Bio.TogoWS包

模块内容

提供访问日本DBCLS的TogoWS集成网络服务的代码。

该模块旨在使TogoWS（来自日本DBXS）更易于使用。请参阅：http://togows.dbcls.jp/

TogoWS REST服务提供对一系列数据库的简单访问，充当代理来保护您免受所有不同提供商API的影响。这使用简单的URL（此模块将为您构建）。欲了解更多详细信息，请参阅http://togows.dbcls.jp/site/en/rest.html

该功能与Biopython的Bio. z模块有些相似，该模块提供对NCBI z Utilities（E-Utils）的访问权限，该Utilities还涵盖广泛的数据库。

目前TogoWS不提供任何使用指南（与NCBI不同，其要求相当明确）。为了避免服务超载的风险，Biopython每秒只允许三次呼叫。

TogoWS肥皂服务提供了一个更复杂的API，用于调用DDBJ、KEGG和PDBj提供的Web服务（本质上是调用远程功能）。例如，这允许您在DDBJ上运行远程AMPS搜索。本模块尚未涵盖这一点，但TogoWS网站上有很多使用SOAPpy pPython库的Python示例。请参阅：http://togows.dbcls.jp/site/en/soap.html http://soapy.sourceforge.net/

Bio.TogoWS.entry(db, id, format=None, field=None)

调用TogoWS“entry”以获取记录。

论点：

DB -数据库（字符串），请参阅下面的列表。
id -标识符（字符串）或标识符列表（作为字符串列表或带有逗号分隔符的单个字符串）。
格式-返回数据文件格式（字符串），选项取决于数据库，例如“html”、“json”、“gff”、“fasta”、“ttl”（RDF Turtle）
字段-来自数据库记录（字符串）内的特定字段，例如pubmed的“au”或“Authors”。

在撰写本文时，这包括以下内容：

KEGG: compound, drug, enzyme, genes, glycan, orthology, reaction,
      module, pathway
DDBj: ddbj, dad, pdb
NCBI: nuccore, nucest, nucgss, nucleotide, protein, gene, onim,
      homologue, snp, mesh, pubmed
EBI:  embl, uniprot, uniparc, uniref100, uniref90, uniref50

有关当前列表，请访问http://togows.dbcls.jp/entry/

该功能本质上相当于NCBI Deliverz服务EFetch，在Biopython中以Bio. Deliverz.efetch（.）的形式提供，但这不提供场提取。

Bio.TogoWS.search_count(db, query)

调用TogoWS搜索计数以查看搜索给出的匹配数量。

论点：

DB -数据库（字符串），请参阅http://togows.dbcls.jp/search
查询-搜索项（字符串）

然后，您可以使用该计数，使用偏移量和限制选项将大量搜索结果批量下载到Bio.TogoWS.search（）。然而，一般来说，Bio.TogoWS.search_iter（）函数使用起来更简单。

Bio.TogoWS.search_iter(db, query, limit=None, batch=100)

调用TogoWS搜索迭代结果（生成器函数）。

论点：

DB -数据库（字符串），请参阅http://togows.dbcls.jp/search
查询-搜索项（字符串）
限制-搜索结果数量的可选上限
批次-每次与TogoWS通话时要拉回的搜索结果数量（目前限制为100个）。

您可以在for循环中使用此函数，例如

>>> from Bio import TogoWS
>>> for id in TogoWS.search_iter("pubmed", "diabetes+human", limit=10):
...     print("PubMed ID: %s" %id) # maybe fetch data with entry?
PubMed ID: ...

在内部，这首先调用Bio.TogoWS.search_call（），然后使用Bio.TogoWS.search（）批量获取结果。

Bio.TogoWS.search(db, query, offset=None, limit=None, format=None)

呼叫TogoWS搜索。

这是TogoWS搜索函数的低级包装器，可以以多种格式返回结果。总的来说，search_iter功能更适合最终用户。

论点：

DB -数据库（字符串），请参阅http://togows.dbcls.jp/search/
查询-搜索项（字符串）
Offset，limit -可选integer，指定从哪个结果开始（从1开始）以及要返回的结果数。
格式-返回数据文件格式（字符串），例如“json”、“ttl”（RDF）默认情况下返回纯文本，每行一个结果。

在撰写本文时，TogoWS应用100个搜索结果的默认计数限制，这是上限。要访问更多结果，请使用Offset参数或search_iter（.）功能

TogoWS支持一长串数据库，包括许多来自NCBI的数据库（例如“ncbi-pubmed”或“pubmed”、“ncbi-genbank”或“genbank”和“ncbi-taxonomy”）、EBI（例如“ebi-ebml”或“embl”、“ebi-uniprot”或“uniprot、“ebi-go”）和KEGG（例如“kegg-compound”或“compound”）。有关当前列表，请参阅http://togows.dbcls.jp/search/

NCBI提供了类似的Bio. zz. esktop（）函数的Bio. zz. esktop（）搜索服务。

另请参阅函数Bio.TogoWS.search_call（），它返回找到的匹配项数，以及Bio.TogoWS.search_iter（）函数，它允许您对搜索结果进行迭代（为您处理迭代）。

Bio.TogoWS.convert(data, in_format, out_format)

调用TogoWS进行文件格式转换。

论点：

数据-包含输入记录的字符串或处理
in_form-描述输入文件格式的字符串（例如“genbank”）
out_form-描述请求的输出格式的字符串（例如“fasta”）

有关支持的转换列表（例如“genbank”到“fasta”），请参阅http://togows.dbcls.jp/convert/

请注意，Biopython内置了对序列和格式转换的支持（功能Bio.SeqIO.convert和Bio.AlignIO.convert）