Bio.SearchIO.FastaIO模块

Bio.SearchIO支持Bill Pearson的FASTA工具。

该模块添加了对解析FASTA输出的支持。FASTA是一套程序，通过搜索数据库或识别局部重复来寻找蛋白质或核苷序列之间局部或全球相似性区域。

Bio.SearchIO.FastaIO在以下FASTA口味和版本上进行了测试：

口味：fasta，ssearch，tfastx

版本：35、36

其他口味和/或版本可能会引入一些错误。如果您发现此类问题，请向Biopython的错误跟踪器提交错误报告。

有关FASTA的更多信息可通过以下链接获取：

网站：http://fasta.bioch.virginia.edu/fasta_www2/fasta_list2.shtml

用户指南：http://fasta.bioch.virginia.edu/fasta_www2/fasta_guide.pdf

支持的格式

Bio.SearchIO.FastaIO支持解析和索引由-m 10标志触发的FASTA输出。模仿其他程序的其他格式（例如使用-m 8标志的AMPS表格格式）可能是可解析的，但使用SearchIO的其他解析器（在这种情况下，使用“blast-tab”解析器）。

请注意，在FASTA -m 10输出中，来自不同链的热休克蛋白被认为来自不同的命中。它们在命中表中作为两个单独的条目列出。FastaIO识别出这一点，并将具有相同hit ID的Hit分组到单个Hit对象中，无论串如何。

FASTA有时还会输出与热休克蛋白匹配相邻的额外序列。这些额外的序列被FastaIO丢弃。仅提取包含实际序列匹配的区域。

提供了以下对象属性：

class Bio.SearchIO.FastaIO.FastaM10Parser(handle, _FastaM10Parser__parse_hit_table=False)

基类：object

Bill Pearson的FASTA套件的-m 10输出的解析器。

class Bio.SearchIO.FastaIO.FastaM10Indexer(filename)

基类：SearchIndexer

Bill Pearson的FASTA套件的-m 10输出的索引器类。