热门问题
时间线
聊天
视角

SAM格式

来自维基百科,自由的百科全书

Remove ads

SAM(Sequence Alignment Map,可直译为“序列比对地图”)是生物信息学中一种用于储存已比对到基因组上的序列信息的文件格式。SAM格式是在千人基因组计划期间由李恒英语Heng Li等人为了取代过去的MAQ格式开发出来的[1]。SAM这一名称是参与这一项目的犹他大学教授加博尔·马思决定的。他在现在的SAM格式开发出来以前就开发出了一种同名的结构文件,不过当时他开发的SAM格式更接近于BLAST算法的输出结果[2]。现在SAM格式已成为学界与工业界都广泛接受的生物信息学格式之一,经过数次修正之后,目前的SAM格式甚至也可以储存没有比对到基因组上的序列信息。SAM格式不仅可以储存第二代测序英语Massive parallel sequencing中的短长度序列的比对信息,也可以储存长至128MB的长序列的比对信息[3]

事实速览 开发者, 格式类型 ...

SAM格式压缩后以二进制格式表示产生的文件称为BAM格式(Binary Alignment Map[4]

Remove ads

格式

SAM格式由头部(header)和比对(alignment section)两部分组成[1],可以使用SAMtools英语SAMtools软件进行分析和编辑。如果存在头部部分,它必须位于比对部分之前。头部部分以'@'符号开头,以区别于比对部分。比对部分有11个必需字段以及可变数量的可选字段[1]

更多信息 列, 名称 ...
Remove ads

参见

参考资料

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads