热门问题
时间线
聊天
视角
SAM格式
来自维基百科,自由的百科全书
Remove ads
SAM(Sequence Alignment Map,可直譯為「序列比對地圖」)是生物信息學中一種用於儲存已比對到基因組上的序列信息的文件格式。SAM格式是在千人基因組計劃期間由李恆等人為了取代過去的MAQ格式開發出來的[1]。SAM這一名稱是參與這一項目的猶他大學教授加博爾·馬思決定的。他在現在的SAM格式開發出來以前就開發出了一種同名的結構文件,不過當時他開發的SAM格式更接近於BLAST算法的輸出結果[2]。現在SAM格式已成為學界與工業界都廣泛接受的生物信息學格式之一,經過數次修正之後,目前的SAM格式甚至也可以儲存沒有比對到基因組上的序列信息。SAM格式不僅可以儲存第二代測序中的短長度序列的比對信息,也可以儲存長至128MB的長序列的比對信息[3]。
SAM格式壓縮後以二進制格式表示產生的文件稱為BAM格式(Binary Alignment Map)[4]。
Remove ads
格式
SAM格式由頭部(header)和比對(alignment section)兩部分組成[1],可以使用SAMtools軟體進行分析和編輯。如果存在頭部部分,它必須位於比對部分之前。頭部部分以'@'符號開頭,以區別於比對部分。比對部分有11個必需欄位以及可變數量的可選欄位[1]。
Remove ads
參見
參考資料
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads