FASTA格式

在生物資訊學中，FASTA格式是一種用於記錄核酸序列或肽序列的文字格式，其中的核酸或胺基酸均以單個字母編碼呈現。該格式同時還允許在序列之前定義名稱和編寫注釋。這一格式最初由FASTA（英語：FASTA）軟體套件定義，但現今已是生物資訊學領域的一項標準。

FASTA簡明的格式降低了序列操縱和分析的難度，令序列可被文字處理工具和諸如Python、Ruby和Perl等手稿語言處理。

胺基酸編碼	含義
A	丙胺酸（Alanine）
B	天門冬胺酸（Aspartic acid，D）或天門冬醯胺（Asparagine，N）
C	半胱胺酸（Cysteine）
D	天門冬胺酸（Aspartic acid）
E	麩胺酸（Glutamic acid）
F	苯丙胺酸（Phenylalanine）
G	甘胺酸（Glycine）
H	組胺酸（Histidine）
I	異白胺酸（Isoleucine）
J	白胺酸（Leucine，L）或異白胺酸（Isoleucine，I）
K	離胺酸（Lysine）
L	白胺酸（Leucine）
M	甲硫胺酸（Methionine）
N	天門冬醯胺（Asparagine）
O	吡咯離胺酸（Pyrrolysine）
P	脯胺酸（Proline）
Q	麩醯胺酸（Glutamine）
R	精胺酸（Arginine）
S	絲胺酸（Serine）
T	蘇胺酸（Threonine）
U	硒半胱胺酸（Selenocysteine）
V	纈胺酸（Valine）
W	色胺酸（Tryptophan）
Y	酪胺酸（Tyrosine）
Z	麩胺酸（Glutamic acid，E）或麩醯胺酸（Glutamine，Q）
X	任意
*	轉譯終止
-	不定長度空白預留位置

資料庫	格式
GenBank	`gb\|accession\|locus`
EMBL Data Library	`emb\|accession\|locus`
DDBJ, DNA Database of Japan	`dbj\|accession\|locus`
NBRF PIR	`pir\|\|entry`
Protein Research Foundation	`prf\|\|name`
SWISS-PROT	`sp\|accession\|entry name`
Brookhaven Protein Data Bank	`pdb\|entry\|chain`
Patents	`pat\|country\|number`
GenInfo Backbone Id	`bbs\|number`
General database identifier	`gnl\|database\|identifier`
NCBI Reference Sequence	`ref\|accession\|locus`
Local Sequence identifier	`lcl\|identifier`

副檔名	含義	備註
fasta (.fas)	普通FASTA	任意普通的FASTA檔案。此類副檔名還有fa、seq、fsa。
fna	核酸FASTA	普遍用於表示核酸序列的FASTA檔案。
ffn	核酸編碼區FASTA	包含基因組編碼區的FASTA檔案。
faa	胺基酸FASTA	包含表示胺基酸序列的FASTA檔案。含有多種蛋白質序列的FASTA檔案還可使用更具體的mpfa副檔名。
frn	非編碼RNA FASTA	包含以DNA字母編碼表示的基因組非編碼RNA區（如tRNA、rRNA）的FASTA檔案。

格式