热门问题
时间线
聊天
视角
GenBank
来自维基百科,自由的百科全书
Remove ads
基因銀行(GenBank)是一個開放獲取的序列資料庫,對所有公開可利用的核苷酸序列與其翻譯的蛋白質進行收集並注釋。
此資料庫是國際協作核酸序列資料庫(INSDC)的一部分,由美國國家生物技術信息中心(NCBI)主管,NCBI為美國國立衛生研究院的下屬機構。GenBank和它的合作者從全球各個實驗室接收了超過百萬種生物的數據。
成立三十年來,GenBank資料庫成為了最重要的也是最有影響力的生物全領域資料庫,其數據正被全球數以百萬計的研究人員獲取與引用。GenBank中的數據量正以每18個月翻一番的速度持續指數增長[1][2],在2013年2月的版本194中,資料庫包含有1.62億個序列,含有1500億個核苷酸堿基。[3]
Remove ads
歷史
1979年,洛斯阿拉莫斯國家實驗室(LANL)理論生物學和生物物理學小組 (頁面存檔備份,存於網際網路檔案館)的Walter Goad等人建立了洛斯阿拉莫斯序列資料庫,最終成為了公共的 GenBank資料庫的前身[4]。1982年,由美國國立衛生研究院、美國國家科學基金會、美國能源部和國防部共同出資,LANL與BBN科技公司合作,成立了GenBank。到1983年底,已有超過2,000個序列被存儲在GenBank。
在20世紀80年代中期,史丹佛大學的Intelligenetics bioinformatics公司與LANL合作經營著GenBank項目[5]。作為最早的網際網路生物信息學社區項目,GenBank計劃為生物學家打造一個開放獲取的BIOSCI/Bionet消息社群。1989到1992年,GenBank被轉移到新成立的美國國家生物技術信息中心[6]。


Remove ads
發展

在GenBank的版本162.0(2007年8月)的發行說明中道出:「從1982年到現在,GenBank中的鹼基數每隔18個月翻一番。」[7]
截至2013年7月8日[update],GenBank的版本196.0已有165,740,164個基因座,152,599,230,112個鹼基,165,740,164個報導序列[3]。 GenBank資料庫還包括一些額外的數據集,不包括在這個統計內。
Remove ads
另見
- Ensembl
- Human Protein Reference Database (HPRD)
- 序列分析
- UniProt
- 已測序真核生物基因組列表
- 已測序古菌基因組列表
- RefSeq — the Reference Sequence Database
- Geneious — includes a GenBank Submission Tool
參考文獻
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads