热门问题
时间线
聊天
视角
GenBank
来自维基百科,自由的百科全书
Remove ads
基因银行(GenBank)是一个开放获取的序列数据库,对所有公开可利用的核苷酸序列与其翻译的蛋白质进行收集并注释。
此数据库是国际协作核酸序列数据库(INSDC)的一部分,由美国国家生物技术信息中心(NCBI)主管,NCBI为美国国立卫生研究院的下属机构。GenBank和它的合作者从全球各个实验室接收了超过百万种生物的数据。
成立三十年来,GenBank数据库成为了最重要的也是最有影响力的生物全领域数据库,其数据正被全球数以百万计的研究人员获取与引用。GenBank中的数据量正以每18个月翻一番的速度持续指数增长[1][2],在2013年2月的版本194中,数据库包含有1.62亿个序列,含有1500亿个核苷酸堿基。[3]
Remove ads
历史
1979年,洛斯阿拉莫斯国家实验室(LANL)理论生物学和生物物理学小组 (页面存档备份,存于互联网档案馆)的Walter Goad等人建立了洛斯阿拉莫斯序列数据库,最终成为了公共的 GenBank数据库的前身[4]。1982年,由美国国立卫生研究院、美国国家科学基金会、美国能源部和国防部共同出资,LANL与BBN科技公司合作,成立了GenBank。到1983年底,已有超过2,000个序列被存储在GenBank。
在20世纪80年代中期,斯坦福大学的Intelligenetics bioinformatics公司与LANL合作经营着GenBank项目[5]。作为最早的互联网生物信息学社区项目,GenBank计划为生物学家打造一个开放获取的BIOSCI/Bionet消息社群。1989到1992年,GenBank被转移到新成立的美国国家生物技术信息中心[6]。


Remove ads
发展

在GenBank的版本162.0(2007年8月)的发行说明中道出:“从1982年到现在,GenBank中的碱基数每隔18个月翻一番。”[7]
截至2013年7月8日[update],GenBank的版本196.0已有165,740,164个基因座,152,599,230,112个碱基,165,740,164个报导序列[3]。 GenBank数据库还包括一些额外的数据集,不包括在这个统计内。
Remove ads
另见
- Ensembl
- Human Protein Reference Database (HPRD)
- 序列分析
- UniProt
- 已测序真核生物基因组列表
- 已测序古菌基因组列表
- RefSeq — the Reference Sequence Database
- Geneious — includes a GenBank Submission Tool
参考文献
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads