热门问题
时间线
聊天
视角

GenBank

来自维基百科,自由的百科全书

Remove ads

基因银行GenBank)是一个开放获取序列数据库英语sequence database,对所有公开可利用的核苷酸序列与其翻译的蛋白质进行收集并注释。

事实速览 内容, 说明(描述) ...

此数据库是国际协作核酸序列数据库英语International Nucleotide Sequence Database Collaboration(INSDC)的一部分,由美国国家生物技术信息中心(NCBI)主管,NCBI为美国国立卫生研究院的下属机构。GenBank和它的合作者从全球各个实验室接收了超过百万种生物的数据。

成立三十年来,GenBank数据库成为了最重要的也是最有影响力的生物全领域数据库,其数据正被全球数以百万计的研究人员获取与引用。GenBank中的数据量正以每18个月翻一番的速度持续指数增长[1][2],在2013年2月的版本194中,数据库包含有1.62亿个序列,含有1500亿个核苷酸堿基。[3]

Remove ads

历史

1979年,洛斯阿拉莫斯国家实验室(LANL)理论生物学和生物物理学小组页面存档备份,存于互联网档案馆)的Walter Goad英语Walter Goad等人建立了洛斯阿拉莫斯序列数据库,最终成为了公共的 GenBank数据库的前身[4]。1982年,由美国国立卫生研究院、美国国家科学基金会、美国能源部和国防部共同出资,LANL与BBN科技公司合作,成立了GenBank。到1983年底,已有超过2,000个序列被存储在GenBank。

在20世纪80年代中期,斯坦福大学的Intelligenetics bioinformatics公司与LANL合作经营着GenBank项目[5]。作为最早的互联网生物信息学社区项目,GenBank计划为生物学家打造一个开放获取BIOSCI英语BIOSCI/Bionet消息社群。1989到1992年,GenBank被转移到新成立的美国国家生物技术信息中心[6]

Thumb
Genbank和EMBL在1986/1987年出版的《核苷酸序列》I到VII卷
Thumb
Genbank v100版本的CDRom
Remove ads

发展

Thumb
GenBank中碱基对数目的增长,1982年到2018年,半对数图.

在GenBank的版本162.0(2007年8月)的发行说明中道出:“从1982年到现在,GenBank中的碱基数每隔18个月翻一番。”[7]

截至2013年7月8日 (2013-07-08),GenBank的版本196.0已有165,740,164个基因座,152,599,230,112个碱基,165,740,164个报导序列[3]。 GenBank数据库还包括一些额外的数据集,不包括在这个统计内。

更多信息 物种, 碱基对 ...
Remove ads

另见

参考文献

外部链接

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads