跳转到内容

GenBank

本页使用了标题或全文手工转换
维基百科,自由的百科全书
基因银行
GenBank
内容
说明(描述)超过300,000种生物体的核苷酸序列,并附有支持性书目和生物学注释。
获取的数据类型
  • 核苷酸序列
  • 蛋白质序列
有机体(生物)全部
相关信息
研究中心美国国家生物技术信息中心(NCBI)
主要参考文献(引用)PMID 21071399
发布日期1982年,​43年前​(1982
访问
数据格式
网站NCBI
下载网址ncbi ftp
网络服务网址
工具
网络BLAST
独立BLAST
其它信息
许可不清楚[1]

基因银行(英語:GenBank,另译基因库基因数据库)是一个开放获取序列数据库英语sequence database,对所有公开可利用的核苷酸序列与其翻译的蛋白质进行收集并注释。

此数据库是国际核酸序列数据库协作组织英语International Nucleotide Sequence Database Collaboration(INSDC)的一部分,由美国国家生物技术信息中心(NCBI)主管,NCBI为美国国立卫生研究院的下属机构。GenBank和它的合作者从全球各个实验室接收了超过百万种生物的数据。

成立三十年来,GenBank数据库成为了最重要的也是最有影响力的生物全领域数据库,其数据正被全球数以百万计的研究人员获取与引用。GenBank中的数据量正以每18个月翻一番的速度持续指數增長[2][3],在2013年2月的版本194中,數據庫包含有1.62億個序列,含有1500億個核苷酸堿基。[4]

历史

[编辑]

1979年,洛斯阿拉莫斯国家实验室(LANL)理论生物学和生物物理学小组页面存档备份,存于互联网档案馆)的Walter Goad英语Walter Goad等人建立了洛斯阿拉莫斯序列数据库,最终成为了公共的 GenBank数据库的前身[5]。1982年,由美国国立卫生研究院、美国国家科学基金会、美国能源部和国防部共同出资,LANL与BBN科技公司合作,成立了GenBank。到1983年底,已有超过2,000个序列被存储在GenBank。

在20世纪80年代中期,斯坦福大学的Intelligenetics bioinformatics公司与LANL合作经营着GenBank项目[6]。作为最早的互联网生物信息学社区项目,GenBank计划为生物学家打造一个开放获取BIOSCI英语BIOSCI/Bionet消息社群。1989到1992年,GenBank被转移到新成立的美国国家生物技术信息中心[7]

Genbank和欧洲分子生物学实验室(EMBL)在1986/1987年出版的《核苷酸序列》第一至第七卷
Genbank v100版本的CDRom

发展

[编辑]
GenBank中碱基对数目的增长,1982年到2018年,半對數圖

在GenBank的版本162.0(2007年8月)的发行说明中道出:“从1982年到现在,GenBank中的碱基数每隔18个月翻一番。”[8]

截至2013年7月8日 (2013-07-08),GenBank的版本196.0已有165,740,164个基因座,152,599,230,112个碱基,165,740,164个报导序列[4]。 GenBank数据库还包括一些额外的数据集,不包括在这个统计内。

GenBank中碱基数前二十的物种(版本 191)[9]
物种 碱基对
智人 Homo sapiens 1.6310774187×10^10
小家鼠 Mus musculus 9.974977889×10^9
褐鼠 Rattus norvegicus 6.521253272×10^9
家牛 Bos taurus 5.386258455×10^9
玉米 Zea mays 5.062731057×10^9
野豬 Sus scrofa 4.88786186×10^9
斑馬魚 Danio rerio 3.120857462×10^9
紫色球海胆英语Strongylocentrotus purpuratus Strongylocentrotus purpuratus 1.435236534×10^9
普通獼猴 Macaca mulatta 1.256203101×10^9
水稻 Oryza sativa Japonica Group 1.255686573×10^9
烟草 Nicotiana tabacum 1.197357811×10^9
非洲爪蟾 Xenopus (Silurana) tropicalis 1.249938611×10^9
黑腹果蝇 Drosophila melanogaster 1.11996522×10^9
黑猩猩 Pan troglodytes 1.008323292×10^9
拟南芥 Arabidopsis thaliana 1.144226616×10^9
家犬 Canis lupus familiaris 951,238,343
酿酒葡萄 Vitis vinifera 999,010,073
原雞 Gallus gallus 899,631,338
大豆 Glycine max 906,638,854
普通小麦 Triticum aestivum 898,689,329

参阅

[编辑]

参考文献

[编辑]
  1. ^ UCSC下载页面显示“NCBI对GenBank数据的使用或分发不做任何限制。但是,一些提交者可能对其提交的全部或部分数据主张专利英语Biological patent、版权或其他知识产权。NCBI无法评估此类主张的有效性,因此无法对GenBank中包含的信息的使用、复制或分发提供评论或无限制许可。”The at says "NCBI places no restrictions on the use or distribution of the GenBank data. However, some submitters may claim Biological patent, copyright, or other intellectual property rights in all or a portion of the data they have submitted. NCBI is not in a position to assess the validity of such claims, and therefore cannot provide comment or unrestricted permission concerning the use, copying, or distribution of the information contained in GenBank."
  2. ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. GenBank. Nucleic Acids Research. 2008, 36 (Database): D25–D30. PMC 2238942可免费查阅. PMID 18073190. doi:10.1093/nar/gkm929. 
  3. ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. GenBank. Nucleic Acids Research. 2009, 37 (Database): D26–D31. PMC 2686462可免费查阅. PMID 18940867. doi:10.1093/nar/gkn723. 
  4. ^ 4.0 4.1 GenBank release notes. NCBI. [2013-12-02]. (原始内容存档于2016-12-22). 
  5. ^ Hanson, Todd. Walter Goad, GenBank founder, dies. Newsbulletin: obituary. Los Alamos National Laboratory. 2000-11-21 [2013-12-02]. (原始内容存档于2008-11-07). 
  6. ^ LANL GenBank History. [2013-12-02]. (原始内容存档于2016-03-03). 
  7. ^ Benton D. Recent changes in the GenBank On-line Service. Nucleic Acids Research. 1990, 18 (6): 1517–1520. PMC 330520可免费查阅. PMID 2326192. doi:10.1093/nar/18.6.1517. 
  8. ^ Dennis A. Benson, Mark Cavanaugh, Karen Clark, Ilene Karsch-Mizrachi, David J. Lipman, James Ostell, Eric W. Sayers. GenBank. Nucleic Acids Research. 2013-01, 41 (Database issue): D36–42 [2019-02-12]. ISSN 1362-4962. PMC 3531190可免费查阅. PMID 23193287. doi:10.1093/nar/gks1195. (原始内容存档于2020-05-14). 
  9. ^ Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Sayers EW. GenBank. Nucleic Acids Res. January 2011, 39 (Database issue): D32–37. PMC 3013681可免费查阅. PMID 21071399. doi:10.1093/nar/gkq1079. 


外部链接

[编辑]