基因本体
维基百科,自由的 encyclopedia
基因本体论(Gene ontology ,GO)是一种系统地对物种基因及其产物属性进行注释的方法和过程[1]。它的目标是:1)维护和发展有限的基因及其产物属性描述的词汇;2)注释基因及其产物,同化和传播注释数据;3)提供方便的工具访问数据;4)实现在实验数据的基础上,使用GO进行程式解析,例如基因富集组分分析。它主要包括三个分支:细胞组件、分子功能和生物过程。
基因本体论也是一个更大的系统分类项目的一部分,这个项目是开放生物医学系统注释(Open Biomedical Ontologies (OBO))[2]。
与基因命名法不同,除了维护和控制发展基因及其产物性质描述的词汇,基因本体论也致力于使用机器学习可以理解的标记语言来进行基因标注,这样统一所有物种的基因注释(而基因命名法注释会根据不同的生物系统分类而有不同的注释)。
随着生物技术的发展越来越快,人们得到的数据越来越多。需要寻找一种方法来组织整理这些信息。基因本体论提供了一个省时省力的解决方案,基因产物在数据库中被赋上GO的词条,进而科学家们可以到数据库中去查询这些生物学的相关信息。基因本体是一个有向无环图(DAG)型的本体。目前,GO中使用了is_a、part_of和regulates三种关系。