基因本體
維基百科,自由的 encyclopedia
基因本體論(Gene ontology ,GO)是一種系統地對物種基因及其產物屬性進行註釋的方法和過程[1]。它的目標是:1)維護和發展有限的基因及其產物屬性描述的詞彙;2)註釋基因及其產物,同化和傳播註釋數據;3)提供方便的工具訪問數據;4)實現在實驗數據的基礎上,使用GO進行程式解析,例如基因富集組分分析。它主要包括三個分支:細胞組件、分子功能和生物過程。
基因本體論也是一個更大的系統分類項目的一部分,這個項目是開放生物醫學系統註釋(Open Biomedical Ontologies (OBO))[2]。
與基因命名法不同,除了維護和控制發展基因及其產物性質描述的詞彙,基因本體論也致力於使用機器學習可以理解的標記語言來進行基因標註,這樣統一所有物種的基因註釋(而基因命名法註釋會根據不同的生物系統分類而有不同的註釋)。
隨着生物技術的發展越來越快,人們得到的數據越來越多。需要尋找一種方法來組織整理這些信息。基因本體論提供了一個省時省力的解決方案,基因產物在數據庫中被賦上GO的詞條,進而科學家們可以到數據庫中去查詢這些生物學的相關信息。基因本體是一個有向無環圖(DAG)型的本體。目前,GO中使用了is_a、part_of和regulates三種關係。