基因家族
维基百科,自由的 encyclopedia
基因家族(英语:Gene family),是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。[1]一个这样的家族是人类血红蛋白亚基的基因,10个基因在不同染色体上的两个簇中,称为α-珠蛋白和β-珠蛋白基因座。这两个基因簇被认为是由于前体基因在大约5亿年前被复制而产生的[2]。
基因根据共享的核苷酸或蛋白质序列被分为家族。 系统发生技术可以用作更严格的测试。外显子在编码序列中的位置可用于推断共同的祖先。 了解基因编码的蛋白质序列可以让研究人员应用方法来发现蛋白质序列之间的相似性,这些相似性提供的信息比DNA序列之间的相似性或差异性更多。
如果一个基因家族的基因编码蛋白质,那么术语蛋白质家族通常以与基因家族类似的方式使用。
基因家族沿特定谱系的扩展或收缩可能是偶然的,也可能是自然选择的结果[3]。区分这两种情况在实践中往往很困难。 最近的工作使用统计模型和算法技术的组合来检测受自然选择影响的基因家族[4]。
国际人类基因组组织(HUGO)的人类基因组组织基因命名委员会(英语:HUGO Gene Nomenclature Committee)(HGNC) 使用基因家族成员的“主干”(或“根”)符号(通过同源性或功能)创建命名方案,并使用分层编号系统来区分各个成员[5][6]。 例如,对于过氧化物氧还酶(Peroxiredoxin)家族,PRDX 是根符号,家族成员为 PRDX1、PRDX2、PRDX3、PRDX4、PRDX5 和 PRDX6。
同一家族基因可以紧密排列在一起,形成一个基因簇,但多数时候,它们是分散在同一染色体的不同位置,或者存在于不同的染色体上的,各自具有不同的表达调控模式。