热门问题
时间线
聊天
视角
单核苷酸多态性
来自维基百科,自由的百科全书
Remove ads
单核苷酸多态性(single-nucleotide polymorphism,SNP,读作/snɪp/)是在同一物种不同个体的基因组DNA中的等位序列上,因同一特定位点的单个核苷酸变异所引起的DNA序列多态性。SNP通常特指生殖细胞系的单核苷酸置换变异(germline substitution),此变异可通过遗传传递给后代,并成为群体中稳定的遗传多态性[1][2][3]。

单核苷酸多态性(SNP)是DNA序列中单个核苷酸的置换导致的、且分布于种群中相当一部分个体(如:1%以上)中的基因多样性。此单个核苷酸置换包括转换(transition)、颠换(transversion)、缺失(deletion)和插入(insertion)等机制[4]。例如,对于某种生物,同一位置基因组片段一部分为AAGCCTA,另一部分为AAGCTTA,则认为此处存在SNP、两种基因型属于等位基因。
几乎所有常见的SNP位点只有两个等位基因。单核苷酸态性(SNP)位点的分布是均匀的,在非编码区比在编码区更常见。一般来说,自然选择倾向于保留最益于遗传适应性的SNP位点[5]。其他因素,如基因重组和突变率也可判断SNP位点的密度[6]。
SNP的密度可以通过微卫星DNA进行预测。AT微卫星是SNP密度有效的检测方式,在SNP显著降低及较低GC含量的区域,AT出现大片重复[7]。
在一个种群中,SNP可以以次要等位基因频率的形式体现,即那些等位基因频率很低的基因座。SNP等位基因的频率在不同人群中具有差异性,因此,常见于某地区或民族的SNP等位基因在其他的地区或民族则可能很少见。
DNA指纹图谱是指个体间的遗传变异(尤其是在基因组的非编码区),常被用于法医学。同时,这些遗传变异也构成了人体对疾病易感性的差异,以及疾病的严重程度及治疗效果的差异。例如,载脂蛋白E(APOE)的单碱基突变与阿尔兹海默病发生低风险相关[8]。
人类遗传基因的各种差异,90%可归因于SNP引起的基因变异。在人类基因组中,每隔100至300个碱基就会存在一处SNP位点。每3个SNP位点中有2个会是胞嘧啶(C)和胸腺嘧啶(T)的相互转变。
Remove ads
类型
SNP根据其在基因中的位置,可以分为基因编码区、基因非编码区、基因间隔区(基因之间的区域)。由于基因序列的简并性,含有编码序列的SNP不一定会改变蛋白质的氨基酸序列。
编码区的SNP有两种类型:同义和非同义。同义SNP并不影响蛋白质序列,而非同义SNP则会改变蛋白质的氨基酸序列。
不在蛋白质编码区的SNP仍可能影响基因剪接、转录因子结合、信使RNA降解或非编码区的RNA序列。受到这种SNP影响的基因表达被称为单核苷酸多态性表达(ESNP),可能发生在此基因的上游或下游。
SNP可能分布于编码基因段或非编码基因段。由于存在冗余基因序列,编码段中的SNP不一定会影响蛋白质中的氨基酸序列。
利用及重要性
人类DNA序列的变化可以影响人类疾病的发展和对病原体、化学品、药品、疫苗等的机体反应。SNP也是个性化医疗的关键[9]。然而,在生物医学中最重要的是在全基因组关联研究中比较同类基因组的不同区域。
SNP的研究在农作物和家畜育种项目中也很重要。识别SNP各种方法的详细信息,请参阅单核苷酸多态性基因分型。
SNP通常是双等位基因,因此容易检测分析。[10]单个的SNP可能导致孟德尔疾病。对于骨质疏松症这种更复杂的疾病,一个位点的SNP通常不能单独起作用,而是与其他位点的SNP相互作用而表现出病情。 [11]
截至2012年6月26日,单核苷酸多态性数据库(dbSNP)已列出人类的53,558,214个SNP位点。 [12]SNP位点已被用于全基因组关联研究(GWAS),例如,基因图谱中的高分辨率标记与疾病或正常的特征有关。SNP的知识将有助于了解药物的代谢动力学(PK)或药效动力学,即在不同的遗传变异个体中药物是如何发挥作用的。SNP可能会导致广泛的人类疾病,如癌症、传染性疾病(艾滋病,麻风病,肝炎等)、自体免疫性疾病、神经精神性疾病、镰状细胞贫血、β地中海贫血症及囊性纤维化等。[13][14][15]与不同SNP相关的疾病将可能成为药物治疗的主要基因组目标。 [16]某些SNP与不同药物的代谢有关。[17][18][19]因其世代中的数量及稳定遗传,对表型没有影响的SNP在全基因组关联研究(GWAS)中也仍然有用。 [20]
Remove ads
举例
数据库
生物信息学数据库用于对SNP相关研究的检索。单核苷酸多态性数据库(dbSNP)信息来自生物技术信息中心 (NCBI)。以下列出一些常用SNP相关的数据库:
Remove ads
命名
SNP的命名可能容易混淆:单个的SNP可能有几种表现形式,并且尚未达成共识。其中一种SNP的书写形式是采用前缀,以及周期和“大于”符号来表示野生型和改变后的核苷酸或氨基酸,如c.76A>T。[25][26][27]如上文所示,通常采用核苷酸多态性数据库的rs号来表示。
SNP分析
用于发现新SNP及检测已知SNP的分析方法包括:
单核苷酸多态性模拟及标签单核苷酸多态性 (tag SNP) 免费工具:
- GWAsimulator
- PLINK(模块)
标签单核苷酸多态性(SNP)表示基因组中具有高的连锁不平衡的区域中具有代表性的单核苷酸多态性(tag SNP)。它可以识别遗传变异和关联的表型基因分型,而无需在染色体区域每个SNP进行基因分型,这减少了与疾病相关的基因组分型(genotyping)的费用和时间,因为它不需要研究每一个个体的SNP。国际HapMap计划其中一个应用是由人类基因组图谱,获得标签SNP信息,从而减少了遗传研究的基因组分型的费用和时间。[31]
Tagger是一种可用于评估基因型数据和选择标签单核苷酸多态性 (tag SNP) 的工具,可用于如国际HapMap项目的资料。它是由保罗·德·巴克(Paul de Bakker)在马萨诸塞州医院(Massachusetts General Hospital)人类遗传研究中心和哈佛医学院Broad研究院的大卫阿特舒勒和马克 - 达利在中心(Labs of David Altshuler and Mark Daly)的实验室开发。[32]
CLUSTAG 和 WCLUSTAG 是免费软件,包含集群和覆盖算法(cluster and set-cover algorithms)来获得一组标签单核苷酸多态性(tag SNP)位点,用来代表一个染色体区域所有已知的单核苷酸多态性(SNP)。该程序用Java实现,并且可以在Windows平台和Unix环境中运行。它们是由区小勇(SIO IONG AO)等人在香港大学开发的。[33][34]
Remove ads
参考文献
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads