基因组单核苷酸多态性运用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基因组单核苷酸多态性运用

1人类基因组

人类基因组计划已经取得了显著的进展,约占整个基因组6.3%的DNA 序列已被测定,已鉴定的基因7484个,约1万条人类基因的序列已被克隆。人类基因组全序列测定预计可以提前在2003年完成1。人类基因组是一个十分稳定的体系,不同的民族、群体和个体都有46条染色体,有相同数目的基因和基因分布,也有基本相同的核苷酸序列。正是基因组结构的这种稳定性保证了人类作为一个物种的共同性和稳定性,也决定了目前基因组测定是有意义的,即有代表性的。

然而人类基因组又是一个变异的体系。在长期进化的过程中,基因组的DNA序列不断地发生变异。这些变异可能是有害的、有益的或中性的,它们其中的一些被保存下来,导致了不同种族、群体和个体间基因组的差异或多态性。除了同卵双生子外,没有两个个体的基因组是完全相同的。随着基因组测序的进展,全面深入地了解个体和群体间基因组的变异或多态性已成为可能,并日益显示其重要性。这不仅因为更多的多态性标记有助于基因的鉴定和定位,同时通过建立序列变异与表型、序列变异与疾病风险之间的关系,将把对疾病,特别是对复杂疾病的预防、诊断和治疗置于坚实的遗传学基础上,从而使人类基因组计划给人类健康带来实际的利益。

人类基因组中的遗传多态性较多地表现在重复序列,特别是短串联重复序列,如小卫星DNA和微卫星DNA,它们的多态性主要是基于重复序列拷贝数的变异。微卫星DNA位点在人类基因组中数以千计,它们分布广泛,是很好的遗传标记。另一类更加普遍的多态性是基因组中散在的单个碱基的不同。这种不同虽然也包括单个碱基的缺失和插入,但更多的是单个碱基的置换,即单核苷酸的多态性(singlenucleotidepolymorphism,SNP)。SNP为数众多,分布广泛。如果比较任意两条同源染色体的碱基序列,那么平均约1000碱基对(bp)

就有一个碱基不同。单个碱基变异能导致基因功能异常者习惯上被称为突变。

随着人类基因组计划的进展,人们愈来愈相信基因组中的这类多态性有助于解释个体的表型差异、不同群体和个体对疾病,特别是对复杂疾病的易感性、以及对各种药物的耐受性和对环境因子的反应。因此,寻找研究SNP已成为人类基因组计划的内容和目标之一1,2。例如美国国立卫生研究院(NIH)在1998年准备斥资4000万美元就SNP的检测技术及应用进行招标,并强调SNP计划的迫切性3,4。本文拟在对人类基因组SNP作一简要说明的基础上,着重介绍SNP的医学意义及其应用,并兼及一些发展中的批量鉴定和检出SNP的方法。

2单核苷酸多态性

单核苷酸多态性(SNP)是指基因组内特定核苷酸位置上存在两种不同的碱基,其中最少一种在群体中的频率不小于1%。尽管遗传密码由4种碱基组成,但SNP通常只是1种二等位基因的(biallelic),或二态的遗传变异。SNP作为一种碱基的替换,大多数为转换,即一种嘧啶碱基换为另一种嘧啶碱基或一种嘌呤碱基换为另一种嘌呤碱基,转换与颠换之比2∶1。SNP在CG序列上出现最为频繁,而且多是C→T,原因是CG中C 即胞嘧啶常为甲基化的、自发地脱氨后即成为胸嘧啶。人类基因组中共有多少SNP位点,目前尚难以确定,这主要是因为还不确知单碱基变异的程度,而各作者对此估计不完全相同,有作者估计每400bp就有1个碱基不同,另一些作者估计碱基的变异频率在0.5‰~10‰之间。

如果假定1/1000的碱基是多态的话,那么人类30亿碱基中当有约三百万SNP位点。由此可见,SNP数比微卫星标记数要高出几个数量级。尽管就单个SNP而言只有两种变异体,变异程度不如微卫星或小卫星DNA。但SNP在基因组中数量巨大,分布频密,因此就整体而论,它们的多态性要高得多。而且由于SNP是二态的,易于自动化批量检测,因而被认为是新一代的遗传标记(第1代的遗传标记是RFLP,第2代是各种短串联重复序列STR标记)。目前的SNP计划希望首先鉴别出已知基因的cSNP,然后在5年内制作出拥有100000个SNPs的基因组,以满足比

较均质群体中的关联分析和其它研究的需要1,3。SNP在单个基因或整

个基因组中的分布不是均匀的。有根据认为,由于选择压力等原因,SNP

在非转录序列中要多于转录序列。

由于基因组中为蛋白质编码的序列仅约为3%,绝大多数SNP当位于非

编码区。在蛋白质编码区的SNP被称为cSNP,它们和位于表达调控序列中的SNP在功能或致病方面具有更重要的意义4。这样的多态性常被称为功能多态性(functionalpolymorphism)。此外,在一些基因中有SNP

的密集区,但由于已知SNP尚少,有关SNP的分布规律还有待进一步研究。

3SNP的医学意义和应用

基因在决定个体的正常表型,即形态、代谢和免疫状态等方面起着决

定性的作用。通过赋予个体对疾病的易感性或抵抗力,以及影响机体与

环境因素的相互作用,基因也对任何一种疾病的发生发展起着重要作用。因此,人们希望能识别这些基因,以加深对疾病的认识,从而改进疾病的

诊断预防。限于技术条件和其它一些原因,迄今疾病的遗传研究大多从

单个基因入手,或按照单基因的模式进行,很少能够考虑包括成千上万

基因的整个基因组及其功能状态。但随着SNP的不断发现和人类第3

代遗传标记图的绘制,现在已有可能描绘在某一疾病时或发育阶段中多

个基因位点甚至整个基因组的状态。

3.1连锁分析与基因定位SNP可以用于疾病的连锁分析和未知致病基

因的定位。SNP数量大和分布广,在任何已知或未知致病基因附近都可

能找到众多的SNP,并用于遗传病的单倍型诊断。在有适当的家系资料时,SNP又可用作遗传标记来定位未知基因。与目前广泛使用的微卫星

小卫星基因图比较,未来SNP图的标记更多,分辨率更高,定位基因也更

加准确。有作者计算,有700~900个SNP的基因图与目前用于基因组

扫描的300~400个微卫星位点的基因图的分析能力相当,但制作前者

要容易得多。而如果采用1500~3000个SNP作扫描,结果明显优于目

前使用的微卫星扫描5。

相关文档
最新文档