SNP与基因型和疾病表型之间的关系

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SNP与基因型和疾病表型之间的关系3

随着人类基因组计划精确序列图的完成,功能基因的克隆与鉴定、人类基因组多样性的研究也提到日程,而这些研究的进行将依赖于精细和精确的遗传标记的选择和应用。在人类基因组计划研究的历史上,RF LP(restriction fragment length polym or2 phism)和STR(short tandem repeats)作为上两代遗传标记,在物理图和遗传图的构建、序列草图的拼接和装搭过程中曾起到决定性的作用。但这些遗传标记依然存在多态性不高、无法摆脱电泳分型、难以实现大规模检测和自动化、难于进行基因判定等缺点。1996年由美国的nder提出了并称之为“第3代遗传标记”的“单核苷酸多态性”(single nucleotide polym orphism, S NP)。S NP即以基因组序列中一个核苷酸的变异而导致DNA序列的变化(多态性)为基础。由于所有遗传多态性的分子基础均为核苷酸,因此S NP在密度上有可能达到人类基因组多态位点数目的极限。S NP与RF LP和STR等DNA标记的根本不同,是不再以长度的差异作为检测手段,而直接以序列的变异作为标记;在理论上,S NP有可能在核苷酸水平上,把序列图、物理图与遗传图最终有机地整合、统一起来;在技术上,S NP可以完全摆脱电泳分型的瓶颈,而采用最新的非电泳分型技术等。以下就S NP与基因型和疾病表型之间的关系作一简介。

1 鉴定SNP

发现核苷酸的变体不是一件困难的事情,每天,许多分子遗传学家在他们的研究工作中会不经意间偶然发现。直接地S NP发现可采取对一个有一定规模的基因组并行测序的战略,如对Y染色体;或在看似候选基因的基因内寻找,如心血管疾病、炎症性疾病和Ⅱ型糖尿病等复杂性遗传病。然而,一些生物信息学小组正在应用“in silico”中储存的序列资料寻找S NP。

C.Lee描述了EST数据库如何提供了成千上万个个体的表现度,通过序列比对,使编码S NP的发现成为可能。同样的数据采集方法已经被用于重叠BAC的克隆。这种日积月累的结果使在S NP数据库(dbS NP)和人类基因组数据库(HG BASE)已有超过二百万个候选S NP。现在的任务是证实这些已发现的S NP,即由于序列错误、重复区域和选择性剪接而产生假的S NP变体。此外,由于这些S NP来自世界不同的人群,还有如下未完成的工作要做:一方面,要确定S NP的等位基因频率;另一方面,要区别在某单一人群中特殊的S NP。

2 SNP的应用

涌向S NP发现和分析淘金热的心理起源于推测它们在两个方面的应用潜力。一方面是应用S NP探索复杂疾病的分子遗传学基础,另一方面是应用S NP进行基因自动分型的可靠性。推荐应用S NP多位点作图的方法用于病例———对照(case2con2 trol)研究,其目的是鉴定某一位点的特殊等位基因和某一特定表型统计学上的显著相关性。广泛的基因组相关性研究的设计依赖于人们关于变异的设想,即变异构成复杂性状的基础。一直争论的问题是H ome sapiens在“hominids”有限的遗传变异中是否不同寻常。然而,关于构成人类常见疾病表型的变异已出现两种相互竞争的学说,其正确的学说将指导研究设计。

(1)常见病Π常见变体(C DΠC V)学说:C DΠC V学说认为这些常见病的等位基因在地球的人类迁移以前已经存在,或者这些通过正选择的等位基因在一定程度上(以显著的比例)代表易感性等位基因。在现存的人群中,预测这些等位基因授予人群以中度的危险性,并在人群中出现相对高的频率(>1%)。它们出现的高频率意味着在大规模的人群中进行相关性研究对于鉴定危险性等位基因将是富有成效的。nder(Whitehead Institute)引证了ApoE34等位基因的例子,该等位基因使对阿尔茨海默病(Alzheimer disease)的易感性增加;CCR52△32等位基因可防止被HI V-1感染。以上是在一些独立(特殊)的人群中产生一些常见变体的例子。在C DΠC V学说的指导下,现在主要的问题是要对公共变体库中的所有变体进行实验分析,或者对每一变体进行直接评价,或者对来自祖先的基因片段进行间接实验分析。从根本上说,目前通过环境导致变体的连锁不平衡度(LD)的研究方法是有限的。在大多数群体中,一个大样本的群体模型预测靠近共同变体的显著的LD一般将不会跨越3kb的基因组。然而,最近以经验为根据的研究已经给出了一个非常乐观的理由,在一个有北欧血统的美国人群中跨越60kb的区域显示了显著的LD。在2001年10月出版的《Nature genetics》发表了一系列的论文,表明被重组热点所中断的大范围基因组区域的连锁不平衡是人类基因组的一个特征。通过代表性的S NP定义有限数量的常见单体型好象能解释大多数的单体型。提示:应用代表性的S NP进行相关性研究将鉴定与疾病易感性增加有关的常见的单体型,形成构建人类基因组单体型图谱的必要基础,即鉴定所有主要的单体型和它们特征性的S NP。

(2)常见病Π稀有等位基因学说(C DΠRA):另一方面,C DΠRV学说的支持者认为,他们没有理由预期大多数常见遗传病是由常见的等位基因引起的。该学说最近被正式接受,应用群体模型在疾病位点预期了广泛的等位异质性(不均一性)。A. Clark已经扩展了该学说的研究工作,表明在人口爆炸性增长和分散以后,人类常见病的99.9999%的突变已经出现。另外,许多研究者相信,在复杂的疾病中我们可预示有意义的位点和异质性。观察与孟德尔疾病类似的疾病,C DΠRA的支持者指出视网膜炎色素沉着和非症状性常染色体隐性耳聋的遗传和等位异质性,这些“简单”的孟德尔疾病带有多个已知位点和一系列的疾病等位基因。如果这个方案适用于常见病的研究,在不均一人群中进行广泛的基因组疾病相关性研究将是无效的。J. T erwilliger争辩说,采用远交人群的病例———对照研究,通过遗传(血缘)查找鉴定等位基因没有令人信服的根据。在上一年的一个评论中上述观点引起注意。J.T erwilliger断言,那些我们估计遗传和等位异质性较低的方法在家系和具有独特来历的人群研究中会始终得到应用。鉴于目前仅把构建人类单体型图谱计划的重点放在常见等位基因上,而在一定程度上,那些稀有等位基因也可以解释常见病,在分析远缘人群时单体型图谱将是有用的,可以减少不一致性。

3 回归到生物学

无论常见或稀有等位基因被证实与某一特殊疾病发病风险相关,对所有的研究者而言,下一步的研究策略是相同的:一旦鉴定某一单体型与对某一疾病的易感性相关,那些定义单体型的所有S NP将被作为候选的致病因素。在这一点上,S NP达到遗传学研究的极限,必须重新回归到生物学。研究策略方面,基因型和表型之间关系的阐明将是21世纪面临的最大挑战和重要任务之一。

3第四届单核苷酸多态性和复杂基因组分析国际会议(The fourth international meeting on single nucleotide polym orphisms and complex genome analysis)

顾明亮 摘译自:Challenges for the21st century.Nature G enet,2001,29:353-354

邱长春 审校

© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved.

相关文档
最新文档