分子遗传学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学分子遗传学最新进展
摘要:医学分子遗传学的发展远迟于孟德尔的发现。
常见疾病的遗传结构是决定不同基因变异导致健康或疾病的重要因素。
医学分子遗传学就是把这些遗传学研究应用于医学,并形成众多的交叉。
这不但推动了现代医学的发展,而且促进了传统的症状医学向真正的预防医学的转变。
关键词:医学分子遗传学基因变异常见疾病
0引言
医学分子遗传学(MedicalMolecular genetics)是在人类遗传学基础上发展起来的一门新兴学科。
它运用分子生物学技术,从DNA水平、RNA水平及蛋白质水平对人类遗传性疾病或疾病的遗传因素进行研究,揭示基因突变与疾病发生的关系,建立在分子水平上对遗传性疾病和遗传相关性疾病的预防、诊断和治疗的方法。
医学分子遗传学的研究对象不仅包括传统的遗传病,而且还包括各种与遗传因素有关的人类常见疾病。
如获得性体细胞遗传疾病(肿瘤、心血管疾病、糖尿病、自闭症等)以及各种感染性疾病(乙型肝炎、艾滋病等)。
近年来医学分子遗传学向系统研究方向发展,兴起了以全基因组为背景的疾病与基因型相关性研究的热潮,这个热潮包括了全基因组相关研究(Genome-wide associationstudy)和个体基因组研究(Personal genome re-search),成为2007年国际上公认的生命科学两大突破性进展。
1医学分子遗传学发展史
医学分子遗传学借助于现代生物学的研究方法,在遗传学理论和广泛采用分子生物学实验方法的基础上发展起来的。
人类遗传学研究中获得的每一新的成就都非常迅速地应用于研究人类的疾病,因而医学分子遗传学近年来得以突飞猛进。
所以首先回顾遗传学的历史必将有助对医学分子遗传学发展的了解。
“种豆得豆”、“孩子长得像爸妈”等是长期以来人们都知道的遗传现象,是孟德尔(GregorMendel)在1865年的豌豆研究报告中首先科学地解释了人们习以为常的现象,而奠定了遗传学的基础。
但是孟德尔的遗传学说未被及时认识,直到1900年孟德尔逝世16年后,他的遗传学说才又被人们重新发现。
1911年,摩尔根(Margan)的果蝇实验证实了孟德尔的结果。
他的杰出研究确认染色体就是基因的载体,他和他的学生还推算出了果蝇各种基因的染色体上位置,并画出了果蝇的4对染色体上的基因所排列的位置图,基因学说得以诞生。
从此遗传学结束了仅凭逻辑推理时代,重大发现接踵而至,成为20世纪最重要的学科之一,生物学的研究重心也逐渐移向遗传学领域。
在摩尔根的工作以前,科学家已经在不懈努力企图找到基因的物质基础。
1868年,年轻的瑞士医生FriedeichMiescher,从细胞核中分离出一种新型的化合物。
他把这种化合物称为“核素”,今天我们称之为核酸。
很长一段时间内人们未能注意到基因与核酸之间的关系。
1944年,核酸研究得到长足的发展,美国科学家Avery在那年成功地借助于核酸将遗传性状从一种细菌移至另一种细菌,他用这个实验证明基因即由核酸构成。
Avery的发现标志着一个新的科学分支的建立,这新学科后来被称为分子生物学,并且至今一直使用生物化学方法研究遗传物质。
1952年AlfredHershey和Martha Chase 利用病毒证实,传递遗传信息的是DNA而不是蛋白质。
医学遗传学早期受孟德尔、摩尔根经典遗传学的指引,对遗传病的来源及传递方式作了朴实的描述。
它的发源可以追溯到1902年,英国医生Archi-bald Garrod的工作。
Garrod是伦敦圣巴多罗买医院(S.t Bartholomews' Hospital)著名的内科医师。
他谙熟当时刚刚兴起的生物化学和处于萌芽时期的遗传学,并率先提出遗传缺陷导致遗传疾病的观点。
1896年, Garrod开始研究罕见病黑尿症( alkap-tonuria),患者由于缺乏尿黑酸氧化酶而尿黑酸不能氧化成乙酰乙酸,直接由尿中排出而成黑尿。
当时Garrod在深入研究后推断,黑尿症不是通常人们认为的细菌感染疾病,而是一种先天性失调病症。
他认为黑尿症病人的患病现象符合孟德尔1865年通过豌豆实验提出的隐性遗传的模式。
1902年,他宣讲了他的研究结果并于次年出版了专著。
1931年,他又出版了《先天性疾病因素》。
然而,Garrod关于
遗传物质控制体内特殊蛋白质的直接作用的研究直到20世纪50年代才被人们理解。
因而后人称他是先天代谢疾病研究之父,也是医学分子遗传学的创始人。
镰刀状红细胞贫血(Sickle-cellAnemia)可能早在1846年就被描述,当时发表在Southern Journal ofMedicalPharmacology的个案报道“Case ofAbsence of the Spleen”中提及的病理解剖所见很可能是镰刀状红细胞贫血。
五十年后, 1910年美国内科医师JamesB. Herrick正式报道了芝加哥首例病例,在接着三例后续报道后于1922年正式命名为镰刀状红细胞贫血(Sickle-cellAnemia)。
1949年著名的量子化学家Linus Pauling和他的同事等在Science杂志发表了“Sickle CellAnemia, aMolecularDisease”的文章,报道了在镰形细胞贫血病患者血液中发现了变异的血红蛋白HbS,并由此得出了镰刀形红细胞贫血症是分子病的结论,第一个提出“分子病”的概念。
镰刀形细胞贫血症是一种包括了由突变基因决定的血红蛋白分子的变异,即在血红蛋白的众多氨基酸分子中,如果将其中的一个谷氨酸分子用缬氨酸替换,就会导致血红蛋白分子变形,造成镰刀形贫血病。
接着, 1956年Vernon Ingram等又进一步证实了HbS的结构异常,即在患者中构成血红蛋白的β链第6位氨基酸是缬氨酸,取代了正常者血红蛋白中这个位置上的谷氨酸。
至今全世界陆续检出的血红蛋白(hemoglobin beta)编码基因变异已有400余种。
1959年以后, Jerome Lejeune发现唐氏综合征(Down’s syndrome)是由于人体的第21对染色体变异造成的。
唐氏综合征是人类最早发现的因染色体缺陷造成的疾病,以后又报道了先天性睾丸发育不全(又称Klinefelter’s综合征)、Turner综合征(45,XO等染色体改变)等性染色体异常疾病,标志着临床遗传学的建立。
遗传学的知识很快被运用于医学临床,人类历史上第一次遗传性疾病的普查是美国Buffalo儿童医院RobertGuthrie医生领导的新生儿苯丙酮尿症(Phenylketonuria,简称PKU)检查。
这是先天代谢性疾病的一种,于1934年由挪威的Folling医生首次报告。
本症是由于基因突变导致肝脏中苯丙氨酸羟化酶(PAH)缺乏,从而引起苯丙氨酸(PA)不能转化为酪氨酸而蓄积在体内,
引起中枢神经系统的损伤。
同时导致酪氨酸、多巴、肾上腺素、黑色素等生理活性物质的合成障碍,引起一系列的病理改变。
这次普查1961年开始, 1967年结束,检查对象涉及美国当时36个州的儿童。
亨廷顿病(Huntington s' Disease,HD)是一种以肌肉不规则震颤和精神障碍为特征的神经元变性疾病,病情呈进行性发展,预后差。
1983年将亨廷顿疾病的遗传标记定位到人的4号染色体上。
此后10年里6个研究小组的58名科学家共同努力,最终于1993年确定了Huntington疾病基因在4号染色体4p16. 3位置。
1986年波士顿儿童医院的研究人员采用基因定位克隆(Positional cloning)技术确定了慢性肉芽肿病(chronic granulomatous disease, CGD)基因在X染色体Xp21位置。
此后陆续确定了肌肉营养不良性萎缩(duchennemuscular dystrophy,DMD)和视网膜母细胞瘤(retinoblastoma)等遗传性疾病的基因及其定位。
20世纪80年代以来对高血压、哮喘、Ⅱ型糖尿病、肥胖、精神病、癌症、神经与肌肉退行性变疾病、心血管疾病、脑血管疾病等人类常见病的广泛研究证实,它们无一不与遗传因素密切关联,因此确定人类常见病多属于数量性状遗传的疾病。
遗传学家与医学家的合作使得一大批疾病从分子水平得以阐明,并迅速在基因定位、基因诊断及产前诊断以至基因治疗方面取得丰硕成果。
特别是人类常见疾病的遗传学研究使得人类能够从基因和环境的相互作用角度重新认识疾病的发生发展机制。
我国医学分子遗传学的实验研究工作开始于60年代。
1962年项维、吴旻等首先报告了中国人的染色体组型,标志着我国人类细胞遗传学的开始。
在生化遗传学方面,当时已对血红蛋白病和红细胞葡萄糖6-磷酸脱氢酶(G6PD)缺乏症开展了实验性研究,标志着我国生化遗传学的萌芽。
此后相当长一段时间,我国医学遗传学停滞不前。
直到1979年底我国召开了第一次人类和医学遗传学论文报告会后,医学遗传学才得到迅猛发展。
部分医学院校已将医学遗传学列入必修课或选修课,各地开办了各种形式的临床医生培训班。
在原来的工作基础上又开展了先天性代谢缺陷、免疫遗传学、肿瘤遗传学、眼遗传病、神经精神遗传病、酶和蛋白质多态性、群体遗传学、遗传咨
询以及诱变剂检测等工作。
80年代后期,分子细胞遗传学领域有了快速的发展。
现在我国生化遗传学已大步跨入分子遗传学行列。
在分子代谢病的突变性质、产前基因诊断、癌基因和肿瘤抑制基因的研究、分子生物学技术的广泛应用,以至基因治疗等方面都取得可喜的成果。
90年代参与了国际人类基因组计划,并开展了新致病基因的克隆研究。
我国的疾病种类众多,遗传资源丰富,深信我国的医学分子遗传学必在世界占有一席之地。
数十年来医学的飞速发展离不开生物学、物理学和化学等基础学科,以及材料、计算机、精密仪器等工程学科的发展,尤其以生物科学对医学的影响最为直接和深刻。
而遗传学作为近代生物学的基石对医学所做出的巨大贡献则在医学分子遗传学令人振奋的进步中得到充分的体现。
分子遗传学与医学的交叉诞生了医学分子遗传学,人类基因组计划的完成以及后续的功能基因组学的进步成为医学分子遗传学的重要基础之一。
分子生物学的新研究技术及新知识的引入加深了对疾病的致病机制及疾病的诊断、预防及治疗的认识,医学分子遗传学自诞生之日起,已经成为遗传学和医学领域里最为活跃的学科之一。
2医学分子遗传学主要研究内容
在遗传学科中,人类遗传学(human genetics)是探讨人类遗传性状的科学,研究人体各种性状及其变异的遗传现象及物质基础。
而医学分子遗传学则是从基因出发、在细胞、个体和家族群体的层面研究各种与人体健康和疾病有关的遗传特征及其表型,病理性状的遗传规律及其物质基础,从而提供人类疾病的诊断、治疗、预防的科学根据。
在医学分子遗传学中,最重要的步骤是发现与疾病有关的基因及其变异,从分子水平实现诊断、治疗和预防这些疾病的目标,并为相关人群提供必要的医学分子遗传学咨询。
日益增多的科学证据表明,几乎所有的人类疾病都与基因有关,因此医学分子遗传学延伸到几乎所有的人类疾病。
按基因与疾病表型间的关系,人类疾病可以分为单基因病、多基因病和获得性基因病三类。
单基因病(Monogenic disease; Single genedisorder)是指单一基因突变引起的疾病,符合孟德尔遗传方式,所以称为孟德尔式遗传病。
多基因病(Polygenic
disease)是指疾病的许多表型性状由不同座位的多个基因与环境因素协同决定,而非单一基因的作用。
因而呈现数量变化的特征,故又称为数量性状遗传性疾病。
而获得性基因病是病原微生物基因与人体基因相互作用的结果。
另外,线粒体基因突变可以导致线粒体基因遗传病,随同线粒体传递,呈细胞质遗传的特征。
体细胞遗传病是以体细胞遗传物质突变为直接原因的,所以癌肿属于体细胞遗传病,有些先天畸形也属于这类遗传病。
染色体病(Chromosome disease)仍然属于医学分子遗传学的范畴。
由于染色体的数目或形态、结构异常引起的疾病,通常分为常染色体病(Euchromosome disease)和性染色体病(Sex Chromosome disease)两大类。
现代遗传学的巨大进步给医学分子遗传学注入了新的内容,同时也对医学分子遗传学提出了许多新的研究课题,主要有以下几个。
2. 1人类疾病相关基因及其变异的研究
基因组指人类的全部遗传物质,人类基因组计划(Human Ge-nome project)揭示了人体遗传物质的全部核苷酸序列。
但是当我们阅读这个由30亿对核苷酸代码组成的序列时发现要理解这些序列所代表的意义还需要付出更艰巨的努力。
已经确定编码蛋白质的基因序列仅占整个基因组序列的5%。
因此为了有效地发现在医学上有重要意义的基因,首先必须确定基因及其在染色体上的位置,确定基因的表达调控元件,由此绘制出人类基因定位图。
在此基础上才有可能找出与疾病有关的基因和基因突变,进一步研究这些基因如何通过指导蛋白质的合成来实现其正常或异常的功能。
同时还必须了解基因的转录和剪接的规律、基因编码蛋白质的多样性、蛋白质翻译后修饰的方式等对这些基因功能的影响。
简而言之,只有了解了基因的结构、功能及其调控方式才能真正理解它们与人类疾病的发生、发展、预后的内在联系。
这对阐明人类疾病的分子机制和遗传方式,疾病的预防、诊断、治疗,遗传咨询及产前诊断等都极为重要。
近年来,以家系材料为对象,以连锁分析为基础的疾病相关基因定位克隆技术(positional clo-ning)的进展大大加快了对疾病相关基因的确定,无疑将有力地推动医学分子遗传学的发展。
由于分子生物学理论和技术的发展,确定了许多单基因遗传病的致病基因,以及它们的突变和表达调控异常。
但是发现致病基因仅仅是理解特定疾
病发生机制的第一步,还必须深入研究基因的功能以及病理状态下功能异常所导致的表型变异。
这就需要从蛋白质水平加以研究。
例如目前已经发现了6 000多种单基因病和性状中,大多数还没有在蛋白质(包括酶分子)水平证实其发生机理。
对动脉粥样硬化、肿瘤、精神分裂症、糖尿病等常见多基因复杂性疾病来说,单一的蛋白质编码基因研究则远远不能揭示疾病发生发展的分子机理,而需要从多个基因着手进行较为系统的探索。
例如特定的酶反应途径、细胞内信号转导途径、蛋白质分子间的相互作用网络等,这方面的分子水平研究仍在起始阶段。
同时环境和营养因素在多基因复杂疾病的发生中有着重要的作用,因此研究它们对基因功能的影响也是不可忽略的方面。
目前,遗传性疾病研究的焦点已经从相对简单的单基因疾病向复杂的多基因疾病转移。
这些都将有助于我们寻找更多有效的常见疾病预防和诊断方法、准确地判断疾病的预后和个体药物反应,发现新的靶向性治疗药物,对疾病采取有针对性的治疗。
在常见疾病中,肿瘤分子遗传学的研究一直是全世界生物学家与医学家最关心的课题。
肿瘤是危害人类健康的常见疾病,也是一类多基因复杂性疾病。
对癌基因(Oncogene)、肿瘤抑制基因(Tumor Suppressor gene)以及肿瘤转移基因(Metastatic gene)和肿瘤转移抑制基因(Non-metastatic gene)的发现及深入研究,无疑是对肿瘤的发生、恶性转化、转移的重大突破。
但是大量的研究证实涉及重要的生命活动的基因大多与肿瘤有关。
例如细胞分裂期相关基因、细胞凋亡相关基因、细胞的运动相关基因等,而对这些基因的综合研究将为肿瘤的防治奠定基础。
由此可见,要弄清疾病或病理缺陷的分子机制,首先要弄清楚异常的基因产物是如何引起临床症状。
对基因产物进行深入研究,然后设法分离相关基因,对基因进行序列分析,找出基因缺陷所在。
随着重组DNA技术的应用、DNA顺序上多态性的发现、限制性片段长度多态性(Restriction Fragment Length Polymorphism, RFLP)和单核苷酸多态性(SingleNucleotide Polymorphism, SNP)分析方法的建立,人类的遗传分析就可以直接从DNA水平上着手,而且更为方便和准确。
与人类所含有的十余万种蛋白质相比,DNA
的单核苷酸多态性远为常见,可以用作疾病的相关分析,而且检测方法也较简单,基因定位更加精确。
目前全世界共发现2 000余个与人类疾病有关的基因,其中有1 500余个已用于临床诊断和常见疾病的遗传风险预测。
我国批准用于临床诊断或疾病遗传易感性的基因种类仅几十个,不到美国的3%。
当然由于黄种人遗传背景与白种人不尽相同,不能完全照搬国外的诊断标准。
因此,开展黄种人基因与疾病关系的基础和应用研究显得意义非凡。
2. 2疾病的表观遗传学研究
除了隐藏在DNA序列之中的传统意义遗传信息外,近年来,科学家们发现了大量隐藏在DNA序列之外更高层次的遗传信息。
DNA序列的变异确实是疾病的基础,但是许多研究发现在DNA序列不发生变异的情况下的疾病发生机理。
基因的DNA序列没有发生改变的情况下基因功能发生了可遗传的变化导致了病理性表型即疾病,它不完全符合孟德尔遗传规律的核内遗传。
目前认为,这些高层次基因组信息主要包括非编码RNA(non-codingRNA)、DNA甲基化(DNA methyla-tion)和组蛋白(histone)共价修饰等表观遗传学信息(epigenetic information)。
由此我们可以认为,基因组含有两类遗传信息,一类提供生命必需蛋白质的模板,称编码遗传信息;另一类是表观遗传学信息,它提供了何时、何地、以何种方式去应用遗传信息的指令。
表观遗传学(epigenetics)是研究在不改变DNA序列的情况下基因表达发生改变的机制,以及这种改变在有丝分裂和减数分裂过程中如何遗传给子代的。
近年来,人们对肿瘤发生发展的认识已经不限于染色体变异和基因突变这个机理,表观遗传调控与肿瘤的关系日益受到重视。
过去一直认为肿瘤与基因突变有着密切的关系,研究者发现了许多促进肿瘤发生的癌基因和抑制肿瘤形成的肿瘤抑制基因中的突变。
但最近10多年来,通过对DNA甲基化模式的研究,人们发现许多种类的癌细胞都有着异常的DNA甲基化行为,肿瘤抑制基因常常被过量地甲基化而导致失去活性,而基因的DNA序列并不发生变化。
由此种种,科学家意识到,“表观遗传修饰”也是细胞癌变的一个重要原因。
从基因序列变异与表观遗传因素的结合来探索肿瘤这种多基因复杂性疾病发生的机理,可能对正确认识癌症等人类重大疾病具有更为重要的意义。
越来越多的研究表明,一个细胞的DNA甲基化形式大致代表了该细胞表达特征的蓝图。
组蛋白氨基端修饰涉及乙酰化(acetylation)、甲基化(methyla-tion)和磷酸化(phosphorylation)的复杂组合方式,构成了“组蛋白密码”(histone code),影响基因表达。
染色质结构重塑(chromatin remodeling)与基因表达密切相关。
非编码RNA(non-coding RNA)可能通过RNA干扰(RNA interference)机制调节影响其它基因的活性,蛋白质分子间的相互作用在信号转导途径与基因组层面对基因功能的调节作用,叶绿体(chloroplast)和线粒体(mitochondria)的基因组可能也参与了表观遗传调控机制。
这些信息表达和传递的交叉组合和相互调节,极大地丰富了遗传密码的信息贮存量。
同时随功能基因组学和蛋白质组学的发展,人们逐渐认识到蛋白质空间结构的特异性和重要性。
因而基于蛋白质和酶的空间结构特异性决定其作用物、产物的特异性,于是有人提出“空间密码”的理论,认为蛋白质分子的结构与修饰的模式也能体现并传递核遗传信息,谓之“蛋白质遗传”。
此外,尚有“糖密码”(saccharide code or glycome)的报道等。
这些都提示,遗传信息并非仅仅是中心法则所说的DNA信息大分子中的一级序列,大分子“构型”(conformation)本身也是一种信息,而且可以是一种遗传信息。
因此,表观遗传学概念似乎就应该随着遗传信息范畴的扩大而有所拓展。
但是表观遗传学研究的内容还是属于总的遗传学范畴,或许可以这样认为,经典遗传学与表观遗传学是现代遗传学的两大支柱。
2.3疾病的系统生物学研究
系统生物学(SystemsBiology)是研究一个生物系统中所有组成成分(基因、mRNA、蛋白质等)的构成,以及在特定条件下这些组分间的相互关系的学科。
也就是说,系统生物学不同于以往的实验生物学仅关心个别的基因和蛋白质,它要研究所有的基因、所有的蛋白质、组分间的所有相互关系。
显然,系统生物学是以整体性研究为特征的一门学科。
多基因病涉及多个基因的效应以及环境因素的综合作用,可以看成是一个复杂的系统。
用系统生物学的方法首先对多基因病的组分(基因、mRNA、蛋白质、环境因子等)进行了解和确定。
通过数据整合描绘出该病理系统的结构和相互作用网络。
第二步是用系统干预方法观察系统结构和功能的相应
变化,包括基因表达、蛋白质表达和相互作用、代谢途径等的变化。
第三步是把通过实验得到的数据建立计算机模型。
最后阶段是根据模型的预测或假设,设计可以对系统进行干预的参数和条件。
重复第二步和第三步,不断地通过实验数据对模型进行修订和精练,其目标就是要得到一个尽可能符合疾病真实情况的模型。
利用这类模型不仅可以了解遗传性疾病发生发展的规律,还可以设计干预或治疗手段,确定靶分子用于药物筛选,也可以预测疗效及药物代谢途径。
当前医学分子遗传学领域中系统生物学研究的杰出例子是全基因组相关研究和个体基因组研究。
当这些遗传学的最新进展涉及人类健康与疾病的同时也成为医学分子遗传学的最新成就。
近年来第一个大规模、高通量的全基因组相关研究(Genome-W ideAssociation,GWA)的浪潮使得我们对许多诸如多基因常见疾病等复杂性状的遗传学基础有了进一步的了解。
大量与Ⅰ型和Ⅱ型糖尿病(diabetes1/2)、炎性结肠疾病( inflammatory boweldisease)、前列腺癌(prostate cancer)和乳腺癌( breast cancer)等复杂性状疾病遗传易感性相关的新基因位座得到确定。
而对哮喘(asthma)、冠心病(coronary heart disease)和心室纤维颤动(atrial fibrillation)等复杂性疾病来说大多还是证实了以往发现遗传易感性相关基因位座,只有少数几个新基因位座被确定。
同时全基因组相关研究还发现了一些影响脂肪代谢、身高和机体脂肪含量(fatmass)等重要连续变异性状的常见基因变异位点。
例如2007年,英国WTCCC机构(WellcomeTrustCase ControlConsortium),一个由50余家英国科研机构组成的团体,花费900万英镑对双向障碍性精神障碍(bipolar disorder)、冠心病、节段性肠炎(Crohns' disease)、类风湿性关节炎、高血压病、Ⅰ型糖尿病和Ⅱ型糖尿病等七类常见复杂性疾病进行全基因组SNP扫描,每种疾病的受试者分别多达2 000余人,有3 000名健康者作为对照。
他们最终揭开了那些受到多种基因影响的疾病的神秘面纱,并于2007年6月公布了研究结果。
如此大规模的研究,可以让研究者辨识出罕见的基因异常。
研究发现有的疾病相关SNP 位点存在于基因的编码区,造成蛋白质分子的异常而引起病理学性状。
有的位于基因的非编码区,这些区域可能具有调控其他基因功能的作用。
还有一。