基因组计划综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人类基因组计划综述
摘要:人类基因组计划(humangenomeproject,HGP)是由美国科学家于1985年率先提出,旨在阐明人类基因组30亿个碱基对的序列,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我。于1990年正式启动的。这一计划旨在为30多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息。与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。
关键字:人类基因组计划;碱基构成;遗传信息
一、研究内容和目标
人类基因组计划的内容和分阶段目标如下:
1、遗传图谱的绘制。遗传图谱主要是用遗传标签来确定基因在染色体上的排列。1994年9月,完成了包含3000个(原计划为600-1500)标签分辨率为1-cM(即1%重组率)的遗传图谱的绘制。
2、物理图谱的绘制。物理图谱是通过序列标签位点对构成基因组的DNA分子进行测定,从而对某基因所相对之遗传讯息及其在染色体上的相对位置做一线性排列。1998年10月,完成了包含52,000个(原计划为30,000)序列标签位点的物理图谱的绘制。
3、序列测定。通过测序得到基因组的序列,是一般意义上的人类基因组计划。2003年4月,包含基因序列中的98%(原预计为95%)获得了测定,精确度为99.99%。
4、辨别序列中的个体差异。每一个人都有唯一的基因序列,因此,人类基因组计划发布的数据不可能精确的反映单独个体的基因序列。它只是很少量匿名捐赠人基因组的组合。人类基因组计划只是为未来鉴定不同个体间基因组差异做一些基础的框架性工作。当前主要工作在于鉴定不同个体间包含的单核苷酸多态性。至2003年2月,已有约3,700,000个单核苷酸多态性位点得到测定。
5、基因鉴定。以获得全长的人类cDNA文库为目标。至2003年3月,已获得15,000个全长的人类cDNA文库。人类基因组计划最开始的目标是不但以最小的错误率检测出人类基因的所有30亿个碱基对,还要从如此海量的数据中确认出所有的基因及其序列。这一部分计划正在进行中,尽管目前的数据显示在人类基因组中只有大约20,000至25,000个基因,远远低于大多数科学家先前的估计。
6、基因的功能性分析。今天,人类DNA序列已经存储在数据库中,任何人都可以通过互联网下载。美国国家生物技术信息中心和位于欧洲和日本的姊妹组织储存着整个基因序列,其中包含已知序列,假设基因和蛋白质。其他组织像加州大学圣塔克鲁斯分校和ENSEMBL提供附加数据,注释和观察和检索数据的有力工具。
二、测序手段
在国际计划中,基因组被分割成多个片断(长度接近150,000个碱基对)。由于这些片断能被插入细菌中,并利用细菌的DNA复制机器进行复制,因此被称为细菌人工染色体。通过对每一个这样的片断分别应用“霰弹枪测序法”,最终将这些片断通过配对末端法(pair-end)以及其他许多定位数据重新组装在一起从而获得完整的基因组。这一手段是先将基因组分成相对较大的片断,并且在对片断进行测序前将其定位到每条染色体对应位置,所以被称为“分级霰弹枪测序法”。
三、研究进展
人类基因组测序“完成”了吗?关于如何界定人类基因组测序完成,有多种定义。根据不同的定义,人类基因组的测序是否完成有不同的看法。曾有多个大众媒体报道人类基因组计划“完成”,而且由国际人类基因组计划所采用的定义,基因组的测序已经完成。有统计数据显示,截至2003年底,绝大部分的人类基因组已获得测定;但基因组中仍有许多的区域未获得测序。这其中的首要原因是在每条染色体的中心区域(称为着丝粒)含有大量重复DNA序列,用目前的技术进行测序的难度较大。着丝粒含有数百万(可能接近千万)的碱基对,其中的大多数完全没有得到测序。第二个原因是在染色体末端区域(称为端粒)同样含有高度重复的DNA序列。而且在46条染色体中,其末端大都不完整,因此无法精确地知道在端粒前还有多少序列;与着丝粒的情况类似,目前的技术很难测定这些序列。第三个原因是在每个人的基因组中都含有多个包含多基因家族成员的位点,这些位点的测序问题用霰弹枪测序法难以解决,而包含于这些位点中的多基因家族成员往往编码具有重要免疫功能的蛋白质。对于前两个原因,可以通过发展新的技术来解决测序问题。除了以上区域,还有一些间隙散布于基因组中,部分间隙较大,但有希望在数年内解决。总而言之,对于全基因组的大小的估计显示了92%的基因组已经获得测定,余下的高度重复的DNA序列不大可能含有基因,但在完成所有的测序之前,没有什么是确定无误的。
相对于基因组测序而言,要了解所有基因的功能还有很长的一段路要走。例如以前人们所认为的垃圾DNA(junk DNA)实际上并不“垃圾”,它们在基因组的进化、每个个体的差异性以及许多其他方面扮演着重要角色,是世界上许多实验室着力研究的目标。
四、对人类的重要意义
破译人类遗传信息,将对生物学,医学,乃至整个生命科学产生无法估量的深远影响。
1、对人类疾病和医学方面的贡献
基于DNA载有的信息在细胞生命活动中的指导作用,在分子生物学水平上深入了解疾病的产生过程将大力推动新的疗法和新药的开发研究。对于癌症、老年痴呆症等疾病的病因研究也将会受益于基因组遗传信息的破解。事实上,在人类基因组计划完成之前,它的潜在使用价值就已经表现出来。大量的企业,例如巨数遗传公司(Myriad Genetics)开始提供价格合宜,而且容易使用的基因测试,其声称可以预测包括乳腺癌、凝血、纤维性囊肿、肝脏疾病在内的很多种疾病。
2、对生物技术等研究领域的贡献
人类基因组计划对许多生物学研究领域有切实的帮助。例如,当科研人员研究一种癌症时,通过人类基因组计划所提供的信息,可能会找到某个,或些相关基因。如果在互联网上访问由人类基因组信息而建立的各种数据库,可以查询到其他科学家相关的文章,包括基因的DNA,cDNA碱基顺序,蛋白质立体结构、功能,多态性,以及和人类其他基因之间的关系。也可找到和小鼠、酵母、果蝇等对应基因的进化关系,可能存在的突变及相关的信号传到机制。人类基因组计划对与肿瘤相关的癌基因,肿瘤抑制基因的研究工作,起到了重要的推动作用。
3、对社会经济的重要影响
生物产业与信息产业是一个国家的两大经济支柱;发现新功能基因的社会和经济效益;转基因食品;转基因药物(如减肥药,增高药)
4、对生物进化研究的影响
分析不同物种的DNA序列的相似性会给生物进化和演变的研究提供更广阔的路径。事