分子生物学11-基因组学与比较基因组学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、物理图
遗传图所表现的,是通过连锁分析确定的各基因间的相 对位置;物理 图则表现染色体上每个DNA片段的实际顺序。 物理图是指以已知核苷酸序列的DNA片段(序列标签位点,
sequencetagged site,STS)为“路标”,以碱基对(bp,kb,Mb)
作为基本测量 单位(图距)的基因组图。 STS:即序列标签位点,是指基因组中物理位置已被确定的小 段单拷贝序列,是功能基因在染色体上位置的标记。
人类基因组计划1%测序中国实验室
基因控制着细胞中的蛋白质合成,控制着生物的各种遗传性状。基因组 是生物体内遗传信息的集合,是某个特定物种细胞内全部DNA分子的总和。人 体是一个多细胞体系,每个细胞中都包含46条两两配对的染色体,每23条染 色体构成一个染色体组。大约有30亿对核苷酸,编码了2-3万个基因,人类 基因组中携带了有关人类个体生长发育、生老病死的全部遗传信息。从整体 上看,不同人类个体的基因是相同的,因此,我们说“人类只有一个基因 组”,人生来是平等的。当然,不同的人可能拥有不同的等位基因,这一点 决定了人与人之间个体上的差异。 各种遗传病的发生,都源于基因的突变。突变是基因在分子结构上的改变, 这种DNA分子结构的改变会导致基因功能的异常,从而导致遗传病。例如人类 2号染色体长臂某段DNA分子的改变,就会导致并指畸形的产生。至于一些复 杂的疾病,如高血压、冠心病、糖尿病、癌等,则可能涉及多个基因的突变。
日本:RIKEN等两家研究中心,贡献率为7%。
法国:GENOSCOPE研究中心,贡献率为2.8%。 德国:IMB等3家研究中心,贡献率为2.2%。
中国:北京华大研究中心、国家南北方基因研究 中心等三家,贡献率为1%。
• 2000年6月, 完成并公布人类基因组工作框架图( 90%)。 • 2001年2月,人类基因组“精细图”完成,(99%)。 • 2003年4月,人类基因组序列图亦称“完成图”(99.99%), 提前绘制成功。
发的分子病理学改变及其进程,为这些疾病的诊断、预防和治
疗提供理论依据。
(7)确定人类基因组中转座子、逆转座子和病毒残余序列,研究 其周围序列的性质。了解有关病毒基因组侵染人类基因组后的 影响,可能指导人类有效地利用病毒载体进行基因治疗。
★ 在基因组内存在着通过DNA转录为RNA后,再经逆转录成为cDNA并插入到基因 组的新位点上的因子,被称为逆转座子。
□ 人类基因组计划的启动
1986 年诺贝尔奖获得者R.Dulbecco
(杜尔贝科)提出人类基因组计划——
测出人类全套基因组的 DNA 碱基序列 ( 3 X 109 bp )
1975年,获诺贝尔生理医学奖
6国科学家组成的国家人类基因组中心主要研究 比例
美国:WASH&MIT等7家研究中心,贡献率为54%。 英国:SANGER一家研究中心,贡献率为33%。
第十一章 基因组与比较基因组学
20世纪人类科技发展史上的三大创举
90年代人类基因组计划 60年代人类首次登上月球 40年代第一颗原子弹爆炸
Contents
● 人类基因组计划 ● DNA的鸟枪法序列分析技术 ● 比较基因组学及功能基因组研究
第一节
人类基因组计划
一、人类基因组计划简介
人类基因组计划是美国科学家于1985 年率先提出的,旨在阐明人类基因组30亿个碱 基对的序列,发现所有人类基因并搞清其在染 色体上的位置,破译人类全部遗传信息,使人 类第一次在分子水平上全面地认识自我。计划 于1990年正式启动,这一价值30亿美元的计划 的目标是,为30亿个碱基对构成的人类基因组 精确测序,从而最终弄清楚每种基因制造的蛋 白质及其作用。
忠实复制保障了遗传的稳定性,正常的重组提供了
变异与进化的分子基础。局部DNA的推迟复制、异
常重组等现象则导致疾病或者胚胎不能正常发育,
因此,了解与人类DNA正常复制和重组有关的序列
及其变化,将对研究人类基因组的遗传与进化提供
重要的结构上的依据。
(6)研究DNA突变、重排和染色体断裂等,了解疾病的分子机制, 包括遗传性疾病、易感性疾病、放射性疾病甚至感染性疾病引
也是最详尽的物理图。 序列图既包括可转录序列,也包括非转录序列, 是转录序列、调节序列和功能未知序列的总和。
人类基因组的核苷酸序列图其实是分子水平上最高层次的、最 详尽的物理图。测定总长约1米、由30亿个核苷酸组成的全序列当 然是人类基因组计划中最明确、最艰巨的任务。因为人类所拥有 的基因位点都是相同的,不同种族、不同个体的基因差异(人类 基因组的多样性)以及“正常”与“疾病”基因的差异,只是同 一位点上的等位基因的差异,所以,现在的人类基因组全序列来 自一个“代表性人类个体”(其所有权在法律上不属于任何供 体)。该序列在理论上代表了全人类的基因组信息,事实上也可 被用于任何族群、任何个体的基因分析和诊断。 人类基因组计划所提供的这四张图,特别是人类核酸序列图, 蕴藏了决定我们生、老、病、死的所有遗传信息,必将成为人类 认识自我、改造自我的用之不绝的知识源泉,为21世纪现代生物 学和医学的迅速发展奠定基础。
二、人类基因组计划的科学意义
(1)确定人类基因组中约3万个编码基因的序列 及其在基因组中的物理位置,研究基因的产物及
其功能。
(2)了解转录和剪接调控元件的结构与位置, 从整个基因组结构的宏观水平上理解基因转录与 转录后调节。
(3)从整体上了解染色体结构,包括各种重复序列
以及非转录“框架序列”的大小和组织,了解各种
3、转录图 转录图:以EST(expressed sequence tag , 表达序列标签)为标记,根据转录顺序的位置 和距离绘制的图谱。
EST:即表达序列标签,通过对随机选择的cDNA克 隆进行5‘或3’端一次测序所获得的核苷酸序列,代
表了完整基因的一部分。
4、序列图(分子水平的物理图)
序列图是指整个人类基因组的核苷酸序列图,
三、 DNA的鸟枪法测序的优缺点
优点:速度快
缺点:
●随着所测基因组总量增大,所需测序的片段大量
增加
●高等真核生物(如人类)基因组中有大量重复序
列,导致判断失误
第三节 比较基因组学及功能基因组学研究
一、比较基因组学(Comparative Genomics) 概念:是基于基因组图谱和测序基础上,对已 知的基因和基因组结构进行比较,来了解基因 的功能、表达机理和物种进化的学科。
二、功能基因组学研究 1. 概念:利用结构基因组学提供的信息,以高 通量,大规模实验方法及统计与计算机分析为 特征,全面系统地分析全部基因的功能。
第二节
DNA的鸟枪法序列分析技术
一、DNA的鸟枪法测序原理 基因测序“鸟枪法”,先将整个基因 组打乱,切成随机碎片,然后测定每个 小片段序列,最终利用计算机对这些切 片进行排序和组装,并确定它们在基因 组中的正确位置。(如下图) 鸟枪法(Shotgun method):使用 基因组中的随机产生的片段作为模板进 行克隆的方法。
二、DNA的鸟枪法测序的主要步骤
• 第一,建立高度随机、插入片段大小为2kb左右的基因组文库。 克隆数要达到一定数量,即经末端测序的克隆片段的碱基总 数应达到基因组5倍以上。 • 第二,高效、大规模的末端测序。 对文库中每一个克隆,进行两端测序,TIGR在完成流感嗜血 杆菌的基因组时,使用了14台测序仪,用三个月时间完成了必需 的28,463个测序反应,测序总长度达6倍基因组。 • 第三,序列集合。 TIGR发展了新的软件,修改了序列集合规则以最大限度地排 除错误的连锁匹配。 • 第四,填补缺口。 有两种待填补的缺口,一是没有相应模板DNA的物理缺口, 二是有模板DNA但未测序的序列缺口。他们建立了插入片段为1520kb的λ 文库以备缺口填补。
(8)研究染色体和个体之间的多态性。这些知 识可被广泛用于基因诊断、个体识别、亲子鉴定、
组织配型、发育进化等许多医疗、司法和人类学
的研究。此外,这些遗传信息还有助于研究人类
历史进程、人类在地球上的分布与迁移以及人类
与其他物种之间的比较。
• 以人类基因组和拟南芥基因组为例说明你对生 物基因组全序测定工作的科学意义与社会意义
的认识(8分)
中国科学院2002年
硕士学位研究生入学分子遗传学试题
遗传图谱
转录图谱
三、HGP的主要任务
0.7 cM 或 kb
四张图:
物理图、 转录图
物理图谱
序列图谱
遗传图 、序列图
100 kb STS map
□ 人类基因组研究包括遗传图(Genetic Map)绘制, 物理图(Physical Map)构建、测序,转录图(Expression Profiling)绘制和人类基因组的序列图及基因鉴定等方面 的工作。 通过多年来的发展,基因组学(genomics)作为一门专 门学科,已应运而生。它涵盖以下几个方面: □ 结构基因组学,着重遗传图、物理图、测序等研究; □ 功能基因组学,包括以转录图为基础的功能制图(基因 组表达图); □ 比较基因组学,包括对不同进化阶段生物基因组的比较 研究,也包括不同人种、族群和群体基因组的比较研究。
酵母第三号染色体 的遗传图(右) 与物理图(左)
这些大片段在进行DNA分子克隆时,也不能通 过细菌质粒或噬菌体的运载而在大肠杆菌中进行 克隆,因为它们太大,而必须用一种特殊的载 体—酵母人工染色体(YAC),将片段导入酵 母,在酵母细胞中克隆。YAC中的DNA大片段是靠 序列标记位标(STS)来识别的。STS是一段 200~500碱基对的已知序列,在染色体上有一定 的位置,所以用STS作位标可将不同YAC克隆排列 成邻接克隆群(contig)。 其他载体还有BAC(细菌人工染色体)、 P1(噬菌体人工染色体)、粘粒(cosmid)、细 菌质粒等。现在,人类基因组24条染色体的YAC、 BAC、P1邻接克隆群均已建立,精度约100碱基对 的物理图也基本绘成,并已开始进行大规模测序。
不同序列在形成染ห้องสมุดไป่ตู้体结构、DNA复制、基因转录
及表达调控中的影响与作用。
(4)研究空间结构对基因调节的作用。有些基因的 表达调控序列与被调节基因从直线距离上看,似乎 相距甚远,但若从整个染色体的空间结构上看则恰 恰处于最佳的调节位置,因此,有必要从三维空间
的角度来研究真核基因的表达调控规律。
(5)发现与DNA复制、重组等有关的序列。DNA的
1、 遗传图(连锁图)
□ 遗传图也称连锁图,是指基因或DNA标志在染色体上的相对 位置与遗传距离,后者通常以基因或DNA片段在染色体交换过程 中的分离频率厘摩(cM)来表示。遗传图的绘制是人类基因组 研究的第一步,即以染色体上某一点为遗传标记,以与之相伴 遗传的特征为对象,经连锁分析,将编码该特征的基因定位于 染色体特定位置。cM值越大,两者之间距离越远。通过遗传图 分析,我们可以大致了解各个基因或DNA片段之间的相对距离与 方向,了解哪个基因更靠近着丝粒,哪个更靠近端粒等。遗传 距离是通过遗传连锁分析获得的,研究中所使用的DNA标志越多, 越密集,所得到的遗传连锁图的分辨率就越高。