基因组和比较基因组学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/5/3
(6)研究DNA突变、重排和染色体断裂等,了解疾病的 分子机制,包括遗传性疾病、易感性疾病、放射性疾 病甚至感染性疾病引发的分子病理学改变及其进程, 为这些疾病的诊断、预防和治疗提供理论依据。
(7)确定人类基因组中转座子、逆转座子和病毒残余序 列,研究其周围序列的性质。了解有关病毒基因组侵 染人类基因组后的影响,可能指导人类有效地利用病 毒载体进行基因治疗。
2000.6. 完成并公布人类基因组工作框 架图( 90%)。
2020/5/3
二000年六月二十六日克林顿宣布 人类基因组草图绘制完成
2020/5/3
美国国家人类基因组研究所所长弗朗西斯·柯林 斯在介绍情况。
2020/5/3
人类基因组草图基本信息
人类基因组 人类蛋白质
• 由31.65亿bp组成 • 61%与果蝇同源 • 含3~3.5万基因 • 43%与线虫同源 • 与蛋白质合成有关 • 46%与酵母同源
由国立卫生研究院和能源部共同组成“人类基 因组研究所”
逐渐地,HGP 扩展为多国协作计划,参与者包 括:英、日、法、德和中国(1993年)。
2020/5/3
二、人类基因组计划的进展状况
(1)截至 2019 年 10 月,完成 1.8 × 108bp, 占计划的 6%。 (2)完成一系列模式生物全基因组测定。
的基因占2%
2020/5/3
2000年6月公共领域测序计划工作框架图
2020/5/3
2000 年 12 月美、英等国科学家宣布绘出拟 南芥基因组的完整图谱,这是人类首次全部破译 出一种植物的基因序列。
2020/5/3
2019年2月16日 人类基因组“精细图”完成(99%)。
2020/5/3
同时发表论文 美国 Science, Vol. 291, No.
这些模式生物全基因组测定的完成有重大 理论与现实意义。
2020/5/3
(3)DNA 测序技术飞速提高 2019.5.9. J.C. Venter 等宣布,组建商业
公司,投入 3 亿美元,3 年内完成。 接着又有若干家公司成立,总共投入资金约
几十亿美元,形成“公”“私”并进格局。
2020/5/3
2020/5/3
一、人类基因组计划的启动
1986年,诺贝尔奖获得者R.Dulbecco(杜尔贝 科)提出人类基因组计划——测出人类全套基因组 的 DNA 碱基序列( 3 × 109 bp )。
2020/5/3
1975年,获诺贝尔生理医学奖
2020/5/3
2020/5/3
美国政府决定于 1990年正式启动HGP,预计 用 15 年时间,投入 30 亿美元,完成 HGP。
2020/5/3
2020/5/3
3、转录图 以EST(expressed sequence tag ,表达序列 标签)为标记,根据转录顺序的位置和距离绘 制的图谱。
EST:通过从cDNA文库中随机挑选的克隆进行测序 所获得的部分cDNA的5'或3'端序列称为表达序列 标签(EST),一般长300-500bp左右。
第十章 基因组与比较基因组学
2020/5/3
20世纪人类科技发展史上的三大创举
90年代人类基因组计划 60年代人类首次登上月球 40年代第一颗原子弹爆炸
2020/5/3
Contents
• 人类基因组计划 • DNA的鸟枪法序列分析技术 • 比较基因组学及功能基因组研究
2020/5/3
第一节 人类基因组计划
2020/5/3
2020/5/3
(8)研究染色体和个体之间的多态性。这些知 识可被广泛用于基因诊断、个体识别、亲子鉴 定、组织配型、发育进化等许多医疗、司法和 人类学的研究。此外,这些遗传信息还有助于 研究人类历史进程、人类在地球上的分布与迁 移以及人类与其他物种之间的比较。
2020/5/3
• 以人类基因组和拟南芥基因组为例说明你对生 物基因组全序测定工作的科学意义与社会意义 的认识(8分) 中国科学院2019年 硕士学位研究生入学分子遗传学试题
5507 英国Nature , Vol.409, p.860
2020/5/3
DNA
测 序 胶 图
2020/5/3
201来自百度文库年4月14日,人类基因组序列图 亦称“完成图”(99.99%),提前绘制成 功。
2020/5/3
三、人类基因组计划的科学意义
(1)确定人类基因组中约5万个编码基因的序列 及其在基因组中的物理位置,研究基因的产物 及其功能。
2020/5/3
• 多态性:人的DNA序列上平均每几百个碱基会出现 一些变异(variation),并按照孟德尔遗传规律 由亲代传给子代,从而在不同个体间表现出不同, 因而被称为多态性(Polymorphism)。
2020/5/3
第一代多态性标记是RFLP(restriction fragment length polymorphism,限制性片段长度多态性)
方法用的最多,技术最成熟。
2020/5/3
(2)基因敲除技术(gene knockout) 又称基因打靶(gene targeting)。这种技
术是通过基因工程的方法将一个结构已知但功能 未知的基因去除,或用其他序列相近的基因取代 (又称基因敲入),然后从整体观察实验动物, 从而推测相应基因的功能。这种人为地把实验动 物某一种有功能的基因完全缺失的技术称为基因 敲除技术。
2020/5/3
Sequence)
完成 总长度 年份 /Mp 2019 12 2019 96 2000 116 2000 115 2000 34 2019 34 2019 2693
已完成总长 的百分数/% 93 99 64 92 75 70 84
占常染色质 百分数/Mb
100
基因数 /Mb
483
100
2020/5/3
第三代多态性标记是单核苷酸的多态性 (single nucleotide polymorphism,SNP) SNP:是由于单个核苷酸改变而导致的核酸序列多态。 第一军医大学2019年分子生物学
2020/5/3
人类99.9%的基因密码是相同的, 而差异不到0.1%,不同人群仅有 140万个核苷酸差异。这些差异是由 “单一核苷酸多样性”(SNP)产 生的,它构成了不同个体的遗传基 础。在整个基因组序列中,人与人 之间的变异仅为万分之一,从而说 明人类不同“种属”之间并没有本 质上的区别。
2020/5/3
二、DNA的鸟枪法测序的主要步骤
• 第一,建立高度随机、插入片段大小为2kb左 右的基因组文库。
• 第二,高效、大规模的末端测序。 • 第三,序列集合。 • 第四,填补缺口。
2020/5/3
Shotgun法序列拼接
2020/5/3
Sequence Gap
三、DNA的鸟枪法测序的优缺点
2020/5/3
SNP与RFLP和STR标记的主要不同之处在于,它 不再以DNA片段的长度变化作为检测手段,而直接 以序列变异作为标记。
2020/5/3
2020/5/3
2、物理图 以已知核苷酸序列的DNA片段(序列标签位点, sequence-tagged site,STS)为“路标”,以碱 基对作为基本测量单位(图距)的基因组图。
2020/5/3
4、序列图(分子水平的物理图) 序列图是指整个人类基因组的核苷酸序列图,也是 最详尽的物理图。1m 既包括可转录序列,也包括非转录序列,是转录序 列、调节序列和功能未知序列的总和。
2020/5/3
2000年6月公共领域测序计划工作框架图
2020/5/3
Contents
• 人类基因组计划 • DNA的鸟枪法序列分析技术 • 比较基因组学及功能基因组研究
2020/5/3
2020/5/3
第二代多态性标记是短的串联重复序列 包括小卫星DNA和微卫星DNA,其多态性主要来自重 复序列拷贝数的变化
2020/5/3
小卫星DNA—由15-65bp的基本单位串联重复而成, 长度一般不超过20kb。 重复次数(小卫星DNA区的长度)在人群中是高度变 异的;按照孟德尔的规律遗传
2020/5/3
第二节 DNA的鸟枪法序列分析技术
一、DNA的鸟枪法测序原理
2020/5/3
2019 年 12 月用“逐个克隆 法”获得第一条 人类染色体 —22 号染色体完成序 列
2020/5/3
2000 年3 月 用“全基因组 鸟枪法”获得 果蝇全基因组 序列。
2020/5/3
2000年6月公共领域测序计划工作框架图
微卫星DNA/简短串联重复(STR、STRP或SSLP) 重复单元2-8bp,通常重复10-60次
CTAGCTTATATATATATATATATATATATAAGCTTGC
2020/5/3
• 真核生物基因组中的DNA重复序列主要有哪些类 型?简要说明基因组重复序列可能的生物学意 义以及基因组重复序列在分子标记研究中的应 用 (12分) 中国科学院2019年 硕士学位研究生入学分子遗传学试题
2020/5/3
(5)发现与DNA复制、重组等有关的序列。DNA的 忠实复制保障了遗传的稳定性,正常的重组提供 了变异与进化的分子基础。局部DNA的推迟复制 、异常重组等现象则导致疾病或者胚胎不能正常 发育,因此,了解与人类DNA正常复制和重组有 关的序列及其变化,将对研究人类基因组的遗传 与进化提供重要的结构上的依据。
2020/5/3
遗传图谱 0.7 cM 或
kb
物理图谱
转录图谱
四、HGP的主要任务
序列图谱
四张图: 物理图、 转录图 遗传图 、序列图
100 kb S2T02S0/5m/3 ap
1、 遗传图(连锁图) 指基因或DNA标记在染色体上的相对位置与遗传距离。 cM(基因或DAN片段在染色体交换过程中分离的频率)
197
97
117
100
221
100
7
97
16
90
12
2019 2654 83
99-93
15
二、功能基因组学研究 1. 概念:利用结构基因组学提供的信息,以高
通量,大规模实验方法及统计与计算机分析为 特征,全面系统地分析全部基因的功能。
2020/5/3
2. 基因功能的研究方法 (1)基因转导技术:导入细胞,观察功能。该
第三节 比较基因组学及功能基因组学研究
一、比较基因组学(Comparative Genomics) 概念:是基于基因组图谱和测序基础上,对已 知的基因和基因组结构进行比较,来了解基因 的功能、表达机理和物种进化的学科。
2020/5/3
基本完成DNA序列分析的真核生物基因组比较
物种
酵母 线虫 果蝇 拟南芥 人类第21染色体 人类第22染色体 人类全基因组 (Public Sequence) 人类全基因组 (Celera
(2)了解转录和剪接调控元件的结构与位置, 从整个基因组结构的宏观水平上理解基因转录 与转录后调节。
2020/5/3
(3)从整体上了解染色体结构,包括各种重复序列 以及非转录“框架序列”的大小和组织,了解各种 不同序列在形成染色体结构、DNA复制、基因转录 及表达调控中的影响与作用。
(4)研究空间结构对基因调节的作用。有些基因的 表达调控序列与被调节基因从直线距离上看,似乎 相距甚远,但若从整个染色体的空间结构上看则恰 恰处于最佳的调节位置,因此,有必要从三维空间 的角度来研究真核基因的表达调控规律。
优点:速度快 缺点: ●随着所测基因组总量增大,所需测序的片段大量 增加 ●高等真核生物(如人类)基因组中有大量重复序 列,导致判断失误
2020/5/3
2020/5/3
2020/5/3
Contents
• 人类基因组计划 • DNA的鸟枪法序列分析技术 • 比较基因组学及功能基因组研究
2020/5/3
(6)研究DNA突变、重排和染色体断裂等,了解疾病的 分子机制,包括遗传性疾病、易感性疾病、放射性疾 病甚至感染性疾病引发的分子病理学改变及其进程, 为这些疾病的诊断、预防和治疗提供理论依据。
(7)确定人类基因组中转座子、逆转座子和病毒残余序 列,研究其周围序列的性质。了解有关病毒基因组侵 染人类基因组后的影响,可能指导人类有效地利用病 毒载体进行基因治疗。
2000.6. 完成并公布人类基因组工作框 架图( 90%)。
2020/5/3
二000年六月二十六日克林顿宣布 人类基因组草图绘制完成
2020/5/3
美国国家人类基因组研究所所长弗朗西斯·柯林 斯在介绍情况。
2020/5/3
人类基因组草图基本信息
人类基因组 人类蛋白质
• 由31.65亿bp组成 • 61%与果蝇同源 • 含3~3.5万基因 • 43%与线虫同源 • 与蛋白质合成有关 • 46%与酵母同源
由国立卫生研究院和能源部共同组成“人类基 因组研究所”
逐渐地,HGP 扩展为多国协作计划,参与者包 括:英、日、法、德和中国(1993年)。
2020/5/3
二、人类基因组计划的进展状况
(1)截至 2019 年 10 月,完成 1.8 × 108bp, 占计划的 6%。 (2)完成一系列模式生物全基因组测定。
的基因占2%
2020/5/3
2000年6月公共领域测序计划工作框架图
2020/5/3
2000 年 12 月美、英等国科学家宣布绘出拟 南芥基因组的完整图谱,这是人类首次全部破译 出一种植物的基因序列。
2020/5/3
2019年2月16日 人类基因组“精细图”完成(99%)。
2020/5/3
同时发表论文 美国 Science, Vol. 291, No.
这些模式生物全基因组测定的完成有重大 理论与现实意义。
2020/5/3
(3)DNA 测序技术飞速提高 2019.5.9. J.C. Venter 等宣布,组建商业
公司,投入 3 亿美元,3 年内完成。 接着又有若干家公司成立,总共投入资金约
几十亿美元,形成“公”“私”并进格局。
2020/5/3
2020/5/3
一、人类基因组计划的启动
1986年,诺贝尔奖获得者R.Dulbecco(杜尔贝 科)提出人类基因组计划——测出人类全套基因组 的 DNA 碱基序列( 3 × 109 bp )。
2020/5/3
1975年,获诺贝尔生理医学奖
2020/5/3
2020/5/3
美国政府决定于 1990年正式启动HGP,预计 用 15 年时间,投入 30 亿美元,完成 HGP。
2020/5/3
2020/5/3
3、转录图 以EST(expressed sequence tag ,表达序列 标签)为标记,根据转录顺序的位置和距离绘 制的图谱。
EST:通过从cDNA文库中随机挑选的克隆进行测序 所获得的部分cDNA的5'或3'端序列称为表达序列 标签(EST),一般长300-500bp左右。
第十章 基因组与比较基因组学
2020/5/3
20世纪人类科技发展史上的三大创举
90年代人类基因组计划 60年代人类首次登上月球 40年代第一颗原子弹爆炸
2020/5/3
Contents
• 人类基因组计划 • DNA的鸟枪法序列分析技术 • 比较基因组学及功能基因组研究
2020/5/3
第一节 人类基因组计划
2020/5/3
2020/5/3
(8)研究染色体和个体之间的多态性。这些知 识可被广泛用于基因诊断、个体识别、亲子鉴 定、组织配型、发育进化等许多医疗、司法和 人类学的研究。此外,这些遗传信息还有助于 研究人类历史进程、人类在地球上的分布与迁 移以及人类与其他物种之间的比较。
2020/5/3
• 以人类基因组和拟南芥基因组为例说明你对生 物基因组全序测定工作的科学意义与社会意义 的认识(8分) 中国科学院2019年 硕士学位研究生入学分子遗传学试题
5507 英国Nature , Vol.409, p.860
2020/5/3
DNA
测 序 胶 图
2020/5/3
201来自百度文库年4月14日,人类基因组序列图 亦称“完成图”(99.99%),提前绘制成 功。
2020/5/3
三、人类基因组计划的科学意义
(1)确定人类基因组中约5万个编码基因的序列 及其在基因组中的物理位置,研究基因的产物 及其功能。
2020/5/3
• 多态性:人的DNA序列上平均每几百个碱基会出现 一些变异(variation),并按照孟德尔遗传规律 由亲代传给子代,从而在不同个体间表现出不同, 因而被称为多态性(Polymorphism)。
2020/5/3
第一代多态性标记是RFLP(restriction fragment length polymorphism,限制性片段长度多态性)
方法用的最多,技术最成熟。
2020/5/3
(2)基因敲除技术(gene knockout) 又称基因打靶(gene targeting)。这种技
术是通过基因工程的方法将一个结构已知但功能 未知的基因去除,或用其他序列相近的基因取代 (又称基因敲入),然后从整体观察实验动物, 从而推测相应基因的功能。这种人为地把实验动 物某一种有功能的基因完全缺失的技术称为基因 敲除技术。
2020/5/3
Sequence)
完成 总长度 年份 /Mp 2019 12 2019 96 2000 116 2000 115 2000 34 2019 34 2019 2693
已完成总长 的百分数/% 93 99 64 92 75 70 84
占常染色质 百分数/Mb
100
基因数 /Mb
483
100
2020/5/3
第三代多态性标记是单核苷酸的多态性 (single nucleotide polymorphism,SNP) SNP:是由于单个核苷酸改变而导致的核酸序列多态。 第一军医大学2019年分子生物学
2020/5/3
人类99.9%的基因密码是相同的, 而差异不到0.1%,不同人群仅有 140万个核苷酸差异。这些差异是由 “单一核苷酸多样性”(SNP)产 生的,它构成了不同个体的遗传基 础。在整个基因组序列中,人与人 之间的变异仅为万分之一,从而说 明人类不同“种属”之间并没有本 质上的区别。
2020/5/3
二、DNA的鸟枪法测序的主要步骤
• 第一,建立高度随机、插入片段大小为2kb左 右的基因组文库。
• 第二,高效、大规模的末端测序。 • 第三,序列集合。 • 第四,填补缺口。
2020/5/3
Shotgun法序列拼接
2020/5/3
Sequence Gap
三、DNA的鸟枪法测序的优缺点
2020/5/3
SNP与RFLP和STR标记的主要不同之处在于,它 不再以DNA片段的长度变化作为检测手段,而直接 以序列变异作为标记。
2020/5/3
2020/5/3
2、物理图 以已知核苷酸序列的DNA片段(序列标签位点, sequence-tagged site,STS)为“路标”,以碱 基对作为基本测量单位(图距)的基因组图。
2020/5/3
4、序列图(分子水平的物理图) 序列图是指整个人类基因组的核苷酸序列图,也是 最详尽的物理图。1m 既包括可转录序列,也包括非转录序列,是转录序 列、调节序列和功能未知序列的总和。
2020/5/3
2000年6月公共领域测序计划工作框架图
2020/5/3
Contents
• 人类基因组计划 • DNA的鸟枪法序列分析技术 • 比较基因组学及功能基因组研究
2020/5/3
2020/5/3
第二代多态性标记是短的串联重复序列 包括小卫星DNA和微卫星DNA,其多态性主要来自重 复序列拷贝数的变化
2020/5/3
小卫星DNA—由15-65bp的基本单位串联重复而成, 长度一般不超过20kb。 重复次数(小卫星DNA区的长度)在人群中是高度变 异的;按照孟德尔的规律遗传
2020/5/3
第二节 DNA的鸟枪法序列分析技术
一、DNA的鸟枪法测序原理
2020/5/3
2019 年 12 月用“逐个克隆 法”获得第一条 人类染色体 —22 号染色体完成序 列
2020/5/3
2000 年3 月 用“全基因组 鸟枪法”获得 果蝇全基因组 序列。
2020/5/3
2000年6月公共领域测序计划工作框架图
微卫星DNA/简短串联重复(STR、STRP或SSLP) 重复单元2-8bp,通常重复10-60次
CTAGCTTATATATATATATATATATATATAAGCTTGC
2020/5/3
• 真核生物基因组中的DNA重复序列主要有哪些类 型?简要说明基因组重复序列可能的生物学意 义以及基因组重复序列在分子标记研究中的应 用 (12分) 中国科学院2019年 硕士学位研究生入学分子遗传学试题
2020/5/3
(5)发现与DNA复制、重组等有关的序列。DNA的 忠实复制保障了遗传的稳定性,正常的重组提供 了变异与进化的分子基础。局部DNA的推迟复制 、异常重组等现象则导致疾病或者胚胎不能正常 发育,因此,了解与人类DNA正常复制和重组有 关的序列及其变化,将对研究人类基因组的遗传 与进化提供重要的结构上的依据。
2020/5/3
遗传图谱 0.7 cM 或
kb
物理图谱
转录图谱
四、HGP的主要任务
序列图谱
四张图: 物理图、 转录图 遗传图 、序列图
100 kb S2T02S0/5m/3 ap
1、 遗传图(连锁图) 指基因或DNA标记在染色体上的相对位置与遗传距离。 cM(基因或DAN片段在染色体交换过程中分离的频率)
197
97
117
100
221
100
7
97
16
90
12
2019 2654 83
99-93
15
二、功能基因组学研究 1. 概念:利用结构基因组学提供的信息,以高
通量,大规模实验方法及统计与计算机分析为 特征,全面系统地分析全部基因的功能。
2020/5/3
2. 基因功能的研究方法 (1)基因转导技术:导入细胞,观察功能。该
第三节 比较基因组学及功能基因组学研究
一、比较基因组学(Comparative Genomics) 概念:是基于基因组图谱和测序基础上,对已 知的基因和基因组结构进行比较,来了解基因 的功能、表达机理和物种进化的学科。
2020/5/3
基本完成DNA序列分析的真核生物基因组比较
物种
酵母 线虫 果蝇 拟南芥 人类第21染色体 人类第22染色体 人类全基因组 (Public Sequence) 人类全基因组 (Celera
(2)了解转录和剪接调控元件的结构与位置, 从整个基因组结构的宏观水平上理解基因转录 与转录后调节。
2020/5/3
(3)从整体上了解染色体结构,包括各种重复序列 以及非转录“框架序列”的大小和组织,了解各种 不同序列在形成染色体结构、DNA复制、基因转录 及表达调控中的影响与作用。
(4)研究空间结构对基因调节的作用。有些基因的 表达调控序列与被调节基因从直线距离上看,似乎 相距甚远,但若从整个染色体的空间结构上看则恰 恰处于最佳的调节位置,因此,有必要从三维空间 的角度来研究真核基因的表达调控规律。
优点:速度快 缺点: ●随着所测基因组总量增大,所需测序的片段大量 增加 ●高等真核生物(如人类)基因组中有大量重复序 列,导致判断失误
2020/5/3
2020/5/3
2020/5/3
Contents
• 人类基因组计划 • DNA的鸟枪法序列分析技术 • 比较基因组学及功能基因组研究
2020/5/3