基因组与基因组学
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人体细胞的核型(Spectral Karyotype)
18
一些模式生物的基因组大小
基因组大小/bp T4噬菌体 2.0×10 5 大肠杆菌(Escherichia coli ) 4.2×10 6 酵母(Sccharomyces cerevisiae) 1.5×10 7 拟南芥(Arabidopsis thaliana ) 1.0×10 8 秀丽小杆线虫(Caenorhbditis elagans) 1.0×10 8 果蝇(Drosophila melanogaster) 1.65×10 8 水稻(Oryza sativa ) 3.89×10 8 小白鼠(Mus musculus ) 3.0×10 9 人类(Homo sapiens) 3.3×10 9 玉米(Zea mays ) 5.4×10 9 普通小麦(Triticum aestivum) 1.6×10 10
其DNA是与蛋白质结合,不形成染色体结构, 只是习惯上将之称为染色体。细菌染色体DNA在胞 内形成一个致密区域,即类核(nucleoid),类 核无核膜将之与胞浆分开。
2.功能相关的几个结构基因往往串联排列在一起 组成操纵子结构,受上游共同的调控区控制。 3.原核生物基因组中基因密度非常高,结构基因是 连续的多为单一拷贝。
3、编码序列只占基因组总DNA量的5%以下,非
编码区占95%以上,大量为重复序列。
49
重复序列
1.高度重复序列:重复频率 >105,通常这些序列的 长度为6-200bp,如卫星DNA; 2.中度重复序列:重复频率 101-105,重复单位平均 长度约300bp占基因总量的35%。(rRNA gene, tRNA gene, 组蛋白gene );
52
二、基因组学概念及范畴
基因组学(genomics)
发展和应用DNA制图、测序新技术以及计算机 程序,分析生命体(包括人类)全部基因组结构及 功能。以整个基因组为研究对象,而不是以单个 基因为单位作为研究对象。
53
基因组学(Genomics)
简单地定义为研究基因组结构和功能的科学。 具体:指以分子生物学技术、计算机技术和信
Genomes and Genomics
生物化学与分子生物学系 陈瑜
第一章 绪论
2
基因及基因组学的发展历史
1860至1870年奥地利 科学家 Gregor Mendel根据豌豆杂交 实验提出遗传因子概 念,并总结出孟德尔 遗传定律。
3
一、遗传因子
孟德尔提出: –生物的遗传性状是通过“遗传因子” (hereditary factor)进行传递的; –遗传因子是一些独立的遗传单位。
32
4.结构基因无重叠现象,基因组中任何一段DNA不会 用于编码2种蛋白质。
5.在原核生物基因组中含有编码同工酶的基因。
6.在不同原核生物基因组中GC含量变化很大。
7.原核生物基因组的非编码区内主要是调控序列。
8.细菌基因组中的可移动成分能产生转座现象。
9.除细菌染色体外,还有能自主复制的双链环状DNA 分子,称为质粒。
6
摩尔根在《基因论》中绘制了果蝇基因位置 图,首次完成了当时最新的基因概念的描述:
–基因是在染色体上呈线性排列的遗传单位,它不 仅是决定性状的功能单位,也是一个突变单位和 交换单位。
至此,人们对基因概念的理解更加具体和丰 富了。
7
Thoman Hunt Morgan ( 1866~1945) 因发现染色体的遗传机制,创立染色体遗传理论而于 1933年获诺贝尔生理学医学奖
个有机体的C值 和其编码能力缺 乏相关性。 如: --爪蟾的基因组大 小和人类相似; --两栖类最小基因组 和最大的基因组之 间相差约100倍; --C值矛盾在进化中 的原因和机制尚不 清楚。
22
病毒基因组
1.结构简单,基因组小,所含基因少。
2.基因组可由DNA组成,也可由RNA组成,但不能 共存于同一病毒。 DNA病毒:多数为双链(ds)、环状或线性; RNA病毒:多数为单链(ss)、线性;
4、基因组中有大量低度(重复频率<103 )、中 度(重复频率<105)和高度重复序列。 5、基因是不连续的(断裂基因),由外显子和 内含子镶嵌排列而成。基因转录的初级产物需 经一定的加工,切除内含子使外显子拼接,才
能形成成熟的mRNA。
6、非编码区(占90%以上)远大于编码区。
42
真核生物基因组结构与功能特点
37
真核生物基因组
染色体DNA 线粒体DNA
38
真核生物和原核生物基因表达的对比
39
真核生物基因组结构与功能特点
1、真核生物基因组的化学本质为DNA,多与蛋白质 结合形成染色质,基本结构单位为核小体。每一
种真核生物都有一定的染色体数目,除配子为单
倍体外,体细胞一般为双倍体,即含两份同源基
因组,而原核生物的基因组则是单拷贝的。
43
人类基因组和基因组学
基因组(genome)
生殖细胞含1套基因组 1套来自父本生殖细胞 体细胞含2套基因组 1套来自母本生殖细胞
44
人类染色体基因组
1
2
3
4
5
6
7
8
9
10 11 12
13 14 15 16 17 18 19 20 21 22 X
Y
45
完整的人类基因组包含:
1-22号常染色体 核基因组
3.单拷贝基因:单拷贝序列(unique sequence)亦 称非重复序列(nonrepetitive sequence)在一个 基因组中只有一个拷贝或2-3个拷贝。多数编码蛋白 质的基因。
50
51
人类基因组中的DNA多态性
每个人之间基因组并不完全相同,称基因组的 多态性,表现在DNA的序列上。统计表明,任意两 个人之间的DNA核苷酸差异约占基因组的0.01%, 就是这基因组中0.01%的差异,决定了人类的遗 传多样性,如有人易生病,而有人却对疾病的免疫 能力特别高;有些药物,有人用了就灵验,有人就 不灵验。 从不同个体DNA序列差异上阐明人类基因组的 多态性,才能真正了解与疾病特别是多基因疾病有 关的遗传机制,同时深入准确地了解人类起源、进 化和迁徙过程中的DNA序列变化。
7、功能相关的基因构成各种 基因家族 ,它们可串联在 一起,亦可相距很远,但即使串联在一起的成簇的基 因也是分别转录的。
8、基因组中也存在一些可移动的遗传因素,这些DNA顺
序并无明显生物学功能,似乎为自己的目的而组织, 故有自私DNA之称,其移动多被RNA介导(如在哺乳动 物及人类基因组中发现的逆转座子),也有被DNA介导 的(如在果蝇及谷类中发现的DNA转座子)。
逆转录病毒(单链RNA病毒)
RNA
人类免疫缺陷病毒(HIV) (human Immunodeficiency virus )
30
原核生物基因组
以大肠杆菌(Escherichia coli)为例
细菌染色体DNA 质粒DNA
31
原核生物基因组结构与功能的特点
1.基因组通常仅由一条环状双链DNA分子组成。
40
真核生物基因组结构与功能特点
2、基因组远大于原核生物,结构复杂,基因数庞 大,具有许多复制起始点,每个复制子大小不一。
3、基因不存在操纵子结构,功能相关基因分散在
不同的染色体上。基因都由一个结构基因与相关
的调控区组成,转录产物为单顺反子,即一分子
mRNA只能翻译成一种蛋白质。
41
真核生物基因组结构与功能特点
孟德尔把可观察的性状和控制它的内在 的遗传因子区分开来。 遗传因子作为基因的雏形名词诞生了。
4
二、基因
1909年,丹麦遗传学家约翰逊在 《精密遗传学原理》一书中根据
希腊语“给予生命”之义,创造
“基因”(gene)一词来代替孟 德尔假定的“遗传因子”。从此 基因便成为遗传因子的代名词一 直沿用至今。
33
34
类核(nucleoid):细菌染色体在 细胞内形成的一个致密区域
nucleoid
质粒plasmid
大肠杆菌细胞结构
35
大肠杆菌染色体DNA
由一条环状双链DNA分子组成, 通常只有一个DNA复制起点。
36
质粒DNA
质粒是存在于细菌染色体外的,具有自主复制
能力的环状双链DNA分子;大小为几kb。
11
12
Francis Harry Compton Crick ( 1916~) 1953年,DNA双螺旋结构模型被提出来了,两位创立者是美
国生物化学家沃森(James Dewey Watson,1928~)和英国 生物物理学家克里克(Francis Harry Compton Crick, 1916~2004)。获1962年的诺贝尔生理学医学奖。
8
2、基因的化学本质是什么?
– 基因的化学本质是核酸而不是蛋白质
3、基因的结构是什么?
– 1953年沃森和克里克提出著名的DNA双螺旋
分子结构模型。
9
Avery实验:
DNA是转化要素的
活性组分,确定
基因由DNA组成
10
赫尔歇 (Hershey A.) 等用同位素32P 和35S验证DNA是 遗传物质。
Wilhelm Ludwig Johannsen (1857~1927)
5
三、基因结构与功能的探索
1、基因在哪里?
– 在孟德尔的成果获得承认后,
生物界都知道是遗传因子
(即基因)决定了生物的性 状。但是,基因究竟在细胞 内的什么地方?摩尔根以果 蝇为试验对象回答了这一问
题,基因在染色体上。
Thomas Hunt Morgan (1866~1945)
物学的主要目标已经从传统的单个基因的研究转
向对生物整个基因组结构与功能的研究。生命科
学正从全新的视觉角度研究与探讨生长与发育、
遗传与变异、结构与功能以及健康与疾病等生物
学与医学基本问题的分子机理,并形成了一门新
的学科分支--
基因组学。
15
第二节
基因组学
(Genomics)
16
一、基因组概念
基因组(genome)
X和Y染色体
线粒体基因组
46
人类线粒体基因组
2个rRNA基因和22个tRNA基因,13个编码 蛋白质基因,编码序列占93%。
48
人类基因组结构特点
1、前述的真核基因组的结构特点基本上都适
用于人类基因组。
2、基因组DNA有30亿个碱基对(3×109bp),约
有2.8万个基因,目前已定位的有2000个。
13
James Dewey Watson ( 1928~)
• 1986年美国约翰· 霍普金斯(Johns Hopkins)大学著名人类遗传学家和内科教 授麦克库塞克(McKusick)造出了“基因
组学”(Genomics)这个名词,意指从
基因组水平研究遗传的学科。
14
在人类基因组计划(HGP)的影响下,分子生
19
物种
基因组的大小(C值)
20
什么是C值?
--通常是指一种生物单倍体基因组DNA的总量. 在真核生物中,C值一般随着生物的进化而 增加,高等生物C值一般大于低等生物。
C值悖理(Cvalue paradox):
对原核生物和低等真核生物而言,单倍体 基因组DNA的量和形态复杂性相关。
21
C值矛盾:指一
息网络技术为研究手段,以生物体内全部基因 为研究对象,在全基因背景下和整体水平上探
索生命活动的内在规律及其内外环境影响机制
的科学。
包括对所有基因进行基因组作图(包括遗
传图谱、物理图谱、转录图谱),核苷酸序列分 析,基因定位和基因功能分析。
54
基因组学(genomics)
26
开环部分双链DNA病毒
HBsAg
HBcAg
聚合酶
乙型肝炎病毒(HBV)
27
HBsAg
聚合酶
HBcAg
乙型肝炎病毒基因组 --开环部分双链DNA
28
单链RNA病毒
血凝素(HA) 8节段-ssRNA
.
神经氨酸酶(N)
29
禽流感病毒(H5N1)
avian influenza A virus
thomashuntmorgan186619457摩尔根在基因论中绘制了果蝇基因位置图首次完成了当时最新的基因概念最新的基因概念的描述基因是在染色体上呈线性排列的遗传单位它不基因是在染色体上呈线性排列的遗传单位它不仅是决定性状的功能单位也是一个突变单位和仅是决定性状的功能单位也是一个突变单位和交换单位
23
3.相关基因丛集。
DNA序列中功能相关的RNA和蛋白质基因,
丛集在基因组的一个或几个特定部位,形成一
个功能单位或转录单位,可被一起转录成为多 顺反子mRNA。 4.常见重叠基因现象。 5.非编码区少,重复顺序少。
24
蛋白D
蛋白E
25
单链环状DNA病毒
噬菌体phiX174
1977,Sanger
泛指一个有生命体、病毒或细胞器的全部 遗传物质;在真核生物,基因组是指一套染色
体(单倍体)DNA。即物种全部遗传信息的总和。
物种遗传信息的“总词典”
控制发育的“总程序”
生物进化历史的“总档案”
17
―基因组(genome)‖一词是1920年Winkles从 GENes和chromosOMEs组成的。