第三章 基因与基因组的结构

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最小C值 (Minimum c value)
The total amount of DNA for encoding the genes information is termed its Minimum c value (编码基因信息 的总DNA含量)
26 2019/6/17
C value paradox of nucleotide
16 2019/6/17
三、真核生物基因组
基因组(genome) 核基因组(nucleic genome) 核外基因组(extranucleic genome )
线粒体基因组(mitochondrial genome) 叶粒体基因组(chloroplast genome)
18 2019/6/17
41 2019/6/17
加工基因的形成
DNA
pre-RNA
RNA
cDNA
Insertion
DNA
2019/6/17
processed gene
U3 pseudo gene stagger
42
加工基因的形成
DNA
pre-RNA
RNA
RNA/DNA
insertion
DNA
2019/6/17
processed RNA An
有3 ×104-1.2 ×105个。 说 明:
C值大小与生物进化程度并不完全呈相关关系 基因组中存在许多不编码蛋白质的DNA序列
29 2019/6/17
真核生物基因组DNA的序列
单拷贝序列 非重复序列,在基因组中仅有一个拷贝 大多数结构基因
轻度重复序列 2-10个拷贝,包括rRNA、tRNA和一些结 构基因如组蛋白基因
4 2019/6/17
2、基因组(Genome)
基因组是一种生物染色体内全部遗传物质的 总和,包括构成基因和基因之间区域的所有 DNA。
不同生物基因组大小及复杂性不同。进化程度越 高,基因组越复杂。
5 2019/6/17
基因组大小
6 2019/6/17
二、原核生物基因组
环状或线状的双链DNA分子所含有的全部基因,有 的还包括染色体外的质粒基因组。
由中等大小的串联重复组成,主要分布于染色体末端 区域。
• 微卫星DNA (microsatellite DNA):
由2-6个bp单位组成的串联重复序列,分散于整个核基 因组。如TGTG……TG= (TG)n
33 2019/6/17
非编码顺序
基因和 ( > 90%)
基因相
关顺序 编码顺序
(20-30%) (< 10%)
DNA
(C)
Salmonella 0.0143 pg
E.coli
0.0040
T2
0.00022
λ
0.0000055
ΦΧ174
0.000005
28 2019/6/17
C值矛盾(C-value paradox)
现 象: 哺乳类动物的C值低于某些显花植物和两栖类的C值; 哺乳动物基因组估计有(4-6)×105个基因,实际只
RNA RNA / DNA
cDNA Second nick ligation to RNA
DR
pseudogene
43
跳跃基因(jumping gene) 移动基因(movable gene) 转座子(transposonable elements, TEs) (transposon)
从基因组上的一个位置转移到 同一条染色体或另一条染色体 的另一个位置,引起相应控制 性状的改变。
11 2019/6/17
莲人在绿杨津


玉漱声歌新阕
采莲人在绿杨津, 在绿杨津一阕新; 一阕新歌声漱玉, 歌声漱玉采莲人。
12 2019/6/17
重叠基因(overlapping gene)
共同使用同一DNA序列,但编码两种不同蛋白质的基因。
X174 ( F. Sanger, 1977 )
5386Nt 11 基因,3 mRNA X174含有的5386Nt最多能编码1795个氨基酸,若 每个氨基酸的平均分子量为110,则总的蛋白质分子 量为197kDa,但实际蛋白质却为262kDa。 将全部DNA顺序和蛋白质的氨基酸顺序进行比较, 证实了重叠基因
第三章 基因与基因组的结构 Chapter 3 Structure of gene and
genome
1 2019/6/17
一、基(Gene)是DNA分子上的一段
序列,一个基因包括一个蛋白质或RNA 的全部编码序列和编码区之外对编码区 转录功能所必要的非编码的调控区
显花植物 鸟类 哺乳类 爬行类 两栖类
硬骨鱼类 软骨鱼类 赖皮类 甲壳类 昆虫类 软体动物
蠕虫类 霉菌 藻类 真菌 G+细菌 G-细菌 枝原体
2019/6/17
A 生物体进化程度高低 与大C值不成明显 相关(非线性)
B 亲缘关系相近的生 物大C值相差较大
C 一种生物内大C值与 小c值相差极大 (Euk. 人体 c = C/10) ( Prok. Φx174 c >C )
原核生物的基因结构特点:
基因组较小,编码区和非编码区组成,非编码DNA 比例较少,无内含子; 有操纵子结构, 且为多顺反子; 结构基因多为单拷贝,rRNA基因多拷贝; 有些基因之间可以形成重叠基因;
7 2019/6/17
闭合环状 4288个基因 类核 操纵子结构 基因多为单拷贝 非编码DNA较少
1、核基因组
真核生物单倍体染色体所含的一整套基因。
3.1.1 基因组的特点:
真核生物基因组数目庞大,结构复杂,基因组大部 分位于细胞核中,为双链线状,并与蛋白质结合形成 染色质,而且染色体数目往往不是一条,而是多条;
每条染色体的DNA分子具有多个复制起点,基因 内存在着不表达的插入序列,即内含子。真核基因 多为断裂基因;
20 2019/6/17
基因 (3~5%)
假基因
2019/6/17
基因外区域
外显子 内含子
21
真核生物基因组
2019/6/17
低等真核 生物
高等真核 生物
22
真核生物基因组--exon & intron 23 2019/6/17
真核生物基因组--“城市化” 与“荒漠化”
24 2019/6/17
19 2019/6/17
编码序列仅占基因组DNA的一小部分,绝大多数 为非编码序列;
基因组中存在大量的重复序列。一些短的DNA序 列多次重复,有时重复频率高达106,这些重复序列 在基因组中所占的比例因种属而异,从10%-60% 不等。重复序列在人基因组中约占50%;
转录产物为单顺反子mRNA,即一mRNA只能翻译 成一种蛋白质。
人类基因组
(3×109bp)
中度/高度
基因以 重复顺序
外非编 (20~30%)
码顺序
(70-80%) 单一/低度
重复顺序
(70~80%)
5'前导顺序,3'拖尾顺序
因突变而失去功能
假基因
加工假基因
基因片断(丢失了 5'和 3'端顺序,不能表达的基因)
短分散顺序(SINEs)―如 Alu 顺序
分散的重复顺序
27
真核生物
两栖鲵 肺鱼 蝾螈 警蛙 牛 人 绵羊 果蝇 贝母 豌豆 玉米
DNA
染色体数
(2C) (2N)
168.0 pg( ) 10-12g 24
100 85.3 28.2 6.4 6.4 5.7 0.2 196.7
38
24 无
24 线
60 性 46 关
54
8系 24 ?
28
12
11
20
原核生物
编码RNA,如rRNA,tRNA和snRNA等; 编码蛋白质的基因家族.
位于同一染色体上,串联排列,如rRNA、组蛋白家族; 位于不同染色体上,个成员的DNA并不完全相同, 如珠蛋白
35 2019/6/17
36 2019/6/17
37 2019/6/17
38 2019/6/17
39 2019/6/17
44 2019/6/17
转座子的发现
(McClintock B,Cold Harboring Lab ) 1950年,发现玉米粒的颜色经常发生变化 认为:一种控制基因在玉米基因组中移动的结果
45 2019/6/17
控制基因插入到玉米染色体上编码色素的基因中, 改变基因表达活性,使玉米粒颜色发生变化。
大肠杆菌基因组(4,639,221bp)
8 2019/6/17
类核(nucleoid):
支架 (scafford) 100个 DNA环组成;
每个环长40Kb,13um;
每200bp就有一个负超螺 旋,即含 5%负超螺旋。
9 2019/6/17
类核的结构
10 2019/6/17
操纵子
--Coding gene--
假基因(pseudogene)
核苷酸序列与编码某一蛋白质的基因相似,但 不具功能,不能转录形成成熟mRNA或不能翻译 出功能蛋白质。
重复的假基因
已有基因在结构上发生较大变化而失去功能后形成
加工的假基因
40 2019/6/17
加工的假基因 没有启动子和内含子,在3端有一段延伸的短A-
T碱基对序列,似poly(A)尾巴。
(T. H. Morgan 1926)
结构基因;工具基因
2 2019/6/17
结构基因
编码蛋白质的基因; 可被转录生成mRNA, 进而翻译成蛋白质, 表 现出相应性状。
3 2019/6/17
工具基因
只转录成RNA,不再翻译成蛋白质; 为蛋白质合成提供必要的工具。 如rDNA、tDNA基因
基因的插入位置不断发生变化,沿着染色体移动, 造成玉米粒的颜色成斑驳状。
46 2019/6/17
47 2019/6/17
转座子的结构特征
48 2019/6/17
转座机制:
内切酶识别靶序列, 并产生交错切口;
转座子插入到切口之 间,两端反向重复与 靶序列突出的单链末 端连接;
DNA聚合酶填补单链 区域缺口,DNA连接 酶封闭缺口
13 2019/6/17
X174 ( F. Sanger, 1977 )
14 2019/6/17
基因重叠方式
• Mis-reading for stop codon
400Nt
800Nt
AUG----------------------UGA-----------------------UAA
14Kd
(40%)
长分散顺序(LINEs)
卫星 DNA(长 100~5000kb)
成簇的重复顺序 小卫星 DNA(长 100bp~20kb,VNTRs)
(60%)
微卫星 DNA(4bp,CA 重复)
图 10-37(b)人类基因组的序列
34 2019/6/17
基因家族(Gene family)
真核生物基因组中功能相似、结构具有同源性的 一组基因。
49 2019/6/17
断裂基因(split gene)
Gilbert (1978年)提出内含子、外显子概念
外显子(exon):编码的DNA序列,即被表达的DNA 区段 内含子(intron):不编码的DNA序列
50 2019/6/17
25 2019/6/17
3.1.2 C值矛盾(C-value paradox)
最大C值 (Maximum C value)
The total amount of DNA in the genome of haploid is a characteristic of each living species known as its Maximum C value (单倍体基因组总DNA 的含量)
Cp 97%
38Kd
Ip 3%
UGA, UAG 易被漏读, 错读 UAA 能严格终止
15 2019/6/17
• Alternate different reading frame
---ATG-----//------AATGCC ----//---ATAACG---//--TAA---A
ATGCCN----NNATAA B
30 2019/6/17
中度重复序列
十至数百个拷贝,分散于整个基因组中; 每种序列的重复次数不等,平均长度大约300bp 一般为不编码序列,起基因调控作用
如:真核生物的 Alu family
300bp
300bp
300bp
AG↓CT
6000bp
6000bp
6000bp
6000bp
300,000 copies 广泛分布于非重复序列间
31 2019/6/17
高度重复序列
几百至几百万个拷贝;长度从几个、几十个到几 百万bp 无选择压力,可保留在群体中 可分为3种:简单重复序列、小卫星DNA和微卫 星序列
32 2019/6/17
• 卫星DNA (satellite DNA):
分布于染色体上异染色区域,由长串联重复序列组成。
• 小卫星DNA (minisatellite DNA):
相关文档
最新文档