基因与基因组的结构与功能讲课文档
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
DNA 与成熟RNA间的非对应区域 氨基酸的非编码区(uncoding region) 间隔区(spacer)
内含子存在意义:保证或增强基因的稳定表达;内含子中包含有其他 基因的编码序列(即基因内基因)。
GT-AG法则:真核生物基因内含子高度保守的一致序列:内含子5`端大 多数以GT开始,3`端大多数以AG结束,称为GT-AG法则。此法则 可用作真核基因中RNA剪接的识别信号。
基因与基因组的结构与功能
第一页,共75页。
3.1. 基因概念的变迁
3.2. 基因概念的多样性
3.3. 基因组
第二页,共75页。
3.1 基因概念的变迁
Theory of the gene (192实体
• 基因象链珠(bead)一样,孤立地呈 线状地排列在染色体上
OriC
0
4000K
大肠杆菌 1000K
C-Value: 4.6×106bp
3000K
2000K
TerC
大肠杆菌染色体DNA
第三十八页,共75页。
2. 结构基因大多组成操纵子
po z
y
at
promoter operator structural gene terminator
ß-galactosidase半乳糖苷酶 z ß-galactoside permease透酶 y
的结构基因的表达, 如:启动基因,操纵基因不转录 、不翻译
不是所有的基因都能为蛋白质编码
第七页,共75页。
✓ 基因命名无严格统一标准
1. 一般:三个小写英文斜体字母表示,lac、leu
2. 三个小写英文斜体字母后面加一个斜体大写字母表示
基因座, LacZ、 LacY、 LacA
3. 质粒:自然质粒,三个正体字母,第一个字母大写;重 组质粒,两个大写字母前加一个p,大写字母表示构建 该质粒的研究者或单位,如pSC101(SC代表Stanley Cohen)。
类似细菌的:如玉米中发现的. 类似逆转录病毒的: 转位机制需RNA介导
第四十二页,共75页。
真核生物基因的结构
1、 断裂基因(split gene)
1978 Gilbert 真核生物基因的新概念 Exon (外显子)
is any segment of an interrupted gene that is
细菌染色体DNA 质粒DNA
第三十五页,共75页。
类核(nucleoid):细菌染色体在 细胞内形成的一个致密区域
nucleoid
质粒plasmid
大肠杆菌细胞结构
第三十六页,共75页。
大肠杆菌染色体结构
蛋白质 核心
超螺旋 DNA环
第三十七页,共75页。
1.由一条环状双链DNA分子组成,通常只 有一个DNA复制起点。
ß-galactoside transacetylase
半乳糖苷乙酰转移酶 a
乳糖操纵子 lac operon
第三十九页,共75页。
3、基因密度非常高,编码区所占比例大; 4. 基因组DNA具有多种调控区域
5、结构基因没有内含子,多为单拷贝, rRNA 基因为多拷贝;
6、存在可移动DNA序列
第四十页,共75页。
11节段dsRNA
轮状病毒
每段编码 一个蛋白 质
第二十一页,共75页。
4.逆转录病毒(retrovirus)
Cap 核心蛋白 逆转录酶
膜蛋白
poly(A)
人类免疫缺陷病毒(HIV)
第二十二页,共75页。
单股正链RNA,有三个基本的结构 基因:gag、pol(逆转录酶)、env, 5′端有甲基化帽,3′端有poly(A), 另有多个基因表达调控位点。
1.单股正链RNA病
毒
病毒RNA聚合
酶
包膜蛋白 膜蛋白
刺突 核衣壳 蛋白 蛋白
SARS冠状病毒 SARS coronavirus
第十七页,共75页。
单股正链RNA、不分节段, 5′端有甲基化帽, 3′端有poly(A)结构。 具有感染性,直接翻译蛋白质
脊髓灰质炎病毒 冠状病毒
第十八页,共75页。
的DNA序列。
第六页,共75页。
★蛋白质基因:transcriptable and translatable gene;
★RNA基因:transcriptable but nontranslatable gene
;tDNA, rDNA 。
★调控基因: untranscriptable nontranslatable gene,调控邻近
第四十四页,共75页。
第四十五页,共75页。
DNA X cDNA
Electro-microscope
7 introns
8 exons
第四十六页,共75页。
真核生物基因又称为
Split gene Interrupted gene
间隔基因,断裂基因
真核生物基因的转录物又称为
Precursor mRNA (pre-mRNA) Heterogeneous nuclear RNA (HnRNA)
4. 果蝇:对突变的表型用1~4个斜体字母代表,如white
(w)、tailless(tll)。
第八页,共75页。
5. 酵母:一般用三个大写斜体字母表示基因的功能,后面
的数字表示不同的基因座,如GAL4,CDC28,也有例外 。 6. 线虫:三个小写斜体字母表示突变型,连字符加数 字表示基因座,如unc-86,ced-9。 7. 植物:大多数情况用1~3个小写字母表示。
2 、取决于所包含的内含子的数目
• 不同生物的外显子数目随着进化增加,基因平均长度也在增加。
第十页,共75页。
3.3 基因组Genome P30
第十一页,共75页。
➢基因组:一个细胞或病毒的全部遗传信息 ;
一套完整的单倍体的遗传物质 的总和;
含有一种生物的一整套遗 传信息的遗传物质;
……
第十二页,共75页。
前体mRNA, 核内不均一 RNA
第四十七页,共75页。
第四十八页,共75页。
8. 脊椎动物:1~4个小写字母和数字表示,如sey,
myc。
9. 人类:与脊椎动物类似,但需要大写,如MYC、
ENO1。
第九页,共75页。
3.2 基因的大小
1、取决于它所包含的内含子的长度
• 例如:31Kb的二氢叶酸还原酶基因含6个外显子,mRNA长度为2Kb,内含子长29Kb ,内含子比外显子大很多。
DNA 或RNA 单链或双链 合环状分子或线性分子
3.基因组有连续的,有不连续的 大多数连续
流感病毒:8条单链RNA
4、编码序列>90%(基因组),多为单拷贝,即每个基因只出现一 次
5、功能上相关的基因排列在一起
6、有重叠基因
第三十四页,共75页。
原核生物基因组
以大肠杆菌(Escherichia coli)为例
静思伊久阻归期, 久阻归期忆别离; 忆别离时闻漏转,
时闻漏转静思伊。
秦少游给苏小妹
第二十八页,共75页。
3.单链环状DNA病 毒
5387nt
噬菌体φX174
第二十九页,共75页。
重叠基因
5387 nt 编码 2500 AA
1977,Sanger
4. 开环部分双链DNA病毒
HBsAg
HBcAg
聚合酶
乙型肝炎病毒(HBV)
第三十页,共75页。
第三十一页,共75页。
第三十二页,共75页。
病毒繁殖的原则
在宿主体内合成了mRNA就意为着胜利。
能用宿主的绝对不用自己的。 实在用不了宿主的就用自己的。
也有例外。
第三十三页,共75页。
病毒基因组的特点
1.基因组大小相差很大: 2.核酸结构多样性:
HBV:3.2kb 痘病毒:300 kb
2.单股负链RNA病毒
血凝素(HA)
8节段-ssRNA
神经氨酸酶(N)
禽. 流感病毒(H5N1)
avian influenza A virus
第十九页,共75页。
单股负链RNA、8节段,均编码蛋白质,
流感病毒 腮腺炎病毒 狂犬病毒
第二十页,共75页。
3.双链RNA病毒
外衣壳 蛋白
内衣 壳蛋 白
生物进化的C值矛盾 (C value paradox)
最大C值 Maximum C value
The total amount of DNA in the genome of haploid is a characteristic of each living species known as its Maximum C value
ITR: 反向末端重复序列
ITR在病毒复制过程有重要作用
腺病毒 adenovirus
第二十五页,共75页。
ITR
90
E4
2.双链环状DNA病毒
SV40病毒基因组
第二十六页,共75页。
重叠基因 (overlapping gene)
Vp1 Vp2
Vp3
SV40
5000bp
T t
第二十七页,共75页。
C-value:单倍体基因组总DNA的含量(bp)
显花植物
鸟类
哺乳类 爬行类 两栖类
骨鱼类
软骨鱼类
棘皮类
甲壳类
昆虫类
软体动物 蠕虫类 霉菌
藻类 真菌
革兰氏阳性菌 革兰氏阴性菌
枝原体
106
107 108
109 1010 1011
第十四页,共75页。
A 生物体进化程度
高低,与大C值不成 明显正相关
B 亲缘关系相近的 生物大C值相差较大
特点
真核生物基因组 **
1、 体细胞: 两套基因组
性细胞: 一套基因组
2、基因组结构复杂,数目庞大, 多个复制起始点
3、mRNA为单顺反子.
4、含大量重复序列.非编码序列占90%以上. 5、转录和翻译存在时空差异
第四十一页,共75页。
6、基因间有间隔区(spacer DNA),基因为断裂基因(split gene) 即内含子,外显子. 7、功能相关的基因串联在一起形成基因家族 8、存在可移动成分.
对经典的基因概念的 第一次重要修正与发展
第四页,共75页。
顺反子假说(Theory of cistron)
• Cistron 是基因的同义词
• 在一个顺反子内,有若干个突变单位 突变子(muton) • 在一个顺反子内,有若干个交换单位 交换子(recon)
• 传统的概念:基因是一个具有特定功能的,完整的不可分割的最 小的遗传单位,基因内可以低频率发生重组,交换
C 一种生物内大C
值与小c值相差极大 人体 c = C/10
Frog的大C值为人的 7倍
lily(百合)的大C值为
人的100倍!
病毒基因组
基本结构
DNA病毒 多数为双链(ds)、环状或线性
RNA病毒 多数为单链(ss)、线性
第十五页,共75页。
RNA病毒基因组
类型
• 特点 • 代表种类
第十六页,共75页。
• 基因是;
经典的基因概念
功能(functional unit)
突变(mutation unit)
交换(cross-over unit)
“三位一体”的 (Three in one)
第三页,共75页。
最小的 不可分割的
基本的
遗传单位
顺反子理论
Theory of cistron
(S.Benzer 1955)
represented in the mature RNA product
DNA 与成熟RNA间的对应区域 氨基酸的编码区(amino acid coding region) 非间隔区(unspacer)
第四十三页,共75页。
Intron (内含子) is a segment of DNA that is transcribed, but removed from within the transcript by splicing together the sequences (exons) on either side of it.
(单倍体基因组总DNA 的含量)
最小C值 Minimum c value
The total amount of DNA for encoding the genes
information is termed its Minimum c value (编码基因信息的总 DNA含量)
第十三页,共75页。
• mut1 X mut2
W.t 是基因内发生交换的结果
cistron 概念的提出是对经典的基因概念的动摇
第五页,共75页。
现代基因的定 义
基因(gene)是核酸分子
中具有遗传效应的核苷酸 序列,是遗传的基本单位
和突变单位以及控制性状 的功能单位,包括结构基 基因和调控基因。
结构基因
指编码蛋白质或RNA
白血病病毒、肉瘤病毒、 人类免疫缺陷病毒
第二十三页,共75页。
DNA病毒基因组
类型 • 特点 • 代表种类
第二十四页,共75页。
1.线性双链DNA病毒
E1A E1B
L1 L2 L3
L4 E3 L5
ITR
0 10 20 30 40 50 60 70 80 100%
E2B
E2A
早期蛋白(E) 晚期蛋白(L)
内含子存在意义:保证或增强基因的稳定表达;内含子中包含有其他 基因的编码序列(即基因内基因)。
GT-AG法则:真核生物基因内含子高度保守的一致序列:内含子5`端大 多数以GT开始,3`端大多数以AG结束,称为GT-AG法则。此法则 可用作真核基因中RNA剪接的识别信号。
基因与基因组的结构与功能
第一页,共75页。
3.1. 基因概念的变迁
3.2. 基因概念的多样性
3.3. 基因组
第二页,共75页。
3.1 基因概念的变迁
Theory of the gene (192实体
• 基因象链珠(bead)一样,孤立地呈 线状地排列在染色体上
OriC
0
4000K
大肠杆菌 1000K
C-Value: 4.6×106bp
3000K
2000K
TerC
大肠杆菌染色体DNA
第三十八页,共75页。
2. 结构基因大多组成操纵子
po z
y
at
promoter operator structural gene terminator
ß-galactosidase半乳糖苷酶 z ß-galactoside permease透酶 y
的结构基因的表达, 如:启动基因,操纵基因不转录 、不翻译
不是所有的基因都能为蛋白质编码
第七页,共75页。
✓ 基因命名无严格统一标准
1. 一般:三个小写英文斜体字母表示,lac、leu
2. 三个小写英文斜体字母后面加一个斜体大写字母表示
基因座, LacZ、 LacY、 LacA
3. 质粒:自然质粒,三个正体字母,第一个字母大写;重 组质粒,两个大写字母前加一个p,大写字母表示构建 该质粒的研究者或单位,如pSC101(SC代表Stanley Cohen)。
类似细菌的:如玉米中发现的. 类似逆转录病毒的: 转位机制需RNA介导
第四十二页,共75页。
真核生物基因的结构
1、 断裂基因(split gene)
1978 Gilbert 真核生物基因的新概念 Exon (外显子)
is any segment of an interrupted gene that is
细菌染色体DNA 质粒DNA
第三十五页,共75页。
类核(nucleoid):细菌染色体在 细胞内形成的一个致密区域
nucleoid
质粒plasmid
大肠杆菌细胞结构
第三十六页,共75页。
大肠杆菌染色体结构
蛋白质 核心
超螺旋 DNA环
第三十七页,共75页。
1.由一条环状双链DNA分子组成,通常只 有一个DNA复制起点。
ß-galactoside transacetylase
半乳糖苷乙酰转移酶 a
乳糖操纵子 lac operon
第三十九页,共75页。
3、基因密度非常高,编码区所占比例大; 4. 基因组DNA具有多种调控区域
5、结构基因没有内含子,多为单拷贝, rRNA 基因为多拷贝;
6、存在可移动DNA序列
第四十页,共75页。
11节段dsRNA
轮状病毒
每段编码 一个蛋白 质
第二十一页,共75页。
4.逆转录病毒(retrovirus)
Cap 核心蛋白 逆转录酶
膜蛋白
poly(A)
人类免疫缺陷病毒(HIV)
第二十二页,共75页。
单股正链RNA,有三个基本的结构 基因:gag、pol(逆转录酶)、env, 5′端有甲基化帽,3′端有poly(A), 另有多个基因表达调控位点。
1.单股正链RNA病
毒
病毒RNA聚合
酶
包膜蛋白 膜蛋白
刺突 核衣壳 蛋白 蛋白
SARS冠状病毒 SARS coronavirus
第十七页,共75页。
单股正链RNA、不分节段, 5′端有甲基化帽, 3′端有poly(A)结构。 具有感染性,直接翻译蛋白质
脊髓灰质炎病毒 冠状病毒
第十八页,共75页。
的DNA序列。
第六页,共75页。
★蛋白质基因:transcriptable and translatable gene;
★RNA基因:transcriptable but nontranslatable gene
;tDNA, rDNA 。
★调控基因: untranscriptable nontranslatable gene,调控邻近
第四十四页,共75页。
第四十五页,共75页。
DNA X cDNA
Electro-microscope
7 introns
8 exons
第四十六页,共75页。
真核生物基因又称为
Split gene Interrupted gene
间隔基因,断裂基因
真核生物基因的转录物又称为
Precursor mRNA (pre-mRNA) Heterogeneous nuclear RNA (HnRNA)
4. 果蝇:对突变的表型用1~4个斜体字母代表,如white
(w)、tailless(tll)。
第八页,共75页。
5. 酵母:一般用三个大写斜体字母表示基因的功能,后面
的数字表示不同的基因座,如GAL4,CDC28,也有例外 。 6. 线虫:三个小写斜体字母表示突变型,连字符加数 字表示基因座,如unc-86,ced-9。 7. 植物:大多数情况用1~3个小写字母表示。
2 、取决于所包含的内含子的数目
• 不同生物的外显子数目随着进化增加,基因平均长度也在增加。
第十页,共75页。
3.3 基因组Genome P30
第十一页,共75页。
➢基因组:一个细胞或病毒的全部遗传信息 ;
一套完整的单倍体的遗传物质 的总和;
含有一种生物的一整套遗 传信息的遗传物质;
……
第十二页,共75页。
前体mRNA, 核内不均一 RNA
第四十七页,共75页。
第四十八页,共75页。
8. 脊椎动物:1~4个小写字母和数字表示,如sey,
myc。
9. 人类:与脊椎动物类似,但需要大写,如MYC、
ENO1。
第九页,共75页。
3.2 基因的大小
1、取决于它所包含的内含子的长度
• 例如:31Kb的二氢叶酸还原酶基因含6个外显子,mRNA长度为2Kb,内含子长29Kb ,内含子比外显子大很多。
DNA 或RNA 单链或双链 合环状分子或线性分子
3.基因组有连续的,有不连续的 大多数连续
流感病毒:8条单链RNA
4、编码序列>90%(基因组),多为单拷贝,即每个基因只出现一 次
5、功能上相关的基因排列在一起
6、有重叠基因
第三十四页,共75页。
原核生物基因组
以大肠杆菌(Escherichia coli)为例
静思伊久阻归期, 久阻归期忆别离; 忆别离时闻漏转,
时闻漏转静思伊。
秦少游给苏小妹
第二十八页,共75页。
3.单链环状DNA病 毒
5387nt
噬菌体φX174
第二十九页,共75页。
重叠基因
5387 nt 编码 2500 AA
1977,Sanger
4. 开环部分双链DNA病毒
HBsAg
HBcAg
聚合酶
乙型肝炎病毒(HBV)
第三十页,共75页。
第三十一页,共75页。
第三十二页,共75页。
病毒繁殖的原则
在宿主体内合成了mRNA就意为着胜利。
能用宿主的绝对不用自己的。 实在用不了宿主的就用自己的。
也有例外。
第三十三页,共75页。
病毒基因组的特点
1.基因组大小相差很大: 2.核酸结构多样性:
HBV:3.2kb 痘病毒:300 kb
2.单股负链RNA病毒
血凝素(HA)
8节段-ssRNA
神经氨酸酶(N)
禽. 流感病毒(H5N1)
avian influenza A virus
第十九页,共75页。
单股负链RNA、8节段,均编码蛋白质,
流感病毒 腮腺炎病毒 狂犬病毒
第二十页,共75页。
3.双链RNA病毒
外衣壳 蛋白
内衣 壳蛋 白
生物进化的C值矛盾 (C value paradox)
最大C值 Maximum C value
The total amount of DNA in the genome of haploid is a characteristic of each living species known as its Maximum C value
ITR: 反向末端重复序列
ITR在病毒复制过程有重要作用
腺病毒 adenovirus
第二十五页,共75页。
ITR
90
E4
2.双链环状DNA病毒
SV40病毒基因组
第二十六页,共75页。
重叠基因 (overlapping gene)
Vp1 Vp2
Vp3
SV40
5000bp
T t
第二十七页,共75页。
C-value:单倍体基因组总DNA的含量(bp)
显花植物
鸟类
哺乳类 爬行类 两栖类
骨鱼类
软骨鱼类
棘皮类
甲壳类
昆虫类
软体动物 蠕虫类 霉菌
藻类 真菌
革兰氏阳性菌 革兰氏阴性菌
枝原体
106
107 108
109 1010 1011
第十四页,共75页。
A 生物体进化程度
高低,与大C值不成 明显正相关
B 亲缘关系相近的 生物大C值相差较大
特点
真核生物基因组 **
1、 体细胞: 两套基因组
性细胞: 一套基因组
2、基因组结构复杂,数目庞大, 多个复制起始点
3、mRNA为单顺反子.
4、含大量重复序列.非编码序列占90%以上. 5、转录和翻译存在时空差异
第四十一页,共75页。
6、基因间有间隔区(spacer DNA),基因为断裂基因(split gene) 即内含子,外显子. 7、功能相关的基因串联在一起形成基因家族 8、存在可移动成分.
对经典的基因概念的 第一次重要修正与发展
第四页,共75页。
顺反子假说(Theory of cistron)
• Cistron 是基因的同义词
• 在一个顺反子内,有若干个突变单位 突变子(muton) • 在一个顺反子内,有若干个交换单位 交换子(recon)
• 传统的概念:基因是一个具有特定功能的,完整的不可分割的最 小的遗传单位,基因内可以低频率发生重组,交换
C 一种生物内大C
值与小c值相差极大 人体 c = C/10
Frog的大C值为人的 7倍
lily(百合)的大C值为
人的100倍!
病毒基因组
基本结构
DNA病毒 多数为双链(ds)、环状或线性
RNA病毒 多数为单链(ss)、线性
第十五页,共75页。
RNA病毒基因组
类型
• 特点 • 代表种类
第十六页,共75页。
• 基因是;
经典的基因概念
功能(functional unit)
突变(mutation unit)
交换(cross-over unit)
“三位一体”的 (Three in one)
第三页,共75页。
最小的 不可分割的
基本的
遗传单位
顺反子理论
Theory of cistron
(S.Benzer 1955)
represented in the mature RNA product
DNA 与成熟RNA间的对应区域 氨基酸的编码区(amino acid coding region) 非间隔区(unspacer)
第四十三页,共75页。
Intron (内含子) is a segment of DNA that is transcribed, but removed from within the transcript by splicing together the sequences (exons) on either side of it.
(单倍体基因组总DNA 的含量)
最小C值 Minimum c value
The total amount of DNA for encoding the genes
information is termed its Minimum c value (编码基因信息的总 DNA含量)
第十三页,共75页。
• mut1 X mut2
W.t 是基因内发生交换的结果
cistron 概念的提出是对经典的基因概念的动摇
第五页,共75页。
现代基因的定 义
基因(gene)是核酸分子
中具有遗传效应的核苷酸 序列,是遗传的基本单位
和突变单位以及控制性状 的功能单位,包括结构基 基因和调控基因。
结构基因
指编码蛋白质或RNA
白血病病毒、肉瘤病毒、 人类免疫缺陷病毒
第二十三页,共75页。
DNA病毒基因组
类型 • 特点 • 代表种类
第二十四页,共75页。
1.线性双链DNA病毒
E1A E1B
L1 L2 L3
L4 E3 L5
ITR
0 10 20 30 40 50 60 70 80 100%
E2B
E2A
早期蛋白(E) 晚期蛋白(L)