基因的结构和功能
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CAAT框(CAAT Box):一段保守序列GGGC/TCAATAC(9bp), 位于转录起始点上游-70~-80bp,转录因子CTF识别位点并与之结合, 激活转录。
GC框(GC Box):碱基序列为GGCGGG,有两个拷贝,位于CAAT Box两侧,与转录因子SP1结合。(SP1有锌指区可以与DNA结合,在 N端有激活转录的作用)GC框有激活转录的功能。
双链DNA/RNA (Double Stranded DNA,dsDNA/RNA) 双链线性DNA/RNA (Double Stranded Linear DNA/RNA) 双链环状DNA/RNA (Single Stranded Circular DNA/RNA)
共价闭合环状DNA (Covalently Closed Circular DNA, cccDNA) 共价闭合环状双链DNA——质粒(Plasmid)
C. 断裂基因具有生物演化意义:
1)不同外显子不同功能域蛋白 2)外显子的不同组合新蛋白 3)同一基因外显子的不同剪接功能有别的蛋白 4)外显子间隔有利于基因重组和演化,防止或减少突变
启动子(Promoter)
转录起始点(5-9bp),常见序列为CAT(原核),第一个转录通常为G/A
启动子 5’-UTR
O
-O
4
32
1
核C 苷T
OH OH
核苷 磷O酸核P 苷O(NMP)
-O
3’
核 苷
A G C
U
了解知识
9
6 51
8
42
73
腺嘌呤A
9
8 7
6 51 42
3
鸟嘌呤G
了解知识
34 5 6
21
胸腺嘧啶T
34 5 6
21
胞嘧啶C
34 5 6
21
尿嘧啶U
了解知识
54
1
3
2
了解知识
基 因 核 酸 链 的 极 性
rRNA基因→rRNA→核仁形成区,核糖体组成。 tRNA基因→tRNA→转运氨基酸。
按重要程度
看家基因(House-keeping Gene) : 维持细胞最低限度
功能所不可少的基因, 如编码组蛋白基因、编码核糖体蛋白 基因、线粒体蛋白基因、糖酵解酶的基因等。这类基因在 所有类型的细胞中都进行表达。
[-30, -25]
转录起点
-10 0
TTGACATATATT
TTGACA(原核)
TATAA(原核) Pribnow box(原核)
[-110, -80]
GC box(真核)
GCCACACCC /GGGCGGG
SP1
-10与-35之间核苷酸变动数应在 [15, 20], 强启动子(原核) : 17±1
3.1 真核生物基因结构(Eukaryotic Gene Structure)
转录起始点
增强子Enhancer
(Optional)
外显子Exons 5’-UTR
终止子
Terminator 加尾信号
PolyA
基因 间隔区
启动子Promoter
5’上游区 侧翼序列/ 调节序列/ 顺式调控元件
内含子Introns
位于螺旋的内侧,糖基平面与碱基 平面相垂直
4. 两条多核苷酸链依照碱基互补配对 的原则形成的氢键相连接:A-T间 形成两个氢键;G-C间形成三个氢 键
3.4nm
3’
5’
了解知识
DNA链结构多样性
A-DNA:右手螺旋,DNA与RNA混合配对时 B-DNA:Watson-Crick模型,右手螺旋,生理条件下最稳定的结构 Z-DNA:左手螺旋 Triple Helix DNA:两股碱基按Watson-Crick方式配对,第三股多聚
上游启动子元件
CTF (-70bp附近的CAAT盒和GC盒及更远)
CCAAT(真核)
[-80, -70]
-35 AATGTGTGGAAT
核Hale Waihona Puke Baidu启动子元件
(起始转录所必需的最小的DNA序列) 转录起始点及其上游-25/-30bp处的TATA盒
Hogness box/TATA box(真核)
TFII
TATAAAAG(真核)
AATTCAAGGGAGAAGTAATGAAGAGGGAAGGAT TTAAGTT CCCTCTTCATTACTTCT CCCTTCCTA
DNA三级结构
DNA双螺旋结构进一步盘曲形成的复杂的超螺旋 结构: 线状DNA形成的纽结; 超螺旋和多重螺旋; 环状DNA形成的结; 超螺旋 连环 ….
线状DNA形成的超螺旋
环状DNA形成的超螺旋
DNA四级结构
约200个碱基对的DNA和包括H1, H2A,H2B,H3,H4 在内的5种组蛋白结合在一起所构成 。
长约140bp的DNA分子绕核心部位1¾圈
核小体
核小体和染色质
核小体构成 染色质丝
RNA链结构多样性
IGC
5’
GCG
3’
mRNA
rRNA
3、真核生物的基因结构及其功能
有两个相同等位基因的基因型,称为纯合子,其对应细胞或个体称为纯合体。
D. 杂合子/体(Heterozygous/Heterozygote) :同一基因座位上,
具有两个不同等位基因的基因型,称为杂合子,其对应细胞或个体称为杂合体。
E. 显性基因(Dominant Genes): 杂合体中,表现为显性性状的基因。 F. 隐性基因(Recessive Genes):杂合体中,表现为隐形性状的基因。
位于结构基因5’端转录起始点上游的大约100-200bp 范围内, 并有若干具有独立功能的DNA序列元件,每个元件约长7- 30bp,序列本身不被转录,是RNA聚合酶特异性识别和结 合的一段DNA序列,能控制基因表达(转录)的起始时间 和转录程度。 注意:启动子包含转录起始点,内部还有精细的序列结构, 其本身不能影响和控制转录起始时间和转录程度,而是通过 与转录因子(Transcription factor) 蛋白质结合互作发生作用。
嘧啶(镜像重复)通过TAT和CGC+配对
A-DNA
B-DNA
Z-DNA
三股螺旋
回文结构
DNA序列中以某一中心区 域为对称轴,其两侧的碱 基对顺序正读和反读都相 同的双螺旋结构。即对称 轴一侧的片段旋转180°后, 与另一侧片段对称重复。
回文结构能形成十字结构 和发夹结构。
镜像重复
存在于同一股上的某些DNA区段的反向重复序列。 此序列各单股中没有互补序列,不能形成十字型或 发夹结构。
基因突变产生的基因。
G. 野生型基因(Wild-type Genes): 在自然群体中占有多数的(视为
正常的)等位基因。
H. 复合基因 (Complex Genes): 在作用上有关的几个基因排列在一起,构成一个基因
复合体或基因簇。
了解知识
1.2. 基因的特点
三大特点:
自我复制(半保留复制):是生物得以繁衍,保证物
了解知识
两类核酸的基本化学组成比较
脱氧核糖核酸(DNA)----核糖核酸(RNA)
了解知识
核苷酸及相应的核苷、碱基名称中英文对照表
DNA/RNA链的形式
单链DNA/RNA (Single Stranded DNA, ssDNA/RNA) 单链线性DNA/RNA (Single Stranded Linear DNA/RNA) 单链环状DNA/RNA (Single Stranded Circular DNA/RNA)
转录起始位点上游大约10/25bp和35/70bp处有两个共有序列 (Consensus Sequence),称为-10和-35序列(分别控制转录起点 和频率)。共有序列只有少数几个核苷酸有差异,能影响RNA聚 合酶与启动子的相互识别。
TATA框(TATA Box):一段高度保守序列(7bp),TATAA/TAA/T,位 于转录起始点上游25~30 bp(-30~50)。TATA框与转录因子TFII结 合,再与RNA 聚合酶II形成复合物,从而准确地识别转录起始位置, 对转录水平有定量效应。
M Snyder, M Gerstein (2003) Science 300: 258-60
了解知识
基因相关遗传术语
A. 基因座(Gene Locus):基因在染色体上的特定位置。 B. 等位基因(Alleles):同源染色体上占据相同座位、具有不同形式的基因。 C. 纯合子/体(Homozygous/Homozygotes) :同一基因座位上,具
必需基因(Essential Gene ): 突变时会引起致死表型的
基因.
按拷贝数
单拷贝基因(多出现在原核和病毒); 多拷贝基因;
按物种
原核基因; 病毒基因; 真核基因
2、基因序列及链特征
了解知识
基因核酸链的化学组成:核苷+磷酸
5’
O
α
P
O
β-D-2-核糖(戊糖)
5
C-H2
O
OH
脱A 碱基 氧 G
双链DNA (Double-stranded Genomic DNA) 5‘-ATGGTTTCCCAATTATTCGAAGAAAAAGCTAAAGCC-3’+ or sense strand(正义链) 3‘TACCAAAGGGTTAATAAGCTTCTTTTTCGATTTCGG-5’- or antisense strand(反义链)
所有含细胞的(单细胞或多细胞)生物的总称,包括动物、植物、 真菌和原生动物。
特点: 均含有细胞核(核遗传)和其他细胞器(核外物质遗传/胞质遗传/ 母系遗传),如线粒体或叶绿体,有细胞骨架 基因编码区不连续 单顺反子(一个基因序列编码一种产物) 基因内部存在大量重复序列 多拷贝基因 基因间大小差异大 表达调控较复杂
种稳定,保持生物的基本特征。
基因决定性状: 能够突变
蛋白/酶
能够突变
致死突变 非致死突变
物种进化 致病突变
新物种 遗传病
http://www.shigen.nig.ac.jp
此外,
不同物种,其基因大小不同。总的来说,低等生物的基
因小,高等生物的基因(通常含大量的内含子或重复序列)大。即使在同一生物内, 不同基因大小不同。
原核生物:基因数目少,结构简单、紧凑,常具有操纵子结构,序列
利用效率高,易突变,大多为多顺反子。
真核生物:基因数目很多,结构复杂,常含重复序列和非编码序列,
机制复杂,相对稳定,大多为单顺反子。
1.3 基因分类
按功能
结构基因---编码蛋白和酶分子结构(蛋白基因); 调控基因(Regulatory Gene)---调节结构基因表达,包含调 节基因、操纵基因和启动基因; 转录而不翻译的基因(RNA基因):
基因的结构和功能
提纲
1、基因的概念和特征 2、基因序列及链特征 3、真核生物的基因结构及其功能 4、原核生物、病毒的基因结构及其功能
1、基因的概念和特征
基因概念的发展
1. 1 基因的定义
基因(Gene Mendelian Factor),也称为 遗传因子,是控制性状的基本遗传单位 (突变单位、重组单位和功能单位),是 指线性排列在染色体上的,携带有一定遗 传信息,具有一定结构,并能进行自我信 息复制与传递,控制 生物个体性状表现的 一段DNA或RNA序列 常常称为“染色体基因”。
开放阅读框ORF
结构基因
3’-UTR 基因 间隔区
3’下游区
侧翼序列/ 调节序列/ 顺式调控元件
断裂基因(Richard J.Roberts &Phillip A.Sharp, 1993)
指基因编码区域的不连续性,是真核基因的结构特 点,即基因的外显子被内含子间隔成不连续、按顺 序镶嵌排列在基因的ORF区域(外显子和内含子交 替出现,每个内含子具有5‘-GT------AG-3’边界序列) .
Open Reading Frame
外显子 内含子 外显子 内含子 外显子
GT
GT
GT
AG
AG
AG
A. 并非所有基因都是断裂基因:如组蛋白基因和干扰素基因等。
在单细胞真核生物中,其多数基因编码区是连续的,非断裂。
B. 断裂基因是基因选择性剪接的结构基础:一个简单基
因编码不同蛋白。人类基因35%的基因存在选择性剪接。
了解知识
右手双螺旋模型要点
5’ 2nm 3’
1. DNA分子由两条反向平行多核苷酸 链围绕同一中心轴构成的双螺旋结 构。双螺旋表面形成大沟和小沟
2. 双螺旋直径2nm,碱基平面垂直于 螺旋纵轴
3. 两条链都由磷酸和脱氧核糖以3’, 5’-磷酸二酯键相连而成,它们位于 螺旋的外侧。嘌呤碱基与嘧啶碱基
了解知识
E.复等位基因(Multiple Alleles): 在群体中,同一基因座上具有三个或三个以上的等
位基因。
F.拟等位基因 (Pseudo Alleles):在功能上密切相关、在位置上又邻接的几个基因。 F. 突变型基因 ( Mutant Genes):同一基因座位,等位基因直接或间接地由野生型
GC框(GC Box):碱基序列为GGCGGG,有两个拷贝,位于CAAT Box两侧,与转录因子SP1结合。(SP1有锌指区可以与DNA结合,在 N端有激活转录的作用)GC框有激活转录的功能。
双链DNA/RNA (Double Stranded DNA,dsDNA/RNA) 双链线性DNA/RNA (Double Stranded Linear DNA/RNA) 双链环状DNA/RNA (Single Stranded Circular DNA/RNA)
共价闭合环状DNA (Covalently Closed Circular DNA, cccDNA) 共价闭合环状双链DNA——质粒(Plasmid)
C. 断裂基因具有生物演化意义:
1)不同外显子不同功能域蛋白 2)外显子的不同组合新蛋白 3)同一基因外显子的不同剪接功能有别的蛋白 4)外显子间隔有利于基因重组和演化,防止或减少突变
启动子(Promoter)
转录起始点(5-9bp),常见序列为CAT(原核),第一个转录通常为G/A
启动子 5’-UTR
O
-O
4
32
1
核C 苷T
OH OH
核苷 磷O酸核P 苷O(NMP)
-O
3’
核 苷
A G C
U
了解知识
9
6 51
8
42
73
腺嘌呤A
9
8 7
6 51 42
3
鸟嘌呤G
了解知识
34 5 6
21
胸腺嘧啶T
34 5 6
21
胞嘧啶C
34 5 6
21
尿嘧啶U
了解知识
54
1
3
2
了解知识
基 因 核 酸 链 的 极 性
rRNA基因→rRNA→核仁形成区,核糖体组成。 tRNA基因→tRNA→转运氨基酸。
按重要程度
看家基因(House-keeping Gene) : 维持细胞最低限度
功能所不可少的基因, 如编码组蛋白基因、编码核糖体蛋白 基因、线粒体蛋白基因、糖酵解酶的基因等。这类基因在 所有类型的细胞中都进行表达。
[-30, -25]
转录起点
-10 0
TTGACATATATT
TTGACA(原核)
TATAA(原核) Pribnow box(原核)
[-110, -80]
GC box(真核)
GCCACACCC /GGGCGGG
SP1
-10与-35之间核苷酸变动数应在 [15, 20], 强启动子(原核) : 17±1
3.1 真核生物基因结构(Eukaryotic Gene Structure)
转录起始点
增强子Enhancer
(Optional)
外显子Exons 5’-UTR
终止子
Terminator 加尾信号
PolyA
基因 间隔区
启动子Promoter
5’上游区 侧翼序列/ 调节序列/ 顺式调控元件
内含子Introns
位于螺旋的内侧,糖基平面与碱基 平面相垂直
4. 两条多核苷酸链依照碱基互补配对 的原则形成的氢键相连接:A-T间 形成两个氢键;G-C间形成三个氢 键
3.4nm
3’
5’
了解知识
DNA链结构多样性
A-DNA:右手螺旋,DNA与RNA混合配对时 B-DNA:Watson-Crick模型,右手螺旋,生理条件下最稳定的结构 Z-DNA:左手螺旋 Triple Helix DNA:两股碱基按Watson-Crick方式配对,第三股多聚
上游启动子元件
CTF (-70bp附近的CAAT盒和GC盒及更远)
CCAAT(真核)
[-80, -70]
-35 AATGTGTGGAAT
核Hale Waihona Puke Baidu启动子元件
(起始转录所必需的最小的DNA序列) 转录起始点及其上游-25/-30bp处的TATA盒
Hogness box/TATA box(真核)
TFII
TATAAAAG(真核)
AATTCAAGGGAGAAGTAATGAAGAGGGAAGGAT TTAAGTT CCCTCTTCATTACTTCT CCCTTCCTA
DNA三级结构
DNA双螺旋结构进一步盘曲形成的复杂的超螺旋 结构: 线状DNA形成的纽结; 超螺旋和多重螺旋; 环状DNA形成的结; 超螺旋 连环 ….
线状DNA形成的超螺旋
环状DNA形成的超螺旋
DNA四级结构
约200个碱基对的DNA和包括H1, H2A,H2B,H3,H4 在内的5种组蛋白结合在一起所构成 。
长约140bp的DNA分子绕核心部位1¾圈
核小体
核小体和染色质
核小体构成 染色质丝
RNA链结构多样性
IGC
5’
GCG
3’
mRNA
rRNA
3、真核生物的基因结构及其功能
有两个相同等位基因的基因型,称为纯合子,其对应细胞或个体称为纯合体。
D. 杂合子/体(Heterozygous/Heterozygote) :同一基因座位上,
具有两个不同等位基因的基因型,称为杂合子,其对应细胞或个体称为杂合体。
E. 显性基因(Dominant Genes): 杂合体中,表现为显性性状的基因。 F. 隐性基因(Recessive Genes):杂合体中,表现为隐形性状的基因。
位于结构基因5’端转录起始点上游的大约100-200bp 范围内, 并有若干具有独立功能的DNA序列元件,每个元件约长7- 30bp,序列本身不被转录,是RNA聚合酶特异性识别和结 合的一段DNA序列,能控制基因表达(转录)的起始时间 和转录程度。 注意:启动子包含转录起始点,内部还有精细的序列结构, 其本身不能影响和控制转录起始时间和转录程度,而是通过 与转录因子(Transcription factor) 蛋白质结合互作发生作用。
嘧啶(镜像重复)通过TAT和CGC+配对
A-DNA
B-DNA
Z-DNA
三股螺旋
回文结构
DNA序列中以某一中心区 域为对称轴,其两侧的碱 基对顺序正读和反读都相 同的双螺旋结构。即对称 轴一侧的片段旋转180°后, 与另一侧片段对称重复。
回文结构能形成十字结构 和发夹结构。
镜像重复
存在于同一股上的某些DNA区段的反向重复序列。 此序列各单股中没有互补序列,不能形成十字型或 发夹结构。
基因突变产生的基因。
G. 野生型基因(Wild-type Genes): 在自然群体中占有多数的(视为
正常的)等位基因。
H. 复合基因 (Complex Genes): 在作用上有关的几个基因排列在一起,构成一个基因
复合体或基因簇。
了解知识
1.2. 基因的特点
三大特点:
自我复制(半保留复制):是生物得以繁衍,保证物
了解知识
两类核酸的基本化学组成比较
脱氧核糖核酸(DNA)----核糖核酸(RNA)
了解知识
核苷酸及相应的核苷、碱基名称中英文对照表
DNA/RNA链的形式
单链DNA/RNA (Single Stranded DNA, ssDNA/RNA) 单链线性DNA/RNA (Single Stranded Linear DNA/RNA) 单链环状DNA/RNA (Single Stranded Circular DNA/RNA)
转录起始位点上游大约10/25bp和35/70bp处有两个共有序列 (Consensus Sequence),称为-10和-35序列(分别控制转录起点 和频率)。共有序列只有少数几个核苷酸有差异,能影响RNA聚 合酶与启动子的相互识别。
TATA框(TATA Box):一段高度保守序列(7bp),TATAA/TAA/T,位 于转录起始点上游25~30 bp(-30~50)。TATA框与转录因子TFII结 合,再与RNA 聚合酶II形成复合物,从而准确地识别转录起始位置, 对转录水平有定量效应。
M Snyder, M Gerstein (2003) Science 300: 258-60
了解知识
基因相关遗传术语
A. 基因座(Gene Locus):基因在染色体上的特定位置。 B. 等位基因(Alleles):同源染色体上占据相同座位、具有不同形式的基因。 C. 纯合子/体(Homozygous/Homozygotes) :同一基因座位上,具
必需基因(Essential Gene ): 突变时会引起致死表型的
基因.
按拷贝数
单拷贝基因(多出现在原核和病毒); 多拷贝基因;
按物种
原核基因; 病毒基因; 真核基因
2、基因序列及链特征
了解知识
基因核酸链的化学组成:核苷+磷酸
5’
O
α
P
O
β-D-2-核糖(戊糖)
5
C-H2
O
OH
脱A 碱基 氧 G
双链DNA (Double-stranded Genomic DNA) 5‘-ATGGTTTCCCAATTATTCGAAGAAAAAGCTAAAGCC-3’+ or sense strand(正义链) 3‘TACCAAAGGGTTAATAAGCTTCTTTTTCGATTTCGG-5’- or antisense strand(反义链)
所有含细胞的(单细胞或多细胞)生物的总称,包括动物、植物、 真菌和原生动物。
特点: 均含有细胞核(核遗传)和其他细胞器(核外物质遗传/胞质遗传/ 母系遗传),如线粒体或叶绿体,有细胞骨架 基因编码区不连续 单顺反子(一个基因序列编码一种产物) 基因内部存在大量重复序列 多拷贝基因 基因间大小差异大 表达调控较复杂
种稳定,保持生物的基本特征。
基因决定性状: 能够突变
蛋白/酶
能够突变
致死突变 非致死突变
物种进化 致病突变
新物种 遗传病
http://www.shigen.nig.ac.jp
此外,
不同物种,其基因大小不同。总的来说,低等生物的基
因小,高等生物的基因(通常含大量的内含子或重复序列)大。即使在同一生物内, 不同基因大小不同。
原核生物:基因数目少,结构简单、紧凑,常具有操纵子结构,序列
利用效率高,易突变,大多为多顺反子。
真核生物:基因数目很多,结构复杂,常含重复序列和非编码序列,
机制复杂,相对稳定,大多为单顺反子。
1.3 基因分类
按功能
结构基因---编码蛋白和酶分子结构(蛋白基因); 调控基因(Regulatory Gene)---调节结构基因表达,包含调 节基因、操纵基因和启动基因; 转录而不翻译的基因(RNA基因):
基因的结构和功能
提纲
1、基因的概念和特征 2、基因序列及链特征 3、真核生物的基因结构及其功能 4、原核生物、病毒的基因结构及其功能
1、基因的概念和特征
基因概念的发展
1. 1 基因的定义
基因(Gene Mendelian Factor),也称为 遗传因子,是控制性状的基本遗传单位 (突变单位、重组单位和功能单位),是 指线性排列在染色体上的,携带有一定遗 传信息,具有一定结构,并能进行自我信 息复制与传递,控制 生物个体性状表现的 一段DNA或RNA序列 常常称为“染色体基因”。
开放阅读框ORF
结构基因
3’-UTR 基因 间隔区
3’下游区
侧翼序列/ 调节序列/ 顺式调控元件
断裂基因(Richard J.Roberts &Phillip A.Sharp, 1993)
指基因编码区域的不连续性,是真核基因的结构特 点,即基因的外显子被内含子间隔成不连续、按顺 序镶嵌排列在基因的ORF区域(外显子和内含子交 替出现,每个内含子具有5‘-GT------AG-3’边界序列) .
Open Reading Frame
外显子 内含子 外显子 内含子 外显子
GT
GT
GT
AG
AG
AG
A. 并非所有基因都是断裂基因:如组蛋白基因和干扰素基因等。
在单细胞真核生物中,其多数基因编码区是连续的,非断裂。
B. 断裂基因是基因选择性剪接的结构基础:一个简单基
因编码不同蛋白。人类基因35%的基因存在选择性剪接。
了解知识
右手双螺旋模型要点
5’ 2nm 3’
1. DNA分子由两条反向平行多核苷酸 链围绕同一中心轴构成的双螺旋结 构。双螺旋表面形成大沟和小沟
2. 双螺旋直径2nm,碱基平面垂直于 螺旋纵轴
3. 两条链都由磷酸和脱氧核糖以3’, 5’-磷酸二酯键相连而成,它们位于 螺旋的外侧。嘌呤碱基与嘧啶碱基
了解知识
E.复等位基因(Multiple Alleles): 在群体中,同一基因座上具有三个或三个以上的等
位基因。
F.拟等位基因 (Pseudo Alleles):在功能上密切相关、在位置上又邻接的几个基因。 F. 突变型基因 ( Mutant Genes):同一基因座位,等位基因直接或间接地由野生型