第一章基因与基因组(1)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A
B
C
非编码区
D
编码区 A、B、C、D
1963年Nass等首次发现线粒体中存在DNA。 1981年Anderson等发表了完整的人线粒体DNA序列。
1972年Fiers等测定了噬菌体MS2衣壳蛋白的基因序列。 某些RNA病毒则以RNA作为遗传信息的载体。
(二)基因的分类
按部位分 核基因 核外基因
rRNA基因是多拷贝的。
6.编码序列一般不会重叠
原核生物基因组中只有少数基因存在基因重叠。
7.编码区在基因组中所占的比例远远大于真核 基因组而小于病毒基因组
编码区占50%,非编码区主要是一些调控序列。
8.细菌基因组中存在可移动的DNA序列
包括插入序列和转座子。
二、真核生物基因组
真核生物DNA 染色体DNA 线粒体DNA
•
1866年,孟德尔在《植物的杂交试验》文中提出: “生物体的某一特定性状是受一个遗传因子(genetic factor)所控制的,也就是一个因子决定一个性状”。 基因是1909年,由Johannsen创造的一个名词, 取代遗传因子。
•
1926年,Morgan在《基因论》中提出:“基因既 是携带生物体遗传信息的结构单位,又是控制一个 特定性状的功能单位”。
偿其基因的缺陷,从而达到治疗的目的。 方式 体细胞基因治疗 (somatic cell gene therapy)
生殖细胞基因治疗 (germ line gene therapy)
第二节
基因组
基因组的定义:
基因组(genome):一个细胞或生物体 中的全部DNA。
细菌和噬菌体 ——指单个染色体所含的全 部DNA。 二倍体真核生物——指维持生物体正常功能最基本 的一套染色体及所携带的全部遗传信息。
Start of genetic message Cap End
Tail
5
3
5’-端非翻译区
开放阅读框架
3’-端非翻译区
密码子(codon)
在mRNA的开放阅读框架区,以每3个相邻的核苷酸 为一组,代表一种氨基酸(或其他信息),这种三联体形式
的核苷酸序列称为密码子。
起始密码子(initiation codon): AUG
由末端单链DNA序列和蛋白质构成。
7.真核生物基因组中也存在一些可移动的遗传因子
果蝇中发现的DNA转座子
8.真核生物基因组还包括细胞器基因组
线粒体基因组、叶绿体基因组
• 端粒(telomere) * 结构特点:
(膨大成颗粒状)
指真核生物染色体线性DNA分子末端的结构。 • 由末端单链DNA序列和蛋白质构成。
(二)基因功能概述
基因携带遗传信息。 遗传信息的表达过程是一个基因所携 带的信息转变为一种具有正常功能产物 (蛋白质、多肽、RNA)的过程。
1. 遗传信息的储备
64个密码 有意义密 码子61个
2. 基因的复制
半保留复制(概念) 双向复制(复制子) 复制的半不连续性
3. 基因的表达 ⑴ 转录: ⑵ 翻译: DNA RNA
4.真核生物基因组内非编码的序列远远多于编码区
90%以上
5.真核生物基因组中含有大量重复序列和基因家族
在真核细胞DNA中发现某些核苷酸序列大量重复
出现,这些核苷酸序列叫重复序列,但在原核细胞 基因组中几乎不存在。核苷酸序列的重复次数越高, DNA复性速度就越快。占35%。
6.真核基因组DNA的末端都有一种称为端粒的特殊结构
﹡
终止密码子(termination codon) : UAA、UAG、UGA
﹡
(RNA.Pr,生物性状) 遗传信息蕴藏于DNA链上4种碱基的不同组合中。
断裂基因(splite gene):
(1977年)
真核生物结构基因,由若干个编码区和非 编码区互相间隔开但又连续镶嵌而成,去除非 编码区再连接后,可翻译出由连续氨基酸组成 的完整蛋白质,这些基因称为断裂基因。
mRNA指导蛋白质多肽链的生成
⑶基因表达的调控:
RNA的种类、分布、功能
细胞核和胞液 线粒体 mt rRNA mt tRNA 功 能
核蛋白体RNA 信使RNA 转运RNA 核内不均一RNA 核内小RNA 核仁小RNA 胞浆小RNA
rRNA mRNA tRNA HnRNA SnRNA SnoRNA scRNA/7SL-RNA
基因组要大上千倍。
2.结构基因与调控序列以操纵子的形式组织在一起
当基因开放时,这几个基因转录在一条mRNA链上,然 后翻译成几条功能相关的蛋白质多肽链,故称之为多顺 反子(polycistron)。
3.基因组中重复序列很少 4.结构基因多为单拷贝 5.基因是连续的
细菌的结构基因中没有内含子(intron)成分,即 基因序列是连续的。
染色体DNA八大特点
(一)真核生物基因组特点
1.真核生物基因组DNA都是双链线状且往往不是一条
配子为单倍体,体细胞一般含两份同源的基因组。
2.大多数真核生物的结构基因组为断裂基因,并 受一系列顺式作用元件的调控 3.结构基因的转录产物为单顺反子
与原核生物不同,真核基因转录产物为单顺反子, 即一个编码基因转录生成一个mRNA分子,翻译生成一 条多肽链。
小分子RNA基因
还有一类不称为基因的DNA序列,它们是不转录的 DNA区段,但对基因起调控作用,如启动子和增强子等。
二、基因的结构与功能
(一)基因的结构
原核生物:
调控区 多个功能相关的结构基因串联在一起构成一 个转录单位,依赖同一调控序列对其进行转 录调节,使这些相关基因实现协调表达。 信息区
5 PPP
源自文库3 5
﹡AATAAA
GTGTGTG
RNA-pol
转录终止的修饰点
2)反式作用因子(trans-acting factor) 由某一基因表达产生的蛋白质因子,通 过与另一基因的特异的顺式作用元件相 互作用,调节其表达。这种调节作用称 为反式作用。 还有蛋白质因子可特异识别、结合自身 基因的调节序列 , 调节自身基因的表达, 称顺式作用。
(对应三种RNA聚合酶)
① Ⅰ类启动子:富含GC碱基对,主要启动rRNA基因的转录。
②Ⅱ类启动子:通常由TATA盒、几个上游启动子元件和转 录起始点组成。主要启动蛋白质和一些小RNA基因的转录。
③ Ⅲ类启动子:主要启动tRNA基因、5SRNA基因和 U6snRNA基因等RNA基因的转录。
② 增强子(enhancer)
③ 沉默子(silencer) 某些基因的负性调节元件,当其结合特异 蛋白因子时,对基因转录起阻遏作用。 有时,同一DNA元件可以既有增强子活 性又有沉默子活性,这取决于与之结合的蛋 白质性质.
④ 终止子 —— 和转录后修饰密切相关。
AAAAAAA· · · · · · 3
mRNA
5’加帽 3加尾 核酸酶 5 3
核蛋白体组分 转运氨基酸 成熟mRNA的前体
mt mRNA 蛋白质合成模板
参与hnRNA的剪接、转运 rRNA的加工、修饰 蛋白质内质网定位合成 的信号识别体的组分
蛋白质生物合成(翻译)反应过程:
氨基酸的活化 肽链的生物合成
起 始 延 长 终 止
肽链形成后的加工和靶向输送
组蛋白乙酰化
DNA水平
一、原核生物基因组
特点
1.基因组通常仅由一条环状双链DNA分子组成 总长为4.2×106个bp,完全伸展开,其长度约 136mm,为菌体长度的1000倍。不形成染色体结 构,只有一个复制起点。
大肠杆菌约有3500个基因,已经定位1000多个,
有些基因的DNA序列也已测定。
一般的原核生物基因组都在106水平上,比病毒
启动子图示:
-25bp
内 含 子
结构基因
修饰点
切离加尾
AATAAA 最简单 启动子
翻译起始点 转录起始点 TATA盒(II)
外显子 转录终止点
增强子 OCT-1 GC盒(I)
TFⅡD(转录起始的准确性及频率)
启动子的 核心序列
CAAT盒
OCT-1:ATTTGCAT八聚体
上游启动子元件
真核生物主要有三类启动子:
第一篇
药学分子生物学基础
生物化学与分子生物学教研室 张尤新
第一章 基因与基因组
第一节
基 因
一、基因的概念及分类
(一)基因的概念
是储存特定遗传信息的DNA片段。 调节区
其他功能序列
转录区
﹡
转录区 调节区
编码区 ( RNA 、蛋白质) 非编码区
其结构为
是RNA序列和蛋白质多肽链顺序相关遗传信息的基本 形式,以及表达这些信息所需要的全部核苷酸序列。
指远离转录起始点、决定基因的时间、空间特异
性、增强启动子转录活性的DNA序列。
-25bp
结构基因
AATAAA
翻译起始点 转录起始点 增强子 TATA盒 OCT-1 GC盒 CAAT盒
特点
内 含 子
外显子 转录终止点
增强效应明显,与方向、距离无关 大多为重复序列,组织和细胞特异性 没有基因特异性,受外部信号的调控 活性与其在DNA双螺旋结构中 的空间方向性有关.
• 1944年,Avery通过实验证实
基因的化学本质是DNA。
1953年 Watson和Crick发现DNA的双螺旋结构。
显示了DNA的空间结构,揭示了DNA分子具有自我复制功能。
1958年 Crick证明了生物遗传的中心法则。
转 录
复 制
翻 译
DNA
RNA
蛋白质
1961年 Crick又提出了遗传密码(66年)
A
B
C
非编码区
D
编码区 A、B、C、D
1.外显子(exon)和内含子(intron) • 外显子(编码区) 在断裂基因及其初级转录产物上出现,并 表达为成熟RNA的核酸序列。 •内含子(非编码区) 隔断基因的线性表达而在剪接过程中被除 去的核酸序列。 外显子--内含子接头(边界序列): 5 GT......AG 3
调控在各个水平上
基因激活
DNA去甲基化 对核酸酶敏感
转录水平
翻译水平
﹡ 转录起始
转录后加工
蛋白质翻译 mRNA 翻译后加工修饰
(三)基因突变与疾病
1.单基因病 2.线粒体遗传病 3.多基因病 4. 基因诊断与治疗
(1)基因诊断:
基因诊断(genetic diagnosis)是利用分 子生物学及分子遗传的技术和原理,在
调控序列
3
蛋白质
这样一个多顺反子转录单位与其调控序列即构成操纵子。
﹡
原核基因的协调表达就是通过调控同一启动基因的活性来实现的。
真核生物:
断裂基因(splite gene):* 真核生物结构基因,由若干个编码区和非 编码区互相间隔开但又连续镶嵌而成,去除非 编码区再连接后,可翻译出由连续氨基酸组成 的完整蛋白质,这些基因称为断裂基因。
DNA 水平分析、鉴定遗传疾病所涉及基
因的置换、缺失或插入等突变。又称 DNA诊断 。
基本过程: 分离、扩增待测的DNA片断 区分或鉴定DNA的异常 基因探针 组织和分化阶段表达特异性的基 因及异常进行检测和诊断
(2)基因治疗
定义 基因治疗(gene therapy)是向有功能缺 陷的细胞补充相应功能的基因,以纠正或补
3 5
第一个外显子的 第一个碱基为+1
下游 3
编码序列
转录开始
5
0不用于标记碱基位置
1)真核生物的顺式作用元件: ① 启动子
② 增强子
③ 沉默子 ④ 终止子
① 启动子
(启动子具有方向性,启动子本身通常不被转录。)
真核基因启动子是 RNA 聚合酶结合位
点周围的一组转录控制组件,至少包括一
个转录起始点以及一个以上的功能组件。 功能组件 TATA盒 GC盒 CAAT盒
编码组蛋白的基因是一例外,无内含子。
编码rRNA和个别tRNA的结构基因也都含有内含子。
2. 调控序列 (启动子、增强子、终止子) 顺式作用元件
(DNA序列)
顺式调节(同一个DNA分子中)
-25bp
内 含 结构基因 子
修饰点
切离加尾
AATAAA
翻译起始点 转录起始点 增强子 TATA盒(II) OCT-1 GC盒(I) CAAT盒
启动子的 核心序列
外显子 转录终止点
OCT-1:ATTTGCAT八聚体
上游启动子元件
DNA
a
A
反式调节
B
mRNA 蛋白质A C
A
反式作用因子
c
DNA mRNA
顺式调节
C 顺式作用蛋白 蛋白质C
RNA聚合酶保护区 结构基因
5 3 5 3 调控序列
上游
-50 -40 -30 -20 -10 1 10 σ
按功能和性质分
1. 编码蛋白质的基因 2. 编码RNA的基因
1.编码蛋白质的基因
⑴结构基因
(在双链DNA中转录出RNA的区段)
﹡ 转录方向
模板链 编码链
5
编码链 模板链
3 5
3
转录方向
⑵调节基因
可转录成mRNA,翻译成阻遏蛋白或激活蛋白, 从而调控其他基因的活性
2. 编码RNA的基因
rRNA基因 tRNA基因 核酶基因 (酶的功能) (调节基因表达)