第三章 基因与基因组的结构
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
质粒(plasmid) 质粒
• 质粒是细菌细胞内携带的染色体外 的共价闭合的环状DNA分子,能独 分子, 的共价闭合的环状 分子 立进行复制。 立进行复制。 • 只有在宿主细胞内才能复制 • 可以赋予宿主细胞特定的遗传性状
质粒的遗传控制
• 复制调控系统:控制质粒的拷贝数。由复 复制调控系统:控制质粒的拷贝数。 制起点、rep基因和 基因构成 制起点、 基因和cop基因构成 基因和 • 分配系统:使质粒在细菌分裂过程中精确 分配系统: 分配到子细胞中 • 细胞分裂控制系统:能抑制细胞分裂,使 细胞分裂控制系统:能抑制细胞分裂, 细胞分裂与质粒复制协调
5’ (CAP)
(AAAA) 3’UTR
5’UTR Translation start site
Note: 5’ CAP, poly A tail and intron only present in eukaryotes UTR = untranslated region.
真核生物DNA DNA序列组织 3.7 真核生物DNA序列组织
注意: “自私 DNA并非毫无功能 自私” 并非毫无功能; 注意:1 “自私”DNA并非毫无功能; 2 真核生物有某些结构基因没有内含子,如 真核生物有某些结构基因没有内含子, 组蛋白基因、干扰素基因等。 组蛋白基因、干扰素基因等。 3 某些原核生物也存在内含子,如E.coli噬菌 某些原核生物也存在内含子, 噬菌 体T4的胸腺嘧啶核苷酸合成酶基因中含有 个核苷酸构成的内含子。 1018个核苷酸构成的内含子。
通过剪接( splicing) 作用除去不必要部 通过剪接 ( ) 内含子)剩下部分 外显子)连接成为成 分 (内含子 剩下部分 外显子 连接成为成 内含子 剩下部分(外显子 熟mRNA
• 外显子在基因中排序与成熟的mRNA排序 是一致的。相同功能的基因的外显子机构 相似,易证明是同源的,有共同的祖先。 它的突变影响较大,不易遗传。 • 内含子在基因中的排序往往很混乱,它的 突变与基因功能没有关系,可以遗传下来。
• 真核生物中DNA可分为: 单拷贝序列 轻度重复序列 中度重复序列 高度重复序列
单拷贝序列:真核基因转录产物为单顺反子, 单拷贝序列:真核基因转录产物为单顺反子,即 一个编码基因转录生成一个mRNA分子,翻译生 分子, 一个编码基因转录生成一个 分子 成一条多肽链。 成一条多肽链。
真核基因组结构庞大, 值矛盾: 真核基因组结构庞大,但C值矛盾: 值矛盾
C值的概念:一个单倍体基因组的DNA含量总是 值的概念:一个单倍体基因组的 值的概念 含量总是 恒定的,它通常称为该物种DNA的C值(C value)。 恒定的,它通常称为该物种 的 值 。
随着生物的进化,生物体的结构与功能越来越复杂, 随着生物的进化,生物体的结构与功能越来越复杂, 需要的基因产物种类也越来越多, 需要的基因产物种类也越来越多,也就是需要的基 因越多, 因越多,因而C值就越大。
“自私”DNA:是指真核生物基因组中大量的非编码序列, 自私”DNA:是指真核生物基因组中大量的非编码序列, 包括分散的高度重复序列、中度重复序列、内含子和间隔 包括分散的高度重复序列、中度重复序列、 序列等。这些序列极少转录成mRNA并翻译成蛋白质, mRNA并翻译成蛋白质 序列等。这些序列极少转录成mRNA并翻译成蛋白质,它们 对细胞的存活、代谢等不作任何贡献, 对细胞的存活、代谢等不作任何贡献,它们存在的唯一目 的似乎就是复制自己,故称之为“自私”DNA。 的似乎就是复制自己,故称之为“自私”DNA。
ф×174噬菌体的基因结构 × 噬菌体的基因结构
3.5.2 真核生物的重叠基因
• 通常情况下真核生物中很少有重叠基因。
• 在特殊情况下,可以在几个外显子之间选 择性剪切以获得不同功能表达物。
利用多个加多聚(A)位点和不同的剪接方式产生不同的蛋白质
3.6 基因组
• 基因组(genome):细胞或生物体中, ):细胞或生物体中 ( ):细胞或生物体中, 一套完整单倍体的遗传物质的总和。 一套完整单倍体的遗传物质的总和。
3.6.1 原核生物的染色体基因组
• 原核生物基因组结构和功能的特点 • 质粒 • 原核生物基因组研究及意义
原核生物基因组的特点
1、通常仅有一条环状双链DNA分子组成,一 通常仅有一条环状双链DNA分子组成, DNA分子组成 般不具核小体结构。 般不具核小体结构。 2、基因组小,DNA含量低。 基因组小, 含量低。 基因组小 DNA含量低 只有一个复制起点。 3、只有一个复制起点。 结构简炼,基因组内多用于编码蛋白质。 4、结构简炼,基因组内多用于编码蛋白质。 重复序列少。 5、重复序列少。 存在转录单元。 6、存在转录单元。 有重叠基因,多顺反子。 7、有重叠基因,多顺反子。
3.2 基因命名简介
• • • • • • 三个小写英文斜体表示基因名字 lac 加上大写斜体字母表示基因座 lac A 正体书写表示蛋白质和表型 lac A 质粒 自然产生 CoeE Ⅰ 人工pUC18 动物 小写字母 sey 人 大写字母 MYC
3.3 真核生物的断裂基因
• 1977年Berget 发现基因是不连续的 • 断裂基因:基因的编码序列在DNA分子上 不连续排列,被不编码序列隔开。 • 外显子 • 内含子
的量远远大于编码蛋白质所需的量。 ③DNA的量远远大于编码蛋白质所需的量。 的量远远大于编码蛋白质所需的量 如哺乳动物的基因组由3× 组成, 如哺乳动物的基因组由 ×109bp组成,假定 组成 哺乳动物每个基因平均是10000bp,那么哺乳动 哺乳动物每个基因平均是 , 物基因组应该有300000个基因。但核酸杂交测 个基因。 物基因组应该有 个基因 定哺乳动物一个细胞中的mRNA种类约为 种类约为10000 定哺乳动物一个细胞中的 种类约为 考虑不同细胞基因表达的不同, 个,考虑不同细胞基因表达的不同,推算哺乳动 物基因组约有30000-40000个基因,这样来看, 个基因, 物基因组约有 - 个基因 这样来看, 基因组DNA量是已知基因的 倍,余下那么多 量是已知基因的10倍 基因组 量是已知基因的 DNA有什么功能? 有什么功能? 有什么功能
比如酵母菌的DNA含量约为 ×107bp,是细菌 含量约为2.3× 含量的5倍左右 比如酵母菌的 含量约为 ,是细菌DNA含量的 倍左右; 含量的 倍左右; 而哺乳动物的基因组DNA约为 ×109bp。 约为3× 而哺乳动物的基因组 约为 。
C值矛盾:在真核生物中,物种进化的复杂程 值矛盾:在真核生物中, 值矛盾 度与DNA含量 值并不完全一致,称之为 值矛盾 含量C值并不完全一致 度与 含量 值并不完全一致,称之为C值矛盾 (C value paradox)。 。 ①一些植物和两栖类动物,它们的DNA含量高达 一些植物和两栖类动物,它们的 含量高达 1010-1011bp,而人类 含量仅为10 ,而人类DNA含量仅为 9bp,显 含量仅为 , 然这是无法解释的。 然这是无法解释的
β-珠蛋来自百度文库的mRNA与基因杂交
β-珠蛋白的pre-mRNA与基因的杂交
鸡卵清蛋白mRNA与基因杂交图 鸡卵清蛋白mRNA与基因杂交图 mRNA
鸡卵清蛋白前体mRNA到成熟mRNA的过程 鸡卵清蛋白前体mRNA到成熟mRNA的过程 mRNA到成熟mRNA
断裂基因转录出包含全部顺序的初始转录 称为前体mRNA。 物,称为前体 。
基因与基因组大小与C 3.4 基因与基因组大小与C值矛盾
• 由于断裂基因的存在,基因远比它编码的 蛋白质信息大。主要取决于内含子的大小。 • 内含子通常比外显子大得多。比如二氢叶 酸还原酶基因
• 进化上断裂基因先在低等的真核生物中出 现。 • 比如酿酒酵母中内含子就较少,而哺乳动 物中内含子较多。 • 高等真核生物中开始出现长基因,多数在510Kb.
在结构、功能很相似的同一类生物中, ② 在结构、功能很相似的同一类生物中,甚至在 亲缘关系十分接近的物种之间, 亲缘关系十分接近的物种之间,其C值可以相差 值可以相差 倍乃至上百倍。 数10倍乃至上百倍。 倍乃至上百倍 如两栖类动物中, 值小的低至 值小的低至10 以下, 值 如两栖类动物中,C值小的低至 9bp以下,C值 以下 大的高达10 大的高达 11bp。
基因的含义
• 狭义:能产生一个特殊蛋白质的DNA序列。
• 广义:一个基因应该是一个转录单位,它 包括转录的启动子及其上游的其他调控区 域、蛋白质编码区域和转录的终止序列等。
基因与DNA DNA分子 3.1.1 基因与DNA分子
• 基因是DNA分子的功能单位,在染色体或 DNA分子上,基因成串排列。
4.含大量重复序列 4.含大量重复序列 5.非编码序列占90%以上 5.非编码序列占90%以上 非编码序列占90% 6.基因是断裂基因 6.基因是断裂基因 7.功能相关的基因构成各种基因家族 7.功能相关的基因构成各种基因家族 8.存在可移动的遗传因素 8.存在可移动的遗传因素
真核生物基因组的结构
• 结构基因 断裂基因 • 顺式调控元件 (cis-acting element) • 基因家族 (gene family) • 重复序列 (repeat sequence) • 转座子 (transposon) • 端粒 (telomere)
Gene Structure
Transcription Transcription start site Translation stop site AUG TAA
第三章 基因与基因组的结构
3.1 基因的概念
• 基因(gene):核酸分子中储存遗传 ):核酸分子中储存遗传 ( ): 信息的遗传单位。 信息的遗传单位。即储存有功能的蛋 白质多肽链或RNA序列信息及表达这 白质多肽链或 序列信息及表达这 些信息所必需的全部核苷酸序列。
基因研究的阶段
• 细胞染色体水平研究 • DNA大分子水平研究 • 重组DNA技术研究
• 基因是遗传的单位,同时也是交换单位和 突变单位。
• 1955年Benzer提出顺反子概念。 • 即:一段能编码一条完整多肽链的核苷酸 片段。 • 现代生物学里面顺反子和狭义的基因概念 通用。
3.1.2 基因与多肽链
• 基因的主要产物是多肽链,其他还包括许 多编码RNA的基因。 • 20世纪中期 “一种基因一种酶” • 20世纪末期 密码子是基因与蛋白质的联系
3.5 重叠基因
• 3.5.1 原核生物的重叠基因 • 重叠基因在表达时利用不同阅读框。 • 重叠基因及基因内基因的现象反映了原核 生物利用有限的遗传资源表达更多生物功 能的能力。
H G A
F C J E D
蛋白D 蛋白
丙
谷
甘
缬
蛋 终止
……GCGGAAGGAGTGATGTAATGTCT…… 蛋白E 蛋白 精 赖 谷 终止 起始 丝 蛋白J 蛋白
质粒的遗传控制
• 位点特异重组系统:控制高拷贝质粒在 位点特异重组系统: 菌体中有形成多聚体, 菌体中有形成多聚体,使其在分裂时拆 开成单体, 开成单体,而向子代细胞平均分配 • 质粒的不相容性:具有相同复制起始位 质粒的不相容性: 点和分配区的两种质粒不能共存与一个 宿主菌
质粒的类型 • 接合型质粒、可移动型质粒和自传 接合型质粒、 递型质粒 • 严谨型质粒(stringent plasmid)、 严谨型质粒( )、 松弛型质粒(relaxed plasmid) 松弛型质粒 • 窄宿主谱及广宿主谱质粒
原核生物基因组研究及意义
• 更好的了解病原微生物的治病机理 • 加快致病微生物致病基因的发现 • 提高临床诊断的效率和准确性 • 筛选有效药物及发展疫苗
3.6.2 真核生物基因组
• 真核生物基因组结构与功能特点
• 真核生物基因组结构
真核生物基因组结构与功能特点
1.体细胞一般为双倍体, 1.体细胞一般为双倍体,即含有两份同源 体细胞一般为双倍体 的基因组 2.基因组大,结构复杂、基因数庞大、具 2.基因组大,结构复杂、基因数庞大、 基因组大 有许多复制起点, 有许多复制起点,每个复制子大小不一 3.转录产物为单顺反子 3.转录产物为单顺反子