基因组学第一章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
码序列在 DNA 上
不连续,被一些插 入序列(一般无编
码功能)所隔开。
其中编码序列称为 外显子,插入序列 称为内含子。DNA
转录为 RNA 后,
内含子序列必须切 除。
外显子和内含子的大小
外显子通常都较短;内含子 的长度可以从很短到非常长。
Vertebrates
内含子的插入和缺失 可造成基因的进化
在 DNA 主带上方形成一条 卫星 带,故称为卫星 DNA。
卫星DNA的分布及 其概念的拓展
• 卫星DNA主要位于着丝粒区, 表现为异染色质。 • 现将所有的串联重复序列都 称为卫星 DNA。不形成卫星
带的称为隐蔽卫星 DNA。
• 有一类重复单位仅含 2 ~ 5 个 碱基的串联重复序列称为微
卫星 DNA,是一种很有用的
同相位重叠基因
异相位重叠基因
真核生物基因组
• 除非特别说明,真核生物基因组 一般是指其核基因组。 • 真核生物基因组由多个 DNA 分子 组成,每个皆为双链线形分子。 • 每个 DNA 分子皆与蛋白质结合, 构成染色体,染色体上有着丝粒 结构,可以进行有丝分裂。
中期染色体
人 类 基 因 组 核 型 图
DNA 的变性(Denaturation)
• 概念:指在物理或化学
因素的作用下,DNA中 氢键断裂,双螺旋解离 成两条独立的单链的过 程。 • 诱因:加热、变性剂。
DNA变性的特性
• 增色效应:DNA 变性会 使其光吸收值增加。
DNA 吸收高峰波长为260nm
• 熔解温度(Tm):指一 半双链发生变性时的温 度。
• 大沟宽而深,扇形 > 180º ;小沟窄
而浅,扇形 < 180º 。
DNA 作为遗传物质的优点
• 信息容量大,集成度高 1个基因 1kb 碱基序列种类达41000 = 10602 比较:直径10亿光年的宇宙体积为10108Å3 人类基因组DNA长 2m;细胞平均直径 10m • 碱基互补配对,保证精确复制
的进化
基因家族和基因簇是
通过一系列的重复、易位
和突变事件,从一个远古
祖先基因进化而来的。
原核生物基因组
• 原核生物基因组通常为一个环状DNA 分子(染色体)。
• 细菌DNA并非完全裸露,而是与蛋白质结合,这些蛋
白质类似于真核生物的组蛋白,对于细菌DNA结构的稳定
和细胞生长可能起重要作用。
间断基因的多少与物种进化程度有关
随着物种进
化程度的提高,
不仅间断基因 的比例增加, 而且每个间断 基因所包含的
酵母
果蝇
外显子(或内
含子)数目也 增加。
哺乳动物
间断基因的大小也与 物种进化程度有关
由于随着物种进化程 度的提高,每个间断基因 所含的内含子数目增加, 因而每个间断基因的大小 也增大。
哺乳动物
人类基因组核型模 式图
真核生物基因组的组织结构特征
• 间断基因(Interrupted gene) • 基因家族与基因簇(Gene family & cluster) • 串联重复基因(Tandemly repeated genes)
• 重复序列(Repeated sequence)
间断基因
一个基因的编
• 核糖 2 碳位脱氧,在水溶液中稳定性好
• 以 T 取代 U,没有 C 脱氨变 U 的危险
DNA超螺旋结构
• DNA 双螺旋扭曲时会改变螺旋
数,为使螺旋数保持不变,则
必须形成超螺旋,故超螺旋的 方向总是与初级螺旋的扭曲方
向相反,以抵消初级螺旋扭曲
的作用力 • 正超螺旋:初级螺旋向紧缠方
向扭曲时产生的超螺旋
遗传标记。
卫星DNA的等级结构
• 基因冗余(Gene redundancy) • 基因重叠(Gene overlap)
基因簇
• 指功能相关的一组基因按一定顺序成串排列的现象。典型的基因
簇即操纵子,转录时整个操纵子作为一个单位受调控,转录成一
条 mRNA。 • 例如大肠杆菌的乳糖操纵子由lacZ、lacY和lacA三个与乳糖代谢 有关基因串联排列而成。
(T) 被换成脲嘧啶(U)。
DNA的二级结构
DNA在活细胞中为 双链结构,两个DNA单 链通过碱基配对(遵循
A=T、GC的原则),
靠氢键结合在一起,相
互缠绕,形成反向平行
的双螺旋结构。
DNA双螺旋
• 核糖和磷酸构成双螺旋骨架 , 具亲水性,处于外侧;碱基具 疏水性,处于内侧。
• 螺旋直wk.baidu.com20Å。 • 螺距34Å,含 10 个核苷酸对。
A260 = ( 1 + 1.37 ) / 2 = 1.185
双螺旋中 G C 含量越高则 Tm 越高
相应的消光系数记为 A260
在 50g/ml 的浓度下 双链 A260 = 1.00
单链 A260 = 1.37
DNA 的复性(Renaturation)
• 概念:消除变性因素后,DNA 单链通过碱基配对重新恢复成 双链的过程。 • 若双链为部分变性,则复性可 很快完成。 • 若双链为完全变性,则复性需 很长的时间,且很难完全恢复 到原来结构。分两步进行: 第一步:成核作用 —— 先在富含 G C 区开始复性 第二步:拉拉链作用 —— 从已复 性区段向两侧扩展
随机断裂和再生的动态平衡状态,产生瞬间的局部双
链解开(单链泡状结构)和恢复,形似嘴巴的开合,
故称之为“呼吸作用”。 • 呼吸作用发生的频率与双螺旋中氢键的强弱有关,富 含 A=T 的区段呼吸作用较明显。
基因组大小(C值)与遗传信息量
• 生物进化从低等到高等,从简单到复杂,遗传信息量不断增加, 因而基因组(C 值)也应该相应不断增大。 • 推论:C 值与遗传信息量应该是平行的,二者是成正比的。 • 从大的进化尺度看,这个规律是成立的;从小的进化尺度看, 在进化早期(低等生物进化阶段)也是成立的,但在高等生物 进化阶段显然不成立。
• 负超螺旋:初级螺旋向松缠方 向扭曲时产生的超螺旋
细胞中形成DNA超螺旋的条件
• 在细胞内,DNA 双链分子必须呈闭合
环状,才能形成超螺旋。
• 绝大多数原核生物 DNA 为环形,称 为共价闭合环(CCC分子),可形成 超螺旋。 • 真核生物的线形 DNA 在两个蛋白质 结合点之间亦可形成环形结构,类似 于CCC 分子,故亦可形成超螺旋。 • 超螺旋可使 DNA 链得到压缩。
果蝇 酵母
几种生物肌动蛋白基因内含子数的比较
串联重复基因(基因冗余)
• 概念:一组功能相关的基因串联排列,构成一个重复 单位,并在基因组中以多拷贝存在,与细菌中的相似。 重复单位可进一步串联在一起构成一个大的基因簇。
• 特点:
– 各重复单位间同种基因的序列高度一致或完全相同 – 拷贝数高,通常有几十个到几百个 – 非转录的间隔区短且一致 – 串联重复基因一般都是细胞中大量需要且进化上保守的基因
– 反转录转座元件(Retroelements)
– 转座元件(Transposable elements)
串联重复序列的概 念和发现
• 串联重复序列是指以一段
DNA 序列为重复单位,串 联排列的序列,重复数可
达 105。
• 富含A-T 的串联重复序列 浮力密度小,在基因组
DNA 酶切后超离心时,会
DNA超螺旋与基
因表达
生物体内一般维持 5%左 右的负超螺旋,这部分 DNA 双螺旋较松缠,有利于 DNA 转录和复制。
超螺旋的形成原因
• • • • 体内 DNA 超螺旋的产生依赖于 DNA 拓扑异构酶。 拓扑异构酶 I:每次作用于单链,无需 ATP,可解除负超螺旋。 拓扑异构酶 II:每次作用于双链,需要 ATP,可解除正超螺旋(又称解旋 酶),并产生负超螺旋(又称旋转酶)。 拓扑异构酶 I 和拓扑异构酶 II 相互竞争,调节细胞内 DNA 的超螺旋状态。
通常几种 tRNA 基因组成一个重复单位
重复序列
• 串联重复序列(Tandemly repeated DNA) – 卫星DNA(Satellite DNA) – 小卫星DNA(Mini-satellite DNA) – 微卫星DNA(Micro-satellite DNA) • 散布重复序列(Interspersed genome-wide repeats)
基因冗余
• 原核生物中,一般蛋白质基因都是单拷贝的,但细菌 中 rRNA 基因(rDNA)是多拷贝的。例如: 大肠杆菌 7 个拷贝
枯草杆菌
10 个拷贝
3 种 rRNA 基因组成一个操纵子,顺序为: 16S rDNA – 23S rDNA – 5S rDNA • 基因多拷贝,超过了实际需要,称为基因冗余,但有 备无患。
DNA 复性的特性
• DNA 片段越长,序列 • DNA序列复杂性:指最
越复杂,则复性速度越
慢。 • DNA 片段越短,序列 越简单,则复性速度越 快。
长的没有重复序列的核
苷酸对数,记为 x。
例如: 序列 (AT)n 的 x = 2 序列 (ATGC)n 的 x = 4
• 复性速度:高度重复 >
中度重复 > 低度重复 > 单拷贝
C值悖理(C value paradox)
• 进化程度低的生物 C 值反而更高。 • 亲缘关系相近的物种
间 C 值差异很大。
• C 值远远超过了遗传 信息量的需要。 • 结论:C 值并不反映 遗传复杂性的高低。
C值悖理暗示基因组中存在大量的无用序列
基因家族和基因簇
例一:组蛋白基因
• 重复单位 = H1 + H2A + H2B + H3 + H4 + 间隔区 • 各组蛋白基因都没有内含子,不同生物的重复单位内组蛋 白基因的排列方式不同,重复拷贝数也不同: 鸡 10 果蝇 100 哺乳动物 20 海胆 300 ~ 600 非洲爪蟾 40
例二: rRNA 基因(rDNA)
• 重复单位(主体 rRNA)= 18S + 5.8S + 28S + 间隔区 • rDNA 基因簇区域称为核仁组织者,其中含有大量的
rRNA,在光学显微镜下呈特殊的区域。高等生物中主体
rRNA 基因拷贝数一般为 200 ~ 500。
例三:tRNA 基因(tDNA)
• tRNA 基因种类很多,也呈重复排列形式存在。 • 爪蟾单倍体基因组: 有 56 种 tRNA 约 8000 份 tRNA 基因 平均每种 tRNA 约有 140 份基因
• 原核生物基因组很小,因而其组织结构十分经济有效,
很少含有无用的多余序列。
大肠杆菌基因组示意图
• 一个典型的细菌染色体
长度约为数百万碱基对。
• 数千个不同的基因分散 在整条染色体上。 • 还可能分布着一些短的 重复序列
• 染色体上有一个复制原
点。
原核生物基因组的组织结构特征
• 基因簇(Gene cluster)
基因重叠
最初在噬菌体 x174 中发现。现在已知,基因重叠 现象不仅在病毒中有,而且在细菌、细胞器乃至高等真 核生物中也有。主要有 4 种情况:
– 重叠操纵子:前后两个操纵子部分重叠 – 同相位重叠基因:两基因阅读框重叠
– 异相位重叠基因:两基因序列重叠,但阅读框不同
– 反向重叠基因:两基因序列重叠,但位于不同链上
一个含105 个核苷酸对的非重
复DNA分子的 x = 105
DNA复性曲线
在一种生物(特别是
真核生物)的基因组中,
同时包含高度重复、中度 重复、低度重复和单拷贝 的序列,因而其复性曲线 是个混合曲线。根据曲线 的形状,可以推断基因组 中各种序列的比例。
人类基因组DNA复性曲线
DNA 的呼吸作用
• 在生理条件下,DNA 双螺旋中配对碱基间的氢键处于
什么是基因组?
• 基因组是一种生物所拥有的整套遗传物质,它包含该 生物的全部遗传信息。 • 绝大多数生物都以脱氧核糖核酸(DNA)为遗传物质, 仅一些病毒以核糖核酸(RNA)为遗传物质。 • 朊病毒是一种蛋白质(Prion蛋白),但它是否称得上 是一种生物,尚无定论。
DNA和RNA的一级结构
• DNA和RNA是由核苷酸 亚基连接成的不分支长 链大分子。 • 核苷酸亚基由一个核糖、 一个磷酸根和一个碱基 (嘌啉、嘧啶)组成。 • 核苷酸通过 3 与 5 位的 磷酸二酯键连接成高聚 物——多聚核苷酸。
DNA和RNA的核苷酸
• DNA的核苷酸含2-脱氧核糖及腺嘌啉(A)、胞嘧啶(C)、鸟 嘌啉(G)、胸腺嘧啶(T) 4种碱基。 • RNA的核苷酸含核糖及与DNA相似的4种碱基,但其中胸腺嘧啶