基因和基因组的演变和发展

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
珠蛋白和免疫球蛋白基因,属于不同时态表 达的复杂多基因家族。
ζ
ψζ ψα ψα α 2 α 1 θ
ε
Gγ Aγ
ψβ
δβ
图 10-30 人 类 血 红 蛋 白 的 α 和β 基 因 簇
珠蛋白基因家族
血红蛋白分子是珠蛋白的四聚体,由2个α型 亚基和2个β型亚基组成,即α2 β2。 α家族包括1个活性的ξ基因、1个ψξ假基因、2 个α基因和2个ψα假基因,集中在28kbp的区 域内。
第一节 基因的概念、演变与发展
分离规律 自由组合规律 基因在染色体上 等位基因 连锁与互换 一个基因一个酶 顺反子假说
第二节 基因概念的多样性 ——重叠基因
(Overlapping genes)
原核生物的重叠基因 (Overlapping genes)
概念: 指一个基因的序列中,含有另一基因的 部分或全部序列。基因重叠现象是英国 分子生物学家Sanger 1977年在测定噬菌 体ΦX174的DNA序列是发现的。
β家族包括ε、2个γ、δ和β基因,以及1个ψβ1 假基因,分布在50kbp的区域内。
ζ
ψζ ψα ψα α 2 α 1 θ
ε
Gγ Aγ
ψβ
δβ
图 10-30 人 类 血 红 蛋 白 的 α 和β 基 因 簇
人类发育阶段中血红蛋白组成的变化
组蛋白基因家族
组蛋白有H1、H2A、H2B、H3、H4共5种基因。 这5种基因串联在一起形成一个重复单元。
5种基因的排列顺序、转录方向和基因间隔区因 生物种类不同而不同。
H1
H4
H2B
H3
H2A
组蛋白基因家族
各种生物的组蛋白基因家族的重复单元
海胆(R)
H1 H4 H2B H3 H2A
海胆(S)
海胆(L)
二、分类
1、简单多基因家族 2、复杂多基因家族 3、发育调控的复杂多基因家族
1、简单多基因家族
家族中只有一个或数个基因以串联方式 重复排列,如rRNA基因。
NTS
NTS
rDNA gene family
TS 18s
TS 5.8s TS 28s
T图S:1TN0可.ST2转:S9可:录非不转的洲转间录爪录隔蟾的的(sr间pR间aN隔cA隔e基序r序)因顺列列的序串联重复排列 NTS:不可转录的间隔顺序
内容
第一节 基因的概念、演变与发展 第二节 基因概念的多样性——重叠基因 第三节 基因概念的多样性——重复基因 第四节 基因概念的多样性——间隔基因 第五节 基因概念的多样性——跳跃基因 第六节 基因家族 第七节 基因组与C值矛盾 第八节 原核生物基因组 第九节 真核生物基因组 第十节 人类基因组计划
不存在内含子的基因 少数真核生物并不存在内含子,如编码 干扰素、组蛋白的基因和大多数酿酒酵 母的基因。
第五节 基因概念的多样性 ——跳跃基因
第六节 基因家族
一、概念 二、分类
一、概念
真核生物基因组中有许多来源相同、结 构相似、功能相关的一系列基因,成串 地排列在一起。这样一组基因称为基因 家族(gene family)。
内含子1
内含子2
α-珠蛋白基因
β-珠蛋白基因
不连续基因的数目和大小
2、不同来源的内含子的分子大小相差悬殊 SV40基因内含子长31bp 人的营养不良蛋白基因内含子长210kbp。
不连续基因的数目和大小
3、内含子的长度一般比外显子长 卵清蛋白基因总长7700bp,而mRNA只有 1859bp,内含子总长为5841bp。 二氢叶酸还原酶(DHFR)基因总长31kb, 而mRNA只有2kb,而内含子长为29kb。
1、概念 一个基因组含有大于105个拷贝,分布于着 丝点, 端粒区, 结构基因两侧。
2、含量 占总DNA的10%-60%,高等真核生物中占 20%,由6-10bp组成。
3、种类 卫星DNA、小卫星DNA、微卫星DNA
卫星DNA(satellite DNA)
DNA的浮力密度决定于它的G﹢C含量,G﹢C含 量越高,浮力密度越大。 ρ = 1.660 + 0.00098(G + C)% g/cm3 在高度重复序列中,常有一些AT含量很高的简 单 重 复 序 列 , AT 含 量 有 时 高 达 97% ( 如 螃 蟹 DNA中的卫星DNA)。 在CsCl密度梯度离心时,易与其它DNA分开,形 成两个以上的峰,即含量较多的主峰和高度重复 序列的小峰。 小峰在主峰旁似卫星,称为卫星DNA。
mRNA
变性杂交
AB
C
S1核酸酶
2 1
不连续基因的数目和大小
1、数目
有些只有一个或少数几个内含子,有的含有 较多的内含子。
珠蛋白:2个;
酵母线粒体cytb:6个
卵类粘蛋白:6个; 卵清蛋白:7个
卵类运铁蛋白:16个;伴清蛋白:17个
α-胶原蛋白:52个; 组蛋白:0个
珠蛋白基因家族中内含子的位置和保守性
3、含量 占总DNA的10%-40% 小鼠:20%;果蝇:15%
中度重复序列
4、类型 i、短周期分散的重复序列:长100-300bp,
如人、爪蟾、海胆的Alu序列。
ii、长周期分散的重复序列:长5000bp, 如Kpn I家族。
Alu家族重复序列
1、含量
Alu家族序列占人基因组DNA总量的5%-6%
Ori
stop1
97%
mRNA1
stop2
DNA
3%
CP
mRNA1
IP
5387 bp 11 genes 3 mRNA 9 peptides
重叠基因有以下几种情况:
一个基因完全在另一个基因里面。 如基因B在基因A里面,基因E在基因D里面。
部分重叠,如K和C、A和C。 两个基因只有一个碱基对的重叠,如D和J。 三重重叠,如G4噬菌体的基因A、B和K。
非重复序列
4、作用 放大作用,单一拷贝序列通过基因扩增
可合成大量蛋白质。 一个蚕丝心蛋白基因作为模板合成104
个丝心蛋白mRNA,每个mRNA可合成 105个丝心蛋白,因此,一个单拷贝蚕丝 心蛋白基因就可合成109个丝心蛋白分子。
二、轻度重复序列
1、概念 一个基因组中含有2-10个拷贝。
检测方法
1、蛋白质序列或mRNA序列与DNA序列相 比较。
2、电镜法——mRNA与DNA杂交法 将成熟mRNA分子与相应DNA进行杂交, 形成DNA-RNA异源杂交双链分子,在电 镜下观察到形成的R-环结构。
断裂基因的发现与证实
Ovalbumin DNA X cDNA
Electro-microscope
2、类型 主要是组蛋白和tRNA等基因。 包括两种情况:
i、几个基因都具有功能,编码同一蛋白质或 RNA。
ii、有的基因有功能,有的基因没有功能,如 假基因。
三、中度重复序列 (moderately repetitive sequence)
1、概念 一个基因组含有10-105个拷贝
2、长度 300bp,5000bp,不是编码序列。
2、长度:300bp
3、拷贝数:5×105个拷贝
4、Alu序列
在170位碱基附近的AGCT是限制性内切酶Alu I的
酶 切 位 点 , Alu 序 列 被 Alu I 切 割 成 ( AG↓CT )
130bp和170bp两段,故名Alu序列。
300bp
300bp
300bp
6000bp
6000bp
6000bp
6000bp
Kpn I家族
Kpn I家族占人类基因组的3%-6%,平 均 长 度 为 3500-5000bp, 拷 贝数 为 30004000个。 用 限 制 性 内 切 酶 Kpn I 消 化 后 , 可 得 1.2Kb、1.5Kb、1.8Kb、1.9Kb。
四、高度重复序列 (highly repetitive sequence)
H1 H3 H4 H2A H2B 果蝇
H1
H3 H2B H2A
H4
蝾螈
图例:
图 10-31 组蛋白基因簇的重复单位
基因;
间隔区;
转录方向
间隔序列??内含子??
6000bp 6540bp 7240bp 4800bp
9000bp
果蝇、非洲爪蟾、大鼠tRNA基因
3、发育调控的复杂多基因家族
在不同组织、细胞类型、时间表达的复杂多 基因家族。
部分重叠
A和C的部分重叠 A的终止密码 -ATGAC的起始密码
D和J部分重叠 D的终止密码 -TAATGJ的起始密码
第三节 基因概念的多样性 ——重复基因
真核生物DNA序列的类型
非重复序列(单一序列、单拷贝序列) 轻度重复序列 中度重复序列 高度重复序列
一、非重复序列(unique sequence)
第四节 基因概念的多样性 ——间隔基因
Splitting gene Interrupted gene
Why is cDNA shorter than the original eukaryotic DNA?
典型的原核和真核生物基因结构
RNA剪接
不连续基因的发现和检测方法
1977 年 , Sharp 和 Roberts 等 人 研 究 腺 病 毒mRNA时首次发现不连续基因。很快 在SV40中也发现了不连续基因。 1993 年 Sharp 和 Roberts 获 诺 贝 尔 生 物 医 学奖。 所有的哺乳动物、脊椎动物、高等植物 及简单的真核生物、甚至少数原核生物 都含有不连续基因。
7 introns 8 exons
3、S1核酸酶制图法(Berk-sharp制图法)
步骤: 变性的基因组DNA同mRNA杂交,形成 异源双链DNA-RNA杂种分子。 用S1核酸酶处理,除去没有杂交的单链 的间隔子序列。 用琼脂糖凝胶电泳检测。
Berk-sharp制图法
exon 1 intron exon 2
卫星DNA
人DNA有1条主带,4条卫星区带。 果蝇DNA有1条主带,3条卫星区带。
果蝇的卫 星DNA带
卫星DNA 的位置
位于染色 体的着丝 粒部位的 异染色质 区
卫星DNA举例
牛的卫星DNA:ATATAT 果蝇有三个卫星DNA区带,它们是: 5'ACAAATT3',重复3.6×106次,占8%; 5'ACAAACT3',重复1.1×107次,占25%; 5'ATAAACT3',重复3.6×106次,占8%;
海胆 果蝇 烟草
450copies 100 copies 750 copies
NTS
NTS
TS
各种真核生物rDNA重复单元的排列
5S rRNA基因的重复单元
5S rRNA由保守的120bp组成,单独成为复制单元。 每个转录单元由5S基因和非转录区组成。
真核生物中有多拷贝的5S rRNA基因,非洲爪蟾约 有2万个5S基因拷贝,人类有2000个拷贝。
富GC区49bp
富AT
15bp
400bp
5S基因120bp 假基因101bp
富含AT区(400bp):大多是GAAAGTTTGAGTTTT共 15bp的重复序列
2、复杂多基因家族
由几个相关基因家族构成,基因家族之间由间 隔序列隔开,并作为独立的转录单位。 海胆和果蝇的组蛋白基因及果蝇tRNA基因。
不连续基因的数目和大小
4、编码序列在进化过程中较保守,而内含 子变化迅速,差异很大。
哺乳动物二氢叶酸还原酶(DHFR)基因
人类
小鼠
中国 仓鼠
四、外显子和内含子之间的关系
1、外显子和内含子联结处的共同序列 联结处具有保守的共同序列。
内含子5'端起始的两个碱基是GT,3‘端 最后两个碱基总是AG。
GT-AG法则
外显子和内含子之间的关系
2、一个基因的内含子可 以是另一基因的外显子
不 同 的 外 显 子 连 接 ຫໍສະໝຸດ Baidu 式
产生多种mRNA的情况
利用多个5'端转录起始位点 多个3'端加polyA位点 利用不同的内含子剪接方式 以上3种情况的不同综合
小鼠淀粉酶基因
小鼠淀粉酶基因有两个启动区,一个在肝 脏中使用,另一个在腮腺中使用。 肝脏和腮腺的mRNA从不同的外显子开始 合成,具有不同的5'端。
小鼠淀粉酶基因在两种组织内利用两 种启动子进行转录
S
L
2
3
唾液腺转录产物
转录
肝脏转录产物
剪接 S23
L23
大鼠肌肉的肌钙蛋白T
α型:W、X、Z、 α β型:W、X、Z、 β
两个或多个polyA位点
大鼠降钙素基因 IgM、D、E、G的H链基因 果蝇肌球蛋白碱性L链基因 牛前激肽原基因
五、内含子的可能功能
1、概念 一个基因组中只存在一个拷贝
2、含量 单拷贝序列占整个基因组的40%-60% 人:60-65%; 牛:55%; 小鼠:70%; 果蝇:79%
非重复序列
3、长度和类型 750-2000bp,相当于一个结构基因的长
度。 大多数蛋白质结构基因属于单拷贝序列,
如蛋清蛋白、蚕的丝心蛋白、血红蛋白 和珠蛋白都是单拷贝序列。
相关文档
最新文档