3第三章-基因组和基因-1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Alu家族重复序列
• Alu 家族不只在人基因组中发现,非洲绿 猴、小鼠、中国仓鼠等哺乳动物中都有。 5、功能 参与基因活化、 DNA 复制起始、参与前 mRNA的加工等,需进一步证实。
Kpn I家族
• Kpn I 家族占人类基因组的 3%-6% ,平 均 长 度 为 3500-5000bp , 拷 贝 数 为 3000-4000个。 • 用 限 制 性 内 切 酶 Kpn I 消 化 后 , 可 得 1.2Kb、1.5Kb、1.8Kb、1.9Kb。
或全部序列。即一段序列中含有合成两个或
两个以上多肽的基因。 基因重叠现象是英国分子生物学家 Sanger
1977年在测定噬菌体ΦX174的DNA序列是
发现的。
ΦX174
5387 bp 11 genes 3 mRNA 9 peptides
1973年,Weiner和Weber在Qβ噬菌体 (E.coli 的病毒)发现基因重叠现象。
非重复序列
4、作用 放大作用,单一拷贝序列通过基因扩增 可合成大量蛋白质。 一个蚕丝心蛋白基因作为模板合成 104 个丝心蛋白mRNA,每个mRNA可合成 105个丝心蛋白,因此,一个单拷贝蚕丝 心蛋白基因就可合成109个丝心蛋白分子。
二、轻度重复序列
1、概念 一个基因组中含有2-10个拷贝。 2、类型 主要是组蛋白和tRNA等基因。 包括两种情况: i、几个基因都具有功能,编码同一蛋白质或 RNA。 ii、有的基因有功能,有的基因没有功能,如 假基因。
部分重叠
A和C的部分重叠:A的终止密码 -ATGAC的起始密码 D和J部分重叠:
-TAATGD的终止密码; J的起始密码
第三节 基因概念的多样性
——重复基因
真核生物DNA序列的类型
• 非重复序列(单一序列、单拷贝序列) • 轻度重复序列 • 中度重复序列 • 高度重复序列
一、非重复序列(unique sequence)
四、高度重复序列 (highly repetitive sequence)
1、概念 一个基因组含有大于105个拷贝,分布于着 丝点, 端粒区, 结构基因两侧。 2、含量 占总DNA的10%-60%,高等真核生物中 占20%,由6-10bp组成。 3、种类 卫星DNA、小卫星DNA、微卫星DNA
卫星DNA(satellite DNA)
变性杂交
A
B
C
S1核酸酶
2
1
三、不连续基因的数目和大小
1、数目 有些只有一个或少数几个内含子,有的含有 较多的内含子。 珠蛋白:2个; 酵母线粒体cytb: 6个 卵类粘蛋白:6个; 卵清蛋白:7个 卵类运铁蛋白:16个;伴清蛋白:17个 α -胶原蛋白:52个; 组蛋白:0个
珠蛋白基因家族中内含子的位置和保守 性
Alu家族重复序列
1、含量 Alu家族序列占人基因组DNA总量的5%-6% 2、长度:300bp 3、拷贝数:5×105个拷贝 4、Alu序列 在 170 位碱基附近的 AGCT 是限制性内切酶 Alu I 的酶切位点, Alu 序列被 Alu I 切割成(AG↓CT) 130bp和170bp两段,故名Alu序列。
外显子和内含子之间的关系
2、一个基因的内含子可 以是另一基因的外显子
产生多种mRNA的情况
• • • •
利用多个5'端转录起始位点 多个3'端加polyA位点 利用不同的内含子剪接方式 以上3种情况的不同综合
小鼠淀粉酶基因
• 小鼠淀粉酶基因有两个启动区,一个在肝 脏中使用,另一个在腮腺中使用。 • 肝脏和腮腺的mRNA从不同的外显子开始 合成,具有不同的5'端。
第四节 基因概念的多样性 ——间隔基因 Splitting gene Interrupted gene
Why is cDNA shorter than the original eukaryotic DNA?
典型的原核和真核生物基因结构
一、概念
• 核苷酸序列中插入与氨基酸编码无关的 DNA间隔区,使一个基因分隔成不连续的 若干区段,这种不编码的间断基因称为不 连续基因。 • 编码的序列称为外显子(exon),不编码 的序列称为内含子(intron)。
检测方法
1 、蛋白质序列或 mRNA 序列与 DNA 序列 相比较。 2、电镜法——mRNA与DNA杂交法 将成熟mRNA分子与相应DNA进行杂交, 形成DNA-RNA异源杂交双链分子,在电 镜下观察到形成的R-环结构。
断裂基因的发现与证实
Ovalbumin DNA X cDNA
Electro-microscope
RNA剪接
不 同 的 外 显 子 连 接 方 式
二、不连续基因的发现和检测 方法 • 1977 年, Sharp 和 Roberts 等人研究腺 病毒mRNA时首次发现不连续基因。很 快在SV40中也发现了不连续基因。 • 1993 年 Sharp 和 Roberts 获诺贝尔生物 医学奖。 • 所有的哺乳动物、脊椎动物、高等植物 及简单的真核生物、甚至少数原核生物 都含有不连续基因。
卫星DNA
• 人DNA有1条主带,4条卫星区带。 • 果蝇DNA有1条主带,3条卫星区带。
果蝇的卫 星DNA带
卫星DNA 的位置
位于染色 体的着丝 粒部位的 异染色质 区
卫星DNA举例
• 牛的卫星DNA:ATATAT • 果蝇有三个卫星DNA区带,它们是: 5'ACAAATT3' ,重复 3.6×106 次,占 8% ; 5'ACAAACT3',重复1.1×107次,占25%; 5'ATAAACT3' ,重复 3.6×106 次,占 8% ;
五、内含子的可能功能
• 不存在内含子的基因 少数真核生物并不存在内含子,如编码 干扰素、组蛋白的基因和大多数酿酒酵 母的基因。
内含子wenku.baidu.com可能功能
• 转录调控功能:内含子通过启动子、起始位 点的精确碱基配对,来阻止或增强RNA聚合 酶的作用,对转录具有调控作用。 • 形成不同成熟的mRNA:内含子具各种剪接 信号,不同细胞选择不同的拼接点,使初始 转录产物形成不同的成熟mRNA。 • 内含子具有自己特定的蛋白质编码,可能携 带某种信号,作为基因调控的因素。
三、中度重复序列 (moderately repetitive sequence)
1、概念 一个基因组含有10-105个拷贝 2、长度 300bp,5000bp,不是编码序列。 3、含量 占总DNA的10%-40% 小鼠:20%;果蝇:15%
中度重复序列
4、类型 i、短周期分散的重复序列:长100-300bp, 如人、爪蟾、海胆的Alu序列。 ii、长周期分散的重复序列:长5000bp, 如Kpn I家族。
第三章 基因和基因组
内容
第一节 基因的概念、演变与发展
第二节 基因概念的多样性——重叠基因
第三节 基因概念的多样性——重复基因 第四节 基因概念的多样性——间隔基因
第五节 基因概念的多样性——跳跃基因
第六节 基因家族
第七节 基因组与C值矛盾
第八节 原核生物基因组
第九节 真核生物基因组
第十节 人类基因组计划
不连续基因的数目和大小
4 、编码序列在进化过程中较保守,而内含 子变化迅速,差异很大。 哺乳动物二氢叶酸还原酶(DHFR)基因
人类 小鼠 中国 仓鼠
四、外显子和内含子之间的关系
1、外显子和内含子联结处的共同序列 • 各种内含子的两端没有任何广泛的同源 性和互补性; • 联结处的确具有保守的共同序列。 内 含 子 5' 端 起 始 的 两 个 碱 基 是 GT , 3‘端最后两个碱基总是AG。 GT-AG法则
Ori
stop1 97%
mRNA1
stop2
DNA
3%
CP mRNA1
IP
重叠基因有以下几种情况:
• 一个基因完全在另一个基因里面。 如基因B在基因A里面,基因E在基因D里面。 • 部分重叠,如K和C、A和C。 • 两个基因只有一个碱基对的重叠,如D和J。
• 三重重叠,如G4噬菌体的基因A、B和K。
300bp 300bp 300bp
6000bp
6000bp
6000bp
6000bp
Alu家族重复序列
• Alu序列两端都具有7-20bp的顺向重复序列, 各个 Alu 成员的两端的顺向重复序列都不相 同。如人的两个Alu成员: GTTTAGATAAG…Alu…GTTTAGATAAA AAAGAAATG… Alu… AAATAAATGG
小鼠淀粉酶基因在两种组织内利用两 种启动子进行转录
S L 2 转录 3
唾液腺转录产物
剪接 S 2 3 肝脏转录产物
L 2 3
大鼠肌肉的肌钙蛋白T
• α 型:W、X、Z、 α • β 型:W、X、Z、 β
两个或多个polyA位点
• • • •
大鼠降钙素基因 IgM、D、E、G的H链基因 果蝇肌球蛋白碱性L链基因 牛前激肽原基因
7 introns 8 exons
3、S1核酸酶制图法(Berk-sharp制图 法)
步骤: • 变性的基因组DNA同mRNA杂交,形成 异源双链DNA-RNA杂种分子。 • 用 S1 核酸酶处理,除去没有杂交的单链 的间隔子序列。 • 用琼脂糖凝胶电泳检测。
Berk-sharp制图法
exon 1 intron exon 2 mRNA
1、概念
一个基因组中只存在一个拷贝 2、含量
单拷贝序列占整个基因组的40%-60%
人:60-65%; 小鼠:70%; 牛:55%; 果蝇:79%
非重复序列
3、长度和类型 750-2000bp ,相当于一个结构基因的 长度。 大多数蛋白质结构基因属于单拷贝序列, 如蛋清蛋白、蚕的丝心蛋白、血红蛋白 和珠蛋白都是单拷贝序列。
第一节 基因的概念、演变与发展
• 分离规律
• 自由组合规律
• 基因在染色体上 • 等位基因 • 连锁与交换 • 一个基因一个酶
• 顺反子假说
第二节 基因概念的多样性
——重叠基因
(Overlapping genes)
原核生物的重叠基因 (Overlapping genes)
概念: 指一个基因的序列中,含有另一基因的部分
• DNA的浮力密度决定于它的G﹢C含量,G﹢C含 量越高,浮力密度越大。 ρ = 1.660 + 0.00098(G + C)% g/cm3 • 在高度重复序列中,常有一些AT含量很高的简单 重复序列, AT 含量有时高达 97% (如螃蟹 DNA 中的卫星DNA)。 • 在 CsCl 密度梯度离心时,易与其它 DNA 分开, 形成两个以上的峰,即含量较多的主峰和高度重 复序列的小峰。 • 小峰在主峰旁似卫星,称为卫星DNA。
α-珠蛋白基因
内含子1 内含子2
β-珠蛋白基因
不连续基因的数目和大小
2、不同来源的内含子的分子大小相差悬殊 SV40基因内含子长31bp 人的营养不良蛋白基因内含子长210kbp。
不连续基因的数目和大小
3、内含子的长度一般比外显子长 • 卵清蛋白基因总长 7700bp ,而 mRNA 只 有1859bp,内含子总长为5841bp。 • 二氢叶酸还原酶(DHFR)基因总长31kb, 而mRNA只有2kb,而内含子长为29kb。
相关文档
最新文档