第3节 单一顺序和重复顺序

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

等位小卫星DNA是指小卫星中含有的重复序列数目 相同;反之,不等位小卫星DNA是指小卫星中含有 的重复序列数目不同。
卫星小卫星 微卫星DNA之间的基本差异
卫星DNA : 基本单位长度 171 bp 小卫星DNA:基本单位长度15-65 bp
微卫星DNA:基本单位长度2-8 bp
人类Vห้องสมุดไป่ตู้TRs的第一个探针
五. 高度重复顺序
• 卫星DNA (satellite DNA) • 隐蔽卫星DNA(cryptic satellite) 自私 DNA(selfish DNA) 伊甸园 DNA (Garden of Eden DNA) • 小卫星 (minisatellite ) • 重复序列可变数(variable number tandem repeat VNTRs) • DNA指纹(DNA fingerprints)
有一些比较复杂的卫星DNA据推测可能是从简单的 短序列重复发展变化而来的。
一般这些序列中的GC含量与其 他的主体DNA不同(例如小鼠 中为30%,低于其主体DNA的 42%GC含量)。所以在进行氯 化铯密度梯度超离心时,这些 DNA由于密度小,会与主体的 DNA带分开而出现在上面,所 以称为卫星DNA。
基因簇(gene cluster):基因家族中的各成员 紧密成簇排列成大串的重复单位,定于染色体的 的特殊区域。 基因簇少则可以是由重复产生的两个相邻相关基 因所组成,多则可以是几百个相同基因串联排列 而成。他们属于同一个祖先的基因扩增产物。 也有一些基因家族的成员在染色体上排列并不紧 密,中间还含有一些无关序列。但总体是分布在 染色体上相对集中的区域。
着丝粒
基因
LINE
基因
VNTR 基因 SINEs
基因
VNTR
LINE
rDNA
核仁形成区
图 10-37(a)真核生物染色体上的各种重复顺序和结构元件
基因和 基因相 关顺序 编码顺序 (20-30%) (< 10%) 人类基因组 (3×109bp) 基因以 外非编 码顺序 (70-80%)
非编码顺序 ( > 90%)
• • • • • • 1985年由Alec Jeffries制备 在肌红蛋白基因的第一个内含子中 分离出132bp的重复顺序 内含4个长33bp的重复单位 内有13bp为核心顺序 (GGAGGTGGGCAGG)
L1 家族
• 长6500bp左右 • 称为长的分散因子(long interspersed elements, LINEs) • 在基因组中约6万个拷贝 • 由RNA多聚酶II转录的。 • 属于一种转座因子
也有的卫星DNA密度比主体DNA密度大,出现在
主体DNA的下面。
隐秘的卫星DNA是指与主体DNA的密度类似,使
用氯化铯密度梯度超离心不能分开的高度重复
序列,但是可以通过其他的方法将其分离出来。
人们开始时认为这些高度重复的DNA序列没有什么
功能。近来发现与DNA复制、基因表达的调节、基 因的转位、减数分裂时染色体的配对等过程有重 要关系。
回文结构的意义: 1)是限制性内切酶的识别位点。 2)具有调节基因的表达作用,如色氨酸操纵子的 前的弱化子。 3)转录终止时的识别结构。 4)有利于稳定RNA的结构和行使功能。
5)基因工程中DNA序列的方便操作。
三. 轻度重复顺序和中度重复顺 序
• 轻度重复顺序 在基因组中含有2-10拷贝 , 酵母tRNA基因、人和小鼠的珠蛋白基因等。 • 中度重复顺序 长约300bp 基因组中约有10-几千个拷贝的顺序 如rRNA和tRNA基因 tRNA基因一般都分布于基因组中,而 rRNA常集中分布于核仁形成区。 •
书 临 汉 字 翰 林 书
画 上 荷 花 和 尚 画
在高度重复序列中,有一种是反向重复序列,也 叫回文结构;长度不等,从几个核苷酸到几百个 核苷酸等。
这种反向重复序列在基因组中很多,据推测可
能与基因的复制、转录等调控有关。 与DNA结合的蛋白质多以二聚体的形式结合,这 时会发现结合位点的DNA多具有回文结构的特点。
H3
H4
H2A
H2B 4800bp
H2B
H2A
H4 9000bp
图例:
图 10-31 组蛋白基因簇的重复单位 基因; 间隔区; 转录方向
δ
ψδ ψα ψα α 2 α 1 θ
ε
Gγ A γ
ψβ
δ
β
图 10-30 人 类 血 红 蛋 白 的 α 和 β 基 因 簇
晚期胚 ψ 小鼠
早期胚 β ho β
第三节
单一顺序和重复顺 序
一. 单一顺序 (Unique sequence ) 二. 重复顺序 短片段的重复顺序可分为三种类型: (1)正向重复(direct repeats)又叫顺向重复; (2)反向重复(inverted repeats) ; (3)回文顺序 (Palindromic sequence) 5‘ GTGAGCTCAC 3’ 3’ CACTCGAGTG 5’
族更长(如人KpnⅠ顺序长6.4kb),而且更加不
均一,呈散在分布,属于中度重复顺序的长分散 序列。 KpnⅠ家族的拷贝数约为3000-4800个, 占人体基因组的1% 。
Hinf家族:这一家族以319bp长度的串联重复存 在于人体基因组中。用限制性内切酶HinfⅠ消 化人体DNA,可以分离到这一片段。Hinf家族在 单位基因组内约有50-100个拷贝,分散在不同 的区域。319bp单位可以再分成两个亚单位,分 别为172bp和147bp,它们之间有70%的同源性。
NTS
NTS
TS
18s
TS 5.8s TS
28s
TS
图 10.29 非洲爪蟾 rRNA 基因的串联重复排列 TS:可转录的间隔(spacer)顺序 NTS:不可转录的间隔顺序
H1 海胆(R) 海胆(S) 海胆(L) H1 果蝇 H1 蝾螈 H3
H4
H2B
H3
H2A 6000bp 6540bp 7240bp
不同的基因家族中成员的数目不等,功能也各异。 基因家族的成员有的位于同一条染色体上,串联 在一起,而有的分散在不同的染色体上。 如果有的成员因为变异而失去了原有的功能, 或不能再进行表达形成有功能的产物,则称为 假基因。
典型的基因家族: 1.tRNA 基因 单倍体人基因组 中 1300 个 tRNA 基因,tRNA 基因簇; 2.rRNA 基 因 >l00copy.rRNA 基因簇(重复单元 28S、18S、 5.8s-rRNA) 3.组蛋白基因 30-40copy.定位:7q32q36 组蛋白基因簇(重复单位:H1,H2A,H2B,H3、 H4)。4.珠蛋白基因 α类:16p13,基因簇(24Kb): 5‘-ζ-Ψζ-Ψα1-α2-α1-3’ β类:11p15,基因簇(60Kb): 5‘- ζ-Gr-Ar-Ψβ-δ-β-3’。
高度重复是一种简单的重复序列,有的重复单 位不超过6 bp,但是重复的次数可以达到几十 万次之多,故称为高度重复序列,也叫做卫星 DNA。
卫星DNA:是高等真核生物基因组重复程度最高的 成分,由非常短的串联多次重复DNA序列组成,一 般占基因组的10%-30%。因为其序列复杂性不高, 所以有时称为简单序列DNA;卫星DNA以大的基因 簇分布(100-3000 kb),常位于异染色质的着丝 粒,可能在染色体的功能中起作用。
h1
成体 ψ h2 ψ h3 β 4 β
maj 1
β ψβ
min 2
β 3 ρ
β 1 β ε
兔 β H 鸡
kb 60
50 图 10-32
40
30
20
10
0
脊椎动物中的β -珠蛋白基因簇和假基因
四 Alu家族
• 长约300bp;Alu顺序也称为短的分散因子(short interspersed elements, SINEs)。 • 由RNA多聚酶III转录的。 • 在基因组中30 万个拷贝; • 在170bp处有一AluI 的酶切位点; • 由两个130bp的串联重复顺序组成; • 在二聚体的右半部有31bp插入序列,此插入 顺序来自7SL RNA。 Alu顺序有何应用价值?
在人基因组中Alu基因家族是一个中等重复序列, 长度在300bp左右,单倍体基因组中有30万份,分 散在各染色体上。 在170 bp处有一个限制性酶切位点Alu。基因组中 平均每5kb出现一次Alu序列,因此在基因的内含 子以及基因附近的序列中有许多。
Alu家族的每一个成员都很相似,由130 bp的
反向重复(Inverted repeats ):
同一个序列的两个拷贝在一个分子中以相反 的方向重复,相邻重复组成回文序列。
由反方向互补的两个DNA片段组成,两个反转 重复序列又叫回文序列(palindrome sequence)。呈两侧对称的序列,常存在于插 入序列和转座子两端的结构元件中。
正反相同
中度/高度 重复顺序 (20~30%) 单一/低度 重复顺序 (70~80%)
5'前导顺序,3'拖尾顺序 因突变而失去功能 假基因 加工假基因 基因片断(丢失了 5'和 3'端顺序,不能表达的基因) 短分散顺序(SINEs)―如 Alu 顺序 分散的重复顺序 (40%) 长分散顺序(LINEs) 卫星 DNA(长 100~5000kb) 成簇的重复顺序 小卫星 DNA(长 100bp~20kb,VNTRs) (60%) 微卫星 DNA(4bp,CA 重复)
串联重复组成,常见的是二聚体形式,在右半
部分的中部有一个31 bp的无关序列插在中间。 这个插入序列(IS)来自7SL(是信号识别蛋 白SRP的一个成分)。
31 bp IS
Alu家族的广泛存在说明其可能具有某种功能, 但是目前还不十分了解。
在小鼠体中有一种和Alu序列同源的序列叫做 B1家族,约有5万个成员。重复单位为130 bp,
图 10-37(b)人类基因组的序列
非重复序列 单 一 序 列 轻度重复序列
一个基因组中只有一个拷贝
一个基因组中有2-10个拷贝
DNA
中度重复序列
一个基因组中有10-几百个拷贝
高度重复序列
一个基因组中有几百-几百万个拷贝
卫星DNA
小卫星DNA12-100 bp
微卫星DNA1-5 bp
• 基因簇(gene cluster):功能相关,紧密连锁 • 基因家族(gene family):起源相同,结构功能相似 • 假基因(pseudogene) • 加工假基因(processed pseudogenes)。 有以下的特点: ⑴缺少正常的内含子; ⑵3’末端有多聚腺苷酸; ⑶5’端的结构和mRNA的5’端十分相似; ⑷两侧有顺向重复顺序的存在 。 对以上特点作何推论? • 因此人们推测它似乎和mRNA一样经过了转录后加 工,因此也称其为加工假基因;
单一序列(非重复序列):
基因在基因组中只有一个或几个拷贝,真核
细胞中占40%-70%。真核细胞的大多数基因是 单拷贝的,但是单一序列中只有百分之几的 序列是编码基因的。而原核基因组中,大多 数的单一序列是编码基因的。
正向重复:
正向重复(direct repeats)又叫顺向重复,
这种重复序列的方向是相同的。比如l噬菌体 的复制起点中的重复序列以及真核转座因子 Ty,copia的两端,插入序列,转座子的两端 的宿主序列以及端粒结构等
基因家族(gene family):一组功能相似且核苷酸 序列具有同源性的基因。可能由某一共同祖先基 因经重复和突变产生。基因家族的特点:①基因 家族的成员可以串联排列在一起,形成基因簇 (gene cluster) 或 串 联 重 复 基 因 (tandemly repeated genes),如 rRNA、tRNA 和组蛋白的基 因;②有些基因家族的成员也可位于不同的染色 体上,如珠蛋白基因;③有些成员不产生有功能 的基因产物,这种基因称为假基因。Ψa1 表示与 a1相似的假基因。
相当于Alu序列的一个单体,和Alu序列的同源
性为70%-80%。
KpnⅠ家族是中度重复顺序中仅次于Alu家族的第
二大家族。用限制性内切酶KpnⅠ消化人类及其它
灵长类动物的DNA,在电泳谱上可以看到4个不同
长度的片段,分别为1.2,1.5,1.8和1.9kb,这就
是所谓的KpnⅠ家族。KpnⅠ家族成员顺序比Alu家
相关文档
最新文档