重复序列
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单一序列(unique sequence)
又称非重复序列, 在一个基因组中一般只有一个拷贝。
真核生物的绝大多数结构基因在单倍体中是单拷贝或几个拷贝(1~5个拷贝)。
基因组中有10个到几千个拷贝的DNA序列。
重复单元的平均长度约300b 中度重复序列(moderately repetitive sequence )一般是非编码序列,有十个到几百个拷贝,如rRNA基因和tRNA基因等。
这类重复序列的平均长度大约为300bp ,往往构成序列家族,常以回文序列形式出现在基因组的许多位置上,有些同单一序列间隔排列。
大部分中度重复序列与基因表达的调控有关,包括开启或关闭基因的活性,调控DNA 复制的起始,促进或终止转录等,它们
可能是与DNA复制和转录的起始、终止等有关的酶和蛋白质因子的识别位
点。
p。
高度重复序列在基因组中重复频率高,可达百万(106)以上,因此复性速度很快。
在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20%。
高度重复顺序又按其结构特点分为三种。
(1)倒位(反向)重复序列
这种重复顺序复性速度极快,即使在极稀的DNA浓度下,也能很快复性,因此又称零时复性部分,约占人基因组的5%。
反向重复序列由两个相同顺序的互补拷贝在同一DNA链上反向排列而成。
变性后再复性时,同一条链内的互补的拷贝可以形成链内碱基配对,形成发夹式或“+”字形结构。
倒位重复(即两个互补拷贝)间可有一到几个核苷酸的间隔,也可以没有间隔。
没有间隔的又称回文(palimdr-ome),这种结构约占所有倒位重复的三分之一。
若以两个互补拷贝组成的倒位重复为一个单位,则倒位重复的单位约长300bp或略少。
两个单位之间有一平均1.6kb的片段相隔,两对倒位重复单位之间的平均距离约12kb,亦即它们多数散布非群集于基因组中。
(2)卫星DNA
卫星DNA(satelliteDNA)是另一类高度重复序列,这类重复顺序的重复单位一般由2-10bp组成,成串排列。
由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体DNA分开,因而称为卫星DNA或随体DNA。
在人细胞组中卫星DNA约占5-6%。
按照它们的浮力密度不同,人的卫星DNA可分为Ⅰ、Ⅱ、Ⅲ、Ⅳ四种。
果蝇的卫星DNA顺序已经搞清楚,可分为三类,这三类卫星DNA都是由7bp组成的高度重复顺序:卫星Ⅰ为5'ACAACT3',卫星Ⅱ为5'ACAAATT3'。
而蟹的卫星DNA为只有AT两个碱基的重复顺序组成。
(3)较复杂的重复单位组成的重复顺序
这种重复顺序为灵长类所独有。
用限制性内切酶HindⅢ消化非洲绿猴DNA,可以得到重复单位为172bp的高度重复顺序,这种顺序大部份由交替变化的嘌呤和嘧啶组成。
有人把这类称为α卫星DNA。
而人的α卫星DNA 更为复杂,含有多顺序家族。
(4)高度重复顺序的功能
a.参与复制水平的调节反向序列常存在于DNA复制起点区的附近。
另外,许多反向重复序列是一些蛋白质(包括酶)和DNA的结合位点。
b.参与基因表达的调控DNA的重复顺序可以转录到核内不均一RNA分子中,而有些反向重复顺序可以形成发夹结构,这对稳定RNA分子,免遭分解有重要作用.
c.参与转位作用几乎所有转位因子的末端都包括反向重复顺序,长度由几个bp到1400bp。
由于这种顺序可以形成回文结构,因此在转位作用中即能连接非同源的基因,又可以被参与转位的特异酶所识别。
d.与进化有关不同种属的高度重复顺序的核苷酸序列不同,具有种属特异性,但相近种属又有相似性。
如人的α卫星DNA长度仅差1个碱基(前者为171bp,后者为172bp),而且碱基序列有65%是相同的,这表明它们来自共同的祖先。
在进化中某些特殊区段保守的,而其他区域的碱基序列则累积着变化。
e.同一种属中不同个体的高度重复顺序的重复次数不一样,这可以作为每一个体的特征,即DNA指纹。
f.α卫星DNA成簇的分布在染色体着丝粒附近,可能与染色体
减数分裂时染色体配对有关,即同源染色体之间的联会可能依赖于具有染色体专一性的特定卫星DNA顺序。
[1]?
单一序列单一序列(unique sequence) 是复性最慢的部分,一般由单一拷贝基因或仅重复数次的基因组成,也可称为单拷贝序列(single copy sequence) 。
原核生物的大多数基因在单倍体中都是单拷贝的。
单一序列最重要的功能是编码蛋白质,除去极少数蛋白质( 组蛋白) 的基因属于重复序列的范畴外,目前已知的绝大多数蛋白质都是由单拷贝序列编码的。
单一序列约占真核生物基因组的40 %~
70 %,但编码序列只占单拷贝序列的一小部分,其中大部分属于不编码序列,所以
单拷贝序列除了编码以外还有其他功能。