医学分子生物学(新)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

泛基因阶段
孟德尔的遗传因子阶段
摩尔根的基因阶段
顺反子阶段
操纵子阶段
现代基因阶段
DNA分子中含有特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。

合成有功能的蛋白质多肽链或RNA所必需的全部核酸序列(通常是DNA序列)。

一个基因应包含不仅是编码蛋白质肽链或RNA的核酸序列,还包括为保证转录所必需的调控序列、5′非翻译序列、内含子以及3′非翻译序列等所有的核酸序列(蛋白质基因和RNA基因)。

根据其是否具有转录和翻译功能可以把基因分为三类
第一类是编码蛋白质的基因,它具有转录和翻译功能,包括编码酶和结构蛋白的结构基因以及编码阻遏蛋白的调节基因
第二类是只有转录功能而没有翻译功能的基因,包括tRNA基因和rRNA基因
第三类是不转录的基因,它对基因表达起调节控制作用,包括启动基因和操纵基因。

原核生物基因组:染色体基因组(chromosomal genome)染色体外基因组(extrachromosomal genome )
真核生物基因组:染色体基因组(chromosomal genome)染色体外基因组(extrachromosomal genome )
生物体的进化程度与基因组大小之间不完全成比例的现象称为 C value paradox,又称C值悖论)
病毒基因组很小,且大小相差较大
病毒基因组可以由DNA组成,或由RNA组成
多数RNA病毒的基因组是由连续的RNA链组成
基因重叠
基因组的大部分可编码蛋白质,只有非常小的一部份不编码蛋白质
形成多顺反子结构
病毒基因组都是单倍体(逆转录病毒除外)
噬菌体(细菌病毒)的基因是连续的,而真核细胞病毒的基因是不连续的
1981年,美国首先发现获得性免疫缺陷征(acquired immunodeficiency syndrome,AIDS),其病原体是一种能破坏人免疫系统的逆转录病毒1986年,命名为:人类免疫缺陷病毒(human immunodeficiency virus,HIV)
HIV特异性地侵犯并损耗T细胞而造成机体免疫缺陷
HIV如何感染免疫细胞并复制
捆绑――当HIV病毒的gp120蛋白捆绑到T-helper细胞的CD4蛋白时,HIV病毒附着到机体的免疫细胞上。

滤过性病毒核进入到T-helper细胞内部,并且病毒体的隔膜融合进细胞壁;
逆转录――滤过性病毒酶,即逆转录酶,将病毒的RNA转化为DNA;
集成――新产生的DNA被病毒整合酶运送到细胞核中,并嵌入到细胞的DNA。

HIV病毒被称之为前病毒;
复制――细胞核中的病毒DNA利用细胞自己的酶分裂产生信使RNA(mRNA)。

mRNA含有制造新的病毒蛋白的指令序列;
翻译――mRNA由细胞的酶运送出细胞核。

然后病毒就利用自然蛋白生成机制来生成病毒蛋白和酶的长链分子;
组装――RNA和病毒酶在细胞边缘聚集。

一种被称之为蛋白酶的酶将多肽切成病毒蛋白。

发育――新的HIV病毒粒子从细胞壁中收缩出来并打破环绕他们的细胞壁。

这就是封装的病毒从细胞中分离出来的过程。

HIV的基因结构特点
遗传变异率高是一个多态性病毒(结构表现出一定的差异),病毒在传播过程中突变、缺失或插入所引起
高度变异区在env基因内,相当于gp120的五个区段,gag和pol基因较少变异,是基因组的保守区域
目前已知HIV有两个型:
HIV-1:欧洲和美洲分离的毒株的总称,亚洲地区的流行株也基本上为HIV-1
HIV-2:西部非洲的妓女中分离的毒株
HIV-1与HIV-2的核苷酸有60%同源性
HIV-1与HIV-2的感染不同
HIV-1是主要毒株,一旦感染终身携带,进展快,预后差
HIV-2感染的潜伏期长,致病性低
没有人真正死于艾滋病
大部分的艾滋病感染者都是死于其他的传染病,这是因为他们的免疫系统已经被彻底破坏了。

艾滋病人死于感冒和死于肺癌对他们来说是一样的容易,由于身体不能与一般的疾病作斗争,最后他们会因一些小小的病症而死去
* 性接触;* 受感染的静脉注射;* 母乳喂养(母亲对婴儿);* 受感染的母亲在怀孕和生产时传递给胎儿;。

乙肝病毒基因组的结构和功能
乙肝病毒(hepatitis B virus,HBV)是目前已知的感染人类的最小的双链DNA病毒
HBV的基因组结构显得特别精密浓缩,基因组DNA结构奇特
环状的部分双螺旋结构,长约3.2kb。

其中的2/3为双螺旋结构,1/3为单链,DNA中的两条链不等长
长链为负链,短链为正链
长链:5’端与3’端无共价连接,而是与一种蛋白质共价相连
短链:长度视病毒而异,一般长约1.6-2.8kb,约为长链的2/3。

短链之间的空隙可由病毒颗粒中的DNA聚合酶充填
为充分利用其遗传物质,通过基因重叠使病毒在很小的基因组中容纳大量的遗传信息。

因而HBV的基因组结构显得特别精密浓缩
1. 重叠的基因序列比较多
2. 调节序列位于基因内部
HBV节约使用遗传物质的一种方式
启动子存在于编码蛋白质序列内
增强子位于聚合酶基因中
polyA附加信号位于ORFC中
GRE(皮质激素敏感因子)位于ORFS和聚合酶基因中
GRE 是与激素受体结合的DNA 片段,结合后能使某一已知基因转录水平增加
GRE具有增强子特征
[1] 顺式作用元件
[2] 在转录的两个方向均有作用
细菌基因组结构与功能
细菌染色体基因组结构的特点
1. 形成类核(nucleoid):
由一条环状双链DNA 分子组成细菌的染色体,并相对聚集在一起,形成一个较为致密的区域类核无核膜与胞浆分开,类核的中央部分由RNA和支架蛋白组成,外围是双链闭环的DNA超螺旋
2. 染色体DNA通常与细胞膜相连:
连接点的数量随细菌生长状况和不同的生活周期而异
在DNA链上,与DNA 复制、转录有关的信号区域与细胞膜优先结合
3. 具有操纵子结构:
结构基因为多顺反子,若干个功能相关的结构基因串联在一起,受同一个调节区的调节
数个操纵子还可以由一个共同的调节基因(regulatorygene )即调节子(regulon)所调控
4.结构基因都是单拷贝,rRNA基因为多拷贝,基因组DNA中不编码的部份所占比例比真核细胞基因组少得多,比病
毒基因组多。

5. 不出现基因重叠现象:
基因组中,编码顺序一般不会重叠
具有同基因(isogene):编码同工酶(isoenzyme)
在大肠杆菌基因组中:
两个编码分支酸(chorismic acid)变位酶的基因
两个编码乙酰乳酸(acetolactate)合成酶的基因
7. DNA分子中具有各种功能的识别区域
如:复制起始区(OriC)复制终止区(TerC)转录启动区转录终止区
这些区域往往具有特殊的顺序,并且含有反向重复顺序
8.
基因或操纵子终末的特殊顺序
可使转录终止、RNA聚合酶从DNA链上脱落
终止子有强、弱之分
强终止子含有反向重复顺序,可形成茎环结构,其后面为polyT 结构,无需终止蛋白参与即可使转录终止
弱终止子也有反向重复序列,但无polyT 结构,需要有终止蛋白参与才能使转录终止
9.结构基因中无内含子
基因序列是连续的,因此在转录时不需要剪接加工,与真核生物不同
大肠杆菌Ecoli
大肠杆菌基因组含有3500个基因,已被定位的有900个左右,900个基因中,有260个基因已查明具有操纵子结构,定位于75个操纵子中,已知的基因中,8 %的序列具有调控作用
大肠杆菌染色体基因组中已知的基因多是编码酶类的基因,合成代谢酶类基因:氨基酸、嘌呤、,嘧啶、脂肪酸和维生素,分解代谢酶类基因:碳、氮化合物
另外,核糖体大小亚基中50多种蛋白质的基因也已经鉴定了
具有双向复制,但不能同时进行,顺时针复制时,逆时针复制被抑制,逆时针复制时,顺时针复制被抑制
具有相关功能的基因在一个操纵子内,由一个启动子转录
大多数基因的相对位置是随机分布的如:控制小分子合成和分解代谢的基因,大分子合成和组装的基因分布在大肠杆菌基因组的许多部位,并不集中在一起,再如:有关糖酵解的酶类的基因分布在染色体基因组的各个部位
细菌染色体上的基因似乎没有固定的格局,相对位置的改变不会影响其功能
大肠杆菌和与其分类关系上相近的其他肠道菌,如志贺氏杆菌属(Shigella)、沙门氏菌属(Salmonella )等具有相似的基因组结构
伤寒沙门氏杆(Salmonellatyphimurium)菌与大肠杆菌的基因组结构几乎相同,有10%的基因组序列和大肠杆菌相比发生颠倒,但其基因的功能仍正常
在大肠杆菌染色体基因组中,基因都是单拷贝基因
在某种特殊环境下,需要有多拷贝基因来编码大量的基因产物
例如:在有极少量乳糖或乳糖衍生物的培养基上,乳糖操纵子的多拷贝化可以使大肠杆菌充分利用的乳糖分子。

但是,一旦将大肠杆菌移到有丰富的乳糖培养基上,多拷贝的乳糖操纵子便没有存在的必要,相反,由于需要较长的复制时间,这种重复的多拷贝基因会重新丢失
基因组上的各个基因的位置与其功能的重要性可能有一定的联系
大肠杆菌染色体基因组中,大多数rRNA 基因集中于基因组的复制起点(oriC )的位置附近。

这一位置有利于rRNA 基因在早期复制后马上作为模板进行rRNA的合成以便进行核糖体组装和蛋白质的合成
染色体的主要化学成分
DNA蛋白质RNA
生化研究表明:上述三类组成染色体的化学成分中,蛋白质含量约为DNA的二倍,根据组成蛋白质的氨基酸特点分为组蛋白和非组蛋白两类。

RNA含量很少,还不到DNA量的10%。

真核生物细胞中的DNA连接蛋白
组蛋白:数量巨大,每个细胞中约6千万个拷贝,几乎与DNA等量
非组蛋白:数百种,每种蛋白质的功能不相同
组蛋白(histones)——染色体中的碱性蛋白质
特点:富含二种碱性氨基酸(赖氨酸和精氨酸)
根据这两种氨基酸在蛋白质分子中的相对比例将组蛋白分为五种小类型
组蛋白的等电点(pI)在7.5-10.5之间,所含的强极性氨基酸使组蛋白带上大量电荷,成为组蛋白与DNA结合及蛋白质之间的相互作用的主要化学力之一
根据所含碱性氨基酸的相对比例划分为三种类型:富精氨酸组蛋白(H3和H4),稍富赖氨酸组蛋白(H2A和H2B)及极富赖氨酸组蛋白(H1)
五种组蛋白的氨基酸全顺序均已确定。

H3 和H4 的序列在各种属之间极少有差异,这种生物进化上的高度保守性预示着其功能的重要性。

其它三种组蛋白在不同种属之间存在着较大的差异
组蛋白对染色体中DNA的包装有十分重要的作用
非组蛋白(non-histone protein,NHP)
染色体中组蛋白以外的其它蛋白质,是一大类种类繁杂的各种蛋白质的总称,估计总数在300-600 之间
分子量范围为7-80kD,等电点为3.9-9.2
高迁移率蛋白群(high mobility group, HMG)
是非组蛋白中一群较丰富而不均一的蛋白,富含Asp、Glu等酸性氨基酸,为酸性蛋白质
分子量一般≤3.0×104,在聚丙烯酰胺凝胶电泳中迁移率很高
在高等真核生物中,HMG可以分为3大类,即HMG-1/2、HMG-I(Y)和HMG-14/17
已经明确其中的一些蛋白质(如HMG14/17)在转录活性区含量丰富,可以认为是参与转录调控的蛋白质
非组蛋白功能
1. 参与并调控基因表达
参与基因复制、转录及核酸修饰的酶类(如各种DNA和RNA聚合酶等)
参与转录调控的蛋白质
2. 维持染色体的高级结构
非组蛋白中的核基质蛋白对于维持染色体的高级结构是必不可少的
从DNA到染色体的四级结构模型
一级结构:核小体串珠结构二级结构:螺线管三级结构:超螺线管四级结构:染色单体
核小体(nucleosome)1974年,Kornberg 发现核小体核小体是所有真核生物染色体的基本结构单位
电镜观察破裂的间期细胞流出的染色质,可见染色质纤维呈非连续性颗粒状,就像一条细线上串联着许多有一定间隔的小珠状颗粒(核小体)
用小球菌核酸酶处理提取的染色质,可得到单个的核小体颗粒
对染色质进行酶解处理,通过凝胶电泳鉴定,发现:产物是一系列不同长度的DNA片段,且这些片段之间有一个200 bp左右的“阶差”
对核小体多聚体的研究,获得的结果是:相邻多聚体之间的DNA“阶差”等于核小体单体中的DNA长度(200 bp 左右),且多聚体分子量总是单体分子量的整倍数
以密度梯度离心法制备核小体单体,对其中的蛋白质进行化学分析得知,每一个单体中含有H2A、H2B、H3和H4各二分子(它们构成一个八聚体),H1一分子
核小体结构
核酸酶酶解实验结果:
核小体由核心颗粒(core particle)和连接区DNA(linker DNA)二部分组成
核小体单体被小球菌核酸酶处理后,随着时间延长,其降解产物(DNA片段)会逐渐缩短,从200 bp降至146 bp 至此变为很难进一步降解的稳定状态
对此稳定降解产物进行分析,证明它是由146 bp 的DNA片段和H2A、H2B、H3 和H4各二分子组成,这种结构称为核心颗粒(core particle)
H1总是随着核心颗粒的形成而消失,通常是在DNA被降解至160 bp以后,提取物中H1丢失,提示H1位于“裸露”DNA与核心颗粒的毗邻区
核心颗粒外,“裸露”的DNA长度为60bp左右,
称为连接区DNA (linker DNA)
染色体的形成——超螺旋结构
染色体的形成实际上是细胞核DNA在核小体
的基础上经多层次的进一步结构变化, 形成更高层次的超螺旋结构
核小体:染色体DNA的一级包装
由直径2nm的DNA双螺旋链绕组蛋白形成直径11nm 的核小体“串珠”结构,若以每碱基对沿螺旋中轴上升距离为0.34 nm计,200bp DNA(一个核小体的DNA片段)的伸展长度为68 nm,形成核小体后仅为11 nm(核小体直径),其长度压缩了6-7倍
螺线管纤维(solenoidal fiber)——染色体DNA二级包装
由6个核小体盘绕形成一种中空螺线管,其外径为30 nm,因此,螺线管的形成使DNA一级包装又压缩小6倍
若以充分伸展的DNA双螺旋论,每个螺线管包含了408 nm(6×68 nm)长度的DNA链,而每圈螺线管的长度几乎等于核小体直径,即11nm,故染色体的二级包装相当于将DNA长度压缩了近40倍
环状螺线管:染色体DNA的三级的包装
电镜显示,由螺线管纤维缠绕在一个由某些非组蛋白构成的中心轴(central axis)骨架上形成的。

这显然使螺线管纤维得到了较大程度的压缩
三级包装后,DNA链被压缩的程度仍远远不足以形成能被细胞核容纳的染色体,因此,环状螺线管纤维需进一步包装经各级包装后染色体DNA总共被压缩了数千倍(8100多倍)
1.
2.真核生物基因组DNA除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组
3.真核细胞基因转录产物为单顺反子。

一个结构基因经过转录生成一个mRNA分子,再翻译生成一条多肽链
4.大部分基因含有内含子,因此,基因是不连续的(断裂基因,split gene)
5.基因组中不编码的区域多于编码的区域,存在大量重复序列,重复次数可达百万次以上
真核生物基因组DNA序列的类型
单拷贝序列中度重复序列高度重复序列多基因家族与假基因自私DNA
单拷贝顺序(低度重复顺序)
单拷贝顺序在单倍体基因组中只出现一次或数次,因而复性速度很慢
单拷贝顺序在基因组中占50-80 %,如人基因组中,大约有60-65%的顺序属于这一类。

单拷贝顺序中储存了巨大的遗传信息,编码各种不同功能的蛋白质
目前尚不清楚单拷贝基因的确切数字,在单拷贝顺序中只有一小部份用来编码各种蛋白质,其他部份的功能尚不清楚
中度重复顺序
中度重复序列:在基因组中重复数十至数万(<105)次的重复顺序中度重复顺序。

在基因组中所占比例在不同种属之间差异很大,一般约占10-40%,在人约为12%
大多不编码蛋白质。

其功能可能类似于高度重复顺序。

但有些中度重复顺序则是编码蛋白质或rRNA的结构基因,如HLA基因,rRNA基因,tRNA基因,组蛋白基因,免疫球蛋白基因
中度重复序列middle repeated sequence
Alu家族KpnⅠ家族Hinf家族rRNA基因多聚dT-dG家族组蛋白基因
短分散片段(short interspersed repeated segments, SINES)
重复顺序的平均长度:约为300bp
在基因组中排列方式:与平均长度约为1000 bp 的单拷贝顺序间隔排列
拷贝数:10万左右
Alu家族Hinf家族,等
长分散片段(Long interspersed repeated segments, LINES)
重复顺序的长度:大于1000bp,平均长度为3500-5000bp
在基因组中排列方式:与平均长度为13000 bp(个别长几万bp)的单拷贝顺序间隔排列
拷贝数:1万左右
KpnⅠ家族,等
中度重复顺序——Alu家族
是哺乳动物基因组中含量最丰富的一种中度重复顺序家族,平均每5kb就有这样的结构
每个单位长度中有一个限制性内切酶Alu的切点(AG↓CT)
Alu可将其切成长130和170bp的两段,因而定名为Alu序列(或Alu家族)
Alu家族每个成员的长度约300bp
在单倍体人基因组中重复达30万-50万次,约占人基因组的3-6%
Alu家族在基因组中广泛分布的原因可能是:
Alu 顺序可由RNA聚合酶转录成RNA 分子,再经反转录酶的作用形成cDNA,然后重新插入基因组所致
Alu序列两侧存在着短的重复顺序,使得Alu顺序很象转座子,因此推测Alu顺序可能也是能够移动的
Alu家族的功能是多方面的:
可能参与hnRNA的加工与成熟
与遗传重组及染色体不稳定性有关
有形成Z-DNA的能力
可能具有转录调节作用
中度重复顺序——KpnⅠ家族
KpnⅠ家族是中度重复顺序中仅次于Alu家族的第二大家族
用限制性内切酶KpnⅠ消化人类及其它灵长类动物的DNA,在电泳谱上可以看到4个不同长度的片段,分别为1.2、1.5、1.8和1.9kb,这就是KpnⅠ家族
KpnⅠ家族成员顺序比Alu 家族更长(如:人KpnⅠ顺序长6.4kb),而且更加不均一,呈散在分布
尽管不同长度类型的KpnⅠ家族(称为亚类,subfamily)之间同源性比较小,不能互相杂交,但它们的3’端有广泛的同源性
KpnⅠ家族的拷贝数约为3000—4800个,占人体基因组的1%
与散在分布的Alu家族相似,KpnⅠ家族中至少有一部份也是通过KpnⅠ顺序的RNA转录产物的cDNA重新插入到人基因组DNA中而产生的
中度重复顺序——Hinf 家族
Hinf家族:以319bp串联重复存在于人体基因组中
用限制性内切酶HinfⅠ消化人体DNA,可以分离到这一片段
Hinf 家族在单倍体基因组内约有50 —100 个拷贝,分散在不同的区域
319bp单位可以再分成两个亚单位,分别为172bp和147 bp,它们之间有70%的同源性
中度重复顺序——多聚dT-dG家族
多聚dT- dG家族:这一家族的基本单位是dT- dG双核苷酸,多个dT- dG双核苷酸串联重复在一起,分散于人体基因组中,这个家族的一个成员位于人类δ和β珠蛋白基因之间,含有17个dT- dG双核苷酸组成的串联重复顺序
在人基因组中,多聚dT- dG顺序达106拷贝,多聚dT- dG的平均长度为40bp
功能
可能是基因转变(gene conversion)或不等交换(unequal crossing-over )的识别信号
dT-dG中嘌呤和嘧啶的交替顺序有助于Z-DNA的形成,在基因调节中可能起着重要的作用
rRNA基因
人类的rRNA基因位于13,14,15,21和22号染色体的核仁组织区
每个核仁组织区平均含有50个rRNA基因的重复单位
5S rRNA 基因似乎全部位于1号染色体(1q42-43)上
每单倍体基因组约有1000个5SrRNA基因
真核生物rRNA基因的重复次数多
真核生物有四种rRNA(18S、28S、5S、5.8S rRNA)
基因组中
18S、28S和5.8S rRNA基因在同一转录单位
5S rRNA 在低等真核生物(如:酵母)中也和18S、28SrRNA在同一转录单位;而在高等生物中,5S rRNA 是单独转录的,而且其在基因组中的重复次数高于18S和28S rRNA基因
tRNA 基因
每一种aa至少含有一个tRNA
每一种tRNA的基因拷贝有几十到几百个
同种tRNA的基因常常串联在一起形成基因簇
各基因间也有间隔区,有的还含有内含子
tRNA基因的准确重复次数比较难以估计
在非洲爪蟾中约有300个拷贝,由tRNA met, tRNA phe, tRNA trp及其它tRNA基因组成的3.18kb的串联重复单位
在人体单倍基因组中约有1000-2000个tRNA基因,由50-60种tRNA基因编码,每种平均重复20-30次
组蛋白基因
组蛋白基因在各种生物体内重复的次数不一样,但都在中度重复的范围内
通常每种组蛋白的基因在同一种生物中拷贝数是相同的
不同生物中组蛋白基因在基因组中的排列不一样
组蛋白基因没有一定的排列方式,而在拷贝数高等生物基因组中(>100拷贝),大部份组蛋白基因串联重复形成基因簇
基因组中存在大量重复序列用以编码组蛋白是有其重要意义的
DNA复制时,组蛋白也要成倍增加,而且往往在DNA合成一小段后,组蛋白马上就要与其相结合,这要求在较短的时间内合成大量的组蛋白,因而需要有大量的组蛋白基因存在
人体基因组中还有几个大的基因簇,也属于中度重复序列的长分散片段。

在一个基因簇内含有几百个功能相关的基因,这些基因簇又称为超基因(Super gene),如人类主要组织相容性抗原复合体HLA和免疫球蛋白重链及轻链基因都属于超基因
超基因可能是由于基因扩增后又经过功能和结构上的轻微改变而产生的,但仍保留了原始基因的结构及功能的完整性
高度重复序列high repeated sequence
高度重复序列在基因组中重复频率高,可达百万(106)以上,因此复性速度很快
在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20 %。

种类反向重复序列卫星DNA 较复杂的重复单位组成的重复顺序
倒位(反向)重复序列reverse repeated sequence
这种重复顺序复性速度极快,即使在极稀的DNA浓度下,也能很快复性,因此又称零时复性部分,约占人基因组的5%反向重复序列由两个相同顺序的互补拷贝在同一DNA链上反向排列而成。

变性后再复性时,同一条链内的互补的拷贝可以形成链内碱基配对,形成发夹式或“+”字形结构
倒位重复(即两个互补拷贝)间可有一到几个核苷酸的间隔,也可以没有间隔没有间隔的又称回文(palimdrome)
回文结构约占所有倒位重复的三分之一
由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体DNA 分开,因而称为卫星DNA (或随体DNA)
按其浮力密度不同,人的卫星DNA可分为Ⅰ、Ⅱ、Ⅲ、Ⅳ四种
在人细胞基因组中,卫星DNA约占5-6%
小卫星DNA(minisatellite DNA) 微卫星DNA(microsatellite DNA)
在部分微生物及人和动物等基因组中,存在一些由寡核苷酸串联、重复排列而成的DNA序列,称为“数量可变的串联重复序列”(variable number of tandem repeat,VNTR)。

小卫星DNA:重复序列为6~70bp,重复次数可达几百次,总长度远比微卫星体DNA长,可达30kb,小卫星体DNA 只存在于染色体近端粒和着丝粒区,存在数目有限,有些染色体尚未发现,重复单位可发生单个碱基的变异。

微卫星DNA(microsatellite DNA):由1~6bp作核心单位,在多串联拷贝上重复而成。

存在于染色体任何部位,重复次数达10~60次,总序列长度从几十到几百bp,一般不超过300bp,存在数目很多,可达10万个,重复单位变异程度低约1/104~106
从符合遗传标记的高度多态,杂合性高,突变率低的标准来看,微卫星体DNA比小卫星体DNA更优越。

微卫星DNA是理想的遗传标记,在个体识别、亲子鉴定、基因组扫描连锁分析中发挥了巨大的作用。

较复杂的重复单位组成的重复顺序
这种重复顺序为灵长类动物所独有
用限制性内切酶HindⅢ消化非洲绿猴DNA,可以得到重复单位为172 bp的高度重复顺序,这种顺序大部份由交替变化的嘌呤和嘧啶组成。

有人把这类称为α卫星DNA, 人的α卫星DNA更为复杂,含有多顺序家族
高度重复顺序的功能
1. 调节反向序列常存在于DNA复制起点区的附近。

另外,许多反向重复序列是一些蛋白质(包括酶)与DNA的结合位点
2.参与基因表达的调控DNA的重复顺序可以转录到核内不均一RNA(hnRNA)分子中,并形成发夹结构,这对稳
定RNA分子,免遭分解有重要作用
3.参与转位作用
几乎所有转位因子的末端都包括反向重复顺序,长度由几个bp 到1400bp。

由于这种顺序可以形成回文结构,因此在转位作用中既能连接非同源的基因,又可以被参与转位的特异酶所识别
4.与进化有关
不同种属的高度重复顺序的核苷酸序列不同,具有种属特异性,但相近种属又有相似性。

如:人与非洲绿猴的α卫星DNA长度仅差1个碱基(前者为171 bp,后者为172bp),而且碱基序列有65%是相同的,这表明它们来自共同的祖先
5. 同一种属中不同个体的高度重复顺序的重复次数不一样,这可以作为每一个体的特征,即DNA指纹
6.α卫星DNA 成簇的分布在染色体着丝粒附近,可能与减数分裂时染色体配对有关,即同源染色体之间的联会
可能依赖于具有染色体专一性的特定卫星DNA顺序
真核基因组的另一特点就是存在多基因家族(multigene family)
多基因家族是指由某一祖先基因经过重复和变异所产生的一组基因
多基因家族大致可分为两类:
一类是:基因家族成簇地分布在某一条染色体上,其可同时发挥作用,合成某些蛋白质(如:组蛋白基因家族就成簇地集中在第7 号染色体长臂3 区 2 带到 3 区 6 带区域内)
另一类是:一个基因家族的不同成员成簇地分布不同染色体上,这些不同成员编码一组功能上紧密相关的蛋白质(如珠蛋白基因家族)
在多基因家族,核苷酸组成序列上与有功能的基因非常相似,但不具正常功能的基因——不能转录或转录后不能翻译原因:缺失、倒位、点突变→转录调控受阻或阅读框架改变(如氨基酸密码子变为终止密码子)。

两类假基因:。

相关文档
最新文档