1B基因组和染色体
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
动粒
着丝粒
二.端粒(telomere) 端粒( )
表10-3 几种生物端粒的重复单位
生物 四膜虫 尖毛虫 鞭毛虫 酵母
拟南芥菜 泥毛霉菌
物种
Tetrahymena,Paramecium Stylonchia Oxytricha,Euplotes Trypanosoma,Leishmania Saccharomyces Arabidopsis Phyparum,Dictyostelium Homo Sapiens
AluI
30bp Alu序列
五. 高度重复顺序
卫星DNA (satellite DNA) 隐蔽卫星DNA(cryptic satellite) 自私 DNA(selfish DNA) 伊甸园 DNA (Garden of Eden DNA) 小卫星 (minisatellite ) 重复序列可变数(variable number tandem repeat VNTRs) DNA指纹(DNA fingerprints)
第二类大约长为40nm。有三个组成部分: 中央部分,含88 kb,AT占93%。 侧翼元件有80% AT的保守序列。特殊的蛋 白结合在侧翼元件上并形成一个复合体, 此复合体使染色体附着到纺锤体上。 较大的染色体有区域化的(regional)着丝 粒,这种着丝粒可同时结合30到40根微管。 例如,果蝇着丝粒含420 kb DNA,由简单 重复的DNA片段组成,此是着丝粒区域上 组成特殊染色体所需要的。此区亦为富含 AT的片段,可起结合微管的作用。
端粒的功能
保持染色体的稳定 使线形DNA的顺利复制 影响染色体的行为 可能控制细胞的寿命 和核骨架的组成有关
1978年Blanckburn E.B.(Univ. of California) 研究四膜虫的rDNA时发现染色体末端有6个 nt的串联重复 (5ˊ— G4T2—3 ˊ)n 重复几十次,总长度为:370-520bp 简单端粒顺序(simple telomeric sequence ) 端粒结合顺序(telomere-associated seqence)
三.
染色体的高级结构
10nm的核丝 核丝(nucleofilament) 核丝 30nm 螺旋管 螺旋管(solenoid) 放射环模型(radeal loop model) 螺旋环模(MarsdenLaemmli,1979,Paulson.,1982) 放射环和螺旋环共存模型(Rattner和Lin,1985) 袢环模型(J.Painta和D.Coffey,1984) 螺旋折叠(helically folded)(Boy de Tour,Ey和 Laemmli U.K.1988)等模型 侧环模型
人类VNTRs的第一个探针
1985年由Alec Jeffries制备 在肌红蛋白基因的第一个内含子中分离 出132bp的重复顺序 内含4个长33bp的重复单位 内有13bp为核心顺序 (GGAGGTGGGCAGG)
L1 家族
长6500bp左右 称为长的分散因子(long interspersed elements, LINEs) 在基因组中约6万个拷贝 由RNA多聚酶II转录的。 属于一种转座因子
微卫星DNA 微卫星DNA(microsatellite DNA) DNA
另一类分散的重复DNA是1~4核苷酸重复序列构 成的15~100个重复单位,这一类 重复DNA称为微卫星DNA 微卫星DNA 微卫星DNA(microsatellite DNA), 也称为简单序列的重复 简单序列的重复(simple sequence 简单序列的重复 repeats,SSRs SSRs)。虽然一般不包括VNTR,但微卫 SSRs 星实际上是由可变数目的2~4核苷酸重复序列组 成的。在人类和其他生物的基因组作图中,这种 类型的重复序列可提供密集排列的分子标记。
小卫星(minisatellite) 小卫星
或同向重复序列可变数 同向重复序列可变数(variable number 同向重复序列可变数 tandem repeat ,VNTRs)。这是一种特 殊的串联重复,多存在于染色体的端粒附 近,在不同个体和基因组的不同位点上数 目都不同。在人类中VNTRs位点是1-5kb 的序列,此序列由单位长15-100nt的重复 序列组成。
Telomerase: Replication of Chromosome Termini
Telomere sequences
Replication origins (ARS)
Centromere sequences
Telomere sequences
共同特点:
每一个端粒都含有一系列的短的正向重复顺序。 Cn(A/T)m ,其中n>1,而m=1~4。 在端粒区域中有一种特殊的不连续排列,产生单 链断裂的形式,这种结构并不能被连接酶将缺口 封闭起来,而在正常情况下连接酶是可以作用 DNA链上的缺刻 缺刻(nick)。这表明什麽? 缺刻 提纯的天然的端粒区可直接用E.Coli DNA多聚酶I 进行缺口平移(nick translation) 。表明什麽? 在端粒区的最末端可能带有3`-OH的单链末端回 折成了发夹回(hairpin)结构。如何用实验来证实? 端粒的双链部分中含有T2G4 的顺序在3`末端,排 列方向是朝向染色体的中心部位。
非编码顺序 ( > 90%)
中度/高度 重复顺序 (20~30%) 单一/低度 重复顺序 (70~80%)
5'前导顺序,3'拖尾顺序 因突变而失去功能 假基因 加工假基因 基因片断(丢失了 5'和 3'端顺序,不能表达的基因) 短分散顺序(SINEs)―如 Alu 顺序 分散的重复顺序 (40%) 长分散顺序(LINEs) 卫星 DNA(长 100~5000kb) 成簇的重复顺序 小卫星 DNA(长 100bp~20kb,VNTRs) (60%) 微卫星 DNA(4bp,CA 重复)
八聚体 染色质小体 (~166bp) 核小体 (~200bp) DNA 连接区 (常为 32~34bp) 图 10-10 核小体的组成 DNA H1
H32-H42 2×H2A-H2B 146bp 166bp 20bp 核心颗粒
30nm 螺旋管
核小 体的 结构
第三节 着丝粒和端粒
一. 着丝粒(centromere) 从结构上看,着丝粒有两种主要的类型: (1)一种在染色体DNA上占非常小的区域 (~200 bp);如酵母的CEN (2)另一种则占有较大的区域(40 kb ~ 5 Mb)。 。 如果蝇,拟南芥
在果蝇第2号染色体的着丝粒内有4个具转录活性 的基因已被作图。 拟南芥着丝粒的长度变化范围在1.4 ~1.9Mb,约 占染色体DNA的7%。在全部的5条染色体上,着 丝粒区内有180bp的序列可重复上百次。 在着丝粒区富含与反转录转座子(retroposons) 相似的序列。着丝粒内的交换明显地被抑制。 拟南芥的着丝粒中有大约200个基因,但其中许多 基因是没有活性的。然而至少有50个基因具有转 录活性。
1987年Henderso证明端粒末端为发 夹结构
提纯的天然的端粒区可直接用E. coli DNA 多 聚 酶 I 进 行 缺 口 平 移 (nick translation) 。表明有nick or nick gap存在。 gap 这种缺口不能被连接酶将封闭, 而在正常情况下连接酶是可以作 用DNA链上的缺刻 缺刻(nick)。 缺刻
书 临 汉 字 翰 林 书
画 上 荷 花 和 尚 画
三. 轻度重复顺序和中度重复顺序
轻度重复顺序 在基因组中含有2-10拷贝 , 酵母tRNA基因、人和小鼠的珠蛋白基因等。 中度重复顺序 长约300bp 基因组中约有10-几千个拷贝的顺序 如rRNA和tRNA基因 tRNA基因一般都分布于基因组中,而 rRNA常集 中分布于核仁形成区。
最后延伸的3′ 端再回折,以 G·G 配 对 的 方 式形成发夹结 构或通过四链 DNA形成拓扑 结构
图
端 粒 的 3′ 单 链(TTAGGG) n末端取代了 端粒上游区域 中一个相同的 序列时形成了 t-环。
第四节 染色体的核型和分带
一. 二.
核型(Karyotype) 核型 染色体带型 G带 G带 C带 带 Q带 带 T带 带 N带 带 R带 带
DNA来源
重复单位(5'-3')
大核 大核
微染色体
CCCCAA CCCCAAAA CCCTA C2-3A(CA)1-3 C3TA3 CCCTA C3TA2
染色体 染色体 rDNA 染色体
人
1938年Muller 用X射线来处理果蝇进行诱变,发 现在染色体的末端很少发生缺失和倒位的现象, 于是推测在染色体的两端一定存在着一种特殊的 结构,这种结构对于染色体的稳定性是至关重要 的,并将它称为端粒(telomere)。 同年McClintock通过玉米染色体的断裂端容易融 合而正常的染色体彼此间不发生连接的现象,推 测染色体末端有端粒的存在。
着丝粒
基因
LINE
基因
VNTR 基 因 SINEs
基因
VNTR
LINE
rDNA
核仁形成区
图 10- 37(a)真 核 生 物 染 色 体 上 的 各 种 重 复 顺 序 和 结 构 元 件
基因和 基因相 关顺序 编码顺序 (20-30%) (< 10%) 人类基因组 (3×109bp) 基因以 外非编 码顺序 (70-80%)
成体 β 2min β1 β ε
βH
kb 60
50 图 10-32
40
30
20
10
0
脊椎动物中的β-珠蛋白基因簇和假基因
四 Alu家族 家族
长约300bp;Alu顺序也称为短的分散因子(short interspersed elements, SINEs)。 由RNA多聚酶III转录的。 在基因组中30 万个拷贝; 在170bp处有一AluI 的酶切位点; 由两个130bp的串联重复顺序组成; 在二聚体的右半部有31bp插入序列,此插入 顺序来自7SL RNA。 Alu顺序有何应用价值?
rDNA分子的末端不能进行末端标记, 推测在端粒区的最末端可能有了发夹回 (hairpin)结构。 1987年E.Henderson等用非变性聚丙稀酰 胺凝胶电泳,吸热变性分析以及核磁共 振光谱分析了端粒的顶端结构,证实了 端粒顶端回折形成发夹结构,而这一结 构并不是由通常的Watson-crick配对, 而是通过G-G配对而形成。
人类 染色 体的 C带
第五节
单一顺序和重复顺序
一. 单一顺序 (Unique sequence ) 二. 重复顺序 短片段的重复顺序可分为三种类型: (1)正向重复 正向重复(direct repeats)又叫顺向重复; 正向重复 反向重复(inverted repeats) ; (2)反向重复 反向重复 (3)回文顺序 (Palindromic sequence) 回文顺序 5‘ GTGAGCTCAC 3’ 3’ CACTCGAGTG 5’
H3
H4
H2A
H2B 4800bp
H2B
H2A
H4 9000bp
图例:
图 10-31 组蛋白基因簇的重复单位 基因; 间隔区; 转录方向
ζ
ψζψ ψ α α θ α α 2 1ቤተ መጻሕፍቲ ባይዱ
ε
Gγ Aγ
ψβ
δ β
图 10-30 人 类 血 红 蛋 白 的 α 和β 基 因 簇
晚期胚 ψ 小鼠
早期胚 β ho β h1 ψh2 ψh3 β4 兔 ρ 鸡 β 1maj β3 ψβ
四种酵母的CEN区也存在着关键的顺序信息,即保 守顺序。它们的核心着丝粒区都由三个功能区组 成。 由三个功能区组成 中部的元件(II)由80~90bp组成,A+T含量高, >90%; 左侧的元件(I)含有PuTCACPuTG顺序(Pu是嘌呤), 右侧的元件(III)是由26bp组成的保守区,此区也 是A-T丰富区。 所有真核生物的着丝粒功能都相同,但其DNA却具 有种的特异性。
NTS
NTS
TS
18s
TS 5.8s TS
28s
TS
图10.29 非洲爪蟾rRNA 基因的串联重复排列 TS:可转录的间隔(spacer)顺序 NTS:不可转录的间隔顺序
H1 海胆(R) 海胆(S) 海胆(L) H1 果蝇 H1 蝾螈 H3
H4
H2B
H3
H2A 6000bp 6540bp 7240bp