第三章 真核生物基因组
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
原核生物的多顺反子
5 PPP
3
真核生物的单顺反子
5 mG - PPP
蛋白质
3
蛋白质
非编码序列
核蛋白体结合位点
编码序列
起始密码子
终止密码子
(二)断裂基因
细胞内的结构基因并非全由编码序列 组成,而是在编码序列中插入了非编 码序列。
外显子(exon):断裂基因中的编码序列。 内含子(intron):非编码序列。
• 第一节 真核生物染色体基因组 • 第二节 染色体外的基因组- 线粒体 • 第三节 人类基因组
第一节 真核生物染色体基因组
• 一、真核生物染色体基因组的一般特征 • 二、单拷贝基因 • 三、重复序列 • 四、基因家族 • 五、端粒和端粒酶 • 六、基因移动
一、真核生物基因组的一般特征
(一)基因组庞大 :基因可达109bp (二)线状双链DNA和二倍体:染色体都是成对出现。 (三)非编码区远多于编码区:仅1.5%的序列被转录
1.rRNA基因 :rRNA常集中成簇存在基因组中, 28s、18s和5.8s串联排列,300个拷贝,5s单独存 在,有2000个拷贝。
2.tRNA基因 :每种氨基酸都有一种或多种tRNA, 而每一种tRNA基因也有几十~几百个拷贝。同一 种基因常串联在一起,排列成基因簇。
3.Alu家族 :长度约300bp,富含GC。具有一个 Alu I酶切位点(AGCT),因而得名。分布非常广, 重复次数100万,约10%基因组。
成mRNA用于指导蛋白质的合成。 • 仅1.5%的序列被转录表达。 • 绝大部分为非编码区
(四)断裂基因(split gene):
真核生物结构基因,由若干个编码区和非 编码区互相间隔开但又连续镶嵌而成,去除非 编码区再连接后,可翻译出由连续氨基酸组成 的完整蛋白质,这些基因称为断裂基因。
A
B
编码区 A、B、C、D
表达。 (四)断裂基因(split gene):基因不连续,外显子
和内含子并存。 (五)大量重复序列存在 :具有高度,中度重复序列
(一)基因组庞大 :
• 真核生生物的基因组一般比较庞大。 • 大肠杆菌:4.6 ×106bp碱基 • 酵 母:1.2 ×107bp碱基 • 人 类:3×109bp碱基组成
• 参与转位作用,几乎所有转位因子的末端都包括 反向重复顺序,长度由几个bp到1000bp。由于 这种顺序可以形成回文结构,因此在转位作用中 即能连接非同源的基因,又可以被参与转位的特 异酶所识别。
• 与进化有关,不同种属的高度重复顺 序的核苷酸序列不同,具有种属特异 性,但相近种属又有相似性。
• 同一种属中不同个体的高度重复顺序 的重复次数不一样,这可以作为每一 个体的特征,即DNA指纹。
C
D
非编码区
(五)大量重复序列存在 :
• 具有高度,中度重复序列 • 重复次数可达百万次以上
二、单拷贝基因
单拷贝基因:基因组中仅出现一次的基因 。 多为编码蛋白质的基因,通常复杂 具有以下特点:单顺反子、断裂基因。
(一)单顺反子
1.转录后直接形成成熟mRNA翻译出一条多
肽链。
2.hnRNA不同时空转录起点、剪接方式或终 止点可不同,成熟为二种以上的mRNA和 多肽链。
❖物理图谱(physical map) 指标明一些界标(已定位的DNA序列,如限制 酶的切点、CpG序列、基因等)在DNA上的位 置,确定遗传标志之间物理距离的图谱。
转录图谱(transcriptional map) 是具有表达能力,利用EST作为标记所构建的分子 遗传图谱。
• 在不同基因位点上的微卫星DNA的重复序 列可以不同,也可以相同。
3、较复杂的重复单位组成的重复顺序
• 这种重复顺序为灵长类所独有。 用限制性内切酶HindⅢ消化非洲 绿猴DNA,可以得到重复单位为 172bp的高度重复顺序,这种顺序 大部份由交替变化的嘌呤和嘧啶组 成。有人把这类称为α卫星DNA。 而人的α卫星DNA更为复杂。
五、端粒和端粒酶
端粒(telomere)
真核染色体末端特有的结构,是一种特殊的核蛋白结构, 由 “TTAGGG”重复序列和端粒结合蛋白构成,具有保护染色 体末端和保证复制正常进行的作用,与细胞周期和衰老密切相 关。
端粒酶(telomerase)
一种特殊的逆转录酶,由蛋白质和RNA两部分组成,它以 自身的RNA为模板,可合成端粒重复序列而延长端粒。
分类:
• 按其结构特点分为三类: • 1、反向重复序列 • 2、卫星DNA • 3、较复杂的重复单位组成的重复顺序
1、反向重复序列
• 这种重复顺序复性速度极快,即使在极稀 的DNA浓度下,也能很快复性
• 约占人基因组的5%。 • 反向重复序列由两个相同顺序的互补拷贝
在同一DNA链上反向排列而成。变性后再 复性时,同一条链内的互补的拷贝可以形 成链内碱基配对,形成发夹式或“+”字形结 构。 • 它们多数散布,非群集于基因组中。
(二)单核苷酸的多态性( single nucleotide polymorphism, SNP)
主要用途: ①疾病的连锁分析与基因的定位 ②指导用药和药物设计
③用于进化和种群多样性的研究
三、人类基因组研究
(一)1990年,“人类基因组计划(human genome project,HGP)”启动。
真核生物rRNA基因的加工
四、基因家族(gene family)
• (一)基因家族:一组功能相似且核苷酸 序列具有同源性的基因,在进化过程中从 一个祖先基因经重复和突变演变而来的。
• (二)假基因(pseudogene):与具正 常功能的基因序列相似,但无转录功能或 转录产物无功能的基因。
组蛋白基因家族
线Hale Waihona Puke Baidu体DNA
二、线粒体DNA的遗传特性
(一)线粒体DNA(mtDNA) :母性遗传的核外遗传物质 (二)与核DNA区别:
1、非孟德尔的母系遗传 2、高突变率 3、异质性和复制分离 4、阈值效应 5、半自主复制与协同作用
第三节 人类基因组
一、人类基因组概貌 二、人类基因组的多态性及在分子诊断中的应用 三、人类基因组研究
• 不同基因内含子长度和数目不等 • 人胰岛素:1个内含子 • 人胶原基因:52个内含子 • 外显子与所编码的蛋白质功能结构
域一致
• 内含子有共同特征:GT/AG规则
三、重复序列
• 定义:指多拷贝的相同或近似序列 的DNA片段。
• 分类: 高度重复序列、中度重复序列
(一)高度重复序列 :
• 一般由较短的序列(10-300bp) 组成,常集中在一起串联排列,重 复频度>105 ,占基因组10~60%。
100Mb
异染色质,中心粒,端 粒附近,通常不转录
0.5~30kb 常染色质 高度多态性
微卫星DNA 2~6bp
400bp 常染色质
微卫星DNA
重复单位序列最短,只有2~6bp,串联成 簇,重复次数15-60次,长度400bp以下, 又称为短串联重复序列(Short Tandem Repeat STR)。 广泛分布于基因组中。 其中富含A-T碱基 对。 以(CA)n、 (GT)n (CAG)n
(二)1994年,我国HGP启动,参与1%工作。 (三)2001年2月12日,美国Celera公司与人类基因组计划分别
在《科学》和《自然》杂志上公布了人类基因组精细图谱及 其初步分析结果。 (四)2003年4月14日中、美、日、德、法、英等6国科学家宣 布人类基因组序列图绘制成功。
人类基因组作图
❖遗传图谱(genetic map) 指通过计算连锁遗传标志之间的重组频率,得 到基因线性排列从而确定相对距离的图谱,又 称连锁图(linkage map)。
高度重复序列的功能
• 参与复制水平的调节反向序列常存在于DNA复制 起点区的附近。另外,许多反向重复序列是一些 蛋白质(包括酶)和DNA的结合位点。
• 参与基因表达的调控DNA的重复顺序可以转录到 核内不均一RNA分子中,而有些反向重复顺序可 以形成发夹结构,这对稳定RNA分子,免遭分解 有重要作用。
一、人类基因组概貌
基 因 甲 基 化 : DNA 甲 基 化是甲基转移酶将胞嘧啶转变 为5-甲基胞嘧啶,DNA甲基化 后表达下调。
二、人类基因组的多态性及在分子诊断 中的应用
(一)短串联重复序列 ( short tandem repeat , STR) 主要用途: ①人类基因遗传图谱的制作。 ②目的基因筛选和基因诊断。 ③法医学个体识别和亲权鉴定。
端粒酶的催 化延长作用
爬 行 模 型
DNA聚合酶复制子链 进一步加工
六、基因移动
基因在染色体上不是固定不变的,可以从 某一处转移到另一处,称为基因移动。
发生移动的基因称为可移动基因。
以转座子形式运动
第二节 染色体外的基因组-线粒体
线粒体DNA(mitochondria,mtDNA)全长为 16.5kb,环状双链分子,不含内含子。共有37个编 码 基 因 , 2 个 rRNA ( 12sRNA 和 16sRNA ) 和 22 个 tRNA(tRNAser和tRNAleu各2个基因),另有13个 为多肽编码基因。
• 在人细胞组中卫星DNA约 占5-6%。
卫星DNA分类:
1.卫星DNA(satellite DNA) 2.小卫星DNA(mini-satellite
DNA) 3.微卫星DNA(micro-satellite
DNA)
高度重复序列比较
重复长度 总长度
定位
卫星DNA 5~100bp 小卫星DNA 15~70bp
第三章 真核生物基因组
临床生化教研室
• 真核生物由真核细胞构成的生物。 包括原生生物界、真菌界、植物界 和动物界。
• 定义 :真核生物是所有单细胞或 多细胞的、其细胞具有细胞核的生 物的总称,它包括所有动物、植物、 真菌和其他具有由膜包裹着的复杂 亚细胞结构的生物。
• 真核生物与原核生物的根本性 区别是前者的细胞内含有细胞 核,因此以真核来命名这一类 细胞。许多真核细胞中还含有 其它细胞器,如线粒体、叶绿 体、高尔基体等。
5’ GGAATCGATCTTAAGATCGATTCC 3’ 3’ CCTTAGCTAGAATTCTAGCTAAGG 5’
2、卫星DNA
• 卫星DNA(satelliteDNA)是 另一类高度重复序列,这 类重复顺序的重复单位一 般由2-100bp组成,成串排 列。
• 由于这类序列的碱基组成 不同于其他部份,可用等 密度梯度离心法将其与主 体DNA分开,因而称为卫 星DNA或随体DNA。
(二)线状双链DNA和二倍体:
• 线状双链DNA • 与蛋白结合形成染色体 • 染色体:数量,多条 基本都是成对出现。 • 特定的一组基因
(三)非编码区远多于编码区:
• 人 类:3×109bp碱基组成
• 按1000个碱基编码一种蛋白质计,理论上可有 300万个基因。
• 但实际上,人细胞中所含基因总数大概是?万个。 • 说明在人细胞基因组中有许多DNA序列并不转录
• α卫星DNA成簇的分布在染色体着丝粒 附近,可能与染色体减数分裂时染色 体配对有关,即同源染色体之间的联 会可能依赖于具有染色体专一性的特 定卫星DNA顺序。
(二)中度重复序列 主要由较大的片段(100-几千个bp )串联重复组 成,分散在整个基因组中,少数在基因中成串排列 在一个区域,大多数与单拷贝基因间隔排列 分为短分散片段和长分散片段: 短分散片段:300bp 拷贝数10万 长分散片段:1000bp 拷贝数1万 其表达产物常是细胞大量需要的,如rRNA、tRNA 等。
特点:
• 种类多、分布广,在人群中世代相传。在 基因组中平均50kb就有一个重复序列,突 变率低(< 0.04%)。
• 在人群中高度多态,其多态信息含量容量 超过70%。其多态性表现为正常人群的不 同个体某一基因位点重复序列的重复次数 可不一样,同一个体的两个同源染色体上 重复次数也可以不一样,即微卫星DNA拷 贝数在人群中是可变的。
• 具有遗传连锁不平衡现象。
• 均可被转录,有些编码蛋白质,而另一些 则位于非转译区的5′端和3′端不编码蛋白质。
• 属于不稳定的DNA序列,其数目在某些遗 传病中有扩大现象,而这种扩增并非是减 数分裂的重组造成,扩大可发生在减数分 裂过程中,由一代传递给另一代,也可发 生在有丝分裂中,导致嵌合体形成。与成 熟人体细胞比较,微卫星DNA在胚胎时期 有丝分裂很不稳定。