真核生物基因组
(整理)第7章真核生物的遗传分析

第七章真核生物的遗传分析重点:真核生物的基因组;真菌的遗传分析;真核生物重组的分子机制。
难点:顺序四分子分析。
第一节真核生物基因组一、C值悖论二、N值悖论三、真核生物基因组DNA的复杂度一、C值悖论基因组(genome):一个物种单倍体的染色体数目及其所携带的全部基因称为该物种的基因组。
genome -- The complete set of sequences inthe genetic material of an organism. Itincludes the sequence of each chromosomeplus any DNA in organelles.C值(C-value):是指生物体的单倍体基因组所含DNA总量。
每种生物各有其相对恒定的C值,不同物种的C值之间有很大差别。
最小的C值是支原体,小于106bp;最大的C值是某些显花植物和两栖动物,可达1011bp。
C值同生物的进化有什么关系? 生物的C值,即基因组的DNA总量是不是随着生物的进化而相应地增加?一方面,随着生物结构和功能复杂程度的增加,需要的基因数量和产物种类越多,因此C值也相应地增加。
另一方面,在结构与功能相似的同一类生物中,以及亲缘关系很近的物种之间,则看不到这种规律。
因此,物种的C值及其进化复杂性之间没有严格的对应关系,这种现象称为C值悖理(C —value paradox)。
C-value paradox:the lack of direct relationshipbetween the C value and phylogenetic complex.人们对C值悖理已经提出许多解释:包括基因组的部分或完全加倍、转座、返座已加工假基因、DNA 复制滑动、不等交换和DNA扩增等。
Petrov等又提出一个解释是:各种生物基因组的大小是由于基因组中长期积累起来的过量的非编码DNA被清除的速率不同所造成的结果,即DNA丢失的速率愈慢,那么基因组DNA含量愈高。
真核生物的基因组结构与功能分析

真核生物的基因组结构与功能分析真核生物是指在生命进化过程中逐渐形成的一类生物,其基本特征之一是存在真核细胞核。
真核生物的基因组结构较为复杂,包含多个线性染色体和一些质粒。
对基因组结构的分析与理解,对于揭示其生物功能和进化机制是至关重要的。
一、真核生物的基因组结构真核生物的基因组大小较大,同一物种不同个体之间的基因组大小存在较大的差异。
基因组大小与细胞大小和复杂度之间存在着类似关联性。
人类基因组大小约为3亿个碱基对,其中蛋白编码基因仅占大约2%。
真核生物的基因组在基本结构上与细菌大相径庭,主要包括以下几个方面。
1. 染色体染色体是真核生物中最重要、最基本的遗传物质,是基因在生物体内的物质传递介质,是遗传信息的载体。
在精细结构上,真核细胞中存在很多复杂的染色体结构,如核小体、类固醇激素受体、平衡染色体等。
2. 基因组复制真核生物的基因组复制主要包括原核生物和真核生物的不同模式,其中原核生物中存在着DNA单线复制机制,而真核生物则采用DNA复制机器进行自我复制。
与原核生物不同的是,真核生物的DNA复制机器必须满足染色体的线性特性和复杂的三维结构,包括多个酶和蛋白质。
3. 基因只读基因只读是指通过读取基因组中的基因序列,进而达到生物高效功能表达和调节的过程。
真核生物基因组的序列阅读具有高度异质性,不同物种、不同个体之间存在大量的序列差异,这在一定程度上阻碍了对真核生物的功能研究。
二、真核生物的基因组功能分析真核生物的基因组分析主要包括以下几个方面。
1. 蛋白编码基因预测蛋白编码基因是真核生物基因组的重要组成部分,对真核生物的基因组进行蛋白编码基因预测,可以揭示其生物功能和进化机制。
目前,已经建立了多种基于序列、结构、相对位置等的蛋白编码基因预测算法与工具,如Glimmer、InterProScan、Pfam等。
2. 生物信息分析真核生物的基因组分析需要大量的计算资源和分析工具,这就需要借助生物信息学的手段来实现。
简述真核生物基因组的结构特点

简述真核生物基因组的结构特点
真核生物基因组的结构特点总结归纳如下:
1真核基因组庞大,一般都远大于原核生物的基因组。
2真核基因组存在大量的重复序列。
3真核基因组的大部分为非编码序列,占整个基因组序列的90%以上,该特点是真核生物与细菌和病毒之间最主要的区别。
4真核基因组的转录产物为单顺反子。
5真核基因是断裂基因,有内含子结构。
6真核基因组存在大量的顺式作用元件,包括启动子、增强子、沉默子等。
7真核基因组中存在大量的DNA多态性。
DNA多态性是指DNA序列中发生变异而导致的个体间核苷酸序列的差异,主要包括单核苷酸多态性和串联重复序列多态性。
8真核基因组具有端粒结构。
遗传学 第六章 真核生物遗传分析

1、单一序列(unique sequence)
➢ 真核生物的大多数基因在单倍体基因 组中都是单拷贝的。
➢ 单一序列所占的比例在不同生物基因 组中变化较大:
原核生物中一般只含有非重复序列;
较低等的真核生物中大部分DNA也 是单拷贝的;
动物中将近50%DNA是中度或高度 重复的;
植物和两栖类生物中单拷贝DNA序 列降低,而中度和高度重复序列增加, 如玉米的重复序列在80%以上。
(2)卫星DNA (satellite DNA)
➢ 其碱基组成不同于其他部份,可用 等密度梯度离心法将其与主体 DNA 分开,因而称为卫星DNA 或 随体DNA。
➢ 各类卫星DNA都由不同的重复序 列家族构成。
➢ 重复单位串联排列。 ➢ 卫星 DNA约占人基因组 5~6%。
卫星DNA 根据长度可将其分为3类:
➢ 基因组(genome):一个物种单倍体的染色体数 目及其所携带的全部遗传信息。
基因组DNA测序结果表明基因组中不仅包含着整 套基因的编码序列,同时还包含着大量非编码序列, 这些序列同样包含着遗传指令(genetic instruction)。 因此,基因组(应该)是整套染色体所包含的 DNA分子以及DNA分子所携带的全部遗传指令。
➢ 可用遗传学方法区分每个染色单 体。
顺序四分子分析( ordered tetrad analysis)
顺序四分子遗传分析的特殊意义在于: (1) 能从四分子不同类型出现的相对频率分析基因间的连
锁关系; (2) 能计算标记基因与着丝点之间的重组值,进行着丝粒
作图; (3) 子囊中子囊孢子严格的对称性质,表明减数分裂是一
Co = DNA concentration t1/2 = time for half reaction
第六章 真核生物的遗传分析

链孢霉的特点是它的四分体是顺序排列的。
不仅减数分裂的四个产物在子囊中仍连在 一起,而且代表减数分裂四个染色单体的子囊 孢子是直线排列的,排列的顺序跟减数分裂中 期板上染色单体的定向相同。
因此,我们用遗传学方法可以区分每个染 色单体及其基因型,而用细胞学检查方法是办 不到的。
四分体遗传分析的特殊意义:
接着在每条产囊菌丝中都发生下列过程: ①由每种交配型的一个核共同形成子囊原始细胞, ②这两个核在伸长的细胞中融合成二倍体细胞核; ③二倍体细胞核立即进行减数分裂; ④减数分裂的四个产物再进行一次有丝分裂,在一个
子囊中形成四对子囊孢子。 同时,其他菌丝形成了一个厚壁包围着产囊菌丝,构
成长颈瓶状的子囊壳。
的特异的碱基序列(单拷贝)的长度(或核苷数)之和来表示 复杂度(的大小) 。
DNA分子中无重复的核苷酸序列的最大长度.
病毒或细菌的基因组无重复序列,其基因组的复杂度与 C值(即基因组的大小)相等。
四、真核生物基因组DNA序列的复杂度
DNA复性动力学研究结果表明,真核生物基因组序列大致 可分为3种类型: 1、单拷贝序列(非重复序列):每个基因只有1-2个 拷贝。 2、中度重复序列:平均长度300bp,重复次数10-102。 3、高度重复序列:通常为6-200bp,重复次数在106。
第二次分裂分离: + - + - +--+
-++-
-+-+
每一个第二次分裂分离的子囊是供试位点与着丝点 之间发生一次交换的结果。
根据这种特殊情况,就有可能计算某一位点和着丝点之间的重组百分率。 重组百分率的标准公式如下:
A位点和着丝点之间重组 染色单体数 染色单体总数
100
交换值 (%)
重组型配子数 总配子数
真核生物基因组的特点

真核生物基因组的特点
x
一、真核生物基因组的特点
1、复杂的基因组
真核生物基因组通常非常复杂,其中含有各种各样的基因、控制序列和非编码序列。
真核生物基因组中存在的基因分布是非常分散的,而且基因的编码信息也相当复杂,所以被称为复杂的基因组。
2、高度信息密度
真核生物基因组的高度信息密度可以满足细胞机能的复杂性和
多样性。
真核生物基因组中的基因可作为特定机能的关键,其在基因组中的位置也很重要,因为基因的表达在基因组的某个特定位置受到其他一些基因的控制。
3、高基因重复率
真核生物基因组中存在一定水平的基因重复,这些重复序列的存在大大提高了基因组的复杂性和密度。
这些基因重复也可以用来检测基因定位因子及其功能。
4、特定的基因组结构
真核生物基因组的结构一般按照特定的模式进行组织,以适应生物体的特定需求。
这种结构使基因组中的基因能够更有效地执行其功能,这样就可以保证生物体的正常运行。
5、动态平衡
真核生物基因组具有非常复杂的结构,但它们之间仍然具有一定
程度的动态平衡。
这种动态平衡使得基因组能够不断地随着环境和活动变化进行改变和调节,从而保证生物体的正常运行和进化。
基因组的特点

基因组的特点真核生物基因组的特点:1.基因组较大。
真核生物的基因组由多条线形的染色体构成,每条染色体有一个线形的DNA分子,每个DNA分子有多个复制起点;2.不存在操纵子结构。
真核生物的同一个基因簇的基因,不会像原核生物的操纵子结构那样,转录到同一个mRNA上;3.存在大量的重复序列。
真核生物的基因组里存在大量重复序列,通过其重复程度可将其分成高度重复序列、中度重复序列、低度重复序列和单一序列;4.有断裂基因。
大多数真核生物为蛋白质编码的基因都含有“居间序列”,即不为多肽编码,其转录产物在mRNA前体的加工过程中被切除的成分;5.真核生物基因转录产物为单顺反子;6.功能相关基因构成各种基因家族。
原核生物基因组的特点:1.基因组较小,通常只有一个环形或线形的DNA分子;2.通常只有一个DNA复制起点;3.非编码区主要是调控序列;4.存在可移动的DNA序列;5.基因密度非常高,基因组中编码区大于非编码区;6.结构基因没有内含子,多为单拷贝,结构基因无重叠现象;7.重复序列很少,重复片段为转座子;8.有编码同工酶的等基因;9.基因组的大部分序列是用来编码蛋白质的,基因之间的间隔序列很短;10.功能相关的序列常串连在一起,由共同的调控元件调控,并转录成同一mRNA分子,可指导多种蛋白质的合成,这种结构称操纵子。
病毒基因组的特点:1.不同病毒基因组大小相差较大;2.不同病毒基因组可以是不同结构的核酸;3.除逆转录病毒外,通常为单倍体基因组;4.有的病毒基因组是连续的,有的病毒基因组分节段;5.有的基因有内含子;6.病毒基因组大部分为编码序列;7.基因重叠,即同一段DNA片段能够编码两种或两种以上的蛋白质分子,这种现象在其他生物细胞中仅见于线粒体和质粒DNA。
阐述真核生物基因组结构特点

真核生物是一类拥有真正的细胞核的生物。
它们的基因组结构与原核生物不同,具有以下几个特点:1.基因组大小不一:真核生物的基因组大小不一,从数百万到数十亿个碱基对不等。
这是因为真核生物的基因组中不仅包含编码蛋白质的基因,还包含其他功能基因,如调控基因、功能未知基因等。
2.基因组有组织结构:真核生物的基因组呈现出组织结构,分布在染色体上。
染色体是由DNA 和蛋白质构成的,在细胞核内进行染色体分离和细胞分裂过程中发挥重要作用。
3.基因组中含有多种基因:真核生物的基因组中含有多种基因,包括编码蛋白质的基因、调控基因、功能未知基因等。
这些基因在基因组中的分布不均匀,有的集中在染色体的某些区域,有的分布在整个基因组的各个部分。
4.基因组中含有冗余信息:真核生物的基因组中含有大量冗余信息,即同一基因的多个副本。
这是因为真核生物的基因组经常经历染色体重组,使得同一基因的多个副本分布在染色体的不同位置,从而增加了基因组的冗余度。
冗余信息在基因组的稳定性中起着重要作用,可以在基因组遭受损伤时提供替代品。
5.基因组中含有跨基因区:真核生物的基因组中含有跨基因区,即与编码蛋白质无关的DNA 序列。
这些序列可能具有调控基因表达的功能,也可能是遗传信息的载体。
跨基因区在基因组的结构和功能中发挥着重要作用。
总的来说,真核生物的基因组结构具有复杂性和多样性,与原核生物相比具有较大的差异。
这些差异决定了真核生物的生物学特征,如多倍体、染色体分离、细胞分裂、发育等。
研究真核生物的基因组结构,不仅有助于我们了解真核生物的生物学特征,还能为我们提供重要的基础知识,帮助我们解决生物学问题。
真核生物基因组结构

真核生物DNA 复性曲线的模 式图
复性反应分为 三P相74,图每-相16代 表不同复杂长 度的序列类型
大部分结构基因 位于非重复的 DNA序列内
第二节 断裂基因(split gene)
不连续基因(interrupted gene)
编码某一RNA的基因中有些序列并不出现在成熟 的RNA序列中,成熟RNA的序列在基因中被其他的 序列隔开。
因家族, 一般往往以基因家族的形式存在。
Alu family(Alu 家族):
•长约300bp的片段,大多数片段含有一个限制性内切 酶AluⅠ的酶切位点(AGCT); • 均匀分散在整个基因组中的非重复序列间; • 在人类基在103mol.s/L以上,复性速度极慢, 在一个基因组中只有一个拷贝或2~3个拷贝,也 称非重复序列(单一序列、单拷贝序列)。 结构基因 (蛋白质基因)大多是单拷贝序列。
人类珠蛋白基因家族---典型的基因家族
珠蛋白 血红蛋白
血红素
α2β2 不同的亚基由各自的基因编 码
血红蛋白( Hb )
发育过程中的珠蛋白的亚基组成
类α链
α2γ2
2% 97% 1%
类β链
两种亚基的编码基因分别形成两个不同的基因簇, 并存在于不同的染色体上。
每个基因簇中的基因按其在发育过程中的表达次序从 5’→3’排列在编码链上(其中包括有功能的基因和假基 因)
1)零时复性序列:
具有反向重复结构(也称回文结构),可在 同一条链内形成双链区,变性后再复性时,在链 间复性之前就已发生链内复性,因此不遵循二级 反应动力学方程。由于这种序列的复性速度非常 快,在动力学上称为零时(或瞬时)复性序列。
DNA复性后可出现发卡形结构。这种序列常 常是DNA复制酶、转录酶以及特异蛋白质的结合 部位。
真核生物基因组

② 无组织特异性。
只有鸟类、鱼类及两栖类红细胞染色体不 含 H1而带有H5。
③ 富含赖氨酸的组蛋白H5。
❖ 赖氨酸(24%) ❖ 与H1无同源性; ❖ 推测H5与染色体失活有关,其磷酸化在 失
活中可能起重要作用。
④ 肽链上氨基酸分布的不对称性
---碱性氨基酸集中分布在N端的半条链上, 易与DNA的负电荷区结合. ---大部分疏水基团都分布在C端。与其他组 蛋白、非组蛋白结合。
2、染色质(体)的结构
电镜下看到的染色质结构
“Beads on a string” structure:念珠模型,染色质的基本结构由一系列核小体相互连接而成的念珠状
From DNA to Chromosome
意义:
将近200 cm长的DNA 分子容纳于直径只有 5微的细胞核中。
影响解链,影响与蛋 白质的相互作用,调 控基因表达。
(一)高度重复序列(重复次数>106)
只存在于真核生物中,占基因组的10%-60%,由6100个碱基组成,在DNA链上串联重复高达数百万次 。
高度重复顺序又按其结构特点分为三种
(1)倒位(反向)重复序列 约占人基因组的5%。反向重复 序列由两个相同顺序的互补拷贝 在同一DNA链上反向排列而成。
常见于基因的调控区和特异蛋白结合区
Histone gene family 干扰素
Yeast 中多数基因
三 重复序列
Repetitive sequences (一)高度重复序列(重复次数:>1O6)
(二)中度重复序列(重复次数:1O2-1O5)
(三)单拷贝序列(Unique Sequence)
包括大多数编码蛋白质的结构基因和基因间隔 序列。
真核生物细胞核基因组的特点

真核生物细胞核基因组的特点
真核生物细胞核基因组与原核生物基因组相比,具有以下主要特点:
1.基因组大小更大
真核生物细胞核基因组的大小通常在几百万到几十亿碱基对之间,大大超过原核生物。
这是由于真核基因组包含大量的非编码DNA序列。
2.线性分子结构
真核生物的DNA分子以线性形式存在于细胞核内,而不是环状结构。
3.含有间隔子
真核基因的编码序列常常被非编码的内含子序列所间隔,需要剪切才能形成成熟mRNA。
而原核基因一般不含内含子。
4.基因组分为多条染色体
真核基因组通常由多条线性染色体DNA分子组成,每条染色体携带成百上千个基因。
5.含有大量重复序列
真核基因组中存在大量的高度重复和中度重复的非编码DNA序列。
6.基因表达受精细调控
真核生物基因的转录和翻译过程受多种调控机制的复杂调节,如染色质重塑、转录因子等。
7.存在序列可移动性
真核基因组中存在转座子和反转录病毒等可移动的DNA序列元件。
8.基因组进化较缓慢
由于真核生物有性生殖,其基因组进化速率较原核生物慢。
总的来说,真核生物细胞核基因组不仅规模大、结构复杂,而且基因表达和进化模式也与原核生物有所不同,反映了真核生物更高级的遗传调控水平。
真核生物基因组的特点 -回复

真核生物基因组的特点 -回复
真核生物基因组的特点有以下几个方面:
1. 基因组大小:真核生物的基因组通常比原核生物和病毒的基因组要大。
真核生物基因组的大小范围广泛,从几万个碱基对到几十亿个碱基对不等。
2. 基因密度:相比于原核生物,真核生物的基因密度较低。
真核生物的基因通常具有较多的非编码区域和间隔序列。
3. 基因副本数:真核生物的基因组中存在许多基因家族,即多个亲缘关系密切的基因。
这些基因可能会经历基因重复、基因家族扩张等过程。
4. 内含子:真核生物基因组的基因通常具有内含子,即非编码序列片段,它们在基因转录后会被剪切掉。
5. 组蛋白修饰:真核生物基因组的DNA通常被染色质蛋白修饰,以调控基因的表达。
这些修饰包括DNA甲基化、组蛋白乙酰化、甲基化等。
6. 染色体结构:真核生物的基因组通常以染色体的形式存在,染色体是DNA与蛋白质组成的复杂结构,能够保护和组织基因。
总的来说,真核生物基因组相比于原核生物基因组更为复杂。
这些特点反映了真核生物对更高级的基因调控和功能的需求。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
微卫星DNA(micro-satellite DNA)
由2~6个核苷酸长的重复序列组成,又称为简单串联重复序列 (simple tandem repeats STRs) 以(CA)n、(GT)n、(CAG)n较常见,重复次数多为15~60次,总长 度一般在400 bp以下。 存在于常染色体,除着丝粒及端粒区域外, 微卫星DNA在染色体的 其他区域均广泛均匀分布。很随机地分布在整个基因组中,而不像卫星或 小/微卫星那样串联成簇存在 微卫星DNA在基因组中的功能尚不清楚,已知其有自身特异结合蛋 白,是一种非常活跃的碱基序列, 且能直接编码蛋白质; 另外,微卫星DNA能参与遗传物质的结构改变,染色体折叠及端粒 形成,是基因重排和变异的来源, 通过改变DNA结构或与特异性蛋白质结 合而发挥其基因调控作用。 在人类基因组中,由CA重复序列构成的微卫星如5′CACACACACACA-3′大约每1万bp出现一次,占整个基因组的0.5%(总 共15Mb),而单碱基重复(即5′-AAAAAAAA-3′)占人类基因组的0.3%
Alternative splicing With a few genes, alternative splicing generates more than one mRNA from the primary transcript. Exons, or parts of exons, may be skipped.
呤(A)组成的序列替换hnRNA3′端的过程,这段序列不被翻译。
可变剪切
大部分真核基因被加工成一种类型的剪接后mRNA, 约有20%的人类基因因为可变剪接而产生两种或多种 mRNA序列 有一个人类基因已被证明,相同的原始转录物可以产 生64种不同的mRNA 外显子的相互排斥: 小鼠肌钙蛋白T基因的外显子2和3是相互排斥的,外 显子2用在平滑肌中,而外显子3用于其他所有组织中 剪接装置: 由多种细胞核内小RNA和一些蛋白组成,不同的细 胞类型中可不同
真核mRNA原始转录体(primary transcripts): 1. 简单原始转录体--经剪接仅生成一条成熟mRNA和翻译 出一条多肽链 2. 复杂原始转录体--在不同的时(不同发育阶段)空(不 同组织细胞),同一原始转录体因转录起点、剪接方式或 终止点的不同,可产生两种或多种成熟mRNA和多肽链。 例如
一
真核生物基因结构
1 启动子元件 开放阅读框标志:
由于大量内含子的存在,真核生物中没有发现原核生物具有的 显著长度的开放阅读框标志。
RNA聚合酶种类:
与原核生物只使用一种由多种蛋白质聚合而成的RNA聚合酶不 同,真核生物至少使用由8~12种蛋白质组成的3种不同类型的RNA 聚合酶。
启动子元件多样性:
二 重复序列
重复序列是指多拷贝的相同或近似序列的 DNA片段。 重复序列一般可以分为两类:
高度重复序列和中度重复序列 串行重复DNA和分散在整个基因组中的重复片段
1 高度重复序列:卫星DNA、小/微卫星
重复频度>105。 在真核生物基因组中,约有45%~60%的 DNA中G:C碱基对含量较高,相对浮力密度大, 将DNA打碎后,进行密度梯度超离心分离,可见 一主峰和1~2个小峰,这种小峰被看成是主峰的 卫星,称为卫星DNA,它是多种短重复序列的混 合物。 根据卫星DNA的长度,又可分成3种。
不同生Байду номын сангаас基因组内含子的特点:
在简单的真核基因组中内含子一般出现得较少(如酵 母基因组6000个基因中总共只有239个内含子 95%的人类基因至少有一个内含子,某些单个基因 中就具有100个或更多内含子
内含子在给定基因中的位置具有进化保守性,在同 源基因的序列比对中内含子经常出现在相同的位置。
3 基因的转录
RNA聚合酶Ⅱ转录物在加工前称为hnRNA(异质RNA), 通过加帽(capping)、剪接和多聚腺苷酸化转化成适合 核糖体翻译的mRNA。 加帽(capping)--是指所有发生在hnRNA5′末端的化学改变
(包括甲基化作用)
剪接(splicing)--从hnRNA中大批地精确切除大片段的过程 多聚腺酸化(polyadenylation)--指用一段大约由250个腺嘌
内含子和外显子的长度:
内含子至少长60bp; 在脊椎动物中外显子长度的变化范围也很广,于100- 2000bp之间,常见的长约450bp。
Eukaryotic Gene
真核基因的内含子/外显子结构和对应的hmRNA转录物经过加工后的mRNA: (a)显示了与酵母内含子的5′和3′剪接位点相关联的保守序列。每个核苷酸旁的 下标数字表示该核苷酸在所有已知酵母基因内含子中的出现频率。 (b)剪接体通过配对识别剪接位点,从而产生mRNA以供核糖体翻译之用。
卫星DNA(satellite DNA): 其重复序列长度在5 bp ~200 bp,串联排列,通常存在 着几百万个拷贝,总长度最长可达100 Mb, 它们主要存在于异染色体以及中心粒和端粒附近,通常 不转录。
小卫星DNA(mini-satellite DNA): 重复序列长度在15~70 bp之间,串联排列,总长度在 0.5 kb ~30 kb 主要分布于常染色体,在人群中有高度的多态性(也即 有高度的特异性或拷贝的多态性)。
非常复杂
简单
2 断裂基因--内含子和外显子
内含子(intron):已发现真核细胞中至少有8种明显不同的内
含子,但只有一种遵循GU-AG规则(GU-AG rule)的内含子与真核细胞 蛋白编码基因有关系。 GU-AG规则:所有内含子序列5’端起始的两个核苷酸总是5’-GU-3’,而 3’端的最后两个碱基总是5’-AG-3’ 。
果蝇肌球蛋白重链转录体,在不同发育阶段有三种不同表达产物。 相同的降钙素基因相关肽(calcitonin gene related peptide)原始转 录体,在甲状腺、脑等不同组织细胞内,因剪接方式不同使其表达产 物不同。 不同B细胞的免疫球蛋白原始转录体都是相同的
4 转录后加工--加帽、剪接和加尾:
Alternative Splicing
Basic Mechanism
Repressor stops splicing that would otherwise occur Repressor
Activator initiates splicing that otherwise wouldn’t occur Activator
每种真核生物RNA聚合酶都能识别一套不同的启动子,并转 录不同类型的基因。
3种真核生物RNA聚合酶
RNA 聚合酶
RNA聚 合酶Ⅰ RNA聚 合酶Ⅱ RNA聚 合酶Ⅲ
启动子 位置
-45至 +20 上游远端 至-25 +50至 +100
启动子的 复杂性
简单
所转录 的基因
核糖体 RNA 蛋白质 编码基因 tRNA和 其他小RNA