【精品】第三章基因与基因组

合集下载

第三章 基因组和基因

第三章 基因组和基因

第三章基因组和基因第一节基因组与C值矛盾一、基因组一个生物物种所有染色体的总和(细胞遗传学)所有核酸分子的总和(分子遗传学)所有基因的总和(经典遗传学)指导一个物种的结构与功能的所有遗传信息的总和(现代分子生物学理论)二、C值一个单倍体基因组的DNA含量。

单位为dolton或uug或bp1 uug = 1 pg = 6.1×1011dolton对每一个物种,C值是恒定的。

三、C值矛盾一般而言,随着生物的进化,生物体的结构与功能越复杂,其C值也越大。

但真核生物中DNA含量并不与生物的复杂性相一致,这种反常现象称为C值矛盾。

C值矛盾表现在:1、结构、功能相似的同一类生物中,甚至亲缘关系十分接近的物种之间,它们的C值可相差10倍乃至上千倍。

如:豌豆的C值为14pg,而蚕豆只有2pg。

两栖类C值的变动范围很大,为109-1011bp。

2、较低等生物的C值大于较高等生物的C值如:两栖动物(1011bp)>哺乳动物(109bp)3、真核生物的C值之大,远远超过其基因编码所需将内含子算上,哺乳动物的一个基因长约5-8Kb,少数10Kb,则哺乳动物应有40-60万个基因。

目前研究表明,实际基因数估计不会超过这个数值的10%(3-4万)。

有些基因的序列不编码蛋白质,则基因组中只含有2%-3%的DNA序列用于编码蛋白质。

余下那么多DNA序列具何功能?难道不被表达的DNA序列都是调控基因吗?目前还无法圆满解释。

第二节原核生物基因组一、原核生物基因组的特点1、不具备明显的核结构,只有类核,即DNA相对集中的区域。

2、基因组小,一般只有一个染色体,大多为双链环状,少数为单链或线型。

E.coli DNA分子量为2.4×109,相当于4.2×106 bp,含3000-4000个基因;噬菌体DNA分子长48502bp,含46个基因;ΦX174 DNA分子长5386bp,含有11个基因;SV40病毒DNA分子量为3×106bp,含5个基因。

(整理)第三章基因与基因组

(整理)第三章基因与基因组

第三章基因与基因组第一节基因概念的历史演变第二节DNA与基因第三节真核生物的割裂基因第四节基因大小第五节重叠基因第六节真核生物的基因组第七节真核生物DNA序列组织第八节细胞器基因组第九节基因鉴定第十节人类基因组计划第三章基因与基因组1 基因(gene)的概念基因是遗传的功能单位,DNA分子中不同排列顺序的DNA片段构成特定的功能单位;含有合成有功能的蛋白质多肽链或RNA所必需的全部核苷酸序列。

广义地说,基因是有功能的DNA片段。

第一节基因概念的历史演变2 基因概念的历史演变:(1)Mendel提出基因的存在(2)Morgan证实基因在染色体上(3)“一个基因一个酶”修正为“一个基因一个多肽链”“基因”一词的创立: 1909年,丹麦遗传学家约翰逊“基因”(gene)。

Gregor MendelThomas Hunt Morgan3 基因概念的理论基础3.1 一个基因一个酶1941年G W Beadle 和E L Tatum研究证实红色链孢霉各种突变体的异常代谢是一种酶的缺陷,产生这种酶缺陷的原因是单个基因的突变。

3.2 一个基因一条多肽链本世纪50年代,Yanofsky有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码,因而又提出了“一个基因一条多肽链”的假设。

3.3 基因的化学本质是DNA(有时是RNA)1944年,O T Avery 证实了DNA是遗传物质。

有些病毒只含有RNA。

1953年沃森和克里克建立DNA分子的双螺旋结构模型。

3.4 基因顺反子(Cistron)的概念1955年,美国本兹尔(Benzer)提出顺反子的概念:是指编码一个蛋白质的全部组成所需信息的最短片段,即一个基因。

基因仅是一个功能单位,基因内部的碱基对才是重组单位和突变单位。

一对同源染色体上两突变(a和b)在同一染色体上时,称为顺式构型,在两个染色体上时,为反式构型;顺反互补测验(cis-trans test):比较顺式和反式构型个体的表型来判断两个突变是否发生在一个基因(顺反子)内的测验。

第三章--基因与基因组的结构PPT课件

第三章--基因与基因组的结构PPT课件

-
4
③近20年来,由于重组DNA技术的完善和应 用,人们已经改变了从表型到基因型的传统 研究基因的途径,而能够直接从克隆目的基 因出发,研究基因的功能及其与表型之间的 关系,使基因的研究进入了反向生物学阶段。
-
5
• 反向生物学:指利用重组DNA技术和离体 定向诱变的方法研究已知结构的基因相应的 功能,在体外使基因突变,再导入体内,检 测突变的遗传效应即表型的过程。
• 例如,对于大肠杆菌和其他细菌,用三个小写
字母表示一个操纵子,接着的大写字母表示不
同基因座,lac 操纵子的基因座:lacZ,lacY, lacA;其表达产物蛋白质则是lacZ,lacY,
lacA。
-
37
• 3.质粒和其他染色体外成分的命名 • 自然产生的质粒,用三个正体字母表示,第—
个字母大写,例如:ColEⅠ;
血破裂而使血红蛋白计数减少,造成贫血。
• 其本质是其血红蛋白的β-链与正常野生型
β-链之间的第6位氨基酸,由Val取代了 Glu所致。
-
32
• 这种贫血病是由基因突变造成的一种分子病,
除溶血后发生贫血外,还会堵塞血管形成栓塞, 从而伤及多种器官。
• 它的纯合子(通过单倍体形成的纯系双倍体)患
者在童年就夭折。
-
40
• 6.线虫基因的命名
• 用三个小写斜体字母表示突变表型,如存
在不止一个基因座,则在连字符后用数字
表示,如基因unc-86,ced-9;蛋白UNC-
86;CED-9。
-
41
• 7.植物基因的命名
• 多数用1~3个小写英文斜体字母表示。
-
42
• 8.脊椎动物基因的命名

03-1基因与基因组

03-1基因与基因组
C值(C—value) C值反常现象(C—value paradox) 序列组成 3.2.3 染色质与核小体 3.2.4 真核生物基因组特点
6
3.2.1 蛋白质- 组蛋白



















进化上极端保守性 保守程度:H1 H2A、H2B H3、H4 无组织特异性 肽链氨基酸分布的不对称性 组蛋白的可修饰性
29
串联重复序列(tandem repetitive sequence)



















30
串联重复序列(tandem repetitive sequence)



















31
串联重复序列(tandem repetitive sequence)

36
散在重复序列(dispersed repetitive
sequence)



















Line (long interspersed nuclear elements, LINE) :
重复长度大于1000bp,在基因组 中约 20000-25000个拷贝。

分子生物学课件 第3章 基因与基因组

分子生物学课件 第3章 基因与基因组
最初基因组被定义为一个单倍体细胞中的全套染色体,现 代分子生物学和遗传学则将基因组定义为一个生物体中的 所有遗传信息,由DNA或者RNA编码,包括所有的基因和 非编码序列。
实际应用中“基因组”这个词既可以特指储存在细胞核中 的整套DNA(即核基因组),也可以指储存在细胞器中的 整套DNA(即线粒体基因组或叶绿体基因组),还可以指 一些非染色体的遗传元件,如病毒基因组、质粒基因组和 转座元件等。
不同基因家族各成员之间的序列 相似度也不同:
序列高度相似:经典的基因家族,如rRNA基因家族和组蛋 白基因家族。 保守性较低,但是编码产物具有大段的高度保守的氨基酸 序列。
序列保守性很低,编码产物之间也只有很短的保守氨基酸 序列,但通常由于具有保守的结构和功能区域,因而编码产 物具有相似的功能。
基因家族的成员在染色体上 的分布形式不同:
成簇存在的基因家族(clustered gene family)或称基因簇 (gene cluster),如人类类α链基因簇和类β链基因簇。 散布的基因家族(interspersed gene family),如肌动蛋白 基因家族和微管蛋白基因家族。
基因间隔区较短且内含子较少,基因排列紧密。
3.2.7 沉默基因
沉默基因( Silent Gene)也叫隐蔽基因(Cryptic gene), 是处于不表达状态的基因。它可能是假基因,也可能是被关闭的 基因。这些基因以隐性的方式埋藏在染色体中,但遇到特殊因子 的刺激,有可能解除关闭变成显性基因。
3.2.8 RNA基因
tRNA、rRNA; 核仁小分子RNA(small nucleolar RNA, snoRNA) 微小分子RNA(microRNA, miRNA); 小分子干扰RNA(small interfering RNA, siRNA); 核内小分子RNA(small nuclear RNA, snRNA);

第三章-基因和基因组结构PPT课件

第三章-基因和基因组结构PPT课件

I PO
ZY
A
Lactose
zy a
☆基因功能的表现是若干基因组成的信息表达的整体行为
☆ one gene → one enzyme
one gene → one peptide
one gene → one function
2021
15
根据其是否具有转录和翻译功能可以把基因分为三类: ☆编码蛋白质的基因,它具有转录和翻译功能,包括编 码酶和结构蛋白的结构基因以及编码调节蛋白的调节基 因; ☆只有转录功能而没有翻译功能的基因,包括tRNA基 因和rRNA基因; ☆不转录的基因,它对基因表达起调节控制作用,包括 启动子和操纵基因。启动子和操纵基因有时被统称为控 制基因。
☆断裂基因
真核蛋白质编码基因的核苷酸序列中间插入有与编码无关的DNA 间隔区,使1个基因分隔成不连续的若干区段 。
☆重叠基因
一些噬菌体和动物病毒,不同基因的核苷酸序列有时是可以共用 的。
2021
17
内含子(intron) 位于基因内部,不
编码基因产物的序列,在 成熟mRNA中被切除。
外显子(exon) 一个基因不包括内
34霉菌藻类g细菌g细菌显花植物鸟类哺乳类爬行类两栖类硬骨鱼类软骨鱼类棘皮类甲壳类昆虫类软体动物蠕虫类真菌支原体a生物体进化程度与大c值不成明显正相关b亲缘关系相近的生物间大c值相差较大c一种生物内大c值与小小c值相差极大35生物进化的c值矛盾cvalueparadoxofnucleotide单倍体基因组总dna的含量叫作c值值最大c值值maximumcvalue编码基因信息的总dna含量叫作c値最小c值值minimumcvalue36c值矛盾c值和生物结构或组成的复杂性不一致的现象
表型 野生型 Gal+,突变型 Gal-或 Gal; 基因型 野生型 gal+ 突变型 gal- 或 gal

分子生物学课件第三章 基因与基因组的结构

分子生物学课件第三章 基因与基因组的结构

基因(gene) 1 基因(gene)
1.1 基因概念的发展
1866年G.J.Mendel提出 遗传因子”概念,但未将“基因” 提出“ ⑴ 1866年G.J.Mendel提出“遗传因子”概念,但未将“基因” DNA联系起来 联系起来。 遗传因子”只是一个假设的遗传单位。 与DNA联系起来。“遗传因子”只是一个假设的遗传单位。 1909年W.L.Johannson(丹麦 首创‘gene’一词 提出“ 丹麦) 一词, ⑵ 1909年W.L.Johannson(丹麦)首创‘gene 一词,提出“基 因型” 表现型” 因型”和“表现型”。“ A”、"B 代表显性。“ a”、"b ” 代 、"B” 代表显性。 、 表隐性。这些符号沿用至今。 表隐性。这些符号沿用至今。 1910年T.H.Morgen提出 基因”代表一个有机的化学实体。 提出“ ⑶ 1910年T.H.Morgen提出“基因”代表一个有机的化学实体。 40~50年代 DNA是遗传物质确成定论后 确立了“基因” 年代, 是遗传物质确成定论后, ⑷ 40~50年代,DNA是遗传物质确成定论后,确立了“基因” 是具有一定遗传效应的DNA片段的概念。 DNA片段的概念 是具有一定遗传效应的DNA片段的概念。 1955年Benzer提出顺反子 cistron)概念 提出顺反子( 概念。 ⑸ 1955年Benzer提出顺反子(cistron)概念。目前已从功能单 位的意义上把顺反子和基因统一起来。 位的意义上把顺反子和基因统一起来。一个顺反子可包含多个 突变子(muton)和重组子(recon)。 和重组子(recon) 突变子(muton)和重组子(recon)。
基因与基因组
gene and genome
引 言
基因的分子结构和组织对基因的表达有重要 的影响。 的影响。 基因的分子结构在原核生物中已搞的十分清 但在真核生物中还缺少完整的例子。 楚。但在真核生物中还缺少完整的例子。近几 年来各种生物基因组计划的开展, 年来各种生物基因组计划的开展,特别是最近 发展起来的生物信息学, 发展起来的生物信息学,为深入研究基因的分 子结构和组织奠定了基础。 子结构和组织奠定了基础。

3第三章 基因与基因组

3第三章  基因与基因组

(4)增强子(enhancer)和沉默子(silencer)
增强子是一段DNA序列,其中含有多个能被反式作用因子 识别与结合的顺式作用元件。反式作用因子与这些元件结合后, 通常为增强邻近基因的转录。增强子一般位于转录起始点上游 -100~-300bp处,但在基因之外或某些内含子中也有增强子序 列。 增强子作用特点:①可在5’端或3’端发挥作用;②不受
的转录因子结合后即成为完整的启动子。
(2)上游启动子元件(upstream promoter elements ups) ①UPS是TATA盒上游的一些特定的DNA序列。 ②反式作用因子可与这些元件结合,通过调节TATA因 子与TATA box的结合、RNA pol与启动子结合及转录起始 复合物形式来调控基因转录效率。
(1)启动子(promoter) ①概念:启动子是促进DNA转录的DNA序列,是DNA分子上可 与RNA pol 特异性识别结合并使之转录的部位,但启动子本
身不被转录。
②功能特点:启动子位于结构基因上游启动子有方向性决 定转录方向及那一条DNA链作模板转录(以信息链的互补链 作模板转录,转录的mRNA与信息链一致)。 ③真核生物的启动子元件是TATA box TATA盒与TATA因子
3.具有操纵子结构。
4.结构基因无重叠现象,基因组中任何一段DNA不会用于编码2种蛋白质。 5.基因序列是连续的,无内含子结构。 6.编码区和非编码区(主要是调控序列)在基因组中约各占50%。
7.基因组中的重复序列很少。编码蛋白质结构基因多为单拷贝,但编码 rRNA的基因往往是多拷贝的,这有利于核糖体的快速组装。 8.具有编码同功酶的基因(isogene) 这是一类结构不完全相同,而功 能相同的基因。如E.coli含有2个编码乙酰乳酸合成酶的基因和2个编码 分支酸变位酶同工酶的基因。

第三章基因与基因组的结构

第三章基因与基因组的结构
线粒体基因组至少包含以下基因或基因 簇:rRNA基因、tRNA基因、ATPase基因、 细胞色素COXase基因。线粒体是个半自主 性的细胞器。其自身基因组只能编码部分 所需产物,许多重要物质的产生需由核基 因组与线粒体基因组共同互作。
叶绿体基因组
叶绿体也属于半自主性的细 胞器,同mtDNA类似,叶绿体 DNA也以双链环状分子的形式 存在于细胞质中。
一般而言,一个顺反子就是一个基因, 大约1500个核苷酸。
它是由一群突变单位和重组单位组成 的线形结构(因为任何一个基因都是突变 体或重组体)。
基因是DNA分子上的功能单位,在染 色体或DNA分子上,基因成串排列,它既 是遗传的功能单位,同时也是交换单位 和突变单位。
但并非所有的DNA序列都是基因,只 有某些特定的多核苷酸区段才是基因的 编码区。
染色体上存在大量无转录活 性的重复DNA序列,主要有两 种形式:
➢ 串联重复的DNA,如卫星DNA,
成簇存在于染色体的特定区域;
➢ 分散重复的DNA,分散在染色体 的各个位点。
卫星DNA
有些高度重复的DNA序列 的碱基组成和浮力密度与主体 DNA不同,在CsCl密度梯度离 心时,可形成相对独立于主 DNA带的卫星带。
例如rRNA和某些tRNA基因以及重 复程度更高的卫星DNA等。
不同生物中 非重复基因占基 因组的比例差别 很大。原核生物 含有完全不重复 的DNA,低等真 核生物的大部分 DNA是非重复的, 高等真核生物中 非重复基因所占 基因组的比例更 低。
从不同种类的原核生物的Cot曲线可以看出, 各种原核生物的Cot曲线形状都很相似,跨度一 般只有两个数量级,只是Cot1/2值不同。表明各
➢ 单拷贝序列
➢ 轻度重复序列

05第三章基因与基因组结构1

05第三章基因与基因组结构1
因; • 另一类不能转录,但对转录能起调节控
制作用,称之为操纵基因。
• 转录基因有mRNA、tRNA、rRNA和调节基因共四种。
–mRNA基因通过转录和翻译,能产生对应的蛋白质,这 种蛋白质是细胞中重要的结构和功能物质,所以, mRNA基因称之为结构基因;
–调节基因通过转录和翻译也能产生对应的蛋白质,这 种蛋白质能对转录基因有调节作用,故称之为调节基 因;
• 基因不仅可以重叠,而且可被分离。有的基因并 不被转录或不完全转录,而作为一个单位转录的 也往往不是一个基因。以前认为基因是在染色体 上成直线排列的独立单元,现已发现一些相关的 基因在染色体上的排列并不是随意的,而是由相 关功能的基因构成一个应的节段可以分两类: • 一类能转录,产生RNA分子,称为转录基
• 真 核 细 胞 中 , 大 多 数 基 因 以 单 顺 反 子 mRNA (monocistronic mRNA)的形式转录。
• 顺反子等价于真核基因的外显子(exon)即被表 达的区段。
• Blake进一步提出很可能每一个外显子相当于蛋白 质的一个结构单位,如结构域(domain)等,于 是由“一个基因,一条多肽链”的概念又深入为 “一个外显子,一个结构域”的精细表达。基因 本质是由若干功能元件组装起来的,这在基因概 念上也是一个突破。
• 1909年丹麦生物学家约翰逊根据希腊文“给予 生命”之义创造“基因”一词,并用这个术语 来代替孟德尔的“遗传因子”。
• 1925年美国著名的遗传学家摩尔根和他的学生通过对果蝇 性状与染色体之间关系的研究,创立了基因学说。摩尔根 指出:“种质必须由某种独立的要素组成,正是这些要素 我们叫做遗传因子,或者简单地叫做基因” 。
–tRNA和rRNA基因能转录,但不能翻译成对应的蛋白质, 只能在合成蛋白质的过程中发挥特定作用,如果没有 tRNA和rRNA基因,蛋白质的合成是不能进行的。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章基因与基因组第一节基因概念的历史演变第二节DNA与基因第三节真核生物的割裂基因第四节基因大小第五节重叠基因第六节真核生物的基因组第七节真核生物DNA序列组织第八节细胞器基因组第九节基因鉴定第十节人类基因组计划第三章基因与基因组1基因(gene)的概念基因是遗传的功能单位,DNA分子中不同排列顺序的DNA片段构成特定的功能单位;含有合成有功能的蛋白质多肽链或RNA所必需的全部核苷酸序列。

广义地说,基因是有功能的DNA片段。

第一节基因概念的历史演变2基因概念的历史演变:(1)Mendel提出基因的存在(2)Morgan证实基因在染色体上(3)“一个基因一个酶”修正为“一个基因一个多肽链”“基因”一词的创立:1909年,丹麦遗传学家约翰逊“基因”(gene)。

GregorMendelThomasHuntMorgan3基因概念的理论基础3.1 一个基因一个酶1941年GWBeadle和ELTatum研究证实红色链孢霉各种突变体的异常代谢是一种酶的缺陷,产生这种酶缺陷的原因是单个基因的突变。

3。

2 一个基因一条多肽链本世纪50年代,Yanofsky有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码,因而又提出了“一个基因一条多肽链”的假设。

3。

3 基因的化学本质是DNA(有时是RNA)1944年,OTAvery证实了DNA是遗传物质.有些病毒只含有RNA。

1953年沃森和克里克建立DNA分子的双螺旋结构模型。

3。

4基因顺反子(Cistron)的概念1955年,美国本兹尔(Benzer)提出顺反子的概念:是指编码一个蛋白质的全部组成所需信息的最短片段,即一个基因.基因仅是一个功能单位,基因内部的碱基对才是重组单位和突变单位.一对同源染色体上两突变(a和b)在同一染色体上时,称为顺式构型,在两个染色体上时,为反式构型;顺反互补测验(cis—transtest):比较顺式和反式构型个体的表型来判断两个突变是否发生在一个基因(顺反子)内的测验。

测验时,两突变发生在同一基因上,杂合体就不存在野生型的基因,因而为突变体表型;如果两突变在两个不同的基因上,后代杂合体中将有一个基因是野生型的,另外一个基因是突变型,杂合体的表型成了野生型。

这两个基因的这种关系称为互补。

反式排列:用于互补测验中所用的两个突变型,如果分别位于两条染色体上,这种组合方式称为反式排列,顺式排列:如果两个突变同时位于一条染色体上,则称为顺式排列。

顺反子:将不同突变之间没有互补的功能区称为顺反子,顺反子就是一个功能水平上的基因.4新的发现--概念断裂基因重叠基因跳跃基因★可转录、可翻译的(乳糖操纵子结构基因Z,Y,A)★可转录但不翻译(tDNA,rDNA)★不转录、不翻译(promoter,operator)5基因的类型2DNA中的编码区与间隔区1)编码区:与蛋白质中氨基酸序列相应的核苷酸序列。

2)间隔区:基因序列外,没有编码功能序列。

3)转录单位的组成:启动子,上游调控区,基因编码区,转录终止序列4)假基因:在序列上与活性的基因相似,但不能转录或翻译生成成熟mRNA或蛋白质,或产生过早终止的无活性肽链,或由于错误的阅读框架形成无活性的蛋白质。

第三节真核生物的割裂基因1割裂基因(splittinggene)不连续基因(discontinuousgene)断裂基因(interruptedgene)◘本世纪70年代,Chambon和Berget。

通过成熟mRNA(或cDNA)与编码基因的DNA杂交试验而发现.割裂基因:基因的编码序列在DNA放在上不是连续的,而是被不编码的序列隔开.外显子Exon:基因中编码的序列,与mRNA的序列相对应。

内含子Intron:基因中不编码的序列.鸡的卵清蛋白基因DNA与其mRNA杂交图剪接:前体RNA中由内含子转录下来的序列去除,并把由外显子转录的RNA序列连接起来的过程。

2割裂基因的性质:1)外显子在基因中的排列顺序和它在成熟mRNA产物中的排列顺序是相同的,2)某种割裂基因在所有组织中都有相同的内含子成分,3)核基因的内含子的可读框通常含无义密码子,没有编码功能。

3割裂基因的普遍性b)原核生物中:SV40大T抗原gene小t抗原gene1984Dr。

ChuT4phage的胸苷合成酶gene1017bpintronSplittinggene并非真核生物所特有酵母成熟酶合成受intronII的自动控制maturase过剩利用intronII编码成熟酶maturase减少提前剪切intronIIa) Intron并非“含而不露”Yeast细胞色素b基因IntronII编码成熟酶(Maturase) 4割裂基因概念的相对性c)并非真核生物所有的结构基因均为splittinggene 不是splittinggeneb)Exon并非“表里如一"人类尿激酶原基因ExonI不编码氨基酸序列Histonegenefamily干扰素Yeast中多数基因(ADH…)(果蝇ADH乙醇脱氢酶基因为间隔基因)第四节基因大小取决于它所包含的内含子的长度取决于所包含的内含子的数目不同生物的外显子数目随着进化增加,基因平均长度也在增加.在进化相关的相似组织的基因,其外显子基本一致,内含子的位置也是保守的,只是长度有变化。

基因的大小第五节重叠基因1977年维纳(Weiner)1978年费尔(Feir)和桑戈尔(Sanger)噬菌体G4、MS2和SV40中都发现了重叠基因基因的重叠果蝇蛹上皮蛋白质基因位于另一个基因的内含子之中人I型神经纤维瘤(NF1)基因的第一个内含子中有三个编码蛋白质的基因,线虫基因组中每个基因平均有5个内含子,有的内含子中包含tRNA基因,以上这些重叠基因的转录方向不一定与包含它的基因的转录方向一致--两个重叠基因的转录是各自独立、互不依赖.第六节真核生物的基因组基因组(genome):真核基因组是指一个物种单倍体的染色体所携带的一整套基因.比如人基因组的全长为大约3X109对碱基,编码3-4万个蛋白分子1真核生物的基因组:与预期的编码蛋白质的基因的数量相比,基因组的DNA含量过多例:人类与E.coli编码基因数目的比较研究E。

coli.4.2X106bpDNA约编码3000种基因人类3。

3X109bp的DNA是大肠杆菌的700多倍有上百万个基因???根据不同细胞中的mRNA数目来估算表达基因的方法,人类编码基因约为3-4万个持家基因(housekeepinggene):有些基因是在所有的细胞类型中都表达的,即这些基因的功能为所有细胞所必须(或称组成型基因constitutivegene)◘奢侈基因(luxurygene):仅在某种特定类型的细胞中表达的基因约为大肠杆菌的30倍,那么90%以上的DNA功能何在???果蝇基因组的基因原核生物与真核生物基因组的特点原核生物基因组的特点:1)原核生物的基因组很小,DNA含量低;2)原核生物DNA不和蛋白质固定结合,一般不具有核小体结构;3)原核生物的基因组内绝大部分序列用于编码蛋白质.4)功能上密切相关得到基因高度集中形成一个功能转录单位,可以转录形成含有多个蛋白质分子的一个mRNA单元。

5)重复序列少,具重叠基因;真核生物基因组的特点:1)真核生物基因组的分子量大2)真核生物的DNA一般与蛋白质结合成染色体。

3)转录和翻译在细胞中不同的位置进行。

4)基因组DNA的大量序列不编码蛋白.5)真核生物的蛋白编码基因往往以单拷贝存在。

2基因组大小和C值C值(CValue):在每一种生物中其单倍体基因组的DNA总量是特异的。

DNA的长度是根据碱基对的多少推算出来的。

C值是每种生物的一个特征,不同生物之间差别很大低等真核生物中与形态学复杂程度相关,但高等真核生物中变化很大C值矛盾(C—valueparadox)C值悖论:C值和生物结构或组成的复杂性不一致的现象。

高等生物的C值不一定就意味着它的C值高于比它低等的生物. 3基因组的基因数目第七节真核生物DNA序列组织DNA复性过程遵循二级反应动力学DNA复性过程中单链消失的速度用公式表示:-dC/dt=kC21DNA的复性动力学反应初始t=0单链DNA浓度=C0反应达t时单链DNA浓度=CtK=复性速度常数DNA复性的影响因素:DNA序列的复杂性、初始浓度、片段大小、温度、离子强度—dCt/dt=KC02积分Ct/C0=1/(1+KC0t)当Ct/C0=1/2时的Cot值定义为Cot1/2Ct/C0=1/2=1/(1+KC0t(1/2))K=1/Cot(1/2)C0t(1/2)值对DNA具有特征性,其中与DNA的碱基对数目成反相关即复性反应完成一半时Ct/C0是C0t的函数,按此公式作图得C0t曲线Cot曲线:用以表示复性速度与DNA顺序复杂性的关系.不同DNA的Cot(1/2)值不同,与K值相关DNA序列的复杂性影响K值:在控制反应条件(初始浓度、温度、离子强度、片段大小)相同的前提下,两种DNA分子的C0t(1/2)值,取决于核苷酸的排列复杂性。

DNA序列的复杂性(complexity)X:最长的没有重复序列的核苷酸对的数值。

X=KCot1/2AAAAAAAAX=1ATCGATCGATCGX=4N105X=105Cot(1/2)=1/K形状相似(跨越2-3个数量级),Cot(1/2)不相同--单一序列只是复杂性不同高度重复序列Cot(1/2)值小单一排列序列Cot(1/2)值大poly(A)X=1Cot(1/2)=2x10-6 T4X=1.7x105Cot(1/2)=0。

3不同原核生物的Cot曲线复性分数(1-c/c0)P74图-16真核生物复性动力学研究复性曲线的模式图复性反应分为三相,每相代表不同复杂长度的序列类型Cot1/2所占比例复杂性X重复频率2重复序列(repetitivesequences)真核生物复性动力学研究发现了重复序列单拷贝序列轻度重复序列中度重复序列高度重复序列1)单拷贝序列(singlecopysequences)又称非重复序列:一个基因组中只有一个拷贝。

单一序列的复性曲线常只有一个拐点,而重复序列常有多个拐点。

结构基因(蛋白质基因)大多是单拷贝。

2)轻度重复序列(lightrepetitivesequences)在基因组中重复数2—10的重复顺序,为慢复性速度。

少数在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列.多为编码功能3)中度重复序列(moderaterepetitivesequences)基因组中重复数十至数万(<105)次的重复顺序,复性速度快于单拷贝顺序,慢于高度重复顺序。

多与单拷贝基因间隔排列.多为非编码序列,如Alu序列也有编码基因产物的,如rDNA、tDNA、Histonegenecluster,一般往往以基因家族的形式组织.4)高度重复序列(highlyrepetitivesequences)在基因组中重复频率高,可达百万(106)以上,复性速度很快.序列一般较短,长10—300bp,如真核生物的卫星DNA。

相关文档
最新文档