第三章 真核生物基因组
真核生物的基因组结构与功能分析
真核生物的基因组结构与功能分析真核生物是指在生命进化过程中逐渐形成的一类生物,其基本特征之一是存在真核细胞核。
真核生物的基因组结构较为复杂,包含多个线性染色体和一些质粒。
对基因组结构的分析与理解,对于揭示其生物功能和进化机制是至关重要的。
一、真核生物的基因组结构真核生物的基因组大小较大,同一物种不同个体之间的基因组大小存在较大的差异。
基因组大小与细胞大小和复杂度之间存在着类似关联性。
人类基因组大小约为3亿个碱基对,其中蛋白编码基因仅占大约2%。
真核生物的基因组在基本结构上与细菌大相径庭,主要包括以下几个方面。
1. 染色体染色体是真核生物中最重要、最基本的遗传物质,是基因在生物体内的物质传递介质,是遗传信息的载体。
在精细结构上,真核细胞中存在很多复杂的染色体结构,如核小体、类固醇激素受体、平衡染色体等。
2. 基因组复制真核生物的基因组复制主要包括原核生物和真核生物的不同模式,其中原核生物中存在着DNA单线复制机制,而真核生物则采用DNA复制机器进行自我复制。
与原核生物不同的是,真核生物的DNA复制机器必须满足染色体的线性特性和复杂的三维结构,包括多个酶和蛋白质。
3. 基因只读基因只读是指通过读取基因组中的基因序列,进而达到生物高效功能表达和调节的过程。
真核生物基因组的序列阅读具有高度异质性,不同物种、不同个体之间存在大量的序列差异,这在一定程度上阻碍了对真核生物的功能研究。
二、真核生物的基因组功能分析真核生物的基因组分析主要包括以下几个方面。
1. 蛋白编码基因预测蛋白编码基因是真核生物基因组的重要组成部分,对真核生物的基因组进行蛋白编码基因预测,可以揭示其生物功能和进化机制。
目前,已经建立了多种基于序列、结构、相对位置等的蛋白编码基因预测算法与工具,如Glimmer、InterProScan、Pfam等。
2. 生物信息分析真核生物的基因组分析需要大量的计算资源和分析工具,这就需要借助生物信息学的手段来实现。
真核生物基因组
微卫星DNA(micro-satellite DNA)
由2~6个核苷酸长的重复序列组成,又称为简单串联重复序列 (simple tandem repeats STRs) 以(CA)n、(GT)n、(CAG)n较常见,重复次数多为15~60次,总长 度一般在400 bp以下。 存在于常染色体,除着丝粒及端粒区域外, 微卫星DNA在染色体的 其他区域均广泛均匀分布。很随机地分布在整个基因组中,而不像卫星或 小/微卫星那样串联成簇存在 微卫星DNA在基因组中的功能尚不清楚,已知其有自身特异结合蛋 白,是一种非常活跃的碱基序列, 且能直接编码蛋白质; 另外,微卫星DNA能参与遗传物质的结构改变,染色体折叠及端粒 形成,是基因重排和变异的来源, 通过改变DNA结构或与特异性蛋白质结 合而发挥其基因调控作用。 在人类基因组中,由CA重复序列构成的微卫星如5′CACACACACACA-3′大约每1万bp出现一次,占整个基因组的0.5%(总 共15Mb),而单碱基重复(即5′-AAAAAAAA-3′)占人类基因组的0.3%
Alternative splicing With a few genes, alternative splicing generates more than one mRNA from the primary transcript. Exons, or parts of exons, may be skipped.
呤(A)组成的序列替换hnRNA3′端的过程,这段序列不被翻译。
可变剪切
大部分真核基因被加工成一种类型的剪接后mRNA, 约有20%的人类基因因为可变剪接而产生两种或多种 mRNA序列 有一个人类基因已被证明,相同的原始转录物可以产 生64种不同的mRNA 外显子的相互排斥: 小鼠肌钙蛋白T基因的外显子2和3是相互排斥的,外 显子2用在平滑肌中,而外显子3用于其他所有组织中 剪接装置: 由多种细胞核内小RNA和一些蛋白组成,不同的细 胞类型中可不同
真核生物染色体基因组的结构和功能
真核生物染色体基因组的结构和功能真核生物的基因组一般比较庞大,例如人的单倍体基因组由3×106bp硷基组成,但人细胞中所含基因总数大概会超过3万个。
这就说明在人细胞基因组中有许多DN A序列并不转录成mR NA用于指导蛋白质的合成。
研究发现这些非编码区往往都是一些大量的重复序列,这些重复序列或集中成簇,或分散在基因之间。
在基因内部也有许多能转录但不翻译的间隔序列(内含子)。
因此,在人细胞的整个基因组当中只有很少一部份(约占2-3%)的DNA序列用以编码蛋白质。
真核生物基因组有以下特点。
1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploi d),即有两份同源的基因组。
2.真核细胞基因转录产物为单顺反子。
一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。
3.存在重复序列,重复次数可达百万次以上。
4.基因组中不编码的区域多于编码区域。
5.大部分基因含有内含子,因此,基因是不连续的。
6.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。
高度重复序列:高度重复序列在基因组中重复频率高,可达百万(106)以上。
在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20%。
高度重复顺序又按其结构特点分为三种(1)反向重复序列这种重复顺序约占人基因组的5%。
反向重复序列由两个相同顺序的互补拷贝在同一DNA链上反向排列而成。
变性后再复性时,同一条链内的互补的拷贝可以形成链内碱基配对,形成发夹式或“+”字形结构。
反向重复间可有一到几个核苷酸的间隔,也可以没有间隔。
没有间隔的又称回文结构,这种结构约占所有反向重复的三分之一。
第3章 生物体中究竟有多少基因?
第三章生物体中究竟有多少基因?与原核基因组(Genome)相比,真核基因组有一些不同的特点。
一个基因的完整性可以被打断,会有多个相同的重复序列,并且有大量的DNA并不编码蛋白。
由于核与胞质的分离,真核中基因的表达也必然和原核生物不同。
但是“真核基因组”并没有明确的界限,其必要条件是基因组大部分位于核内。
核DNA的数量变化很大,它所形成的染色体数量各不相同,序列类型也有很大区别,而细胞器含有相对较少的基因组,其大小也表现出广泛差异。
在分析真核基因组,特别是高等真核生物基因组的主要困难是编码区只代表总DNA 的很小一部分。
由于基因可能是割裂的,其大部分可能并非与编码的蛋白质相关。
基因之间也可能存在很长的DNA。
因此我们不可能从基因组总大小上推测出基因的大小。
可以通过鉴定拥有开放读框的区域直接推知基因组的编码潜力。
但是割裂基因可能含有很多分离的开放读框,从而混淆大规模基因组作图。
由于我们不知道蛋白产物的功能,或者没有确实证据说明它们表达,这种方法仅局限于确定基因组的潜力(但也有假设认为保守的开放读框会被表达,见第二章)。
另一种确认基因数量的途径是通过它们表达的蛋白或者mRNA。
这对处理已知条件下表达的基因非常可靠。
可了解在特定组织或者细胞中有多少基因表达,在相关表达水平上存在哪些差别,并且在一个细胞中表达的基因有多少与其它细胞不同,或者有多少也在其他细胞表达。
关于细胞类型,我们可能会问一个特定基因是否是必要的,当该基因突变时会发生什么情况呢?如果这种突变是致死的,或者生物表现出可见的缺陷,我们可能推测这个基因是必须的,或者至少表现出选择优势。
但有些基因的缺失对表型没有明显的影响,这些基因真是不需要的吗?在其他情况下或者经过长期的进化,它们的缺失意味着选择的劣势吗?3.1 基因组为何如此之大?基因组中DNA的总量是物种所特有的,称为C值(C-value)。
C值的范围变化很大,从微生物中的<106到一些植物和两栖类的>1011。
(整理)第三章基因与基因组
第三章基因与基因组第一节基因概念的历史演变第二节DNA与基因第三节真核生物的割裂基因第四节基因大小第五节重叠基因第六节真核生物的基因组第七节真核生物DNA序列组织第八节细胞器基因组第九节基因鉴定第十节人类基因组计划第三章基因与基因组1 基因(gene)的概念基因是遗传的功能单位,DNA分子中不同排列顺序的DNA片段构成特定的功能单位;含有合成有功能的蛋白质多肽链或RNA所必需的全部核苷酸序列。
广义地说,基因是有功能的DNA片段。
第一节基因概念的历史演变2 基因概念的历史演变:(1)Mendel提出基因的存在(2)Morgan证实基因在染色体上(3)“一个基因一个酶”修正为“一个基因一个多肽链”“基因”一词的创立: 1909年,丹麦遗传学家约翰逊“基因”(gene)。
Gregor MendelThomas Hunt Morgan3 基因概念的理论基础3.1 一个基因一个酶1941年G W Beadle 和E L Tatum研究证实红色链孢霉各种突变体的异常代谢是一种酶的缺陷,产生这种酶缺陷的原因是单个基因的突变。
3.2 一个基因一条多肽链本世纪50年代,Yanofsky有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码,因而又提出了“一个基因一条多肽链”的假设。
3.3 基因的化学本质是DNA(有时是RNA)1944年,O T Avery 证实了DNA是遗传物质。
有些病毒只含有RNA。
1953年沃森和克里克建立DNA分子的双螺旋结构模型。
3.4 基因顺反子(Cistron)的概念1955年,美国本兹尔(Benzer)提出顺反子的概念:是指编码一个蛋白质的全部组成所需信息的最短片段,即一个基因。
基因仅是一个功能单位,基因内部的碱基对才是重组单位和突变单位。
一对同源染色体上两突变(a和b)在同一染色体上时,称为顺式构型,在两个染色体上时,为反式构型;顺反互补测验(cis-trans test):比较顺式和反式构型个体的表型来判断两个突变是否发生在一个基因(顺反子)内的测验。
第3章 微生物细胞的形态结构-真核微生物
内质网
蛋白合成示意图
第一节 概述
五、细胞质和细胞器--高尔基体(Golgi body)
1898年意大利学者C Golgi在神经细胞发现,4~8个平 行的扁平膜囊和囊泡组成,无核糖体附着。
作用:RER合成Pr运到Golgi与脂、糖形成糖蛋白或 脂蛋白,外排到细胞外。合成糖蛋白、脂蛋白及对 某些蛋白质原酶切加工,合成新CW和CM提供原材 料的重要场所
吸取养料:假根、吸器 特化营养菌丝 附着:附着枝 休眠:菌核、菌索 菌丝体 延伸:匍匐枝 捕食线虫:菌环、菌网 简单:孢子囊、担子 特化气生菌丝(子实体)复杂:分生孢子器 子囊果
直径是细菌的10倍。球状、卵圆状、椭圆状、香肠状等
典型酿酒酵母(Saccharomyces cerevisiae)2.5~10×4.5~21um 有的成链状,叫假丝酵母。
1)CW
25nm,外层甘露聚糖,中间蛋白,
里层葡聚糖(使cell抗机械强度)
2)CM
蛋白+类脂+少量糖 含丰富麦角甾醇,uv转化为VD2
第一节 概述
五、细胞质和细胞器--细胞基质和细胞骨架
细胞基质(cytometrix):除可分辩细胞器之外的胶状 溶液,细胞代谢重要场所。 微管:微管蛋白组成中空管 细胞骨架(cytoskeleton) 肌动蛋白丝(微丝):肌动Pr 中间丝:中间纤维
微管功能:支持和运输,细胞分裂时的纺锤体、鞭毛和纤毛。 微丝功能:提供ATP,发生收缩 中间丝:支持和运动
叶绿体
类囊体摞在一起为基粒
第一节 概述
五、细胞质和细胞器--其他细胞器
液泡(vacuole)
单位膜分隔的细胞器,老龄细胞大而明显。 含糖原、脂肪、多磷酸盐等贮藏物,各种酶类。 功能:维持渗透压、贮藏营养物、溶酶体的作用 (将各种蛋白酶与CP隔离,防止细胞损伤)。
分子生物学基础第三章遗传与变异 第三节基因、基因组与基因突变
第三节 基因、基因组与基因突变
2.基因的命名 (1)用三个小写英文斜体字母表示基因的名称 (2)在三个小写英文斜体字母后面加上一个大写英文 斜体字母表示其不同的基因座,全部用正体时表示其相应 的蛋白产物和表型。 (3)对于质粒和其他染色体外成分,如果是自然产生 的质粒,用三个英文正体字母表示,第一个字母大写;但 如果是重组质粒,则在两个大写字母之前加一个p,大写 字母表示构建该质粒的研究者或单位。 (4)对果蝇基因命名的例子最繁多,特别是在发育生 物学中。对突变表型的表示用1-4个字母代表。
第三节 基因、基因组与基因突变
图3-23 化学修饰剂改变碱基的配对性质
第三节 基因、基因组与基因突变
3.诱变剂和致癌剂的检测 许多化合物需在体内经过代谢活化才有诱变作用,在 测试时可将待测物与肝提取物一起保温,使其转化,这样 可使潜在的诱变剂也能被检测出来。大肠杆菌的SOS反应 可以使处于溶源状态的λ噬菌体激活,从而裂解宿主细胞 产生噬菌斑。通常引起细菌SOS反应的化合物对高等动物 都是致癌的。Devoret根据此原理,利用溶源菌被诱导产
第三节 基因、基因组与基因突变
三、基因突变
1.基因突变的类型
基因突变有以下多种类型:碱基对置换指DNA错配碱 基在复制后被固定下来,由原来的一个碱基对被另一个碱 基对所取代,又称为点突变。碱基对置换有两种类型:即 转换是在两种嘧啶或两种嘌呤之间的互换;颠换发生在嘧 啶与嘌呤或嘌呤与嘧啶之间的互换。碱基替换通常仅发生 在一个碱基上,偶尔也有几个碱基同时被替换。转换发生 的频率一般比颠换高1倍左右。插入突变指在基因的序列 中插入了一个碱基或一段外来DNA导致的突变。例如,大 肠杆菌的噬菌体Mu-1、插入序列(IS)或转座子都可能诱 发插入突变。插入突变有两种方式:①拷贝或复制移动, 指一个位点上的序列被复制后插入到另一位点。②非拷贝 移换,DNA序列从一个位点直接移动到另一位点。
基因组
(1)几个结构基因的编码区无间隔:几个基因 几个结构基因的编码区无间隔: 的编码区是连续的、不间断的, 的编码区是连续的、不间断的,即编码一条多 肽链,翻译后切割成几个蛋白质。 肽链,翻译后切割成几个蛋白质。 mRNA没有 ′端帽子结构 没有5 (2)mRNA没有5 ′端帽子结构 5 ′ 端非编码区 RNA形成特殊的空间结构称翻译增强子 形成特殊的空间结构称翻译增强子。 的RNA形成特殊的空间结构称翻译增强子。 (3)结构基因本身没有翻译起始序列,必须在 结构基因本身没有翻译起始序列, 转录后进行加工、剪接,与病毒RNA5 ′端的帽 转录后进行加工、剪接,与病毒RNA5 ′端的帽 结构相连,或与其它基因的起始密码子连接, 结构相连,或与其它基因的起始密码子连接, 成为有翻译功能的完整mRNA。 成为有翻译功能的完整mRNA。
细菌多数基因按功能相关成串排列,组成操纵元的基因 细菌多数基因按功能相关成串排列, 表达调控的单元,共同开启或关闭, 表达调控的单元,共同开启或关闭,转录出多顺反子的 mRNA; mRNA;真核生物则是一个结构基因转录生成一条 mRNA, mRNA是单顺反子 mRNA,即mRNA是单顺反子,基本上没有操纵元的结 是单顺反子, 构,而真核细胞的许多活性蛋白是由相同和不同的多肽 形成的亚基构成的, 形成的亚基构成的,这就涉及到多个基因协调表达的问 真核生物基因协调表达要比原核生物复杂得多。 题,真核生物基因协调表达要比原核生物复杂得多。 原核基因组的大部分序列都为基因编码, 基因组的大部分序列都为基因编码 原核基因组的大部分序列都为基因编码,而核酸杂交等 实验表明:哺乳类基因组中仅约10%的序列为蛋白质 基因组中仅约 的序列为蛋白质、 实验表明:哺乳类基因组中仅约10%的序列为蛋白质、 rRNA、tRNA等编码 其余约90%的序列功能至今还不 rRNA、tRNA等编码,其余约90%的序列功能至今还不 等编码, 清楚。 清楚。 原核生物的基因为蛋白质编码的序列绝大多数是连续的, 原核生物的基因为蛋白质编码的序列绝大多数是连续的, 而真核生物为蛋白质编码的基因绝大多数是不连续的, 而真核生物为蛋白质编码的基因绝大多数是不连续的, 即有外显子(exon)和内含子 和内含子(intron), 即有外显子(exon)和内含子(intron),转录后需经剪接 (splicing)去除内含子 才能翻译获得完整的蛋白质, (splicing)去除内含子,才能翻译获得完整的蛋白质,这 去除内含子, 就增加了基因表达调控的环节。 就增加了基因表达调控的环节。
第三章-基因和基因组结构PPT课件
☆基因的两个基本属性: 基因是世代相传的, 基因是决定遗传性表达的
现在所说的“基因是生物体传递遗传信息和表达遗传信 息的基本物质单位”,实际上就是孟德尔所阐明的基因观。
-
7
1926年,摩尔根的巨著《基因论》出版,从而建 立了著名的基因学说。
-
8
☆ 基因是染色体上的实体 ☆ 基因象链珠(bead)一样,孤立地呈 线状地排列在染色体上 ☆ 基因是
-
2
第一节 基因与基因组的概念
-
3
基因
是遗传信息的物理和功能单位,包含产生 一条多肽链或功能RNA所必需的全部核苷酸 序列。
-
4
基因结构研究的历史
从遗传学史的角度看,基因概念大致分以下几个阶段:
泛基因 (或前基因)
孟德尔 (遗传因子)
摩尔根 (基因)
现代基因
操纵子
-
顺反子
5
遗传学的奠基人孟德尔 (Gregor Johann Mendel 1822~1884)
基因主要位于染色体上,还有染色体外遗传物质
-
16
基因概念的发展
☆移动基因
DNA能在有机体的染色体组内从1个地方跳到另一个地方,它 们能从1个位点切除,然后插入同一或不同染色体上的另一个位置。 移动基因机构简单,由几个促进移位的基因组成。基因的跳动能够 产生突变和染色体重排,进而影响其他基因的表达。
one gene → one function
-
15
根据其是否具有转录和翻译功能可以把基因分为三类: ☆编码蛋白质的基因,它具有转录和翻译功能,包括编 码酶和结构蛋白的结构基因以及编码调节蛋白的调节基 因; ☆只有转录功能而没有翻译功能的基因,包括tRNA基因 和rRNA基因; ☆不转录的基因,它对基因表达起调节控制作用,包括 启动子和操纵基因。启动子和操纵基因有时被统称为控 制基因。
真核生物基因组
② 无组织特异性。
只有鸟类、鱼类及两栖类红细胞染色体不 含 H1而带有H5。
③ 富含赖氨酸的组蛋白H5。
❖ 赖氨酸(24%) ❖ 与H1无同源性; ❖ 推测H5与染色体失活有关,其磷酸化在 失
活中可能起重要作用。
④ 肽链上氨基酸分布的不对称性
---碱性氨基酸集中分布在N端的半条链上, 易与DNA的负电荷区结合. ---大部分疏水基团都分布在C端。与其他组 蛋白、非组蛋白结合。
2、染色质(体)的结构
电镜下看到的染色质结构
“Beads on a string” structure:念珠模型,染色质的基本结构由一系列核小体相互连接而成的念珠状
From DNA to Chromosome
意义:
将近200 cm长的DNA 分子容纳于直径只有 5微的细胞核中。
影响解链,影响与蛋 白质的相互作用,调 控基因表达。
(一)高度重复序列(重复次数>106)
只存在于真核生物中,占基因组的10%-60%,由6100个碱基组成,在DNA链上串联重复高达数百万次 。
高度重复顺序又按其结构特点分为三种
(1)倒位(反向)重复序列 约占人基因组的5%。反向重复 序列由两个相同顺序的互补拷贝 在同一DNA链上反向排列而成。
常见于基因的调控区和特异蛋白结合区
Histone gene family 干扰素
Yeast 中多数基因
三 重复序列
Repetitive sequences (一)高度重复序列(重复次数:>1O6)
(二)中度重复序列(重复次数:1O2-1O5)
(三)单拷贝序列(Unique Sequence)
包括大多数编码蛋白质的结构基因和基因间隔 序列。
第三章基因与基因组的结构
叶绿体基因组
叶绿体也属于半自主性的细 胞器,同mtDNA类似,叶绿体 DNA也以双链环状分子的形式 存在于细胞质中。
一般而言,一个顺反子就是一个基因, 大约1500个核苷酸。
它是由一群突变单位和重组单位组成 的线形结构(因为任何一个基因都是突变 体或重组体)。
基因是DNA分子上的功能单位,在染 色体或DNA分子上,基因成串排列,它既 是遗传的功能单位,同时也是交换单位 和突变单位。
但并非所有的DNA序列都是基因,只 有某些特定的多核苷酸区段才是基因的 编码区。
染色体上存在大量无转录活 性的重复DNA序列,主要有两 种形式:
➢ 串联重复的DNA,如卫星DNA,
成簇存在于染色体的特定区域;
➢ 分散重复的DNA,分散在染色体 的各个位点。
卫星DNA
有些高度重复的DNA序列 的碱基组成和浮力密度与主体 DNA不同,在CsCl密度梯度离 心时,可形成相对独立于主 DNA带的卫星带。
例如rRNA和某些tRNA基因以及重 复程度更高的卫星DNA等。
不同生物中 非重复基因占基 因组的比例差别 很大。原核生物 含有完全不重复 的DNA,低等真 核生物的大部分 DNA是非重复的, 高等真核生物中 非重复基因所占 基因组的比例更 低。
从不同种类的原核生物的Cot曲线可以看出, 各种原核生物的Cot曲线形状都很相似,跨度一 般只有两个数量级,只是Cot1/2值不同。表明各
➢ 单拷贝序列
➢ 轻度重复序列
分子生物学课件 第3章 基因与基因组
实际应用中“基因组”这个词既可以特指储存在细胞核中 的整套DNA(即核基因组),也可以指储存在细胞器中的 整套DNA(即线粒体基因组或叶绿体基因组),还可以指 一些非染色体的遗传元件,如病毒基因组、质粒基因组和 转座元件等。
不同基因家族各成员之间的序列 相似度也不同:
序列高度相似:经典的基因家族,如rRNA基因家族和组蛋 白基因家族。 保守性较低,但是编码产物具有大段的高度保守的氨基酸 序列。
序列保守性很低,编码产物之间也只有很短的保守氨基酸 序列,但通常由于具有保守的结构和功能区域,因而编码产 物具有相似的功能。
基因家族的成员在染色体上 的分布形式不同:
成簇存在的基因家族(clustered gene family)或称基因簇 (gene cluster),如人类类α链基因簇和类β链基因簇。 散布的基因家族(interspersed gene family),如肌动蛋白 基因家族和微管蛋白基因家族。
基因间隔区较短且内含子较少,基因排列紧密。
3.2.7 沉默基因
沉默基因( Silent Gene)也叫隐蔽基因(Cryptic gene), 是处于不表达状态的基因。它可能是假基因,也可能是被关闭的 基因。这些基因以隐性的方式埋藏在染色体中,但遇到特殊因子 的刺激,有可能解除关闭变成显性基因。
3.2.8 RNA基因
tRNA、rRNA; 核仁小分子RNA(small nucleolar RNA, snoRNA) 微小分子RNA(microRNA, miRNA); 小分子干扰RNA(small interfering RNA, siRNA); 核内小分子RNA(small nuclear RNA, snRNA);
分子生物学第三章 基因与基因组的结构与功能
3.1 基因的概念
基因(gene):是原核、真核生物以及病毒的
DNA和RNA分子中具有遗传效应的核苷酸序
列,是遗传的基本单位和突变体及控制性状
的功能单位。
结构基因
包括:
(编码蛋白质、tRNA、rRNA)
调控基因
(编码调控蛋白)
• 基因通过复制、转录和翻译合成蛋白质以及
• 有关基因的命名方法现在并没有严格的统一。
随着分子生物学的飞速发展。许许多多的基 因组都已大规模被测序,更多的基因也不断 的被鉴定。因而十分需要一个统一的命名方 法。
• 为便于学习理解,根据现代分子生物学中目
前使用最多的方法暂归纳如下:
• 1)用三个小写英文斜体字母表示基因的名
称,例如涉及乳糖(lactose)代谢相关的酶 基因lac;涉及亮氨酸(Leucine)代谢相关 的酶基因leu。
7)植物基因的命名
目前还没有适用于植物的惯用命名法 多数用1~3个小写英文斜体字母表示。 如:hsp90,热激蛋白基因
Oryza sativa,Arabidopsis thaliana
OsAthsp90;
Athsp90;Athsp90.3; Athsp90.6
• 8)脊椎动物基因的命名 • 用描述基因功能的1~4个小写字母和数字
• 2)在三个小写英文斜体字母后面加上一个斜体大写
字母表示其不同的基因座。全部用正体时表示蛋白 产物和表型
• 例如,对于大肠杆菌和其他细菌,用三个小写字母
表示一个操纵子,接着的大写字母表示不同基因座,
lac 操纵子的基因座:lacZ,lacY,lacA;其表达
产物蛋白质则是lacZ,lacY,lacA。
分子生物学课件第三章 基因与基因组的结构
基因(gene) 1 基因(gene)
1.1 基因概念的发展
1866年G.J.Mendel提出 遗传因子”概念,但未将“基因” 提出“ ⑴ 1866年G.J.Mendel提出“遗传因子”概念,但未将“基因” DNA联系起来 联系起来。 遗传因子”只是一个假设的遗传单位。 与DNA联系起来。“遗传因子”只是一个假设的遗传单位。 1909年W.L.Johannson(丹麦 首创‘gene’一词 提出“ 丹麦) 一词, ⑵ 1909年W.L.Johannson(丹麦)首创‘gene 一词,提出“基 因型” 表现型” 因型”和“表现型”。“ A”、"B 代表显性。“ a”、"b ” 代 、"B” 代表显性。 、 表隐性。这些符号沿用至今。 表隐性。这些符号沿用至今。 1910年T.H.Morgen提出 基因”代表一个有机的化学实体。 提出“ ⑶ 1910年T.H.Morgen提出“基因”代表一个有机的化学实体。 40~50年代 DNA是遗传物质确成定论后 确立了“基因” 年代, 是遗传物质确成定论后, ⑷ 40~50年代,DNA是遗传物质确成定论后,确立了“基因” 是具有一定遗传效应的DNA片段的概念。 DNA片段的概念 是具有一定遗传效应的DNA片段的概念。 1955年Benzer提出顺反子 cistron)概念 提出顺反子( 概念。 ⑸ 1955年Benzer提出顺反子(cistron)概念。目前已从功能单 位的意义上把顺反子和基因统一起来。 位的意义上把顺反子和基因统一起来。一个顺反子可包含多个 突变子(muton)和重组子(recon)。 和重组子(recon) 突变子(muton)和重组子(recon)。
基因与基因组
gene and genome
引 言
基因的分子结构和组织对基因的表达有重要 的影响。 的影响。 基因的分子结构在原核生物中已搞的十分清 但在真核生物中还缺少完整的例子。 楚。但在真核生物中还缺少完整的例子。近几 年来各种生物基因组计划的开展, 年来各种生物基因组计划的开展,特别是最近 发展起来的生物信息学, 发展起来的生物信息学,为深入研究基因的分 子结构和组织奠定了基础。 子结构和组织奠定了基础。
真核生物细胞器基因组概述
真核细胞器基因组概述真核生物细胞器基因组概述中文摘要真核生物的基因组分为细胞核基因组和细胞器基因组。
细胞核基因组,占绝大多数的基因都由核基因组控制;细胞器基因组,与该细胞器功能相关的少数基因由该细胞器自身控制。
它们的基因结构、转录和翻译不一样,核基因组是真核的系统,细胞器基因组类似原核生物的系统。
核基因组占控制地位,它调控细胞器基因组,但后者也可以调节核基因组基因的表达。
本文主要对真核生物细胞器基因组进行描述。
关键字:真核生物基因组细胞器基因组Overview of eukaryotic organelle genomesAbstractEukaryotic genome into the nucleus genome and organelle genomes. Nuclear genome,the majority of genes controlled by the nuclear genome; organelle genomes, cells,functions associated with the small number of genes controlled by the organelle itself.Their gene structure, transcription and translation is not the same, eukaryotic nucleargenome is a system, organelle genomes like prokaryotes system. Total control of thenuclear genome position, which regulate organelle genome, but the latter can also adjustthe nuclear genome gene expression. In this paper, the genome of eukaryotic organellesare described.Keywords:Eukaryotes genomes organelle genomes前言基因组,Genome,一般的定义是单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基因为一个基因组。
第三章 基因组(医学分子生物学,2011.9,2011级研究生)
6. 原核生物基因组中的基因密度非常高,基因 组序列中编码区所占的比例较大(约为50% 左右),非编码区内主要是一些调控序列。 7. 结构基因是连续的,没有内含子 8. 基因组中重复序列很少。编码蛋白质的结构 基因常为单拷贝(占99.7%) ,但编码rRNA 的 基因往往是多拷贝的。 9. 具有编码同工酶的同基因 10. 不同的原核生物基因组中的GC含量变化很 大,其范围从25%~75%。因此测量基因组 的GC含量可以用来识别细菌种类。
重复序列
单拷贝序列或低重复序列:在整个基因组
中仅出现一次或少数几次,大部分为编码蛋白 质的结构基因
34
P17
反向重复序列: 两个顺序相同的拷贝在DNA
链上呈反向排列。①两个反向排列的拷贝之间隔 着一段间隔序列;②两个拷贝反向串联在一起, 中间没有间隔序列,又称为回文结构。
串联重复序列: 重复序列 编码区串联重复: 人类5种组蛋白基因密集在
27
第四节
真核生物基因组
28
一、真核生物基因组远大于原核生物基因组
真核生物基因组复杂性体现在两个方面:
具有复杂多样的结构形式
具有复杂精细的基因表达调控机制
真核生物基因组结构庞大,人类单倍 体基因组DNA约3.3109 bp ,约有3~3.5万 个基因。大肠杆菌基因组只有4.6106 bp。
真核基因组中非编码序列(non-coding sequence, NCS) 占90%以上。人类基因组中,编码序列仅占 3%左右。这是真核生物与细菌、病毒的重要区别, 在一定程度上也是生物进化的标尺。 基因的内含子、调控序列等
非编码序列
重复序列
>90%
约占DNA 总量50%
32
编码序列:rRNA、tRNA、组蛋白、 免疫球蛋白的结构基因
分子生物学笔记完全版第三、四章
分子生物学笔记完全版第三、四章--------------------------------------------------------------------------------作者: tonyloveyou 收录日期: 2006-07-13 发布日期: 2006-07-13第三章基因表达的调控基因表达:DNA→mRNA→蛋白质的遗传信息传递过程基因表达的调控第一节基因的活化基因的“开关”-染色质的活化一、活性染色质的结构间期核染色质:异染色质(heterochromatin),高度压缩(不转录);常染色质(euchromatin),较为松散,常染色质中约10%为活性染色质(更开放疏松)。
活性染色质→←非活性染色质二、活性染色质的结构特点(一)DNaseI敏感性转录活性(或有潜在转录活性)的染色质对DNase I更敏感.DNase I超敏感位点(DNase I HyperSensitive Sites,DHSS)(二)组蛋白H3的CyS110上巯基暴露,三、活性染色质结构的形成(一)、核小体位相(Phased positioning)1.核小体的旋转定位(rotational positioning)指核小体核心与DNA双螺旋在空间结构中的相互关系,主要包括DNA双螺旋的大沟是面向还是背向核心结构.‘2.核小体的平移定位(translational positioning)指核小体与特定DNA序列的结合位置和方式,特别是转录活性相关的DNA调控元件(启动子、增强子等)序列与核小体的相互位置关系。
(二)、组蛋白修饰1.H1组蛋白磷酸化促进染色体包装,影响转录活性,2.核心组蛋白修饰乙酰化:常发生在组蛋白的Lys,一般活性染色质是高度乙酰化的。
(三)HMG蛋白结合HMG(high mobility group)蛋白—高迁移率蛋白, 如HMG14/HMG17.与核小体核心颗粒结合,有利转录。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 第一节 真核生物染色体基因组 • 第二节 染色体外的基因组- 线粒体 • 第三节 人类基因组
第一节 真核生物染色体基因组
• 一、真核生物染色体基因组的一般特征 • 二、单拷贝基因 • 三、重复序列 • 四、基因家族 • 五、端粒和端粒酶 • 六、基因移动
一、真核生物基因组的一般特征
(一)基因组庞大 :基因可达109bp (二)线状双链DNA和二倍体:染色体都是成对出现。 (三)非编码区远多于编码区:仅1.5%的序列被转录
特点:
• 种类多、分布广,在人群中世代相传。在 基因组中平均50kb就有一个重复序列,突 变率低(< 0.04%)。
• 在人群中高度多态,其多态信息含量容量 超过70%。其多态性表现为正常人群的不 同个体某一基因位点重复序列的重复次数 可不一样,同一个体的两个同源染色体上 重复次数也可以不一样,即微卫星DNA拷 贝数在人群中是可变的。
线粒体DNA
二、线粒体DNA的遗传特性
(一)线粒体DNA(mtDNA) :母性遗传的核外遗传物质 (二)与核DNA区别:
1、非孟德尔的母系遗传 2、高突变率 3、异质性和复制分离 4、阈值效应 5、半自主复制与协同作用
第三节 人类基因组
一、人类基因组概貌 二、人类基因组的多态性及在分子诊断中的应用 三、人类基因组研究
真核生物rRNA基因的加工
四、基因家族(gene family)
• (一)基因家族:一组功能相似且核苷酸 序列具有同源性的基因,在进化过程中从 一个祖先基因经重复和突变演变而来的。
• (二)假基因(pseudogene):与具正 常功能的基因序列相似,但无转录功能或 转录产物无功能的基因。
组蛋白基因家族
• 在人细胞组中卫星DNA约 占5-6%。
卫星DNA分类:
1.卫星DNA(satellite DNA) 2.小卫星DNA(mini-satellite
DNA) 3.微卫星DNA(micro-satellite
DNA)
高度重复序列比较
重复长度 总长度
定位
卫星DNA 5~100bp 小卫星DNA 15~70bp
• 具有遗传连锁不平衡现象。
• 均可被转录,有些编码蛋白质,而另一些 则位于非转译区的5′端和3′端不编码蛋白质。
• 属于不稳定的DNA序列,其数目在某些遗 传病中有扩大现象,而这种扩增并非是减 数分裂的重组造成,扩大可发生在减数分 裂过程中,由一代传递给另一代,也可发 生在有丝分裂中,导致嵌合体形成。与成 熟人体细胞比较,微卫星DNA在胚胎时期 有丝分裂很不稳定。
(二)单核苷酸的多态性( single nucleotide polymorphism, SNP)
主要用途: ①疾病的连锁分析与基因的定位 ②指导用药和药物设计
③用于进化和种群多样性的研究
三、人类基因组研究
(一)1990年,“人类基因组计划(human genome project,HGP)”启动。
• α卫星DNA成簇的分布在染色体着丝粒 附近,可能与染色体减数分裂时染色 体配对有关,即同源染色体之间的联 会可能依赖于具有染色体专一性的特 定卫星DNA顺序。
(二)中度重复序列 主要由较大的片段(100-几千个bp )串联重复组 成,分散在整个基因组中,少数在基因中成串排列 在一个区域,大多数与单拷贝基因间隔排列 分为短分散片段和长分散片段: 短分散片段:300bp 拷贝数10万 长分散片段:1000bp 拷贝数1万 其表达产物常是细胞大量需要的,如rRNA、tRNA 等。
• 不同基因内含子长度和数目不等 • 人胰岛素:1个内含子 • 人胶原基因:52个内含子 • 外显子与所编码的蛋白质功能结构
域一致
• 内含子有共同特征:GT/AG规则
三、重复序列
• 定义:指多拷贝的相同或近似序列 的DNA片段。
• 分类: 高度重复序列、中度重复序列
(一)高度重复序列 :
• 一般由较短的序列(10-300bp) 组成,常集中在一起串联排列,重 复频度>105 ,占基因组10~60%。
端粒酶的催 化延长作用
爬 行 模 型
DNA聚合酶复制子链 进一步加工
六、基因移动
基因在染色体上不是固定不变的,可以从 某一处转移到另一处,称为基因移动。
发生移动的基因称为可移动基因。
以转座子形式运动
第二节 染色体外的基因组-线粒体
线粒体DNA(mitochondria,mtDNA)全长为 16.5kb,环状双链分子,不含内含子。共有37个编 码 基 因 , 2 个 rRNA ( 12sRNA 和 16sRNA ) 和 22 个 tRNA(tRNAser和tRNAleu各2个基因),另有13个 为多肽编码基因。
表达。 (四)断裂基因(split gene):基因不连续,外显子
和内含子并存。 (五)大量重复序列存在 :具有高度,中度重复序列
(一)基因组庞大 :
• 真核生生物的基因组一般比较庞大。 • 大肠杆菌:4.6 ×106bp碱基 • 酵 母:1.2 ×107bp碱基 • 人 类:3×109bp碱基组成
5’ GGAATCGATCTTAAGATCGATTCC 3’ 3’ CCTTAGCTAGAATTCTAGCTAAGG 5’
2、卫星DNA
• 卫星DNA(satelliteDNA)是 另一类高度重复序列,这 类重复顺序的重复单位一 般由2-100bp组成,成串排 列。
• 由于这类序列的碱基组成 不同于其他部份,可用等 密度梯度离心法将其与主 体DNA分开,因而称为卫 星DNA或随体DNA。
第三章 真核生物基因组
临床生化教研室
• 真核生物由真核细胞构成的生物。 包括原生生物界、真菌界、植物界 和动物界。
• 定义 :真核生物是所有单细胞或 多细胞的、其细胞具有细胞核的生 物的总称,它包括所有动物、植物、 真菌和其他具有由膜包裹着的复杂 亚细胞结构的生物。
• 真核生物与原核生物的根本性 区别是前者的细胞内含有细胞 核,因此以真核来命名这一类 细胞。许多真核细胞中还含有 其它细胞器,如线粒体、叶绿 体、高尔基体等。
(二)线状双链DNA和二倍体:
• 线状双链DNA • 与蛋白结合形成染色体 • 染色体:数量,多条 基本都是成对出现。 • 特定的一组基因
(三)非编码区远多于编码区:
• 人 类:3×109bp碱基组成
• 按1000个碱基编码一种蛋白质计,理论上可有 300万个基因。
• 但实际上,人细胞中所含基因总数大概是?万个。 • 说明在人细胞基因组中有许多DNA序列并不转录
❖物理图谱(physical map) 指标明一些界标(已定位的DNA序列,如限制 酶的切点、CpG序列、基因等)在DNA上的位 置,确定遗传标志之间物理距离的图谱。
转录图谱(transcriptional map) 是具有表达能力,利用EST作为标记所构建的分子 遗传图谱。
分类:
• 按其结构特点分为三类: • 1、反向重复序列 • 2、卫星DNA • 3、较复杂的重复单位组成的重复顺序
1、反向重复序列
• 这种重复顺序复性速度极快,即使在极稀 的DNA浓度下,也能很快复性
• 约占人基因组的5%。 • 反向重复序列由两个相同顺序的互补拷贝
在同一DNA链上反向排列而成。变性后再 复性时,同一条链内的互补的拷贝可以形 成链内碱基配对,形成发夹式或“+”字形结 构。 • 它们多数散布,非群集于基因组中。
(二)1994年,我国HGP启动,参与1%工作。 (三)2001年2月12日,美国Celera公司与人类基因组计划分别
在《科学》和《自然》杂志上公布了人类基因组精细图谱及 其初步分析结果。 (四)2003年4月14日中、美、日、德、法、英等6国科学家宣 布人类基因组序列图绘制成功。
人类基因组作图
❖遗传图谱(genetic map) 指通过计算连锁遗传标志之间的重组频率,得 到基因线性排列从而确定相对距离的图谱,又 称连锁图(linkage map)。
1.rRNA基因 :rRNA常集中成簇存在基因组中, 28s、18s和5.8s串联排列,300个拷贝,5s单独存 在,有2000个拷贝。
2.tRNA基因 :每种氨基酸都有一种或多种tRNA, 而每一种tRNA基因也有几十~几百个拷贝。同一 种基因常串联在一起,排列成基因簇。
3.Alu家族 :长度约300bp,富含GC。具有一个 Alu I酶切位点(AGCT),因而得名。分布非常广, 重复次数100万,约10%基因组。
一、人类基因组概貌
基 因 甲 基 化 : DNA 甲 基 化是甲基转移酶将胞嘧啶转变 为5-甲基胞嘧啶,DNA甲基化 后表达下调。
二、人类基因组的多态性及在分子诊断 中的应用
(一)短串联重复序列 ( short tandem repeat , STR) 主要用途: ①人类基因遗传图谱的制作。 ②目的基因筛选和基因诊断。 ③法医学个体识别和亲权鉴定。
原核生物的多顺反子
5 PPP
3
真核生物的单顺反子
5 mG - PPP
蛋白质
3
蛋白质
非编码序列
核蛋白体结合位点
编码序列
起始密码子
终止密码子
(二)断裂基因
细胞内的结构基因并非全由编码序列 组成,而是在编码序列中插入了非编 码序列。
外显子(exon):断裂基因中的编码序列。 列的功能
• 参与复制水平的调节反向序列常存在于DNA复制 起点区的附近。另外,许多反向重复序列是一些 蛋白质(包括酶)和DNA的结合位点。
• 参与基因表达的调控DNA的重复顺序可以转录到 核内不均一RNA分子中,而有些反向重复顺序可 以形成发夹结构,这对稳定RNA分子,免遭分解 有重要作用。
• 在不同基因位点上的微卫星DNA的重复序 列可以不同,也可以相同。
3、较复杂的重复单位组成的重复顺序