第1章 基因组-基因组结构特征电子教案
1.5基因及基因组的结构与特点
基因及基因组的结构与特点§1 基因与基因组一. 基因基因是DNA分子中含有特定遗传信息的一段核苷酸序列,是遗传物质的最小功能单位。
根据基因是否具有转录和翻译功能分为:二. 基因组(genome)基因组是指含有一个生物体生存、发育、活动和繁殖所需要的全部遗传信息的整套核酸。
基因组中不同的区域具有不同的功能,有些是编码蛋白质的结构基因,有些是复制及转录的调控信号,有些区域的功能尚不清楚。
功能基因组是指由表达基因构成的基因组。
基因组结构是指不同功能区域在整个DNA分子中的分布情况。
1. C值不同生物体的基因组大小和复杂程度各不相同,进化程度越高的生物体一般基因组越大也越复杂单倍基因组DNA含量(haploid DNA content)称为C值。
C值矛盾:人类基因组的C值只有3×109bp,肺鱼的C值比人高10多倍;亲缘关系相近的物种间,C值仍然相差很大:两栖类的不同物种间C值可相差100倍,被子植物不同物种间C值相差达1000倍,藻类5000倍,鱼类350倍,节肢动物250倍。
在原生动物不同物种间C值相差竟高达5800倍。
C值的大小并不说明遗传复杂性的高低,而只说明基因组中自私DNA(selfish DNA)的多少。
2. 基因结构一个基因组的核酸可分为编码区和非编码区两类序列。
(1)编码区:为mRNA、rRNA、tRNA以及其他各种RNA编码。
(2)非编码区:又可分为信号序列和非信号序列两类。
大都是一些大量的重复序列,它们或集中成簇,或分散在基因之间,可能在DNA复制、调控中具有重要意义,并与生物进化、种族特异性有关。
1)信号序列包括:复制起点、增强子、启动子、终止子及一切由调节蛋白识别和结合的序列。
2)非信号序列是指间隔区:间隔区并非不含有信息,有时信息不表现为核苷酸的顺序,而表现为序列的长度。
∙MS2外壳蛋白结构基因上游的非编码序列不得少于30nt,否则翻译效率降低10倍;∙真核基因的内含子并非编码序列,但其中含有重要信息,如5’剪接位点、3’剪接位点等;一些内含子的位置在不同物种之间保守,甚至其序列也有程度不同的保守。
基因及基因组的结构与功能ppt课件
ppt课件.
22
第三节 真核基因组的结构与功能
ppt课件.
23
一、真核生物基因组的结构特点
1、真核生物基因组都是大分子双链线状DNA;
这些DNA通常与组蛋白、非组蛋白组成核小体、染色体等 复合体而存在。
染色体通常成对出现(双倍体)。
ppt课件.
26
(二)真核生物基因组中的重复序列
真核生物基因组中通常存在大量的重复序列
◦ 占整个基因组DNA的90%以上。
按重复频率的高低分为:
◦ 高度重复序列 ◦ 中度重复序列 ◦ 单拷贝序列
ppt课件.
27
1、高度重复序列: 高度重复序列:
◦ 重复频率高,106以上,复性速度很快。 ◦ 在基因组中所占比例随种属而2、DNA分子式右手双螺旋 3、疏水性碱基堆积力和氢
键是DNA双螺旋结构的稳定 力。
ppt课件.
8
DNA的高级结构
原核生物DNA的高级结构:双链闭合环状 DNA
真核生物高级结构:多次折叠的染色质结 构
当E.coli的细胞被裂解后,类核
区DNA就释放出去形成环状
即回文序列
ppt课件.
29
回文对联
画上荷花和尚画 书临汉字翰林书
ppt课件.
30
回文序列结构特征
茎环结构/发卡结构
十字结构
ppt课件.
31
②卫星DNA (satelliteDNA)
◦ 定义:一类高度重复序列,其重复单位一般由2-10bp组 成,成串排列。由于这类序列的碱基组成不同于其它部 份,可用等密度梯度离心法将其与主体DNA分开,因而 称为卫星DNA或随体DNA。
基因组的结构和功能ppt课件
ppt课件.
1
第一节 真核生物基因组的 结构与功能
Section 1 Structure and Function of Eukaryotic Genome
度重复序列和单拷贝序列三大类。
ppt课件.
5
(一)高度重复序列:
Ø 高度重复序列在基因组中重复频率高,可 达106次,因此复性速度很快。高度重复序 列在基因组中所占比例随种属而异,一般 在10~60%范围内。
Ø 人的高度重复序列约占整个基因组的20% 左右。
ppt课件.
6
Ø高度重复序列按其结构特点可分为三种: 1. 反向重复序列(inverted repeats):
ppt课件.
24
真核生物基因组中的重复序列
ppt课件.
25
二、多基因家族与假基因
多基因家族(multigene family)——指DNA 序列具有较高的同源性(通常大于50%),并 且其编码产物具有相同或相似生理功能的一组 结构基因。
多基因家族中的基因通常是由同一祖先基因经
进化或变异而来。
ppt课件.
Ø 是由两个相同顺序的互补拷贝在同一DNA 双链上反向排列而成。
ppt课件.
7
反向重复序列的两种形式
发卡结构
ppt课件.
8
回文结构
画上荷花和尚画 书临汉字翰林书
ppt课件.
9
2. 卫星DNA(satellite DNA) : Ø 卫星DNA的重复单位一般由2~70 bp组成, 成串排列。 Ø 卫星DNA占基因组的比例随种属而异,在 0.5~31% 范围内。
4-第1章 基因组-基因组结构特征
特殊结构基因
1) 重叠基因 2) 基因套基因 (gene in gene) 3) 反义基因 4) 分裂基因 (由两段非连续DNA组成的基
因)
φX174基因组中的重叠基因
病毒基因组 的大小受到 外壳蛋白包 装体积的限 制,长度有 限,不能编 码足够数量 的基因。为 了维持生存, 存在不少重 叠基因。
假基因也能转录但功能缺失随着基因组数据的积累现在已知有不少假基因仍然保持转录的活性特别是起源于重复基因的假基因和获得启动子的加工的假基因
第1章 基因组-结构特征
1) C值悖理 2) 基因组DNA的顺序组成 3) 顺序复杂性 4) 基因与基因家族 5) 真核基因组与原核基因组
C值
悖理
生物体的单倍 体基因组所含 DNA总量称为C 值。生物基因 组的大小同生 物在进化上所 处地位的高低 无关,这种现 象称为C值悖 理(C—value paradox)。
经典遗传学: 决定表型的独立的遗传单位,
可在上下代之间传递。 分子遗传学: 由一段可转录的区域和调控区域组成的
DNA序列。 引自“An Introduction to Genetic Analysis”一书,
Suzuki DT等.
经典的基因结构
分子生物学对基因的定义为:由不同的DNA片段共同组成的一个完 整的独立的表达单元,由调控区和转录区组成,有一个特定的表达 产物。表达产物可以是RNA分子,亦可为多肽分子。
原核 与真 核生 物基 因组 结构 比较
谢谢!
假基因可以衍生新的功能
假基因可产生新的功能:
1. 产生反义RNA, 抑制靶基因功能. 2. 在RNA水平与正常基因的mRNA竞争, 起调控
作用, 如软体动物Lymnaea stagnalis 的神经细 胞NO合成酶假基因产物调控NOS酶的合成. 3. 在DNA水平与正常基因竞争转录因子, 起抑制 作用, 如老鼠的Makorin1基因的转录. 4. 作为人类免疫球蛋白多样性的顺序库.
《基因结构和基因组》PPT课件
➢基因结构(重点) ➢基因组学 ➢真核生物基因组结构及特点
1
一、基因结构
1. 基因概念:
基因是一段具有特定功能和结构的连 续的DNA片断,是编码蛋白质或RNA 分子遗传信息的基本遗传单位。
2
生物的性状是经由遗传单位传递给下一代,这个概念 在1900年由孟德尔(Gregor Mendel)提出,1909年约 翰森(Wilhelm Johanssen)将这个遗传单位的概念冠 上“gene”的名字,汉文将之翻译成“基因”,日本人 则将之翻译成“遗传子”,更为直接。 最早的观念中,基因是前述的“遗传单位”(unit of inheritance)。这是一个比较功能性的概念,它是一个 自主单位(autonomous unit),能把性状遗传给后代。 相对地,有人认为基因是一个有形的物体(physical entity),它是染色体上面一段固定的序列。这两派看 法多年来,各执一词,不相上下。
17
◆ 2. 原核生物的基因结构
非编码区 编码区上游
编码区
非编码区 编码区下游
与RNA聚酶 结合位点
RNA聚合酶能够识别调控序列中的结合位点,并与其结合。 转录开始后,RNA聚合酶沿DNA分子移动,并与DNA分子 的一条链为模板合成RNA。转录完毕后,RNA链释放出来, 紧接着RNA聚合酶也从DNA模板链上脱落下来。
10
11
基因概念的更新和不断发展
重叠基因(overlapping gene): 一个基因的核苷酸与另一个基因的核苷酸之间存
在这一定的重叠现象。
1977年,维纳(Weiner)在研究Q0病毒的基因结构时,首先发 现了基因的重叠现象。1978年,费尔(Feir)和桑戈尔(Sangor) 在研究分析φX174噬菌体的核苷酸序列时,也发现由5375个核 苷酸组成的单链DNA所包含的10个基因中有几个基因具有不同 程度的重叠,但是这些重叠的基因具有不同的读码框架。以后 在噬菌体G4、MS2和SV40中都发现了重叠基因。基因的重叠性 使有限的DNA序列包含了更多的遗传信息,是生物对它的遗传 物质经济而合理的利用,参与对基因的调控。
第01章-基因PPT课件
3.增强子(enhancer) 是一种较短的DNA序列,能够被反式作用因子识别与结合。与增强子元件结合后能够增强邻近基因转 录。位于转录起始点上游-100~-300 bp处
4. 反应元件 一类能介导基因对细胞外的某种信号产生反应的 特异的DNA序列 ●特点 具有较短的保守序列 通常位于启动子附近、启动子内或增强子区域
第二节 结构基因中贮存的遗传信息
一、 RNA的结构信息 二、 结构基因中贮存的蛋白质序列信息
●编码区 一个特定蛋白质多肽链的序列信息,也称 为开放阅读框(open reading frame,ORF) 功能 决定蛋白质分子的一级结构
RNA 聚合酶
转录因子
启动子类型
启动子构成
含有该类启动子的基因
I
TFI
I
核心元件, 上游调控元件
rRNA
II
TFII
II
TATA盒(TATA box)、几个上游启动子元件和转录起始位点
5.poly(A)信号 II类基因除了调控转录起始的序列外,在结构 基因的3‘端下游还有加尾信号。由AATAAA序列和GT丰富区,或T丰富区组成。 作用: 终止mRNA转录和为其加上poly(A)尾
(三) 基因的基本结构特点 1.原核生物基因的基本结构 5′-启动子-结构基因-转录终止子-3 ′ ●操纵子(operon) 功能上相关联的数个结构基因串联在一起, 由一套转录调控序列控制其转录,构成的基因 表达单位.
四、基因的结构特点
● 组成 一个编码特定多肽链的DNA序列+与蛋白质编码 无关的DNA序列(调控序列)
● 结构特点
1.原核生物结构基因的特点 结构基因在DNA上是连续的 2.真核生物结构基因的特点 结构基因在DNA上是不连续的(断裂基因)
第一章 基因的结构与功能(共75张PPT)
第二节 遗传物质的结构和特点
一 DNA的双螺旋结构及意义〔略〕 二 DNA的理化性质与应用
1 一般理化性质
• 晶形 DNA为白色纤维状固体
RNA为白色粉末状固体 • 两性解离
呈酸性
在中性溶液中带负电荷 • 溶解性
均溶于水
不溶于一般有机溶剂,在70%乙醇中形成沉淀
0.14MNacl 1-2MNacl DNA-蛋白 溶解度低 溶解度高
基因的功能〔2〕
近年来,发现细胞内存在为数众多的小 分子RNA,有特殊功能,它们也是转录 产物,但不翻译成蛋白质。有人主张, 编码这些RNA的DNA序列也应该叫做基 因。按此理解,基因就是染色体上具有 转录功能的DNA序列。 〔至于转录物RNA是进一步翻译或是就 以RNA的形式行使功能,是RNA的问题 〕
Chapter 1 基因的结构与功能
基因的活动是分子水平的核心 内容
• 核酸与蛋白质的结构与功能
• 基因组的结构与功能
• 基因的复制与表达 • 基因表达的调控及其生物学效应 • 生物大分子间的相互作用
• 细胞间通讯和细胞内信号转导
• 总之,人体的生长 发育 衰老 死亡等生命现象,人体 各种疾病的发生,都与一种基因或几种基因的结构与 功能有关。
RNA-蛋白 溶解度高 溶解度低
• 粘度 DNA粘度大 RNA粘度小
• 旋光性 均很强
• 密度 RNA>双链DNA; 环状DNA >开环、线状DNA 单链DNA >双链DNA
• 沉降速度: RNA >环状DNA >开环、线状DNA
• 核酸的紫外吸收
• 碱基、核苷、核苷酸和核酸在240~290nm的
• 第二个成功实验-噬菌体感染细菌。核酸 进入细菌细胞,并制造出成千上万的子 代。
《基因及基因组结构》PPT课件电子版本
第三节 真核生物核基因组
(一)真核生物核基因组特点
1.基因组较大;
低等真核生物:107-108 bp,较原核生物大 10倍;
高等真核生物:5X108-1010 bp,某些植物
和两栖生物可达1011 bp;
哺乳类生物大于2X109它们可编码100万个 基因。
2.真核生物核DNA与蛋白质结合, 形成核小体,再缠绕成染色质(染色体);
(三)基因分类
第一类是编码蛋白质的基因,它具有转录和翻 译功能,包括编码酶和结构蛋白的结构基因以 及编码阻遏蛋白的调节基因
第二类是只有转录功能而没有翻译功能的基因, 包括tRNA基因和rRNA基因
第三类是不转录的基因,它对基因表达起调节 控制作用,包括启动基因和操纵基因
二、基因组(genome)
Interspersed
~15%
Interspersed throughout genome between
and within genes; includes Alu sequences 2
and VNTRs or mini (micro) satellites
Satellite (tandem) ~10%
Nucleosome (right) • ~200 bp DNA; 2 turns of DNA plus spacer • also includes H1 histone
Nucleofilament structure
3. 基因组一般为双倍体(diploid); 4. 基因为单顺反子。
单顺反子:一个基因单独转录,一个基 因一条mRNA,翻译成一条多肽链;
Classes of repetitive DNA
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人类和老鼠核基因组重叠基因
人类INK4a/ARF基因座含两个重叠基因:p14/ARF和p16/INK4a. 这两个基因分别由两个独立的启动子调控, 共享外显子2和3, p14/ARF含外显子1β, p16/INK4a 含外显子α.
基因内基因---线虫内含子中独立的基因
线虫基因组中一段30 kb的区段中含有8个基因,其中FGAM(甘氨酰胺合 成酶)基因长25 kb,有21个内含子。内含子9中含有一个独立的基因,内含 子11中含有4个独立的基因,基因内基因分别具有独立的外显子和内含子。
不同物种的Dicer家族成员
假 基 因 (Pseudogenes)
定义: 来源于功能基因但已失去活性的DNA 顺序.
1) 重复假基因: 串接排列, 具有祖先基因的组成 特点, 具内含子和外显子,突变失活.
2) 加工假基因: 由RNA反转录再插入基因组中的 基因顺序, 无内含子.
3) 残缺假基因: 因不等交换使部分顺序缺失而失 去功能的假基因.
经典遗传学: 决定表型的独立的遗传单位, 可在上下代之间传递。
分子遗传学: 由一段可转录的区域和调控区 域组成的DNA序列,表达单位。
Suzuki DT等,“An Introduction to Genetic Analysis”, 4th edit. , 2006
基因结构
分子生物学对基因的定义为:由不同的DNA片段共同组成的一个完 整的独立的表达单元,由调控区和转录区组成,有一个特定的表达 产物。表达产物可以是RNA分子,亦可为多肽分子。
含3个独立表达的基因
人类神经成纤维细胞瘤1(neurofubromatosis1)基因编码 GTPase 的激酶, 是致癌基因RAS的负调控因子, 长350 kp, 60个内含子, 蛋白质产物2839 aa. 27号内含子编码3个独 立表达的基因.
多重可选启动子基因
果蝇求爱基因(fru)有4个启动子:
假基因有没有功能?
有两层含义: 1) 相对于原来的功能基因而言,假基因已
失去正常功能。 2) 假基因可能产生了新的功能。
假基因也能转录,但功能缺失
1) 随着基因组数据的积累, 现在已知有不少假 基因仍然保持转录活性, 特别是起源于重复 基因的假基因和获得启动子的加工的假基 因。
2) 假基因的表达产物已失去原有功能, 如产生 残缺蛋白质。
基因的 多重可选
启动子
果蝇求爱基因(fru)
有4个可选启动子,
14个外显子。在雄
性个体和雌性个体
中启用的启动子不
同,转录产物的加
工也不同。有共享
外显子,也有不同
外显子。
Dros. Info. Service 84:65-66,2001
基因家族
同一物种或不同物种中来自一个共同的祖先, 因 加倍趋异而产生的一组具有相似顺序组成的 基因成员: 1) 具有氨基酸顺序相似性; 2) 具有相同的功能域。
4) 单一假基因:由于点突变而失去功能的基因.
重复假基因
重复假基因: 串接排列, 具有祖先基 因的组成特 点, 含启动 子,内含子 和外显子,但 已突变失去 活性.
加工假基因
加工假基因: 由mRNA反转录再借助于细胞的逆转录机制插入基因组 中的基因顺序, 无内含子结构。全基因组范围分析人类基因组发现存 在19 724个假基因,与功能基因数目大致相当。这些假基因中约70% 属于加工假基因。 Genome Research 13:2559–2567,2006
隔开基因
蓝细菌Synechocystis sp. PCC6803基因组中 编码DNA聚合酶III α 亚基的基因dnaE由两 个分开表达的区段组成, dnaE-n和dnaE-c, 位于 两条相反的DNA链的 不同区段。两个独立结 构的区段转录后翻译成 两段独立多肽链,经反 式剪接组成活性蛋白。
基因内基因--人类NF1基因第27内含子
特殊结构基因
1) 重叠基因(overlapping gene) 2) 基因内基因 (gene in gene) 3) 反义基因 (antisense gene,正负链均编
码与转录) 4) 隔开基因 (separate gene)(由两段非连
续DNA组成的基因)
φX174基因组中的重叠基因
病毒基因组 的大小受到 外壳蛋白包 装体积的限 制,长度有 限,不能编 码足够数量 的基因。为 了维持生存, 存在不少重 叠基因。
高胆固醇遗传病的机 制:胆固醇是细胞必 须的成分,由低密度 脂蛋白(LDL)颗粒转 运。LDL颗粒与细胞跨 膜受体蛋白结合,借 助胞内网格蛋白内吞 进入细胞。LDL受体 基因可因不等交换突 变成残缺假基因,因 失去功能使胆固醇阻 止在胞外,滞留在血 管引起高血压。
残缺假基因
无 效 假 基 因
高等动物中均含有编码L-古洛糖酸伽马内酯氧化酶(GULO)的基因,涉 及维生素C的合成。但在人类和黑猩猩中,GULO基因未加倍,但编码 序列发生了终止突变,产生无效蛋白。GULO无效假基因一直保留在 群体中未被淘汰,通常称其为单一假基因( unitary pseudogenes )。 The Journal of Biological Chemistry 269 (18): 13685–8 ,1994
第1章 基因组-结构特征
1) C值悖理 2) 基因组DNA的顺序组成 3) 顺序复杂性 4) 基因与基因家族 5) 真核基因组与原核基因组
C值 悖理
生物体的单倍 体基因组所含 DNA总量称为C 值。生物基因 组的大小同生 物的复杂性及 其在进化上所 处的地位无关, 这种现象称为C 值悖理(C— Value paradox)。
基因组DNA的顺序组成
1) 单一顺序: 基因组中只有单拷贝的顺序,分散 分布;
2) 中度重顺序: 拷贝数在1-10万, 长度50-1000bp 在基因组中分散分布;
3) 高度重复顺序: 集中分布,串接排列,拷贝数 达数百万, 离心时形成卫星带.
不同物种基因组DNA顺序组成
什么叫基因?
1) “gene”一词的出现: 1905年, Johson首次提出. 2) “gene”一词的中文翻译最早出自谈家桢先生. 3) 基因的定义 (Genetics Glossary):