第1章 基因与基因组

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

修饰点 上游启动子元件 启动子
+1
剪接加尾
结构基因
AATAAA
翻译起始点 转录起始点 增强子 TATA盒 OCT-1 GC盒 CAAT盒 内 含 子
外显子 转录终止点
OCT-1:ATTTGCAT八聚体
顺式作用元件 (cis-acting element)
定义:影响自身基因表达活性的非编码DNA序列。 例: 启动子、增强子、沉默子等
SV40的转录单元上发现,转录起始位点上游约 200 bp处有两段长72 bp的正向重复序列。
增强子是能够提高转录效率的顺式调控元件
增强子的功能及其作用特征如下:
与被调控基因位于同一条DNA链上,属于顺 式作用元件。 是组织特异性转录因子的结合部位
不仅能够在基因的上游或下游起作用,而且 还可以远距离实施调节作用
基因是连续的
编码序列一般不重叠 编码序列所占比例远大于真核基因组而小于病毒
基因组 存在可移动的DNA序列:插入序列和转座子
二、真核生物基因组
结构特点:
都是双链线状且不止一条 断裂基因,受一系列顺式作用原件调控 结构基因产物为单顺反子 飞编码序列远多于编码区
大量重复序列和基因家族
转录起始点 DNA B A
编码序列
这些顺式作用元件往往是反式作用因子如RNA聚合酶、 特异转录因子等的结合位点。
1. 启动子 真核基因启动子是 RNA 聚合酶结合位 点周围的一组转录控制组件,至少包括一 个转录起始点以及一个以上的功能组件。 TATA盒

GC盒
CAAT盒
TATA盒,-25附近 GC盒与CCAAT盒, -30—-110附近
末端有端粒 细胞器基因组
真核基因组中存在大量重复序列
高度重复序列(highly repetitive sequence)
中度重复序列(moderately repetitive sequence) 单拷贝序列(single copy sequence)或低度重复序列
(一)高度重复序列
重复频率可达106以上,不编码蛋白质或RNA。
Hinf家族

以319bp长度的串联重复存在于人基因组中 重复序列中含有限制性内切酶Hinf I的位点。
rRNA基因重复序列属于中度重复序列

各重复单位中的rRNA基因都是相同的。 rRNA基因集中成簇存在,这样的区域称为rDNA区。 人类的rRNA基因位于13、14、15、21和22号染色 体的核仁组织区,每个核仁组织区平均含有50个 rRNA基因的重复单位。 5SrRNA基因似乎全部位于1号染色体,每个单倍体 基因组约有1000个5SrRNA基因。
一、基因的概念及分类
(二)基因的分类 按定位分类(位置):
核基因:染色体上 核外基因:胞质基因(线粒体基因、叶绿体基因) 按功能和性质分类(终产物): 编码蛋白质的基因:结构基因+调节基因 编码RNA的基因:rRNA基因、tRNA基因、核酶 基因 *启动子、增强子:对基因表达起调控作用,是不 转录的DNA区段
主要编码rRNA的基因。 II类启动子具有TATA盒结构:主要编码(mRNA) 蛋白质基因和一些小RNA。TATA盒的核心序列: TATA(A/T)A(A/T),决定RNA合成的起始位 点。 III类启动子包括A盒B盒和C盒:编码 5srRNA,tRNA,U6snRNA等RNA分子
2. 增强子(enhancer) 指一段与转录有关的短 DNA 序列,可特异地 与转录因子结合增加转录结构基因的 RNA 聚合酶 分子数量,增强转录,作用的方式通常与方向、距 离无关。
7.7Kb
1.2Kb
断裂基因的发现

1993年诺贝尔生理学/医学奖
电镜观察腺病毒hexon基因的 mRNA和其DAN分子杂交,发现 mRNA对应DNA的3个被隔开的区 域。
Richard J. Roberts(英)
Phillip A. Sharp(美)

真核生物绝大部分编码蛋白质的基因都有内含子。
沉默子(silencer) 某些基因的负性调节元件,当其结合特异蛋白
因子时,对基因转录起阻遏作用。 终止子(terminater)终止转录的一段DNA序列
(二)基因功能概述
1、遗传信息存储 2、基因的复制 3、基因的表达
基因的功能
利用碱基的不同排列荷载遗传信息。
通过复制将遗传信息稳定、忠实地遗传给子代
分类: 反向重复序列(inverted repeat sequence)
两个相同顺序的互补拷贝在同一DNA链上反向排列而 成,重复单位长度约300 bp,多数散在于基因组中,总 长度约占人基因组的5% 。
卫星DNA(satellite DNA)
主要存在于染色体的着丝粒区域,重复单位一般由 2~10 bp组成,成串排列,在人基因组中约占5%~6%。
第 1章
基因与基因组
Gene and Genome
讲授人:邓颖
主要内容

基因
基因组

基因组学
第一节
基因
Gene
中心法则
(The Central Dogma)
遗传信息传递的规律(复制、转录、翻译).
复 制 DNA 转录
RNA mRNA tRNA rRNA 转录、翻译
翻译
蛋白质
反转录 复 RNA(病毒) 制
编码rRNA和一些tRNA的基因也都有内含子。组 蛋白编码基因例外。

内含子的数量和大小决定了真核基因的大小。不 同种属中,外显子序列通常比较保守,而内含子 序列则变异较大。

外显子与内含子接头处有一段高度保守的序列, 这一共有序列是真核基因中RNA剪接的识别信号。 (内含子5
GT----AG 3 端)

(三)单拷贝序列(低度重复序列)
在单倍体基因组中只出现一次或数次, 大多数为蛋白质编码的基因,体现生物的
各种功能,因此对这些序列的研究对医学
实践有特别重要的意义。
真核基因组中存在大量的多基因家族 与假基因
多基因家族是指由某一祖先基因经过重复 和变异所产生的一组在结构上相似、功能相关 的基因。
基因家族成簇地分布在某一条染色体上,同时发挥作 用,合成某些蛋白质。如组蛋白基因家族。 基因家族的不同成员成簇地分布于不同染色体上,编 码一组功能上紧密相关的蛋白质。如球蛋白基因家族。
蛋白质。

mtDNA 的 结 构 为 环 状 分 子 , 与 原 核 生 物 的
DNA类似,结构特点也与原核生物相似。
人的线粒体基因组
线粒体基因组编码
37个基因,包括13个编 码呼吸链多酶体系的一 些多肽的基因、22个编 码mt-tRNA的基因、2
个编码mt-rRNA(16S
和12S)的基因。
超家族基因 (superfamily gene)
DNA序列相似,但功能不一定相关的若
干个单拷贝基因或若干组基因家族总称。 假基因(psuedogene)
基因组中存在的一段与正常基因非常相似
但不能表达的DNA序列。以来表示。
线粒体DNA结构有别于染色体DNA

线粒体DNA(mitochondrial DNA,mtDNA) 是核外遗传物质,能独立编码线粒体中的一些
真核生物有3类启动子,分别对应于细胞内存
在的三种不同的RNA聚合酶和相关蛋白质。
rInr:核糖体起始因子 UPE:上游启动子元件 Inr:起始元件 编码rRNA基因
编码(mRNA)蛋 白质基因和一些小 RNA
编码 5srRNA,tRNA,U6snRN A等RNA分子
I类启动子富含GC碱基对:具有I类启动子的基因

基因的5端称之为上游,3端称为下游
基因序列中开始RNA链合成的第一个核苷酸所
对应的碱基记为+1,此碱基上游的序列记为负
数,下游的序列记为正数。
2、调控序列:
百度文库
位于结构基因两侧 不被转录 调控结构基因表达
基因的调控区(顺式作用元件)
位于基因转录区前后,对基因表达起调控作用的区 域,因其是紧邻的DNA序列,又称旁侧序列。
蛋白质(病毒)
Reverse transcription
一、基因的概念及分类
(一)基因的概念
基因(gene)是核酸分子中储存遗传信息的基 本单位,是核酸分子中由特定的核苷酸按一定的碱 基顺序排列而成的具有一定功能的片段,是RNA序 列和蛋白质多肽链顺序相关遗传信息的基本存在形 式,以及表达这些信息所需要的全部核苷酸序列。 基因的化学本质是DNA(RNA病毒除外)。
二、基因的结构与功能
(一)基因的结构 操纵子(原核生物):功能相关的结构基因成簇
排列,几个结构基因共用一个mRNA分子,然后 翻译成几种蛋白质,操作元件/序列与这几个结构 基因相邻并控制mRNA分子的转录 DNA 阻遏基因
P
O
Z
Y
A
乳糖操纵子 (lac operon) 的结构
调控区 DNA
小结:启动子、增强子、沉默子、终止子的定义
启动子(promoter)
真核基因启动子是 RNA 聚合酶结合位点周围的
一组转录控制组件,至少包括一个转录起始点以及一 个以上的功能组件。 增强子(enhancer) 指远离转录起始点 (1- 30kb) 、决定基因的时 间、空间特异性、增强启动子转录活性的 DNA 序列。 其发挥作用的方式通常与方向、距离无关。
(二)中度重复序列
重复数十至数千次,大多数与单拷贝基因 间隔排列。 短分散重复片段
平均长度约300 bp~500 bp,与长度约为1000 bp的单 拷贝序列间隔排列。拷贝数可达数十万。如Alu家族、 KpnI家族、Hinf家族。
长分散重复片段
平均长度为3500 bp~5000bp,与长度约为13000bp 的单拷贝序列间隔排列。
Alu家族
重复达30~50万次,每个成员的长度约300 bp。 每个单位长度中一个限制性内切酶Alu的切点 (AG↓CT),将其切成长130bp和170bp的两段。

KpnI家族

仅次于Alu家族的第二大家族, 重复序列中含有限制性内切酶KpnⅠ的位点 呈散在分布,拷贝数约为3000~4800个
作用与序列的方向性无关 需要有启动子才能发挥作用
增强子作用 机理:
3. 沉默子(silencer)
某些基因的负性调节元件,当其结合特
异蛋白因子时,对基因转录起阻遏作用。
3. 终止子(terminater)
结构基因下游近3 ’端的一段DNA序列,
由AATAAA和一段回文序列组成,在转录中 提供终止信号,使转录作用终止。
细胞,在这一过程中为适应环境变化,可能会 发生基因突变。 作为基因表达(gene expression)的模板,使 其所携带的遗传信息通过各种RNA和蛋白质在 细胞内有序合成而表现出来。
(三)基因突变与疾病
1、单基因病 2、线粒体遗传病 3、多基因病 4、基因诊断与基因治疗
第二节
基因组
Genome
结构基因
I
P
O
Z
Y
Y: 透酶
A
Z: β-半乳糖苷酶
阻遏基因
CAP结合位点
操纵序列 启动序列
A:乙酰基转移酶
CAP : 分解(代谢)物基因激活蛋白
二、基因的结构与功能
断裂基因(真核生物):结构基因由编码序列和
非编码序列两部分组成,编码序列在DNA中是不 连续的,被非编码序列隔开
真核基因结构
真核基因结构不连续,为断裂基因(split gene)。
基因组
(genome)
细胞或生物体中,一套完整单倍体遗传物质的总和。
病毒基因组的特点
基因组小 DNA/RNA RNA病毒基因组为数条RNA组成
重叠基因
形成多顺反子 噬菌体基因是连续的,真核细胞的病毒基因是不
连续的
一、原核生物基因组
基因组通常仅有一条环状双链DNA分子 结构基因与调控序列以操纵子形式组织在一起 重复序列少
功能:
参与复制水平的调节
存在于DNA复制起点区的附近,是一些蛋白质(包 括酶)的结合位点。
参与基因表达的调控
可以转录到核内不均一RNA分子中,有些反向重复 序列可以形成发夹结构,有助于稳定RNA分子。
参与染色体配对
如卫星DNA成簇样分布在染色体着丝粒附近,可能 与染色体减数分裂时染色体配对有关。
外显子(exon);在基因序列中,出现在成熟mRNA分子 上的序列。
内含子(intron):外显子之间、与mRNA剪接过程中被 删除部分相对应的间隔序列。
全长7.7kb 包含8个外显子和7个内含子 每个基因的内含子数目比外显子数目少一个,内含子和外
显子同时出现在最初合成的mRNA前体中,在合成后被剪接
相关文档
最新文档