基因的分子结构
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基因的分子结构
吴乃虎黄美娟
(中国科学院遗传发育所)(北京大学生命科学学院)
(2011年3月修订)
一.若干概念
1. 5'—末端和3'—末端
5'—末端:系指具有一个自由的或加帽的 5'—磷酸基团( 5'-P)之核苷酸链的末端。
3'—末端:系指具有一个自由的或是磷酸化的3'—羟基(3'-OH)之核苷酸链的末端。
2. 上游与下游
这是用来描述多核苷酸链或蛋白质多肽链分子中相反取向或相对位置关系的一对术语。上游(upstream)和下游(downstream)在不同的场合代表不同的含义:
(1) 基因的DNA或mRNA分子:
上游:位于5'-末端的序列叫上游序列。
下游:位于3'-末端的序列叫下游序列。
(2) 在基因的转录反应中:
上游:位于转录起点5'-方向的DNA序列叫上游。
下游:位于转录起点3'-方向的DNA序列叫下游。
(3 )蛋白质多肽链:
上游:处于N-端的氨基酸序列为上游。
下游:处于C-端的氨基酸序列为下游。
(4) 在基因工程研究中:
上游:基因的克隆、分离、转化、表达和调节等研究工作统称上游。
下游:转基因之后的细菌培养与发酵以及转基因动植物的培育、表达产物的分离纯化及鉴定等研究工作统称下游。
3.上游序列与下游序列
在基因的DNA序列中,头一个被转录的核苷酸碱基叫做转录起点,通常是A或G,其坐标定为+1。.
(1)上游序列
位于转录起点5'一侧的DNA叫做上游序列。其核苷酸碱基的坐标定为负。例如-1 -5,-10.......。
(2) 下游序列
位于转录起点3'-侧的DNA叫做下游序列。其核苷酸碱基的坐标定为正。例如+3,+5,+10.......。
4. 5'-侧翼序列区和3'-侧翼序列区
(1) 5'-侧翼序列区(5'-flanking sequence region)
位于mRNA转录起点之前的一段长度有限的DNA序列区,叫做5'-侧翼序列区,或者泛称为启动子区。在该区存在着数种控制基因转录的信号:
a. 确定mRNA起点的信号
b. 决定最大转录起始速率的信号
c. 对环境刺激作出反应的信号
d. 对发育程序作出反应的信号
e. 增强子序列区
(2) 3'-侧翼序列区(3'-flanking sequence region)
位于mRNA转录终点之后的一段长度有限的DNA序列区,叫做3'-侧翼序列区,也叫做3'-下游序列区。在该区存在着数种控制基因转录的信号:
a. 终止转录作用的信号
b. mRNA3'-末端的加工信号
c. 大多数真核基因的3'-末端还有一段poly(A)加尾信号,即多聚腺苷酸化信号
(3) 旁侧DNA(flanking DNA)
这个术语与上述所说的侧翼序列区的概念不同。指的是与目的基因之核苷酸序列两端紧密相邻的,但是位于基因核苷酸序列外侧的DNA序列或基因。
5.前导序列区和尾随序列区
(1) 前导序列区(leader sequence region)
指位于mRNA 5'-末端,起始密码子之前的一段长达数百个核苷酸的不转译的RNA区段,叫做前导序列区,也叫前导序列或5'-非转译区,简称5'-UTR。它含有如下
两种元件:a. 核糖体结合位点(Ribosome-binding site ,RBS)
b. 转译起始信号
(2)尾随序列区(trailer sequence region)
指位于mRNA 3'-末端,终止密码子之后的一段非转译的核苷酸序列,叫做尾随序列区,也叫做尾随序列或3'-非转译区,简称3'-UTR,其长度约为100个核苷酸左右,它含有一个转录终止信号。
6. 核苷酸序列的同源性和相似性
(1) 同源性(homology)
定义:一指蛋白质的同源性—即两种或数种蛋白质多肽链之间氨基酸序列的相似性。
二指核酸的同源性—即两种或数种核酸分子之间核苷酸序列的相似性。
要点:无论何种情况,序列的同源性均是起因于它们的编码基因之间有着共同的祖先。
显而易见,就基因的进化而言,它们之间只有"有关"或"无关"两种情况,介于二
者之间的情况是不存在的。因此,说不同序列或不同基因之间具有"百分之几的同
源性",抑或是说具有"很高的同源性"或"很低的同源性",都是不科学的,没有意
义的。
什么叫同源基因 (homologous gene) 呢?
它是指来自不同的物种,但编码着同样的蛋白质产物,具有共同的进化祖先的基因。
同源基因的核苷酸序列往往具有很高的相似性,因此可以作为DNA杂交的探针使用。
(2) 相似性(similarity)
这是用来描述不同的核酸分子之间或不同的蛋白质多肽链之间,核苷酸序列或氨基
酸序列一致性程度的一种术语。
不同序列之间的相似性或说是相关性的程度,是用序列的一致性(identity)或保
守性(conservation)来衡量的。
很显然,不同序列之间的相似性程度是不一样的,有高有低,可以用“百分比”或“高度相似性”、“低水平相似性”等带有度量性含意的语言来表述。
需要指出的是,核苷酸序列具有高度的相似性的基因或者蛋白质,往往是同源的。
(3)一致性(identity)
定义:“identity”有时也译作“同一性”,系指被比对的两种甚至数种的核苷酸序列
或氨基酸序列之间,在相同的位置具有同样的核苷酸单元或同样的氨基酸单元的水