如何构建一个高效表达真核生物基因的大肠杆菌的表达体系
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如何构建一个高效表达真核生物基因的大
肠杆菌的表达体系
华中师范大学
生命科学学院生物科学
2011211870 李书婷
概要:构建一个高效的表达体系,包括了对宿主菌的选择及相应载体的构建。
基因工程技术的核心是基因表达技术。
影响基因在大肠杆菌中表达的因素是多方面的,以下我就从载体选择、启动子、终止子、核糖体结合位点、密码子、质粒拷贝数、表达产物的稳定性、受体细胞代谢等方面说明构建大肠杆菌高效表达的方法。
大肠杆菌作为宿主菌的特点1,原核生物单细胞异样,生长快,代谢易于控制。
能快速获得大量基因代谢表达代谢产物。
2,基因结构简单,便于基因操作和基因分析。
3,原核生物内含有质粒或噬菌体,便于构建相应的载体。
4,生理代谢途径及基因表达机制比较清楚。
关键词:表达载体启动子终止子核糖体结合位点翻译密码子质粒拷贝数
一、表达载体
表达载体应具有以下条件:
1、能够独立复制。
2、应具有灵活得多克隆位点和方便的筛选标记,便于外源基因的克隆、鉴定和筛选。
而且多克隆位点应位于启动子序列之后,以使外源基因表达。
3、应具有很强的启动子,能被大肠杆菌的RNA聚合酶识别。
4、应具有使启动子受抑制的阻遏子,只有在受到诱导时才能进行转录。
5、应具有很强的终止子,以便使RNA聚合酶集中力量转录克隆的外源基因,而不转录其他无关基因。
6、所产生的mRNA必须有翻译的起始信号,即起始密码AUG和SD序列。
二、启动子
启动子是表达载体最重要的组成成分,这是因为启动子控制了基因表达的第一个阶段,决定了mRNA合成的速度。
启动子是在转录水平上影响基因表达。
转录的最大速率取决于启动子中碱基的组成,往往会因为一个碱基的不同,启动子效率可能提高上千倍。
也就是说启动子会有强弱之分。
要获得高校表达必须选择强启动子。
由于真核基因启动子不能被大肠杆菌RNA聚合酶识别,因此必须将真核基因编码区连接在大肠杆菌RNA聚合酶能够识别的强启动子控制之下。
通常用的强启动子有lac、trp、tac、bla、λP L等,将外源基因插入这类启动子的下游,可以增加基因的表达产量。
三、终止子
虽然转录终止子在表达质粒的构建过程中常被忽略,但有效的转录终止子是表达载体必不可少的元件,因为它们具有极其重要的作用。
贯穿启动子的转录将抑制启动子的功能,造成所谓的启动子封堵。
这种效应可以通过在编码序列下游的适当位置放置一转录终止子,阻止转录贯穿别的启动子来避免。
同样地,在启动目的基因的启动子上游放置一转录终止子,将最大限度地减小背景转录。
四、核糖体结合位点
1、Shine-Dalgarno(SD)序列
一般来说,mRNA与核糖体的结合程度越强,翻译的起始效率就越高,而这种结合程度主要取决于SD序列与16S rRNA的碱基互补性,其中以GGAG四个碱基序列尤为重要。
对多数基因而言,上述四个碱基中任何一个换成C或T,均会导致翻译效率大幅度降低。
2、翻译起始密码子
已知序列的绝大部分(91%)E.coli基因的翻译起始区均含有起始密码子AUG,GUG的利用率为8%,而UUG的利用率则为1%。
大肠杆菌中的起始tRNA分子可以同时识别AUG、GUG 和UUG三种起始密码子,但其识别频率并不相同,通常GUG为AUG的50%,而UUG只及AUG 的25%。
3、SD与起始密码子间的距离及碱基组成
SD序列与起始密码子之间的精确距离保证了mRNA在核糖体上定位后,翻译起始密码子
AUG正好处于核糖体复合物结构中的P位,这是翻译启动的前提条件。
在很多情况下,SD 序列位于AUG之前大约七个碱基处,在此间隔中少一个碱基或多一个碱基,均会导致翻译起始效率不同程度的降低。
紧邻AUG的前三个碱基成份对翻译起始也有影响,对于大肠杆菌b-半乳糖苷酶的mRNA 而言,在这个位置上最佳的碱基组合是UAU或CUU,如果用UUC、UCA或AGG取代之,则酶的表达水平低20倍。
4、此外,从AUG开始的前几个密码子碱基序列也至关重要,至少这一序列不能与mRNA 的5’端非编码区形成茎环结构,否则便会严重干扰mRNA在核糖体上的准确定位。
五、密码子
不同的生物,甚至同种生物不同的蛋白质编码基因,对简并密码子使用频率并不相同,具有一定的偏爱性。
对E.coli中密码子的使用频率进行系统分析得到以下结论:
(1)对于绝大多数的简并密码子中的一个或两个具有偏好;
(2)某些密码子对所有不同的基因都是最常用的,无论蛋白质的含量多少,例如CCG 是脯氨酸最常用的密码子;
(3)高度表达的基因比低表达的基因表现更大程度的密码子偏好;
(4)同义密码子的使用频率与相应的tRNA含量有高度相关性。
这些结果暗示,富含E.coli不常用密码子的外源基因有可能在E.coli中得不到有效表达。
通过用常用密码子替换稀有密码子或与“稀有”tRNA基因共表达可以提高外源基因在E.coli中的表达水平。
即通过外源基因全合成或者同步表达相关tRNA编码基因两种策略来实现高效表达。
外源基因全合成:按照大肠杆菌密码子的偏爱性规律,设计更换外源基因中不适宜的相应简并密码子,重组人胰岛素、干扰素以及生长激素在大肠杆菌中的高效表达均采用了这种方法。
同步表达相关tRNA编码基因:对于那些含有不和谐密码子种类单一、出现频率较高、而本身分子量又较大的外源基因而言,则选择相关tRNA编码基因同步克隆表达的策略较为有利。
六、质粒的拷贝数
目前实验室里广泛使用的表达型质粒在每个大肠杆菌细胞中可达数百甚至上千个拷贝,质粒的扩增过程通常发生在受体细胞的对数生长期内,而此时正是细菌生理代谢最旺盛的阶段。
质粒分子的过度增殖以及其后目的基因的高效表达势必会影响受体细胞的生长代谢,进而导致重组质粒的不稳定性以及目的基因宏观表达水平的下降。
解决上述难题的一种有效策略是将重组质粒的扩增纳入可控制的轨道pCP3拥有一个温度可诱导型的复制子在28℃时,每个细胞的质粒拷贝数为60,在42℃时,拷贝数迅速增至300 - 600,在此温度下,受体细胞染色体上的CI基因表达的温度敏感型阻遏蛋白失活,因此,用一种手段同时控制质粒拷贝数和基因的表达。
七、表达产物的稳定性
真核基因在原核细胞中表达时,可以产生融合型和非融合型表达蛋白,非融合蛋白指的是不与细菌的任何蛋白质和多肽融合在一起的表达蛋白,这类蛋白质具有近似于原核蛋白质的结构,生物学功能也更接近生物体内天然蛋白质的性质。
但当融合蛋白表达时,细胞内降解该蛋白质的蛋白酶由于应急反应,其产量也会大量增加,所以即使原始表达量很高,也会被产生的蛋白酶所降解,而实际产量仍然很低。
可以采取一些方法来提高表达产物在细菌体内的稳定性。
如将外源基因构建在融合蛋白表达载体中,产生融合蛋白。
融合蛋白与天然真核蛋白相比,在细菌体内比较稳定,不易被细菌蛋白酶所降解。
还可以利用大肠杆菌的信号肽或外源基因中自身的信号肽,把真核基因产物运输到胞浆周质的空隙中,避免外源基因被酶降解。
也可以采用定点突变的方法,改变真核蛋白二硫键的位置,来增加蛋白质的稳定性。
此外,选用大肠杆菌蛋白酶缺陷型作为宿主菌,有可能减弱表达产物的降解。
八、受体细胞的代谢
细胞的代谢负荷影响产物的表达效率。
大量的外源基因表达产物可能打破宿主细胞的正常生长代谢平衡,如大量氨基酸被用于合成与细胞生长无关的蛋白质,就会影响细胞的代谢过程。
有的表达产物对细胞有害,其大量积累可能导致细胞生长缓慢甚至死亡。
所以合理调节这种消长关系,才能使宿主细胞的代谢负荷不至过重,又能高效表达外源产物。
减轻宿主细胞代谢负荷的措施是将宿主细胞的生长和外源基因的表达分成两个阶段,首
先使宿主细胞的生长量达到饱和,在这一阶段中或采用一定的方法抑制重组质粒的复制或不诱导基因产物的合成,以减少宿主细胞的代谢负荷;在第二阶段再诱导细胞重组质粒的复制或诱导基因产物表达。