红豆杉属基因的密码子偏性分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

红豆杉属基因的密码子偏性分析

摘要:运用emboss(the european molecular biology open software suite)软件包中的chips(condon heterozygosity in a protein coding sequence)和cusp(create a condon usage table)程序对红豆杉属的52个基因的密码子偏性进行综合分析,并与大肠杆菌、酵母、拟南芥和水稻的密码子偏性进行比较。结果表明,红豆杉属基因的nc(有效密码子数)为45~58,大部分密码子使用频率较为一致。部分氨基酸密码子使用频率存在较大差异,如ala、asp、phe、gly、his、asn、arg、thr、tyr等。红豆杉属基因密码子偏性与拟南芥等双子叶植物较接近,与原核生物和单子叶植物相差较远。

关键词:红豆杉属;密码子偏性;chips;cusp

中图分类号:s791.49 文献标识码:a 文章编号:0439-8114(2013)10-2427-04

核酸是蛋白质合成的模板,编码天然蛋白质的20种氨基酸的密码子共61种,每一种氨基酸可由1个密码子(met和trp)至6个密码子(arg、leu和ser)编码[1]。编码同一种氨基酸的密码子在不同物种中具有不同的使用频率,这就造成密码子偏性(codon bias)[2]。从原核生物到真核生物,这种基因组中同义密码子使用偏性的现象普遍存在,它的产生与多种因素有关,如基因表达水平、g/c含量、trna的丰富性等[3]。密码子偏性的产生与基因的碱基组成、表达水平、编码蛋白的结构与功能等众多因素有关,且

各因素间还可能相互影响,因而进行密码子偏性分析是一个较为复杂的问题。从这些复杂的现象中分析并发现内在规律,将对新基因的预测、基因功能和表达调控机制研究、基因编码蛋白的细胞定位及分子进化研究等具有重要指导意义。

紫杉醇是从双子叶植物红豆杉(taxus brevifolia)中提炼出来的具有天然活性的双萜抗癌药物[4],是1971年从短叶红豆杉的树皮、树根和枝叶中提炼出来的[5],被广泛用于卵巢癌、非小细胞肺癌、乳腺癌等癌症的治疗[6]。目前紫杉醇主要的合成方法是化学合成,但是收益低、成本高,从红豆杉植物中提取紫杉醇会造成严重的资源破坏。产量不足,带动了紫杉醇合成的全方位的研究,其中利用生物工程方法实现紫杉醇的高产合成成为研究热点。许多科学家希望实现紫杉醇合成基因在大肠杆菌等微生物中异源表达来实现紫杉醇的生物合成。但是蛋白质在异源宿主中表达一般会受到限制,因为编码这些蛋白质的核酸序列往往含有宿主不喜欢使用的密码子,从而降低了表达效率[7]。因此,分析红豆杉属植物基因的密码子偏性对于选择基因外源表达的合适的宿主有重要意义。研究利用emboss(the european molecular biology open software suite)软件,以麦迪红豆杉和东北红豆杉为主,从红豆杉属植物中选取52个基因,对其编码区进行密码子偏性分析,并与大肠杆菌、酵母、拟南芥和水稻的密码子偏性进行比较,为利用生物工程方法实现紫杉醇的生物合成提供参考。

1 材料与方法

1.1 红豆杉基因来源

以麦迪红豆杉和东北红豆杉为主,从红豆杉属植物中选取52个基因。登录号分别为ay724737,gu568338, fj608574, eu078561,af457109,af228104, hb792670, fb922725, ay675557,ay461811,hb792772, fb922713, gu568337,ay563630, fb922731,

ay453402, hb792790,af466397, bd313599, hb792668,

ay453403,dq836053, ay644708, ay628433, hb792746,fb922723,ay452666, ay277740, ay326950,hb792782, hb792744,

ay307951, ay461450,ay188177, hb831819, hb776721,

bd313592,bd313600, bd313597, ay588482, ay505129,eu549861,ay289209, ay866412, bd313598,ay453404, eu549860,

ay571340, hb769723,ay789508, ay518383, bd313601。

1.2 分析软件与数据库

用emboss软件包中的chips(condon heterozygosity in a protein coding sequence)和cusp(create a condon usage table)程序进行密码子偏性分析[1,2]。chips可对密码子使用频率进行统计,计算特定序列中有效密码子的nc(有效密码子数),该值是一个基因的密码子使用频率与同义密码子平均使用频率偏差的量

化值。

nc=2+9/f2+1/f3+5/f4+3/f6

f=■, n﹥1,pi=ni/n

其中,n表示基因中所使用的密码子总数;k为同义密码子数量;

pi是第i个密码子的使用频率(ni/n)。

nc值与基因长度和氨基酸组成有关,因此可以对基因的密码子偏性程度提供一个客观的评价标准。cusp是对一个或多个编码序列进行阅读后计算出密码子频率。该程序可计算不同密码子在同一氨基酸编码中所占的比例,并通过外延法计算密码子在编码基因中出现的频率。本研究的大肠杆菌、酵母、拟南芥和水稻的密码子偏性数据来自密码子数据库[8]。

2 结果与分析

2.1 红豆杉属基因编码区长度与g+c含量

对从红豆杉属植物中选取的基因结构完整的52个基因进行分析(图1),其编码区长度主要为 1 200~1 600 bp。这些基因的(g+c)含量从34.0%到56.5%,平均(g+c)含量为43.7%,少数基因的(g+c)含量在50%以上(3/52)或40%以下(7/52)。如氨基变位酶基因

ay724737的(g+c)含量为56.2%,苯丙氨酸解氨酶基因gu568338的(g+c)含量为56.5%,jamyc转录因子fj608574的(g+c)含量为50.8%。(g+c)含量在40%以下的基因有7个,其中成熟酶k基因eu078561、红豆杉山定子成熟酶k基因af457109、东北红豆杉的成熟酶k基因af228104的(g+c)含量分别为34.0%、34.1%、34.7%。

2.2 红豆杉属基因有效密码子数

nc值描述密码子使用偏离随机选择的程度(并不是某个特殊密码子的使用频率与其他密码子的比较),能反映密码子家族中同义密码子非均衡使用的偏好程度。其数值范围在20(每个氨基酸只使用

相关文档
最新文档