转录因子WRKY的同义密码子使用偏好性分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
拟南芥和水稻转录因子WRKY的同义密码子使用偏好性分析
生物科学2004级何瑞
指导老师刘汉梅讲师
摘要:本文首次对拟南芥和水稻WRKY基因家族的密码子用法进行了分析,发现两个物种WRKY基因的碱基组成明显不同,水稻的密码子在第一、二、三位GC含量都明显高于拟南芥,且第三位差异最大。不同物种的WRKY基因存在共同的进化趋势,即基因GC3s 逐步增大。对应性分析结果显示,拟南芥WRKY基因的密码子使用偏性受碱基组成等多种因素共同作用,水稻主要受碱基组成和基因表达水平两个因素的影响。最后确定了拟南芥和水稻WRKY基因家族的最优密码子,分别为11个和27个。研究结果为深入开展其进化、表达调控机制和提高该基因家族新成员预测的准确性等提供了重要的理论依据。
关键词:WRKY基因,密码字偏好性,GC含量,Enc
Synonymous Codon Bias of WRKY Gene Family in Aribidopsis and
Rice
HE Rui Biological Science,Grade 2004
Directed by LIU Han-mei (instructor)
Abstract: WRKY gene family were firstly analyzed on the codon bias in Arabidopsis and Rice. The components of nitrogenous bases in the two species are obviously different: the GC content at the fist, second and third position of Rice are significantly higher than those of Aribidopsis, that discrepancy at the third position is the most marked. Meanwhile, as WRKY gene family is evolving, G-ending and C-ending codons of both Aribidopsis and Rice are good for the genes evolution. According to Correspondence Analysis, the codon usage of WRKY gene in Aribidopsis is affected by many factors, such as the components of nitrogenous bases. But the components of nitrogenous bases and the gene expression level are two primary factors in Rice. The numbers of the optimal codon in Arabidopsis and Rice are 11 and 27. The results of the the research provide the accuracy of important theoretical basis of forecasts for its evolution, regulation of gene expression and adding the gene family members.
Keywords: WRKY Gene,Codon bias,GC content,Enc
蛋白质中的氨基酸序列是由mRNA中核苷酸序列决定的。mRNA上连续相邻的核苷酸以3个为一体,即三联体密码子,进行翻译时,识别与其对应的tRNA,正确的译出遗
传信息中所指定的氨基酸。遗传密码子具有通用性、线性不重叠和简并性等特点。除少数种外,原核和真核生物中核基因均采用标准的遗传编码系统进行蛋白质翻译工作。任何相邻的2个密码子之间无空位,且线性不重叠。通常,AUG作为翻译识别的起始密码子,而UGA、UAG和UAA三个密码子作为翻译终止密码子,由此构成一个完整的编码阅读框。终止密码子不编码任何的氨基酸,这样就有61种密码子编码20种氨基酸,因此出现了冗余现象,即密码子的简并性。使得某些氨基酸可能由几种不同的密码子编码,通常将编码同一氨基酸的不同密码子互称为同义密码子(Synonymous Codon)。
同义密码子编码同一氨基酸,如果没有任何选择压力或突变偏好,那么每个氨基酸位点上的核苷酸突变都是随机的,同义密码子出现的概率是一样的。但实际上,同义密码子的使用并非随机的[1,2],而是不同的物种或同一物种的不同基因在编码氨基酸时倾向使用某些特定的同义密码子,这种现象称为同义密码子的使用偏好性(Synonymous Codon Usage Bias)[3]。
同义密码子的使用偏好性广泛地存在于细菌、真菌、植物、动物及人类中,且对于不同生物,影响密码子使用偏性的因素也不尽相同,因此产生了多种解释密码子偏性使用的理论。早期关于密码子偏性理论(如密码子的选择模式在进化过程中是保守的;密码子的使用偏性与对应的同工tRNA丰度相关,从而有利于提高翻译的效率和准确性)的数据大多来源于大肠杆菌和酵母等单细胞生物[4]。而后,关于密码子使用偏性与tRNA丰度的关系,在对多细胞生物果蝇和线虫的分析中得到了与大肠杆菌和酵母相似的结论。Bierne等[5]通过分析果蝇中3种不同位点的多态性和分歧与密码子偏性的关系,认为蛋白质的选择压力是密码子偏性进化的主要原因。而关于密码子偏性与翻译效率也有不同的看法,Kanaya等[6]在研究物种特异的密码子偏性时,通过对5个真核生物(酵母、线虫、果蝇、非洲爪蟾和人)的密码子使用模式进行比较分析发现,并不是所有的高表达基因都有显著的密码子使用偏好性现象,说明真核生物中密码子的偏性并不是由翻译效率决定的,而可能和基因组中的isochore结构及含GC二核苷酸的密码子使用有关,因为后者与哺乳动物中发现的通过GC二核苷酸甲基化来调节转录有关;且在植物的密码子偏性分析中也得到了类似的结论[7]。随着基因芯片技术的产生和发展,获得组织特异基因及其表达丰度成为可能,Zhang等[8]发现看家基因的进化速率低于组织特异基因,同时指出看家基因和组织特异基因的密码子使用模式基本相似,并提出基因表达水平是决定密码子使用偏好的主要因素。
产生密码子偏性的原因主要是自然选择的结果,但并非唯一因素。其中自然选择、突