密码子偏性分析精品资料
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.3密码子偏性分析
采用CodonW1.4.2软件分析CDS,获得有效密码子数,第1位、第2位和第3位碱基中GC含量以及相对同义密码子使用度。根据ENC值对基因由大到小排序,抽取前后10%的基因分别作为样本的高表达样本组和低表达样本组,分别计算各个密码子的RSCU值,卡方检验确定高表达基因的优越密码子。
2.2ENC-plot曲线
ENC值是一个基因的密码子使用频率与同义密码子平均使用频率偏差的量化值。高表达基因的密码子趋向于使用一种或几种同义密码子,偏爱程度越大,ENC值越小;反之,低表达基因含有的稀有密码子种类多,偏好程度小,ENC值越大[6-7]。ENC-plot曲线是以ENC值为纵坐标,密码子第3位GC含量(GC3s)为横坐标,描述ENC与GC3s之间函数关系的曲线,能有效分析密码子的偏好性,无选择压力下,表示ENC值的点应落在曲线上。如果密码子偏好主要受碱基组成的影响,ENC值则位于曲线附近;如果密码子受选择压力的影响,偏好性显著,相应的点则位于曲线下方。曲线上方对应的基因偏向于随机使用密码子[8]。在普通羊肚菌的全基因组中较少的基因位点分布在ENC-plot曲线上,大部分基因都不同程度的偏离曲线(图1),表明少数基因的密码子偏好性受基因的碱基组成影响,大部分基因在进化过程中受环境选择压力等其他因素的影响从而使密码子的偏好性发生差异。
1材料与方法
1.1标本
普通羊肚菌(M.conica)于2015年5月采自云南省昆明市禄劝县轿子山,标本经上海市农业科学院转基因环境安全评价实验室提取基因组DNA,交由上海派森诺生物公司测序,并将ITS序列提交到NCBI网站进行BLAST比对后鉴定为普通羊肚菌。
1.2CDS获得
将样品的基因组DNA构建400bp、700bpPairedEnd文库和3000bp、10000bpMatepair文库,运用读长为2*250bp的Miseq技术组装文库,SOAPdenovo软件评价组装结果。采用C语言编写程序剔除序列长度小于300bp(氨基酸数量小于100)CDS作为分析样本[5]。
密码子偏性分析
摘要:
采用CodonW1.4.2软件和CUSP程序,以普通羊肚菌全基因组蛋白质编码序列为对象,解析了该菌的有效密码子数、密码子3个位点的GC含量、相对同义密码子使用度和高表达优越密码子。结果表明:普通羊肚菌全基因组密码子第2位密码子的GC含量明显低于第1位和第3位,第3位密码子与第1位含量差异不大,分别为57.8%和56.8%,RSCU值大于等于1的密码子总共35个,其中以G或C结尾的25个,占71.4%,确定了25个高表达优越密码子。
2.3相对同义密码子使用度
RSCU值反映的是密码子在编码同义氨基酸间的相对概率,当同义密码子对应氨基酸的使用频率相同,则相对密码子使用度就是1。当密码子的使用频率相对较高时则相对密码子使用度大于1(高频密码子),反之当密码子的使用频率相对较低时则相对密码子使用度小于1[9]。普通羊肚菌中RSCU值大于等于1的密码子总共35个,其中以G或C结尾的25个,占71.4%;以A或T结尾的10个,占28.6%(表1)。
2结果与分析
2.1有效密码子数与GC含量
获得9676个CDS作为分析样本,经CodonW1.4.2软件分析获得全基因组共计9981条基因的4497467个密码子,密码子中不同位置GC含量不同,其中第2位的GC含量较低,为42%,第1位和第3位的GC含量差异较小,分别为57.8%和56.8%,GC平均含量为52.2%。
关键词:
普通羊肚菌;编码序列;密码子偏好性;优越密码子
生物界中大部分物种均采用标准的遗传编码系统进行蛋白质翻译,密码子是生物体内信息传递的基本单元,3个碱基组成的密码子为基本的氨基酸翻译单位,ATCG4种碱基共形成了64种不同的密码子,在长期的物种进化过程中,形成了较为固定的起始密码子ATG和3种终止密码子TAA、TAG和TGA,除去3种终止密码子后实际编码氨基酸的密码子共有61种,但是最终编码的氨基酸只有20种,由此存在了密码子冗余的现象,即一种氨基酸可由多种密码子编码,这些编码相同氨基酸的密码子称之为同义密码子。不同的物种编码同种氨基酸所利用的密码子种类不同,使用频率也不同,这种现象称为密码子偏好性。最早关于密码子偏好性的研究是1989年BONEKAMP发现大肠杆菌全基因组偏好性[1]。普通羊肚菌是著名的珍稀食药用菌,味道鲜美,营养丰富,具有提神醒脑、补肾壮阳和抗肿瘤的功效[2-4],笔者以普通羊肚菌全基因组蛋白质编码序列为对象,通过CodonW软件和CUSP程序分析该菌的密码子使用特征,为羊肚菌基因选择合适的表达系统,优化密码子和提高基因表达量等奠定研究基础。
2.4优越密码子
经分析确定了TTC、CTC和ATC等25个密码子为普通羊肚菌的优越密码子,这些优越密码子将为外源基因在羊肚菌中的表达提供了编码基因序列优化的参考,也将显著提高外源基因的表达水平和翻译准确率。
3讨论
GC含量在同义密码子使用偏好性的过程中具有重要的作用,密码子偏好性强的基因使用G或C结尾密码子的概率要大,第3位密码子的变异往往是密码子偏好性发生变化的决定性因素[10]。在物种长期进化过程中,环境和选择压力差异造成了不同的进化历程,所以任何物种为适应其特定的环境和基因组条件,都要形成自己特定的符合其基因组的密码子使用法则。密码子偏好性受多个因素的影响,如基因表达水平[11]、mRNA二级结构[12]、翻译效率[13]、基因的碱基组分[14]、基因长度[15-16]、二核苷酸的出现频率[17]、RNA丰度[18]、编码蛋白质的结构和功能[19]及密码子-反密码子间结合能的大小[20]。在不存在自然选择压力的条件下,一定方向的突变压力会造成基因编码序列的碱基组成差异,同样,这种突变压力也会影响密码子的第3位碱基种类[21]。在进化过程中,若A(T)到G(C)的突变压力大,那么密码子的第3位碱基是G(C)的概率就要高[22]。对于普通羊肚菌而言,密码子的碱基组成中第3位碱基上GC含量为57.8%,高于A(T)的含量,说明与普通羊肚菌密码子偏好性一致的物种在进化过程中A(T)到G(C)的突变压力高于G(C)到A(T)的突变压力。普通羊肚菌的优越密码子的确定对于今后羊肚菌转基因过程中对构建合适的转基因表达系统具有重要的指导意义,针对普通羊肚菌所偏好的密码子进行优化改造源自文库的基因,从而提高目的蛋白质的表达量,同时为普通羊肚菌基因外源表达选择适合的宿主提供重要基础,为食药用真菌的密码子优化建立参考模本。
采用CodonW1.4.2软件分析CDS,获得有效密码子数,第1位、第2位和第3位碱基中GC含量以及相对同义密码子使用度。根据ENC值对基因由大到小排序,抽取前后10%的基因分别作为样本的高表达样本组和低表达样本组,分别计算各个密码子的RSCU值,卡方检验确定高表达基因的优越密码子。
2.2ENC-plot曲线
ENC值是一个基因的密码子使用频率与同义密码子平均使用频率偏差的量化值。高表达基因的密码子趋向于使用一种或几种同义密码子,偏爱程度越大,ENC值越小;反之,低表达基因含有的稀有密码子种类多,偏好程度小,ENC值越大[6-7]。ENC-plot曲线是以ENC值为纵坐标,密码子第3位GC含量(GC3s)为横坐标,描述ENC与GC3s之间函数关系的曲线,能有效分析密码子的偏好性,无选择压力下,表示ENC值的点应落在曲线上。如果密码子偏好主要受碱基组成的影响,ENC值则位于曲线附近;如果密码子受选择压力的影响,偏好性显著,相应的点则位于曲线下方。曲线上方对应的基因偏向于随机使用密码子[8]。在普通羊肚菌的全基因组中较少的基因位点分布在ENC-plot曲线上,大部分基因都不同程度的偏离曲线(图1),表明少数基因的密码子偏好性受基因的碱基组成影响,大部分基因在进化过程中受环境选择压力等其他因素的影响从而使密码子的偏好性发生差异。
1材料与方法
1.1标本
普通羊肚菌(M.conica)于2015年5月采自云南省昆明市禄劝县轿子山,标本经上海市农业科学院转基因环境安全评价实验室提取基因组DNA,交由上海派森诺生物公司测序,并将ITS序列提交到NCBI网站进行BLAST比对后鉴定为普通羊肚菌。
1.2CDS获得
将样品的基因组DNA构建400bp、700bpPairedEnd文库和3000bp、10000bpMatepair文库,运用读长为2*250bp的Miseq技术组装文库,SOAPdenovo软件评价组装结果。采用C语言编写程序剔除序列长度小于300bp(氨基酸数量小于100)CDS作为分析样本[5]。
密码子偏性分析
摘要:
采用CodonW1.4.2软件和CUSP程序,以普通羊肚菌全基因组蛋白质编码序列为对象,解析了该菌的有效密码子数、密码子3个位点的GC含量、相对同义密码子使用度和高表达优越密码子。结果表明:普通羊肚菌全基因组密码子第2位密码子的GC含量明显低于第1位和第3位,第3位密码子与第1位含量差异不大,分别为57.8%和56.8%,RSCU值大于等于1的密码子总共35个,其中以G或C结尾的25个,占71.4%,确定了25个高表达优越密码子。
2.3相对同义密码子使用度
RSCU值反映的是密码子在编码同义氨基酸间的相对概率,当同义密码子对应氨基酸的使用频率相同,则相对密码子使用度就是1。当密码子的使用频率相对较高时则相对密码子使用度大于1(高频密码子),反之当密码子的使用频率相对较低时则相对密码子使用度小于1[9]。普通羊肚菌中RSCU值大于等于1的密码子总共35个,其中以G或C结尾的25个,占71.4%;以A或T结尾的10个,占28.6%(表1)。
2结果与分析
2.1有效密码子数与GC含量
获得9676个CDS作为分析样本,经CodonW1.4.2软件分析获得全基因组共计9981条基因的4497467个密码子,密码子中不同位置GC含量不同,其中第2位的GC含量较低,为42%,第1位和第3位的GC含量差异较小,分别为57.8%和56.8%,GC平均含量为52.2%。
关键词:
普通羊肚菌;编码序列;密码子偏好性;优越密码子
生物界中大部分物种均采用标准的遗传编码系统进行蛋白质翻译,密码子是生物体内信息传递的基本单元,3个碱基组成的密码子为基本的氨基酸翻译单位,ATCG4种碱基共形成了64种不同的密码子,在长期的物种进化过程中,形成了较为固定的起始密码子ATG和3种终止密码子TAA、TAG和TGA,除去3种终止密码子后实际编码氨基酸的密码子共有61种,但是最终编码的氨基酸只有20种,由此存在了密码子冗余的现象,即一种氨基酸可由多种密码子编码,这些编码相同氨基酸的密码子称之为同义密码子。不同的物种编码同种氨基酸所利用的密码子种类不同,使用频率也不同,这种现象称为密码子偏好性。最早关于密码子偏好性的研究是1989年BONEKAMP发现大肠杆菌全基因组偏好性[1]。普通羊肚菌是著名的珍稀食药用菌,味道鲜美,营养丰富,具有提神醒脑、补肾壮阳和抗肿瘤的功效[2-4],笔者以普通羊肚菌全基因组蛋白质编码序列为对象,通过CodonW软件和CUSP程序分析该菌的密码子使用特征,为羊肚菌基因选择合适的表达系统,优化密码子和提高基因表达量等奠定研究基础。
2.4优越密码子
经分析确定了TTC、CTC和ATC等25个密码子为普通羊肚菌的优越密码子,这些优越密码子将为外源基因在羊肚菌中的表达提供了编码基因序列优化的参考,也将显著提高外源基因的表达水平和翻译准确率。
3讨论
GC含量在同义密码子使用偏好性的过程中具有重要的作用,密码子偏好性强的基因使用G或C结尾密码子的概率要大,第3位密码子的变异往往是密码子偏好性发生变化的决定性因素[10]。在物种长期进化过程中,环境和选择压力差异造成了不同的进化历程,所以任何物种为适应其特定的环境和基因组条件,都要形成自己特定的符合其基因组的密码子使用法则。密码子偏好性受多个因素的影响,如基因表达水平[11]、mRNA二级结构[12]、翻译效率[13]、基因的碱基组分[14]、基因长度[15-16]、二核苷酸的出现频率[17]、RNA丰度[18]、编码蛋白质的结构和功能[19]及密码子-反密码子间结合能的大小[20]。在不存在自然选择压力的条件下,一定方向的突变压力会造成基因编码序列的碱基组成差异,同样,这种突变压力也会影响密码子的第3位碱基种类[21]。在进化过程中,若A(T)到G(C)的突变压力大,那么密码子的第3位碱基是G(C)的概率就要高[22]。对于普通羊肚菌而言,密码子的碱基组成中第3位碱基上GC含量为57.8%,高于A(T)的含量,说明与普通羊肚菌密码子偏好性一致的物种在进化过程中A(T)到G(C)的突变压力高于G(C)到A(T)的突变压力。普通羊肚菌的优越密码子的确定对于今后羊肚菌转基因过程中对构建合适的转基因表达系统具有重要的指导意义,针对普通羊肚菌所偏好的密码子进行优化改造源自文库的基因,从而提高目的蛋白质的表达量,同时为普通羊肚菌基因外源表达选择适合的宿主提供重要基础,为食药用真菌的密码子优化建立参考模本。