密码子偏性分析精品资料

合集下载

密码子使用偏好性参数汇总

密码子使用偏好性参数汇总

研究密码子偏好性常用的参数1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU )是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。

如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。

第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下:公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。

研究中通常先利用高表达基因的RSCU值建立参考表格。

2、密码子适应指数(Codon Adaptation Index, CAI)可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。

CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。

CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。

w ij(The relative adaptiveness of a codon): 密码子相对适应度上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值L是指基因中所使用的密码子数。

3、密码子偏好参数(Codon Preference Parameter, CPP)CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。

它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。

x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除)4、有效密码子数(Effective Number of Codon, ENC)ENC值的范围在20~ 61之间, 越靠近20偏性越强。

密码子偏好性

密码子偏好性
CCC (6.2)
CAC (7.3)
CGC (14.0)
C
CUA (5.6)
CCA (9.1)
CAA (14.4)
CGA (4.8)
A
CUG (37.4)
CCG (14.5)
CAG (26.7)
CGG (7.9)
G
A
AUU (29.6)
ACU (13.1)
AAU (29.3)
AGU (13.2)
U
AUC (19.4)
ACC (18.9)
AAC (20.3)
AGC (14.3)
C
AUA (13.3)
ACA (15.1)
AAA (37.2)
AGA (7.1)
A
AUG (23.7)
ACG (13.6)
AAG (15.3)
AGG (4.0)
G
G
GUU (21.6)
GCU (18.9)
GAU (33.7)
GGU (23.7)
精氨酸
Arginine
Arg
R
CGU,CGC,CGA,CGG,AGA,AGG
天冬酰胺
Asparagine
Asn
N
AAU,AAC
天冬氨酸
Asparticacid
Asp
D
GAU,GAC
半胱氨酸
Cystine
Cys
C
UGU,UGC
谷氨酸
Glutamicacid
Glu
E
GAA,GAG
谷氨酰胺
Glutarnine
A
UUG (12.9)
UCG (4.4)
UAG (0.8)
UGG (13.2)

密码子使用偏好性参数汇总

密码子使用偏好性参数汇总

密码子使用偏好性参数汇总研究密码子偏好性常用的参数1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU )是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。

如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU 值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。

第i 个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下:公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。

研究中通常先利用高表达基因的RSCU值建立参考表格。

2、密码子适应指数(Codon Adaptation Index, CAI)可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。

CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。

CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。

w ij(The relative adaptiveness of a codon): 密码子相对适应度上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值L是指基因中所使用的密码子数。

3、密码子偏好参数(Codon Preference Parameter, CPP)CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。

它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。

x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i 个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除)4、有效密码子数(Effective Number of Codon, ENC)ENC值的范围在20~ 61之间, 越靠近20偏性越强。

密码子偏好性分析

密码子偏好性分析
Abstract Lipopolysaccharide-binding protein(LBP) is key factor in identifying endotoxin of gram-negative bacterium and starting immune response. The aim of this study was to understand LBP gene codon use features and provide foundation for selecting appropriate receptor animals and expression systems. In this
摘 要 脂多糖结合蛋白(lipopolysaccharide-binding protein, LBP)是机体识别革兰氏阴性菌内毒素并启 动免疫反应的关键因子。为了了解 LBP 基因的密码子使用特性,为其选择合适的受体动物以及最佳外源 表达系统提供依据,本研究运用 CHIPS、CUSP 和 CodonW 在线程序分析自主电子克隆的猪(Sus scrofa) LBP 基因(GenBank 登录号: NM-001128435.1)的密码子偏好性,并与猪 8 种抗病相关基因、模式生物基因 组以及其他物种 LBP 基因相比较。结果表明,猪 LBP 基因大部分偏好使用以 G/C 结尾的密码子,27 种偏 好密码子(相对使用度(RSCU)>1)中偏好性较强的有 GCC、CAC、CTG 和 TCC(RSCU≥2),而猪 8 种抗病 相关基因有 23 种偏好密码子,全部以 G/C 结尾,并且偏好性较强的密码子有 GCC、ATC、CTG 和 GTG;通 过比较 14 种动物的 LBP 基因密码子偏好性,发现 14 个物种的 LBP 基因表达水平一般,并且都偏好以 G/C 结尾的密码子;聚类分析发现,偶蹄目猪与 2 种食肉目动物(猫(Felis catus)和狗(Canis))聚为一类,与系统 分类关系不一致;在密码子的使用频率上,猪 LBP 基因与小鼠(Mus musculus)基因组的差异小于大肠杆菌 (Escherichia coli)和酵母菌(Saccharomyces)等 2 种模式生物基因组,故小鼠更适合作为该 LBP 基因的外源表 达宿主。本研究结果为 LBP 基因在动物遗传改良中选择合适的受体动物、选择最佳的外源表达系统以及 提高其表达水平提供一定的理论依据。 关键词 猪,脂多糖结合蛋白基因(LBP),密码子偏好性

向日葵全基因组NBS抗病基因密码子使用偏好性分析

向日葵全基因组NBS抗病基因密码子使用偏好性分析

向日葵全基因组NBS抗病基因密码子使用偏好性分析刘洋路妍景岚关键词:向日葵;NBS抗病基因;密码子偏好性;密码子相关参数;相关性分析向日葵(HelianthusannuusL.)别称太阳花、朝阳花属菊科(Asteraceae)向日葵属(HelainthusL.),是世界各地均有栽培的重要的油料作物。

原产地位于南美洲,起初用于观赏。

现我国新疆、内蒙古、黑龙江等北方地区均有栽培。

据张一宾等在2022年的统计,全球向日葵种植面积约为2540万hm2,同比上年增长1.0%[1]。

向日葵生长发育的过程中受到许多病原物侵染是向日葵产量下降的主要原因,而培育和科学利用抗病品种是控制植物病害最经济有效的方式。

抗病品种防御抵抗力强,能大大减少田间防治的成本,还能减少因使用农药造成的环境污染。

当植物受到病原菌刺激后会发出一系列的信号,并分泌抗病基因编码的抗病蛋白(R蛋白),通过识别病原菌分泌出的效应因子(Avr)后,再将信号进行传导继而引发一系列防御反应,最终就可以迅速地抑制病原菌对植物的侵染[2]。

核苷酸结合位点作为R基因所编码的蛋白中高度保守的区域之一,在抗病过程中起重要作用[3]。

核苷酸结合位点(nucleotidebindingsite,简称NBS)型蛋白有3个保守结构域[4],分别是磷酸结合环(P-loop,别称Kinase-1a)、激酶2a(Kinase-2a)、激酶3a(Kinase-3a),它们一起构成了抗病蛋白的(ATP/GTP)水解和抗病信号的传递[5]。

除了这3个保守结构域外,NBS还含有其他几个保守区域,像GLPL和MHD等[6]。

有研究表明,植物NBS型抗病基因是植物抗病基因中最大的一类,在植物自然免疫中起着重要的作用。

密码子(codon)指mRNA或DNA中每相邻的3个核苷酸编为一组序列,编码某一种特定氨基酸,是生物体内信息传递的基本环节。

密码子偏性是生物体中编码同一种氨基酸的同义密码子的非均衡使用现象,由于这一现象与DNA和蛋白质相关联,所以具有重要的生物学意义。

密码子偏好性分析..

密码子偏好性分析..

手段 ,通过比较核基因编码的核糖体蛋白和线粒体基 因编码的核糖体蛋白上密码子使用模式的差异来预测 未知蛋白的基因所在基因组位置。
(二)通过密码子使用偏好性的研究, 可以判定一些最优
密码子,针对这些密码子设计基因工程表达载体可以提高目 的基因的表达量 。 (三)利用密码子使用偏好性和某种功能的关联程度对某些 未知功能基因进行预测利用已知的密码子偏好知识对未知表 达水平 的 基 因 进行 判 定 初步判断该基因的表达水平高或 低。 (四)利用编码区和非编码区的基因组特征差异进行全基因 组扫描,发现新基因。 密码子使用偏性的影响因素:

其中,n表示这个密码子所代表的氨基酸的同义密码子种类数目(1<n6), 戈代表第i个密码子的出现次数。RSCU是衡量密码子偏性较直观的一个参数。
密码子适应指数( Codon adaption index , CAI ) 该指数以一组具高表达水平的基因为参考 , 测量某一个基因的密码子偏 好情况和这些高表达基因密码子偏好情况的接近程度 , 如果一个基因完 全使用高表达基因中所用的密码子 , 则其 C AI 值为 1 。目前这个指数已 被广泛用来预测基 因 的 表 达 水平。

进行查询
如只需要基因序列而不需要详细信息,则需点击TASTA

如需进行图文分析,则点击Graphics
计算同义密码子相对使用度(Relative synonymous codon
usage, RSCU) 在genebank中取出序列后,用codonw进行在线分析
结果如下:
利用cusp计算密码子Franction和Frequency。 Franction:各个密码子在编码该氨基酸的密码子中所占的比例。 Frequency:该密码子在编码总基因密码子中出现的频率。

密码子数据库及密码子偏好性分析软件

密码子数据库及密码子偏好性分析软件

密码子数据库及密码子偏好性分析软件题记:转基因研究中经常要进行基因的异源表达,在翻译过程中,受体物种对外源基因密码子的翻译效率对表达有非常大的制约。

因此,利用相应的生物信息学数据库及软件对目标序列进行受体物种的密码子偏好性分析将有助于完成对转基因效率的评价,适当选择合适的受体物种进行高效、可行的表达。

人物,阅读前,让我们感谢下列科学家,是他们为基因异源高效表达提供有价值参考。

Yasukazu Nakamura博士:The First Laboratory for Plant Gene Research,Kazusa DNA Research Institute 开发Codon Usage Database(生物密码子表的利用情况统计)。

PrimerX:编写了Codon Usage Analyzer在线密码子统计表处理软件(/cgi-bin/codon.cgi),它使得对密码子的统计用图表的形式显示出来,更加的直观可读。

Morris Maduro博士:针对E. coli开发了E. coli Codon Usage Analyze 。

目前的版本为2.1。

Thomas Schödl:开发设计的以图形形式对异源基因表达的密码子使用分析软件(Graphical codon usage analyser),用以帮助异源基因表达时对异源基因进行改造,以适应受体物种,避免由于翻译时密码子使用情况的限制使受体物种对外源基因表达产生负面影响。

内容:一:密码子使用统计数据库Codon Usage Database(.jp/codon/ 是由植物基因研究第一实验室(The First Laboratory for Plant Gene Research)Kazusa DNA Research Institute的Yasukazu Nakamura博士开发的生物密码子表的利用情况统计。

数据来源于GenBank 的DNA 序列数据库,是GenBank 的Codon Usage Tabulated 数据库在WWW模式下的扩展和整合。

红豆杉属基因的密码子偏性分析

红豆杉属基因的密码子偏性分析

红豆杉属基因的密码子偏性分析摘要:运用emboss(the european molecular biology open software suite)软件包中的chips(condon heterozygosity in a protein coding sequence)和cusp(create a condon usage table)程序对红豆杉属的52个基因的密码子偏性进行综合分析,并与大肠杆菌、酵母、拟南芥和水稻的密码子偏性进行比较。

结果表明,红豆杉属基因的nc(有效密码子数)为45~58,大部分密码子使用频率较为一致。

部分氨基酸密码子使用频率存在较大差异,如ala、asp、phe、gly、his、asn、arg、thr、tyr等。

红豆杉属基因密码子偏性与拟南芥等双子叶植物较接近,与原核生物和单子叶植物相差较远。

关键词:红豆杉属;密码子偏性;chips;cusp中图分类号:s791.49 文献标识码:a 文章编号:0439-8114(2013)10-2427-04核酸是蛋白质合成的模板,编码天然蛋白质的20种氨基酸的密码子共61种,每一种氨基酸可由1个密码子(met和trp)至6个密码子(arg、leu和ser)编码[1]。

编码同一种氨基酸的密码子在不同物种中具有不同的使用频率,这就造成密码子偏性(codon bias)[2]。

从原核生物到真核生物,这种基因组中同义密码子使用偏性的现象普遍存在,它的产生与多种因素有关,如基因表达水平、g/c含量、trna的丰富性等[3]。

密码子偏性的产生与基因的碱基组成、表达水平、编码蛋白的结构与功能等众多因素有关,且各因素间还可能相互影响,因而进行密码子偏性分析是一个较为复杂的问题。

从这些复杂的现象中分析并发现内在规律,将对新基因的预测、基因功能和表达调控机制研究、基因编码蛋白的细胞定位及分子进化研究等具有重要指导意义。

紫杉醇是从双子叶植物红豆杉(taxus brevifolia)中提炼出来的具有天然活性的双萜抗癌药物[4],是1971年从短叶红豆杉的树皮、树根和枝叶中提炼出来的[5],被广泛用于卵巢癌、非小细胞肺癌、乳腺癌等癌症的治疗[6]。

密码子偏好表

密码子偏好表

密码子偏好表是指生物体内不同基因在不同组织或不同细胞类型中的密码子使用偏好性。

它反映了基因在不同环境下的表达和翻译效率。

密码子偏好性对于理解基因表达调控、药物设计和生物信息学等领域具有重要意义。

首先,从遗传密码的特性来看,密码子偏好性是必然存在的。

生物体使用的密码子有3个,分别代表不同的氨基酸。

由于自然界中氨基酸的种类有限,因此不同的密码子在生物体内出现的频率必然有所不同。

这反映了基因在不同环境下的表达和翻译效率。

其次,不同基因在不同组织或不同细胞类型中的密码子偏好性存在差异。

这种差异可能是由于基因在特定组织或细胞类型中的表达调控机制所致。

例如,某些基因在某些组织中的表达可能受到转录因子或RNA加工机制的影响,而这些机制可能会影响密码子的使用偏好性。

再者,密码子偏好性受到生物体内各种因素的影响,如代谢状态、环境压力、营养条件等。

这些因素可能通过影响基因的表达和翻译效率来影响密码子的使用偏好性。

此外,遗传变异和进化也可能会影响密码子的使用偏好性,从而使不同的物种和种群表现出不同的密码子偏好性。

具体来说,某些密码子在生物体内可能更常见于编码某些特定的氨基酸,而其他密码子则可能较少出现。

这可能是由于某些氨基酸在生物体内的需求较高,因此在基因表达和翻译过程中更频繁地使用某些密码子。

此外,某些氨基酸可能与特定的辅因子或信号分子结合,从而影响其翻译效率,这也可能导致某些密码子的偏好性。

总之,密码子偏好表反映了生物体内不同基因在不同组织或不同细胞类型中的密码子使用偏好性。

这种偏好性是基因在不同环境下的表达和翻译效率的体现,同时也受到各种因素的影响。

密码子偏好性对于理解基因表达调控、药物设计和生物信息学等领域具有重要意义。

通过研究密码子偏好性,我们可以更好地了解生物体的基因表达机制和蛋白质合成过程,从而为药物设计和疾病治疗提供新的思路和方法。

密码子偏好性

密码子偏好性
CCC (6.2)
CAC (7.3)
CGC (14.0)
C
CUA (5.6)
CCA (9.1)
CAA (14.4)
CGA (4.8)
A
CUG (37.4)
CCG (14.5)
CAG (26.7)
CGG (7.9)
G
A
AUU (29.6)
ACU (13.1)
AAU (29.3)
AGU (13.2)
U
AUC (19.4)
GCA (15.8)
GAA (29.0)
GGA (16.5)
A
GUG (28.1)
GCG (7.4)
GAG (39.6)
GGG (16.5)
G
表2大肠杆菌密码子偏好性
第二位碱基(‰)
第三位碱基
U
C
A
G
第一位碱基
U
UUU (24.4)
UCU (13.1)
UAU (21.6)
UGU (5.9)
U
UUC (13.9)
Trp
W
UGG
酪氨酸
Tyrosine
Tyr
Y
UAU,UAC
缬氨酸
Valine
Val
V
GUU,GUC,GUA,GUG
起始密码子
AUG
终止密码子
UAG,UGA,UAA
U
GUC (13.1)
GCC (21.6)
GAC (17.9)
GGC (20.6)
C
GUA (13.1)
GCA (23.0)
GAA (35.1)
GGA (13.6)
A
GUG (19.9)

不同哺乳动物密码子偏性及聚类分析

不同哺乳动物密码子偏性及聚类分析

不同哺乳动物密码子偏性及聚类分析在雌性哺乳动物整个生殖周期过程中,卵母细胞只能来源于原始卵泡库[1]。

有研究表明,原始卵泡形成过程受激素、转录因子和相关通路的介导[2]。

生长分化因子9(growth differentiation factor 9,GDF9)作为转化生长因子β超家族成员之一,在卵泡的发育过程中有关键的调节作用[3]。

密码子是DNA或RNA的碱基序列与其编码蛋白序列之间的对应关系[4]。

编码相同氨基酸的密码子为同义密码子,在蛋白合成过程中,同义密码子的使用频率存在差异,且物种和基因对某一种或几种密码子的使用具有偏好性[5]。

对基因密码子偏好参数进行分析,能更好地理解和研究基因水平转移和基因家族分化的发生[6]。

因此对密码子偏好性的研究可在分子的角度为GDF9基因序列特征、分类和遗传进化规律提供重要信息。

前人相关研究表明,GDF9基因具有刺激颗粒细胞减数分裂、抑制素的生成作用[7],并影响卵泡发育和生殖功能[8]。

Wang等发现通过siRNA敲除GDF9后能抑制仓鼠原始卵泡的形成,但添加GDF9纯品培养卵巢会加速原始卵泡的形成[9]。

在人、啮齿类、牛、绵羊和有袋类动物卵巢卵母细胞中,GDF9基因特异性表达,但该基因在山羊卵母细胞和黄体中可同时表达[10-11]。

GDF9基因还能通过多个信号通路促进颗粒细胞增殖过程[12]。

马会明等通过RNA干扰使该基因表达沉默,也能抑制颗粒细胞增殖过程[13]。

这些研究通过探讨不同哺乳动物已被克隆的GDF9基因,并在卵巢卵母细胞中进行了相关表达分析,但未开展密码子使用偏性的研究,这不利于其异源表达和遗传转化等后续试验的进行。

GDF9基因密码子使用偏好性的研究能为该基因的分类和进化提供重要信息。

本研究利用CodonW软件分析不同哺乳?游?GDF9基因对密码子的使用情况,基于GDF9基因最小进化法和同义密码子相对使用度的欧式平方距离系数建立聚类关系,为GDF9基因功能的深入研究提供参考依据。

大豆花叶病毒CP基因密码子使用偏性分析

大豆花叶病毒CP基因密码子使用偏性分析

大豆花叶病毒CP基因密码子使用偏性分析黄赛花;袁瑗;王成坤;任锐;何卓伟;智海剑【摘要】大豆花叶病毒(soybean mosaic virus,SMV)外壳蛋白(coat protein,CP)是SMV基因组的结构蛋白,在SMV侵染大豆的过程中发挥着重要的作用.运用CUSP和CodonW等软件分析了大豆花叶病毒外壳蛋白的密码子的偏性,并与SMV基因组的密码子偏性进行了比较.结果表明,SMV CP偏好于以A/T结尾的密码子;与SMV基因组密码子偏性相比,发现只有8种氨基酸密码子偏性完全一致.ENC与GC3的相关性分析结果显示,CP的密码子使用偏好性受碱基组成等多种因素共同影响.聚类分析显示基于基因CDS序列的聚类结果与基于密码子偏性参数相对密码子使用度(RSCU)的聚类结果基本一致.通过分析CP密码子使用特性,为进一步研究其功能奠定基础.【期刊名称】《中国油料作物学报》【年(卷),期】2015(037)002【总页数】6页(P148-153)【关键词】大豆花叶病毒;CP基因;密码子偏好性【作者】黄赛花;袁瑗;王成坤;任锐;何卓伟;智海剑【作者单位】南京农业大学大豆研究所,国家大豆改良中心,作物遗传与种质创新国家重点实验室,江苏南京,210095;南京农业大学大豆研究所,国家大豆改良中心,作物遗传与种质创新国家重点实验室,江苏南京,210095;南京农业大学大豆研究所,国家大豆改良中心,作物遗传与种质创新国家重点实验室,江苏南京,210095;南京农业大学大豆研究所,国家大豆改良中心,作物遗传与种质创新国家重点实验室,江苏南京,210095;南京农业大学大豆研究所,国家大豆改良中心,作物遗传与种质创新国家重点实验室,江苏南京,210095;南京农业大学大豆研究所,国家大豆改良中心,作物遗传与种质创新国家重点实验室,江苏南京,210095【正文语种】中文【中图分类】S565.103;S435.651大豆花叶病毒CP基因密码子使用偏性分析黄赛花,袁瑗,王成坤,任锐,何卓伟,智海剑*(南京农业大学大豆研究所,国家大豆改良中心,作物遗传与种质创新国家重点实验室,江苏南京,210095)作者简介:黄赛花( 1988-),女,硕士研究生,主要从事大豆抗大豆花叶病毒基因功能研究,E-mail:2011101023@ njau.edu.cn*通讯作者:智海剑( 1957-)男,教授,博士生导师,从事大豆遗传育种研究,E-mail: zhj@ njau.edu.cn摘要:大豆花叶病毒( soybean mosaic virus,SMV)外壳蛋白( coat protein,CP)是SMV基因组的结构蛋白,在SMV侵染大豆的过程中发挥着重要的作用。

《密码子偏好性分析》PPT课件

《密码子偏好性分析》PPT课件
(四)利用编码区和非编码区的基因组特征差异进行全基因 组扫描,发现新基因。
密码子使用偏性的影响因素:
(一)基因序列碱基组成的偏好性
在不存在自然选择压力 的 情 况 下, 一定方向的突变压会影响序列本 身的碱基组成 ,而这一效应同时也会反映在同义密码子的第 3位上。这 样 的偏好性仅仅是反映了序列组成的特征,而与蛋白功能或表达水平无 关。
只不过其偏向的并不是高表达基因所用的密码子 。
计算公式:
其中p,表示密码子i的使用频率,n是所有密码子的数目
精选PPT
11
GC 和 GC3s
G C 测量的是基因中 G 和 C 的含量 。G C 3s 则计算密码子第三个碱基 中出现 G 或 C 的频率 。一般认为这两个因素对基因的密码子选择有重 要影响。
精选PPT
27
精选PPT
28
其中RSCUmax、是高表达参照基因中,每一个氨基酸里使用频率最高的密码子的相对同义密码子使用频率,L是基因中 密码子的个数
精选PPT
8
高 频 密 码 子与最优密码子
某一密码子相对同义密码子使用频率单值超过60% 或者超过该组同义密 码子平均占有频率的1.5 倍的密码子即为高频码子。
最后采用高表达优越密码子分析方法先,计算每个基因的密码子有效数 和相对同义密码子用法, 然后再根据各 Nc值确 定高表达和低表达样本 组,计算出这两个样本组中各个密码子各自的值,最后通过卡方检验确 定出高表达基因的优越密码子确定最优密码子。
手段 ,通过比较核基因编码的核糖体蛋白和线粒体基 因编码的核糖体蛋白上密码子使用模式的差异来预测 未知蛋白的基因所在基因组位置。
精选PPT
3
(二)通过密码子使用偏好性的研究, 可以判定一些最优

刺猬线粒体基因组密码子偏好性分析

刺猬线粒体基因组密码子偏好性分析

收稿日期:2023-05-05作者简介:韩君(1988—),男,黑龙江哈尔滨人,硕士,工程师,研究方向为生物信息学与多组学数据分析。

刺猬线粒体基因组密码子偏好性分析韩君(北京康仁堂药业有限公司,北京101301)摘要:为利用分子技术探究刺猬皮等组织作为中药使用的机制,促进远东刺猬分子进化研究。

以远东刺猬线粒体全基因组序列为材料,从中筛选出长度大于300bp 的非重复编码序列(CDS )12条,利用CodonW1.4.2、SPSS 25.0和Excel 2007等软件分析其密码子偏好性。

结果显示:密码子第3位的碱基平均GC 含量为24.30%;有效密码子数目(ENC )分布范围为31.83~50.67,平均值为43.37;相对同义密码子使用度(RSCU )值>1.00的密码子共有32个,偏好以碱基A 或U (T )结尾。

中性绘图分析结果显示,GC 1和GC 2的平均值(GC 12)与GC 3之间的相关系数为0.443;ENC-plot 分析结果显示,多数基因在标准曲线附近聚集;对应性分析结果表明,第1~4个向量轴的贡献率分别为35.64%、16.22%、10.26%和9.13%,同义密码子第3位的GC 含量(GC3s )、ENC 与第1向量轴(Axis1)呈显著正相关;密码子适应指数(CAI )与Axis1呈负相关,最终确定CUA 、AUA 、GUU 、UCU 、CCC 、ACA 、GCU 、CAU 、AAA 、GAA 、UGA 、CGC 、GGC 和GGA 为最优密码子。

通过优化远东刺猬线粒体基因组密码子以及应用分子手段进行深入研究,有助于探究远东刺猬组织入药机制。

关键词:远东刺猬;线粒体;密码子;偏好性;中药中图分类号:S862;R282文献标志码:A文章编号:1001-0084(2023)04-0031-07Codon Preference Analysis on MitochondrialGenome of Erinaceus amurensisHAN Jun(Beijing Tcmages Pharmaceutical Co.,Ltd.,Beijing 101301,China )Abstract:Using molecular technique to explore the mechanism of hedgehog hide and other tissues applied astraditional Chinese medicine,and promote molecular evolution of Erinaceus amurensis in the Far East,taking the complete mitochondrial genome sequence of Erinaceus amurensis as the material,12non-repeating coding sequences (CDS)with a length greater than 300bp were selected as the research objects in this study,and their codon preference was analyzed by using CodonW1.4.2,SPSS 25.0,Excel 2007and other software.The average GC content of the third codon was 24.30%;the number of effective codons (ENC)ranged from 31.83to 50.67,with an average value of 43.37;and the relative synonymous codon usage (RSCU)value of 32codons was greater than 1.00,and the preference ends with either A or U (T).According to neutral plot analysis,the correlation coefficientbetween the average value (GC 12)of GC 1,and GC 2and GC 3was 0.443.In addition,ENC-plot analysis also revealed that most genes cluster near the standard curve;besides,the corresponding analysis showed that the contribution rates of the 1-4vector axes were 35.64%,16.22%,10.26%and 9.13%,respectively;and the GC content of the third synonymous codon (GC3s )and ENC were significantly positively correlated with the first vector axis (Axis1).In addition,the codon adaptation index (CAI)was negatively correlated with Axis1.Hence,it could finally beDOI:10.20041/ki.slbl.2023.04.006猬科在我国共有5个属7个种。

乙型肝炎病毒密码子偏好性及影响因素分析

乙型肝炎病毒密码子偏好性及影响因素分析

中国病原生物学杂志2020年12月第15卷笫12期•1404•Journal of Pathogen Biology Dec.2020,Vol.15,No.12DOI:10.13350/j.cjpb.201208•论著*乙型肝炎病毒密码子偏好性及影响因素分析*吴炜倩',胡源「胡接力黄爱龙涂增…(1.重庆医科大学第二临床阪学院•重庆400016;2.感染性疾病分子生物学教育部重点实验家;3.重庆医科大学基础医学院病原生物学教研室)目的分析乙型肝炎病毒(HBV)B、C基因里密码子使用偏好性及其影响肉素•探讨HBV密码子使用模式与宿主、病毒进化的关系。

方法从GenBank数据库中收集47株HBV的全基因组序列,利用EMB()SS、SPSS24.0、MEGAX等软件对具密码子偏好性进行统计分析。

结果HBV各蛋白编码序列的ENC值为56.37-58.74.CAI值为0.678-0.697,GC3含量为0.474-0.506。

RS('U>1的密码子共27个,主要以U/C结尾。

高频使用密码子为UCU、C(、U和AGC•低频使用密码子为CUA、C('G、CGA、AC(;和UCG0ENC绘图显示47株病毒均位于预期曲线之下。

中性绘图分析表明GC12与GC3无显著相关性(R=0.005,PV0.01)。

PR2绘图显示第1位碱基T和C含屋较高。

对应分析显示这些病毒的密码子偏好性受碱肚组成影响的町能性较小。

利川CAI值和卡方检验的方法确定GAC 和GAA为上述毒株的最优密码子。

密码子使用频率比值表明B、C基因型与人类的密码子偏好性相近•而聚合酶(P)、表面(S)基因与人类的密码子偏好性存在一定的差界•以P基因差异更大。

系统发工分析显示毒株分类的进化越相近,其密码子偏好件越相似。

结论B、('基因熨HBV偏爱使用U/C结尾的密码子,其密码子偏好性主要受到自然选择的影响。

结介密码子偏好件9密码子优化可能仃助于理解HBV进化过程和对垠适宿主的选择机制,关键词】乙型肝炎病毒;密码子使用偏好性;进化中图分类号】R373.2【文献标识码】【文章编号】1673-5234(2020)12-1404-07^Journal of Pathogen Biology.2020Dec;15(12):1404—1410.]Codon usage bias of the hepatitis B virus and factors influencing itWU Wei-qian1,HU Yuan'.HU Jie-li J・Huang Ailong"・TU Zeng"(1.The Second Hospital Affiliated UL'ith Chongqing Medical University<,Chongqing、C7?ina400016;2.Ministry o f Education Key laboratory for the Mo­lecular Biology o f Infectious Diseases; 3.De pa rtment o f Pathogen Biology.College of Basic Medical Sciences.Chongqing Medical University)Objective To analyze the codon usage bias of the B and(.'genotypes of the hepatitis B virus(HBV)and factors influe n cing it and to further explore its relati o n s hip to the evolution of HBV.Methods Forty-seven full-le n gth genomes of HBV were obtained from GenBank,and the codon usage bias and factors influencing it were evaluated using the relative synonymous codon usage(RSCU),codon adaptation index(CAI),effective number of cod o ns(ENC),and (;('calculated using EMBOSS and CodonW.SPSS24.0and MEGAX were used for statistical and phylogenetic analysis, respectively.The best cod o n was determined using a X test(C'hi-square test)based on the CAI.Results For the cod­ing sequence of HBV.ENC ranged from56.37to5&74,CAI ranged from0.678to0.697.and GC3content ranged from0.474to0.506.Twenty-seven codons of HBV with a RSCU value larger than one mainly ended with U/C.The high-frequency codons were UCU,CCU・and AGC while the low-frequency codons were CUA»CCG.C(;A・ACG,and UCG ENC plots indicated that all47isolates were below the expected curve.A neutrality plot analysis revealed no sig­nificant correlation between GC12and GC3(R=0.005,P<0.01).A PR2bias-plot analysis revealed a high T and C con tent.Correspondence analysis suggested that overall nucleotide composition slightly affected the codon usage bias within the B and('genotypes of HBV in the current dataset.GAC and GAA were the optimal codons of the above strains based on the CAI value and a chi-square test.A comparative analysis of the relative frequency of codon usage revealed a high frequency of codon usage(84.75%)in HBV genotypes B and C similar to the codon preference in human beings.This was true for the whole genome.The P gene of HBV genotypes B and C displayed the greatest dissimilarity(40.68%),followed by the S gene(28.81%).Phylogenetic analysis indicated that HBV isolates with a similar cod O n prefer-【基金项目】重庆市基础科学与前沿技术研究专项(No.CSTC2O15jcyjAlOOO6);国家自然科学基金青年科学基金项目(No.81501751);重庆市博士后科学基金项冃(No.Xm2014006)o涂增.E—mail:***************吴炜倩(1998—),女,重庆忠县人,在读本科生。

大豆GmRAV基因的密码子偏好性分析

大豆GmRAV基因的密码子偏好性分析

R V( e t B3V I转 录 因子 首 先 是 在 A R l e t A I/P ) ado 拟 南 芥 中被 克 隆 出来 的 ,含有 A 2E F B 两 种 P /R 与 3 D A结 合结 构 域 ” N I 豆 属于 光周期 敏感 的短 日照 。大 作 物 ,短 日照促进 其 开花 。据报道 ,在 大豆 中 ,虽 然短 日照 能够 强烈 诱导 大 豆叶 片 G R 基 因表达 , m AV
T M1 基 因抑 制 F E ) r的表 达从 而 抑 制 开花 。可见 , R V转 录 因 子 为短 日照 和 长 日照植 物 中光 周 期 开 A
花途 径 的 关键 抑 制 因子 。此外 ,有 报道 R V蛋 白 A 作为一 种转 录激 活物 ,定位在 细胞 核 中 ,能 够被病 原 、植 物激 素 以及 环境 压力所 诱 导 ,诱 导 防卫 基 因
1 材 料 与方 法
11 序 列来 源 .
不 同物 种 的基 因在 密 码 子 使 用 上 存 在 着 明显 的偏 好 性 ;不 同功 能 的 基 因其 密 码 子 使 用 偏 好 性 也 存 在 较 大 差 异 。分 析 密 码 子 的偏 好 性 对 于 外 源 基 因
大 豆 GR m AV转 录 因 子 ( e B n G n a k登 录 号
Unv ri , abn1 0 8 , i ; . o b a e e r si t , r e s r u ua nv ri, a i ies y H ri 0 1 Chn 2 S y e nR s a c I tue Not a t i l rl ie t H r n t 5 a h n t h Ag c t U sy b
第7 期
杨 春亮等 :大豆 G AV mR 基因的密码 子偏好性分析

密码子偏好性分析课件

密码子偏好性分析课件
要求较高。
现有的研究方法和技术还存在一 定的局限性,例如在数据采集、 处理和分析等方面,需要进一步
完善和改进。
研究的发展趋势与前景
随着基因组测序技术的不断发展,可以预见未来将有更多的物种基因组被测序,为 密码子偏好性研究提供更多的数据资源。
计算机科学和统计学的技术进步将为密码子偏好性研究提供更加高效和准确的分析 工具和方法,有助于揭示更深层次的规律和机制。
撰写报告
将分析过程、方法和结果写成报告,以供后续研究和参考。
03
密码子偏好性模型
建立模型
基于序列数据的统计模型
01
Hale Waihona Puke 利用序列数据,通过统计方法建立模型,分析密码子的使用偏
好。
基于基因组数据的机器学习模型
02
利用基因组数据,通过机器学习算法建立模型,预测密码子的
使用偏好。
基于生物信息的综合分析模型
03
数据分析
统计每个密码子的使用频率
根据计算方法得到的密码子使用频率数据进行排序和统计,得出 每个密码子的使用频率。
分析偏好性
对比不同种类生物的密码子使用频率数据,分析密码子的偏好性。
寻找热点密码子
根据统计分析结果,寻找热点密码子,即使用频率最高的密码子。
结果展示
制作图表
根据数据分析结果,制作条形图、饼图、柱状图等图表,直 观展示密码子的使用频率和偏好性。
其他因素
翻译后修饰
某些蛋白质在翻译后需要进行修饰,这种修饰可能会影响密码子的使用。
代谢途径
不同生物体具有不同的代谢途径,这可能会影响密码子的使用和偏好性的形成 。
05
密码子偏好性与蛋白质 表达
密码子使用与蛋白质表达关系

鸡Z染色体基因表达的密码子偏性

鸡Z染色体基因表达的密码子偏性

第31卷第1期2010年1月 华南农业大学学报Journal of S outh China Agricultural University Vol .31,No .1Jan .2010 收稿日期:2009204223 作者简介:饶友生(1965—),男,教授,博士;通讯作者:张细权(1963—),男,教授,博士,E 2mail:xqzhang@scau .edu .cn 基金项目:江西省教育厅科学技术研究项目(GJJ8469);863计划项目(2006AA10A120)鸡Z 染色体基因表达的密码子偏性饶友生1,梁菲菲2,王樟凤1,柴学文1,张细权2(1江西教育学院生物技术研究所,江西南昌330029;2华南农业大学动物科学学院,广东广州510642)摘要:从NCB I 数据库(htt p:∥www .ncbi .nl m .nih .gov/p r ojects/mapvie w /map )下载鸡Z 染色体上全部基因完整的c DNA,最终共有626个基因的CDS 序列纳入统计分析.使用Codon W (11412)进行密码子偏性分析,确定了CGG 、AGC 、UGC 等26个密码子为Z 染色体基因表达的“最优”密码子.对应分析表明,影响鸡Z 染色体基因表达的密码子偏性的主要因素分别为GC3s 、基因的表达丰度、GC 含量、C DS 长度及氨基酸的疏水性.鸡Z 染色体基因表达的密码子用法受到了核苷酸组成偏好的显著影响,这种核苷酸组成偏好很可能是突变偏畸、固定偏畸及基因转换导致的.对于鸡这种群体有效规模较大的群体,密码子的偏性更有可能是核苷酸组成偏好及选择等因素综合作用的结果.关键词:鸡;Z 染色体;密码子;偏性中图分类号:Q953.3 文献标识码:A 文章编号:10012411X (2010)0120070205Study on the Codon B i a s of Genes Expressi on i n GGAZRAO You 2sheng 1,L I A NG Fei 2fei 2,WANG Zhang 2feng 1,CHA I Xue 2wen 1,Z HANG Xi 2quan2(1Depart m ent of B i ol ogical Technol ogy,J iangxi I nstitute of Educati on,Nanchang 330029,China;2College of Ani m al Science,S outh China Agricultural University,Guangzhou 510642,China )Abstract:The t otal c DNA sequences were downl oaded fr om NCB I dateset,and 626CDS sequences were finally included in analyses .By the use of Codon W (11412),26codons (eg .CGG,AGC,UGC et al .)were identified as op ti m al codons .The corres ponding analyses indicted that the main fact ors influencing codon usage of genes in GG AZ were GC3s,exp ressi on level,GC content,CDS length as well as Hydr opho 2bicity of a m ino acids .A s the codon usage of genes in GG AZ was mostly influcenced by nucleotide compo 2siti on,the bias of nucleotide compositi on ismore likely due t o the mutati on bias,fix bias,and gene conver 2si on .For a greater effective populati on size,the codon usage of chicken was most likely the combinati on of nucleotide co mpositi on and selecti on and s o on .Key words:chicken;GG AZ;codon;bias 突变和重组是生物进化的根本动力.突变如果发生在基因的阅读框内,则必然会导致密码子的突变.密码子的突变分为3大类型:同义突变(Synony mous mutati on )、非同义突变(Nonsynony mous mutati on )、无义突变(Nonsense mutati on ).L i 等[1]的研究表明,如果基因表达过程中所有密码子以同一频率出现,则同义、非同义和无义突变的比例约为0125∶0171∶0104.非同义突变会导致编码的氨基酸发生改变,从而引起蛋白质的结构和功能发生改变,使突变个体发生相对显著的表型变异.同义突变是一种中性或近中性突变,虽然不会引起所编码的氨基酸发生变化,但这些密码子在蛋白质的翻译过程中使用的频率存在显著差异,此即为密码子的偏性.影响密码子偏性的因素主要有:高表达的基因其密码子使用的频率与细胞内同功t RNA 的丰度有关[2];密码子的偏性同密码子偏倚的突变压有关[3];密码子的偏性同整个基因组的GC 含量特别是阅读框的GC 含量有关[426].密码子的偏性还与基因的长度、基因的功能、氨基酸的疏水性以及蛋白质的二级结构等有关[729].密码子的偏性可能是中性进化的结果(如突变偏畸、基因转换等)也可能是对同义密码子的选择所至,密码子的用法反映的是2种进化力量之间的一种平衡[10].在果蝇和线虫的研究中发现,高表达的基因存在显著的密码子用法偏畸,这种偏畸主要是通过对同义密码子的选择以提高翻译的效率和准确性而导致的[11213].研究者们还发现,在人的不同组织中,基因表达的密码子用法存在显著差异,组织特异性基因的密码子偏畸是通过对不同组织细胞中t RNA丰度的选择导致的[14215].鸡的核型包括8对大染色体,30对小染色体和1对性染色体(2n=78),性别决定方式为Z W型,雄性同配(ZZ).其他物种的研究表明,在性染色体上存在许多性别偏畸基因(Sex2bias genes),这种偏畸可能对密码子的用法产生影响[16217].本研究对鸡Z染色体基因的密码子偏性模式进行了探讨,旨在为鸡常染色体基因的密码子用法及线粒体基因组的密码子用法提供参照,同时为鸡的转基因研究中外源基因(如GHR基因,该基因在育种实践中有非常重要的意义)的改造提供理论上的指导.1 材料与方法1.1 基因序列鸡Z染色体上全部基因完整的c DNA序列从NCB I数据库(htt p:∥www.ncbi.nl /p r o2 jects/mapvie w/map)下载.编写PERL程序提取相应的CDS序列.所有下列情形之一的CDS不包括在数据分析中:(1)不以ATG为起始密码子;(2)碱基数全长不为3的倍数;(3)序列内部含有终止密码子;(4)CDS全长小于300个碱基.包含多个剪接体的基因选择其最长的CDS序列.最终共有626个基因的CDS序列纳入统计分析.1.2 统计分析使用Codon W(11412)进行密码子偏性分析.密码子偏性的度量指标包括:相对密码子使用度(Rel2 ative synony mous codon usage,RSCU)、有效密码子数(Effective nu mber of codons,E NC)、密码子适应指数(Codon adap tati on index,CA I)[18].RSCU定义为某一同义密码子使用次数的观察值与该密码子出现次数的期望值的比例.密码子出现次数的期望值为该密码子所编码的氨基酸的所有同义密码子平均使用的次数.如果密码子的使用无偏好性,则RSCU值为1;如果该密码子相对其他同义密码使用频繁,则RSCU 值大于1.有效密码子数(E NC)反映基因有效使用密码子种类的多少,也即反映了基因密码子使用的偏性程度.其值一般从20(该基因只有20个密码子,编码所有20种氨基酸)到61(所有的同义密码子以均等频率使用).ENC越大,基因对密码子使用偏性越小, ENC越小,基因对密码子的使用偏性越大.密码子适应指数(CA I)反映编码区同义密码子与密码子最佳使用相符合的程度,取值范围在0~1之间.表达量较高的基因具有较高CA I值,表达量较低的基因具有较低的CA I值.许多研究表明,CA I值最接近于基因表达水平的实际观测值,并已广泛应用于基因表达水平的预测[19220].本研究采用核糖体核蛋白基因作为计算CA I值的参考数据[21].统计全部CDS序列的碱基组成参数:G+C含量(鸟嘌呤和胞嘧啶含量);GC3s(同义密码子第3位的G+C频率);A3s、T3s、G3s、C3s(同义密码子在第3位上腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶的出现频率).通过构建这些参数和E NC之间的二维散点图,反映密码子使用偏性与基因碱基组成之间的关系[22].使用对应分析探究样本各变量之间的关系.对应分析样本中所有基因按密码子的使用频率分布在一个59维(64个密码子去除3个终止密码子以及甲硫氨酸和色氨酸的密码子)的向量空间,通过矩阵数据转换,鉴定出影响密码子使用偏性的主要因素[23224].对应分析使用Codon W(11412)的corres pondence an2 alyses程序(htt p:∥codonw.s /)完成.各变量间的相关性分析使用SPSS11.5完成.2 结果与分析2.1 Z染色体基因表达的“最优”密码子计算所有基因序列的E NC,并对这些值进行排序,取该有序数据集的上下限区域各5%的序列数据,形成2个新的数据子集.比较2个数据子集中密码子的RSCU值,如果差异大于013,且该密码子的RSCU值在高表达基因样本中大于1,在低表达基因样本中小于1,则该密码子定义为“最优”密码子[25].最终确定了CGG、AGC、UGC等26个密码子为Z染色体基因表达的“最优”密码子.由表1中可以看出“最优”密码子均为以GC结尾的密码子.2.2 ENC和GC3s的关联分析使用E NC与GC3s描绘散点图(Nc2p l ot).图1的连续曲线反映了在无选择压力的情况下ENC和GC3s之间的关系.从图1可知,大多数基因位点的分布偏离了曲线,说明除了核苷酸组成偏好外,自然17 第1期 饶友生等:鸡Z染色体基因表达的密码子偏性 表1 鸡Z 染色体基因表达的最优密码子1)Tab .1 Codon us age of gene πs expressi on i n GGAZ氨基酸密码子高表达低表达氨基酸密码子高表达低表达Phe UUU 0.481.37SerUCU 0.511.75UUC 1.520.63UCC 1.770.52LeuUUA 01071.19UCA 0.391.59UUG 0.381.22UCG0.750.11C UU 0.281.26Pr o CCU 0.461.57CUC 1.830.42CCC 1.750.41C UA 0.150.66CCA 0.391.83C UG3.281.24CCG1.400.20Ile AUU 0.511.37Thr ACU 0.451.54AUC2.330.60ACC 1.830.45AUA0.161.04ACA 0.661.82Met AUG 1.001.00ACG1.060.19ValG UU 0.261.41A la GCU 0.561.46GUC 1.230.44GCC 1.720.51G UA 0.221.06GCA 0.451.92GUG2.291.09GCG1.270.11Tyr UAU 0.411.28Cys UG U 0.311.31UAC 1.590.72UGC 1.690.69Ter UAA 0.560.94Ter UG A 1.691.31UAG 0.750.75Tr p UGG 1.001.00H is C AU 0.251.43A rgCG U 0.480.56CAC 1.750.57CGC 2.470.24Gln C AA 0.371.01CG A 0.420.56CAG 1.630.99CGG1.860.30A sn AAU 0.281.33Ser AG U 0.341.34AAC 1.720.67AGC2.250.69Lys AAA 0.511.28A rg AG A 0.223.07AAG 1.490.72AGG 0.551.27A s p G AU 0.431.42GlyGG U 0.311.15GAC 1.570.58GGC 1.870.58GluG AA 0.331.33GG A 0.421.75GAG1.670.67GGG1.400.51 1)最优密码子用黑体标记选择等其他因素对密码子的使用具有显著影响.相关性分析表明,基因表达水平(CA I 值)与ENC 呈极显著负相关(r =-01555,P <0101),与GC3s 呈极显著正相关(r =01978,P <0101).曲线下方的基因具有较高的GC3s 含量,趋向使用较少的密码子(E NC 偏低),表达水平也相对较高;曲线上方的基因倾向于随机使用密码子,表达量相对较低.从CA I 和GC 含量、GC3s 的相关性可以看出Z 染色体上高表达的基因富集GC,尤其偏好以G 或C 结尾的密码子.ENC 与GC 含量、GC3之间的相关性也验证了上述结论(r =-01436,P <0101;r =-01446,P <0101).连续曲线表示密码子随机使用时ENC 和GC3s 之间的关系图1 鸡Z 染色体基因的散点图分布Fig .1 Nc 2p l ot of genes in GG AZ27 华 南 农 业 大 学 学 报 第31卷 2.3 密码子使用的对应分析图2的对应分析发现,第1条向量轴能够解释基因间总变异的30102%,其余3条向量轴只能解释总变异的8146%、5187%、4156%.从对应分析中数据分布的贡献率明显看出,第1条向量轴是第2条向量轴的2倍以上,所以第1条向量轴是解释基因密码子偏好使用的首要参考.第1轴的特征值与偏性参数的相关分析表明,该轴上基因的位置与GC3s 、GC 含量、CA I 值呈极显著正相关(r =01984,P <0101;r =01912,P <0101;r =01967,P <0101),与CDS 长度及氨基酸的疏水性呈极显著负相关(r =-01305,P <0101;r =-01138,P <0101).表明影响鸡Z 染色体基因表达的密码子偏性的主要因素为GC3s 、基因的表达丰度、GC 含量.CDS 长度及氨基酸的疏水性对密码子的使用偏性也有显著影响.图2 Z 染色体上的基因在2个主向量轴上的分布Fig .2 D istributi on of genes in GG AZ on the p lane defined bythe first t w o main axes of the corres pondence analysis3 讨论使用NCB I 数据库,笔者下载了鸡Z 染色体上全部基因的CDS 序列,探讨了鸡Z 染色体基因表达的密码子使用模式,确定了26个“最优”密码子.研究发现,影响鸡Z 染色体基因表达密码子偏性的主要因素是GC3s (同义密码子第3位的G +C 频率)、基因的表达丰度、GC 含量、CDS 长度及氨基酸的疏水性.基因的碱基组成是影响密码子使用的一个主要因素,鸡Z 染色体上基因的碱基组成存在很大的异质性,GC3s 值的范围为0126~0191,GC 含量和ENC 的变化范围也分别为01376~01814和25~61.结合对应分析和相关分析的结果,第1向量轴基因的位置和GC 含量呈极显著正相关(r =01912,P <0101),可以推测Z 染色体基因的密码子用法受到了核苷酸组成偏好的显著影响.笔者以为,这种核苷酸组成偏好很可能是突变偏畸、固定偏畸及基因转换导致的.根据群体遗传学的观点,对于有效规模较小的群体,密码子的偏性最有可能是核苷酸组成偏好及遗传漂变的结果;但对于鸡这种群体规模较大的群体,密码子的偏性更有可能是核苷酸组成偏好及选择等因素综合作用的结果.基因表达水平(CA I 值)与ENC 的相关性(r =-01555,P <0101)以及GC 含量与E NC 的相关性验证了上述结论(r =-01436,P <0101;r =-01446,P <0101).在果蝇和线虫的研究中发现,基因的偏性和CDS 的长度及基因的长度呈极显著负相关,该现象被解释为在自然选择压力下缩短表达量高的基因对生物体本身有利,可以减少物质、能量和时间的消耗[2].相反地,对于大的基因,可能存在更多的更严紧的调控因子,因而在自然选择过程中承受着更大的选择压[4].本研究发现,鸡Z 染色体上的基因虽然表现出相同的趋势,但基因的偏性和基因的长度之间的相关性并未达到显著水平.有趣的是,研究样本中65个没有内含子的基因,其长度和基因的偏性(ENC )呈极显著正相关(r =01292,P =010204),印证了上述研究结果.这是否意味着基因中内含子的存在与否(Poly mor phis m of p resence /absent of intr on )以及内含子的数目和大小与基因的表达偏性相关联,抑或是性染色体上基因的密码子用法和常染色体有别?相关的研究我们还在进行中.参考文献:[1] L I W en 2hsiung .Molecular evoluti on [M ].SunderlandMA:Sinauer A ss ociates,1997:28246.[2] MOR I Y AMA E N,P OW E LL J R.Codon usage bias andt RNA abundance in D r os ophila [J ].J Mol Evol,1996,13:2612277.[3] 刘庆坡,薛庆中.遗传密码子及其应用[J ].中国生物化学与分子生物学报,2006,22(11):8512855.[4] HOL MQU I ST G P,F I L I PSKE J.O rganizati on of mutati onsal ong the genome:A p ri m e dete m inant of genome evoluti on [J ].Trends Ecol Evol,1994,9:65269.[5] BERNARD I G .The hu man genome:O rganizati on and evo 2luti onary hist ory [J ].Annu Rev Genet,1995,29:4452476.[6] 石秀凡,黄京飞,柳树群,等.人类基因同义密码子偏好的特征以及与基因GC 含量的关系[J ].生物化学与生物物理进展,2002,29(3):4l12414.[7] K N I GHT R D,FREE LAND S J,LANDW E BER L F .Asi m p le model based on mutati on and selecti on exp lains trends in codon and a m ino 2acid usage and GC compositi on within and acr oss genomes [J ].Genome B i ol,2001,2:RESE ARCH0010.[8] MAR I N A,G ONZ ALEZ F,G UTI ERREZ G,et al .Genelength and codon usage bias in D rosophila m elanogaster ,Saccharo m yces cervisiae and Escherichia coli [J ].NucleicAcids Res,1998,26(19):4540.37 第1期 饶友生等:鸡Z 染色体基因表达的密码子偏性 [9] G UPT A S K,MAJUMDAR S K,BHATT ACHARY A T,etal.Studies on the relati onshi p s bet w een the synony mouscodon usage and p r otein secondary structural units[J].B i oche m B i ophys Res Commun,2000,269(3):6922696.[10]MARA I S G D,MOUCH I ROUD D,DURET L.Neutraleffect of recombinati on on base compositi on in D r os ophila[J].Genet Res,2003,81:79287.[11]COM ERON J M,KRE I T MAN M.The correlati on bet w eensynony mous and nonsynony mous substituti ons in D r os ophi2la:M utati on,selecti on or relaxed constraints?[J].Genet2ics,1998,150:7672775.[12]DURET L.Evoluti on of synony mous codon usage in meta2zoans[J].Curr Op in Genet Dev,2002,12:6402669. [13]AK ASH I H.Translati onal selecti on and yeast p r oteome e2voluti on[J].Genetics,2003,164:129121303.[14]P LOTKI N J B,ROB I N S H,LE V I N E A J.Tissue2s pecificcodon usage and the exp ressi on of hu man genes[J].Pr ocNatl Acad Sci,2004,101:12588212591.[15]SE’MON M,LOBRY J R,DURET L.No evidence for tis2sue2s pecific adap tati on of synony mous codon usage in hu2 mans[J].Mol B i ol Evol,2006,23(3):5232529.[16]P AR I SIM,NUTT ALL R,E DWARDS P,et al.A survey ofovary2,testis2,and s oma2biased gene exp ressi on in D r o2s ophila melanogaster adults[J].Genome B i ol,2004,5:R40.[17]RANZ J M,C ASTI L LO2DAV I S C I,ME I K LEJOHN C D,etal.Sex2dependent gene exp ressi on and evoluti on of theD r os ophila transcri p t ome[J].Science,2003,300:174221745.[18]吴宪明,吴松锋,任大明,等.密码子偏性的分析方法及相关研究进展[J].遗传,2007,29(4):4202426.[19]G UPT A S K,BHATT ACHARYY A T K,GHOSH T C.Syn2ony mous codon usage in lact ococcus lactis:mutati onal biasversus translati onal selecti on[J].J B i omol Struct Dyn,2004,21:129.[20]PE I XOT O L,Z AVALA A,ROM ERO H,et al.The strengthof translati onal selecti on f or codon usage varies in threerep licons of S inorhizobium m elioti[J].Gene,2003,320:1092116.[21]HOU Z C,Y ANG N.Fact ors affecting codon usage inYersinia pestis[J].Acta B i ochi m ica et B i ophysica Sinica,2003,25:5802586.[22]WR I GHT F.The“effective nu mber of codon”used in agene[J].Gene,1990,87:23229.[23]SI N GER G A C,H I CKEY D A.Ther mophilic p r okaryoteshave characteristic pattern of codon usage,a m ino acid com2positi on and nucleotide content[J].Gene,2003,317:39247.[24]ROM ERO H,Z AVALA A,MUST O H,et al.The influenceof translati onal selecti o on codon usage in fishes fr om thefam ily Cyp rinidae[J].Gene,2003,317:1412147.[25]DURET L,MOUCH I ROUD D.Exp ressi on pattern and,sur2p risingly,gene lenght shape codon usage in Caenorhabdi2tis,D r os ophila,and A rabidop sis[J].Pr oc Natl Acad Sci,1999,96:448224487.【责任编辑 柴 焰】(上接第69页)[12]张清峰,许尚忠,李俊雅,等.鲁西黄牛肉用品系育种目标性状和选择性状研究[J].西北农林科技大学学报:自然科学版,2007,35(2):33237.[13]K OOTS K R,GI B S ON J P,S M I T H C,et al.Analyses ofpublished genetic parameter esti m ates f or beef p r oducti ontraits:1:Heritability[J].Ani m al B reeding Abstract,1994,62:3092338.[14]K OOTS K R,GI B S ON J P,S M I T H C,et al.Analyses ofpublished genetic parameter esti m ates f or beef p r oducti ontraits:2:Phenotyp ic and genetic correlati ons[J].Ani m alB reeding Abstract,1994,62:8252853.[15]KE ALEY C G,MAC NE I L M D,TESS M W,et al.Esti m a2ti on of genetic para meters of yearling scr otal circu mferenceand se men characteristics in line1heref ord bulls[J].Ani2 mal Science,2006,84:2832290.[16]GREG ORY K E,CUND I FF L V,K OCH R M.Genetic andphenotyp ic(co)variances for gr owth and carcass traits of purebred and composite populati ons of beef cattle[J].Journal of Ani m al Science,1995,73:192021926.[17]R I L EY A C,CHASE C C,J r,HAMMOND A C,et al.Esti2mated genetic para meters for carcass traits of B rah man cat2tle[J].Journal of Ani m al Science,2002,80:9552962. [18]L:BO R N B,MADALE NA F E,PE NNA V M.Evaluati onof alternative breeding p r ogra m s f or dual pur pose zebu cat2tle[J].Rev B ras Zootec,2000,29(5):136121370.[19]李俊雅.中国西门塔尔牛核心群优化育种规划的研究[D].北京:中国农业大学动物科学院,2002.[20]张沅.家畜育种规划[M].北京:中国农业大学出版社,2000:962179.[21]DUBO I S C,MANFRE D I E,R I CARD A.Op ti m izati on ofbreeding sche mes for s port horses[J].L ivest ock Science,2008,18:992112.[22]GI CHEHA M G,K OSGEY I S,BE BE B O,et al.Evalua2ti on of the efficiency of alternative t w o2tier nucleus breed2ing syste m s designed t o i m p r ove meat sheep in Kenya[J].Joural of Ani m al B reeding and Genetics,2006,123(4):2472257.【责任编辑 柴 焰】47 华 南 农 业 大 学 学 报 第31卷 。

杜梨叶绿体基因组密码子偏好性分析

杜梨叶绿体基因组密码子偏好性分析

第43卷第6期2020年11月河北农业大学学报JOURNAL OF HEBEI AGRICULTURAL UNIVERSITYVol.43 No.6Nov.2020杜梨叶绿体基因组密码子偏好性分析辛雅萱,董章宏,瞿绍宏,刘 成,叶 鹏,辛培尧( 西南林业大学 西南山地森林资源保育与利用教育部重点实验室/ 西南地区生物多样性保育国家林业和草原局重点实验室,云南 昆明 650224)摘要:为了明确杜梨叶绿体基因组密码子的使用偏性,以杜梨叶绿体基因组中的37条蛋白质编码序列为研究对象,利用Codon W 1.4.2和在线软件CUSP等对其密码子进行了中性绘图分析、ENC-plot和PR2-plot分析。

结果表明:(1)杜梨叶绿体基因组密码子不同位置GC碱基含量为:GC1(48.45%)>GC2(40.76%)>GC3(28.66%),说明密码子末位碱基偏好以A/U结尾;(2)有效密码子数(ENC)取值范围是33.13~52.73,表明密码子偏性较弱;(3)相对同义密码子(RSCU)分析表明,其值>1的密码子有30个,其中以A、U结尾的有29个;(4)GC3和GC12无显著相关,相关系数和回归系数分别为-0.1434和0.2072; ENC-plot中大部分基因分布于曲线周围和下方,ENC比值分布在-0.05~0.05区间的有14个,说明密码子偏性主要受选择的影响;PR2-plot分析中,T的使用频率高于A,G的使用频率高于C,说明密码子偏性受多重因素影响;(5)最终筛选出UUU、UAA、AUU等18个密码子为最优密码子,多以A或U结尾。

综上所述,杜梨叶绿体基因组密码子的使用主要受选择影响,研究结果可为杜梨乃至梨属植物叶绿体基因组学的研究提供理论依据。

关 键 词:杜梨;叶绿体基因组;密码子偏好性;最优密码子中图分类号:S661.1开放科学(资源服务)标识码(OSID):文献标志码:AAnalysis on codon usage bias of chloroplast genome in Pyrus betulifolia Bge.XIN Yaxuan, DONG Zhanghong, QU Shaohong, LIU Cheng, YE Peng, XIN Peiyao(1. Key Laboratory of Forest Resources Conservation and Utilization in the Southwest Mountains of Ministry ofEducation / Key Laboratory of National Forestry and Grassland Administration on Biodiversity Conservation inSouthwest China, Southwest Forestry University, Kunming 650224, China)Abstract: In order to realize the usage bias of codons in Pyrus betulifolia chloroplast genome, 37 CDS of P.betulifolia chloroplast genome were used as the research object, and the codons were analyzed by neutral plotting,ENC-plot and PR2-plot using Codon W 1.4.2 and online software CUSP. The results showed that: (1) the GC contentat different locations of the codons in the chloroplast genome of P. betulifolia were GC1 (48.45%)>GC2 (40.76%)>GC3 (28.66%), indicating that the codon terminal base preferred to end with A/U. (2) The value range of theeffective codon number (ENC) was 33.13-52.73, indicating weak codon bias. (3) Relative synonymous codon (RSCU)analysis showed that there were 30 codons with the RSCU value>1, and 29 codons ending with A and U. (4) Therewas no significant correlation between GC3 and GC12, and the correlation coefficient and regression coefficient was收稿日期:2020-04-01基金项目:国家重点研发计划子课题项目(2017YFD060120204);云南省科技厅科技计划项目(2018BB005).第一作者:辛雅萱(1996-),女,甘肃临洮人,硕士研究生,主要从事林木遗传育种及繁育研究.E-mail:****************通信作者:辛培尧(1975-),男,云南昆明人,博士,教授,主要从事林木遗传育种与良种繁育研究.E-mail:***************本刊网址:http: // hauxb. hebau. edu. cn: 8080 /CN/ volumn / home. shtml文章编号:1000-1573(2020)06-0051-09DOI:10.13320/ki.jauh.2020.011252第43卷河北农业大学学报-0.1434 and 0.2072, respectively. Most of the genes in ENC-plot were distributed around and below the curve, and 14 ENC ratios were distributed between -0.05 and 0.05, indicating that codon bias was mainly affected by selection. In PR2-plot analysis, the usage frequency of T was higher than that of A, and G was higher than C,so the preference of P. betulifolia chloroplast genome codon was affected by multiple factors. (5) Finally, 18 codons such as UUU, UAA and AUU were selected as the optimal codons, most of which ended with A or U. In conclusion, the use of codons in chloroplast genomics of P. betulifolia is mainly influenced by selection. The theoretical basis is provided by this study for the research of chloroplast genomics of P. betulifolia and even Pyrus genus plants.Keywords:Pyrus betulifolia Bge.; chloroplast genome; codon bias; optimal codons密码子(Codon)又称遗传密码,在生物体遗传信息传递的过程中作为联结核酸和蛋白质的纽带,扮演着重要的角色,其偏好性作为基因和基因组的一个静态特征,是生物在长期演化过程中适应和选择的结果[1]。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2结果与分析
2.1有效密码子数与GC含量
获得9676个CDS作为分析样本,经CodonW1.4.2软件分析获得全基因组共计9981条基因的4497467个密码子,密码子中不同位置GC含量不同,其中第2位的GC含量较低,为42%,第1位和第3位的GC含量差异较小,分别为57.8%和56.8%,GC平均含量为52.2%。
2.3相对同义密码子使用度
RSCU值反映的是密码子在编码同义氨基酸间的相对概率,当同义密码子对应氨基酸的使用频率相同,则相对密码子使用度就是1。当密码子的使用频率相对较高时则相对密码子使用度大于1(高频密码子),反之当密码子的使用频率相对较低时则相对密码子使用度小于1[9]。普通羊肚菌中RSCU值大于等于1的密码子总共35个,其中以G或C结尾的25个,占71.4%;以A或T结尾的10个,占28.6%(表1)。
1材料与方法
1.1标本
普通羊肚菌(M.conica)于2015年5月采自云南省昆明市禄劝县轿子山,标本经上海市农业科学院转基因环境安全评价实验室提取基因组DNA,交由上海派森诺生物公司测序,并将ITS序列提交到NCBI网站进行BLAST比对后鉴定为普通羊肚菌。
1.2CDS获得
将样品的基因组DNA构建采用C语言编写程序剔除序列长度小于300bp(氨基酸数量小于100)CDS作为分析样本[5]。
密码子偏性分析
摘要:
采用CodonW1.4.2软件和CUSP程序,以普通羊肚菌全基因组蛋白质编码序列为对象,解析了该菌的有效密码子数、密码子3个位点的GC含量、相对同义密码子使用度和高表达优越密码子。结果表明:普通羊肚菌全基因组密码子第2位密码子的GC含量明显低于第1位和第3位,第3位密码子与第1位含量差异不大,分别为57.8%和56.8%,RSCU值大于等于1的密码子总共35个,其中以G或C结尾的25个,占71.4%,确定了25个高表达优越密码子。
2.2ENC-plot曲线
ENC值是一个基因的密码子使用频率与同义密码子平均使用频率偏差的量化值。高表达基因的密码子趋向于使用一种或几种同义密码子,偏爱程度越大,ENC值越小;反之,低表达基因含有的稀有密码子种类多,偏好程度小,ENC值越大[6-7]。ENC-plot曲线是以ENC值为纵坐标,密码子第3位GC含量(GC3s)为横坐标,描述ENC与GC3s之间函数关系的曲线,能有效分析密码子的偏好性,无选择压力下,表示ENC值的点应落在曲线上。如果密码子偏好主要受碱基组成的影响,ENC值则位于曲线附近;如果密码子受选择压力的影响,偏好性显著,相应的点则位于曲线下方。曲线上方对应的基因偏向于随机使用密码子[8]。在普通羊肚菌的全基因组中较少的基因位点分布在ENC-plot曲线上,大部分基因都不同程度的偏离曲线(图1),表明少数基因的密码子偏好性受基因的碱基组成影响,大部分基因在进化过程中受环境选择压力等其他因素的影响从而使密码子的偏好性发生差异。
1.3密码子偏性分析
采用CodonW1.4.2软件分析CDS,获得有效密码子数,第1位、第2位和第3位碱基中GC含量以及相对同义密码子使用度。根据ENC值对基因由大到小排序,抽取前后10%的基因分别作为样本的高表达样本组和低表达样本组,分别计算各个密码子的RSCU值,卡方检验确定高表达基因的优越密码子。
2.4优越密码子
经分析确定了TTC、CTC和ATC等25个密码子为普通羊肚菌的优越密码子,这些优越密码子将为外源基因在羊肚菌中的表达提供了编码基因序列优化的参考,也将显著提高外源基因的表达水平和翻译准确率。
பைடு நூலகம்3讨论
GC含量在同义密码子使用偏好性的过程中具有重要的作用,密码子偏好性强的基因使用G或C结尾密码子的概率要大,第3位密码子的变异往往是密码子偏好性发生变化的决定性因素[10]。在物种长期进化过程中,环境和选择压力差异造成了不同的进化历程,所以任何物种为适应其特定的环境和基因组条件,都要形成自己特定的符合其基因组的密码子使用法则。密码子偏好性受多个因素的影响,如基因表达水平[11]、mRNA二级结构[12]、翻译效率[13]、基因的碱基组分[14]、基因长度[15-16]、二核苷酸的出现频率[17]、RNA丰度[18]、编码蛋白质的结构和功能[19]及密码子-反密码子间结合能的大小[20]。在不存在自然选择压力的条件下,一定方向的突变压力会造成基因编码序列的碱基组成差异,同样,这种突变压力也会影响密码子的第3位碱基种类[21]。在进化过程中,若A(T)到G(C)的突变压力大,那么密码子的第3位碱基是G(C)的概率就要高[22]。对于普通羊肚菌而言,密码子的碱基组成中第3位碱基上GC含量为57.8%,高于A(T)的含量,说明与普通羊肚菌密码子偏好性一致的物种在进化过程中A(T)到G(C)的突变压力高于G(C)到A(T)的突变压力。普通羊肚菌的优越密码子的确定对于今后羊肚菌转基因过程中对构建合适的转基因表达系统具有重要的指导意义,针对普通羊肚菌所偏好的密码子进行优化改造目的基因,从而提高目的蛋白质的表达量,同时为普通羊肚菌基因外源表达选择适合的宿主提供重要基础,为食药用真菌的密码子优化建立参考模本。
关键词:
普通羊肚菌;编码序列;密码子偏好性;优越密码子
生物界中大部分物种均采用标准的遗传编码系统进行蛋白质翻译,密码子是生物体内信息传递的基本单元,3个碱基组成的密码子为基本的氨基酸翻译单位,ATCG4种碱基共形成了64种不同的密码子,在长期的物种进化过程中,形成了较为固定的起始密码子ATG和3种终止密码子TAA、TAG和TGA,除去3种终止密码子后实际编码氨基酸的密码子共有61种,但是最终编码的氨基酸只有20种,由此存在了密码子冗余的现象,即一种氨基酸可由多种密码子编码,这些编码相同氨基酸的密码子称之为同义密码子。不同的物种编码同种氨基酸所利用的密码子种类不同,使用频率也不同,这种现象称为密码子偏好性。最早关于密码子偏好性的研究是1989年BONEKAMP发现大肠杆菌全基因组偏好性[1]。普通羊肚菌是著名的珍稀食药用菌,味道鲜美,营养丰富,具有提神醒脑、补肾壮阳和抗肿瘤的功效[2-4],笔者以普通羊肚菌全基因组蛋白质编码序列为对象,通过CodonW软件和CUSP程序分析该菌的密码子使用特征,为羊肚菌基因选择合适的表达系统,优化密码子和提高基因表达量等奠定研究基础。
相关文档
最新文档