密码子偏好性分析

合集下载

密码子使用偏好性参数汇总

密码子使用偏好性参数汇总

研究密码子偏好性常用的参数1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU )是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。

如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。

第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下:公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。

研究中通常先利用高表达基因的RSCU值建立参考表格。

2、密码子适应指数(Codon Adaptation Index, CAI)可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。

CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。

CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。

w ij(The relative adaptiveness of a codon): 密码子相对适应度上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值L是指基因中所使用的密码子数。

3、密码子偏好参数(Codon Preference Parameter, CPP)CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。

它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。

x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除)4、有效密码子数(Effective Number of Codon, ENC)ENC值的范围在20~ 61之间, 越靠近20偏性越强。

兰科植物FNR基因的密码子偏好性分析

兰科植物FNR基因的密码子偏好性分析

兰科植物FNR基因的密码子偏好性分析作者:李蓉谢析颖王雪晶苏立遥林玉玲郭容芳陈裕坤赖钟雄徐涵来源:《热带作物学报》2018年第06期摘要为揭示兰科植物FNR基因的特性和密码子偏好性,采用DNAMAN、CodonW和SPSS软件及 EMBOSS、SWISS-MODEL在线网站对17种兰科植物的FNR基因序列、氨基酸序列、同源区域及蛋白质三维结构进行分析。

结果表明:兰科植物FNR基因普遍具有在A/T (U)与G/C之间较弱的密码子偏好性;密码子的末位在A和T(U)之间存在显著的T (U)偏好性,在C和G之间存在显著的C偏好性;NADP结合域比非结合域有较小的密码子偏好性;基于CDS和氨基酸聚类结果比基于RSCU聚类更接近于植物的进化分类;自然选择的作用是导致兰科植物FNR基因的密码子使用偏好性的主要成因。

关键词兰科;FNR基因;密码子偏好性中图分类号 S682.31 文献标识码 ACodon Usage Bias of Ferredoxin-NADP+ Oxidoreductase (FNR)in OrchidaceaeLI Rong1, XIE Xiying1, WANG Xuejing1, SU Liyao1, LIN Yuling1, GUO Rongfang1,CHEN Yukun1, LAI Zhongxiong1*, XUHAN Xu1,2*1 Institute of Horticulture of Biotechnology, Fujian Agriculture and Forestry University,Fuzhou, Fujian 350002, China2 Institut de la Recherche Interdisciplinaire de Toulouse, Toulouse 313008, FranceAbstract For a good understanding of the codon usage bias of ferredoxin-NADP+ oxidoreductase (FNR) in Orchidaceae, the gene sequence, amino acid sequence, homologous region and three-dimensional protein structure of 17 FNR genes in Orchidaceae were analyzed by DNAMAN,CodonW, SPSS softwares, and EMBOSS, SWISS-MODEL online programs. The results showed that there was a low-level codon usage bias in FNR genes between A/T(U) and G/C;there existed a significant T(U) bias between A and T(U) and a significant C bias between C and G in the codons; NADP binding domain showed less codon bias than that of the non-binding domain; the cluster tree based on coding sequence (CDS) as well as amino acid sequences matched better with the plant evolution classification; the codon usage bias of FNR was mainly influenced by the natural selection in Orchidaceae.Key words orchidaceae; FNR gene; codon usage biasdoi 10.3969/j.issn.1000-2561.2018.06.015基因表达是细胞在生命活动过程中将储存在DNA双链中的遗传信息转录、翻译为具有生物活性的蛋白质的过程。

密码子使用偏好性参数汇总

密码子使用偏好性参数汇总

研究密码子偏好性常用的参数1、相对同义密码子使用度(Relativ e Synonymous Codon Usage, RSCU )是指对于某一特定的密码子在编码对应氨基酸的同义密码子间的相对概率,它去除了氨基酸组成对密码子使用的影响。

如果密码子的使用没有偏好性,该密码子的RSCU值等于1,当某一密码子的RSCU值大于1时,代表该密码子为使用相对较多的密码子,反之亦然。

第i个氨基酸的第j个密码子的相对同义密码子使用度值的计算公式如下:公式中, X ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为1~6) 。

研究中通常先利用高表达基因的RSCU值建立参考表格。

2、密码子适应指数(Codon Adaptation Index, CAI)可以根据已知高表达基因的序列来估计未知基因密码子使用的偏好性程度。

CAI的值在0~1之间, 如果越高则表明该基因的密码子使用偏好性越强。

CAI 值一般用来预测种内基因的表达水平( 但目前的研究发现对于单细胞生物比较适用, 而在哺乳动物中并不能用来表示基因表达水平), 又可以用来预测外源基因的表达水平。

w ij(The relative adaptiveness of a codon): 密码子相对适应度上式中RSCU imax、X imax分别指编码第i个氨基酸的使用频率最高的密码子的RSCU值和X值L是指基因中所使用的密码子数。

3、密码子偏好参数(Codon Preference Parameter, CPP)CPP的变化范围为0 ~ 18, 越接近18表示密码子被非随机使用的程度越高。

它对于基因编码区域总的碱基组成不敏感, 适于比较基因间或物种间密码子使用偏性的大小。

x ij是编码第i个氨基酸的第j个密码子的出现次数, n i是编码第i个氨基酸的同义密码子的数量( 值为2~6, n i= 1 的情况被排除)4、有效密码子数(Effective Number of Codon, ENC)ENC值的范围在20~ 61之间, 越靠近20偏性越强。

密码子偏好性分析..

密码子偏好性分析..

手段 ,通过比较核基因编码的核糖体蛋白和线粒体基 因编码的核糖体蛋白上密码子使用模式的差异来预测 未知蛋白的基因所在基因组位置。
(二)通过密码子使用偏好性的研究, 可以判定一些最优
密码子,针对这些密码子设计基因工程表达载体可以提高目 的基因的表达量 。 (三)利用密码子使用偏好性和某种功能的关联程度对某些 未知功能基因进行预测利用已知的密码子偏好知识对未知表 达水平 的 基 因 进行 判 定 初步判断该基因的表达水平高或 低。 (四)利用编码区和非编码区的基因组特征差异进行全基因 组扫描,发现新基因。 密码子使用偏性的影响因素:

其中,n表示这个密码子所代表的氨基酸的同义密码子种类数目(1<n6), 戈代表第i个密码子的出现次数。RSCU是衡量密码子偏性较直观的一个参数。
密码子适应指数( Codon adaption index , CAI ) 该指数以一组具高表达水平的基因为参考 , 测量某一个基因的密码子偏 好情况和这些高表达基因密码子偏好情况的接近程度 , 如果一个基因完 全使用高表达基因中所用的密码子 , 则其 C AI 值为 1 。目前这个指数已 被广泛用来预测基 因 的 表 达 水平。

进行查询
如只需要基因序列而不需要详细信息,则需点击TASTA

如需进行图文分析,则点击Graphics
计算同义密码子相对使用度(Relative synonymous codon
usage, RSCU) 在genebank中取出序列后,用codonw进行在线分析
结果如下:
利用cusp计算密码子Franction和Frequency。 Franction:各个密码子在编码该氨基酸的密码子中所占的比例。 Frequency:该密码子在编码总基因密码子中出现的频率。

密码子数据库及密码子偏好性分析软件

密码子数据库及密码子偏好性分析软件

密码子数据库及密码子偏好性分析软件题记:转基因研究中经常要进行基因的异源表达,在翻译过程中,受体物种对外源基因密码子的翻译效率对表达有非常大的制约。

因此,利用相应的生物信息学数据库及软件对目标序列进行受体物种的密码子偏好性分析将有助于完成对转基因效率的评价,适当选择合适的受体物种进行高效、可行的表达。

人物,阅读前,让我们感谢下列科学家,是他们为基因异源高效表达提供有价值参考。

Yasukazu Nakamura博士:The First Laboratory for Plant Gene Research,Kazusa DNA Research Institute 开发Codon Usage Database(生物密码子表的利用情况统计)。

PrimerX:编写了Codon Usage Analyzer在线密码子统计表处理软件(/cgi-bin/codon.cgi),它使得对密码子的统计用图表的形式显示出来,更加的直观可读。

Morris Maduro博士:针对E. coli开发了E. coli Codon Usage Analyze 。

目前的版本为2.1。

Thomas Schödl:开发设计的以图形形式对异源基因表达的密码子使用分析软件(Graphical codon usage analyser),用以帮助异源基因表达时对异源基因进行改造,以适应受体物种,避免由于翻译时密码子使用情况的限制使受体物种对外源基因表达产生负面影响。

内容:一:密码子使用统计数据库Codon Usage Database(.jp/codon/ 是由植物基因研究第一实验室(The First Laboratory for Plant Gene Research)Kazusa DNA Research Institute的Yasukazu Nakamura博士开发的生物密码子表的利用情况统计。

数据来源于GenBank 的DNA 序列数据库,是GenBank 的Codon Usage Tabulated 数据库在WWW模式下的扩展和整合。

10种植物psy基因密码子使用偏好性分析

10种植物psy基因密码子使用偏好性分析

八氢 番 茄 红 素 合 成 酶 (PSY)是 植 物 类 胡 萝 卜素生物合成途 径 中 的 关 键 酶,对 于 番 茄 红 素 的 合成具有重要作用,犘犛犢 基因表达量高低显著调 控着植物类 胡 萝 卜 素 的 合 成 和 积 累[1],敲 除 番 茄 SlPSY1 基 因 导 致 番 茄 中 类 胡 萝 卜 素 缺 失 , [2] 犘犛犢 基因在烟草[3]、玉米 和 [4] 番 茄 中 超 表 达 提 高 了胡萝卜 素 含 量 和 其 他 次 级 代 谢 物。犘犛犢 基 因 不仅限制了类胡 萝 卜 素 的 生 物 合 成,而 且 在 非 生 物胁迫中也 起 到 作 用。比 如 脱 落 酸、茉 莉 酸 甲 酯 和盐胁迫 。 [57] 在香菜中,茉莉酸甲酯处理 后 导 致 犘犛犢 基因表达增强 。 [8]
1犇犻狊狋狉犻犫狌狋犻狅狀狅犳犲犳犳犲犮狋犻狏犲狀狌犿犫犲狉狅犳犮狅犱狅狀狊犈犖犆犪狀犱犌犆犮狅狀狋犲狀狋犪狋狋犺犻狉犱狊狔狀狅狀狔犿狅狌狊犮狅犱狅狀狆狅狊犻狋犻狅狀犌犆3狊犪狀犱狆犪狉犻狋狔犪狀犪犾狔狊犻狊狅犳犘犛犢犵犲狀犲狊犳狅狉狋犺犲狆犾犪狀狋狊狆犲犮犻犲狊组织图上的每个长方形表示对应于物种的密码子以列显示的rscu值以行显示eachsquareonselforganizingmaprepresentstherscuvalueofacodonshownincolumnscorrespondingtothespeciesshowninrows
收 稿 日 期 :20190730 修 回 日 期 :20191128 基 金 项 目 :国 家 自 然 科 学 基 金 (31860548);石 河 子 大 学 育 种 专 项 (kx0301)。 第 一 作 者 :李 慧 姬 ,女 ,硕 士 研 究 生 ,从 事 植 物 逆 境 相 关 功 能 基 因 研 究 。Email:929281557@qq.com 通 信 作 者 :吉 雪 花 ,女 ,博 士 ,副 教 授 ,主 要 从 事 蔬 菜 抗 逆 及 种 质 资 源 创 新 研 究 。Email:lilysnowjxh@163.com

菠萝叶绿体基因组密码子偏好性分析

菠萝叶绿体基因组密码子偏好性分析

菠萝叶绿体基因组密码子偏好性分析作者:杨祥燕蔡元保谭秦亮覃旭黄显雅吴密来源:《热带作物学报》2022年第03期摘要:葉绿体基因组密码子偏好性影响基因的表达效率,对于叶绿体基因工程应用及物种遗传改良具有重要的科学意义。

为了明确菠萝叶绿体基因组密码子偏好性的使用特征及主要影响因素,本研究以菠萝叶绿体基因组为研究对象,利用生物信息学软件分析其密码子的使用模式和偏好性。

密码子偏好性相关参数分析显示:(1)菠萝叶绿体基因密码子的GC含量平均值为38.31%,密码子第1~3位的GC含量平均值分别为46.78%、39.61%、28.53%,密码子前两位的GC平均含量明显高于第3位;(2)有效密码子数(ENC)的取值范围为38.48~61.00,平均值为47.21,其密码子偏性较弱。

相关性分析显示:(1)GC1与GC2显著相关,GC all与GC1、GC2、GC3都极显著正相关,GC3与GC1、GC2都不显著相关;(2)ENC与GC1不显著相关,但与GC2和GC3分别显著和极显著相关;(3)密码子数(N)只与GC3显著相关,说明密码子3个位置中第3位碱基组成主要影响着密码子数。

RSCU分析显示,29个RSCU>1的密码子中以A结尾有12个、以U结尾有16个、以G结尾有1个。

中性绘图分析显示,GC12与GC3的相关系数和回归系数分别为0.065和0.085,二者不显著相关。

ENC-plot 绘图分析显示,大多数基因分布于标准曲线附近,多数ENC比值分布在–0.05~0.05区间。

PR2-plot绘图分析显示,所有基因不均匀分布在平面图的4个区域内,密码子第3位嘧啶T/C 的使用频率高于嘌呤A/G。

这3种绘图分析综合表明,自然选择和突变作为主要因素,相对均衡地影响菠萝叶绿体基因组的密码子偏好性。

最优密码子和RSCU分析显示,29个RSCU>1的密码子及筛选的18个最优密码子绝大多数偏好以A或U结尾。

这些研究结果可为外源基因的密码子优化及提高其表达效率提供科学依据。

密码子偏性分析精品资料

密码子偏性分析精品资料
2结果与分析
2.1有效密码子数与GC含量
获得9676个CDS作为分析样本,经CodonW1.4.2软件分析获得全基因组共计9981条基因的4497467个密码子,密码子中不同位置GC含量不同,其中第2位的GC含量较低,为42%,第1位和第3位的GC含量差异较小,分别为57.8%和56.8%,GC平均含量为52.2%。
2.3相对同义密码子使用度
RSCU值反映的是密码子在编码同义氨基酸间的相对概率,当同义密码子对应氨基酸的使用频率相同,则相对密码子使用度就是1。当密码子的使用频率相对较高时则相对密码子使用度大于1(高频密码子),反之当密码子的使用频率相对较低时则相对密码子使用度小于1[9]。普通羊肚菌中RSCU值大于等于1的密码子总共35个,其中以G或C结尾的25个,占71.4%;以A或T结尾的10个,占28.6%(表1)。
1材料与方法
1.1标本
普通羊肚菌(M.conica)于2015年5月采自云南省昆明市禄劝县轿子山,标本经上海市农业科学院转基因环境安全评价实验室提取基因组DNA,交由上海派森诺生物公司测序,并将ITS序列提交到NCBI网站进行BLAST比对后鉴定为普通羊肚菌。
1.2CDS获得
将样品的基因组DNA构建采用C语言编写程序剔除序列长度小于300bp(氨基酸数量小于100)CDS作为分析样本[5]。
密码子偏性分析
摘要:
采用CodonW1.4.2软件和CUSP程序,以普通羊肚菌全基因组蛋白质编码序列为对象,解析了该菌的有效密码子数、密码子3个位点的GC含量、相对同义密码子使用度和高表达优越密码子。结果表明:普通羊肚菌全基因组密码子第2位密码子的GC含量明显低于第1位和第3位,第3位密码子与第1位含量差异不大,分别为57.8%和56.8%,RSCU值大于等于1的密码子总共35个,其中以G或C结尾的25个,占71.4%,确定了25个高表达优越密码子。

密码子的简并性及偏好性

密码子的简并性及偏好性

密码⼦的简并性及偏好性在氨基酸密码⼦及逆密码⼦表⼀贴中,我们以及提到密码⼦表中总计有64种,但实际最终对应翻译的⽬的氨基酸种类只有20种,这就意味着,存在某些多个密码⼦编码同⼀种氨基酸的现象,也称做密码⼦的简并性。

正是由于该特性,每个氨基酸⾄少对应1种密码⼦,最多可以有⼀种氨基酸对应6种密码⼦。

但这些编码相同氨基酸的不同密码⼦,在不同物种、不同⽣物体中使⽤的频率并⾮完全地平均分布,也即绝⼤多数⽣物倾向于只利⽤这些密码⼦中的⼀部分,该现象也称密码⼦的偏好性。

其中那些被最频繁利⽤的密码⼦称为最佳密码⼦(optimal codons),⽽那些不被经常利⽤的密码⼦称为稀有或利⽤率低的密码⼦(rare or low-usage codons)。

不论是真核⽣物还是原核⽣物,每种⽣物都会表现出某种程度的密码⼦利⽤的差异或偏爱。

这些偏好性的产⽣可能与两个原因有关:⼀是避免使⽤类似终⽌密码⼦的密码⼦;⼆是这些偏好能够有效地翻译密码⼦,因为这些密码⼦对应于⽣物体中⾮常丰富的tRNA 。

⽆论导致这种偏好的原因到底是什么,不同⽣物的密码⼦使⽤偏性的差异可以⾮常⼤。

因此,我们在做蛋⽩表达或⽣产时,就需要考虑到密码⼦偏好性的问题。

利⽤偏爱密码⼦(preferred codons),并避免利⽤率低的或稀有的密码⼦,从⽽实现对⽬的表达基因的重新设计也称为密码⼦最佳化。

下表总结了源⾃http://www.kazusa.or.jp/codon/的最常使⽤的表达系统,包括⼈类、⼩⿏、家蚕、酵母在内的真核表达宿主以及原核表达宿主⼤肠杆菌中的密码⼦应⽤的偏好性。

此外,在附件中,我们挑选了⼀篇针对毕⾚酵母(Pichia pastoris )进⾏密码⼦优化的科研论⽂。

密码⼦偏好性表第⼆位碱基U C A G 第⼀位碱基UUU (17.6)UCU (15.2)UAU (12.2)UGU (10.6)UUC (20.3)UCC (17.7)UAC (15.3)UGC (12.6)UUA (7.7)UCA (12.2)UAA (1.0)UGA (1.6)⼈类UUG (12.9)UCG (4.4)UAG (0.8)UGG (13.2)第⼀位碱基CUU (13.2)CCU (17.5)CAU (10.9)CGU (4.5)CUC (19.6)CCC (19.8)CAC (15.1)CGC (10.4)CUA (7.2)CCA (16.9)CAA (12.3)CGA (6.2)CUG (39.6)CCG (6.9)CAG (34.2)CGG (11.4)第⼀位碱基AUU (16.0)ACU (13.1)AAU (17.0)AGU (12.1)AUC (20.8)ACC (18.9)AAC (19.1)AGC (19.5)AUA (7.5)ACA (15.1)AAA (24.4)AGA (12.2)AUG (22.0)ACG (6.1)AAG (31.9)AGG (12.0)第⼀位碱基GUU (11.0)GCU (18.4)GAU (21.8)GGU (10.8)GUC (14.5)GCC (27.7)GAC (25.1)GGC (22.2)GUA (7.1)GCA (15.8)GAA (29.0)GGA (16.5)GUG (28.1)GCG (7.4)GAG (39.6)GGG (16.5)⼩⿏第⼀位碱基UUU (17.2)UCU (16.2)UAU (12.2)UGU (11.4)UUC (21.8)UCC (18.1)UAC (16.1)UGC (12.3)UUA (6.7)UCA (11.8)UAA (1.0)UGA (1.6)UUG (13.4)UCG (4.2)UAG (0.8)UGG (12.5)第⼀位碱基CUU (13.4)CCU (18.4)CAU (10.6)CGU (4.7)CUC (20.2)CCC (18.2)CAC (15.3)CGC (9.4)CUA (8.1)CCA (17.3)CAA (12.0)CGA (6.6)CUG (39.5)CCG (6.2)CAG (34.1)CGG (10.2)第⼀位碱基AUU (15.4)ACU (13.7)AAU (15.6)AGU (12.7)AUC (22.5)ACC (19.0)AAC (20.3)AGC (19.7)AUA (7.4)ACA (16.0)AAA (21.9)AGA (12.1)AUG (22.8)ACG (5.6)AAG (33.6)AGG (12.2)第⼀位碱基GUU (10.7)GCU (20.0)GAU (21.0)GGU (11.4)GUC (15.4)GCC (26.0)GAC (26.0)GGC (21.2)GUA (7.4)GCA (15.8)GAA (27.0)GGA (16.8)GUG (28.4)GCG (6.4)GAG (39.4)GGG (15.2)家蚕第⼀位碱基UUU (15.3)UCU (12.7)UAU (13.9)UGU (8.7)UUC (24.0)UCC (12.0)UAC (22.0)UGC (11.3)UUA (13.1)UCA (13.0)UAA (1.4)UGA (0.6)UUG (15.8)UCG (11.0)UAG (0.6)UGG (11.7)第⼀位碱基CUU (11.5)CCU (14.0)CAU (10.3)CGU (9.8)CUC (14.6)CCC (11.7)CAC (13.8)CGC (10.5)CUA (8.8)CCA (13.6)CAA (18.7)CGA (7.0)CUG (18.4)CCG (13.0)CAG (17.4)CGG (5.4)第⼀位碱基AUU (18.6)ACU (15.6)AAU (20.5)AGU (10.3)AUC (20.7)ACC (14.2)AAC (24.9)AGC (12.5)AUA (15.9)ACA (15.9)AAA (34.0)AGA (14.1)AUG (23.4)ACG (11.9)AAG (28.4)AGG (8.9)第⼀位碱基GUU (16.8)GCU (25.3)GAU (25.6)GGU (21.7)GUC (16.7)GCC (19.7)GAC (28.8)GGC (18.8)GUA (12.4)GCA (14.6)GAA (36.0)GGA (21.4)GUG (19.4)GCG (13.5)GAG (26.2)GGG (7.7)第⼀位碱基UUU (26.1)UCU (23.5)UAU (18.8)UGU (8.1)UUC (18.4)UCC (14.2)UAC (14.8)UGC (4.8)酵母UUA (26.2)UCA (18.7)UAA (1.1)UGA (0.7)UUG (27.2)UCG (8.6)UAG (0.5)UGG (10.4)第⼀位碱基CUU (12.3)CCU (13.5)CAU (13.6)CGU (6.4)CUC (5.4)CCC (6.8)CAC (7.8)CGC (2.6)CUA (13.4)CCA (18.3)CAA (27.3)CGA (3.0)CUG (10.5)CCG (5.3)CAG (12.1)CGG (1.7)第⼀位碱基AUU (30.1)ACU (20.3)AAU (35.7)AGU (14.2)AUC (17.2)ACC (12.7)AAC (24.8)AGC (9.8)AUA (17.8)ACA (17.8)AAA (41.9)AGA (21.3)AUG (20.9)ACG (8.0)AAG (30.8)AGG (9.2)第⼀位碱基GUU (22.1)GCU (21.2)GAU (37.6)GGU (23.9)GUC (11.8)GCC (12.6)GAC (20.2)GGC (9.8)GUA (11.8)GCA (16.2)GAA (45.6)GGA (10.9)GUG (10.8)GCG (6.2)GAG (19.2)GGG (6.0)⼤肠杆菌第⼀位碱基UUU (24.4)UCU (13.1)UAU (21.6)UGU (5.9)UUC (13.9)UCC (9.7)UAC (11.7)UGC (5.5)UUA (17.4)UCA (13.1)UAA (2.0)UGA (1.1)UUG (12.9)UCG (8.2)UAG (0.3)UGG (13.4)第⼀位碱基CUU (14.5)CCU (9.5)CAU (12.4)CGU (15.9)CUC (9.5)CCC (6.2)CAC (7.3)CGC (14.0)CUA (5.6)CCA (9.1)CAA (14.4)CGA (4.8)CUG (37.4)CCG (14.5)CAG (26.7)CGG (7.9)第⼀位碱基AUU (29.6)ACU (13.1)AAU (29.3)AGU (13.2)AUC (19.4)ACC (18.9)AAC (20.3)AGC (14.3)AUA (13.3)ACA (15.1)AAA (37.2)AGA (7.1)AUG (23.7)ACG (13.6)AAG (15.3)AGG (4.0)第⼀位碱基GUU (21.6)GCU (18.9)GAU (33.7)GGU (23.7)GUC (13.1)GCC (21.6)GAC (17.9)GGC (20.6)GUA (13.1)GCA (23.0)GAA (35.1)GGA (13.6)GUG (19.9)GCG (21.1)GAG (19.4)GGG (12.3)。

密码子偏好表

密码子偏好表

密码子偏好表DNA密码子是指DNA分子上一组三个碱基(核苷酸)的排列顺序,它们对应着氨基酸的编码。

在遗传密码表中,常用的密码子有某种氨基酸的编码,而有些密码子编码了相同的氨基酸。

这种一对多的编码关系就是密码子偏好。

密码子偏好表是一种记录了各种氨基酸编码的密码子使用频率的工具。

通过分析密码子的使用频率,我们可以了解到细胞对不同氨基酸的需求程度,进而提供改良基因表达的依据。

本文将对密码子偏好表的研究内容进行讨论。

一、密码子偏好的分析方法密码子偏好的分析通常基于大规模的基因组数据。

研究者可以从不同生物体的基因组数据库中获取相关数据,并利用生物信息学工具进行分析。

下面介绍几种常用的密码子偏好分析方法:1. 基于相对密码子使用频率的分析方法这种方法主要是比较不同密码子在基因组中的相对使用频率。

通过计算某个密码子相对于其他密码子在同一个位置上的使用频率,可以得出具体的密码子偏好情况。

这种方法需要大规模的基因组数据支持,具备较高的可靠性和准确性。

2. 基于机器学习的方法机器学习方法可以利用已知的密码子和氨基酸关系,构建模型来预测未知密码子的氨基酸编码。

这种方法可以通过训练集和测试集的分割,提高密码子偏好预测的准确性。

然而,由于模型的构建和调整需要大量的计算和优化,这种方法的复杂度较高。

3. 基于统计学的方法统计学方法通过对密码子出现的频率进行统计学分析,来确定密码子偏好情况。

这种方法常常用于不同物种间的密码子偏好比较。

通过统计学的方法,可以发现特定物种在某些密码子的使用上存在明显差异,这些差异可能与物种的进化和适应环境有关。

二、密码子偏好的影响因素密码子偏好的形成和影响因素非常复杂,下面列举了一些常见的影响因素:1. 突变率和选择压力密码子偏好可能受到突变率和选择压力的共同影响。

突变率指的是密码子在基因组中发生变异的速率,而选择压力指的是外界环境对密码子选择的影响。

突变率越高,密码子偏好可能越小,因为基因组中出现新的密码子编码的几率会增加。

密码子的偏好性是什么?

密码子的偏好性是什么?

密码子的偏好性是什么?
密码子的偏好性是指不同生物在翻译过程中对简并密码子的使用频率存在差异,而在进化的过程中形成了一套与其相适应的常用密码子。

蛋白质在翻译的过程中,是由tRNA转运氨基酸至核糖体中,mRNA中的三联体密码决定氨基酸序列(图1)。

由于密码子存在简并性,因此同一种氨基酸可以由多个密码子编码。

这意味着有61种可能的tRNA,而在生物体中都表达61种tRNA的可能性不高,并且每种tRNA的表达丰度也会存在差异。

那当外源基因的密码子所对应的tRNA在宿主细胞中的表达量低时,则会影响它的翻译效率。

肽链的合成过程(Image from Mariana Ruiz Villarreal)。

刺猬线粒体基因组密码子偏好性分析

刺猬线粒体基因组密码子偏好性分析

收稿日期:2023-05-05作者简介:韩君(1988—),男,黑龙江哈尔滨人,硕士,工程师,研究方向为生物信息学与多组学数据分析。

刺猬线粒体基因组密码子偏好性分析韩君(北京康仁堂药业有限公司,北京101301)摘要:为利用分子技术探究刺猬皮等组织作为中药使用的机制,促进远东刺猬分子进化研究。

以远东刺猬线粒体全基因组序列为材料,从中筛选出长度大于300bp 的非重复编码序列(CDS )12条,利用CodonW1.4.2、SPSS 25.0和Excel 2007等软件分析其密码子偏好性。

结果显示:密码子第3位的碱基平均GC 含量为24.30%;有效密码子数目(ENC )分布范围为31.83~50.67,平均值为43.37;相对同义密码子使用度(RSCU )值>1.00的密码子共有32个,偏好以碱基A 或U (T )结尾。

中性绘图分析结果显示,GC 1和GC 2的平均值(GC 12)与GC 3之间的相关系数为0.443;ENC-plot 分析结果显示,多数基因在标准曲线附近聚集;对应性分析结果表明,第1~4个向量轴的贡献率分别为35.64%、16.22%、10.26%和9.13%,同义密码子第3位的GC 含量(GC3s )、ENC 与第1向量轴(Axis1)呈显著正相关;密码子适应指数(CAI )与Axis1呈负相关,最终确定CUA 、AUA 、GUU 、UCU 、CCC 、ACA 、GCU 、CAU 、AAA 、GAA 、UGA 、CGC 、GGC 和GGA 为最优密码子。

通过优化远东刺猬线粒体基因组密码子以及应用分子手段进行深入研究,有助于探究远东刺猬组织入药机制。

关键词:远东刺猬;线粒体;密码子;偏好性;中药中图分类号:S862;R282文献标志码:A文章编号:1001-0084(2023)04-0031-07Codon Preference Analysis on MitochondrialGenome of Erinaceus amurensisHAN Jun(Beijing Tcmages Pharmaceutical Co.,Ltd.,Beijing 101301,China )Abstract:Using molecular technique to explore the mechanism of hedgehog hide and other tissues applied astraditional Chinese medicine,and promote molecular evolution of Erinaceus amurensis in the Far East,taking the complete mitochondrial genome sequence of Erinaceus amurensis as the material,12non-repeating coding sequences (CDS)with a length greater than 300bp were selected as the research objects in this study,and their codon preference was analyzed by using CodonW1.4.2,SPSS 25.0,Excel 2007and other software.The average GC content of the third codon was 24.30%;the number of effective codons (ENC)ranged from 31.83to 50.67,with an average value of 43.37;and the relative synonymous codon usage (RSCU)value of 32codons was greater than 1.00,and the preference ends with either A or U (T).According to neutral plot analysis,the correlation coefficientbetween the average value (GC 12)of GC 1,and GC 2and GC 3was 0.443.In addition,ENC-plot analysis also revealed that most genes cluster near the standard curve;besides,the corresponding analysis showed that the contribution rates of the 1-4vector axes were 35.64%,16.22%,10.26%and 9.13%,respectively;and the GC content of the third synonymous codon (GC3s )and ENC were significantly positively correlated with the first vector axis (Axis1).In addition,the codon adaptation index (CAI)was negatively correlated with Axis1.Hence,it could finally beDOI:10.20041/ki.slbl.2023.04.006猬科在我国共有5个属7个种。

原核表达密码子偏好 概述及解释说明

原核表达密码子偏好 概述及解释说明

原核表达密码子偏好概述及解释说明1. 引言1.1 概述原核表达密码子偏好是指原核生物在蛋白质合成过程中对编码氨基酸的密码子选择存在一定规律性。

密码子是由三个核苷酸组成的序列,用于编码不同的氨基酸。

在原核生物中,有些密码子被广泛使用,而其他密码子则较少使用。

这种密码子偏好现象引发了科学家们的兴趣,并且对研究人员揭示了一些有关遗传信息传递机制和生物进化的重要见解。

1.2 文章结构本文将以以下几个部分来描述原核表达密码子偏好。

首先,在第2部分中,我们将概述原核表达密码子偏好的基本概念和背景知识。

然后,在第3部分中,我们将解释说明影响原核表达密码子偏好的主要原因和机制。

接下来,在第4部分中,我们将通过实例分析具体介绍常见原核生物中的密码子偏好现象及其解释。

最后,在第5部分中,我们将总结原核表达密码子偏好的特点并展望该领域未来的研究方向。

1.3 目的本文旨在深入探讨原核表达密码子偏好的现象和机制,并通过实例分析加深对该领域的理解。

了解原核表达密码子偏好对我们揭示细胞功能和进化过程具有重要意义。

同时,本文也希望能够促进对密码子偏好研究领域的发展,为未来的研究提供新的思路和方向。

2. 原核表达密码子偏好概述:2.1 什么是原核表达密码子偏好原核生物中的基因编码信息通过密码子来进行转录和翻译,密码子是由三个核苷酸组成的序列,每个密码子对应着一个氨基酸。

然而,在同一种原核生物的基因组中,对于某些氨基酸来说,并非所有可能的密码子都被等概率地使用。

相反,原核生物存在一种选择性地使用某些密码子来编码特定氨基酸的现象,这就是原核表达密码子偏好。

2.2 密码子的定义和功能在DNA或RNA序列中,每三个连续的核苷酸被称为一个密码子。

根据遗传密码表,不同的密码子对应着不同的氨基酸,起到了翻译基因信息为蛋白质序列的作用。

2.3 原核生物中密码子使用的规律性原核生物在使用密码子时并非随机选择,而是存在一定程度上的规律性。

具体而言,原核生物中较为常见或者富集的密碼雙取决于其所编码氨基酸出现频率及其它影响因素。

乙型肝炎病毒密码子偏好性及影响因素分析

乙型肝炎病毒密码子偏好性及影响因素分析

中国病原生物学杂志2020年12月第15卷笫12期•1404•Journal of Pathogen Biology Dec.2020,Vol.15,No.12DOI:10.13350/j.cjpb.201208•论著*乙型肝炎病毒密码子偏好性及影响因素分析*吴炜倩',胡源「胡接力黄爱龙涂增…(1.重庆医科大学第二临床阪学院•重庆400016;2.感染性疾病分子生物学教育部重点实验家;3.重庆医科大学基础医学院病原生物学教研室)目的分析乙型肝炎病毒(HBV)B、C基因里密码子使用偏好性及其影响肉素•探讨HBV密码子使用模式与宿主、病毒进化的关系。

方法从GenBank数据库中收集47株HBV的全基因组序列,利用EMB()SS、SPSS24.0、MEGAX等软件对具密码子偏好性进行统计分析。

结果HBV各蛋白编码序列的ENC值为56.37-58.74.CAI值为0.678-0.697,GC3含量为0.474-0.506。

RS('U>1的密码子共27个,主要以U/C结尾。

高频使用密码子为UCU、C(、U和AGC•低频使用密码子为CUA、C('G、CGA、AC(;和UCG0ENC绘图显示47株病毒均位于预期曲线之下。

中性绘图分析表明GC12与GC3无显著相关性(R=0.005,PV0.01)。

PR2绘图显示第1位碱基T和C含屋较高。

对应分析显示这些病毒的密码子偏好性受碱肚组成影响的町能性较小。

利川CAI值和卡方检验的方法确定GAC 和GAA为上述毒株的最优密码子。

密码子使用频率比值表明B、C基因型与人类的密码子偏好性相近•而聚合酶(P)、表面(S)基因与人类的密码子偏好性存在一定的差界•以P基因差异更大。

系统发工分析显示毒株分类的进化越相近,其密码子偏好件越相似。

结论B、('基因熨HBV偏爱使用U/C结尾的密码子,其密码子偏好性主要受到自然选择的影响。

结介密码子偏好件9密码子优化可能仃助于理解HBV进化过程和对垠适宿主的选择机制,关键词】乙型肝炎病毒;密码子使用偏好性;进化中图分类号】R373.2【文献标识码】【文章编号】1673-5234(2020)12-1404-07^Journal of Pathogen Biology.2020Dec;15(12):1404—1410.]Codon usage bias of the hepatitis B virus and factors influencing itWU Wei-qian1,HU Yuan'.HU Jie-li J・Huang Ailong"・TU Zeng"(1.The Second Hospital Affiliated UL'ith Chongqing Medical University<,Chongqing、C7?ina400016;2.Ministry o f Education Key laboratory for the Mo­lecular Biology o f Infectious Diseases; 3.De pa rtment o f Pathogen Biology.College of Basic Medical Sciences.Chongqing Medical University)Objective To analyze the codon usage bias of the B and(.'genotypes of the hepatitis B virus(HBV)and factors influe n cing it and to further explore its relati o n s hip to the evolution of HBV.Methods Forty-seven full-le n gth genomes of HBV were obtained from GenBank,and the codon usage bias and factors influencing it were evaluated using the relative synonymous codon usage(RSCU),codon adaptation index(CAI),effective number of cod o ns(ENC),and (;('calculated using EMBOSS and CodonW.SPSS24.0and MEGAX were used for statistical and phylogenetic analysis, respectively.The best cod o n was determined using a X test(C'hi-square test)based on the CAI.Results For the cod­ing sequence of HBV.ENC ranged from56.37to5&74,CAI ranged from0.678to0.697.and GC3content ranged from0.474to0.506.Twenty-seven codons of HBV with a RSCU value larger than one mainly ended with U/C.The high-frequency codons were UCU,CCU・and AGC while the low-frequency codons were CUA»CCG.C(;A・ACG,and UCG ENC plots indicated that all47isolates were below the expected curve.A neutrality plot analysis revealed no sig­nificant correlation between GC12and GC3(R=0.005,P<0.01).A PR2bias-plot analysis revealed a high T and C con tent.Correspondence analysis suggested that overall nucleotide composition slightly affected the codon usage bias within the B and('genotypes of HBV in the current dataset.GAC and GAA were the optimal codons of the above strains based on the CAI value and a chi-square test.A comparative analysis of the relative frequency of codon usage revealed a high frequency of codon usage(84.75%)in HBV genotypes B and C similar to the codon preference in human beings.This was true for the whole genome.The P gene of HBV genotypes B and C displayed the greatest dissimilarity(40.68%),followed by the S gene(28.81%).Phylogenetic analysis indicated that HBV isolates with a similar cod O n prefer-【基金项目】重庆市基础科学与前沿技术研究专项(No.CSTC2O15jcyjAlOOO6);国家自然科学基金青年科学基金项目(No.81501751);重庆市博士后科学基金项冃(No.Xm2014006)o涂增.E—mail:***************吴炜倩(1998—),女,重庆忠县人,在读本科生。

密码子偏好性分析课件

密码子偏好性分析课件
要求较高。
现有的研究方法和技术还存在一 定的局限性,例如在数据采集、 处理和分析等方面,需要进一步
完善和改进。
研究的发展趋势与前景
随着基因组测序技术的不断发展,可以预见未来将有更多的物种基因组被测序,为 密码子偏好性研究提供更多的数据资源。
计算机科学和统计学的技术进步将为密码子偏好性研究提供更加高效和准确的分析 工具和方法,有助于揭示更深层次的规律和机制。
撰写报告
将分析过程、方法和结果写成报告,以供后续研究和参考。
03
密码子偏好性模型
建立模型
基于序列数据的统计模型
01
Hale Waihona Puke 利用序列数据,通过统计方法建立模型,分析密码子的使用偏
好。
基于基因组数据的机器学习模型
02
利用基因组数据,通过机器学习算法建立模型,预测密码子的
使用偏好。
基于生物信息的综合分析模型
03
数据分析
统计每个密码子的使用频率
根据计算方法得到的密码子使用频率数据进行排序和统计,得出 每个密码子的使用频率。
分析偏好性
对比不同种类生物的密码子使用频率数据,分析密码子的偏好性。
寻找热点密码子
根据统计分析结果,寻找热点密码子,即使用频率最高的密码子。
结果展示
制作图表
根据数据分析结果,制作条形图、饼图、柱状图等图表,直 观展示密码子的使用频率和偏好性。
其他因素
翻译后修饰
某些蛋白质在翻译后需要进行修饰,这种修饰可能会影响密码子的使用。
代谢途径
不同生物体具有不同的代谢途径,这可能会影响密码子的使用和偏好性的形成 。
05
密码子偏好性与蛋白质 表达
密码子使用与蛋白质表达关系

杜梨叶绿体基因组密码子偏好性分析

杜梨叶绿体基因组密码子偏好性分析

第43卷第6期2020年11月河北农业大学学报JOURNAL OF HEBEI AGRICULTURAL UNIVERSITYVol.43 No.6Nov.2020杜梨叶绿体基因组密码子偏好性分析辛雅萱,董章宏,瞿绍宏,刘 成,叶 鹏,辛培尧( 西南林业大学 西南山地森林资源保育与利用教育部重点实验室/ 西南地区生物多样性保育国家林业和草原局重点实验室,云南 昆明 650224)摘要:为了明确杜梨叶绿体基因组密码子的使用偏性,以杜梨叶绿体基因组中的37条蛋白质编码序列为研究对象,利用Codon W 1.4.2和在线软件CUSP等对其密码子进行了中性绘图分析、ENC-plot和PR2-plot分析。

结果表明:(1)杜梨叶绿体基因组密码子不同位置GC碱基含量为:GC1(48.45%)>GC2(40.76%)>GC3(28.66%),说明密码子末位碱基偏好以A/U结尾;(2)有效密码子数(ENC)取值范围是33.13~52.73,表明密码子偏性较弱;(3)相对同义密码子(RSCU)分析表明,其值>1的密码子有30个,其中以A、U结尾的有29个;(4)GC3和GC12无显著相关,相关系数和回归系数分别为-0.1434和0.2072; ENC-plot中大部分基因分布于曲线周围和下方,ENC比值分布在-0.05~0.05区间的有14个,说明密码子偏性主要受选择的影响;PR2-plot分析中,T的使用频率高于A,G的使用频率高于C,说明密码子偏性受多重因素影响;(5)最终筛选出UUU、UAA、AUU等18个密码子为最优密码子,多以A或U结尾。

综上所述,杜梨叶绿体基因组密码子的使用主要受选择影响,研究结果可为杜梨乃至梨属植物叶绿体基因组学的研究提供理论依据。

关 键 词:杜梨;叶绿体基因组;密码子偏好性;最优密码子中图分类号:S661.1开放科学(资源服务)标识码(OSID):文献标志码:AAnalysis on codon usage bias of chloroplast genome in Pyrus betulifolia Bge.XIN Yaxuan, DONG Zhanghong, QU Shaohong, LIU Cheng, YE Peng, XIN Peiyao(1. Key Laboratory of Forest Resources Conservation and Utilization in the Southwest Mountains of Ministry ofEducation / Key Laboratory of National Forestry and Grassland Administration on Biodiversity Conservation inSouthwest China, Southwest Forestry University, Kunming 650224, China)Abstract: In order to realize the usage bias of codons in Pyrus betulifolia chloroplast genome, 37 CDS of P.betulifolia chloroplast genome were used as the research object, and the codons were analyzed by neutral plotting,ENC-plot and PR2-plot using Codon W 1.4.2 and online software CUSP. The results showed that: (1) the GC contentat different locations of the codons in the chloroplast genome of P. betulifolia were GC1 (48.45%)>GC2 (40.76%)>GC3 (28.66%), indicating that the codon terminal base preferred to end with A/U. (2) The value range of theeffective codon number (ENC) was 33.13-52.73, indicating weak codon bias. (3) Relative synonymous codon (RSCU)analysis showed that there were 30 codons with the RSCU value>1, and 29 codons ending with A and U. (4) Therewas no significant correlation between GC3 and GC12, and the correlation coefficient and regression coefficient was收稿日期:2020-04-01基金项目:国家重点研发计划子课题项目(2017YFD060120204);云南省科技厅科技计划项目(2018BB005).第一作者:辛雅萱(1996-),女,甘肃临洮人,硕士研究生,主要从事林木遗传育种及繁育研究.E-mail:****************通信作者:辛培尧(1975-),男,云南昆明人,博士,教授,主要从事林木遗传育种与良种繁育研究.E-mail:***************本刊网址:http: // hauxb. hebau. edu. cn: 8080 /CN/ volumn / home. shtml文章编号:1000-1573(2020)06-0051-09DOI:10.13320/ki.jauh.2020.011252第43卷河北农业大学学报-0.1434 and 0.2072, respectively. Most of the genes in ENC-plot were distributed around and below the curve, and 14 ENC ratios were distributed between -0.05 and 0.05, indicating that codon bias was mainly affected by selection. In PR2-plot analysis, the usage frequency of T was higher than that of A, and G was higher than C,so the preference of P. betulifolia chloroplast genome codon was affected by multiple factors. (5) Finally, 18 codons such as UUU, UAA and AUU were selected as the optimal codons, most of which ended with A or U. In conclusion, the use of codons in chloroplast genomics of P. betulifolia is mainly influenced by selection. The theoretical basis is provided by this study for the research of chloroplast genomics of P. betulifolia and even Pyrus genus plants.Keywords:Pyrus betulifolia Bge.; chloroplast genome; codon bias; optimal codons密码子(Codon)又称遗传密码,在生物体遗传信息传递的过程中作为联结核酸和蛋白质的纽带,扮演着重要的角色,其偏好性作为基因和基因组的一个静态特征,是生物在长期演化过程中适应和选择的结果[1]。

豆科植物dxr基因密码子偏好性分析

豆科植物dxr基因密码子偏好性分析

Abstract 1 ̄deoxy ̄D ̄xylulose - 5 ̄phosphate reductoisomerase ( DXR) is one of the key enzymes in EMP pathwayꎬ involving in the bi ̄
osynthesis of terpenoids and anthraquinones. Due to the high content of terpenoids and ( or) anthraquinones in leguminous plantsꎬ it is
dxr 基因在酵母表达系统中具有高表达效率ꎬ仍需对其密码子进行优化ꎮ
关键词 豆科植物ꎻ1 ̄脱氧 ̄D ̄木酮糖 - 5 ̄磷酸还原异构酶ꎻ密码子偏好性ꎻ聚类分析
中图分类号 Q78ꎻQ943. 2
文献标识码 A
文章编号 2095 - 1736(2020)01 - 0030 - 05
Analysis of codon bias of dxr gene in leguminous plants
difference between yeast and E. coli was significantly lowerꎬ suggesting that yeast expression system is more suitable for the exogenous
expression system of dxr genes from leguminous plants. Howeverꎬ if the dxr genes of leguminous could be more efficiently expressed in
significant to study the codon bias of dxr gene in leguminous plants in order to understand the regulatory mechanism and further molecu ̄

绵羊骨代谢相关基因VDR密码子偏好性分析

绵羊骨代谢相关基因VDR密码子偏好性分析
ENc)
及密码子偏好指数(
CBI)等参数进行统计 分 析,并 在 多 物 种 间 进 行 比 较,同 时 利 用 ENc
-P
l
o
t关 联 分 析 和 中 性 绘 图
等方法分析 VDR 基因密码子偏好性使用的主要影响因素,并 基 于 多 物 种 同 义 密 码 子 相 对 使 用 度 数 据 与 系 统 进 化
[]
VDR 基因 敲 除 小 鼠 品 系;
P
l
um 等 7 通 过 低 钙 喂 食
方 法 构 建 了 VD 缺 乏 大 鼠 模 型,利 用 切 除 卵 巢
(
OVX)的基 本 无 骨 吸 收 能 力 大 鼠 模 型 研 发 出 一 种
新型具有强化骨合 成 代 谢 活 性 的 1,
25(
OH)
2D3 类
ENc
-P
l
o
t绘
图和中性绘图分析显示,选择压力对 VDR 基因密码子偏好性的影响强 于 突 变 压 力。【结 论】以 G/C 结 尾 的 密 码 子
为 VDR 基因优势密码子,自然选择是导致其偏好性的主要 力 量,密 码 子 偏 好 使 用 存 在 物 种 特 异 性,并 与 物 种 亲 缘
关系进化存在关联性。
骼、肾脏及甲状旁腺等组织的调节作用,维持骨组织
矿物质平衡 [3]。众 所 周 知,骨 矿 盐 代 谢 失 衡 可 引 发
骨质疏松症、骨关 节 炎、椎 间 盘 退 变、骨 软 化 症 及 肌
肉减少症等多种骨代谢相关疾病。目前,
VDR 在动
物医学及动物遗 传 学 领 域 的 研 究 较 多,如 San
t
lr
e
l
a
t
edt
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Abstract Lipopolysaccharide-binding protein(LBP) is key factor in identifying endotoxin of gram-negative bacterium and starting immune response. The aim of this study was to understand LBP gene codon use features and provide foundation for selecting appropriate receptor animals and expression systems. In this
摘 要 脂多糖结合蛋白(lipopolysaccharide-binding protein, LBP)是机体识别革兰氏阴性菌内毒素并启 动免疫反应的关键因子。为了了解 LBP 基因的密码子使用特性,为其选择合适的受体动物以及最佳外源 表达系统提供依据,本研究运用 CHIPS、CUSP 和 CodonW 在线程序分析自主电子克隆的猪(Sus scrofa) LBP 基因(GenBank 登录号: NM-001128435.1)的密码子偏好性,并与猪 8 种抗病相关基因、模式生物基因 组以及其他物种 LBP 基因相比较。结果表明,猪 LBP 基因大部分偏好使用以 G/C 结尾的密码子,27 种偏 好密码子(相对使用度(RSCU)>1)中偏好性较强的有 GCC、CAC、CTG 和 TCC(RSCU≥2),而猪 8 种抗病 相关基因有 23 种偏好密码子,全部以 G/C 结尾,并且偏好性较强的密码子有 GCC、ATC、CTG 和 GTG;通 过比较 14 种动物的 LBP 基因密码子偏好性,发现 14 个物种的 LBP 基因表达水平一般,并且都偏好以 G/C 结尾的密码子;聚类分析发现,偶蹄目猪与 2 种食肉目动物(猫(Felis catus)和狗(Canis))聚为一类,与系统 分类关系不一致;在密码子的使用频率上,猪 LBP 基因与小鼠(Mus musculus)基因组的差异小于大肠杆菌 (Escherichia coli)和酵母菌(Saccharomyces)等 2 种模式生物基因组,故小鼠更适合作为该 LBP 基因的外源表 达宿主。本研究结果为 LBP 基因在动物遗传改良中选择合适的受体动物、选择最佳的外源表达系统以及 提高其表达水平提供一定的理论依据。 关键词 猪,脂多糖结合蛋白基因(LBP),密码子偏好性
究在不断发展,从研究方向来看,以前主要研究原核
脂 多 糖 结 合 蛋 白 (lipopolysaccharide- binding
生物以及低等真核生物中密码子偏性与基因表达的 protein, LBP)是机体识别革兰氏阴性菌内毒素并启
关系(Gustafsson et al., 2004),随后更多的开始关注 动免疫反应的关键因子。目前关于猪(Sus scrofa)
哺乳动物、植物等高等生物的密码子偏性,这可以有 LBP 基因的研究报道较少,喻礼怀等(2012)利用电
效地分析动植物的基因表达差异以及分子进化机制 子克隆成功克隆出猪 l., 2007),并且通过比较密码子偏性 Uenishi 等(2004)通过猪 EST 序列数据库成功拼接
突变和选择的影响,还受其他多种因素影响,如基 CodonW 在线程序,分析猪 LBP 基因的密码子偏
Online system:
农业生物技术学报 Journal of Agricultural Biotechnology
2013, 21(10):1135~1144 DOI: 10.3969/j.issn.1674-7968.2013.10.001
研究论文 Article
research, pig(Sus scrofa) LBP gene(GenBank Accession: NM- 001128435.1) based on electronic cloning sequence was analyzed by Codon W, CHIPS, and CUSP programs online, and then compared with eight disease resistance- related genes, genomes in model organisms and LBP genes from 14 animal species. The results showed that most of pig LBP genes were bias toward the synonymous codons with G and C at the third codon position. There were twenty- seven biased codons (relative synonymous codon usage(RSCU) >1), whose biased strongly codons were GCC, CAC, CTG and TCC (RSCU≥2). However, all of eight disease resistance-related genes were bias toward codons with G and C, and had twenty-three biased codons, whose biased strongly codons were GCC, ATC, CTG and GTG. The comparative analysis results of LBP genes from 14 animal species also showed that gene expression level was general in 14 animal species,and all of the LBP genes were bias toward the synonymous codons with G and C at the third codon position, which was possible due to special functions of these genes. Clustering analysis showed that pigs belonging to artiodactyla and animals belonging to carnivora were together for a class, which disagreed with taxonomic relationship. The differences in codon usage frequency between pig LBP gene and genome of Mus musculus were less than other two kinds of model organisms' (Escherichia coli and Saccharomyces Yeast) genome. Therefore, Mus musculus expression systems might be more suitable for expression of LBP gene. This study can provide certain theoretical basis for selecting the appropriate receptor animals in animal genetic improvement, selecting appropriate expression systems and improving the expression level of LBP gene. Keywords Pig, Lipopolysaccharide-binding protein gene(LBP), Codon bias
为同义密码子的末位碱基突变是中性选择的结果, 达水平的预测都有待解决,分析密码子偏好性有助
而这种选择不受自然选择压力的影响;选择-突变- 于指导外源基因进行分子改造,从而提高该基因的
漂变学说认为同义密码子的偏好性使用主要是用 表达效率以及新基因预测和基因组注释的准确性
于选择最优密码子。研究发现密码子偏性不仅受 ( 刘 汉 梅, 2010)。 本 研 究 运 用 CHIPS、CUSP 和
遗传信息是主要按照“中心法则”进行传递,即 Powell, 1997)、翻译的起始效应(Sakai et al., 2001)
从 DNA 转录为 mRNA,最后翻译成氨基酸的过程。 以及氨基酸保守性(张文娟, 2006)等。密码子偏性
其中,氨基酸是以三联体密码子形式编码,每个氨基 分析已经成功运用到转基因研究中,通过比较某一
基金项目:国家自然科学基金(No.31172183),江苏省科技支撑计划(农业)(No. BE2012330, BE2010371, BE2013345)和江苏 省产学研前瞻性联合研究项目(No.BY2012157) 收稿日期:2013-05-21 接受日期:2013-07-15
农业生物技术学报 1136 Journal of Agricultural Biotechnology
猪脂多糖结合蛋白基因(LBP)的密码子偏好性分析
吴正常 1 王靖 1 赵乔辉 1 朱世平 1 訾臣 1 吴圣龙 1,2 包文斌 1,2*
1 扬州大学动物科学与技术学院,江苏省动物遗传繁育与分子设计重点实验室,扬州 225009;2 江苏省现代种猪分子选育工程技术研究中心, 常州 213149 *通讯作者,wbbao@
的差异程度,来分析物种间的亲缘关系。
出猪 LBP 基因的 mRNA 序列,GenBank 登录号为
密码子偏性现象存在 2 种理论,即中性理论和 NM_001128435。虽然已经预测出猪 LBP 基因的编
选择-突变-漂变学说(Bulmer, 1991)。中性理论认 码序列,但该基因最佳外源表达系统的选择以及表
相关文档
最新文档