葫芦巴叶绿体基因组密码子偏好性分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第32卷 第2期
V o l .32 N
o .2草 地 学 报
A C T A A G R E S T I A S I N I C A
2024年 2月
F e b . 2024
d o i :10.11733/j
.i s s n .1007-0435.2024.02.007引用格式:杜明川,王伟,鲍海娟,等.葫芦巴叶绿体基因组密码子偏好性分析[J ].草地学报,2024,32(2):409-418
D U M i n g -c h u a n ,WA N G W e i ,B A O H a i -j u a n ,e t a l .A n a l y s i so fC o d o nB i a s i nC h l o r o p l a s tG e n o m eo f T r i g
o n e l l a F o e n u m -g
r a e c u m [J ].A c t aA g r e s t i aS i n i c a ,2024,32(2):409-418葫芦巴叶绿体基因组密码子偏好性分析
杜明川1,王 伟2,鲍海娟1,格 措1,张 蕊1,王久利1,刘 晶*
(1.
青海民族大学生态环境与资源学院,青海省特色经济植物高值化利用重点实验室,青海民族大学药用植物资源学凯瑞研究生工作站,青海西宁810000;2.青海大学,青海西宁810000
)摘要:为探究葫芦巴(T r i g o n e l l a f o e n u m -g r a e c u m L .)叶绿体基因组密码子的使用偏好性,利用C o d o n W 1.4.2和在线软件C U S P 对筛选到的50条蛋白质编码序列密码子进行分析㊂结果表明:葫芦巴叶绿体基因组密码子末位碱基以A /U 为主,G C 含量仅为26.25%㊂E N C 取值范围为35.05~53.66,且E N C 值>45的有20个,说明葫芦巴大部分基因编码序列的密码子偏性较强㊂R S C Uȡ1的密码子有30个,其中16个以U 结尾㊁13个以A 结尾㊂中性绘图分析㊁E N C -p l o t 分析及P R 2-p l o t 偏倚分析结果发现,葫芦巴叶绿体基因组密码子使用偏好性受到突变压力等多种因素的影响,主要因素为自然选择㊂最终筛选出G C U ,A G A ,C G U 等21个密码子为最优密码子㊂关键词:葫芦巴;叶绿体基因组;密码子偏好性;选择;最优密码子
中图分类号S 681.9 文献标识码:A 文章编号:1007-0435(2024)02-0409-10
A n a l y s i s o fC o d o n
B i a s i n
C h l o r o p
l a s tG e n o m e o f T r i g o n e l l aF o e n u m -g r a e c u m D U M i n g -c h u a n 1,WA N G W e i 2,B A O H a i -j u a n 1,G EC u o 1,Z H A N G R u i 1,WA N GJ i u -l i 1,L I UJ i n g
1*
(1.C o l l e g e o fE c o l o g i c a l E n v i r o n m e n t a n dR e s o u r c e s ,Q i n g h a iM i n z uU n i v e r s i t y ,Q i n g h a i P r o v i n c i a lK e y L a b o r a t o r y o fH i g
h v a l u e U t i l i z a t i o no fC h a r a c t e r i s t i cE c o n o m i cP l a n t s ,K a i r u iG r a d u a t eW o r k s t a t i o no fM e d i c i n a l P l a n tR e s o u r c e s o fQ i n g h a iM i n z u U n i v e r s i t y ,X i n i n g ,Q i n g h a i P r o v i n c e 810000,C h i n a ;2Q i n g h a iU n i v e r s i t y ,X i n i n g ,Q i n g
h a i P r o v i n c e 810000,C h i n a )A b s t r a c t :I no r d e r t oe x p l o r e t h e c o d o nu s a g eb i a so f c h l o r o p l a s t g e n o m e i n T r i g o n e l l a f o e n u m -g
r a e c u m ,C o d o n W1.4.2a n d o n l i n e s o f t w a r eC U S Pw e r e u s e d t o a n a l y z e t h e c o d o n s o f 50p r o t e i n c o d i n g s e q u e n c e s .T h e r e s u l t s s h o w e d t h a t t h eb a s e a t t h e e n do f t h e c h l o r o p l a s t g e n o m e c o d o no f T r i g o n e l l a f o e n u m -g
r a e -c u m w a sm a i n l y A /U ,a n d t h eG Cc o n t e n tw a s o n l y 26.25%.T h eE N Cv a l u e r a n g
e d
f r o m35.05t o 53.66,a n d t h e r ew e r e 20E N Cv a l u e s >45,i n d i c a t i n
g t
h a t t h e c o d o nb
i a s o fm o s t g e n e c o d i n g s e q u e n c e s o f T r i g o -n e l l a f o e n u m -g
r a e c u m w a s s t r o n g .T h e r ew e r e 30c o d o n sw i t hR S C Uȡ1,o fw h i c h16e n dw i t hUa n d13e n dw i t hA.T h e r e s u l t s o f n e u t r a lm a p p i n g a n a l y s i s ,E N C -p l o t a n a l y s i s a n dP R 2-p l o t b i a s a n a l y
s i s s h o w e d t h a t t h e c o d o nu s a g eb i a s o f t h e c h l o r o p l a s t g e n o m e o f T r i g o n e l l a f o e n u m -g
r a e c u m w a s a f f e c t e db y m a n y f a c t o r s s u c ha sm u t a t i o n p r e s s u r e ,a n dt h em a i nf a c t o rw a sn a t u r a l s e l e c t i o n .F i n a l l y
,21c o d o n ss u c ha s G C U ,A G A ,C G U w e r e s e l e c t e d a s t h e o p
t i m a l c o d o n s .K e y w o r d s :F e n u g r e e k ;C h l o r o p l a s t g e n o m e ;C o d o nb i a s ;S e l e c t i o n ;O p t i m a l c o d o n s 收稿日期:2023-08-14;修回时间:2023-12-08
基金项目:国家重点研发计划课题(2022Y F D 1602304
)资助作者简介:杜明川(1996-),女,穿青人,贵州六盘水人,硕士研究生,主要从事药用植物种质资源开发与利用研究,E -m a i l :1321575830@
q q .c o m ;*通信作者A u t h o r f o r c o r r e s p o n d e n c e ,E -m a i l :654138133@q q
.c o m 葫芦巴(T r i g o n e l l a f o e n u m -g
r a e c u m L .)为豆科葫芦巴属一年生草本植物,又名芸香草㊁香草㊁香苜蓿㊁芦巴子等,被称为希腊干草,是豆科最古老的药用植物之一㊂葫芦巴原产于西亚㊁南欧和地中海地区,汉朝时作为香料传入中国,目前在我国大部分
地区均有不同程度的分布[
1]
㊂葫芦巴全株可入药,含氨基酸㊁黄酮类㊁生物碱类㊁甾体皂苷类等化学成分,具有抗菌㊁抗炎㊁抗氧化㊁降血糖㊁降血脂等功
效[2]
㊂此外,葫芦巴具有较高的饲用价值㊂前人研
究发现,饲粮中添加0.10%葫芦巴提取物对断奶仔猪有诱食效果,能改善机体抗氧化功能㊁降低血糖水
平和保护肾脏[3]
㊂B e g
u m 等[4]研究表明,饲料中添
草地学报第32卷
加葫芦巴籽提取物提高了断奶仔猪的生产性能,降
低了粪便中的有毒气体排放㊂饲喂葫芦巴日粮改善
了牛奶中功能性脂肪酸的分布,降低了胆固醇浓度,
增加了功能性脂肪酸[5]㊂在热应激山羊的饲料中添加葫芦巴籽,可以提高山羊的产奶量,改善其抗氧化
能力及血液学和生理指标[6]㊂黄羽肉鸡饲料中添加葫芦巴提取物,能够改善鸡肉风味,提升肉品质,增强抗应激能力[7]㊂
叶绿体是植物重要的细胞器,为植物生命活动
提供能量,同时拥有相对独立的遗传体系,可进行半
保留复制[8-9]㊂上世纪60年代初,首先在烟草(N i c-o t i a n a t a b a c u m)和地钱(M a r c h a n t i a p o l y-m o r p h a)中获得叶绿体全基因组序列,目前已有超过1000种物种的叶绿体基因组全序列被公布[10-11]㊂相对于核基因组,叶绿体基因组具有大小适中㊁结构相对保守㊁简单重复序列(S i m p l e s e q u e n c e r e p e a t,S S R)位点丰富㊁碱基变异速率适中㊁易于提取纯化等优势,被广泛应用于植物起源㊁物种鉴定㊁系统发育进化等研究[12-14]㊂K i m等[15]研究发现,r p oB-r p oA(2)和y c f2-t r nL-C A A序列可作为越桔属(V a c c i n i u m)的D N A条形码㊂Z h a o等[16]利用叶绿体基因组对蝙蝠草(C h r i s t i a v e s p e r t i l i o n i s)进行比较和系统发育分析㊂H u a n g等[17]研究了须弥葛(H a y m o n d i a w a l l i c h i i)叶绿体全基因组及其在豆科中的系统发育关系,表明了须弥葛与粉葛(P u e r a r i a t h o m s o n i i)和野葛(P u e r a r i a l o b a t a(W i l l d.)O h w i)的亲缘关系较近㊂
密码子是生命信息的基本遗传单位,在遗传信
息表达的过程中,起到了纽带的作用[18]㊂自然界共存在64种密码子,除三种终止密码子外,即U A G, U A A和U G A,其余61种密码子编码20种氨基酸,除蛋氨酸(M e t)和色氨酸(T r p)外,其余氨基酸均对应2个及以上的同义密码子(S y n o n y m o u s c o d o n),即编码同一氨基酸的不同密码子[19]㊂在蛋白质的编码过程中,同义密码子的使用存在偏好性,称为密码子的使用偏好性[20]㊂同义密码子使用偏好性受到多种因素的影响,如自然选择㊁选择-突变-遗传漂变模型㊁基因的碱基组成㊁t R N A的丰度等因素[21-22]㊂研究某物种的密码子使用偏好性,设计外源基因表达载体时根据最优密码子进行优化,可以提高外源基因在叶绿体基因组中的表达量[23]㊂周宗梁等[24]根据水稻密码子使用偏好性对c r y1A h1基因进行优化,提高了C r y1A h蛋白平均表达量㊂韩岚等[25]根据植物密码子使用偏好性设计并人工合成了纳豆激酶基因s NK i,并在不同成熟时期的番茄果实中实现了瞬时表达㊂
目前,已在蒜头果(M a l a n i a o l e i f e r a)[26]㊁安龙油果樟(S y n d i c l i s a n l u n g e n s i s)[21]㊁降香黄檀(D a l-b e r g i a o d o r i f e r a)[22]㊁白羊草(B o t h r i o c h l o a i s c h a e-m u m)[27]㊁厚壳红瘤果茶(C a m e l l i a r u b i t u b e r c u l a-t a)[28]等植物中开展了叶绿体基因组密码子偏好性的研究㊂但是在葫芦巴中的研究尚未见报道㊂本研究采用中性绘图㊁E N C-p l o t绘图及P R2-p l o t绘图等方法,分析了叶绿体葫芦巴基因组蛋白质编码区(C o d i n g D N As e q u e n c e,C D S)序列的碱基组成,以确定葫芦巴密码子使用偏好的主要影响因素,并确定了葫芦巴叶绿体基因组的最优密码子,旨为葫芦巴遗传改良和育种等研究提供科学的参考依据㊂
1材料与方法
1.1试验材料
在N C B I数据库中下载葫芦巴叶绿体基因组序列(G e n b a n k登录号为:MN736956.1;h t t p s:// w w w.n c b i.n l m.n i h.g o v/n u c c o r e/MN736956.1),共获得到76条C D S序列㊂剔除重复基因㊁长度小于300b p㊁非A T G作为起始密码子㊁C D S内部存在终止密码子及终止密码子异常的序列后,获得50条蛋白编码区序列作为研究对象用于后续分析㊂
1.2试验方法
1.2.1密码子组成分析将筛选得到的50条
C D S序列作为研究对象,使用C o d o n W1.4.2对葫芦巴叶绿体基因组的50条编码序列进行分析,获得各C D S序列的同义密码子相对使用度(R e l a t i v e s y n o n y m o u s c o d o nu s a g e,R S C U)和有效密码子数(E f f e c t i v en u m b e r o f c o d o n s,E N C),利用在线软件C U S P(h t t p://e m b o s s.t o u l o u s e.i n r a.f r/c g i-b i n/ e m b o s s/c u s p)分析密码子三个位置的G C含量(G C1,G C2,G C3)及G C平均含量(G C a l l),并运用S P S S和E X C E L软件对结果进行分析㊂
E N C常被用来评估同义密码子使用偏好性程度,其取值范围在20~61之间,E N C值45为分界点,值越小偏倚性越强,值越大偏倚性越弱[22]㊂R S C U为某个密码子实际使用频率与理论频率的比值;R S C U =1,表明该密码子没有使用偏好性;R S C U>1,表明该密码子的使用频率高于预期,反之则表明该密码子出现的频率低于其他同义密码子[29]㊂
014
第2期杜明川等:葫芦巴叶绿体基因组密码子偏好性分析
1.2.2中性绘图分析中性绘图被用来分析密码子使用偏好性的影响因素[30]㊂纵坐标为G C12含量(G C1与G C2平均值),G C3含量为横坐标,图中每
一个散点代表一个基因㊂若回归系数接近于1,且图中所有散点均沿对角线分布,说明密码子的碱基组成相似,表示密码子偏好性主要受突变压力的影响㊂反之则表示其偏好性受选择压力的影响较大㊂结合S P S S对密码子碱基组成进行相关性分析,进一步判断影响葫芦巴叶绿体基因组密码子偏好性的主要因素,当G C12与G C3无相关性时,说明密码子前两位在碱基组成上与第三位存在较大差异,选择压力为偏好性的主要影响因素;反之,则说明突变压力对密码子使用偏性的影响较大[26]㊂
1.2.3 E N C-p l o t绘图分析 E N C-p l o t图包括标准曲线及散点图㊂散点图分别以E N C和G C3为纵㊁横坐标;标准曲线的公式为E N C=2+G C3+ 29/[G C23+(1-G C3)2],其代表无选择压力存在时,基因的核酸序列决定密码子偏好性[17]㊂具体判断标准为图中散点与标准曲线的距离,两者距离较近则主要影响因素为碱基组成,反之主要影响因素为选择压力[31-32]㊂同时,需要结合E N C比值频数分布情况准确区分选择压力和中性突变对密码子偏好性的影响程度,以-0.05~0.05区间为界限[33]㊂1.2.4 P R2-p l o t绘图分析 P R2-p l o t绘图分析用于揭示核苷酸组成的影响因素,图的横㊁纵坐标分别为G3/(G3+C3)和A3/(A3+T3)㊂图的中心点表示A=T,C=G,代表密码子偏好性不受选择压力的影响,其余各点与中心点的矢量距离表示其偏倚方向和程度[34]㊂
1.2.5最优密码子的确定将葫芦巴叶绿体基因组筛选后得到的基因序列的E N C值从高到低进行排序,并在最低值和最高值两端各选择10%基因,用于构建高低表达数据库,利用C o d o n W1.4.2计算R S C U值和ΔR S C U(高低表达数据库之间的差值),将满足ΔR S C Uȡ0.08,且R S C U>1的密码子确定为最优密码子[35]㊂
2结果与分析
2.1密码子的碱基组成
对葫芦巴叶绿体基因组编码序列进行碱基组成分析(表1),G C1(密码子第一位碱基G C含量)㊁G C2(密码子第二位碱基G C含量)㊁G C3(密码子第三位碱基G C含量)的分布范围分别在28.57%~57.14%,28.52%~18.56%,28.57%~33.83%之间,G C含量在密码子的3个位置上的分布频率不同,且平均值为G C1(46.31%)>G C2(38.62%)>
G C3(26.25%)㊂其中,G C a l l(密码子总G C含量)为
37.06%,与G C2相差不大;G C3的平均值最小,选择压力最大,具有明显A/U偏向性㊂密码子数量主要分布在100~2000之间,r p s14数量最少,为101,y c f2数量最多,为2140㊂由表1可知,表示偏倚性强弱的E N C值的范围在33.02~53.66之间,平均值为44.12,有20个基因的E N C值大于45,表明葫芦巴叶绿体基因组密码子偏性较强㊂
葫芦巴叶绿体基因组密码子各位置G C含量㊁密码子数(N)㊁E N C值相关性分析(表2)㊂结果表明G C a l l和G C1㊁G C2㊁G C3极显著相关,G C1和G C2呈极显著相关,但G C3与G C1㊁G C2显著性较差,说明葫芦巴密码子前两位的碱基组成相似,且与第3位存在较大差异㊂E N C与G C1相关性显著,与G C2无相关性,与G C3达极显著相关,表明E N C受密码子第1位和第3位碱基组成的影响㊂密码子数(N)与E N C相关系数为0.292,呈显著相关,说明密码子使用偏好性在一定程度上受基因编码序列长度影响㊂
对葫芦巴叶绿体基因组整体的同义密码子相对使用度(R S C U)进行分析(图1),结果显示葫芦巴编码序列包含64种密码子㊂其中,编码I l e的密码子A U U数量最多,为919个,编码T e r的密码子U A G数量最少,仅有6个㊂葫芦巴叶绿体基因组密码子中有30个R S C Uȡ1,其中有29个以A/U结尾,占比97%,具有明显的A/U偏向性㊂
2.2中性绘图分析
中性图分析是用来解释自然选择和突变压力对密码子偏好性的影响程度㊂当回归系数接近1时,突变压力为主要影响因素,当回归系数接近0时,选择压力起到主要作用[36-37]㊂由图2可知,G C12与G C3回归系数为0.358,相关系数为0.1761,说明G C12和G C3之间的相关性很弱,表明葫芦巴叶绿体基因组密码子的前两位碱基与第3位在进化方式㊁碱基组成等方面存在差异,基因组中的G C含量高度保守,第3位的G C含量较低㊂葫芦巴叶绿体编码序列的基因,全部位于对角线上方,且大部分基因与对角线距离较远,仅有2个基因离对角线较近,涉及保守假设性叶绿体O R F和包膜膜蛋白两种功能㊂表明葫芦巴叶绿体基因组密码子偏好性以受自然选择的影响为主㊂
114
草 地 学 报
第32卷
表1 葫芦巴叶绿体基因组密码子的G C 组成特征
T a b l e 1 G Cc o m p o s i t i o no f T r i g o n e l l a f o e n u m -g
r a e c u m c h l o r o p l a s t g e n o m e c o d o n 基因功能
G e n e f u n c t i o n
基因
G e n e
C N G C 1/%G C 2/%G C 3/%G C a l l /%G C 12/%E N C 乙酰辅酶A 羧化酶A c e t y l -C o Ac a r b o x y
l a s e a c c D
53043.0232.0830.0035.0337.5543.83A T P 合成酶亚基S u b u n i t s o fA T Ps y n t h a s e a t p
A 51154.6039.9224.2739.6047.2645.47a t p
B 49655.8541.3326.0141.0648.5945.20a t p E 13448.5138.0626.8737.8143.2949.13a t p F 18544.3231.8930.8135.6838.1149.07a t p
I 24847.5835.0825.4036.0241.3341.17细胞色素c 基因c -t y p e c y t o c h r o m e s y
n t h e s i s g e n e c c s A
32433.6435.8025.6231.6934.7243.21包膜膜蛋白E n v e l o p
em e m b r a n e p r o t e i n c e m A 23034.7828.7029.1330.8731.7442.82蛋白酶P r o t e a s e
c l p P 19657.1436.7329.0840.9946.9444.41成熟酶M a t u r a s e m a t K
50736.8829.7824.2630.3133.3346.88N A D H 脱氢酶亚基S u b u n i t s o fN A D Hd e h y d r o g
e n a s e n d h A 36440.3837.6420.8832.9739.0139.11n d h B 49341.3838.9528.4036.2440.1745.20n d h C 12143.8031.4024.7933.3337.6038.99n d h E 10241.1833.3327.4533.9937.2643.04n d h F 74536.3834.6320.4030.4735.5139.48n d h G 17742.3733.3323.7333.1537.8544.63n d h H 39451.5235.0322.3436.2943.2846.18n d h I 16741.9234.1318.5631.5438.0342.29n d h J 15949.6936.4825.7937.3243.0937.92n d h K 22542.6744.0024.8937.1943.3448.34细胞色素b /
f 复合体亚基S u b u n i t s o f c y t o c h r o m eb /f c o m p
l e x p e t A 32152.3435.8325.5537.9044.0947.17p e t B 21647.2241.6731.9440.2844.4543.15p
e t D 16151.5538.5126.0938.7245.0342.02光合系统I 亚基S u b u n i t s o
f p h o t o s y s t e mI p s a A 75952.4442.8228.7241.3347.6346.56p s a B 73548.5742.8628.8440.0945.7246.64光合系统I I 亚基S u b u n i t s o f p h o t o s y
s t e mI I p s b A 35449.7242.9432.4941.7146.3341.16p s b B 50955.6045.5826.9242.7050.5942.15p
s b C 47453.1646.2028.6942.6949.6842.18p s b D 35452.2643.2232.2042.5647.7444.61R u B i s C O 酶大亚基L a r g
e s u b u n i t o
f r u b i s c o r b c L
47656.5143.2826.2642.0249.9043.92核糖体大亚基蛋白P r o t e i n s o f l a r g
e r i b o s o m a l s u b u n i t r p l 1412347.1539.0219.5135.2343.0943.53r p l 1613652.2150.0026.4742.8951.1142.56r p l 227552.7347.6429.0943.1550.1953.66r p l 2012133.0637.1927.2732.5135.1342.62R N A 聚合酶亚基S u b u n i t s o fR N A p o l y
m e r a s e r p o A 334
43.4129.6422.4631.8436.5341.41r p o B 107149.3037.6326.4237.78
43.4745.48r p
o C 168548.4737.5222.7736.2543.0043.81r p o C 2137743.2834.7924.6934.2539.0445.29核糖体小亚基蛋白P r o t e i n s o f s m a l l r i b o s o m a l s u b u n i t
r p s 1113951.8053.2424.4643.1752.5244.11r p s 1212452.4248.3926.6142.4750.4145.44r p s 1410145.5447.5228.7140.5946.5342.59r p s 1812628.5734.9222.2228.5731.7535.02r p s 223743.4642.6224.4736.8543.0444.23r p s 321944.7534.2521.4633.4939.5043.24r p s 420250.9937.1321.7836.6344.0644.16r p
s 715650.6446.1526.2841.0348.4046.25保守假设性叶绿体开放阅读框y c f 1176037.2228.5226.3130.6832.8746.02C o n s e r v e dh y p o t h e t i c a l c h l o r o p
l a s tO R F y c f 2214040.9833.8333.8336.2137.4150.03y c f 316946.7538.4629.5938.2642.6145.05y c f
420245.5441.5831.6839.6043.5645.51平均值A v e r a g e 407.28
46.31
38.62
26.25
37.0642.4644.12
2
14
第2期
杜明川等:葫芦巴叶绿体基因组密码子偏好性分析
表2 葫芦巴叶绿体基因组密码子中各参数的相关性分析
T a b l e 2 C o r r e l a t i o na n a l y s i s o f p a r a m e t e r s i n T r i g o n e l l a f o e n u m -g
r a e c u m c h l o r o p l a s t g e n o m e c o d o n 变量V a r i a t i o n
G C 1G C 2G C 3G C a l l E N C
G C 20.581*
*G C 3
0.183
0.220G C a l l
0.864*
*0.845**
0.484**
E N C
0.279*
0.155
0.362*
*0.326*密码子数C o d o nn u m b e r (N )
-0.119
-0.2490.183
0.292*
0.292*
注:**表示极显著相关(P <0.01);*表示显著相关(P <0.05
)N o t e :**m e a n s a s i g n i f i c a n t c o r r e l a t i o n (P <0.01);*m e a n s a s i g
n i f i c a n t c o r r e l a t i o n (P <0.05
)图1 葫芦巴叶绿体基因组中各氨基酸的R S C U 分析
F i g .1 R S C Ua n a l y s i s o f a m i n o a c i d s i n T r i g o n e l l a f o e n u m -g
r a e c u m c h l o r o p l a s t g e n o m
e 图2 葫芦巴叶绿体基因组中性绘图分析
F i g .2 N e u t r a l i t yp l o t a n a l y s i s o n c h l o r o p l a s t g e n o m e i n T r i g o n e l l a f o e n u m -g
r a e c u m 2.3 E N C -p
l o t 绘图分析E N C -p l o t 绘图分析(图3)表明G C 3值分布较为集中,仅有2个N A D H 脱氢酶亚基基因位于标准
曲线上,涉及A T P 合成酶亚基㊁
细胞色素c 基因㊁核糖体大亚基蛋白三种功能中的3个基因与标准曲线距离较近,大部分基因落在曲线下方较远的位置上㊂
说明葫芦巴密码子偏好性的主要影响因素为选择压力㊂为进一步检验基因与标准曲线的距离,统计了
3
14
草 地 学 报
第32卷
葫芦巴叶绿体基因E N C 比值频数分布情况(表3),仅有9个基因分布在-0.05~0.05区间内;其余41个基因均分布在-0.05~0.05区间之外,
占基因总数的82%,这部分基因距离标准曲线较远㊂进一步表明选择压力为葫芦巴密码子使用偏好性的主要影
响因素,而突变压力的影响较弱
㊂
图3 葫芦巴叶绿体基因组E N C -p
l o t 绘图分析F i g .3 E N C -p l o t a n a l y s i s o n c h l o r o p l a s t g e n o m e i n T r i g o n e l l a f o e n u m -g
r a e c u m 表3 葫芦巴叶绿体基因E N C 比值频数分布
T a b l e 3 E N Cr a t i oo f c h l o r o p
l a s t g e n o m e i n T r i g o n e l l a f o e n u m -g
r a e c u m 组段C l a s s r a n g
e 组中值C l a s sm i dv a l u e 频数F r e q u e n c y n u m b e r 频率F r e q u e n c y
-0.05~0.050.09
0.180.05~0.150.1270.540.15~0.250.2
140.28合计T o t a l 50
1.00
2.4 P R 2-p
l o t 绘图分析葫芦巴叶绿体基因组密码子偏倚分析如图4所示㊂P R 2平面图中4个区域的散点并非均匀分布,表明突变不是唯一影响因素㊂图中涉及R N A 聚合酶亚基和N A D H 脱氢酶亚基两种功能中的2个基因距离P R 2平面图的中心部位最近,表明其偏向程度较小,主要受到突变的影响㊂R u B i s C O 酶大亚基全部基因均落于P R 2平面图的右下方(即G 3>C 3,T 3>A 3)㊂而大部分基因,包括:乙酰辅酶A 羧化酶㊁光合系统I 亚基㊁细胞色素c 基因㊁包膜膜蛋白㊁成熟酶全部基因以及保守假设性叶绿体O R F ㊁核糖体小亚基蛋白㊁A T P 合成酶亚基㊁
细胞色素b /f 复合体亚基㊁N A D H 脱氢酶亚基㊁光合系统I I 亚基㊁R N A 聚合酶亚基的部分基因均落于P R 2平面图的右下方,说明在碱基的使用频率方面G 3>C 3㊁T 3>A 3,且4个碱基的使用频率存在差异㊂综上,葫芦巴叶绿体基因组密码子偏好性除了受到选择压力的影响,同时还会受到突变压力的影响㊂
2.5 最优密码子的确定
运用C o d o n W1.4.2软件,构建葫芦巴叶绿体基因组的高低表达基因库,并计算两个基因库的
R S C U 值,结果表明(表4),有G C U ,A G A 等21个密码子ΔR S C Uȡ0.08,且均为高表达优越密码子(表4中用*表示),其中8个以A 结尾,13个以U
结尾㊂将R S C U 值ȡ1的密码子作为高频密码子,共32个㊂将同时满足R S C Uȡ1和ΔR S C Uȡ0.08的密码子作为最优密码子,最终确定了葫芦巴叶绿
体基因组的21个最优密码子(G C U ,A G A ,C G U ,A A U ,G A U ,U G U ,C A A ,G A A ,G G U ,C A U ,A U A ,U U A ,A A A ,U U U ,C C U ,A G U ,U C U ,
A C A ,A C U ,G U A ,G U U ),其中8个以A 结尾,13个以U 结尾㊂表明葫芦巴叶绿体基因组偏好使用
A /U 结尾的密码子,这与G C 3和R
S C U 分析结果一致㊂因此,在利用葫芦巴叶绿体基因工程设计外源基因载体时,选用以A /U 结尾的密码子可以提高外源基因的表达转化效率㊂
4
14
第2期
杜明川等:
葫芦巴叶绿体基因组密码子偏好性分析
图4 葫芦巴叶绿体基因组P R 2-p
l o t 分析F i g .4 P R 2-p l o t a n a l y s i s o n c h l o r o p l a s t g e n o m e i n T r i g o n e l l a f o e n u m -g
r a e c u m 表4 葫芦巴叶绿体基因组最优密码子的确定
T a b l e 4 D e t e r m i n a t i o no f o p t i m a l c o d o n s i n c h l o r o p l a s t g e n o m e o f T r i g o n e l l a f o e n u m -g
r a e c u m 氨基酸A m i n o a c i d
密码子C o d o n
高表达基因H i g he x p
r e s s i o n g e n e 低表达基因L o we x p
r e s s i o n g e n e 数目N u m b e r
R S C U 数目N u m b e r
R S C U ΔR S C U A l a
G C A 211.08291.16-0.08G C C
70.36170.68-0.32G C G 7
0.36160.64-0.28G C U *
**
432.21381.520.69A r g
A G A
*
182.00601.860.14
A G G 6
0.67411.27-0.60C G A 101.11401.24-0.13C G C
20.22110.34-0.12C G G 30.33190.59-0.26C G U
***
151.67230.710.96
A s n A A C
80.2743
0.46-0.19A A U *
511.731451.540.19A s p G A C
30.12290.32-0.20G A U
*
47
1.881501.680.20C y s U G C
30.50120.73-0.23U G U
*
91.50211.270.23G l n C A A *
**431.91771.390.52C A G
20.09340.61-0.52G l u G A A *411.461201.330.13G A G 150.54600.67-0.13G l y
G G A 401.70681.74-0.04G G C
100.43170.44-0.01G G G 140.60300.77-0.17G G U
*
301.28411.050.23
H i s C A C 1
0.10110.38-0.28C A U *201.90471.620.28I l e
A U A *
631.13771.000.13A U C
260.47460.60-0.13
A U U
781.401071.400.00L y s A A A *
*611.74
1471.38
0.365
14
草地学报第32卷
续表4氨基酸A m i n o a c i d密码子C o d o n高表达基因H i g he x p r e s s i o n g e n e低表达基因L o we x p r e s s i o n g e n e
数目N u m b e r R S C U数目N u m b e r R S C UΔR S C U
A A G90.26660.62-0.36
L e u C U A260.81480.95-0.14
C U C50.16240.47-0.31
C U G40.12180.36-0.24
C U U371.15591.16-0.01
U U A***862.67831.641.03
U U G351.09721.42-0.33 M e t A U G341.00461.000.00 P h e U U C240.39660.85-0.46 U U U**981.61891.150.46 P r o C C A161.14301.090.05
C C C70.50200.73-0.23
C C G50.36200.73-0.37
C C U***282.00401.450.55
S e r A G C40.1770.140.03
A G U*321.32531.090.23
U C A261.08681.40-0.32
U C C130.54631.29-0.75
U C G120.50260.53-0.03
U C U***582.40751.540.86 T h r A C A*241.48501.400.08
A C C40.25220.62-0.37
A C G60.37170.48-0.11
A C U**311.91541.510.40
T r p U G G311.00331.000.00 T y r U A C120.32180.36-0.04 U A U621.68821.640.04 V a l G U A*301.43391.210.22
G U C80.38180.56-0.18
G U G60.29300.93-0.64
G U U***401.90421.300.60注:*表示ΔR S C Uȡ0.08,**表示ΔR S C Uȡ0.30,***表示ΔR S C Uȡ0.50
N o t e:*m e a n sΔR S C Uȡ0.08;**m e a n sΔR S C Uȡ0.30;***m e a n sΔR S C Uȡ0.50
3讨论
3.1葫芦巴叶绿体基因密码子的特征
密码子偏好性是指同义密码子的使用频率不同,这种现象普遍存在于植物体中,引起这种现象的原因有很多,其中碱基组成是最常见的因素[38]㊂中性进化理论认为碱基的第1位和第2位发生变化会引起编码氨基酸的改变,而第3位发生变化则不会使所编码的氨基酸发生改变,同时选择压力对密码子第3位碱基的影响较小,所以G C3可作为密码子偏好性分析的重要依据[39]㊂本研究中葫芦巴叶绿体基因组密码子的平均G C含量为37.06%,表明葫芦巴叶绿体更倾向于使用A/U密码子,这与高守舆等[27]对白羊草叶绿体基因组的研究结果一致㊂葫芦巴叶绿体基因组密码子第3位碱基G C含量较低,这一特征与紫花苜蓿(M e d i c a g o s a t i v a L.)[40]㊁秋茄(K a n d e l i ao b o v a t a S h e u e)[20]㊁厚壳红瘤果茶[28]等相同,符合 高等植物密码子倾向于使用A/ U结尾 的假设[41]㊂
3.2葫芦巴叶绿体基因密码子偏好性的主要影响因素
本研究中P R2-p l o t绘图分析结果表明突变压力不是影响葫芦巴叶绿体基因组密码子偏好性的唯一因素;中性绘图㊁E N C-p l o t分析表明在葫芦巴在进化过程中,葫芦巴密码子偏好性主要受自然选择的影响,受突变的影响较小,这主要是因为叶绿体是葫芦巴进行光合作用最重要细胞器,它可以将太阳能转化为化学能来维持葫芦巴正常生长所需要的物质[42],因此其基因演化主要会受到自然选择影响㊂这一结论与沙枣(E l a e a g n u s a n g u s t i f o l i a)[43]㊁睡
614
第2期杜明川等:葫芦巴叶绿体基因组密码子偏好性分析
莲(N y m p h a e a t e t r a g o n a)[44]㊁籽粒苋(A m a r a n t h u s h y p o c h o n d r i a c u s)[45]等植物的密码子偏好性一致㊂而杨国锋等[34]对蒺藜苜蓿(M e d i c a g o t r u n c a t u l a)的研究表明其密码子偏好性主要受到突变的影响,在续晨等[46]的研究中,蝴蝶兰(P h a l a e n o p s i s)密码子使用偏好性受自然选择和碱基差异的共同影响㊂由此可以看出,植物密码子使用偏好性受多种因素影响,不同植物其影响因素有所差异㊂
3.3葫芦巴叶绿体基因密码子偏好性的模式
R S C U分析是一种根据相对密码子偏好性来分析基因表达水平的方法[47]㊂本研究采用高表达优越密码子方法确定葫芦巴叶绿体基因组最优密码子,共选出了21个最优密码子,8个以A结尾,13个以U结尾,由此可见葫芦巴叶绿体基因组中密码子偏好N N A㊁N N U型㊂这与前人在扁蓿豆(M e d i-c a g o r u t h e n i c a)[48]的研究结果一致,说明不同种属的植物,其密码子偏好性存在着一定的相似性㊂
4结论
自然选择是葫芦巴叶绿体基因组密码子偏好性主要的影响因素,但其他因素在一定程度上对其密码子偏性造成影响㊂同时,本研究确定了葫芦巴叶绿体基因组的21个最优密码子,研究结果为科学制定葫芦巴种质保存和更新策略提供理论依据和实践指导㊂
参考文献
[1] A L T U N T A SE,ÖZ GÖZE,T A S E RFÖ.S o m e p h y s i c a l p r o p-
e r t i e s o
f f e n u
g r e e k(T r i g o n e l l a f o e n u m-g r a c e u m L.)s e e d s[J].
J o u r n a l o f F o o dE n g i n e e r i n g,2004,71(1):37-43
[2]李建芳,周枫,张阳阳,等.S D E葫芦巴叶挥发性提取物G C-
M S分析与抗氧化活性研究[J].食品研究与开发,2020,41
(21):154-160
[3]夏鑫,余曼荣,黄慧,等.葫芦巴渣及提取物对断奶仔猪生长性
能㊁抗氧化功能和血清生化指标的影响[J].动物营养学报, 2020,32(3):1118-1126
[4] B E G UM M,H O S S A I N M M,K I MIH.E f f e c t so f f e n u g r e e k
s e e de x t r a c t s u p p l e m e n t a t i o no n g r o w t h p e r f o r m a n c e,n u t r i e n t
d i g
e s t i b i l i t y,d i a r r h o e as c o r e s,b l o o d p r o
f i l e s,f a e c a lm i c r o f l o r a
a n d f a e c a l n o x i o u s g a s e m i s s i o n i nw e a n l i n g p i g l e t s[J].J o u r n a l
o f a n i m a l p h y s i o l o g y a n da n i m a l n u t r i t i o n,2016,100(6):1121-
1129
[5] S HA H A M,M I R SP.E f f e c to fd i e t a r y f e n u g r e e ks e e do n
d a i r y c o w p
e r
f o r m a n c ea n d m i l kc h a r a c t e r i s t i c s[J].C a n a d i a n
J o u r n a l o fA n i m a l S c i e n c e,2004,84(4):725-729
[6] E l-T A R A B A N Y,A K R AM,T E AMA,e t a l.I m p a c to f d i e t a r y
f e n u
g r e e k s e e d s o n l a c t a t i o n a l p e r f o r m a n c e a n d b l o o db i o c
h e m-
i c a la n d h e m a t o l o g i c a l p a r a m e t e r so fd a i r y g o a t su n d e rh o t
s u m m e r c o n d i t i o n s[J].M l j e k a r s t v o,2018,68(3):214-223 [7]黄慧,郑柯,王霞,等.葫芦巴提取物对黄羽肉鸡屠宰性能㊁肉
品质及抗氧化性能的影响[J].动物营养学报,2022,34(4): 2334-2346
[8] WA N G X M,Z H O U T,B A IG Q,e t a l.C o m p l e t e c h l o r o p l a s t
g e n o m es e q u e n c eo fF a g o p y r u m d i b o t r y s:G e n o m ef e a t u r e s,
c o m p a r a t i v e a n a l y s i s a n
d p h y l o g
e n e t i c r e l a t i o n s h i p s[J].S c i e n-
t i f i cR e p o r t s,2018,8(1):12379
[9]邢少辰,L I U CJ.叶绿体基因组研究进展[J].生物化学与生
物物理进展,2008(1):21-28
[10]S H I N O Z A K IK,O HM E M,T A N A K A M,e t a l.T h e c o m p l e t e
n u c l e o t i d e s e q u e n c e o f t h e t o b a c c o c h l o r o p l a s t g e n o m e:i t s g e n e o r g a n i z a t i o na n de x p r e s s i o n[J].T h eE M B OJ o u r n a l,1986,5
(9):2043-2049
[11]O H Y AMA K,F U K U Z AWA H,K O H C H IT,e ta l.C h l o r o-
p l a s t g e n e o r g a n i z a t i o nd e d u c e d f r o mc o m p l e t e s e q u e n c eo f l i v-
e r w o r tM a r c h a n t i a p o l y m o r p h a c h l o r o p l a s tD N A[J].N a t u r e,
1986,322(6079):572-574
[12]王雪芹,宋卫武,高晓燕,等.芸香科植物叶绿体基因组结构和
系统发育分析[J].分子植物育种,2023,21(5):1510-1520 [13]H E N R Y D,C H O U N-S E A L,M I N G Y,e t a l.C h l o r o p l a s t g e-
n o m e s:d i v e r s i t y,e v o l u t i o n,a n da p p l i c a t i o n si n g e n e t i ce n g i-n e e r i n g[J].G e n o m eB i o l o g y,2016,17(1):13059 [14]李绪英,肖炳光,高玉龙,等.烟草叶绿体基因组和线粒体基因
组S S R位点分析[J].西北植物学报,2011,31(12):2399-2405
[15]K I M Y K,S H I NJ,O H D R,e ta l.C o m p a r a t i v eA n a l y s i so f
C o m p l e t eC h l o r o p l a s tG e n o m eS e q u e n c e sa n dI n s e r t i o n-
D e l e-
t i o n(I n d e l)P o l y m o r p h i s m st o D i s t i n g u i s h F i v e V a c c i n i u m S p e c i e s[J].F o r e s t s,2020,11(9):927
[16]Z H A O X L,Z HU Z M.C o m p a r a t i v eG e n o m i c s a n dP h y l o g e-
n e t i cA n a l y s e s o fC h r i s t i av e s p e r t i l i o n i s a n dU r a r i o p s i sb r e v i s-s i m a i n t h eT r i b eD e s m o d i e a e(F a b a c e a e:P a p i l i o n o i d e a e)B a s e d o nC o m p l e t eC h l o r o p l a s tG e n o m e s[J].P l a n t s,2020,9(9): 1116
[17]HU A N G XJ,X I A C L,Z H A O Y,e ta l.T h e f i r s tc o m p l e t e
c h l o r o p l a s t g e n o m eo f H a y m o n
d i aw a l l i c h i i(F a b a c
e a e)a n d
i t s p h y l o g e n e t i ca n a l y s i s[J].M i t o c h o n d r i a lD N A.P a r tB-R e-
s o u r c e s,2021,6(7):1865-1866
[18]李显煌,杨生超,辛雅萱,等.灯盏花叶绿体基因组密码子偏好
性分析[J].云南农业大学学报(自然科学),2021,36(3):384-392
[19]莫冰棋,李艺,张骏骁,等.宽叶韭与峨眉韭系统发育及叶绿体
基因组密码子偏好分析[J/O L].分子植物育种:1-19[2023-10-18]
[20]赵森,邓力华,陈芬.秋茄叶绿体基因组密码子使用偏好性分
析[J].森林与环境学报,2020,40(5):534-541 [21]娄丽,袁丛军,陈锐,等.安龙油果樟叶绿体基因组密码子偏好
性分析[J/O L].分子植物育种:1-17[2023-10-18]
714
草地学报第32卷
[22]原晓龙,李云琴,张劲峰,等.降香黄檀叶绿体基因组密码子偏
好性分析[J].广西植物,2021,41(4):622-630 [23]梁湘兰,覃逸明,孙晓波,等.藿香叶绿体基因组密码子偏好性
分析[J].分子植物育种,2023,21(3):809-818 [24]周宗梁,林智敏,耿丽丽,等.水稻中c r y1A h1基因密码子优化
方案的比较[J].生物工程学报,2012,28(10):1184-1194 [25]韩岚,王欢,王佳琪,等.密码子优化的纳豆激酶基因在番茄果
实中的瞬时表达[J].内蒙古大学学报(自然科学版),2016,47
(1):73-79
[26]原晓龙,刘音,康洪梅,等.蒜头果叶绿体基因组密码子偏好性
分析[J].西南林业大学学报(自然科学),2021,41(3):15-22 [27]高守舆,李钰莹,杨志青,等.白羊草叶绿体基因组密码子使用
偏好性分析[J].草业学报,2023,32(7):85-95 [28]肖旭,赵紫涵,陆江桃,等.厚壳红瘤果茶叶绿体基因组特征及
密码子偏好性分析[J].种子,2022,41(12):19-26
[29]L I U HB,L U YZ,L A NBL,e t a l.C o d o n u s a g e b y c h l o r o p l a s t
g e n e i sb i a s i n H e m i p t e l e ad a v i d i i[J].J o u r n a lo fG e n e t i c s,
2020,99(1):32089527
[30]李江平,秦政,国春策,等.抽筒竹叶绿体基因组的密码子偏好
性分析[J].竹子学报,2019,38(2):79-87
[31]S U E O K A N.N e a r h o m o g e n e i t y o f P R2-b i a s f i n g e r p r i n t s i n t h e
h u m a n g e n o m e a n d t h e i r i m p l i c a t i o n s i n p h y l o-g e n e t i c a n a l y s e s
[J].J o u r n a l o fM o l e c u l a rE v o l u t i o n,2001,53(4-5):469-476 [32]金刚,覃旭,龙凌云,等.剑麻叶绿体基因组编码序列密码子的
使用特征[J].福建农林大学学报(自然科学版),2018,47(6): 705-710
[33]N I EXJ,D E N GPC,F E N G K W,e t a l.C o m p a r a t i v e a n a l y s i s
o f c o d o nu s a g e p a t t e r n s i nc h l o r o p l a s t g e n o m e so f t h eA s t e r-
a c e a e f a m i l y[J].P l a n t M o l e c u l a rB i o l o g y R e p o r t e r,2014,32
(4):828-840
[34]杨国锋,苏昆龙,赵怡然,等.蒺藜苜蓿叶绿体密码子偏好性分
析[J].草业学报,2015,24(12):171-179
[35]胡莎莎,罗洪,吴琦,等.苦荞叶绿体基因组密码子偏爱性分析
[J].分子植物育种,2016,14(2):309-317
[36]Z H A O YC,Z H E N G H,X U A Y,e t a l.A n a l y s i s o f c o d o nu s-
a g e
b i a s o f e n v e l o p e g l y
c o p r o t e i n g e n e s i nn u c l e a r p o l y h e
d r o s i s
v i r u s(N P V)a n d i t sr e l a t i o nt oe v o l u t i o n.[J].B M C g e n o m-
i c s,2016,17(1):1-10
[37]B H A T T A C H A R Y Y A D,U D D I N A,D A SS,e ta l.M u t a t i o n
p r e s s u r ea n dn a t u r a ls e l e c t i o no nc o d o nu s a g ei nc h l o r o p l a s t
g e n e s o f t w os p e c i e s i n P i s u m L.(F a b a c e a e:F a b o i d e a e)[J].
M i t o c h o n d r i a lD N A.P a r tA,D N A m a p p i n g,s e q u e n c i n g,a n d a-n a l y s i s,2019,30(4):664-673
[38]胡晓艳,许艳秋,韩有志,等.酸枣叶绿体基因组密码子使用偏
性分析[J].森林与环境学报,2019,39(6):621-628
[39]I N G V A R S S O NPK.G e n e e x p r e s s i o n a n d p r o t e i n l e n g t h i n f l u-
e n c e c o d o nu s a g ea n dr a t e so fs e q u e n c ee v o l u t i o ni n P o p u l u s t r e m u l a[J].M o l e c u l a rB i o l o g y a n d E v o l u t i o n,2007,24(3): 836-844
[40]孙志轩,敖平星,毕玉芬,等. 德钦 紫花苜蓿叶绿体基因组序
列及特征分析[J].草地学报,2022,30(2):320-328
[41]C AM P B L L W H,G OWR IG.C o d o nu s a g e i nh i g h e r p l a n t s,
g r e e na l g a e,a n dc y a n o b a c t e r i a[J].P l a n t p h y s i o l o g y,1990,92
(1):1-11
[42]Y I N D M,WA N G Y,Z H A N G X G,e ta l.D e v e l o p m e n to f
c h l o r o p l a s t g e n o m er e s o u r c e sf o r p e a n u t(A r a c h i sh y p o g a e a
L.)a n do t h e r s p e c i e s o fA r a c h i s[J].S c i e n t i f i cR e p o r t s,2017, 7(1):11649
[43]王婧,王天翼,王罗云,等.沙枣叶绿体全基因组序列及其使用
密码子偏性分析[J].西北植物学报,2019,39(9):1559-1572 [44]毛立彦,黄秋伟,龙凌云,等.7种睡莲属植物叶绿体基因组密
码子偏好性分析[J].西北林学院学报,2022,37(2):98-107 [45]冯瑞云,梅超,王慧杰,等.籽粒苋叶绿体基因组密码子偏好性
分析[J].中国草地学报,2019,41(4):8-15
[46]续晨,贲爱玲,蔡晓宁.蝴蝶兰叶绿体基因组密码子使用的相
关分析[J].分子植物育种,2010,8(5):945-950 [47]唐晓芬,陈莉,马玉韬.密码子使用偏性量化方法研究综述
[J].基因组学与应用生物学,2013,32(5):660-666 [48]田春育,武自念,李贤松,等.扁蓿豆叶绿体基因组密码子偏好
性分析[J].草地学报,2021,29(12):2678-2684
(责任编辑刘婷婷)
814。