油菜脯氨酸代谢基因家族的生物信息学分析与核心成员鉴定
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
DOI: 10.3724/SP.J.1006.2022.14131
油菜脯氨酸代谢基因家族的生物信息学分析与核心成员鉴定
张天宇王越刘影周婷岳彩鹏黄进勇华营鹏*
郑州大学农学院,河南郑州450001
摘要:脯氨酸积累是植物在生物和非生物胁迫下的一种重要的代谢适应性机制。
吡咯啉-5-羧酸合成酶(P5CS)、吡咯啉-5-羧酸还原酶(P5CR)酶、脯氨酸脱氢酶(PDH)、吡咯啉-5-羧酸脱氢酶(P5CDH)是依赖谷氨酸的脯氨酸生物合成途径中的关键酶。
油菜是世界上重要的油料作物,在油菜生长发育过程中,其时常遭受各类生物和非生物胁迫。
然而迄今为止,在异源四倍体油菜中缺乏关于这些脯氨酸代谢基因家族的系统分析报道。
本研究利用甘蓝型油菜‘中双11’基因组注释信息,分别鉴定到上述10个BnaP5CSs、6个BnaP5CRs、8个BnaPDHs以及3个BnaP5CDHs基因。
这些基因家族在系统发育上分为不同的进化分支,同一亚组中的成员具有相似的理化特性、基因/蛋白质结构和保守的基序。
进化压力分析表明,这些基因均遭受了强烈的纯化选择。
启动子区的顺式作用元件分析揭示了油菜上述4类基因家族之间均存在共同的和特异的转录调控机制。
本研究分别对‘中双11’油菜幼苗进行盐胁迫、低钾、低磷以及铵毒胁迫处理,分别取地上部及根部进行转录组测定与分析。
结果显示,脯氨酸合成相关基因的表达水平在上述4种胁迫下普遍上调,而调控脯氨酸降解基因的表达水平则在盐胁迫和低磷胁迫情况下调;基因共表达分析显示BnaC4.P5CS1a、BnaA5.P5CS1等基因可能在脯氨酸介导的油菜逆境响应网络中发挥核心作用。
本研究通过脯氨酸代谢基因家族的生物信息学鉴定以及多种非生物逆境下的转录特征分析,将为深入研究脯氨酸介导的逆境抗性提供理论依据,也将为脯氨酸介导油菜非生物胁迫抗性的遗传改良提供优异的基因资源。
关键词:甘蓝型油菜;脯氨酸代谢;基因家族;转录组;养分胁迫
Bioinformatics analysis and core member identification of proline metabolism gene family in Brassica napus L.
ZHANG Tian-Yu, WANG Yue, LIU Ying, ZHOU Ting, YUE Cai-Peng, HUANG Jin-Yong, and HUA Ying-Peng*
School of Agricultural Sciences, Zhengzhou University, Zhengzhou 450001, Henan, China
Abstract:Proline accumulation is an important metabolic adaptative mechanism of plants under biotic and abiotic stress. P5CS, P5CR, PDH, and P5CDH are key enzymes in the glutamate-dependent proline biosynthesis pathway. Rapeseed, an important oil crop in the world, is often subjected to various biotic and abiotic stresses during its growth and development. However, no systematic analysis of these proline metabolic gene families has been reported in Brassica napus so far. In this study, 10 BnaP5CSs, 6 BnaP5CRs, 8 BnaPDHs, and 3 BnaP5CDHs were identified by using the genomic annotation information of ‘Zhongshuang 11’. Phylogenetically, these gene families were divided into different evolutionary branches, and members of the same subgroups had
本研究由国家自然科学基金项目(31801923),河南省科技攻关项目(22170004),郑州大学重点学科专项(xkzdjc201905),郑州大学青年学科专项(XKZDQN202002)和国家超算郑州中心创新生态科技专项(201400210600)资助。
This study was supported by the National Natural Science Foundation of China (31801923), the Key Science and Technology Project of Henan Province (22170004), the Key Discipline Project of Zhengzhou University (xkzdjc201905), the Special Project for Youth Discipline of Zhengzhou University (XKZDQN202002), and the Innovation Ecosystem Construction Science and Technology Special Project of National Supercomputing Zhengzhou Center (201400210600).
* 通信作者(Corresponding author):华营鹏, E-mail:yingpenghua@
第一作者联系方式:E-mail: zhangtianyu010@
Received (收稿日期): 2021-07-25; Accepted (接受日期): 2021-10-19; Published online (网络出版日期): 2021-11-02.
URL: https:///kcms/detail/11.1809.S.20211101.1354.012.html
similar physical and chemical properties, gene / protein structure, and conserved motifs. Evolutionary pressure analysis showed that these genes were subjected to strong purification selection. Cis-acting element analysis revealed that there were common and specific transcriptional regulatory mechanisms among the four kinds of gene families. In this study, rapeseed seedlings were respectively treated with salt stress, low potassium (K), low phosphate (P), and ammonium toxicity, and both shoots and roots were respectively sampled for transcriptomic analysis. The results indicated that the relative expression levels of genes related to proline synthesis were generally up-regulated under the above-mentioned four stresses, whereas the relative expression levels of genes regulating proline degradation were down-regulated under salt and low P stresses. Gene co-expression network analysis demonstrated that BnaC4.P5CS1a and BnaA5.P5CS1 might play central roles in the proline-mediated stress responsive networks in rapeseed. Through bioinformatics identification of proline metabolism gene family and analysis of transcription characteristics under various abiotic stresses, this study will provide a theoretical basis for further study of proline-mediated stress resistance, and will also provide excellent gene resources for genetic improvement of abiotic stress resistance mediated by proline metabolism in Brassica napus. Keywords:Brassica napus;proline metabolism; gene family; transcriptome; nutrient stress
全世界大面积的灌溉土地正在遭受着干旱、盐渍化以及众多养分胁迫,植物已经进化出多种策略来应对这些胁迫[1]。
脯氨酸在植物的渗透调节、氧化还原平衡和能量状态等过程中发挥重要作用[2],脯氨酸的大量累积则是许多植物在各类环境胁迫(干旱、高盐、低温、必需养分缺乏、重金属毒害以及生物胁迫等)下的一种代谢适应性机制[3-4]。
脯氨酸合成主要在叶绿体和细胞质中进行,主要分为依赖谷氨酸的[5]和依赖鸟氨酸的[6]2种合成途径。
谷氨酸在吡咯啉-5-羧酸合成酶(P5CS)和吡咯啉-5-羧酸还原酶(P5CR)的催化作用下被还原为脯氨酸[7],其合成途径一般发生在细胞质和质体中,如叶绿体。
脯氨酸的降解过程是脯氨酸生物合成的逆过程,由脯氨酸脱氢酶(PDH)和吡咯啉-5-羧酸脱氢酶(P5CDH)催化,其场所在线粒体中[8]。
在拟南芥[9]、烟草[10]、高粱[11]、白菜[12]、仙人掌[13]、莲花[14]、金橘[15]等多种植物中,对脯氨酸代谢相关基因以及调控的上下游靶标基因功能均有研究。
在拟南芥中,P5CS是催化脯氨酸生物合成的限速酶,其包括P5CS1和P5CS2两个成员。
P5CS基因一般主要在植物的生殖器官和组织中表达,缺水条件下则会在整个植株中表达;脱落酸和盐胁迫可以以光依赖性的方式诱导P5CS的表达。
P5CS1可能参与了与脯氨酸积累相关的植物盐胁迫抗性响应,包括影响活性氧的产生。
过表达P5CS1的植株可以积累更多的脯氨酸,对渗透胁迫有更好的耐受性[16]。
在拟南芥中,敲除P5CS1基因会导致应激诱导的脯氨酸合成减少,积累较多的活性氧,使得植株对盐胁迫更加敏感。
P5CS2的突变则会导致种子发育后期的胚胎败育,P5CS2突变体幼苗即使在脯氨酸供应条件下生长,也会发生异常发育,上述结果表明P5CS1和P5CS2具有非冗余功能,存在一定程度的功能分化[9]。
在植物脯氨酸合成途径中,P5CR参与了最后一步的催化反应。
P5CR可以用NADPH或NADH作为电子供体,其蛋白表达水平既与相应的mRNA拷贝数无关,也不受细胞内脯氨酸浓度的调控。
脯氨酸的反馈调节取决于NADPH还是NADH作为辅助底物[17]。
PDH编码的脯氨酸脱氢酶水平的改变导致拟南芥游离脯氨酸的积累,使得植株对脯氨酸及其类似物更加敏感,但是植株的生长发育受到的影响较小,表明脯氨酸稳态受到严格控制[18]。
P5CDH则可以在非生物胁迫下影响激活PDH,进而影响脯氨酸的生物合成[19]。
同时,P5CDH过表达显著降低了植株对外界提供的脯氨酸的敏感性,而P5CDH敲除突变体则对脯氨酸高度敏感[20]。
甘蓝型油菜(Brassica napus L., A n A n C n C n, 2n=4x=38)是世界上重要的油料作物,由二倍体的白菜(A r A r, 2n=2x=20)与二倍体的甘蓝(C o C o, 2n=2x=18)通过天然的远缘杂交形成的一种异源四倍体,具有复杂的起源与多样性[21]。
在油菜生长周期中经常会受到各种逆境胁迫的影响,如盐胁迫、干旱胁、重金属胁迫以及其他生物胁迫等。
尽管脯氨酸合成与降解途径的这4类基因功能在拟南芥中等植物中已经被研究,但是目前还没有关于甘蓝型油菜中这4类基因家族的基因系统鉴定与报道。
甘蓝型油菜‘中双11’属于半冬型油菜品种,2017年就已经发布了高质量的参考基因组[22]。
本研究基于BnPIR数据库中ZS11品种基因组,全基因组水平鉴定甘蓝型油菜BnaP5CS、BnaP5CR、BnaPDH、BnaP5CDH 基因家族成员,并对它们进行理化性质、亲缘进化关系、染色体定位、基因结构、系统进化等方面的生物
信息学分析,结合不同养分胁迫下转录组数据,分析其调控脯氨酸代谢的转录模式,结合基因共表达网络分析筛选出调控脯氨酸生物合成的核心成员。
本研究为油菜脯氨酸代谢途径的基因家族功能研究提供重要的信息学理论基础,并将为脯氨酸介导油菜非生物逆境抗性的遗传改良提供优异的基因资源。
1 材料与方法
1.1 序列数据信息获取
本研究使用以下数据库检索所需编码区(CDS)、蛋白序列和基因组注释信息:拟南芥信息来自拟南芥信息资源(TAIR10,https:///)[23],甘蓝(B. oleracea)和白菜(B. rapa)的数据来自于芸薹数据库(BRAD) v3.0 (/)[24]和EnsemblPlants数据库(/index.html),甘蓝型油菜(B. napus)‘中双11’品种的全基因组信息来自甘蓝型油菜泛基因组信息资源数据库(BnPIR,)[25-26]。
1.2 P5CS、P5CR、PDH、P5CDH基因家族鉴定及命名
利用已知的拟南芥这4个基因家族的蛋白序列在从BnPIR数据库下载的全部甘蓝型油菜蛋白序列进行本地BLASTp分析,设定E值<1e-5,筛选出同源性较高的序列。
并用本地HMMSEARCH功能,设定E 值<1e-5,筛选结构域进一步检查是否含有相关蛋白特有的保守结构域,结构域信息来自于PFAM数据库(/),剔除没有保守结构域的蛋白序列。
最终筛选出甘蓝型油菜中的BnaP5CS、BnaP5CR、BnaPDH、BnaP5CDH基因家族所有成员,甘蓝和白菜中的上述4类基因鉴定方法同上。
基于先前提出的命名法,我们按照以下标准命名芸薹属物种中的家族基因[27]:属(1个大写字母)+植物物种(2个小写字母)+染色体(后跟1个句点)+拟南芥中该同源基因的名称。
例如,BnaA3.P5CS1代表甘蓝型油菜A3染色体上与拟南芥P5CS1同源的基因。
1.3 P5CS、P5CR、PDH、P5CDH基因家族分子特征、亚细胞定位及互作网络分析
通过ExPASy (https:///)在线网站对甘蓝型油菜上述4类家族所有成员的蛋白分子质量(MW)、理论等电点(pI)、不稳定性指数(II)的预测[28]。
利用在线工具WoLFPSORT (https://www.genscript. com/wolf-psort.html)[29]和CELLO (.tw/)[30]预测基因家族蛋白的亚细胞定位。
使用SignalP (http://www.cbs.dtu.dk/services/SignalP/)[31]预测甘蓝型油菜基因家族编码蛋白序列信号肽切割位点的存在及位置。
用STRING在线网站(邻近基因重复实例搜索工具) (https:///)[32]检索展示编码蛋白互作网络。
1.4 P5CS、P5CR、PDH、P5CDH基因家族染色体定位和共线性分析
利用BnPIR数据库中甘蓝型油菜‘中双11’品种的基因组注释以及TAIR数据库中拟南芥基因组注释,使用TBtools (/)的内置程序Gene Location Visualize from GFF对基因家族在在染色体上的定位进行可视化。
通过内置BLAST程序对甘蓝型油菜物种内及其与拟南芥、甘蓝、白菜之间的共线性关系进行比对筛选,设定E值<1e-5,获得基因在染色体上的位置信息、基因对共线性信息以及染色体长度、密度等信息,通过TBtools内置程序对物种间和物种内基因的共线性关系进行可视化展现。
1.5 多序列比对和系统发育分析
从拟南芥TAIR数据库下载所需拟南芥的蛋白序列,从BRAD数据库下载白菜、甘蓝所需的蛋白序列,以及从BnPIR数据库中下载甘蓝型油菜‘中双11’品种的蛋白序列,利用MEGA X (https:///)软件对序列进行多序列比对,对甘蓝型油菜、甘蓝、白菜的SERK蛋白序列进行多序列比对,使用常用的邻接法(neighbor-joining,NJ)构建进化树[33]。
其中参数设置为泊松校正、成对删除以及自举法检验(1000次重复)[34],并使用ITOL (https://itol.embl.de/)在线网站对进化树进行美化调整[35]。
1.6 P5CS、P5CR、PDH、P5CDH基因家族进化选择压力和功能分化分析
为了分析这些基因家族上的正或负(纯化)的选择压力,本研究计算了核苷酸同义(Ks)和非同义(Ka)替代频率以及Ka/Ks值。
使用的工具为TBtools内置Ka/Ks_Calculator进行Ka/Ks分析[36]。
根据达尔文的进化论,Ka/Ks > 1.0表示正向选择,Ka/Ks < 1.0表示发生纯化选择,Ka/Ks = 1.0表示中性选择。
此外,本研究应用以下公式估算了这些基因家族与其祖先的分化时间:T = Ks/2λ,λ= 1.5×10-8 (十字花科物种)[37]。
1.7 P5CS、P5CR、PDH、P5CDH基因家族保守基序及基因结构预测
为了比较研究拟南芥和甘蓝型油菜中这4个基因家族之间的结构异同,本研究将它们的蛋白质序列提交在线MEME (/tools/meme)网站得到保守结构域,基序的最大数量设置为10,其他均为默认参数[38]。
并用TBtools软件将结果进行可视化。
将自BnPIR数据库下载的甘蓝型油菜‘中双11’品种的gff3注释文件和所有甘蓝型油菜四个基因家族成员的ID文件输入到TBtools程序,得到甘蓝型油菜基因家族的基因结构图[36]。
用phyr2在线工具(/phyre2/webscripts/jobmonitor)预测了脯氨酸代谢这4个基因家族的二级结构[39]。
1.8 P5CS、P5CR、PDH、P5CDH基因家族顺式作用元件分析
利用BnPIR在线数据库(BnPIR,/)获取甘蓝型油菜这4个基因家族的基因全长和gff注释文件。
使用TBtools提取启动子上游2000 bp序列,利用启动子在线分析工具Plant⁃Care (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)对顺式作用元件进行预测[40],使用TBtools软件展示顺式作用元件的数量与分布特征。
1.9 不同营养胁迫条件下植物的培养
为了鉴定甘蓝型油菜脯氨酸代谢相关基因与油菜响应非生物逆境的关系,用营养液培养油菜幼苗。
本试验使用的油菜品种为‘中双11’,首先选取饱满一致的油菜种子,1%的NaClO消毒10 min,超纯水清洗处理,4℃过夜浸泡,随后播种在育苗盘上,7 d后将长势一致的幼苗移栽至霍格兰培养液中。
基础营养液含有1.0 mmol L-1 KH2PO4、5.0 mmol L-1 KNO3、5.0 mmol L-1 Ca(NO3)2·4H2O、2.0 mmol L-1 MgSO4·7H2O、50 μmol L-1 EDTA-Fe、9.0 μmol L-1 MnCl2·4H2O、0.80 μmol L-1 ZnSO4·7H2O、0.30 μmol L-1 CuSO4·5H2O、0.37 μmol L-1 Na2MO4·2H2O和46 μmol L-1 H3BO3。
油菜苗在光照室中培养,光照强度为200 μmol m-2 s-1,白天温度为25℃,夜晚温度为22℃,光照时间为16 h,黑暗时间为8 h,相对湿度为70%。
盐胁迫处理:将种子萌发后的7 d龄均匀甘蓝型油菜幼苗在不添加NaCl的营养液中培养10 d,然后转移到200 mmol L-1 NaCl中处理1 d,直至取样。
硝酸盐和铵处理:种子萌发后的7 d龄均匀甘蓝型油菜幼苗首先在6.0 mmol L-1硝酸盐(NO3−)下水培10 d,然后转移到低硝酸盐(0.3 mmol L-1)营养液中饥饿处理3 d。
随后,在6.0 mmol L-1铵(NH4+)处理3 d后对上述幼苗取样。
无机磷酸盐(Pi)饥饿处理:甘蓝型油菜种子萌发后7 d龄的均匀幼苗首先在充足磷供应(250 µmol L-1 KH2PO4)下水培10 d,然后转移到低磷(5 µmol L-1 KH2PO4)条件下处理3 d,直至取样。
在缺钾处理中,7 d龄均匀油菜籽苗先在高(6.0 mmol L-1)钾条件下水培10 d,然后在低钾(0.05 mmol L-1)条件下水培3 d,直至取样。
1.10 P5CS、P5CR、PDH、P5CDH基因家族转录分析及共表达网络分析
分别收获不同处理的地上部和根,并立即储存在-80℃直到分离出RNA。
每个样本包含3个独立的生物重复,进行转录组测序,用于不同的营养条件下对脯氨酸代谢基因家族中差异表达基因进行转录分析(P-value<0.05;|log2 Fold-change|>1)。
共表达分析时,使用DeGNServer (https:///DeGNServer/)计算各基因间互作的Stress值或者Degree值,其中的Pearson相关性指数阈值根据基因的多少在0~0.6之间进行调整,然后利用Cytoscape 3.2.1 (https:///)软件构建基因共表达网络图[41]。
2 结果与分析
2.1 拟南芥与芸薹属物种脯氨酸代谢基因家族的全基因组鉴定
为了鉴定不同植物物种中的P5CS、P5CR、PDH、P5CDH家族成员,本研究使用拟南芥这4类家族成员的氨基酸序列作为筛选比对参照,通过本地BLASTp及PFAM结构域在BRAD数据库和BnPIR数据库
中筛选出甘蓝、白菜、甘蓝型油菜‘中双11’品种的同源物并进行鉴定。
在拟南芥中,P5CS (P5CS1和P5CS2)和PDH (PDH1和PDH2)家族中均有2个亚族成员,而P5CR和P5CDH家族均只有1个成员,这4类基因家族成员均只包含1个拷贝。
在白菜中这4类基因家族每个成员分别有1~3个同源拷贝,在甘蓝中每个成员有1~4个同源拷贝,而甘蓝型油菜中每个成员则是2~6个同源拷贝。
白菜与甘蓝的脯氨酸代谢同源基因数量之和与异源四倍体油菜中的基因数目基本一致。
因此,我们推测在甘蓝型油菜的祖先甘蓝与白菜的天然远缘杂交过程中,大部分基因都被保留下来(表1)。
表1 脯氨酸代谢相关的4个基因家族在拟南芥和芸薹属作物中的拷贝数目
Table 1 Copy number of the four kinds of gene families involving proline metabolism in Arabidopsis and Brassica crops
基因家族Gene family
基因名称
Gene name
拟南芥
Arabidopsis thaliana
(125 Mb)
白菜
Brassica rapa
(465 Mb)
甘蓝
Brassica oleracea
(485 Mb)
油菜
Brassica napus
(1130 Mb)
P5CS P5CS1 1 2 3 6 P5CS2 1 2 2 4
P5CR P5CR 1 2 4 6
PDH PDH1 1 3 4 6 PDH2 1 1 1 2
P5CDH P5CDH 1 1 2 3
2.2 基因家族分子特征、理化性质分析及亚细胞定位预测
为了鉴定P5CS、P5CR、PDH、P5CDH 4类家族基因的分子特征,本研究用ExPASy计算了甘蓝型油菜中4类家族每个基因的理化性质参数。
结果表明,同一家族基因编码的大多数蛋白质具有相似的分子特征(表3)。
总的来说,BnaP5CSs家族的CDS长度最小为2148 bp (BnaA3.P5CS1),最大为2184 bp (BnaA9.P5CS2和BnaC8.P5CS2),相对应的氨基酸残基数量从715个到727个变化。
在BnaP5CR家族中,BnaA3.P5CR具有最多的氨基酸残基(464个),其他BnaP5CRs家族成员氨基酸数量从212个到299个。
在BnaPDH家族中CDS序列长度和拟南芥相对应的同源基因几乎一致,BnaP5CDH中除BnaC2.P5CDH的CDS长度之外其余也十分相似(表2)。
大部分BnaP5CS蛋白成员的分子量在77~79 kD之间变化,而BnaP5CR 基因家族中除BnaA3.P5CR之外,其余蛋白间的分子量也比较接近(表3)。
BnaP5CSs的等电点在5.47到6.85之间,均小于7.0;在BnaP5CR、BnaPDH、BnaP5CDH基因家族编码的蛋白中,只有BnaA10.P5CR、BnaC9.P5CR、BnaA9.PDH1、BnaC9.PDH1、BnaC4.PDH2、BnaC2.P5CDH等电点大于7.0,其余成员均小于7.0 (表3)。
亲水性(GRAVY)的总平均值定义为氨基酸亲水性值的总和除以蛋白质长度。
结果表明,BnaP5CRs蛋白的GRAVY值均小于0,而其余3个基因家族编码蛋白的GRAVY值大于0,而且这些蛋白总体上表现出与相应拟南芥中同源蛋白类似的理化性质(表3)。
因此BnaP5CRs中都被认为是疏水的,而其余3个基因家族都认为是疏水的。
BnaPDHs所有成员不稳定性指数<40.0,而BnaP5CRs、BnaP5CSs、BnaP5CDHs不稳定性指数>40.0 (表3),表明除BnaPDH蛋白质稳定性较强外,其余3类基因家族表现出较弱的蛋白质稳定性。
为了进一步研究基因家族在细胞中的定位,应用在线WoLF粒子群优化算法预测P5CS、P5CR、PDH、P5CDH 4类基因家族在拟南芥(6个成员)和油菜(27个成员)中的亚细胞定位。
结果表明,油菜中的亚细胞定位与相应的拟南芥同源基因具有相同的亚细胞定位特征(表3)。
具体来说,BnaP5CS1/2定位于叶绿体和细胞质,BnaP5CR定位于细胞质,而BnaPDH和BnaP5CDH则定位于线粒体中。
表明,它们在油菜的生长发育和逆境响应过程中可能发挥迥然不同的功能。
表2 脯氨酸代谢相关的4类基因家族在拟南芥和甘蓝型油菜中分子特征
Table 2 Molecular characterization of the four kinds of gene families involving proline metabolism in Arabidopsis and B. napus.
基因ID Gene ID
基因名称
Gene name
区块
Block
蛋白质
长度
Protein
length
编码区
长度
CDS
length
DNA全
长
DNA
length
外显子/
内含子
Exon/in
tron
异义突
变Ka
同义突
变Ks
Ka/Ks
进化时
间
Diverge
nt time
(Mya)
AT2G39800 AtP5CS1 J 717 2154 5156
BnaA03T0194400ZS BnaA3.P5CS1 J 715 2148 4299 18/17 0.035 0.361 0.096 12.04 BnaA04T0253600ZS BnaA4.P5CS1 J 717 2154 4128 19/18 0.032 0.371 0.087 12.36 BnaA05T0063500ZS BnaA5.P5CS1 J 717 2154 4499 17/16 0.021 0.378 0.056 12.62 BnaC03T0227700ZS BnaC3.P5CS1 J 715 2148 4255 18/17 0.035 0.349 0.101 11.64 BnaC04T0069800ZS BnaC4.P5CS1a J 717 2154 4584 18/17 0.021 0.376 0.055 12.54 BnaC04T0569500ZS BnaC4.P5CS1b J 717 2154 4711 19/18 0.030 0.356 0.084 11.87
AT3G55610 AtP5CS2 N 726 2181 5276
BnaA04T0040200ZS BnaA4.P5CS2 N 719 2160 4705 20/19 0.047 0.325 0.145 10.83 BnaA09T0513600ZS BnaA9.P5CS2 N 727 2184 4572 20/19 0.035 0.314 0.110 10.46 BnaC04T0313900ZS BnaC4.P5CS2 N 726 2181 4571 20/19 0.046 0.345 0.133 11.52 BnaC08T0355700ZS BnaC8.P5CS2 N 727 2184 4513 20/19 0.033 0.305 0.110 10.15
AT5G14800 AtP5CR R 276 831 2037
BnaA03T0060400ZS BnaA3.P5CR R 464 1395 3245 10/9 0.100 0.459 0.217 15.29 BnaA10T0212800ZS BnaA10.P5CR R 276 831 1660 7/6 0.062 0.414 0.150 13.81 BnaC03T0069400ZS BnaC3.P5CR R 276 831 1478 7/6 0.100 0.485 0.206 16.17 BnaC04T0138900ZS BnaC4.P5CRa R 255 768 1258 5/4 0.058 0.427 0.136 14.24 BnaC04T0227600ZS BnaC4.P5CRb R 212 639 1239 5/4 0.101 0.389 0.259 12.98 BnaC09T0514400ZS BnaC9.P5CR R 299 900 1473 6/5 0.067 0.411 0.162 13.69
AT3G30775 AtPDH1 L 499 1500 2921
BnaA02T0358100ZS BnaA2.PDH1 L 498 1497 2651 4/3 0.053 0.547 0.097 18.22 BnaA06T0368500ZS BnaA6.PDH1 L 498 1497 2620 3/2 0.053 0.655 0.081 21.84 BnaA09T0046200ZS BnaA9.PDH1 L 498 1497 2808 4/3 0.066 0.535 0.123 17.84 BnaC02T0481700ZS BnaC2.PDH1 L 498 1497 2589 4/3 0.052 0.532 0.098 17.72 BnaC07T0324000ZS BnaC7.PDH1 L 498 1497 2635 3/2 0.052 0.659 0.079 21.96 BnaC09T0031900ZS BnaC9.PDH1 L 498 1497 3015 4/3 0.068 0.544 0.125 18.13
AT5G38710 AtPDH2 S 476 1431 3144
BnaA04T0103200ZS BnaA4.PDH2 S 466 1401 2586 3/2 0.049 0.421 0.116 14.03 BnaC04T0377900ZS BnaC4.PDH2 S 476 1431 2834 4/3 0.055 0.428 0.130 14.25
AT5G62530 AtP5CDH X 556 1671 4310
BnaA06T0278700ZS BnaA6.P5CDH X 557 1674 3571 15/14 0.026 0.426 0.062 14.20 BnaC02T0533200ZS BnaC2.P5CDH X 394 1185 2861 10/9 0.240 0.740 0.324 24.67 BnaC03T0552600ZS BnaC3.P5CDH X 557 1674 3554 15/14 0.028 0.370 0.076 12.35
2.3 系统发育分析
为了进一步阐明十字花科物种中P5CS、P5CR、PDH、P5CDH 4类家族基因的分子进化和系统发育特征,本研究利用芸薹属物种和拟南芥中这些基因的氨基酸序列构建了无根系统发育树。
分别对拟南芥、白菜、甘蓝、甘蓝型油菜中的脯氨酸代谢4个家族的基因分别进行了系统发育分析(图1)。
P5CS基因家族可以分为2个较大的分支:P5CS1分支和P5CS2分支,每个BnaP5CS成员都与拟南芥中相应的同源基因聚类到最小的进化分支(图1-A),在拟南芥物种形成之前,P5CS2个亚族成员就已经发生了功能分化。
PDH 基因家族同样分为2个较大的进化分支,BnaPDH与拟南芥对应同源基因聚类到一起(图1-B),说明在拟南芥物种演化前,该基因就已经发生了显著的功能分化。
P5CR和P5CDH基因家族在拟南芥中只有一个成员,除白菜和甘蓝型油菜中C2染色上的P5CDH基因外亲缘关系都较近(图1-C,D)。
同一亚家族之间,芸薹属物种亲缘较近,与拟南芥亲缘关系相对较远。
甘蓝型油菜染色体上的基因与其祖先甘蓝和白菜上对应染色体亲缘关系更近,而与其他染色体上的甘蓝型油菜同源基因亲缘相对较远,这表明在芸薹属物种进化前,不同染色体上的基因拷贝就已经发生了一定的分化。
(A)(B)
(C)(D)
图1 拟南芥、白菜、甘蓝和甘蓝型油菜脯氨酸代谢相关4类基因家族的系统进化分析
Fig. 1 Phylogeny analysis of the four kinds of gene families involving proline metabolism from A. thaliana, B. rapa, B. oleracea,and B. napus
进化树不同颜色代表不同的分支,树枝上的数字代表进化距离。
Different colors represent different branches of the evolutionary tree, and the numbers on the branches represent evolutionary distances.
2.4 基因结构及保守基序分析
由图2和表2可知,BnaP5CS1s有17~19个外显子,BnaP5CS2s含有20个外显子;BnaP5CR基因家族中,除BnaA3.P5CR含有10个外显子外,其余家族成员只含有5~7个外显子。
BnaPDH1-2中外显子数目都保持在3~4个,BnaP5CDH家族中除BnaC2.P5CDH只有10个外显子外,其余成员均有15个外显子,每个基因家族中外显子数量的变化,可能是由可变剪接引起的,造成不同的基因之间的略微功能差异。
在亲缘关系较近的基因间,外显子的长度和数量都比较相似,表明基因家族在进化中相对保守。
利用MEME在线工具进一步分析甘蓝型油菜P5CS、P5CR、PDH、P5CDH 4类基因家族编码的氨基酸序列的保守结构域(图3),一般情况下,如果氨基酸残基在进化上是保守的,则认为它们在功能或结构上是重要的,其中设置保守结构域的预测基序长度为5~60个氨基酸。
本研究发现,在BnaP5CSs中所有的10个预测的保守结构域均有同一性,在BnaP5CRs中,Motif 1、Motif 2、Motif 3、Motif 6、Motif 7、Motif 8在所有的成员中都预测到。
BnaPDHs家族中,PDH1比PDH2成员只多了Motif 7结构域,其他成员预测的结构域完全一致,与拟南芥中的结构域分布相同,表明其在进化中比较保守。
BnaP5CDHs中除了C2染色体上有结构域的缺失,其余成员的结构域一致(图3)。
说明与脯氨酸代谢相关的这4个基因在氨基酸残基进化方面是非常保守的,表明它们在基因功能或者结构方面具有非常重要的作用。
图2 甘蓝型油菜4类脯氨酸代谢基因家族成员的基因结构
Fig. 2 Gene structure of the four kinds of gene families involving proline metabolism in B. napus 绿色的部分代表UTR 区域,黄色的部分代表外显子,黑色的线代表内含子。
The green part represents the UTR region, the yellow part represents the exon, and the black line represents the intron.
图3 甘蓝型油菜4类脯氨酸代谢基因家族成员保守结构域分析
Fig. 3 Conserved motif analysis of the four kinds of gene families involving proline metabolism in B. napus
2.5 顺式作用元件分析
转录因子可以与靶基因启动子区域的顺式作用调控元件结合,进而调控靶基因的表达。
为了预测调控脯氨酸代谢相关家族基因的转录因子以及家族基因可能参与的响应途径,选取基因起始密码子(ATG)的上游2000 bp 区域序列用于预测富集的顺式作用元件(CREs) (图4)。
首先,除去常见的TATA-box 、CAAT-box 以及那些未被定义的顺式元件,选取富集较多的一些CREs 。
结果发现,P5CS 、P5CR 、PDH 、P5CDH 4类
(A )(B )
(C )(D
)
(A )
(D )
(C )
(B )
基因家族中几乎所有成员得启动子区域都含有MYB 转录因子的结合元件(CNGTT)。
除此之外,脯氨酸代谢这4类基因家族启动子区域均鉴定到G-box (CACGT)、以及应答光响应的保守DNA 序列box-4元件,还鉴定到与激素相应相关的顺式作用元件,如调控茉莉酸元件(CGTCA/TGACG-motif)以及调控脱落酸响应元件ABRE (ACGTG) (图4)。
在PDH 中找到较多的水杨酸响应的元件(TCA-element)。
在P5CS 和P5CDH 中检测到大量与非生物逆境胁迫相关的响应元件,如干旱响应元件(MBS)、低温响应元件(LTR)、厌氧诱导元件(ARE)。
甘蓝型油菜的脯氨酸代谢4类家族基因启动子调控区域具有多种与激素响应和非生物胁迫抗性相关的顺式作用元件,暗示着这些家族基因有可能通过不同的激素和非生物胁迫响应途径调控油菜的生长发育以及非生物胁迫抗性反应。
图4 甘蓝型油菜脯氨酸代谢基因启动子区顺式作用调控元件的富集分析
Fig. 4 Enrichment analysis of the cis -acting regulatory elements in the promoter regions of proline metabolism genes in B. napus 气泡的大小代表顺式作用元件数量,颜色代表其占总顺式作用元件个数的比例。
The size of the bubble represents the number of cis -acting regulatory elements, and the color represents its ratio of the total c is -acting elements.
2.6 染色体定位、基因组扩增及共线性分析 通过观察拟南芥中P5CS 、P5CR 、PDH 、P5CDH 这4类基因家族的成员在染色体上的位置发现,AtP5CS 定位在2号(AtP5CS1)和3号(AtP5CS2)染色体上,AtP5CR 定位在5号染色体上,AtPDH 定位在3号(AtPDH1)和5号(AtPDH2)染色体上,AtP5CDH 定位在5号染色体上(图6-A)。
为了进一步确定甘蓝型油菜中这4类基因家族成员的染色体定位,本研究在油菜数据库中检索出它们的基因组DNA 序列,BnaP5CSs 、BnaP5CRs 、BnaPDHs 、BnaP5CDHs 不均匀地分布在7条A 染色体和6条C 染色体上,每条染色体上有1~6个数目不等的基因,C4染色体上分布最多,共有6个脯氨酸代谢相关的基因。
此外,在甘蓝型油菜A 、C 2个染色体组的分布也不均等,其中A 基因组有12个、C 基因组有15个(图5)。
基因家族扩增主要通过4种途径发生:串联复制、片段复制、全基因组复制(多倍体化)和复制转座[42]。
异源四倍体甘蓝型油菜的是由祖先甘蓝与白菜演化而来,它们都是比较古老的多倍体植物,自它们从共同
(A)(C)(B)
(D)
(E)(F)。