【doc】几种经济植物UFGT基因的生物信息学分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

几种经济植物UFGT基因的生物信息学分

基因组学与应用生物学,2010年,第30卷,第1期,第92—102页GenomicsandAppliedBiology,2010,V o1.30,No.1,92—102
数据分析
AnAnalysis
几种经济植物UFGT基因的生物信息学分析
付海辉0辛培尧1许玉兰刘岩?韦援教0董娇曹有龙周军
1西南山地森林资源保育与利用省部共建教育部重点实验室,西南林业大学,昆明,650224;2宁夏农林科学院枸杞工程技术研究中心,银川,
750002
通讯作者,******************;******************
摘要本文根据在GenBank中已登录的葡萄,玉米,水稻,草莓,拟南芥和苹果等植物的类黄酮一3—0一葡
萄糖基转移酶基因的核苷酸序列和氨基酸序列,应用生物信息学软件预测了其理化性质,疏水性/亲水性,
导肽,跨膜结构,卷曲螺旋结构,二级结构,功能结构域及高级结构,并构建了类黄酮一3—0一葡萄糖基转移酶
蛋白家族的系统进化树.结果表明这几种植物的UFGT基因核苷酸序列除葡萄存在2个外显子外,其它植物
均存在1个外显子.含量最丰富的氨基酸是Leu,Ala,Gly,V al和Ser等,除葡萄,苹果UFGT属于不稳定类
蛋白外,其余均属于稳定类蛋白.进一步研究分析表明,这几种植物UFGT蛋白存在明显的疏水区和亲水
区,信号肽,跨膜结构以及卷曲螺旋.二级结构组成上比例相似,并且都由Or.一螺旋,延伸链和无规则卷曲所
组成.它们都存在UDPGT,COG1819和MGT等保守域.除了拟南芥外,其它几种植
物都能够通过同源建模
建立UFGT蛋白的三维结构.进化分析表明,把它们的UFGT基因分成5个类群,其中3个大类群,另外陆地
棉和野芭蕉的UFGT基因分别单独成一类.本工作将为深入研究该蛋白在植物花,果实和叶片等器官颜色变
化中发挥的功能,开展生物大分子结构模拟以及药物设计提供抛砖引玉的作用. 关键词UFG生物信息学,同源建模,进化树BioinformaticsAnalysisofUFGTGenefromSeveralEconomicPlants
FuHaihui.XinPeiyaoXuYulanLiuranWeiYuanjiao.DongJiaoCaoY oulongZhouJun
1KeyLaboratoryforForestResourcesConservationandUseintheSouthwestMountainsof China,MinistryofEducation,SouthwestForestryUniver—
sity,Kunming,650224;2CenterofChineseWolfberryEngineeringandTechnology,Ningxi aAcademyofAgricultureandForestryScience,Yinchnan,
750002
Correspondingauthor,*****************;******************
DOI:10.3969/gab.030.000092
AbstractInthispaper,thenucleicacidsequencesandaminoacidsequencesofflavonoid一3一O—glucosyltrans—
ferasfromsixspeciessuchasVitisvinifera,Zeamays,Oryzasativa,Fragariaxananassa,Arab idopsisthalianaand
Malusdomestica,wereanalyzedbybioinformaticstools.Severalparametersofthesesequen cesloginedin
GeneBank,includingsequencescomposition,physicochemicalproperty,leaderpeptide,to pologicalstructureof
transmembraneregions,hydrophobicityorhydrophilicity,secondarystructures,functional domainsandprotein
structures,werepredicted.Phylogenetictreewasreconstructedfortheflavonoid一3~O—glucosy—ltransferaseprotein
family.UFGTgenescontainonlyoneexoninmostoftheseplants,buttwoexonsinV.vinifern. Abundantwith
Leu,Ala,Gly,V alandSeraminoacids,mostoftheseUFGTproteinsarestructuralstableexcep tforthosefromV.
viniferaandapple.InalltheseUFGTprotein,evidenthydrophobicorhydrophilicdomain,sig nalpeptide,trans—
membraneregionandcoiled—coildomainwerepredicted;andsimilarratioinsecondarystructurecomposition madefrom仅一helixes,sheetsandrandomcoilsweredetected.A1ltheseproteinshaveUDPGT,C0G1819, MGT
基金项目:本研究由西南林业大学科研启动基金项目,国家林业局西南地区生物多样性保育重点实验室开放基金项目
(BC2010F08),西南林业大学云南省重点学科森林培育学()(Kz20O906)和西南林业大学重点建设学科林木遗传育种()(Kx2o0904)共
同资助
几种经济植物UFGT基因的生物信息学分析BioinformaticsAnalysisofUFGTGenet_r(ImSevemlEcon0micPlants93 conserveddomains.The3一dimensiona1structureswereconstructedthroughroughhomologymodelingmethod successfullyformostoftheseproteinsbutnotfortheonefromArabidopsis.Inevolutionaryan alysisallthese
UFGTproteinsweredividedintofivegroups,amongwhichwerethreemajoronesandtwosin gleonethatfrom
GossypiumhirsutumL.andCamptothecaacuminaterespectively.Thisworkwouldprovide abasisforthefunction determinationofthisproteinincolorvarianceofdifferentplantorgans,suchasflowers,fruitsa ndleaves,andde—velopbiologicalmacromoleculestructualsimulationandmoleculardrugdesign. KeywordsUFGBioinformatics,Homologymodeling,Plylogenetictree
类黄酮(flavonoids)是植物酚类化合物的一类,
它是三碳桥把2个芳香环连起来的15碳化合物(Graham,1998).黄酮类化合物在低等植物分布比较少,在高等植物界分布很广,不仅参与植物的花,果
实和叶片等颜色的形成和植物的紫外光保护剂以及
杀虫等生理功能,还具有抗炎,抗癌,抗氧化和保护
心脑血管系统等多种药理作用(潘瑞炽,2001;吴立军, 2003;周军等,2009).植物中的类黄酮一3-0一葡萄糖
基转移酶(flavonoid一3~0.glucosyltransferas,UFGT)处于类黄酮合成途径中,催化不稳定的花色素(antho. cyanins),糖苷化形成各种花色苷(Bosseta1.,1996).
到目前为止,国内外学者对UFGT基因做了大量工作.Sun和Hrazdina(1991)从红色甘蓝中分离出类黄
酮一3—0一葡萄糖基转移酶,并且对该酶进行了纯化. Sparvoli等(1994)研究人员从欧亚洲种葡萄中分离出类黄酮途径中的PAL,CHS,CHI,F3H,DFR,LDOX~tl UFGT等基因.Boss等(1996)研究人员对类黄酮途径
中L,CHS,CHI,F3,DFR,LDOX和UFGT等7个
基因在欧亚洲种葡萄中的表达情况作了分析.Poudel 等(2008)研究人员对桑叶葡萄和欧亚洲种葡萄的杂
交种UFGT基因的表达情况作了分析.李俊才等(2010),卢其能等(2009)和刘海峰等(2009)研究人员
分别从红巴梨'果皮,马铃薯以及山葡萄中克隆了UFGT基因,并且作了表达分析.
目前,生物基因组序列数据正以爆发式增长,如
何对这些序列数据进行科学的收集,管理和挖掘已
经成为基因组学和蛋白组学研究的热点.此外,由于X—ray和NMR等实验技术预测蛋白质的结构代价相当高,一般的科研机构难以承受.随着生物信息学的
发展,用生物软件预测蛋白质的结构变成现实,也成
为一种趋势.本文利用比较基因组学和生物信息学
的方法以葡萄(Vitisvin~fera)为重点,对不同植物的
类黄酮-3-0一葡萄糖基转移酶基因的核苷酸序列以
及所对应的氨基酸序列的理化性质,疏水性/亲水
性,导肽,跨膜区域,卷曲螺旋结构,二级结构,功能
结构域及高级结构等进行预测和分析,并对该蛋白
质家族构建进化树,为下一步研究它在植物的花,果
实和叶片等颜色变化和开展生物大分子结构模拟以
及药物设计提供抛砖引玉的作用.
1结果与分析
1.1核苷酸序列的外显子分析
利用在线分析工具GENSCAN对葡萄和其它几
种植物的UFGT基因的核苷酸序列进行分析,结果表明,葡萄P值为0.885和0.721,玉米P值为0.721,水
稻P值为0.999,草莓P值为0.908,拟南芥P值为
0.999,苹果P值为0.995.一般认为,P值表示分析结
果为外显子的可能性,当P>0.99时为外显子可能性
极高;0.50<P<0.99时为外显子可能性中等;P<0.50 时为外显子可能性低,即预测结果不可靠.由P值可
以看出,这几种植物的UFGT基因核苷酸序列除葡
萄存在2个外显子外,其它植物均存在1个外显子.
1.2蛋白质的一级结构分析
1.2.1氨基酸序列的理化性质分析
利用在线分析软件Protparam分别对葡萄,玉
米,拟南芥,草莓,水稻和苹果等植物的类黄酮一3一.一
葡萄糖基转移酶基因所对应的氨基酸序列的理化性
质进行分析,结果(表1)表明,这几种植物UFGT基因
氨基酸残基数差异很小,分子量差异也很小;水稻的
pI最大,玉米的pI最小;含量最丰富的氨基酸是
Leu,Ala,Gly,V al和Ser等;这几种植物的UFGT氨
基酸的构成都是带正电荷的氨基酸百分比小于带负
电荷的氨基酸(通常不稳定系数小于40时,预测对应
蛋白质在试验中比较稳定,反之则不稳定).除葡萄,
苹果UFGT属于不稳定类蛋白外,其余均属于稳定
类蛋白;此外,除葡萄外,其余植物UFGT总平均疏
水性都是正数,说明这几种植物的UFGT蛋白是疏
水性蛋白.
1.2.2疏水性/亲水性的预测和分析
蛋白质亲疏水性氨基酸的组成是蛋白质折叠的
基因组学与应用生物学
94G
enomicsandApp1iedBio1ogy
表1几种植物UFGT基因对应氨基酸序列的组成成分及理化性质分析
Table1CompositionandphysicochemicalcharactercomparisonsofthededucedUFGTprot einsfromseveralplants
推导的氨基酸残基数
Deducedaminoacidresidues
分子量(kD)
Molecularweight(kD)
等电点(pI)
Isoelectricpoint
含量最丰富的氨基酸(%)
Themostabundantamino
acidsresidues(%1
带正电荷氨基酸(%)
Positivelycharged
aminoacids(%)
带负电荷氨基酸(%) Negativelycharged aminoacid(%)
不稳定系数Instabilityindex
总平均疏水性Grandaverageofhydrophobicity Ala9.2
Leu9.0
V al8.8
GIv7.2
Ser7.2
9.2
9.810.7
39.5l
稳定的
Stable
0.234
41.42
不稳定的
Unstable

0.002
34.97
稳定的
Stable
0.038
463
5.0329
5.56
37.40
稳定的
Stable
0.015
454483
4.7281
5.2654
6.185.48
9-310.6
37.12
稳定的
Stable
0.203
主要驱动力,通过亲水性预测可以反映蛋白质的折叠
情况.蛋白质疏水区域可以作为评判潜在跨膜区的参
考依据(薛庆中,2009).利用在线分析软件ProtScale
的KyteandDoolittle算法对葡萄的类黄酮一3一O一葡萄糖基转移酶进行亲水/疏水性分析(正值表示疏水性,负值表示亲水性,介于+0.5~~0.5之间主要为两性氨基酸).分析结果表明(图1A),该葡萄的类黄酮一
3一O一葡萄糖基转移酶蛋白中疏水区共9处,分别为1o~18,21,--43,102N107,113-139,213-221,274-280,
288-295,340~349和360~370,亲水区共9处,分别为81-86,95-99,l51-158,l65-171,181-187,223-236,
264~271,372~380和410~444,其中第416与417位最低,值为-2.589,第14位最高,值为2.111.就整体
分析,葡萄的类黄酮一3-0-葡萄糖基转移酶蛋白存
在明显的疏水区和亲水区.用同样的方法分别对玉
米,拟南芥,草莓,水稻和苹果等植物的类黄酮
-
3-0一葡萄糖基转移酶蛋白进行分析(图1B),结果
表明,这几种植物的类黄酮-3-O一葡萄糖基转移酶
蛋白存在明显的疏水区和亲水区(其它几种植物的图片分析结果未显示1.
1.2_3导肽的预测和分析
大多数的蛋白质在核糖体上开始合成,然后在
信号肽的指导下分泌到细胞的特定部位才能参与生命活动.信号肽是N端的一段氨基酸序列,指导分泌
性蛋白到内质网膜上合成,在蛋白质合成结束之前被切除,信号肽位于蛋白质的N端,一般由l6到26个
氨基酸残基组成,其中包括疏水核心区,信号肽的C
端和N端(翟中和等,2000).利用在线分析工具Sig. nalP的神经网络算法对葡萄的类黄酮一3-0一葡萄糖基转移酶蛋白进行预测.结果由图2可知,C,Y值都
为YES,说明该蛋白质可能存在信号肽,最可能的剪
切点位于34—35,可能属于分泌型蛋白.用同样的方法对其它植物UFGT氨基酸序列进行分析,结果表
明其它植物的UFGT蛋白均可能存在信号肽.
1.2.4跨膜结构的预测和分析
跨膜结构是蛋白质与膜内在蛋白的静电相互作
用和氢键键合相互作用与膜结合的一段氨基酸片段,一般由20个左右的疏水性氨基酸残基组成,主

343㈨哪
34■
"㈨
~一一一

儿种经济植物UFGT基因的生物信息学分析BioinformaticsAnalysisofUFGTGenefromSeveralEconomicP1ants95 麟

1.5
:

3.0
3∽
图1葡萄(A)和拟南芥(B)UFGT基因对应氨基酸序列的疏水
性/亲水性预测
Figure1Hydrophobicity/phydrophilicitypredictionofthede—ducedUFGTproteinsfromVitisvinirera(A)andArobidopsis
thaliana(B)
图2葡萄UFGT蛋白信号肽预测f神经网络算法)
注:C值:原始剪切位点的分值;S值:信号肽的分值:Y值:综
合剪切位点的分值
Figure2SignalpeptidepredictionofthededucedUFGTprotein fromVitisVinifeFausingtheNNModel
Note:Cscore:Primitivecleavagesitescore;Sscore:Signalpep—tidescore;Yscore:Syntheticcleavagesitescore
要形成Q一螺旋(王镜岩等,2002).用在线工具TMPred
对葡萄的类黄酮一3—0一葡萄糖基转移酶蛋白进行跨
膜结构分析,结果表明(图3),葡萄的类黄酮一3-0一
葡萄糖基转移酶蛋白存在2种跨膜模型,其中1个
STRONGL Ypreferedmodel(强烈推荐模型)有4个跨
膜螺旋,N端处在膜外面,第1个跨膜螺旋从第26位
氨基酸开始,到第44位氨基酸结束,相对膜的取向
是由外到内;第2个跨膜螺旋从第47位氨基酸开
始,到第69位氨基酸结束,相对膜的取向是由内到
外;第3个跨膜螺旋从第136位氨基酸开始,到第
163位氨基酸结束,相对膜的取向是由外到内;第4个
跨膜螺旋从第361位氨基酸开始,到第384位氨基
酸结束,相对膜的取向是由内到外,另外1个altema. tivemode(可选择模型)有3个跨膜螺旋.另一方面,
跨膜结构域的存在也证实了信号肽存在的可能性.
对其它植物UFGT蛋白质序列进行分析,结果表明
它们均存在2种跨膜模型,其中玉米以5个跨膜螺
旋模型更为可信,总分值为4589;拟南芥以2个跨膜
螺旋模型更为可信,总分值为2406;草莓以5个跨膜
螺旋模型更为可信,总分值为4134;水稻以7个跨膜
螺旋模型更为可信,总分值为7076;苹果以4个跨膜
螺旋模型更为可信,总分值为2463.
1.2.5卷曲螺旋预测
利用在线分析工具COILS对葡萄的类黄酮一3一
O一葡萄糖基转移酶蛋白进行分析.结果表明(图4),
葡萄的类黄酮一3一O一葡萄糖基转移酶蛋白存在1个卷曲螺旋结构,位于450区域左右.对其它物种
UFGT分析,结果表明,玉米,拟南芥,草莓,水稻和苹
果等植物的UFGT蛋白也存在1个卷曲螺旋结构,
同样位于450处左右.
图3葡萄UFGT蛋白的跨膜区域预测
Figure3Transmembranedomainpredictionofthededuced UFGTproteinfromVitisviniJbra
基因组学与应用生物学
96G
enomicsandApp1iedBio1og)r
图4葡萄UFGT蛋白的卷曲螺旋预测
注:绿,蓝,黄线分别表示不同尺寸窗口的预测
Figure4Coiled—coilpredictionofthededucedUFGTprotein fromVitisvinifera
Note:Green,blueandyellowlinesrepresenttheforecastofdif- ferentsizewindows,respectively
1.3亚细胞定位预测
利用在线工具wolfpsort分别对葡萄,玉米,拟
南芥,草莓,水稻和苹果等植物的UFGT蛋白的亚细
胞定位进行分析,结果表明,葡萄的叶绿体得分
14.0;玉米的胞液得分9.0,过氧物酶体得分4.0;拟南
芥的叶绿体得分5.0,胞液得分3.0,线粒体得分1.0,
液泡膜得分1.0;草莓的叶绿体得分14.0;水稻的叶
绿体得分13.0;苹果的胞液得分13.0.分析认为,
UFGT蛋白极有可能在细胞质合成,然后通过信号
肽定位在叶绿体或胞液.
1.4蛋白质二级结构的预测和分析
二级结构主要指多肽链依赖氢键排列成方向上
具有周期性的结构构象,主要包括仪一螺旋,延伸链,
无规则卷曲和6一转角等,对其进行分析有助于认识
蛋白质的空间结构.采用GOR4分析葡萄的类黄酮

3一O一葡萄糖基转移酶蛋白的二级结构,结果表明(图5),该蛋白由35.53%OL一螺旋(alphahelix),16.67%
延伸链(extendedstrand)~]47.81%无规则卷曲(ran. domcoil)所组成,0c一螺旋和无规则卷曲是主要的构
成元件,并且散布于整个蛋白质.同样的方法对其它
植物的类黄酮一3一O一葡萄糖基转移酶蛋白进行二级结构分析,结果(表2)表明它们在二级结构组成上比
例相似,并且也都由O1.一螺旋,延伸链和无规则卷曲
所组成,说明UFGT基因所编码的蛋白二级结构单
元具有一定的相似性.
1.5蛋白质功能域的预测和分析
功能域是蛋白质亚基结构中介于二级与三级结
l0203040
lIIi
MSQTYIIqPHV AVLAFPFSr阿AAPLLAWRRLAAAAPHAVFSFFSTS ccccccccceeeeeccccccchhhhhhhhhhhhcccceeeccccc
QSNASIFHDS任fnQCNIl(SYDISDGVPEGYvFAGRPQEDIELFMR cccceeeeceeeeeeeeeeeeecccccccceeeccccchhhhhhhh AAPESFRQGMVMA VAETGRPVSCLV ADAFIWFAADMAAEMG^r5^7Lp hchhhhhhhhhheeecccccceeeecchhhhhhhhhhhhhheeeec
FWLGPNSLS_玎TDEIREKIGVSGIQGREDELLNFIPGMSj(vRF cccccccccccceechhhhhhcceeccccchhhhhccccccchhhh
RD/QEGIVFGNLNSLFSRMLHRMGQVLPKATAVFINSFEELDDSLT cccccceeeccccchhhhhhhhhhcccccchhhhhchhhhcchhhh NDLKSKLKTYLNIGPFNLITPPPWpNTTGCLQWLKERKPTSVVYI hhhhhhhceeecccccccccccccccccccchhhhcccccceeeee
SFG啊PPPAELV ALAEALEASRVPFIWSLRDKASVHLPEGFLEK eccccccccchhhhhhhhhhhhcccchhhhhccccccccccccccc
TRGY国nrPWAPQAEVLAHEAVGAFvTHCNSLWESVAGGVPLIC cccceeeecccccchhhhhhhheeeeeeeccccccccccccccccc
RPFFGDQRLN8RMVEDALEIG.vRIEGGVFTENGLMSCFDQILSQEK CCCCCCCcccchhhhhhhhhheeeccceeeccccccccchhhhhhh GKKLRENLRALRETADRA VGPKGSSTENFKTLVDLVSKPKDV hhhhhhhhhhhhhhhhhhcccccccccchhhhhhhhccceec 50100150200250300350400450
Helix--u--------——-——Sheet?---—.__.—------——Coil--------?---—-——
图5葡萄UFGT蛋白的二级结构预测
注:h:一螺旋;e:/3一折叠延伸链;L:/3一转角;c:无规则卷曲Figure5SecondarystructurepredictionofthededucedUFGT proteinfromVitisvinifera
Note:h:Alphahelix;e:BetasheetExtendedstrand;L:Betaturn; c:Randomcoil
构之问的一种独立结构和功能单位,用BLAST搜索
葡萄的类黄酮一3一O一葡萄糖基转移酶蛋白的结构功能域.结果表明(图61,以CD算法,得出结论是葡萄的
类黄酮一3-0一葡萄糖基转移酶蛋白存在GT1Gtf
like(GT1Gtf类似物),然后利用Cn3D制图(刘旭光
和张杰.2007),该功能域活性位点分别位于第11位,
第12位,第14位,第140位,第143位,第144位,
第148位,第172位,第229位,第292位,第294位,
第296位,第297位和第300位等残基;受体连接的
口袋分别位于第15位,第87位,第121位,第200位,
第281位和第372位等残基;TDP连接位点分别位于
第229位,第292位,第294位,第296位和第297位
等残基;二聚体分界面分别位于第26位,第93位,
基因组学与应用生物学
98G
enomicsandAppliedBio1O
圈目圈ABC
图7基于同源性建模推测UFGT蛋白的三维结构模型注:A:葡萄;B:苹果;c:玉米;红色:一螺旋;黄色:p~折叠延
伸链:绿色:无规卷曲
Figure7Three—dimensionalstructurepredictionofthededuced UFGTproteins
fromseveralplantsusinghomology—basedmodels
Note:A:Vitisvinifera;B:Malusdomestica;c:Zeamays;Red: Alphahelix;Yellow:Betasheetextendedstrand;Green:Random coil
准确性;若待建模序列与参考蛋白质序列同源性在
30%以下,则通过同源建模的方法很难得到好的结果
(李军等,2008).从建模结果可知,葡萄类黄酮一3-0一
葡萄糖基转移酶的氨基酸序列与参考蛋白质序列同
源性为95.55%,另外,利用Swiss.PdbViewer分析同
源建模结果,预测的蛋白质残基的二面角(图8)位于
黄色核心区域,表明其空间结构稳定,所以用同源建
模的方法对葡萄的类黄酮一3—0一葡萄糖基转移酶的氨基酸序列进行建模结果非常可靠.对玉米,拟南
芥,草莓,水稻和苹果等植物的UFGT蛋白进行同源
建模,结果表明,玉米,草莓,水稻和苹果的类黄酮一
3~0一葡萄糖基转移酶的氨基酸序列与参考蛋白质
序列同源性分别为38.87%,58.11%,40.92%#Il53.52%,
都能满足建模的效果和部分建模结果(图7),而拟南
芥不能通过同源建模建立起它的模型.
1.7葡萄UFGT基因序列相似性比对分析及UFGT
蛋白家族系统进化树的构建
利用Blast对葡萄UFGT的核苷酸及氨基酸序列
进行同源性比对,Blastn比对结果表明,葡萄UFGT
的核酸序列与毛果杨(Populustrchocarp(XM00232 7278),山竹子(Garciniamangostana)(FJ197134),草莓(Fragaria~ananassa)(AY695816),马来蒲t~(Syzygium malaccense)fGU233762),拟南芥rabidopsisthaliana)
(AY128739),西洋梨(communis)(GQ325589),
黑豆(nmungo)(AB009370),葡萄柚(Citrus~para-
disi)(GQ141630),苹果(Malusxdomestica)(DQ15690 6),连翘(poythiaxintermedia)(AF127218)及马铃薯(502帆mtuberosm)(AY954034)NN~,性较高,分别为71%,68%,70%,74%,72%,66%,70%,68%,66%,
72%和67%;Blastnp比对结果表明,葡萄UFGT与山避'?.(.
[I.厂—'\\
.
{/\\
,——
————.—
/
180—120—60060120l80
).''/.
/
J'I,
>.[f厂—-\,
.
\,●●
\—_——————————,


l●I
֤
.1
=>'.r,f.\
.
/\———_
————,
..1
图8几种植物UFGT蛋白模型的拉氏构象图(基于Swiss.Model 预测1
注:A:苹果;B:玉米;c:葡萄
Figure8RamachandranplotpredictionofthededucedUFGT proteinsfromseveralplantsusingtheSwiss—Model
Note:A:Malusdomestica;B:Zeamays:C:Vitisvinifera
葡萄(Vitisamurensis)(ACI15395),美洲葡萄(Vitis
labrusc(ABR24135),毛果杨(Populustrich0carpn)
(XP002327314),草莓(Fragaria~ananass(AAU123
66),山竹子(Garciniamangostana)(ACM62748),葡萄
柚(Citrusxparadisi)(ACS15351),苹果(Malusxdomesti.
c(AAD26203),柿(Diospyroskaki)(BAI40148),紫
苏(Perillafrutescens)(BAA19659),拟南芥rabidop—sisthaliana)(CAC01717),康乃馨(Dianthuscaryophyl—
几种经济植物UFGT基因的生物信息学分析BioinformaticsAnalysisofUFGTGenefromSeveralEconomicPlants99 lus)(BAD52003),连翘(Forsythiaxintermedia)(AAD210
86),马铃薯(Solanumtuberosum)(AAZ76827),墨西哥
野生马铃薯(Solanumpinnatisectum)(AAY88192)和
黑~(Vignamungo)(BAA36972)等有较高的同源性,
分别为100%,100%,98%,98%,99%,98%,97%,100%,
96%,94%,96%,98%,98%,98%和99%.
进化树是一组物种的进化历史,构建进化树的
目的是根据共同的祖先来描述它们的进化关系(Har. risonandLangdale,2006).根据李军等(2008)推荐的
软件组合,先采用clustalX将葡萄(Vitisinirer(BA
B41026.1)类黄酮一3~O一葡萄糖基转移酶蛋白的氨基酸序列和拟南芥rabidopsisthaliana)(AAK25870. 1,苹果(Malusxdomestica)(AAD26203.1),草莓(Fraga. riaxananass(AAS89832.1),玉米(Zeamars)(CAA31 857.1)及水稻(Oryzasativ(BAD358l6.1)等5条类
黄酮-3-O-葡萄糖基转移酶蛋白的氨基酸序列进行
多序列比对的分析,然后利用MEGA4.1软件,算法
为Neighbor—Joining,自检举1000次,构建进化树(Tamuraeta1.,2007)(图9).结果表明,6个物种的UFGT基因分为2个大类,其中草莓,苹果,葡萄和拟
南芥的UFGT基因聚成一大类;水稻和玉米的UFGT 基因聚成另一个大类.用同样的方法对UFGT蛋白家族构建进化树(图l0).结果表明,葡萄(Vitisvinifer (BAB41026.1,ABF59818.1,BAB41025.1,BAB41020.1) UFGT基因与'巨峰'葡萄(VitislabruscaxVitisvinil@ era)(BAB41018.1,BAB41017.11,美洲葡萄(Vitisbrus. c(ABR24135.11,山葡萄(Vitisamltrensis)(ACI1539
5.1,草莓(Fragariaxananassa)(AAS89832.1),山竹子(Garcini口mangostana)(ACM62748.1),毛果杨(Popu. 1ustrichocarp(XP002327314.1,XP002319914.1),葡
萄柚(Citr"xparadii)(ACS15351.1),苹果(MaIusx
do,nestic(AAD26203.1,AAZ79375.1),拟南芥ra. bidopsisthaliana)(AAK25870.1,AAM65321.1),柿(Dio—spyroskak)(BAI40148.1),洋桔梗(Eustomagrandiflo—rM(BAF49284.1)及康乃~:(Dianthuscaryophyllus)03A D52005.1)UFGT基因在1个大类群中.在这个大类
群中,其中葡萄柚,苹果,拟南芥,柿,洋桔梗和康乃
馨聚成1个亚类,说明它们在进化上的亲缘关系较
近;但是它们处在这个大类群中的外侧,说明它们的UFGT基因和葡萄UFGT基因在进化上的亲缘关系
较远;而草莓,山竹子和毛果杨等在这个大类群的内侧,说明它们的UFGT基因和葡萄UFGT基因在进化上的亲缘关系较近.大~(Glycinem)(ADC96620.
1)UFGT基因与黑_~(Vignamungo)(BAA36972.1),
图9根据6种植物的UFGT氨基酸序列构建的进化树注:标尺上的数字代表遗传距离
Figure9PhylogenetictreeofthededucedUFGTproteinsfrom sixplants
Note:Thenumbersintherulerindicatedthegeneticdistances 图10UFGT蛋白家族系统进化树
Figure10PhylogenetictreeofUFGTfamily
三花龙胆(Gentianatrra)(BAA12737.1),连翘(Forsy. thiaxiteed(AAD21086.1),油橄榄(Oleaeuropa—
ea)(ACB59250.1),紫苏(Perillafrutescens)(BAA1965 9.1),甜椒(CapscMmannuum)(ACN60406.1),墨西哥
野生马铃薯(Solanumpinnatisectum)(AAY88192.1),
马铃薯f50lanumtuberosum)(从Z76827.1)及三裂叶牵牛(1pomoeatri.,.,.fida)(ACF596991ACF596911ACF5 9685.1,ACF59680.1,ACF59675.1,ACF59670.1)的
UFG堪因在1个大类群中.在这个大类群中,甜椒,
墨西哥野生马铃薯,三裂叶牵牛和马铃薯的UFGT基因聚成1个亚类;连翘,油橄榄和紫苏的UFGT基因
~一一~
基因组学与应用生物学
1o0G
enomicsandAppliedBi0Iogy
聚成另一个亚类;大豆和黑豆的UFGT基因聚成1个
亚类.其中草莓,苹果,葡萄和拟南芥等在1个大类群
中的结果跟6个物种中草莓,苹果,葡萄和拟南芥的UFGT基因聚成一类相似.水稻(Oryzasativ(13AD35 816.1)UFGT基因与玉米(Zeamays)(~AA31857.1,CA
A31855.1CAA31856.1)UFGT基因在1个类群中,这

分析结果与6个物种中玉米和水稻的UFGT基因
归为一类的结果相似.陆地棉(GossypiumhirsMturn) (ACH56523.2)的UFGT基因与野芭蕉(Ms.umi.
nate1(ACI22618.1的UFGT基因分别单独成为一类.
2讨论
通过在线分析工具和生物软件对葡萄,玉米,拟
南芥,苹果,草莓和水稻等植物进行分析,结果表明
这几种植物的UFGT基因都存在外显子.氨基酸序
列的理化性质分析表明,葡萄和苹果的类黄酮一3一O一葡萄糖基转移酶蛋白属于不稳定蛋白,其余几种植
物属于稳定性蛋白.有人报道,CHI,F3H,F3'H等基
因编码的蛋白不包含信号肽(周军等,2009;李鹏等, 2010;刘海峰等,2009),定位于细胞基质.本文分析
表明,葡萄,玉米,拟南芥,苹果,草莓和水稻等植物
的UFGT基因编码的蛋白存在信号肽,跨膜结构,卷
曲螺旋以及亚细胞定位于胞液或叶绿体.虽然它们
都属于类黄酮途径中的酶蛋白,但是由于它们的功
能和所处的空间位置的不同,所以导致在亚细胞中
的定位存在差异,一方面,UFGT催化不稳定的花青
素转变为稳定的花青苷,处于类黄酮途径中的最后
阶段;另一方面,由于大量的花色苷累积在液泡中,
因此,UFGT蛋白可能在信号肽引导下定位于液泡,
在液泡中催化不稳定的花青素转变为稳定的花青苷,从而使大量的花色苷累积在液泡中.
二级结构分析表明,葡萄,玉米,拟南芥,苹果,
草莓和水稻等植物UFGT蛋白质二级结构元件比例相似,主要由OL一螺旋,延伸链和无规则卷曲所组成. 结构域分析表明它们都存在糖基转移酶蛋白所拥有的UDPGT,COG1819和MGT等保守域.除拟南芥外,葡萄,玉米,苹果,草莓和水稻等植物都能通过同
源建模的方法建立它们的三维结构.通过blastn对
葡萄的UFGT核苷酸序列以及blastp对它的UFGT 氨基酸序列分别进行同源性搜索,结果表明葡萄的UFGT核苷酸序列与毛果杨,山竹子,?。

相关文档
最新文档