砀山酥梨4CL基因家族的全基因组鉴定与分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

砀山酥梨4CL基因家族的全基因组鉴定与分析
曹运鹏, 方志,李姝妹, 闫冲冲, 丁庆庆, 程曦, 林毅, 郭宁*, 蔡永萍*
安徽农业大学生命科学学院,合肥,230036
摘要:4-香豆酸:辅酶A连接酶(4CL)基因是植物调控木质素代谢,以及参与类黄酮和其他次生代谢产物的合成的关键基因之一,而木质素的合成及聚合在细胞壁沉积导致部分薄壁细胞次生壁加厚形成石细胞。

为了更好的了解砀山酥梨中4CL基因的种类和数量,本文利用砀山酥梨基因组的氨基酸和cDNA数据库对4CL基因家族进行筛选,分析砀山酥梨基因组中4CL基因的种类、进化关系、基因的物理定位、以及基因结构和保守基序。

结果显示在砀山酥梨基因组中发现并初步确定了29个4CL基因,通过基因的定位分析发现除了4、8、11、12号染色体上面没有4CL基因之外,其他的染色体上都存在有4CL基因;并且在9、17号染色体上还存在着基因簇。

通过基因结构和进化树之间的比较,进一步确定了基因结构和进化之间的相互联系。

这些研究结果为砀山酥梨4CL基因功能的深入分析奠定了基础。

关键词:砀山酥梨;4CL;基因结构;进化
Genome-wide identification and analyses of 4CL gene families in Pyrus bretschneideri Rehd
Yunpeng Cao, Zhi Fang,Shumei Li, Chongchong Yan, QiongQiong Ding,Xi Cheng, Yi Lin, Ning Guo*, Yongping Cai*
College of Chemistry and Life Sciences,Anhui Agricultural University,Hefei 230036
Abstract:4-Coumaric acid: coenzyme A ligase (4CL) gene is one of the key genes involved in the regulation of lignin metabolism and the synthesis of flavonoid and other secondary metabolites in plant, while the synthesized and polymerized lignin is deposited in cell walls and leads to thickening of secondary walls in some parenchyma cells and formation of stone cells. To better understand the variety and quantity of 4CL genes in Pyrus bretschneideri Rehd., we used the amino acid and cDNA databases of Pyrus bretschneideri Rehd. genome to screen 4CL gene family, and analyzed their classification, evolutionary relationships, physical location, gene structure and conserved motif. Our results showed that 29 4CL genes were identified and preliminarily characterized, and these 4CL genes were distributed in all chromosomes except chromosomes 4, 8, 11, 12 and clustered on chromosomes 9 and 17 through gene location analysis. The relationship between 4CL gene structure and evolution was further determined by comparing gene structure and phylogenetic tree. These findings provide a basis for further analysis of 4CL gene function in Pyrus bretschneideri Rehd.
Key words: Pyrus bretschneideri Rehd, 4CL, gene structure, phylogenetic
砀山酥梨(Pyrus bretschneideri Rehd.)原产于安徽省砀山县,是我国对外出口的主要品种。

与国际上那些高质量的梨相比,我国的梨大多数都有石细胞含量高、口感较差、含糖量不高以及果皮比较厚的特点[1-3]。

梨石细胞是影响梨品质的重要因素之一,石细胞是由薄壁细胞经次生壁加厚形成的,木质素是石1细胞的主要成分之一。

因此,石细胞的形成发育过程与木质素的合成、运输、沉积有着密切的关系。

而4-
收稿时期:2015-02-05 ;修回日期:2015-03-24
基金项目:国家自然科学基金(编号:30771483, 31171944),安徽省级大学生创新基金项目(编号:AH201410364038)资助
作者简介:曹运鹏,硕士研究生,研究方向:砀山酥梨功能基因组学:E-mail:499981806@
*通讯作者:蔡永萍, 教授, 博士,主要从事植物生物技术方面研究:E-mail:swkx12@
郭宁, 副教授, 在读博士, 主要从事遗传学、分子生物学等方面的教学和科研工作:E-mail:81_ahau@
香豆酸:辅酶A连接酶(4CL)是木质素合成途径一个重要的限速酶,是苯丙氨酸途径中联系着木质素的前体和其他各个分支反应的重要节点。

4CL基因能够分别催化p-香豆酸、咖啡酸、阿魏酸和芥子酸生成相应的CoA 酯,最终促进木质素单体的生物合成[4-6]。

近年来,4CL基因家族的研究已经成为热点。

目前,已从水稻[7]、大豆[8]、拟南芥[9]、杨树[10]、松树[11]等物种中分离鉴定出了4CL基因。

目前砀山酥梨的4CL基因、以及关于4CL基因家族的分析还未见报道,本研究主要是利用生物信息学对砀山酥梨4CL基因家族进行挖掘,旨在为今后深入的研究砀山酥梨4CL基因家族成员以及功能研究奠定基础。

1 材料与方法
1.1 基因组数据库序列来源
以蔷薇科砀山酥梨(Pyrus bretschneideri Rehd.)为研究对象,砀山酥梨全基因组的数据来源于GigaDB 数据库(/dataset/100083)。

拟南芥和水稻的数据从相关文献中得到[12]。

1.2 砀山酥梨4CL基因的筛选
使用“DNATOOLS”软件将获得的砀山酥梨全基因组氨基酸序列建立一个本地数据库,以拟南芥4CL结构域的氨基酸序列作为查询(query)与建立的砀山酥梨全基因cDNA序列本地数据库进行TBlastN (E-value=0.001)[13]序列比对,初步筛选出4CL候选基因序列。

将BLAST得到的同源核苷酸序列分别通过Pfam(E-value=0.001)以及SMART程序[14]检验其是否含有4CL结构域。

将得到的4CL序列通过MEGA6.0软件的ClustalW工具[15]进行多重序列比对,去除重复序列。

1.3砀山酥梨4CL基因家族进化树的构建及分类
利用MEGA6.0软件里提供的ClustalW工具对砀山酥梨4CL基因氨基酸序列进行多序列比对,然后通过邻接法(Neighbor-Joining method,N-J)(bootstrap=1000)进行系统进化树的构建,以此来分析砀山酥梨4CL基因家族的进化关系。

然后再使用最大似然法(Maximum Likelihood,M-L)(bootstrap=1000)构建了砀山酥梨、水稻和拟南芥的4CL基因家族的复合进化树。

1.4砀山酥梨4CL基因编码的氨基酸序列属性分析
为了分析砀山酥梨4CL基因氨基酸的序列属性和特征,使用ExPAsy(/)在线工具对获得的4CL基因氨基酸序列进行等电点(PI)、蛋白分子量(MW)和开放阅读框(ORF)等属性的计算。

1.5 砀山酥梨4CL基因的保守基序分析
利用MEME (Multiple Expectation Maximization for Motif Elicitation)在线分析工具(/meme4_3_0/intro.html)[16]对4CL基因的蛋白保守基序进行分析,基序的最大数值设为20,基序的长度设置介于6~200之间。

对得到的保守基序使用Pfam和SMART进行功能注释。

1.6砀山酥梨4CL基因定位
从公布的砀山酥梨基因组数据库中得到砀山酥梨每个4CL基因在染色体上面的起始位置等相关信息,使用MapInspect(/)软件将所有的砀山酥梨4CL基因在染色体上的物理位置绘制成图。

2 结果与分析
2.1砀山酥梨4CL获选基因的确定与命名
通过Pfam蛋白数据库得到砀山酥梨4CL基因的HMM氨基酸序列,利用“DNATOOS”软件对砀山酥梨全基因组进行TBlastN(E-value=0.001)序列比对,共获得35个候选基因。

将全部的获选基因通过MEGA6.0
软件中的ClustalW多序列比对工具进行序列对比,并通过SMART和Pfam对获选基因的氨基酸进行分析,删除重复序列和没有4CL基因氨基酸保守结构域的序列,最终确定了29个4CL基因家族的成员。

数量多于拟南芥(13个)和水稻(14个)中的基因数量。

参考已公布的其他物种对4CL基因的命名方式,本研究将这类基因统称为“4CL”,其前缀加上代表物种的特异性字母。

将砀山酥梨4CL基因命名为Pbr4CL。

同时通过ExPAsy(/)网站查询所有4CL基因的基本信息,如蛋白质的分子量、等电点等(表1)。

表1 砀山酥梨29个4CL基因的序列属性
序号基因名称4CL序列号长度分子量等电点染色体定位
1 Pbr4CL1 Pbr038759.1 831 92050.61 6.58 9
2 Pbr4CL2 Pbr012657.1 182 20144.25 8.28 17
3 Pbr4CL3 Pbr030475.1 55
4 61236.
5 8.29 5
4 Pbr4CL4 Pbr027708.1 593 65415.06 6.89 15
5 Pbr4CL5 Pbr011975.1 581 63703.55 7.94 13
6 Pbr4CL6 Pbr008461.1 574 63243.95 7.94 9
7 Pbr4CL7 Pbr019162.1 607 66271.74 6.48 9
8 Pbr4CL8 Pbr028634.1 370 40727.98 5.91 scaffold477.0
9 Pbr4CL9 Pbr005761.1 555 60077.34 7.67 15
10 Pbr4CL10 Pbr024635.1 547 60307.53 5.71 5
11 Pbr4CL11 Pbr039972.1 605 65257.24 5.36 7
12 Pbr4CL12 Pbr036273.1 200 22121.44 5.31 16
13 Pbr4CL13 Pbr026213.1 559 60910.34 8.78 14
14 Pbr4CL14 Pbr027219.1 298 32793.96 7.03 6
15 Pbr4CL15 Pbr036926.1 560 61015.28 6.29 14
16 Pbr4CL16 Pbr027704.1 544 59136.27 6.03 17
17 Pbr4CL17 Pbr036272.1 374 41133.76 7.6 16
18 Pbr4CL18 Pbr026415.1 605 66149.74 8.85 3
19 Pbr4CL19 Pbr037933.1 456 49627.46 5.64 2
20 Pbr4CL20 Pbr040326.1 570 62144.47 5.8 17
21 Pbr4CL21 Pbr001283.1 575 62994.99 5.27 scaffold1027.0
22 Pbr4CL22 Pbr040753.1 1069 117793.16 5.75 7
23 Pbr4CL23 Pbr021917.1 721 79904.5 5.75 17
24 Pbr4CL24 Pbr012658.1 488 53584.1 7.18 17
25 Pbr4CL25 Pbr003455.1 567 62130.6 6.81 scaffold1149.0
26 Pbr4CL27 Pbr012647.1 574 63567.4 7.91 17
27 Pbr4CL30 Pbr013445.1 606 65177.8 5.39 1
28 Pbr4CL32 Pbr040787.1 569 61914.3 6.04 7
29 Pbr4CL35 Pbr037490.1 566 62103.6 8.66 10
2.2砀山酥梨4CL基因的结构和进化分析
通过对砀山酥梨全基因组进行搜索和筛选之后,共得到了29个非重复砀山酥梨4CL基因。

这些4CL基因具有相似的序列和结构域,其保守性和同源性都比较高。

为了分析砀山酥梨中4CL基因的亲缘关系,利用MEGA6.0软件通过邻接法对砀山酥梨4CL氨基酸序列构建了系统进化树(图1)。

系统进化树将29个砀山酥梨4CL基因清晰地分为了两个亚类。

将获得的所有砀山酥梨4CL基因按照GSDS (/) [17]网站提供的格式整理,然后在该网站提交信息就得到砀山酥梨所有4CL 基因的基本结构示意图。

从图1中可见,所有4CL基因的核苷酸序列基本可以分为三个部分:内含子和外显子、以及UTR区。

每个4CL基因的核苷酸序列被内含子分成几个部分,并且进化树中同一个聚类的基因结构较为相似,这个也间接的证明了本研究利用系统发生树进行分类的准确性。

为了进一步明确不同物种间4CL基因的亲缘进化关系,使用最大似然法对13个拟南芥、14个水稻和29个砀山酥梨的4CL基因构建了一个复合进化树(图2)。

结果显示,14个拟南芥的4CL基因与报道的一样,被清晰的分成两个亚类。

不过从图2中也可以看出,砀山酥梨、水稻和拟南芥三个物种的4CL基因在Class I区域均有存在,而在Class II这个区域只存在砀山酥梨与拟南芥的4CL基因。

形成这个的原因可能是单双子叶物种分化时双子叶植物的4CL基因出现了不同程度的进化。

直系同源基因是由最近的祖先经过种系发生而形成[18]。

根据砀山酥梨、水稻和拟南芥4CL基因家族的系统进化树,砀山酥梨和拟南芥之间能够找出4对直系同源基因、水稻跟拟南芥之间能够找出1对直系同源基因、砀山酥梨跟水稻之间能够找出1对直系同源基因。

该直系同源基因数目表明,在3个物种的进化中砀山酥梨与拟南芥之间的亲缘关系比较近,而与水稻的亲缘关系比较远。

图 1 砀山酥梨中4CL蛋白的进化和基因结构分析
图2 砀山酥梨、拟南芥、水稻4CL蛋白的进化关系分析
2.3砀山酥梨中4CL基因染色体物理位置定位
基因的加倍(Gene duplication))被认为是促进基因进化最为重要的原因之一[19],砀山酥梨基因组在经历了几次加倍事件,这些变化都使得砀山酥梨基因组中出现了越来越多的基因家族,丰富了砀山酥梨基因组的多样性。

为了进一步研究基因分化以及基因复制对砀山酥梨中4CL基因家族的影响,利用MapInspect (/)软件将砀山酥梨的29个基因定位在13条染色体上(图3)。

其中Pbr4CL8、Pbr4CL21、Pbr4CL25等基因定位在scaffold上。

从图3可以看出,砀山酥梨4CL基因随机的分布于砀山酥梨13条染色体上,但是基因的分布不均衡。

如图所示,9号和17号染色体上分布的4CL基因最多,含有5个基因。

1、2、3、6、10、13等染色体上只分布1个基因。

此外根据基因簇的定义一般认为200 kb的核苷酸单位中含有三个以上基因的基因群[20],29
个基因只有在9号、17号染色体上分别形成1个基因簇,其他的染色体上面没有形成明显的基因簇。

4 0.137931 200 ALPYSSGTTGLPKGVMLTHKGLVTSVAQQVDGENPNLYFHEDDVILCVLPLF
AMP-binding enzyme
HIYSLNSVFLCGLRVGAGILIMQKFEIGKLLELIQKYKVSIAPFVPPIVIAI
AKNPMVDRYDLSSIRMVMSGAAPMGKELEDTVKAKVPNAKLGQGYGMTEAGP
VLSMCMAFAKEPFPIKSGACGTVVRNAEMKIVDPDTGASLGYNQ
5 0.62069 52 GIQKGDVVMILAPNCPEFYFMHFGVPMIGAVLTTANPRYTAAEIAKQVRHSN AMP-binding enzyme
6 0.96551
7 21 VHFIDSIPKNPTGKIQRKELR No
No
7 0.275862 56 MEMLPKCDANYTPLSPTWFLERAAVVYPDRTSVVYGSIRYTWQQTYQRCCRL
ASAL
8 0.310345 57 RRPLPHPVQIMTGGAPPPPPILFKMEELGFNVTHGYGMTETYGPATVCAWKP
AMP-binding enzyme
EWDSL
9 0.586207 29 QDDPCLILYSSGTTGKPKGVVLTHRNFIA AMP-binding enzyme
10 0.068966 200 FDYNSSDIYWCTADCGWITGHSYVTYGPLLNGATAVLYEGAPNYPDPGRCWD
AMP-binding enzyme
VVDKYKVTIFYTAPTLVRSLMRDSDEYVTRYSRKSLRVLGSVGEPINPSAWR
WFFNVVGDSKCPISDTWWQTETGGFMITPLPGAWPQKPGSATFPFFGVQAVI
VDEKGVEIEGECSGYLCVKSSWPGAFRTLYGDHERYETTYFKPF
11 0.413793 21 TEEQVMQFIAKQVAPYKKIRR No
12 0.241379 57 KYDLSSLRWVGCGGAPLSKEVIDRFRERFPWVEIRQGYGLTETCGAGTRMID
AMP-binding enzyme
DEECK
No
13 0.068966 152 NNNKKPRNNPNLITTSDHLRHVESMATMPSGAGNISHLNAIILGESLASEEN
DLVFPSDHFSCQAHVSSPQQYLEMYKRSIEDPAGFWSDIAATFFWKQKWGQP
VYSENLDIRKGDIRIEWFKGGITNICYNCLDTNVEAGLGDKIAFYWEG
14 0.310345 41 GNTIVLMQRFDFNKMLRAIERHKVSHMPVVPPIIVALVKHA No
15 0.344828 21 KQTCKEIMKFCRKKLPHYMVP No
16 0.275862 21 EGVDVKNPNTMESVPYDGKTM No
17 0.137931 29 HIFRSKLPDIYIPNHLPLHTYCFQNISQF No
18 0.310345 29 HEGSCGRLMPNMEAKIVDPETGEALPPYK AMP-binding enzyme
19 0.310345 19 HDVFLCTLPMFHIYGLAYF No
AMP-binding enzyme 20 0.068966 113 KQSFTSDGYFRTGDAGTVDEDGYYIILGRTGADIMKVGGYKLSALEIESVLL
QHPAVEECCVLGLPDKDYGEVVCAIIVPEVETKKKQKEELKPAISLEELSFW
AKDKLAPYK
图4 砀山酥梨4CL蛋白20个保守基序的分布
3讨论
4-香豆酸:辅酶A连接酶(4CL)是植物木质素和类黄酮等苯丙烷衍生物在生物合成途径中的一个关键酶。

20世纪70年代初,已有研究者开始分离纯化植物中的4CL蛋白酶。

到现在为止,已经从杨树和水稻、丝瓜和大豆、欧芹和刺槐、以及云杉等多种植物中纯化或者部分纯化了4CL蛋白[21]。

随着研究工作的深入,发现4CL基因在植物基因组中一般是以基因家族的形式存在的,欧芹和马铃薯、以及水稻的4CL基因家族DNA就成功的被分离和测序[22, 23]。

Endler等[24]对不同植物的4CL基因的氨基酸序列进行重组发现4CL蛋白能够分成两个大的古进化种类,即Class I、Class II。

这个结论与本文对砀山酥梨4CL的进化分析结构是一致的。

目前,将拟南芥中的At4CL1与At4CL2归为Class I这一组,而将At4CL3归为Class II这一组。

以往的研究结果显示Class I内的4CLs主要伴随木质素的生物合成,而Class II中的4CLs主要参与类黄酮的生物合成[25]。

在杨树中2个Pt4CL1和Pt4CL2基因也被成功的克隆出来[26],并且这两个基因的表达模式是有区别的,Pt4CL1主要在杨树的木质部表达,而Pt4CL2主要在杨树幼叶表皮细胞中表达。

这个就揭示了4CL具有不同的底物利用特性和催化特性[27]。

Gilbert等[28]人的研究结果表明基因结构中的内含子跟古老基因进化是有一定关系的。

到目前为止研究者对于内含子的起源有两种不同的假说。

一种假说认为编码蛋白的基因是不连续的,一开始就有内含子的存在。

另一种假说认为内含子不是基因原有的,而是在进化的某一过程中通过转座作用插入到连续基因去的。

对于这两种假说研究者都找到了与之相关的证据,实际上内含子的起源有很大可能是这两种假说的结
合,即有些内含子是物种在进化的时候才出现的,而有一些内含子是基因在一开始的时候就存在的[29]。

Tijet
等[30]人的研究表明一个基因家族中间不同亚族内含子的位置几乎不保守,所以内含子的保守情况与亚家族成员之间的进化是存在一定相关性的。

因此,推测在砀山酥梨的4CL基因家族中,最早出现的那些4CL基因所含的内含子很少;随着进化的进行出现的基因所含内含子数目逐渐增多;当达到最大值的时候内含子又开始有所减少。

在砀山酥梨4CL基因中,Class I中的Pbr4CL1与Pbr4CL2所含的内含子数目最多,而ClassI的Pbr4CL19和Class II的Pbr4CL13等基因则不含内含子。

因此,推测不含内含子的这两个基因在砀山酥梨4CL基因组中出现的时间是最早的。

另外从进化树和内含子外显子的图也能够看出,进化距离远近与基因的结构是存在相关性的,即进化距离近的基因其基因的结构也较为类似。

这个是跟艾均文等[31]家蚕基因结构的研究是一致的,即在进化树中间进化距离越近,它们的基因结构相似度越大。

从图3的结果来看,砀山酥梨的4CL基因在染色体上的分布是没有规律的。

部分基因是以基因簇的形式存在于染色体上,如染色体9号和17号。

基因簇的形成一般是基因复制的结果,并且大多数他们还聚类在一个亚家族中,同源性较高。

因此,推测9号和17号染色体上面可能发生过4CL基因的复制,从而最终导致这两条染色体分布的4CL基因比较多。

总之,本研究利用砀山酥梨全基因组进行TBlastN搜索和HMM分析比对,最终在砀山酥梨中间确定了29个4CL基因。

染色体定位结构表明4CL基因在染色体上面的分布是随机不均衡的。

除了9、17号染色体之外的其他染色体上没有基因簇的存在。

对砀山酥梨4CL基因的结构进行了分析,位于进化树同一亚家族的基因其结构是类似的,其基因中所含有的外显子、以及内含子的数目也基本一致,只是在长短方面有所区别。

对砀山酥梨4CL氨基酸的保守基序也进行了初步探究,并使用Pfam、SMART进行了注释。

其结果显示砀山酥梨4CL基因含有4CL基因家族所特有的一些保守基序。

参考文献
[1] 陶书田,张绍铃,乔勇进,盛宝龙. 梨果实发育过程中石细胞团及几种相关酶活性变化的研究. 果树学报, 2004, 21(6): 516-520.
[2] 刘小阳,李玲,高贵珍,蔡永萍,宗梅. 光照对砀山酥梨果实发育过程中POD、PAL、PPO酶活性的影响研究. 激光生物学报, 2008,17(3): 295-298.
[3] 李玲,蔡永萍,刘小阳. 梨果实的石细胞. 植物生理学通讯, 2004,40(5): 629-632.
[4] Humphreys J M, Chapple C. Rewriting the lignin roadmap. Curr Opin Plant Biol, 2002, 5(3): 224-229.
[5] Boerjan W, Ralph J, Baucher M. Lignin biosynthesis. Annu Rev Plant Biol, 2003, 54(1): 519-546.
[6] Lee D, Meyer K, Chapple C, Douglas, C. J. Antisense suppression of 4-coumarate: coenzyme A ligase activity in Arabidopsis leads to altered lignin subunit composition. Plant Cell, 1997, 9(11): 1985-1998.
[7] Furukawa T, Sakaguchi N, Shimada H. Two OsGASR genes, rice GAST homologue genes that are abundant in proliferating tissues, show different expression patterns in developing panicles. Genes Genet Syst, 2006, 81(3): 171-180.
[8] Kotilainen M, Helariutta Y, Mehto M, Pöllänen E, Albert, V A, Elomaa P, Teeri T H. GEG participates in the regulation of cell and organ shape during corolla and carpel development in Gerbera hybrida. Plant Cell, 1999, 11(6): 1093-1104.
[9] José I, Amaya I, Castillejo C, Sánchez-Sevilla J F, Quesada M A, Botella M A, Valpuesta V. The strawberry gene FaGAST affects plant growth through inhibition of cell elongation. J Exp Bot, 2006, 57(10): 2401-2411.
[10] Herzog M, Dorne A, Grellet F. GASA, a gibberellin-regulated gene family from Arabidopsis thaliana related to the tomato GAST1 gene. Plant Mol Biol, 1995, 27(4): 743-752.
[11] Aubert D, Chevillard M, Dorne A, Arlaud G, Herzog M. Expression patterns of GASA genes in Arabidopsis thaliana: the GASA4 gene is up-regulated by gibberellins in meristematic regions. Plant Mol Biol, 1998, 36(6): 871-883. [12] de Azevedo Souza C, Barbazuk B, Ralph S G, Hamberger B, Douglas C J. Genome‐wide analysis of a land plant‐specific acyl: coenzymeA synthetase (ACS) gene family in Arabidopsis, poplar, rice and Physcomitrella. New Phytol, 2008, 179(4): 987-1003.
[13] 吴翔宇,许志茹,曲春浦,李蔚,孙琦,刘关君. 毛果杨 NLP 基因家族生物信息学分析与鉴定. 植物研究, 2014, 34(1): 37-43.
[14] Letunic I, Doerks T, Bork P. SMART 6: recent updates and new developments. Nucleic Acids Res, 2009, 37(suppl 1): D229-D232.
[15] Thompson J D, Higgins D G, Gibson T J. CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Res, 1994, 22(22): 4673-4680.
[16] Bailey T L, Elkan C. The value of prior knowledge in discovering motifs with MEME. Proc Int Conf Intell Syst Mol Biol, 1995, 3: 21-29.
[17] Guo A Y, Zhu Q H, Chen X, Luo J C. [GSDS: a gene structure display server]. Yi Chuan, 2007, 29(8): 1023-1026.
[18] Shi S Y, Ding D F. A evolutionary approach to identification of orthologous relationship across proteomes. Sheng Wu Hua Xue Yu Sheng Wu Wu Li Xue Bao (Shanghai), 2002, 34(1): 88-94.
[19] Sankoff D. Gene and genome duplication. Curr Opin Genet Dev, 2001, 11(6): 681-684.
[20] Holub E B. The arms race is ancient history in Arabidopsis, the wildflower. Nat Rev Genet, 2001, 2(7): 516-527.
[21] Duthie G, Crozier A. Plant-derived phenolic antioxidants. Curr Opin Clin Nutr Metab Care, 2000, 11(1): 43-47.
[22] Lozoya E, Hoffmann H, Douglas C,Schulz W, Scheel D, Hahlbrock K. Primary structures and catalytic properties of isoenzymes encoded by the two 4‐coumarate: CoA ligase genes in parsley. Eur J Biochem, 1988, 176(3): 661-667. [23] Wang Z, Wu Z L, Xing Y Y, Zheng F G, Guo X L, Zhang W G, Hong M M. Nucleic Acids Res. Nucleic Acids Research, 1990, 18(19): 5898.
[24] Endler A, Martens S, Wellmann F, Matern U.Unusually divergent 4-coumarate: CoA-ligases from Ruta graveolens L. Plant Mol Biol, 2008, 67(4): 335-346.
[25] Wei X, Wang X. Evolution of 4-coumarate: coenzyme A ligase (4CL) gene and divergence of Larix (Pinaceae). Mol Phylogenet Evol, 2004, 31(2): 542-553.
[26] Hu W, Kawaoka A, Tsai C, Lung J, Osakabe K, Ebinuma H, Chiang V L. Compartmentalized expression of two structurally and functionally distinct 4-coumarate: CoA ligase genes in aspen (Populus tremuloides). Proc Natl Acad Sci U S A, 1998, 95(9): 5407-5412.
[27] Allina S M, Pri-Hadash A, Theilmann D A, Ellis B E, Douglas C J. 4-Coumarate: coenzyme A ligase in hybrid poplar properties of native enzymes, cDNA cloning, and analysis of recombinant enzymes. Plant Physiol, 1998, 116(2): 743-754.
[28] Gilbert W. The exon theory of genes. Cold Spring Harb Symp Quant Biol, 1987, 52: 901-905.
[29] Plomin R, Spinath F M. Intelligence: genetics, genes, and genomics. J Pers Soc Psychol, 2004, 86(1): 112.
[30] Tijet N, Helvig C, Feyereisen R. The cytochrome P450 gene superfamily in Drosophila melanogaster: annotation, intron-exon organization and phylogeny. Gene, 2001, 262(1): 189-198.
[31] 艾均文,薛宏,何行健,孟繁利,朱勇,向仲怀. 家蚕细胞色素P450基因的研究进展. 昆虫学报, 2011, 54(8): 918-926.
(责任编委:储成才)。

相关文档
最新文档