纤维素合成酶基因家族的生物信息学分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
摘要 (1)
关键词 (1)
前言 (2)
1材料与方法 (4)
1.1获取氨基酸序列 (4)
1.2序列比对及进化树构建 (4)
2结果与分析 (4)
2.1 水稻纤维素合成酶基因家族组成 (4)
2.2纤维素合成酶各成员蛋白质序列的多重比对 (6)
2.3 纤维素合成酶成员的进化分析 (17)
3讨论 (20)
4参考文献 (20)
5致谢 (20)
水稻纤维素合成酶基因家族的生物信息学分析
作者: 吴赵指导老师:彭喜旭专业:生物科学
(湖南科技大学生命科学学院,湖南湘潭411201 )
摘要:本文利用DNAStar和MEGA软件对水稻纤维素合成酶基因家族进行生物信息学分析。结果表明,水稻纤维素合成酶基因家族分为CesA(纤维素合成酶家族)和Csl(纤维素合成酶相似家族)两个家族,其中CesA有11个成员;Csl有34个成员,蛋白质序列对比和进化树分析表明,CesA家族可分3组,其中CesA7可以看出是第一组与第二组的过渡支。Csl家族可以分为6组。这些结果为纤维素合成酶基因家族成员的结构、功能分析和进化起源的探索提供了资料。
关键词:纤维素合成酶;基因家族;进化树;生物信息学;水稻
Bioinformatics analysis of cellulose synthase Gene family of rice
Major:Life Sciences
Author: Wu Zhao Director: Peng Xixu,
(School of Life Sciences of Hunan University of Science and Technology Xiangtan 411201,
Hunan)
Abstract :This article analyze the cellulose synthase gene family of rice by using the DNAStar and MEGA software, The results show that cellulose synthase gene family is formed by the cellulose synthase family which is make up of eleven members and the cellulose synthase-like family which including thirty-four members, By Protein sequence alignment and phylogenetic analysis,we know that the family of CesA can divided into three groups .the member CesA7 can be seen as the transition of the group one and group two ,The family of Csl can be divided into six groups, This results laiding a foundation on origin, evolution and function research of ccellulose synthase gene family.
Key words:cellulose synthase; gene family; evolution tree;Bioinformatics;rice
前言
纤维素是生物圈最丰富的有机质,占植物界碳素的50%以上,是植物的结构多糖,是它们的细胞壁主要成分。纤维素是线形葡萄糖,残疾通过β(1→4)糖苷键连接的纤维二糖可看成是它的二糖单位。它是在细胞质膜上的纤维素合成酶催化下合成的,此酶同时催化多条糖链的合成。自然界中每年可产生约1 800亿t纤维素。纤维素广泛分布于植物和大多数藻类中, 一些细菌、真菌甚至某些动物也能合成纤维素[1 ]。纤维素在造纸、纺织、食品、林业、生物能源等工农业生产领域中有着广泛的经济和商业价值, 这使得它一直成为人们研究的热点。纤维素的基本单位是吡喃式D2葡萄糖, 通过β(1, 4 )糖苷键相连[2 ]。虽然纤维素合酶基因首先在木醋杆菌(Acetobacter xylinum)中被发现[3~ 5 ], 但近年来随着人类对石油、煤炭的大量需求及石油价格的飞速增长, 对植物纤维素合酶基因及其蛋白的研究显得更有价值。要掌握纤维素合成酶基因的调控, 可以通过植物基因工程方式增加植物中的纤维素含量, 而同时相对减少木质素的含量[6], 这样可以充分减少由造纸工业带来的环境污染, 也可以更加充分地利用纤维素来造福于人类。同时增加纤维素含量以改善其品质, 将会培育更适于造纸的新型树种。
纤维素是在细胞质膜上的纤维素合成酶催化下合成的,对纤维素合成酶(cellulose synthase,CESA)的了解可以更使纤维素的人工合成更具效率。
所有的CESA与CSl (cellulose-synthase-like protein,纤维素合成酶相似蛋白)蛋白都具有跨膜蛋白的特征, 在N端与C端具2个或多个跨膜区域中, 其中间为亲水胞内区, 相似性比较结果表明了CESA与CSl蛋白之间最大的同源性出现在中间胞内区。有关研究结果表明, 高尔基体存在着大量的糖苷转移活性, 因此, 有许多研究者认为, 部分CSl蛋白可能位于高尔基体的膜上。植物CESA 蛋白含有一个植物特异保守区和一个超变区(HVR ) ,N端含有2个锌指区, 紧跟着HVR区, 这是植物CESA蛋白所特有的结构特征[7 ]。1999年,Delmer提出了一个纤维素合酶的三维结构模型, 即8 个跨膜结构域在细胞膜上形成一个“洞” , 正在合成的β(1→4)葡萄糖苷链经此“洞”到达细胞外形成细胞壁。N 2端形成的蛋白间互作结构域位于胞内, 可以结合各种催化活性所需的因子。纤维素合成酶基因的大小为315~515kb ,有9~13个内含子,转录的mRNA范围为310~315 kb ,编码的蛋白长约985~1088个氨基酸,序列同源性53 %~98 %。其内含子和外显子的边界区域是高度保守的,基因结构的差异主要在于内含子的多少。CESA基因家族目前有40多个基因。公共数据库里收集了来自40多个不同植物的1400 多个相关序列,新的序列还在不断增加。植物纤维素合酶是一个由36个单体组成的玫瑰状复合体,其单体主要由植物纤维素合酶(cellulose synthase, CesA)基因家族成员编码。近年来的研究证明CesA1,CesA3,CesA6在初生细胞壁的合成中起着不可替代的作用,CesA4,CesA7,CesA8与次生细胞壁的形成有直接的关系。而CesA2,CesA5,CesA9,CesA10的功能还不是很清楚。类纤维素合酶(cellulose-synthase-like protein, Csl蛋白)家族共分CslA、CslF、CslC、CslD、CslE和CslH等6个家族。Csl基因家族功能还处于探索阶段,目前只有少数的报道。有研究表明Csl基因与半纤维素的合成有关;有文献指出在旱金莲花(Tropaeolum)中发现Csl与I 型初生细胞壁的半纤维素主要成分xyloglucan(XyG)的-1,4-glucan骨架合成有关,该基因与拟南芥CslC4高度同源。而Burton等报道水稻CslF基因家族与细胞物细胞壁形成和生长发育中的重要作用,但绝大多数的Csl基因功能有待进一步研究。近年来,科学家采用了ESTs(Expressed Sequence tags),cDNA微阵列,反向遗传学等技术手段,在拟南芥纤维素合酶基因的的定位、表达和功能的研究上取得了一定的进展,而在探索纤维素的合成对外界环境胁迫的反应方面研究较少。
因为纤维素合酶(CesA)多基因现象的存在, 所以它与存在的大量纤维素合酶相似蛋白(Csl)