毛果杨PP2C基因家族生物信息学分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

毛果杨PP2C基因家族生物信息学分析

摘要:蛋白磷酸酯酶2C(PP2C)是蛋白磷酸酯酶中的一大类,广泛参与逆境信号的传递过程。本实验采用比较基因组学的方法,利用已知的拟南芥PP2C蛋白序列为检索序列,在全基因组水平上搜索毛果杨的PP2C基因的同源序列。最终确定了毛果杨45个PP2C候选基因。对同源序列作进一步的多序列联配、ESTs、MEME和系统发生表达分析。

关键词:毛果杨比较基因组学基因家族

Abstract: Protein phosphatase 2C (PP2C) is a protein phosphatase in a large class, the broad participation of adversity signal transmission process. In this study, we searched the homologous sequence from Populus trichocarpa protein database based on the complete genome by using comparative genomics methods and taking the Arabidopsis thaliana PP2C protein which has been isolated as the retrieval sequence. The results showed that 45 PP2C-like protein were identified from Populus trichocarpa. Further, we also analyzed the sequence alignment, MEME, EST and phylogenetic.

Keywords: Populus trichocarpa comparative genomics genne family

真核生物基因组中,编码蛋白磷脂酶的基因远远少于蛋白激酶,一般只有蛋白激酶基因数的四分之一至三分之一。在过去的研究中,蛋白质可逆磷酸化研究的重点主要针对蛋白激酶,不过,现在越来越多的研究显示,在信号转导中,蛋白磷酸酶和蛋白激酶同样重要[1]。

根据底物蛋白分子上去磷酸化的氨基酸残基的种类,PP主要分为三个家族:酪氨酸蛋白磷酸酶(protein tyrosine phosphatases, PTPs)、丝氨酸蛋白磷酸酶(protein serine phosphatases, PPPs)和双特异性蛋白磷酸酶(dual specificity phosphatases, PSPs)。根据酶对底物选择的特异性和对抑制剂的敏感程度,PPPs分为PP1和PP2。根据亚基的结构、二价离子的依赖性和底物特异性,PP2又可进一步分为PP2A、PP2B和PP2C[2]。大量研究表明,PP2A在进化过程中,高度保守且广泛表达。PP2B是由催化亚基A和调节亚基B构成的二聚体,也是唯一受Ca2+/CaM调节的丝氨酸蛋白磷酸酶,在介导Ca2+信号到细胞应答中发挥了重要作用。在所有PSPs的亚类中,只有PP2C没有调控亚基,是一种单体蛋白磷酸酶,活性依赖于Mg2+或Mn2+[4]。PP2C与其他类型的PPP类蛋白磷酸酶相比,没有较明显的氨基酸序列同源性,但是蛋白质三维结构的相似性却揭示这些蛋白磷酸酶可能拥有相似的催化机制或相同的催化底物。PP2C类蛋白磷酸酶的一个重要的结构特征是在其催化区域内含有11个保守的结构亚区[3]。与哺乳动物PP2Cs相比,植物PP2Cs具有独特的结构模式,即植物中多数PP2C类磷酸酶C端具有保守的催化区域,而N端却是保守性不强、长度不一的延伸区域,在这些延伸区域内,含有与胞内信号相关的序列包括跨膜区域和激酶互作区域等,从而赋予了PP2C 不同的功能[1]。

蛋白磷酸酶结构的复杂性是功能广泛性的基础。随着植物中越来越多的蛋白磷酸酶基因及其相关蛋白的分离、纯化与鉴定,以及基因特性与生理生化的深入研究,其众多的功能也陆续的被确定。迄今为止,蛋白磷酸酶已经被证实与植物的生长发育、信号转导、细胞周期、渗透胁迫以及活性氧胁迫等各种抗逆性反应相关联。如今,毛果杨的全基因组测序已经完成,数据库Populus trichocarpa v1.1(/Poptrl_1/Poptrl_1.home.html)公布了全部序列。此后,在第一测序的基础上,进行了第二次补充测序。毛果杨全基因组最新数据已经包含在数据库Phytozome v7.0(/poplar)。本实验运用生物信息学

方法对毛果杨的PP2C基因家族进行了初步分析鉴定[5]。

1 材料与方法

1.1数据库的搜索

根据拟南芥只已分离出的PP2C基因及其编码的蛋白质序列,在NCBI(美国国立生物技术信息中心,National Center for Biotechnology Information, /)中通过blastp检索毛果杨无荣誉蛋白质数据库,E≤10-26的序列被认为是候选蛋白。利用Blastn 程序将获得的候选蛋白与拟南芥的PP2C基因作进一步的匹配,采用默认参数,取E≤10-10的击中项为最终的候选蛋白,由相应的程序和索引文件提取所有符合条件的蛋白序列,构建列表。最后,从相应的数据库中下载最终确认的候选蛋白所对应的CDS序列[5]。

1.2序列联配分析与系统发生树的构建

利用Clustal W软件对搜索到的蛋白质序列进行多序列联配分析。以序列联配结果为基础,用MEGA3.1软件生成毛果杨PP2C蛋白的系统发生树。进化树的生成采用邻接法(Neighbor-joining method)。具体参数设置Test of Phylogeny: Bootstrap method; Replications: 1000; Method: Poisson model; Gaps: Pairwise deletion; Rates among Sites: Uniform rates。其它为默认参数[7]。

1.3 PP2C的motif分析

毛果杨PP2C类型基因的预测motif分析通过MEME (/meme/cgi-bin/meme.cgi)在线分析[14]。

1.4 PP2C的EST分析

毛果杨PP2C基因家族的EST分析是通过NCBI,在Expressed sequence tags(EST)数据库中进行核苷酸比对,统计比对结果的组织类型的信息,进而与预测每个基因在不同组织类型中的表达情况。

相关文档
最新文档