生物信息学论文完结版

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生物信息学论文

学院:生命科学技术学院

专业:生物科学

班级:2013级

老师:***

学生:蔡欣月

学号:***********

链孢霉GH5-1及GH6-3基因生物信息学分析蔡欣月(黑龙江八一农垦大学,生命科学技术学院,2013级生物科学专业,黑龙江省,大庆市)

【摘要】目的:分析和预测链孢霉菌GH5-1和GH6-3基因及其编码蛋白质的结构和特征。方法:利用NCBI、CBS和ExPASy网站中的各种信息分析工具,并结合VectorNTIsuite8.0生物信息分析软件包,分析预测链孢霉菌GH5-1和GH6-3基因并预测该基因编码蛋白结构的特征和功能。结果:GH5-1基因全长2006bp,编码区具有390个氨基酸,在GenBank同源序列中,其与endoglucanase 3 [Neurospora crassa OR74A]基因氨基酸序列一致性达到100%,且有GH5-1保守域。GH5-1蛋白相对分子量预测为41907.4,理论等电点为5.14。预测GH5-1编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是16.92%、33.85%、49.23%,2个GTPase结构域。GH5-1蛋白为亲水蛋白,无跨膜区,有信号肽。GH6-3基因全长1914bp,编码区具有419个氨基酸,在GenBank同源序列中,其与exoglucanase 3 [Neurospora crassa OR74A]基因氨基酸序列一致性达到100%,且有GH6-3保守域。GH6-3蛋白相对分子量预测为44839.3,理论等电点为6.51。预测GH6-3编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是29.59%、16.71%、53.75%,1个GTPase结构域。GH6-3蛋白为亲水蛋白,有跨膜区,无信号肽。结论:成功预测GH5-1和GH6-3基因及其编码蛋白生化及其结构特征,为下一步对其进行克隆和表达奠定基础。

【关键词】链孢霉菌;糖基水解酶家族5(GH5-1);糖基水解酶家族6(GH6-3)生物信息学

链孢霉菌又称脉孢菌、串珠菌、红色面包菌,俗称红霉菌,是食用菌生产中重要的竞争性杂菌之一。其广泛分布在自然界土壤中和和禾本科植物上,尤其在玉米芯上极易发生[1]。通过空气、土壤、腐烂植物、谷物等进行传播、在食用菌生产中,链孢菌和绿菌是生产中最常见的病原菌。链孢霉在高温高湿条件下最易发生,是夏季食用菌生产中危害严重的病原菌,该病原菌生活力强、生长迅速、繁殖快、分生孢子多、易传播,几乎会感染所有熟料栽培的食用菌,并且一旦感染很难彻底消灭,给生产造成较大的经济损失,严重危害所有食用菌的母种、原种、栽培种,以及香菇、木耳、银耳、银耳、灵芝等熟料菌简[2]。目前链孢霉菌的全基因组序列已经获得,但有关其蛋白和基因的各类研究仍为数较少,本文通过对链孢霉GH5-1和GH6-3基因及编码蛋白质进行生物信息学分析,分析其基本生化及结构特征,为下一步对其进行克隆表达和应用奠定基础。

一、材料与方法

1.1材料

通过ExPASy 数据库的UniProtKB(或/uniprot)获得链孢霉菌的GH5-1与GH6-3基因序列。GH5-1基因编号为NCU00762,NCBI的登录号为XM_959066.2,其他物种的GH5-1的氨基酸序列均来自Genbank,登录号见表1。GH6-3基因编号为NCU09680,NCBI的登录号为XM_952322.2,其他物种的GH6-3的氨基酸序列均来自Genbank,登录号见表2。

1.2方法

利用美国国家生物技术信息中心(NCBI,)的基本局部比对搜索工具(BLAST,/blast/),运用Blastx完成基因同源性分析。

应用ORF finder(/gorf/orfig.cgi)寻找其开放读码框,并推导出可编码蛋白序列。

利用保守结构域(/Structure/cdd/wrpsb.cgi)分析预测其保守域。

通过瑞士生物信息学研究所的蛋白分析专家系统(ExPASy,)所提供的蛋白组学和分析工具:Protparam、Proscale程序分析GH5-1及GH6-3蛋白氨基酸组成、相对分子质量、等电点等基本理化性质;TMHMM程序预测GH5-1及GH6-3的跨膜区;SignalP程序预测GH5-1及GH6-3蛋白的信号肽,

GOR超链接分析GH5-1及GH6-3的二级结构,SWISS-MODEL通过二级结构比对和折叠,模拟蛋白质的空间构象。

利用SMART(http://smart.embl-heidelberg.de/)分析预测其结构域。

二、结果

2.1GH5-1及GH6-3基因序列的分析

BLASTx分析结果表明,GH5-1与多个物种的GH5基因同源,其中与endoglucanase 3 [Neurospora crassa OR74A]的同源性最高,一致性达100%,相似度达58%(图1)。ORF Finder获得其开放阅读框编码氨基酸序列,该基因全长2006bp,编码区为678̴—1850bp,编码390个氨基酸,起始密码子ATG,终止密码子TAA (图2)。CCD分析发现有GH5-1保守域。

图1 GH5-1基因BLASTx同源性分析

图2 GH5-1基因开放阅读框分析

BLASTx分析结果表明,GH6-3与多个物种的GH6基因同源,其中与exoglucanase 3 [Neurospora crassa OR74A]的同源性最高,一致性达100%,相似性达65%(图3)。ORF Finder获得其开放阅读框编码氨基酸序列,该基因全长1914bp,编码区为22—1281bp,编码419个氨基酸,起始密码子ATG,终止密码子TAA (图4)。CCD分析发现有GH6-3保守域。

图3 GH6-3基因BLASTx同源性分析

图4 GH6-3基因开放阅读框分析

2.2GH5-1及GH6-3编码蛋白的特征分析

2.2.1蛋白质的基本参数

GH5-1蛋白相对分子量预测为41907.4,理论等电点为5.14,脂肪系数为65.90。在溶液中的不稳定系数是19.02,为稳定蛋白。当蛋氨酸在N端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均30小时,在酵母(体内)中,半衰期大于20小时,在大肠杆菌(体内)中,大于10小时。氨基酸的组合物(图5),原子组成(图6)。带负电荷的残基总数28,带正电荷的残基总数22。当蛋白浓度为1g/L,所有的半胱氨酸残基形成半胱氨酸时,吸光指数(ABS)为2.653,在水中280nm摩尔消光指数为111185;所有的半胱氨酸残基不形成半胱氨酸时,吸光指数(ABS)则为2.644,在水溶液中280nm摩尔消光指数为110810。总的亲水性平均疏水性指数(grand average of hydropathieity)为-0.192,预测为亲水蛋白。

图6 GH5-1基因原子组成

图5 GH5-1基因的氨基酸组成

相关文档
最新文档