生物信息学论文汇总
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生命科学技术学院
专业:生物科学
班级:2013级
老师:高亚梅
学生:王秉政
学号:20134083038
GH75及米曲霉GH76-5基因生物信息学分析
2013级生物科学专业,黑龙江省,大庆市)
GH75和米曲霉GH76-5基因及其编码蛋白质的结构和特征。方法:利
NCBI、CBS和ExPASy网站中的各种信息分析工具,并结合VectorNTIsuite8.0生物信息分析软件包,分析
GH75和米曲霉GH76-5基因并预测该基因编码蛋白结构的特征和功能。结果:GH75基因全长
编码区具有57个氨基酸,在GenBank同源序列中,其与
An04c0140, genomic contig
100%,且有GH75保守域。GH75蛋白相对分子量预测为26257.2,理论等电
4.69。预测GH75编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是11.07%、25.41%、63.52%,
个GTPase结构域。GH75蛋白为亲水蛋白,有跨膜区,有信号肽。GH76-5基因全长309bp,编码区具有
个氨基酸,在GenBank同源序列中,其与
An14c0130, genomic contig基因氨基酸序
100%,且有GH76-5保守域。GH76-5蛋白相对分子量预测为46029.3,理论等电点为5.28。
GH76-5编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是26.90%、20.71%、52.38%,2个
结构域。GH76-5蛋白为疏水蛋白,无跨膜区,无信号肽。结论:成功预测GH75和GH76-5基因及
GH75);糖基水解酶家族(GH76-5)生物信息学
黑曲霉是一种重要工业微生物,在酶制剂、异源蛋白、有机酸等领域应用广泛。2007年黑曲霉基因组
,各种组学数据如雨后春笋般涌现,人们对黑曲霉高效生产机制的
;与此同时,黑曲霉遗传操作系统也不断成熟,为系统地研究和改造黑曲霉、将黑
1000多年。米曲霉是理想的生产大肠杆菌不能表达的真核生物活性蛋
米曲霉基因组所包含的信息可以用来寻找最适合米曲霉发酵的条件,这将有助于提高食品酿造
资料
ExPASy 数据库的UniProtKB(或/uniprot)获得黑曲霉的GH75
GH76-5基因序列。GH75基因编号为
,NCBI的登录号为XM_001401782.1. ,其他物
GH75的氨基酸序列均来自Genbank,登录号见图1。GH76-5基因编号为
,NCBI的登录号
,其他物种的GH76-5的氨基酸序列均来自Genbank,登录号见图2。
方法
用美国国家生物技术信息中心(NCBI,)的基本局部比对搜索工具
BLAST,/blast/),运用Blastx完成基因同源性分析。
ORF finder(/gorf/orfig.cgi)寻找其开放读码框,并推导出可编码蛋白
/Structure/cdd/wrpsb.cgi)分析预测其保守域。
ExPASy,)所提供的蛋白组学和分
Protparam程序分析GH75及GH76-5蛋白氨基酸组成、相对分
子质量、等电点等基本理化性质;
程序预测GH75及GH76-5的跨膜区;Proscale程序分析GH75及GH76-5的蛋白性质;SignalP程
GH75及GH76-5蛋白的信号肽,GOR超链接分析GH75及GH76-5的二级结构,SWISS-MODEL通过
SMART(http://smart.embl-heidelberg.de/)分析预测其结构域。
基因序列的分析
分析结果表明,GH75与多个物种的GH5基因同源,其中与
niger contig An04c0140,
的同源性最高,一致性达100%,相似度达99%(图1)。ORF Finder获得其开放阅读框编码
174bp,编码区为2-174bp,编码57个氨基酸,无起始密码子,终止密码子TAA,
3)。CCD分析发现有GH75保守域。
分析结果表明,GH76-5与多个物种的GH6基因同源,其中与
An14c0130,
的同源性最高,一致性达100%,相似性达100%(图2)。ORF Finder获得其开放阅读框编
该基因全长309bp,编码区为1-308bp,编码102个氨基酸,无起始密码子,终止密码子TGA,
4)。CCD分析发现有GH76-5保守域。
编码蛋白的特征分析
蛋白质的基本参数
蛋白相对分子量预测为26257.2,理论等电点为4.69,脂肪系数为75.94。在溶液中的不稳定系图3 ORF Finder 图1 BLASTx 图2 BLASTx 图4 ORF Finder
25.26,为稳定蛋白。当蛋氨酸在N端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均30
20小时,在大肠杆菌(体内)中,大于10小时。氨基酸的组合物
5),原子组成(图6)。带负电荷的残基总数13,带正电荷的残基总数27。当蛋白浓度为1g/L,所
ABS)为1.629,在水中280nm摩尔消光指数为42775;
ABS)则为 1.615,在水溶液中280nm摩尔消光指数
42400。总的亲水性平均疏水性指数(grand average of hydropathieity)为-0.204,预测为亲水蛋白。
蛋白相对分子量预测为46029.3,理论等电点为5.28,脂肪系数为64.67。在溶液中的不稳定
27.19,为稳定蛋白。当蛋氨酸在N端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均
小时,在酵母(体内)中,半衰期大于20小时,在大肠杆菌(体内)中,大于10小时。氨基酸的组
(图7),原子组成(图8)。带负电荷的残基总数33,带正电荷的残基总数42。当蛋白浓度为1g/L,
ABS)为 1.970,在水中280nm摩尔消光指数为90675;
ABS)则为1.962,在水溶液中280nm摩尔消光指数
90300。总的亲水性平均疏水性指数(grand average of hydropathieity)为-0.323,预测为亲水蛋白。
2.2.2疏水性分析、跨膜区分析
预测GH75蛋白,提示有跨膜区,位于膜内(图9)。Proscale分析疏水性,结果也提示GH75
10)。SignalP分析提示GH75有信号肽(图11)。
预测GH76-5蛋白,提示无跨膜区,位于膜外(图12)。Proscale分析疏水性,结果也提示
为疏水蛋白(图13)。SignalP分析提示GH76-5无信号肽(图14)。
图5 氨基酸
组合物物 图6 原子组成 图7氨基酸组合图8 原子组成
9TMHMM
图10Proscale 图11 SignalP 图13 Proscale
14 SignalP 图12 TMHMM
二三级结构与结构域
预测可能存在1个小GTPase结构域(图15),GOR预测GH75编码蛋白二级结构中螺旋(H)、
(E)、无规则卷(L)的比例分别为11.07%、25.41%、63.52%,以无规则卷为主(图16)。SWISS-MODEL
GH75三维结构,应用vector NTI suite 软件包D molecule viewer显示蛋白质三维结构(图17)。
预测可能存在2个小GTPase结构域(图18),GOR预测GH76-5编码蛋白二级结构中螺旋(H)、
(E)、无规则卷(L)的比例分别为26.90%、20.71%、52.38%,以无规则卷为主(图19)。SWISS-MODEL
GH76-5三维结构,应用vector NTI suite 软件包D molecule viewer显示蛋白质三维结构(图20)。
15 SMART
16 GOR
图17 D molecule viewer
20 D molecule viewer
18 SMART
19 GOR
GH75基因全长174bp,编码区具有57个氨基酸,在GenBank同源序列中,其与
niger contig
基因氨基酸序列一致性达到100%,且有GH75保守域。GH75蛋白相对分子量预
26257.2,理论等电点为4.69。预测GH75编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别
11.07%、25.41%、63.52%,1个GTPase结构域。GH75蛋白为亲水蛋白,有跨膜区,有信号肽。GH76-5
309bp,编码区具有102个氨基酸,在GenBank同源序列中,其与
An14c0130,
contig基因氨基酸序列一致性达到100%,且有GH76-5保守域。GH76-5蛋白相对分子量预测为
,理论等电点为5.28。预测GH76-5编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是
、20.71%、52.38%,2个GTPase结构域。GH76-5蛋白为疏水蛋白,无跨膜区,无信号肽。结论:
GH75和GH76-5基因及其编码蛋白生化及其结构特征,为下一步对其进行克隆和表达奠定基础。
,对环境友好,潜力巨大的可再生资源,通过生物方法对纤维素进行降
,纤维素酶的使用占成本的比
,也是木质纤维素大规模利用的主要瓶颈之一,因此需要快速、高效地筛选纤维素酶特别是来自极端
,以寻求酶活高,热稳定性好,能适应极端pH环境的纤维素酶。纤维素酶是多组分酶,包
,外切葡聚糖酶和β-葡萄糖苷酶,纤维素的水解是这三个组分协同作用的结果。其中内切葡
,之后对来源于真菌和细菌的内切葡聚糖酶进行了深入的研
,且发现内切葡聚糖酶多数来源于细菌。内切葡聚糖酶(EC 3. 2.1.4)又称为接甲基纤维素酶、Q酶等,分子
23-146 kDa之间。内切葡聚糖酶主要作用于纤维素的非结晶区,随机水解卩-1,4-糖苷键,将长链的
,对纤维素的整体降解起到了重要作用.所以利用基因工程的方法,通过内切葡聚糖酶与外切葡
,可以有效地降解结晶纤维素
在纤维素酶系中,内切葡聚糖酶作为首先
,也是典型的模块化酶。纤
(CBM)通过增加纤维素酶在底物表面的浓度,进而提高酶的活性。
,纤维素酶得到了广泛的认识和挖掘,也受到很多行业的关注。纤维素酶的用途非
,在食品发酵、动物饲料、造纸业、洗涤工业、制药业和污染处理等各个领域均有应用。此外,内切
,啤酒过滤,石油幵采,洗漆剂工业,改善烘焙产品和动物词料的营养质量方面,扮演
根据纤维素酶的作用效果,其应用可以分为两类:一,降解植物细胞壁中的纤维素,释放细
;二,水解纤维素产生葡萄糖。比较成功的例子是纤维素酶在洗潘剂工
,R本将碱性的纤维素酶加入洗涤剂中制成了高效洗洚粉剂,获得了巨大的经济效益。近几年来,
,纤维素酶作为被添加到饲料添加剂中以提高动物对饲料的利用率,纤维素酶对草料和青贮的预
,作用效果明显。而在生物质能的开发利用中,用纤维素酶降解
,已得到了广泛的认可,但由于纤维素酶的使用成本较高,还有待
郭艳梅; 郑平; 孙际宾.黑曲霉作为细胞工厂:知识准备与技术基础, 2010.10.010
赵龙飞,徐亚军.米曲霉的应用研究进展.
, 2006(3):8-10
. 内切葡聚糖酶的酶库构建和酶学特性研究[D].华东理工大学,2013.
乔宇,毛爰军,何永志.里氏木霉内切p-葡聚糖酶II基因在毕赤酵母中的表达及酶学性质研究.菌物学
.2004, 23(3): 388-396
NJ, Beever DE,Owen E,Nerinckx W, Claeyssens M, Van Beeumen J, Bhat MK. Biochemical
王亮,尚会建,杨立彦,郑学明.纤维素酶的应用研究进展.河北工业科技.2010,27(6):441-443
. 内切葡聚糖酶的酶库构建和酶学特性研究[D].华东理工大学,2013.