生物信息学实验报告3(三)蛋白质序列分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
⽣物信息学实验报告3(三)蛋⽩质序列分析
(三)蛋⽩质序列分析
实验⽬的:掌握蛋⽩质序列检索的操作⽅法,熟悉蛋⽩质基本性质分析,了解蛋⽩质结构分析和预测。
实验内容:
1、检索SOX-21蛋⽩质序列,利⽤ProParam⼯具进⾏蛋⽩质的氨基酸组成、分⼦质量、等电点、氨基酸组成、原⼦总数及疏⽔性(ProtScale⼯具)等理化性质的分析。
2、利⽤PredictProtein、PROF、HNN等软件预测分析蛋⽩质的⼆级结构;利⽤Scan Prosite软件对蛋⽩质进⾏结构域分析。
3、利⽤TMHMM、TMPRED、SOSUI等⼯具对蛋⽩质进⾏跨膜分析;采⽤PredictNLS进⾏核定位信号分析;利⽤PSORT进⾏蛋⽩质的亚细胞定位预测;利⽤
CBS(http://www.cbs.dtu.dk/services/ProtFun/)⽹站⼯具预测蛋⽩的功能,将序列⽤Blocks、SMART、InterProScan、PFSCAN等搜索其保守序列的特征,进⾏motif 的结构分析。
4、利⽤Swiss-Model数据库软件预测该蛋⽩的三级结构,结果⽤蛋⽩质三维图象软件Jmol查看。
CPHmodels 也是利⽤神经⽹络进⾏同源模建预测蛋⽩质结构的⽅法和⽹络服务器I-TASSER预测所选蛋⽩质的空间结构。
5、分析蛋⽩质的翻译后修饰:分析信号肽及其剪切位点: SignalIP http://www.cbs.dtu.dk/services/SignalP/;分析糖链连接点:分析O-连接糖蛋⽩,
NetOGlyc,http://www.cbs.dtu.dk/services/NetOGlyc/;分析N-连接糖蛋⽩,NetNGlyc,http://www.cbs.dtu.dk/services/NetNGlyc/。
6、利⽤检索的序列,进⾏同源⽐对,获得并分析⽐对结果。
实验步骤
(⼀)
1、在NCBI 蛋⽩质数据库中查找SOX-21蛋⽩质序列分别选择⽖蟾(Xenopus laevis)、⼩家⿏[Mus musculus]、猕猴[Macaca mulatt a]的SOX-21蛋⽩质序列,并保存其FASTA格式。
2、利⽤ProParam⼯具对SOX-21蛋⽩质序列进⾏理化性质的分⼦。
3、利⽤PredictProtein、PROF、HNN等软件预测分析蛋⽩质的⼆级结构;利⽤Scan Prosite软件对蛋⽩质进⾏结构域分析。
4、利⽤TMHMM、TMPRED、SOSUI等⼯具对蛋⽩质进⾏跨膜分析;采⽤
PredictNLS进⾏核定位信号分析;利⽤PSORT进⾏蛋⽩质的亚细胞定位预测;利⽤CBS(http://www.cbs.dtu.dk/services/ProtFun/)⽹站⼯具预测蛋⽩的功能,将序列⽤Blocks、SMART、InterProScan、PFSCAN等搜索其保守序列的特征,进⾏motif 的结构分析。
5、利⽤Swiss-Model数据库软件预测该蛋⽩的三级结构,结果⽤蛋⽩质三维图象软件Jmol查看。
CPHmodels 也是利⽤神经⽹络进⾏同源模建预测蛋⽩质结构的⽅法和⽹络服务器I-TASSER预测所选蛋⽩质的空间结构。
6、分析蛋⽩质的翻译后修饰:分析信号肽及其剪切位点: SignalIP http://www.cbs.dtu.dk/services/SignalP/;分析糖链连接点:分析O-连接糖蛋⽩,
NetOGlyc,http://www.cbs.dtu.dk/services/NetOGlyc/;分析N-连接糖蛋⽩,NetNGlyc,http://www.cbs.dtu.dk/services/NetNGlyc/。
7、利⽤检索的序列,进⾏同源⽐对,获得并分析⽐对结果。
实验结果
1、>gi|288557317|ref|NP_001165684.1| transcription factor Sox-21 [Xenopus laevis] MSKPLDHVKRPMNAFMVWSRAQRRKMAQENPKMHNSEISKRLGAEWKLLTEAEKRPFI DEAKRLRAMHMKDHPDYKYRPRRKPKTLLKKDKFAFPMPYSLTGDHDGLKA VSLHGAG VLTDALLCHPEKAAAAAAAAAARVFFQPSAAAAAAAAAAASGSSTNPYSLFDLSSKMAE MTHSSSSIPYTSSIGYPQSSGGAFAGVTGGGHTHSHPSPGNPGYMIPCNCTGWPSPGLQPPL AYILFPGMGKPQLEPYPAAAY AAAL
>gi|29244252|ref|NP_808421.1| transcription factor SOX-21 [Mus musculus] MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHNSEISKRLGAEWKLLTESEKRPFI DEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFPVPYGLGSV ADAEHPALKAGAG LHAGAGGGLVPESLLANPEKAAAAAAAAAARVFFPQSAAAAAAAAAAAAAGSPYSLLD LGSKMAEISSSSSGLPYASSLGYPTAGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGNPG YMIPCNCSAWPSPGLQPPLAYILLPGMGKPQLDPYPAAY AAAL
>gi|302565644|ref|NP_001180661.1| transcription factor SOX-21 [Macaca mulatta] MSKPVDHVKRPMNAFMVWSRAQRRKMAQENPKMHNSEISKRLGAEWKLLTESEKRPFI DEAKRLRAMHMKEHPDYKYRPRRKPKTLLKKDKFAFPVPYGLGGV ADAEHPALKAGAG LHAGAGGGLVPESLLANPEKAAAAAAAAAARVFFPQSAAAAAAAAAAAAAGSPYSLLD LGSKMAEISSSSSGLPYASSLGYPTAGAGAFHGAAAAAAAAAAAAGGHTHSHPSPGNPG YMIPCNCSAWPSPGLQPPLAYILLPGMGKPQLDPYPAAYAAAL
2、1~6步骤已经在练习题中做类似分析
3、利⽤BLAST在线⼯具对⽖蟾(Xenopus laevis)、⼩家⿏[Mus musculus]、猕猴[Macaca mulatt a]的SOX-21蛋⽩质序列进⾏序列同源⽐对。
其中⽖蟾与⼩家⿏、猕猴的相似性均为74%,E值分别为6e-119、2e-119。
⽽⼩家⿏SOX-21蛋⽩质序列与猕猴的序列的相似性⾼达99%,E值为0。
说明⼩家⿏与猕猴的同源的可能性远⾼于⼩家⿏与⽖蟾。