生物信息学分析实例

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

ORF预测的可靠性检验

设计引物:Primer Premier 5.0

评估引物质量:Oligo 6.65 或Oligonucleotide Properties Calculator

NCBI的BLAST 2 SEQUENCES程序

/blast/bl2seq/wblast2.cgi

核苷酸序列=>氨基酸序列

制作密码子用法表

蛋白质理化性质分析

在线分析

ExPasy服务器上的ProtParam

/tools/protparam.html

生物学软件

BioEdit-氨基酸成分

Seqtools-亲、疏水性残基,蛋白溶解度

蛋白质功能性区域分析

疏水性分析

在线的ProtScale 程序

/cgi-bin/protscale.pl

使用生物学软件BioEdit7.05

采用Kyte-Doolittle的TGRESE算法

调整计算窗口大小n=9

附:该参数用于估计每种氨基酸残基的平均显示尺度,有助于对数据进行平滑。

跨膜区分析

在线分析

TMHMM Server v. 2.0

http://www.cbs.dtu.dk/services/TMHMM/

TMpred

/software/TMPRED_form.html

TMP

http://www.mbb.ki.se/tmap/

信号肽预测

SignalP 3.0 Server

几种人工神经网络法的组合

G+、G-、真核生物为训练集

http://www.cbs.dtu.dk/services/SignalP/

卷曲螺旋是控制蛋白质寡聚化的元件

/software/COILS_form.html

亮氨酸拉链结构:亲脂性的α螺旋,包含有许多集中在螺旋一边的疏水氨基酸,两条多肽链以此形成二聚体。每隔6个残基出现一个亮氨酸。由赖氨酸(Lys)和精氨酸(Arg)组成DNA结合区。

Domain分析

结构域是蛋白序列的功能、结构和进化单元,由50-300个氨基酸组成,有独特的空间构象。

类型:全平行结构域、反平行结构域、α+β结构域、α/β结构域及他折叠类型

EMBL的SMART服务器

http://smart.embl-heidelberg.de/

提交序列后=>系统每隔10秒刷新一次=>结果

模体(Motif)搜索

PROSITE数据库

确定新的蛋白质序列是否属于已知家族

N-糖基化位点的模式(Pattern):N[^P][ST][^P]

其中^P表示除Pro外的任意氨基酸

缺点:数量与质量上存在问题

/prosite/

Profile数据库

基于最佳的多重比对质量(包括人工校正)

优点:确保重要信息不被遗漏

http://myhits.isb-sib.ch/cgi-bin/motif_scan

蛋白质二级结构预测

蛋白质二级结构是指α螺旋、β折叠、无规则卷曲(Coils)等元件

预测方法:

基于统计的预测方法,如Chou-Fasman法、人工神经网络法等

基于知识的预测方法:Lim方法、Cohen方法

混合方法:选择性合并以上提到的各种方法

预测准确率:>70%,其中PHD神经网络预测的平均准确度及最佳残基的准确率分别高达72%和90%

二级结构预测的标准:PHD

/

同源模建

原理:比较模建,利用已知结构的同源蛋白建立目的蛋白的结构模型,再用理论计算方法进化优化,最终得到合理的3D模型。

关键:模板的选择

适用:同源性>30%的同源蛋白质

步骤:(6步曲)

目的序列与模板序列的匹配;

根据多重比对结果确定同源蛋白质的保守区及相应的框架结构;

目的蛋白质结构保守区的主链模建;

目标蛋白质结构变异区的主链模建;

侧链的安装和优化;

优化和评估模建的结构

系统发育分析

NJ法-邻接法:

特点:NJ法是基于最小进化原理经常被使用的一种算法,它构建的树相对准确,假设少,计算速度快,只得一颗树。

缺点:序列上的所有位点等同对待,且所分析的序列的进化距离不能太大

适用:进化距离不大,信息位点少的短序列

MP法-最大简约法

特点:基于进化过程中碱基替代数目最少这一假说

缺点:推测的树不是唯一的,变异大的序列会出现长枝吸引而导致建树错误。

适用:序列残基差别小,具有近似变异率,包含信息位点比较多的长序列

ML法-最大似然法

原理:考虑到每个位点出现的残基的似然值,将每个位置所有可能出现的残基替换概率进行累加,产生特定位点的似然值。ML法对所有可能的系统发育树都计算似然函数,似然函数值最大的那颗树即最可能的系统发育树

优点:在进化模型确定的情况下,ML法是与进化事实吻合最好的建树算法

缺点:计算强大非常大,极为耗时

建树相关软件:

PAUP-/

PHLIP-/phylip.html

MEGA-

TreePuzzle-http://www.nsc.liu.se/software/biology/puzzle5/

TreeView-/rod/treeview.html

MEGA用法: [生信相关]

PHYLIP3.65界面

PHYLIP建树的子程序:

Dnapars-核苷酸序列最大简约法

Protpars-蛋白质序列最大简约法

相关文档
最新文档