生物信息学分析实例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ORF预测的可靠性检验
设计引物:Primer Premier 5.0
评估引物质量:Oligo 6.65 或Oligonucleotide Properties Calculator
NCBI的BLAST 2 SEQUENCES程序
/blast/bl2seq/wblast2.cgi
核苷酸序列=>氨基酸序列
制作密码子用法表
蛋白质理化性质分析
在线分析
ExPasy服务器上的ProtParam
/tools/protparam.html
生物学软件
BioEdit-氨基酸成分
Seqtools-亲、疏水性残基,蛋白溶解度
蛋白质功能性区域分析
疏水性分析
在线的ProtScale 程序
/cgi-bin/protscale.pl
使用生物学软件BioEdit7.05
采用Kyte-Doolittle的TGRESE算法
调整计算窗口大小n=9
附:该参数用于估计每种氨基酸残基的平均显示尺度,有助于对数据进行平滑。
跨膜区分析
在线分析
TMHMM Server v. 2.0
http://www.cbs.dtu.dk/services/TMHMM/
TMpred
/software/TMPRED_form.html
TMP
http://www.mbb.ki.se/tmap/
信号肽预测
SignalP 3.0 Server
几种人工神经网络法的组合
G+、G-、真核生物为训练集
http://www.cbs.dtu.dk/services/SignalP/
卷曲螺旋是控制蛋白质寡聚化的元件
/software/COILS_form.html
亮氨酸拉链结构:亲脂性的α螺旋,包含有许多集中在螺旋一边的疏水氨基酸,两条多肽链以此形成二聚体。每隔6个残基出现一个亮氨酸。由赖氨酸(Lys)和精氨酸(Arg)组成DNA结合区。
Domain分析
结构域是蛋白序列的功能、结构和进化单元,由50-300个氨基酸组成,有独特的空间构象。
类型:全平行结构域、反平行结构域、α+β结构域、α/β结构域及他折叠类型
EMBL的SMART服务器
http://smart.embl-heidelberg.de/
提交序列后=>系统每隔10秒刷新一次=>结果
模体(Motif)搜索
PROSITE数据库
确定新的蛋白质序列是否属于已知家族
N-糖基化位点的模式(Pattern):N[^P][ST][^P]
其中^P表示除Pro外的任意氨基酸
缺点:数量与质量上存在问题
/prosite/
Profile数据库
基于最佳的多重比对质量(包括人工校正)
优点:确保重要信息不被遗漏
http://myhits.isb-sib.ch/cgi-bin/motif_scan
蛋白质二级结构预测
蛋白质二级结构是指α螺旋、β折叠、无规则卷曲(Coils)等元件
预测方法:
基于统计的预测方法,如Chou-Fasman法、人工神经网络法等
基于知识的预测方法:Lim方法、Cohen方法
混合方法:选择性合并以上提到的各种方法
预测准确率:>70%,其中PHD神经网络预测的平均准确度及最佳残基的准确率分别高达72%和90%
二级结构预测的标准:PHD
/
同源模建
原理:比较模建,利用已知结构的同源蛋白建立目的蛋白的结构模型,再用理论计算方法进化优化,最终得到合理的3D模型。
关键:模板的选择
适用:同源性>30%的同源蛋白质
步骤:(6步曲)
目的序列与模板序列的匹配;
根据多重比对结果确定同源蛋白质的保守区及相应的框架结构;
目的蛋白质结构保守区的主链模建;
目标蛋白质结构变异区的主链模建;
侧链的安装和优化;
优化和评估模建的结构
系统发育分析
NJ法-邻接法:
特点:NJ法是基于最小进化原理经常被使用的一种算法,它构建的树相对准确,假设少,计算速度快,只得一颗树。
缺点:序列上的所有位点等同对待,且所分析的序列的进化距离不能太大
适用:进化距离不大,信息位点少的短序列
MP法-最大简约法
特点:基于进化过程中碱基替代数目最少这一假说
缺点:推测的树不是唯一的,变异大的序列会出现长枝吸引而导致建树错误。
适用:序列残基差别小,具有近似变异率,包含信息位点比较多的长序列
ML法-最大似然法
原理:考虑到每个位点出现的残基的似然值,将每个位置所有可能出现的残基替换概率进行累加,产生特定位点的似然值。ML法对所有可能的系统发育树都计算似然函数,似然函数值最大的那颗树即最可能的系统发育树
优点:在进化模型确定的情况下,ML法是与进化事实吻合最好的建树算法
缺点:计算强大非常大,极为耗时
建树相关软件:
PAUP-/
PHLIP-/phylip.html
MEGA-
TreePuzzle-http://www.nsc.liu.se/software/biology/puzzle5/
TreeView-/rod/treeview.html
MEGA用法: [生信相关]
PHYLIP3.65界面
PHYLIP建树的子程序:
Dnapars-核苷酸序列最大简约法
Protpars-蛋白质序列最大简约法