实习4蛋白质结构与功能预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
19
网站 http://www.sbc.su.se/~miklos/DAS/
HMMTOP
SOSUI TMAP TMHMM TMpred
TopPred
TMpred
• TMpred工具 工具: 工具
http://www.ch.embnet.org/software/TMPRED_form.html
• 依靠跨膜蛋白数据库TMbase • 预测跨膜区和跨膜方向
Chou-Fasman算法 PHD算法 PHD算法 多序列列线预测 基于神经网络的序列预测 基于已有知识的预测方法 (knowledge based method) 混合方法(hybrid system method)
27
蛋白质二级结构分析工具
工具 BCM Search Launcher HNN 备注 包括了常见的蛋白质结构分 析程序入口,一般分析可以 以此服务器作为起点 http://npsa-pbil.ibcp.fr/cgi基于神经网络的分析工具, bin/npsa_automat.pl?page=npsa_nn.html 含序列到结构过程和结构到 结构处理 http://www.compbio.dundee.ac.uk/~www基于Jnet神经网络的分析程序, jpred/submit.html 并 采 用 PSI-BLAST 来 构 建 序 列 Profile 进 行 预 测 , 对 于 序 列较短、结构单一的蛋白预 测较好 http://alexander.compbio.ucsf.edu/~nomi/nnpr 预测蛋白质序列中潜在的亮 edict.html 氨酸拉链结构和卷曲螺旋 http://bioweb.pasteur.fr/seqanal/interfaces/nns 基于双层前反馈神经网络为 sp-simple.html 算法,还考虑到蛋白质结构 分类信息 http://bioweb.pasteur.fr/seqanal/interfaces/pre 预测时考虑了氨基酸残基间 dator-simple.html 的氢键
6
课程安排
• 一、蛋白质理化性质分析
– 使用工具:Protparam
• 二、跨膜区分析
– 使用工具:TMpred
• 三、二级结构分析
– 使用工具:PredictProtein
• 四、结构域分析
– 使用工具:InterProScan
• 五、蛋白质三级结构分析
– 使用工具:SWISS-MODEL/SWISS-PdbViewer
28
来自百度文库
网站 http://searchlauncher.bcm.tmc.edu/
Jpred
nnPredict NNSSP
PREDATOR
蛋白质二级结构分析工具( 蛋白质二级结构分析工具(续)
工具 PredictProtein Prof PSIpred 备注 提供多项蛋白质性质分析, 并有较好准确性 http://www.aber.ac.uk/~phiwww/prof/ 基于 多重 序列 比对 预测 工 具 http://bioinf.cs.ucl.ac.uk/psipred/psiform.ht 提供 跨膜 蛋白 拓扑 结构 预 ml 测和蛋白profile折叠结构识 别工具 http://npsa-pbil.ibcp.fr/cgi可以 比较 各种 分析 方法 得 bin/npsa_automat.pl?page=npsa_sopma.ht 到的结果,也可输出 “一 ml 致性结果” http://coot.embl.de/~fmilpetz/SSPRED/sspr 基于 数据 库搜 索相 似蛋 白 ed.html 并构建多重序列比对 网站 http://www.predictprotein.org/
组学
学 实习
2
DNA sequence Protein sequence
Protein structure
Protein function
3
蛋白质序列分析主要内容
蛋白质基本理化性质分析 蛋白质一级序列 蛋白质亲疏水性分析 跨膜区结构预测 翻译后修饰位点预测 蛋白质序列分析 蛋白质二级结构 蛋白质超二级结构 蛋白质三级结构 蛋白质二级结构预测 蛋白质序列信号位点分析 蛋白质结构域分析 蛋白质三维结构模拟
10
主要选项/参数 主要选项 参数
• 如果分析SWISS-PORT和TrEMBL数据库中序列
– 直接填写Swiss-Prot/TrEMBL AC号(accession number)
• 如果分析新序列:
– 直接在搜索框中粘贴氨基酸序列
输入Swiss-Prot/TrEMBL AC号 输入 号
打开protein.txt, , 打开 将蛋白质序列 粘贴在搜索框中
http://www.ch.embnet.org/software/TMPRED_form.html
数据:C:\ZCNI\shixi4\protein.txt
26
三、蛋白质二级结构预测
• 基本的二级结构 – α螺旋,β折叠, β转角,无规则卷曲(coils)以及 模序(motif)等蛋白质局部结构组件 • 分析方法: – 基于统计和机器学习方法进行预测
20
主要参数/ 主要参数/选项
• 序列在线提交形式:
– 直接贴入蛋白序列 – 填写SwissProt/TrEMBL/EMBL/EST的ID或AC
输出格式 最短和最长的跨膜螺旋疏水区长度
输入序列名(可选) 输入序列名(可选) 选择序列的格式
贴入protein.txt蛋白 贴入 蛋白 质序列
21
输出结果
16
蛋白质跨膜区特性
• 典型的跨膜螺旋区主要是由20~30个疏水性 疏水性氨 疏水性 基酸(Leu、Ile、Val、Met、Gly、Ala等)组 成; • 亲水残基往往出现在疏水残基之间,对功能有 重要的作用; • 基于亲/疏水量和蛋白质跨膜区每个氨基酸的统 计学分布偏好性。
17
跨膜蛋白序列“边界” 跨膜蛋白序列“边界”原则
• 胞外末端 胞外末端:Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯 氨酸) • 胞外 内分界区 胞外-内分界区 内分界区:Trp(色氨酸) • 跨膜区 跨膜区:Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨 酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色 氨酸)、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯 氨酸)和Gly(甘氨酸) • 胞内 外分界区 胞内-外分界区 外分界区:Tyr(络氨酸)、 Trp(色氨酸)和Phe(苯丙氨酸) • 胞内末端 胞内末端:Lys(赖氨酸)和Arg(精氨酸)
实习4 实习4:蛋白质结构与功能分析
阮 陟
陈晓龙 何 源 蒋 琰
浙江加州国际纳米技术研究院( 浙江加州国际纳米技术研究院(ZCNI) )
实习课程内容
实习一 实习二 实习三 实习 实习 实习 基因组数据注释和功能分析 核苷酸序列分析 芯片的基本数据处理和分析 功能分析 组学数据分析
基因组学 系 统 生 转录组学 物 学
14
练习一:ProtParam 练习一:
http://www.expasy.org/tools/protparam.html 数据:C:\ZCNI\shixi4\protein.txt
15
二、蛋白质跨膜区分析
(a)-Type I membrane protein (b)-Type II membrane protein (c)-Multipass transmembrane proteins (d)-Lipid chain-anchored membrane proteins (e)-GPI-anchored membrane proteins
基于实验经验值的计算机分析方法
8
蛋白质理化性质分析工具
工具
AACompldent
网站
http://expasy.org/tools/aacomp/
备注
利用未知蛋白质的氨基酸组 成确认具有相同组成的已知 蛋白 计算蛋白质序列的等电点和 分子量 对氨基酸序列多个物理和化 学参数(分子量、等电点、 吸光系数等)进行计算 计算相应肽段的pI和分子量 利用蛋白质序列统计分析方 法给出待测蛋白的物理化学 信息
数据: C:\ZCNI\shixi4\protein.txt
7
一、蛋白质基本理化性质分析
蛋白质理化性质是蛋白质研究的基础 蛋白质的基本性质:
相对分子质量 等电点(pI) 半衰期 总平均亲水性 氨基酸组成 消光系数 不稳定系数 ……
实验方法:
• 相对分子质量的测定、等电点实验、沉降实验 • 缺点:费时、耗资
11
返回结果
氨基酸数目 相对分子质量 理论 pI 值
氨基酸组成
正/负电荷残基数 负电荷残基数
12
原子组成
分子式 总原子数 消光系数
E(Prot) = Num(Tyr)*Ext(Tyr) + Num(Trp)*Ext(Trp) + Num(Cystine)*Ext(Cystine)
proteins in water measured at 280 nm: Ext(Tyr) = 1490, Ext(Trp) = 5500, Ext(Cystine) = 125
Compute pI/Mw
http://expasy.org/tools/pi_tool.html
ProtParam
http://expasy.org/tools/protparam.html
PeptideMass SAPS
http://expasy.org/tools/peptide-mass.html http://www.isrec.isbsib.ch/software/SAPS_form.html
18
常用蛋白质跨膜区域分析工具
工具 DAS 备注 用 Dense Alignment Surface (DAS)算法来预测无同源 家族的蛋白跨膜区 http://www.enzim.hu/hmmtop/ 由Enzymology研究所开发的 蛋白质跨膜区和拓扑结构预 测程序 http://bp.nuap.nagoya-u.ac.jp/sosui/ 由Nagoya大学开发一个具有 图形显示跨膜区的程序 http://bioinfo.limbo.ifm.liu.se/tmap/ 基于多序列比对来预测跨膜 区的程序 http://www.cbs.dtu.dk/services/TMHMM-2.0 基于HMM方法的蛋白质跨 膜区预测工具 http://www.ch.embnet.org/software/TMPRED 基 于 对 TMbase 数 据 库 的 统 _form.html 计分析来预测蛋白质跨膜区 和跨膜方向 http://bioweb.pasteur.fr/seqanal/interfaces/top 是一个位于法国的蛋白质拓 pred.html 扑结构预测程序
9
ProtParam工具 工具
基于蛋白质序列的组分分析 氨基酸亲疏水性等分析为高级结构预测提供参考 • Expasy 开发的针对蛋白质基本理化性质的分析:
– Protparam 工具 http://www.expasy.org/tools/protparam.html
计算以下物理化学性质: 计算以下物理化学性质: •相对分子质量 •氨基酸组成 •等电点(PI) •消光系数 •半衰期 •不稳定系数 •总平均亲水性 ……
4
蛋白质结构预测过程
ORF翻译 蛋白质理化性质 和一级结构 蛋白质序列 实验数据
数据库搜索
结构域匹配
已知结构的 同源蛋白? 有
无 二级 结构预测 有
同源 建模
可用的折 叠模型?
串线法

三维结构模型
从头 预测
5
ExPASy(Expert Protein Analysis System)Tools ( ) (http://expasy.org/tools/) )
Absorb(Prot) = E(Prot) / Molecular_weight
半衰期
13
不稳定系数
<40 stable >40 unstable
脂肪系数 总平均亲水性
注意:ProtParam没有考虑蛋白质翻译后修饰 没有考虑蛋白质翻译后修饰、 注意 :ProtParam没有考虑蛋白质翻译后修饰、 蛋白质多 聚体等情况, 聚体等情况,故用户在预测和分析此类特定蛋白质的基本 理化性质时需要仔细审视反馈结果。 理化性质时需要仔细审视反馈结果。
• 包含四个部分
– 可能的跨膜螺旋区 – 相关性列表
位置 分值 片段中点位置 可能的跨膜螺旋区 相关性列表
22
跨膜拓扑模型及图示
建议的跨膜拓扑模型
每一位置计算分值 最优拓 扑结构
23
TMHMM
http://www.cbs.dtu.dk/services/TMHMM-2.0/
24
25
练习二:TMpred 练习二:
相关文档
最新文档