七蛋白质结构预测与功能初步注释

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

用户自定义区段
点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果
氨基酸数目 相对分子质量 理论 pI 值
氨基酸组成
原子组成 分子式 总原子数
消光系数
半衰期
不稳定系数 脂肪系数 总平均亲水性
蛋白质疏水性分析
• ProtScale工具 • 氨基酸标度
– 表示氨基酸在某种实验状态下相对其他氨基酸在 某些性质的差异,如疏水性、亲水性等
PROSITE (/prosite) is a dictionary of motifs (there are currently >1700 entries)(9/04). In PROSITE, a pattern is a qualitative motif description (a protein either matches a pattern, or not). In contrast, a profile is a quantitative motif description. We will encounter profiles in Pfam, ProDom, SMART, and other databases.
Definition of a motif
A motif (or fingerprint) is a short, conserved region of a protein. Its size is often 10 to 20 amino acids.
Simple motifs include transmembrane domains and phosphorylation sites. These do not imply homology when found in a group of proteins.
蛋白质理化性质分析
• Protparam 工具
/tools/protparam.html
计算以下物理化学性质:
相对分子质量 氨基酸组成 等电点(PI) 消光系数 半衰期 不稳定系数 总平均亲水性 ……
主要选项/参数
序列在线提交形式: • 如果分析SWISS-PORT和TrEMBL数据库中序列
caexpasyorgtoolsprotscalehtml表示氨基酸在某种实验状态下相对其他氨基酸在某些性质的差异如疏水性亲水性等默认值为hphobkytedoolittle做疏水性分析直接填写swissprottremblac号accessionnumber直接在搜索框中粘贴氨基酸序列输入swissprottremblac号氨基酸标度粘贴序列计算窗口711相对权重值权重值变化趋势输入swissprottremblac号分不同的功能域肽段功能域用户自定义区段蛋白质序列疏水区域分布预测图图形结果文本结果序列参数每个位置的得分实验方gfp轰击洋葱表皮细胞瞬时表选择物种类型粘贴序列点击查看详细信息最好利用多种预测软件进行预测然后将结果进行整合
• 如果分析新序列:
– 直接在搜索框中粘贴氨基酸序列
氨基酸标度
输入Swiss-Prot/TrEMBL AC号
粘贴 序列
计算窗口(7-11)
相对权重值 权重值变化趋势
输出结果
输入Swiss-Prot/TrEMBL AC号—分不同的功能域肽段
功能域
用户自定义区段
• 点击不同功能域或直接粘贴氨基酸序列的方式得到以下结果 • 蛋白质序列疏水区域分布预测图
PSORT
http://psort.ims.u-tokyo.ac.jp/
Web
NNPREDICT
(/~nomi/nnpredict.html)
结构域分析
• 结构域是蛋白序列的功能、结构和进化单元
• The conserved motifs may be used to build characteristic signatures that aid family and /or functional diagnoses of newly determined sequences.
首先从蛋白质的一级结构开始。。。
氨基酸按其R基的极性分类(在PH7)
非极性R基 丙氨酸 Ala A 缬氨酸 Val V 亮氨酸 Leu L 异亮氨酸 Ile I 脯氨酸 Pro P 苯丙氨酸 Phe F 色氨酸 Trp W 蛋氨酸 Met M 不带电荷的极性R基 甘氨酸 Gly G 丝氨酸 Ser S 苏氨酸 Thr T 半胱氨酸 Cys C 酪氨酸 Tys Y 天冬酰胺 Asn N 谷氨酰胺 Gln Q
胞吞 蛋白转运
蛋白质二级结构预测
BCM Search Launcher Protein Sequence Analysis PHD ANTHEPROT SOMPA Jpred PSIpred SSPRED NNPREDICT PROF /seq-search/strucpredict.html http://bioweb.pasteur.fr/seqanal/protein/introuk.html http://www.embl-heidelberg.de/predictprotein/ http://antheprot-pbil.ibcp.fr/ http://npsa-pbil.ibcp.fr/cgibin/npsa_automat.pl?page=npsa_sopma.html /~wwwjpred/submit.html /psipred/psiform.html http://www.embl-heidelberg.de/sspred/ssp_mul.html /~nomi/nnpredict.htm l /~phiwww/prof/index.html Web Web Web Windows Web Web Web Web Web Web/Lin ux
Chapter 6 蛋白质结构预测与 功能初步注释
蛋白质序列结构信息
1. 氨基酸的理化性质分析
2. 蛋白质的亚细胞定位 3. 结构域分析 4. 膜蛋白的跨膜区预测 5. 蛋白质序列的二级结构预测 6. 蛋白质序列的三级结构预测
确定功能和结构
• 蛋白质结构预测问题 序列——结构——功能
….-Gly-Ala-Glu-Phe-….
带正电荷的极性R基
赖氨酸 Lys K 精氨酸 Arg R 组氨酸 His H
带负电荷的极性R基
天冬氨酸 Asp D 谷氨酸 Glu E
蛋白质基本理化性质分析
蛋白质理化性质是蛋白质研究的基础 蛋白质的基本性质: 相对分子质量 氨基酸组成 等电点(PI) 消光系数 半衰期 不稳定系数 总平均亲水性 …… 通过传统实验方法研究蛋白质的理化性质: • 相对分子质量的测定、等电点实验、沉降实验 • 缺点:费时、耗资 因此发展了基于实验经验值基本理化性质分析
基于一级序列的组分分析
氨基酸亲疏水性等分析为高级结构预测提供参考
• Expasy 开发的针对蛋白质基本理化性质的分析:
– Protparam 工具
/tools/protparam.html
– ProtScale 工具
/tools/protscale.html
/tools/protscale.html
• 收集50多个文献中提供的氨基酸标度 • 默认值为Hphob. Kyte & Doolittle,做疏水 性分析
主要选项/参数
序列在线提交形式:
• 如果分析SWISS-PORT和TrEMBL数据库中序列 – 直接填写Swiss-Prot/TrEMBL AC号(accession number)
– 直接填写Swiss-Prot/TrEMBL AC号(accession number)
• 如果分析新序列:
– 直接在搜索框中粘贴氨基酸序列
输入Swiss-Prot/TrEMBL AC号
在搜索框中 粘贴序列
输出结果
• 输入Swiss-Prot/TrEMBL AC号—分不同的功能域肽段
功能域
Protparam首先探测出目标 蛋白中都有哪些功能域, 然后分不同的功能域计算 其理化参数
//logo.cgi
Varieties of protein domains
Extending along the length of a protein
Occupying a subset of a protein sequence
Occurring one or more times
通过结构预测其功能
FUNCTION
结构预测问题
….-Gly-Ala-Glu-Phe-….
?
怎么样获得目 标蛋白的空间 结构呢?
FUNCTION
解决方法
….-Gly-Ala-Glu-Phe-….
预测

利用x射线衍射和核磁 共振等实验方法确定蛋 白质的空间结构存在成 本较高,过程复杂等不 足
FUNCTION
蛋白质二级结构预测
TMpred /software/TMPRED_for Web m.html
TMHMM
TopPred 2 COILS PEPCOIL TargetP
http://www.cbs.dtu.dk/services/TMHMM/
http://bioweb.pasteur.fr/seqanal/interfaces/toppr ed.html
Web
Web
/software/COILS_form. Web/Li html nux http://bioweb.pasteur.fr/seqanal/interfaces/pepco il.html http://www.cbs.dtu.dk/services/TargetP/ Web/Li nux Web
According to InterPro at EBI (/interpro/): A domain is an independent structural unit, found alone or in conjunction with other domains or repeats. Domains are evolutionarily related. According to SMART (http://smart.embl-heidelberg.de): A domain is a conserved structural entity with distinctive secondary structure content and a hydrophobic core. Homologous domains with common functions usually show sequence similarities.
蛋白质二级结构预测
蛋白质二级结构预测
• 基本的二级结构
– α螺旋,β折叠, β转角,无规则卷曲(coils)以及 模序(motif)等蛋白质局部结构组件
• 分析方法
– 基于统计和机器学习方法进行预测
• 分析内容
– α螺旋/β折叠等基本结构 • PHD,JPRED,PROF,PSIpred,NNSSP – 信号位点的分析 • SignalP,PSORT,TargetP
immunoglobulin domain
Motif (or fingerprint): • a short, conserved region of a protein • typically 10 to 20 contiguous amino acid residues
Definition of a domain
图形结果 文本结果 序列 参数
每个位置的得分
蛋白质的亚细胞定位
蛋白质的亚细胞定位
点击查 实验方 看详细 法: 信息 选择物种 GFP
类型
轰击洋 葱表皮 细胞 瞬时表 达
粘贴序列
最后预测结果如何判断
1. 最好利用多种预测软件进行预测,然后将结 果进行整合;
2. 结合已发表的文献数据;
3. 结合同源序列搜索的结果。
Protein domains and motifs
Signature: • a protein category such as a domain or motif Domain: • a region of a protein that can adopt a 3D structure • a fold • a family is a group of proteins that share a domain • examples: zinc finger domain
相关文档
最新文档