生物信息学 第六章 蛋白质结构预测及分子设计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
▪ 如果分析Swiss-Prot和TrEMBL数据库中序列 ▪ 直接填写Swiss-Prot/TrEMBL AC号(accession number)
▪ 如果分析新序列: ▪ 直接在搜索框中粘贴氨基酸序列
输入Swiss-Prot/TrEMBL AC号
将protein.txt蛋白质序列 粘贴在文本框中
实验数据
数据库搜索
结构域匹配
已知结构的 同源蛋白?
有
同源 建模
无 二级
结构预测 有
串线法
三维结构模型
可用的折 叠模型?
无
从头 预测
蛋白质的基本性质
蛋白质的基本性质:
相对分子质量 氨基酸组成 等电点(pI) 消光系数
半衰期
不稳定系数 总平均亲水性 …….
工具 AACompldent
Compute pI/Mw
蛋白质结构预测及分析的主要内容
蛋白质结构分析
蛋白质基本理化性质分析
蛋白质一级结构
蛋白质亲疏水性分析
蛋白质二级结构 蛋白质超二级结构
蛋白质跨膜区结构预测
蛋白质二级结构预测 (α螺旋,β折叠等)
蛋白质结构域分析
蛋白质三级结构
蛋白质三维结构模拟
蛋白质结构预测过程
蛋白质理化性质 和一级结构
ORF翻译 蛋白质序列
3、输入要找的蛋白名称或ID号等(如RecBCD, E. coli DNA repair)
4、点击”Go” 5、点击感兴趣的结果(1W36,进入MMDB) 结果列表中包含相关蛋白(powered by BLAST)、文献、结构域 (domain)、配体(ligand)、3D缩略图、三维查看器
在MMDB看搜到蛋白的结构(NCBI)
ProtParam
PeptideMass SAPS
蛋白质理化性质分析工具
网站
备注
利用未知蛋白质的氨基酸组成确 认具有相同组成的已知蛋白
计算蛋白质序列的等电点和分子 量
对氨基酸序列多个物理和化学参 数(分子量、等电点、吸光系数 等)进行计算
计算相应肽段的pI和分子量
利用蛋白质序列统计分析方法给 出待测蛋白的物理化学信息
生物信息学 第六章 蛋白质结构预测 及分子设计
单个蛋白 涉及的问题 结构预测(2D, 3D) 物理化学性质 功能 空间位置 研究方法 提取 纯化 制作晶体,决定结构 理解机制,功能
引子
多个蛋白 涉及的问题 表达过程(DNARNA蛋白,调控网络) 相互作用(yeast two-hybrid,亲和层析) 蛋白家族(family) 检测(2D-PAGE,质谱仪,蛋白质芯片) 研究方法 基因组测序 蛋白预言 计算机分析结构 理解机制,功能
蛋白结构的主要仓库 – PDB
▪ 始建于1971 ▪ >32000个结构数据(其中约3万是蛋白)
读取PDB文件的门户网站 Swiss-Prot, NCBI, EMBL
PDB
CATH, Dali, SCOP, FSSP 解释PDB文件的数据库
用”PubMed”搜蛋白结构(NCBI)
1、进入”PubMed” 2、选择”Structure”
不稳定系数
脂肪系数 总平均亲水性
蛋白质的结构
▪ 一级结构(primary):氨基酸序列 ▪ 二级结构(secondary):α螺旋、β片层、... ▪ 三级(维)结构(tertiary):亚基,结构域 ▪ 四级结构(quaternary):亚基之间特定的空间关系
蛋白结构与人类疾病 (重要性)
一些单氨基酸(aa)突变可引起蛋白结构的重大变化 CFTR的ΔF508突变改变螺旋结构,从而改变其功能 另一些变化则不明显 一些蛋白引起的疾病 囊肿性纤维化(cystic fibrosis): CFTR 镰刀性贫血: 血红蛋白 疯牛病: 朊蛋白 阿尔兹海默氏征: 淀粉样前体蛋白
点击其中的PDB (RCSB)链接,显示
▪ 三维结构实验数据 ▪ 蛋白分类
SCOP链接: 结构域(家族,超家族) CATH链接: 域, Class, Architecture, Topology, Homology GO链接: 功能,过程,细胞组成 ▪ 更多信息 生化性质,配体,SNP (Sequence Details)图形显示各域的分布,类别,DSSP二级结
▪ MMDB (Molecular Modeling Database): NCBI的大分子三维结构 数据库,数据来自PDB
▪ 打开的单个蛋白的页面中包括 ▪ 文献、简单描述、入库日期、物种(taxonomy) ▪ 该蛋白的PDB, VAST链接(entire chain/View 3D Alignment) ▪ 三维查看器(Cn3D) ▪ 分子成分(图): chain, 3D domain, classification/family, ligand
ProtParam 工具简介
基于蛋白质序列的组分分析 氨基酸亲疏水性等分析为高级结构预测提供参考 Expasy 开发的针对蛋白质基本理化性质的分析:
▪ ProtParam 工具
计算以下物理化学性质: •相对分子质量 •氨基酸组成 •等电点(pI) •消光系数 •半衰期 •不稳定系数 •总平均亲水性 ……
氨基酸数目 相对分子质量
氨基酸组成
返回结果
正/负电荷残基数
原子组成 分子式
总原子数Hale Waihona Puke Baidu消光系数
半衰期
E(Prot) = Num(Tyr)*Ext(Tyr) + Num(Trp)*Ext(Trp) + Num(Cystine)*Ext(Cystine) proteins in water measured at 280 nm: Ext(Tyr) = 1490, Ext(Trp) = 5500, Ext(Cystine) = 125 Absorb(Prot) = E(Prot) / Molecular_weight
构,PDP域 更多外部链接(对于RecBCD多达26个)
更多有用的链接
▪ PDB的外部链接中Compute pI Mw点击Chain B (可计算各链分子 量)
▪ 在打开的Compute pI/Mw页面中点击EX5B_ECOLI (ExPASy,大 量信息,链接)
▪ 在打开的UniProtKB/Swiss-Prot页面中点击EcoCyc:EG10824MONOMER (biocyc,参与的反应/路径图)