蛋白质序列分析课件
蛋白质分析鉴定精品课件
最新 PPT
22
2. 分析多肽链的氨基酸组成。
将多肽链用酸或酶完全水解,再用离子交换树脂 (或用高效液相色谱)将各种氨基酸分离开,测 定其含量并计算各种氨基酸组成的百分比。下图 表示蛋白质的水解产物通过Moor-Stein Dowex 50 离子交换柱层析的自动分析结果。
最新 PPT
31
双向电泳:
2-DE技术依然是大多数蛋白质组研究 中分离复杂蛋白质混合物的首选技 术。
最新 PPT
32
双向电泳分析中的样品制备
制备原则:
应使所有待分析的蛋白样品全部处于溶解状态 (包括多数疏水性蛋白),且制备方法应具有可 重现性。
防止样品在聚焦时发生蛋白的聚集和沉淀。
防止在样品制备过程中发生样品的抽提后化学修 饰(如酶性或化学性降解等)。
a 加入脱水剂除去水膜 b 使pH=pI c 加入电解质使质点表面失去同种电荷。
最新 PPT
12
五、蛋白质的变性作用
天然蛋白质受到理化因素的影响, 氢键、盐键等次级键维系的高级结构遭 到破坏,分子内部结构发生改变,致使 生物学 性质、理化性质改变的现象。
最新 PPT
13
物理因素: 加热、紫外线、X—射线、超声波
最新 PPT
45
双向电泳的分类
非变性2D-PAGE:两向均在非变性条件下 进行,这样分离的蛋白质点的等电点和表观 分子量同生理条件下获得的这些蛋白的值是 一样的
非变性/SDS-2D-PAGE:第一向采用非变性 IEF,之后在2%SDS溶液中平衡;第二向也 在SDS存在的条件下进行。适于分析非共价 键连接的蛋白-蛋白间的相互作用。
5 蛋白质序列分析
实例分析,使用PHYRE系统 进行 RGDV P2蛋白的折叠识别预测
3.从头预测
• Abinitio prediction:直接从序列本身预测三 维结构。
5.4抗原表位预测分析
• 抗原抗体结合反应中,抗原参与的结合部 位称为抗原表位(epitope)
实例:TargetP对RSvc2蛋白细胞定 位预测
5.2结构与分析及motif搜索
• 结构域(structure domain)是在蛋白质结 构中介于二级结构和三级结构之间的可以 明显区分但又相对独立的折叠单元,每个 结构域自身形成紧实的三维结构,可以独 立存在或折叠,但结构域之间的关系较松 散。 • 常见工具:InterProSan, SMART,Pfam。
实例:使用PROSITE数据库对 RGDV P8 蛋白进行motif搜索。
5.3空间结构预测
• 二级结构预测的意义。 • 在线工具,SSPro 等。
• Amino Acids: MAGKLQDGVAIAKIKETINLFCEYSFGDLVNNRREIVGRVHDARKN AALAWPDLIMNCFLHSASHYGVVKFLLDIALSTRFGDFTLLGVSSQ NYPFYDLHVVMTKAFCNLDFAKDEYLMINDSFSSMMSAFLDEEGV HSAMSMELGIHDIEDRFVLRTKRLFYIIHEYHMSLDEIEPWLEKLPD ASGGTLLNQKSKEQMRVIFSNAKVRIANSINLYVTNNTNSYNEYVR EVAEYVADLWNIQATTNTQGHENELADEDFGVLASSSQMNGTKS ELGDSVIKSDGNEVKLEPAVFTRNDDEEELAGSEFTSLLSDDGRM G Predicted Secondary Structure (8 Class): CCCHHHHHHHHHHHHHHHHHHHHHCHTHHHTTTCEHHHHHHH HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHEHETCE EEEEEECCSCCTCCHHEEEEHHHEECTCCCCCEECCCHHHHHH HHHHHHHHHCCEEEEHEEECECHHHHHHHHHHHHHHHHHHHH HHHHHHHHHHHTCCCTTTTCHHCHHHHHHHHHHHHHHHHHHH HHHHEEEETHHHHHHHHHHHHHHHHHHHHHEEEECCCTCCHH HHHHHHTTEEEECHHCTCCHCHTTCEEEECTTCEEEECCEEEEE CCCHHHHHHHHHHHHHCTTTCCC
蛋白质序列分析
百泰派克生物科技
蛋白质序列分析
蛋白质序列分析是指对构成蛋白质一级结构的氨基酸残基进行鉴定,以及对氨基酸残基的排列顺序进行分析,常用的蛋白质序列分析方法主要包括质谱法和非质谱法(Edman降解法)两类。
质谱法是目前使用最为广泛的一种蛋白质序列分析方法,基于质谱的蛋白质序列分析结合对应算法和生物信息学技术,可以实现蛋白的N/C末端序列分析、全序列分析和从头测序分析,其可用于已知蛋白的表达验证和未知蛋白的氨基酸序列分析。
基于质谱的蛋白序列分析通过特异性蛋白酶将目标蛋白酶切为肽段,再经过MS/MS
或LC-MS/MS检测得到肽段二级质谱图,解析谱图获得肽段的氨基酸序列,最后根
据肽段间的重合互补性完成各肽段的拼接,由此可实现完整蛋白质的序列分析。
百泰派克使用Thermo公司推出的Obitrap Fusion Lumos质谱仪提供蛋白测序服务,该服务可对蛋白样品的序列分析。
Obitrap Fusion Lumos质谱仪是现在分辨率和
灵敏度最高的质谱仪,保证了低丰度肽段碎裂片段鉴定的灵敏度;同时在肽段碎裂过程中采取HCD与ETD结合的模式,保证肽段碎裂片段的完整性。
可以实现蛋白样品的N端,C端序列分析以及蛋白全长序列分析。
2-蛋白质序列特征分析-生物信息学
TMPRED在线网页
生命科学学院
用TMPRED分析P51684序列所得到生的命可科能学学院 的7个跨膜螺旋区
生命科学学院
用TMPRED分析P51684序列所得到的7个可 能的跨膜螺旋区的相关性列表
含有卷曲螺旋结构最知名的蛋白质有原癌蛋白 (oncoprotein)c-fos和jun,以及原肌球蛋白 (tropomyosin)。
生命科学学院
利用COILS分析蛋白质的卷曲螺旋
COILS是由Swiss EMBNet维护的预测卷曲螺旋的在 线工具,该软件是基于Lupas算法,将查询序列在一个由 已知包含卷曲螺旋蛋白结构的数据库中进行搜索,同时也 将查询序列与包含球状蛋白序列的PDB次级库进行比较, 并根据两个库搜索得分决定查询序列形成卷曲螺旋的概率。 COILS也可以下载到本地进行运算。
生命科学学院
序列特征分析
Analysis of Sequence Characterristics
一、蛋白质结构 蛋白质的一级结构
生命科学学院
蛋白质的一级结构决定二级结构 蛋白质的二级结构决定三级结构
蛋白质的二级结构
生命科学学院
H表示螺旋 E表示折叠 B表示β桥 G表示3-螺旋 I表示π螺旋 T表示氢键转角 S代表转向
或者全部由碳原子和氢原子组成,因此这类氨基酸不太可 能与水分子形成氢键; 2. 极性氨基酸(polar amino acid),其测链通常由氧原子或 氮原子组成,它们比较容易与水分子形成氢键,因此也称 为亲水氨基酸; 3. 带电氨基酸(charged amino acids),这类氨基酸在生物 pH环境中带有正电或负电。
生命科学学院
蛋白质序列分析1
蛋白质模体及结构域数据库:如PROSITE、Pfam, 这些数 据库主要收集了蛋白质的保守结构域和功能域的特征序列;
蛋白质结构数据库: 如PDB 等, 这些数据库主要以蛋白质 的结构测量数据为主; 蛋白质分类数据库:如SCOP、CATH、FSSP 等, 这其中 又有以序列比较为基础的序列分类数据库以及以结构比较 为基础的结构分类数据库之分。
② MotifScan 用于查找未知序列中所有可能的已知结构组 件, 数据库包括PROSITE序列表谱、PROSITE 模式、Pfam 收集的隐马尔可夫模式( HMM)。
3.1.2 模体以及结构域数据库
(2) PRINTS Fingerprint Database
(/dbrowser/PRINTS/ )
3 .1 蛋白质数据库介绍
特征:
这些数据库种类有差别, 但内部是相互联系的, 每个 数据库都有指针指向其他数据库, 而且数据库之间的序列
以及相应的结构是共享的, 同一种蛋白质依次会出现在不
同的数据库, 这样的数据沟通有助于更深层地挖掘蛋白质 的内在生物信息, 这些数据库是融序列信息的索取、处理、 存储、输出于一身的。
网址:/pirwww 课堂演示,网页 及认识数据库内容。
3.1.1 蛋白质序列数据库
2. SWISS-PROT/ TrEMBL数据库( /swissprot )
SWISS-PROT 数据库是经注释的蛋白质数据库, 始建于
② 蛋白质是否包含“coiled-coils”结构。
螺旋卷曲结构可以在“COILS server”
( /software/COILS form.html)上预测, 螺旋卷曲结
实验四蛋白质序列结构的获取和显示 ppt课件
分子类别— PDB文本文件, 用写字板打开 转运蛋白
该文件的公 布日期
该化合物 的pdb代
码
标
题
部
分
该化合物的
来源
结构测定者 名字
REMARK是此pdb文件的参 考书目、最大分辨率、注解
等
一 级 结 构 杂 因 子
二 级 结 构
连 接 注 释 坐晶 标胞 变特 换征
及
坐 标 部 分
ID 号
名称,基本性质简要说明
20
作业
1. 在Uniprot中查询拟南芥的光敏色素phyE编码蛋白的
详细信息,阅读序列格式的解释,列出共包含哪几
个部分?标出头部区主要字段的含义。
2. 在 Uniprot 中 查 询 ( 1 ) 拟 南 芥 油 菜 素 内 酯 受 体
gibberellin receptor GID1C 、 (2)水稻独角金内酯
FKSTFPRWPT PTNPAATLGK DITNLCPLGL DLLSKMITYD PYARITAEEA LKHAYFDELN
N //
18
实验四蛋白质 序列结构的获
取和显示
氨基酸代码
19
FASTA文件格式
>tr|Q9XYV1|Q9XYV1_PARTE Cyclin-dependent protein kinase Cdk2 OS=Paramecium tetraurelia GN=CDK2 PE=4 SV=1
写出它们所对应的mrna检索号类似于这样的格式精选ppt22pdbproteidatabank美国brookhaven国家实验室管理生物大分子三维空间结构原子坐标数据库htncbistructuremolecularmodelngdatabas包含了从pdb获取的实验确定的生物高聚物结构分子模型数据库精选ppt23pdb数据库proteindatabankproteindatabank简介美国brookhaven实验室1971年建立的大分子结构数据库pdb蛋白质晶体结构资料数据库proteipdb数据库的维护由结构生物信息学研究合作组织researchcolucturalbioinformatcsrcsb负责
蛋白质序列分析ppt课件
• 使用单一的预测软件准确性不太高, 综合不同的软 件预测结果并结合疏水性图, 可以获得较好的预测, 对于跨膜螺旋和膜向性预测准确率达80%~95%
蛋白质序列分析
跨膜区在线分析工具
名称 TMHMM Tmpred
TMP
网址
说明
http://www.cbs.dtu.dk/services/TMHMM/ 判定是否是膜蛋白
/software/TMPRED_for 预测跨膜片断 m.html
http://www.mbb.ki.se/tmap/
用多序列比对方法预测 跨膜区
跨膜蛋白数据库Tmbase 1.来源于Swiss-Prot数据库, 提供如跨膜结构区的
数量、位置及其侧翼序列等信息。
2.数据库下载地址:http://www.isrec.isbsib.ch/ftp-server/tmbase
蛋白质序列分析
跨膜区实例分析
• 使用TMHMM server 2.0对水稻瘤矮病毒 (RGDV)外层衣壳 P8蛋白进行跨膜区分析 。
• TMHMM基于隐马尔可夫模型预测,综合了跨膜 区疏水性、电荷偏倚、螺旋长度和膜蛋白拓扑学 限制等性质,可对跨膜区及膜内外区进行整体预 测。
Asp (D) -3.5
Ala (A) 1.8
Gln (Q) -3.5
Gly (G) -0.4
Glu (E) -3.5
Thr (T) -0.7
Lys (K) -3.9
Ser (S)
-0.8
Arg 精选课件PPT (R)
-4.5
10
蛋白质序列分析
主要选项/参数
序列在线提交形式:
蛋白质序列分析
蛋白质序列分析日期:目录•蛋白质序列分析简介•蛋白质序列获取与预处理•蛋白质序列分析方法•功能与结构预测•蛋白质序列分析的挑战与展望•案例研究:蛋白质序列分析在生物医学中的应用蛋白质序列分析简介•蛋白质序列分析是指通过算法和软件工具对蛋白质序列进行各种层面的分析,以揭示其结构、功能和进化关系等生物信息。
这种分析可以基于一级结构(即氨基酸序列)以及更高层次的结构(如二级、三级和四级结构)进行。
蛋白质序列分析的定义通过序列分析,可以预测蛋白质的功能,进而理解其在生物体内的角色。
揭示蛋白质功能比较不同物种间同源蛋白质的序列变异,可以推断它们的进化关系。
解析进化关系了解蛋白质的结构和功能,有助于设计针对特定蛋白质的小分子药物。
助力药物设计蛋白质序列分析的重要性基础科学研究:在生物学、生物化学、生物物理学等基础科学领域,蛋白质序列分析是理解和揭示生命活动基本规律的重要手段。
生物工程:在生物工程领域,蛋白质序列分析可用于蛋白质工程、代谢工程等方面,指导工业生产和应用。
医学领域:通过蛋白质序列分析,可以研究疾病的发生发展机制,寻找新的药物靶点和治疗手段。
综上所述,蛋白质序列分析在生命科学研究中扮演着至关重要的角色,其应用场景广泛,意义重大。
蛋白质序列分析的应用领域蛋白质序列获取与预处理常见的蛋白质序列数据库包括UniProt、NCBI的Protein Database (nr)等。
这些数据库收录了大量的蛋白质序列及其相关信息。
常用数据库这些数据库通常提供分类、注释、检索等功能,用户可以根据需要获取特定物种、特定功能或特定实验条件下的蛋白质序列。
数据库特点蛋白质序列数据库简介从数据库中获取蛋白质序列用户可以通过关键词、序列ID、物种信息等方式在数据库中进行检索,获取目标蛋白质序列。
数据格式获取的蛋白质序列通常以FASTA、GenBank等格式提供,这些格式包含了序列的基本信息和序列数据。
在获取到的蛋白质序列中,可能会包含一些非氨基酸字符或特殊符号,需要进行相应的去除或替换。
蛋白质组学中的从头测序方法PPT课件
VS
药物作用机制
通过从头测序方法,可以深入了解药物的 作用机制,有助于药物的优化和改进。
生物进化与物种分类的研究
物种进化
物种分类
从头测序方法可以用于研究物种的进化历程, 有助于理解生物多样性的形成和演化。
从头测序方法可以用于更精确地分类和鉴定 物种,有助于生物分类学的研究和发展。
05
从头测序的挑战与前景
蛋白质组学中的从头 测序方法ppt课件
目录
• 从头测序方法的概述 • 从头测序的基本原理 • 从头测序的最新进展 • 从头测序的应用实例 • 从头测序的挑战与前景
01
从头测序方法的概述
定义与重要性
定义
从头测序方法是一种基于质谱技术的蛋白质测序方法,通过将蛋白质切割成较小的肽段,然后对这些肽段进行测 序,最终确定蛋白质的氨基酸序列。
02
从头测序的基本原理
蛋白质的分离与纯化
蛋白质的分离
利用不同蛋白质在物理、化学性质上 的差异,将其从混合物中分离出来。 常见的方法包括离心、电泳、色谱等 。
蛋白质的纯化
在分离的基础上,进一步去除蛋白质 中的杂质,提高蛋白质的纯度。常用 的纯化方法包括凝胶过滤、离子交换 等。
蛋白质的酶切
选择合适的酶
03
从头测序的最新进展
高通量测序技术
最新一代测序技术
随着技术的不断进步,新一代测 序技术如纳米孔测序和单分子测 序等,具有更高的通量、更短的 测序时间以及更低的成本。
深度覆盖
高通量测序技术能够实现蛋白质 组的深度覆盖,从而更全面地揭 示蛋白质的表达和修饰情况。
交叉验证
通过与其他技术如质谱和抗体检 测的交叉验证,高通量测序技术 能够提高结果的准确性和可靠性。
蛋白质序列分析
/protscale/
利用BioEdit软件分析 软件分析 利用
5. Coil区分析 区分析 蛋白质中由2-7条 螺旋链相互缠绕形成类似麻花状结 蛋白质中由 条α螺旋链相互缠绕形成类似麻花状结 构的总称; 构的总称; 主要存在形式是2-5条相互缠绕形成的平行或反平行 主要存在形式是 条相互缠绕形成的平行或反平行 同寡聚体或异寡聚体; 同寡聚体或异寡聚体; 是控制蛋白质寡聚化的元件,转录因子、骨架蛋白、 是控制蛋白质寡聚化的元件,转录因子、骨架蛋白、 动力蛋白、膜蛋白、酶等; 动力蛋白、膜蛋白、酶等; 七肽重复区。 七肽重复区。 例,使用COILS服务器分析 使用 服务器分析 /software/COILS_form.html
第五章 蛋白质序列分析
蛋白质序列的基本性质分析
理化性质分析,疏水性分析,跨膜区分析,信号肽预测, 理化性质分析,疏水性分析,跨膜区分析,信号肽预测, Coil区分析,亚细胞定位 区分析, 区分析
结构域分析及motif搜索 搜索 结构域分析及 空间结构预测
二级结构及三级结构预测, 二级结构及三级结构预测,结构预测方法评价
模建评 价
比对、模建、 比对、模建、 模板选择
四级结构 模建日志 配合物模 建日志
通过CPHmodels同源模建 同源模建 通过 http://www.cbs.dtu.dk/services/CPHmodels/
(2)折叠识别 ) 原理:将序列“ 原理:将序列“穿”入已知的各种蛋白质折叠子骨架 内,通过目的蛋白序列与已知折叠子的逐一比对,计 通过目的蛋白序列与已知折叠子的逐一比对, 算出未知结构序列折叠成各种已知折叠子的可能性; 算出未知结构序列折叠成各种已知折叠子的可能性; 折叠子一般包括一个或多个蛋白质超家族; 折叠子一般包括一个或多个蛋白质超家族; 每个折叠子的结构内核有确定的结构特征; 每个折叠子的结构内核有确定的结构特征; 基于序列同源性很低的蛋白质都可能存在结构相同的 折叠子进行预测。 折叠子进行预测。 例,通过PHYRE系统进行折叠识别预测 通过 系统进行折叠识别预测 /~phyre/index.cgi (3)从头预测 )
6-蛋白质序列分析
FASTA格式 SWISS-PROT格式 PDB格式
2. 理化特性分析--基于一级结构的预测
理化特性分析
相对分子量、氨基酸组成、等电点、酶切特性、疏水 性等、亲水性,及消光系数等
常用工具
蛋白的功能位点是与其三维结构紧密相关 的,局部区域符合某种pattern不能保证一 定会具有对应的性质,要根据实际情况, 谨慎对待pattern 预测结果。
PROSITE 工具
ScanProsite
搜索蛋白序列是否含PROSITE数据库中存有的模式或是功能位点;搜 索Swiss-Prot中符合某种模式的蛋白以及蛋白三维结构数据库PDB中 含有该模式的蛋白,可察看其三维结构。
2. 蛋白质序列数据库
/
/swissprot/
3. 蛋白质模体及结构域数据库
PROSITE蛋白质家族和结构域数据库 (/prosite/ )
PROSITE数据库收集了有显著生物学意义的蛋白质位点序 列、蛋白质特征序列谱库以及序列模型,
注意问题
不要把所有搜索结果用在比对中 对搜索结果进行手工校正,将显著性不高的序列,非
蛋白质家族的序列剔除掉。
6. 同源建模
如果蛋白质序列有显著的同源序列(相似 性>50%,尤其是与已知结构的蛋白质之间 有显著同源性时,即可进行同源建模
以已知结构的蛋白质为模板进行精确的结构模 型构建
数字表示氨基酸个数。 [AC]-x-V-x(4)-{ED}This pattern is translated as: [Ala or Cys]-any-Val-any-any-any-any-{any but Glu or Asp}
蛋白质序列分析
Compute pI/Mw 计算理论等电点
和分子量
复制粘贴上述93aa的家 蝇defensin氨基酸序列
Theoretical pI/Mw 8.53/9846.29
MW=9844.4 Predicted pI=8.29 氨基酸组成列表
!不同程序预测的结果有差别
ProtParam 计算蛋白质理化 参数常用的工具
蛋白质亲疏水性氨基酸的组成是蛋白质折叠的 主要驱动力。
蛋白质折叠时会形成疏水内核和亲水表面,而 跨膜区多由疏水性氨基酸组成 。
可利用综合性序列分析软件(如DNAMAN) 或 ExPASy上的ProtScale来分析蛋白质的亲疏 水性。
疏水性轮廓
2~18区域,有一典型 的疏水性区域
Primary structure analysis (一级结构分析)
多序列比对结果
昆虫防御素的保守区域
KRATCD
KAVCVC
1、蛋白质序列检索 2、蛋白质序列比对 3、蛋白质基本性质分析 4、蛋白质功能预测 5、蛋白质结构预测
蛋白质序列的基本性质分析是蛋白质序列分析 的基本方面,一般包括: 蛋白质的氨基酸组成 分子量 等电点(pI) 亲疏水性分析 跨膜区分析 信号肽分析
InterProScan Sequence Search
All Resources (A-Z)
Defensin_2,4e-07 (blastp 会自动搜索
CDD)
Conserved Domain Database,CDD 保守结构域数据库
Defensin_2,4e-07 (blastp 会自动搜索
蛋白质家族(family)
具有一个或多个相同结构域的一组同源蛋 白质称为一个蛋白质家族。
第六章、核酸与蛋白质序列分析2
2019/1/30
30
第六章、核酸和蛋白质序列分析
(2)SIM4:http://pbil.univ-lyon1.fr/sim4.php
2019/1/30
31
第六章、核酸和蛋白质序列分析
6、CpG岛分析
CpG岛,是指哺乳动物基因启动子及其附近大 量的CpG位点(CpG表示指C、G以磷酸基连接)。 事实上基因组中60%~ 90% 的CpG 都被甲基 化, 未甲基化的CpG 成簇地组成CpG 岛, 位于结 构基因启动子的核心序列和转录起始点。有实验 证明超甲基化阻遏转录的进行。
2019/1/30
35
第六章、核酸和蛋白质序列分析
7、终止信号分析
r.it/~webgene/wwwHC polya.html
2019/1/30
36
第六章、核酸和蛋白质序列分析
8、基因定位分析
2019/1/30
37
第六章、核酸和蛋白质序列分析
1、遮蔽重复序列
在进行任何真核生物序列的基因辨识分析 之前,最好把散布和简单的重复序列找出来并 从序列中除去。虽然这些重复序列可能正好覆 盖了由RNA聚合酶Ⅱ转录的部分区域,它们几 乎不会覆盖启动子和外显子编码区。这样,这 些重复序列的定位能为其它基因特征的定位提 供重要的反面信息。 重复序列还常常会搅乱其它分析,特别是 在数据库搜索中。
2019/1/30 5
第六章、核酸和蛋白质序列分析
• 功能位点(functional site)
-与特定功能相关的位点,是生物分子序列上的一个功能 单元,或者是生物分子序列上一个较短的片段。 • 功能位点又称为功能序列(functional
sequence)、序列模式(motif)、信号 (signal)等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质序列分析
• 信号肽主要由三个domain组成:N-region、Hregin和C-region.
• N-region为正电荷区域,至少含有一个精氨酸(R) 或赖氨酸(K).
• H-region为疏水核,一般长为12~14个氨基酸. • C-region包含信号肽酶(SPase)的剪切位点,在剪切
脂肪系数 总平均亲水性
蛋白质序列分析
蛋白质疏水性分析
• ProtScale工具
• 氨基酸标度
– 表示氨基酸在某种实验状态下相对其他氨基酸在 某些性质的差异,如疏水性、亲水性等
• 收集50多个文献中提供的氨基酸标度 • 默认值为Hphob. Kyte & Doolittle,做疏水性
分析
20种氨基酸的疏水K-D标度
功能域
用户自定义区段
蛋白质序列分析
• 点击不同功能域或直接粘贴氨基酸序列的方式得到以下结果
• 蛋白质序列疏水区域分布预测图
图形结果
文本结果
序列
参数
每个位置的得分
蛋白质序列分析
跨膜区分析
• 膜蛋白不溶于水,分离纯化困难,不容易生长晶体, 很难确定其结构
• 膜蛋白跨膜区可能作为膜受体, 也可能是定位在膜 上的锚定蛋白或离子通道蛋白
• 如果分析新序列:
– 直接在搜索框中粘贴氨基酸序列
氨基酸标度
输入Swiss-Prot/TrEMBL AC号
打开protein.txt, 将一条蛋白质序列 粘贴在搜索框中
计算窗口(7-11) 相对权重值
权重值变化趋势
蛋白质序列分析
输出结果
• 输入Swiss-Prot/TrEMBL AC号—分不同的功能域肽段
Asp (D) -3.5 Gln (Q) -3.5
Gly (G) -0.4
Glu (E) -3.5
Thr (T) -0.7
Ser (S)
Байду номын сангаас
-0.8
Lys (K) -3.9 Arg (R) -4.5
蛋白质序列分析
主要选项/参数
序列在线提交形式:
• 如果分析SWISS-PORT和TrEMBL数据库中序列 – 直接填写Swiss-Prot/TrEMBL AC号(accession number)
氨基酸 K-D标度 氨基酸 K-D标度
Ile (I)
4.5
Trp (W) -0.9
Val (V) 4.2
Tyr (Y) -1.3
Leu (L) 3.8 Phe (F) 2.8
Pro (P)
-1.6
His (H) -3.2
Cys (C) 2.5
Asn (N) -3.5
Met (M) 1.9 Ala (A) 1.8
• TMHMM在区分可溶性蛋白和膜蛋白方面尤为见 长,常用于判定一个蛋白是否为膜蛋白。
贴入RGDVp8.txt蛋 白质序列
1. P8蛋白的1~405位氨基酸位于细胞膜表面 2. 406~425位氨基酸形成一个典型的跨膜螺旋区
蛋白质序列分析
信号肽预测
• 蛋白质合成后要运送到细胞中不同的部位,有的 蛋白质要通过内质网膜进入内质网腔内,最终成 为分泌蛋白。
• 预测跨膜螺旋主要基于已知的跨膜螺旋信息, 应用 统计模型或神经网络方法
• 使用单一的预测软件准确性不太高, 综合不同的软 件预测结果并结合疏水性图, 可以获得较好的预测, 对于跨膜螺旋和膜向性预测准确率达80%~95%
蛋白质序列分析
跨膜区在线分析工具
名称 TMHMM Tmpred
TMP
网址
说明 判定是否是膜蛋白 预测跨膜片断
• 分泌蛋白的N端都有一段约15~35个氨基酸的疏水 性肽段,其功能是引导蛋白质多肽链穿过内质网 膜进入腔内,称为信号肽(signal peptide)。
• 按照氨基酸组成及其位置特征,可将信号肽分为4 大类:
1. 分泌信号肽
2. 脂蛋白信号肽
3. Pilin-like信号肽 4. 细菌素和细菌素信号肽
蛋白质序列分析
输出结果
• 输入Swiss-Prot/TrEMBL AC号—分不同的功能域肽段
功能域 用户自定义区段
蛋白质序列分析
点击不同功能域或是以直接粘贴氨基酸序列的方式得到以下结果
氨基酸数目 相对分子质量
理论 pI 值 氨基酸组成
原子组成 分子式 总原子数
蛋白质序列分析
消光系数
半衰期 不稳定系数
• 理化性质分析 • 疏水性分析 • 跨膜区分析 • 信号肽预测 • Coil区分析 • 亚细胞定位
蛋白质序列分析
蛋白质理化性质分析
• Protparam 工具
计算以下物理化学性质: • 相对分子质量 理论 pI 值 • 氨基酸组成 原子组成 • 消光系数 半衰期 • 不稳定系数 脂肪系数 • 总平均亲水性
位点的-1位和-3位上多为中性的丙氨酸,该区域 也称为富含丙氨酸区域.
N HC
N端
C端
蛋白质序列分析
信号肽预测在线分析工具
名称 ChloroP
网址
说明 预测植物中叶绿体转运肽
LipoP NetNES
预测革兰氏菌中的信号肽酶I、 II的剪切位点
预测富含亮氨酸的核输出信号
SecretomeP SignalP
用多序列比对方法预测 跨膜区
跨膜蛋白数据库Tmbase 1.来源于Swiss-Prot数据库, 提供如跨膜结构区的
数量、位置及其侧翼序列等信息。
2.数据库下载地址:
蛋白质序列分析
跨膜区实例分析
• 使用TMHMM server 2.0对水稻瘤矮病毒 (RGDV)外层衣壳 P8蛋白进行跨膜区分析 。
• TMHMM基于隐马尔可夫模型预测,综合了跨膜 区疏水性、电荷偏倚、螺旋长度和膜蛋白拓扑学 限制等性质,可对跨膜区及膜内外区进行整体预 测。
蛋白质序列分析
2005 《基因表达序列标签(EST) 数据分析手册》第八章
吴祖建等 2011 《生物信息学分析实践》 第五章
蛋白质序列分析
• 蛋白质序列结构信息
– 蛋白质序列的基本性质 分析
– 结构域分析及motif搜索 – 蛋白质二级结构 – 蛋白质三级结构
蛋白质序列分析
一 、蛋白质序列的基本性质分析
蛋白质序列分析
主要选项/参数
序列在线提交形式: • 如果分析SWISS-PORT和TrEMBL数据库中序列
– 直接填写Swiss-Prot/TrEMBL AC号(accession number)
• 如果分析新序列:
– 直接在搜索框中粘贴氨基酸序列
输入Swiss-Prot/TrEMBL AC号
打开protein.txt, 将一条蛋白质序列 粘贴在搜索框中