蛋白质组学数据统计分析软件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质组学数据库检索软件 GPM(X!tandem)
蛋白质组学数据库检索软件
GPM(X!tandem) SEQUEST Mascot
类型
免费开源软件
商业软件
商业软件
数据输入 DTA,PKL,MGF
mzXML,mzDATA
速度
快
RAW,DTA
较慢
MGF,DTA
较慢
并行运算 支持(PVM,MPI)
支持(PVM)
开始>运行>输入“cmd” 开启命令行窗口
Download:http://sourceforge.net/project/d
ownloading.php?group_id=69281&use_mirror=jai st&filename=ReAdW_2006Nov01.exe&40300388
2. 编辑参数
1letter code
A
Arginine
R
Asparagine N
Aspartic acid D
Asn or Asp
B
Cysteine
C
Glutamic acid E
Glutamine
Q
Glu or Gln
Z
Glycine
G
Histidine
H
Average mass
71.08 156.19 114.10 115.09
Threonine
T
101.10
Selenocysteine
U
150.03
Tryptophan
W
186.21
Tyrosine
Y
163.18
Valine
V
99.13
蛋白质组学质谱分析背景介绍
蛋白质组学质谱分析背景介绍
蛋白质组学质谱分析背景介绍
目前人类已知蛋白大约有6万8千种 平均每种蛋白长度为500个氨基酸 平均每种蛋白可以胰切成50个肽段 平均每个肽段有10种可能打碎情况 每一种可能情况产生一张理论图谱 平均一次质谱实验有3000次扫描 每一次扫描产生一张质谱谱图 ???面对如此多的质谱谱图和理论图 谱我们将如何进行比对
一级谱中片段离 子理论与实际差 异最大允许值
搜索的离子为b 离子与y离子
57.03404 15.99492
氨基酸残 基的修饰
完全修饰
潜在的修饰 氧化,磷酸化等等
快速搜索可 能的修饰
蛋白酶解时所使 用的酶(胰酶)
非特异性酶切 漏切
3.运行程序
点击运行
运行界面
4. 查看结果
结果可 靠性的 统计指 标以及
参数 数据库
数据库目录
输出结果目录
蛋白质组学数据库检索软件
工作流程:
1. 将 *.raw 文件转变为 *.mzXML 文件
(练习文件为肝癌蛋白质组学数据)
2. 编辑参数 3. 运行 GPM中的X!Tandom 4. 查看结果 5. 使用自己的数据库
1. 将 *.raw 文件转变为 *.mzXML 文件
粘贴蛋白序列:PGYRNNVVN TMRLWSAKAPNDFNLKDFNVG
选择“Only the following selection of enzymes and chemicals”,并选择胰酶Trypsin酶切
蛋白质组学质谱分析背景介绍 APNDFNLK
蛋白质组学质谱分析背景介绍
v Alanine
TPP包含一系列蛋白质鉴定和定量 分析的模块, 能够对经Sequest数据库 搜索引擎得到的结果进行筛选过滤,从 而达到蛋白质鉴定和测序的目的.
http://thegpm.org/
http://thegpm.org/GPM/gp m_install_faq.html
蛋白质组学数据统计分析软件
Trans-Proteomics Pipeline (TPP)
蛋白质组学数据统计分析软件
Trans-Proteomic Pipeline (TPP)是 用于LC/MS/MS蛋白质组学数据分析 的软件.
蛋白质组学数据库检索软件
Download GPM:
ftp://ftp.thegpm.org/projects/gpm/gpm-xe-installer/
蛋白质组学数据库检索软件
解压缩:
运行程序
质谱原始数据
数据库、结果 程序等核心内容
蛋白质组学数据库检索软件
C:/ZCNI_tranning/X!tandem/
强度
蛋白 的覆 盖率
唯一 对应 肽断
数
对应 肽断 总数
蛋白分 子质量
蛋白检索号
5.替换数据库
下载蛋白数据库存放到本文件夹
(所使用fasta数据库为所研究种属的蛋白数据库,可从 ftp://ftp.ebi.ac.uk/pub/databases/IPI/current/下载得 到)
用记事本打开
参考文献:
选择程序X!Tandem 选择需要搜索的质谱 数据 DTA, PKL, MGF, mzData, mzXML or Tandem BIOML
选择数据库
数据检索输出阀值
(|M-M0|/M0)X106(ppm) M为离子质量的实测值; M0为离子质量的理论值;
二级谱中片段离 子理论与实际差 异最大允许值
支持(MPI)
蛋白质组学数据库检索软件
X!Tandem
Master node
优点:
• 运算速度快 • 免费,并行集群计算成本低 • 开源可自行修改代码
缺点:
Network switching
• 应用范围尚不广泛 • 后期统计软件接口尚未成熟
硬件要求:
当前主流电脑配置即可胜任小规模数据检索
Slave nodes
双击打开
!!点击advanced 选 择搜索二级谱
Baidu Nhomakorabea
One spectrum:搜索一个质谱数据 One directory:搜索多个质谱数据,放于 一个文件夹中,然后压缩成一个rar文件谱
Simple:仅简单的设置一级肽指纹图谱 相关参数
Advanced:设置搜索二级图谱所有参数 Upload:查看以前的搜索
103.14 129.12 128.13
57.05 137.14
具体数值,对应后页中离子质量
Isoleucine
I
113.16
Leucine
L
113.16
Lysine
K
128.17
Methionine
M
131.19
Phenylalanine
F
147.18
Proline
P
97.12
Serine
S
87.08
课程内容:
1.蛋白质组学质谱分析背景介绍
2.蛋白质组学数据库检索软件 GPM(X!tandom)
3.蛋白质组学数据统计分析软件TPP
蛋白质组学质谱分析背景介绍
蛋白质组学质谱分析背景介绍
Tandem MS
m/z:质量电荷比
蛋白质组学质谱分析背景介绍
点击Perform
http://www.expasy.ch/tools/peptidecutter/