质谱数据定量分析方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非线性拟合算法
C *Ti i
, i 1,2
Ii
CC
*Ti *Ti
K1Ti2 K1Ti2
i K T2 i4
i
, ,
i i
3,4 5,6
K1Ti2 K2Ti4 i
, i 7,8
K T2 i4 i
,i 9,10
10
Leabharlann Baidu
2
f i
f K1
10
2 i
i 1
i K1
0
f
特点 K2
i 110
2 i
i 1
i K 2
0
f C
10
2 i
i 1
i C
0
可定义一般模式,支持自定义标记方法,支持多重标记
能够充分利用同位素分布信息
能够直接解决谱峰叠加问题
定量信息提取:标记定量
18
肽段水平
实现了多种算法:XIC面积比, 图谱比值平均,主成分分析, 最小二乘回归
采用了异常值排除策略
实现了基于XIC连续性的截断
临床诊断 ---直接寻找差异---
肽段组学,肽段特征矩阵,LC-MS策略,信号直接对比+有选择鉴定
定量数据分析的基本方法
5
无
标
标
定
记
量
定
量
不包括MRM、iTRAQ和SC定量
计算问题
6
图谱定量信息提取---同位素峰簇处理 肽段定量指标计算---比值计算,XIC处
理,母离子误差校正 RT对齐---LC-MS策略和LC-MS/MS策略
保留时间RT 53.661617 58.135022 59.199630 57.643797
上样量(ug/ul) 3.0 0.3 0.03
0.003
鉴定信息
AVG_ISO_DIS
SC CH XCorr ∆Cn LM(ug/ul)
126 2 5.1
0.62 3.0
14 3 2.63 0.33 3.0
70 2 5.58 0.47 0.3
使用方法
在搜库前定义修饰和定量的参数(通过修改XML文件实现),搜库,然后 使用Distiller定量
15
第二部分:研究内容和结果
定量信息的提取:Label free
16
图 谱 水 平
去噪方法 谱峰定量信息
X 不去噪
Xcalibur默认
最大值 平滑积分
小波去噪
函数拟合
信号加和
同位素峰
X 单一 最高 全部
标记定量:比值,定量指标 无标定量:定量指标
肽段定量指标计算
9
可选步骤
去噪处理:小波,平 滑滤波
XIC峰形拟合:复杂的 类高斯函数
XIC边界确定:信噪比, 连续性,局部最小 值
母离子匹配误差分布: 提高精度?
标记定量:比值计算,MaxQuant采用了最小二乘拟合法 问题:不同试剂标记的肽段XIC平移,差异越大,表现越明显 无标记定量:定量指标计算
未来工作
3
第一部分:研究背景
定量数据分析面对的问题
4
大规模Biomarker 发现 ---低丰度蛋白质---
信号S/N低+鉴定信息少 重复实验数据综合 蛋白质和肽段预分离技术 策略的数据综合
Biomarker验证 ---靶标分析---
靶标挑选(MRM)肽段分析效率预测(绝对定量)生物样本蛋白质表达 的随机变化影响
信号归一化 目的:针对无标记定量,消除不同实验间的系 统误差 基本方法:寻找不变量
差异显著性检验 从肽段到蛋白质的信息综合:平均?筛选? 异方差问题:信号越弱,误差分布越宽
一个例子
12
XIC
定量信息:TGVIVGEDVHNLFTYAK
图谱计数SC 126 70 3 4
XIC面积SA(对数) 8.54 7.56 5.15 5.89
问题:同位素峰分布测量误差
19
ERRi
ExpIso[i]
6
IsoDis[i] / IsoDis[i],i 1 ~ 6
ExpIso[i]
i1
1.8
Iso1
1.6
Iso2
Iso3
1.4
Iso4
Iso5
1.2
Iso6
Density
1
0.8
0.6
0.4
0.2
-1 -0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 Data
1
蛋白质学组中质谱数据定量分 析方法研究
谢红卫 国防科学技术大学机电工程与自动 化学院自动控制系
2010.5.15
主要内容
2
研究背景(我们对定量问题的认识)
定量数据分析面对的问题 定量数据分析的基本方法 已有定量软件和应用情况
研究内容和结果
定量信息提取方法及问题 多批次定量数据的对应及重复实验 差异显著性检验 计算问题和软件开发
的不同 信号归一化---消除系统误差 差异显著性检验---考虑信号强度影响
质谱信号与定量
7
标记:配对的同位素峰
无标记:同位素峰
图谱定量信息提取方法
8
基本方法
最大值法,平滑积分法,信号求和,构建3D peaks (MaxQuant),函数拟合
附加处理
小波去噪,同位素分布约束,信噪比过滤
结果形式
4 3 2.8
0.40 0.3
3 2 4.9
0.49 0.03
4 2 4.3
0.72 0.003
1 3 2.2
0.34 0.003
数据产生 LTQ/FT分析Yeast样品,SEQUEST搜 库,Target-decoy过滤(FDR=0.01), 取Scan number最小的记录
定量软件
13
Cencus、 CRAWDAD、 MaxQuant
单一同位素峰最高 第二同位素峰最高 第三同位素峰最高 第四同位素峰最高
数据:FT_yeast, BPRC,高可信鉴定肽段
软件在可视化、 速度、数据文 件格式支持、 算法精度和实 验策略支持等 方面有很大发 展空间
定量软件-Mascot
14
支持的定量类型
多种标记定量, MS/MS图谱 定量, emPAI, 重复实验 Label free, 选择信号最强的3 个肽段
数据处理算法特色
基于m/z和RT的对齐,多种XIC积分方法,多参数鉴定结果过滤,outliers排 除,归一化处理(利用均值)
RT对齐
10
LC-MS策略:寻找共同的肽段信号,建立非线 性模型
LC-MS/MS策略:利用共同鉴定肽段的RT建立 对齐模型
对齐模型:3次样条,局部回归,小波,分段线 性,偏移向量等
作用:对LC-MS/MS策略,可以弥补鉴定信息的 不足,提高MS图谱信号利用率
信号归一化和差异显著性检验
11
X
肽 段 水 平
X XIC处理 小波去噪 平滑去噪
XIC定量
平滑积分
连续性截断
函数拟合
误差分析
信号加和
共3*4*3*4*3=432种计算流程
比较原则:重复实验的CV值最小
目前结论: (1)不进行去噪处理的信号加 和方法最优 (2)高信号水平的处理结果 CV值都比较小
定量信息提取:标记定量
17
图谱水平:
C *Ti i
, i 1,2
Ii
CC
*Ti *Ti
K1Ti2 K1Ti2
i K T2 i4
i
, ,
i i
3,4 5,6
K1Ti2 K2Ti4 i
, i 7,8
K T2 i4 i
,i 9,10
10
Leabharlann Baidu
2
f i
f K1
10
2 i
i 1
i K1
0
f
特点 K2
i 110
2 i
i 1
i K 2
0
f C
10
2 i
i 1
i C
0
可定义一般模式,支持自定义标记方法,支持多重标记
能够充分利用同位素分布信息
能够直接解决谱峰叠加问题
定量信息提取:标记定量
18
肽段水平
实现了多种算法:XIC面积比, 图谱比值平均,主成分分析, 最小二乘回归
采用了异常值排除策略
实现了基于XIC连续性的截断
临床诊断 ---直接寻找差异---
肽段组学,肽段特征矩阵,LC-MS策略,信号直接对比+有选择鉴定
定量数据分析的基本方法
5
无
标
标
定
记
量
定
量
不包括MRM、iTRAQ和SC定量
计算问题
6
图谱定量信息提取---同位素峰簇处理 肽段定量指标计算---比值计算,XIC处
理,母离子误差校正 RT对齐---LC-MS策略和LC-MS/MS策略
保留时间RT 53.661617 58.135022 59.199630 57.643797
上样量(ug/ul) 3.0 0.3 0.03
0.003
鉴定信息
AVG_ISO_DIS
SC CH XCorr ∆Cn LM(ug/ul)
126 2 5.1
0.62 3.0
14 3 2.63 0.33 3.0
70 2 5.58 0.47 0.3
使用方法
在搜库前定义修饰和定量的参数(通过修改XML文件实现),搜库,然后 使用Distiller定量
15
第二部分:研究内容和结果
定量信息的提取:Label free
16
图 谱 水 平
去噪方法 谱峰定量信息
X 不去噪
Xcalibur默认
最大值 平滑积分
小波去噪
函数拟合
信号加和
同位素峰
X 单一 最高 全部
标记定量:比值,定量指标 无标定量:定量指标
肽段定量指标计算
9
可选步骤
去噪处理:小波,平 滑滤波
XIC峰形拟合:复杂的 类高斯函数
XIC边界确定:信噪比, 连续性,局部最小 值
母离子匹配误差分布: 提高精度?
标记定量:比值计算,MaxQuant采用了最小二乘拟合法 问题:不同试剂标记的肽段XIC平移,差异越大,表现越明显 无标记定量:定量指标计算
未来工作
3
第一部分:研究背景
定量数据分析面对的问题
4
大规模Biomarker 发现 ---低丰度蛋白质---
信号S/N低+鉴定信息少 重复实验数据综合 蛋白质和肽段预分离技术 策略的数据综合
Biomarker验证 ---靶标分析---
靶标挑选(MRM)肽段分析效率预测(绝对定量)生物样本蛋白质表达 的随机变化影响
信号归一化 目的:针对无标记定量,消除不同实验间的系 统误差 基本方法:寻找不变量
差异显著性检验 从肽段到蛋白质的信息综合:平均?筛选? 异方差问题:信号越弱,误差分布越宽
一个例子
12
XIC
定量信息:TGVIVGEDVHNLFTYAK
图谱计数SC 126 70 3 4
XIC面积SA(对数) 8.54 7.56 5.15 5.89
问题:同位素峰分布测量误差
19
ERRi
ExpIso[i]
6
IsoDis[i] / IsoDis[i],i 1 ~ 6
ExpIso[i]
i1
1.8
Iso1
1.6
Iso2
Iso3
1.4
Iso4
Iso5
1.2
Iso6
Density
1
0.8
0.6
0.4
0.2
-1 -0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 Data
1
蛋白质学组中质谱数据定量分 析方法研究
谢红卫 国防科学技术大学机电工程与自动 化学院自动控制系
2010.5.15
主要内容
2
研究背景(我们对定量问题的认识)
定量数据分析面对的问题 定量数据分析的基本方法 已有定量软件和应用情况
研究内容和结果
定量信息提取方法及问题 多批次定量数据的对应及重复实验 差异显著性检验 计算问题和软件开发
的不同 信号归一化---消除系统误差 差异显著性检验---考虑信号强度影响
质谱信号与定量
7
标记:配对的同位素峰
无标记:同位素峰
图谱定量信息提取方法
8
基本方法
最大值法,平滑积分法,信号求和,构建3D peaks (MaxQuant),函数拟合
附加处理
小波去噪,同位素分布约束,信噪比过滤
结果形式
4 3 2.8
0.40 0.3
3 2 4.9
0.49 0.03
4 2 4.3
0.72 0.003
1 3 2.2
0.34 0.003
数据产生 LTQ/FT分析Yeast样品,SEQUEST搜 库,Target-decoy过滤(FDR=0.01), 取Scan number最小的记录
定量软件
13
Cencus、 CRAWDAD、 MaxQuant
单一同位素峰最高 第二同位素峰最高 第三同位素峰最高 第四同位素峰最高
数据:FT_yeast, BPRC,高可信鉴定肽段
软件在可视化、 速度、数据文 件格式支持、 算法精度和实 验策略支持等 方面有很大发 展空间
定量软件-Mascot
14
支持的定量类型
多种标记定量, MS/MS图谱 定量, emPAI, 重复实验 Label free, 选择信号最强的3 个肽段
数据处理算法特色
基于m/z和RT的对齐,多种XIC积分方法,多参数鉴定结果过滤,outliers排 除,归一化处理(利用均值)
RT对齐
10
LC-MS策略:寻找共同的肽段信号,建立非线 性模型
LC-MS/MS策略:利用共同鉴定肽段的RT建立 对齐模型
对齐模型:3次样条,局部回归,小波,分段线 性,偏移向量等
作用:对LC-MS/MS策略,可以弥补鉴定信息的 不足,提高MS图谱信号利用率
信号归一化和差异显著性检验
11
X
肽 段 水 平
X XIC处理 小波去噪 平滑去噪
XIC定量
平滑积分
连续性截断
函数拟合
误差分析
信号加和
共3*4*3*4*3=432种计算流程
比较原则:重复实验的CV值最小
目前结论: (1)不进行去噪处理的信号加 和方法最优 (2)高信号水平的处理结果 CV值都比较小
定量信息提取:标记定量
17
图谱水平: