质谱数据定量分析方法概要
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信号归一化和差异显著性检验
信号归一化 目的:针对无标记定量,消除不同实验间的系 统误差 基本方法:寻找不变量 差异显著性检验 从肽段到蛋白质的信息综合:平均?筛选? 异方差问题:信号越弱,误差分布越宽
一个例子
定量信息:TGVIVGEDVHNLFTYAK
图谱计数SC 126 70 3 4 XIC面积SA(对数) 8.54 7.56 5.15 5.89 保留时间RT 53.661617 58.135022 59.199630 57.643797 上样量(ug/ul) 3.0 0.3 0.03 0.003
鉴定信息
SC 126 14 70 4 3 4 1 C H 2 3 2 3 2 2 3 XCor r 5.1 2.63 5.58 2.8 4.9 4.3 2.2 ∆Cn 0.62 0.33 0.47 0.40 0.49 0.72 0.34 LM(ug/ul ) 3.0 3.0 0.3 0.3 0.03 0.003 0.003
X
XIC定量
平滑积分 函数拟合 信号加和
定量信息提取:标记定量
图谱水平:
非线性拟合算法
, i 1,2 C * Ti i C * T K T , i 3,4 i 1 i 2 i I i C * Ti K1Ti 2 K 2Ti 4 i , i 5,6 K T K T , i 7,8 2 i 4 i 1 i 2 , i 9,10 K 2Ti 4 i
未来工作
第一部分:研究背景
定量数据分析面对的问题
大规模Biomarker 发现 ---低丰度蛋白质--信号S/N低+鉴定信息少 术策略的数据综合 重复实验数据综合 蛋白质和肽段预分离技
Biomarker验证
---靶标分析--靶标挑选(MRM)肽段分析效率预测(绝对定量)生物样本蛋白质表 达的随机变化影响
XIC
AVG_ISO_DIS
数据产生 LTQ/FT分析Yeast样品,SEQUEST 搜库,Target-decoy过滤 (FDR=0.01),取Scan number最小 的记录
定量软件
Cencus、 CRAWDAD、 MaxQuant 软件在可视化、 速度、数据文 件格式支持、 算法精度和实 验策略支持等 方面有很大发 展空间
第二部分:研究内容和结果
定量信息的提取:Label ห้องสมุดไป่ตู้ree
图 谱 水 平
去噪方法
不去噪 Xcalibur默认 小波去噪
谱峰定量信息
X X
最大值 平滑积分 函数拟合 信号加和
同位素峰
X
单一 最高 全部
XIC处理
肽 段 水 平 小波去噪 平滑去噪 连续性截断 误差分析
共3*4*3*4*3=432种计算流程 比较原则:重复实验的CV值最小 目前结论: (1)不进行去噪处理的信号 加和方法最优 (2)高信号水平的处理结果 CV值都比较小
蛋白质学组中质谱数据定量分 析方法研究
谢红卫 国防科学技术大学机电工程与自动 化学院自动控制系
2010.5.15
主要内容
研究背景(我们对定量问题的认识)
定量数据分析面对的问题 定量数据分析的基本方法 已有定量软件和应用情况
研究内容和结果
定量信息提取方法及问题 多批次定量数据的对应及重复实验 差异显著性检验 计算问题和软件开发
质谱信号与定量
标记:配对的同位素峰
无标记:同位素峰
图谱定量信息提取方法
基本方法
最大值法,平滑积分法,信号求和,构建3D peaks (MaxQuant),函数拟合
附加处理
小波去噪,同位素分布约束,信噪比过滤
结果形式
标记定量:比值,定量指标
无标定量:定量指标
肽段定量指标计算
可选步骤
去噪处理:小波,平 滑滤波 XIC峰形拟合:复杂的 类高斯函数 XIC边界确定:信噪比, 连续性,局部最小 值 母离子匹配误差分布: 提高精度?
定量软件-Mascot
支持的定量类型
多种标记定量, MS/MS图谱 定量, emPAI, 重复实验 Label free, 选择信号最强的3 个肽段
数据处理算法特色
使用方法
在搜库前定义修饰和定量的参数(通过修改XML文件实现),搜库,然后 使用Distiller定量
基于m/z和RT的对齐,多种XIC积分方法,多参数鉴定结果过滤,outliers排 除,归一化处理(利用均值)
f
10
特点
i 1 10 i f 2 i 0 K 2 i 1 K 2
2 i
10 f 10 2 i i 0 f 2 i i 0 K1 i 1 K1 C i 1 C
可定义一般模式,支持自定义标记方法,支持多重标记 能够充分利用同位素分布信息 能够直接解决谱峰叠加问题
标记定量:比值计算,MaxQuant采用了最小二乘拟合法 问题:不同试剂标记的肽段XIC平移,差异越大,表现越明显 无标记定量:定量指标计算
RT对齐
LC-MS策略:寻找共同的肽段信号,建立非线 性模型 LC-MS/MS策略:利用共同鉴定肽段的RT建立 对齐模型 对齐模型:3次样条,局部回归,小波,分段线 性,偏移向量等 作用:对LC-MS/MS策略,可以弥补鉴定信息 的不足,提高MS图谱信号利用率
临床诊断 ---直接寻找差异--肽段组学,肽段特征矩阵, LC-MS策略,信号直接对比 + 有选择鉴 定
定量数据分析的基本方法
标 记 定 量 无 标 定 量
不包括MRM、iTRAQ和SC定量
计算问题
图谱定量信息提取---同位素峰簇处理 肽段定量指标计算---比值计算,XIC 处理,母离子误差校正 RT对齐---LC-MS策略和LC-MS/MS 策略的不同 信号归一化---消除系统误差 差异显著性检验---考虑信号强度影响
定量信息提取:标记定量
肽段水平
图谱比值平均,主成分分析, 最小二乘回归
实现了多种算法:XIC面积比,
采用了异常值排除策略
实现了基于XIC连续性的截断
问题:同位素峰分布测量误差
ExpIso [ i ] ERRi 6 IsoDis[i ] / IsoDis[i ], i 1 ~ 6 [i ] ExpIso i 1