代谢组学方法及其研究进展(re)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样品制备方法 代谢产物分离、 检测与鉴定方法 数据分析与模型 建立方法
归一化与滤噪、非监督学习方法、有监督学习方法、 数据库及专家系统; 模型建立
“Metabolite”+”genomics” metabonomics
Metabolome metabolomics
数据分析方法和模型建立(1)
(1)归一化与滤噪 在得到分析对象的原始谱图后,首先需要对数据进行预处理 对数据进行预处理(一般包括 对数据进行预处理 归一化和滤噪) ,处理后保留与分类有关的大部分信息 消除多余的干扰因 处理后保留与分类有关的大部分信息,消除多余的干扰因 处理后保留与分类有关的大部分信息 素的影响。 素的影响 广泛应用的滤噪技术是正交信号校正技术 正交信号校正技术(orthogonal signal 正交信号校正技术 correction , OSC) 。与普通的谱图滤噪技术不同,OSC 滤掉与类别判断 ,OSC 正交(不相关) 的变量信息,只保留与类别判断有关的变量,从而使类别判别 分析能集中在这些与类别的判别相关的变量上,提高了判别的准确性。 OSC 等效于从数据中去除了额外的影响因素,因此该方法经常用于 该方法经常用于 易受环境因素影响的分析,例如在微量药物引发的生化效应中,分析结果经 易受环境因素影响的分析 常被研究对象的性别、饮食和其他环境因素所淹没,在这种情形下,应用 OSC能收到较好的效果。
数据分析方法和模型建立(5)
代谢组学分析离不开各种代谢途径和生物化学数据库 代谢途径和生物化学数据库。 代谢途径和生物化学数据库 现在主要的数据库有接连图数据库(Connections Map DB) , KEGG, EcoCyc , EcoCyc and metacyc , BRENDA , L IGAND , MetaCyc ,UMBBD , WIT2 , EMP 项目, IRIS , AraCyc ,PathDB , 生物化 学途径( ExPASy) , 互联网主要代谢途径( main metabolic pathways on Internet ,MMP) , Duke 博士植物化学和民族植物学数据库,Arizona 大学 天然产物数据库等, 其中IRIS , AraCyc 分别为水稻和拟南芥的有关数据 库。
1989年,Gartland等根据药物造成的靶器官(如肝、肾皮层或髓质毒) 损伤及程度分组,利用1HNMR对尿液进行分析,结合主成分分析 ( PCA) ,建立相应的毒理学研究模型 帮助判断新药的毒副作用与程 建立相应的毒理学研究模型,帮助判断新药的毒副作用与程 建立相应的毒理学研究模型 以及量效与时效关系。 度,以及量效与时效关系。Holmes等研究了HgCl2 (损伤近端肾小管) 以及量效与时效关系 和乙基溴(损伤肾髓质)两组肾损伤模型,观察了9天1H NMR谱的演变 情况。在肾损伤进展及恢复的过程中,尿中20种代谢物发生的改变,与 组织学的改变相一致,并存在规律性的时效关系。进一步相关分析的 基础上发现,HgCl2 的损伤是单一的直接损伤、具有可逆性;而乙基 溴则为双重损伤机制(直接损伤加上影响渗透压而造成肾乳头的间接 损伤) 、可逆性差。肝毒性研究方面亦有相类似的研究。 美国食品与药品管理局( FDA)已经接受代谢组学研究的结果作为新药 美国食品与药品管理局 已经接受代谢组学研究的结果作为新药 申报和注册的重要参考指标。代谢组学研究大大缩短了新药安全性研 申报和注册的重要参考指标 究的周期,它能够快速、有效地分析多条代谢通路,帮助定位靶组织 及判定毒副作用程度,寻找相应的生物学标志。主要采用的仍是NMR 技术,包括对各种体液、组织或组织提取液进行分析;在计算机基础上, 发展起来的数据分析模型更是发挥了巨大的推动作用。
样品制备
代谢产物的分 离、检测、鉴定
数据分析 与模型建立
代谢组学的研究方法
研究对象 单个细胞或细胞类 对生物体液和组织进行系统测量和分 型中所有的小分子 析,研究完整的生物体中代谢物随时 成分和波动规律 间改变的情况,确定生物标志物 根据不同的分析方法 采取不同的样品制备方法 GC, LC, CE - MS NMR
数据分析方法和模型建立(3)
(3)有监督(supervised ) 学习方法 这类方法用于建立类别间的数学模型,使各类样品间达到最大的 这类方法用于建立类别间的数学模型 使各类样品间达到最大的 分离,并利用建立的多参数模型对未知的样本进行预测 并利用建立的多参数模型对未知的样本进行预测。 分离 并利用建立的多参数模型对未知的样本进行预测。在这类方法 中,由于建立模型时有可供学习利用的训练样本,所以称为有监督(有师) 学习。在这种方法中经常需要建立用来确认样品归类(防止过拟合) 的 确认集(validation set) 和用来测试模型性能的测试集(test set) 。 应用于该领域的主要是基于PCA、偏最小二乘法(partial least 、偏最小二乘法 应用于该领域的主要是基于 squares, PLS) 、神经网络 neural network ,NN) 的改进方法 常用 神经网络( 的改进方法, 的有SIMCA ( soft independent modeling of class analogy) 和偏最小 偏最小 二乘法显著性分析(PLS-discriminant analysis ,PLS-DA) 。 二乘法显著性分析 作为非线性的模式识别方法,人工神经元网络(ANN)技术也得到广 泛应用。
数据分析方法和模型建立(4)
(4)数据库及专家系统 现实情况下,代谢组学的数据是非常复杂的,特别是对病理生 对病理生 理过程的研究,预将代谢物的表达谱与时间相联系,则需要借助复杂 理过程的研究,预将代谢物的表达谱与时间相联系 复杂 的模型或是专家系统进行分析。 的模型或是专家系统 为了将基于NMR 的代谢组学用于药物的毒性筛选,伦敦大学的 皇家科学院实验室和Pfizer 等6 家制药公司于2001 年1 月启动了一个 为期3 年的关于药物毒性研究的研究小组(COMET) ,拟在药物的发现 到开发阶段用代谢组学的方法来评价药物的毒性,以缩短药物开发的时 间,减少损失,并试图建立一个用于药物毒性预测 预测的专家系统。该专家 预测 系统分为3 个独立的级别:正常/ 异常的判别、对未知样本进行数据库 中已知毒性或疾病的识别、病理学的生物标记物的识别。
代谢组学的应用
生理条件对代谢谱的影响 生物学研究领域 农业和食品领域 医药领域 疾病诊断和发病机理探讨
代谢组学的应用(1)
(1)生理条件对代谢谱的影响:
建立生理条件下对代谢谱的正确认识,是研究各种病理条件或刺激干 预的前提。目前运用NMR技术对生理状态的研究已取得了一些进展。
代谢组学的ห้องสมุดไป่ตู้用(2)
对比几个基本概念
研究对象 基因组学 genomics
核酸(A、T/U、C、G )
研究方法
以测序为主
转录组学 transcriptomics 蛋白质组学 proteomics 代谢组学
由20个氨基酸构成 代谢产物则以元素组成、 原子排列、立体结构和分 子特征来区分
差异显示、减法杂交、 DNA芯片技术等 同位素亲和标签、2D-MS技术
数据分析方法和模型建立(2)
(2)非监督(unsupervised) 学习方法 这类方法用于从原始谱图信息或预处理后的信息中对样本进行归 类,并采用相应的可视化技术直观的表达出来。该方法将得到的分类信 该方法将得到的分类信 息和这些样本的原始信息(如药物的作用位点或疾病的种类等)进行比较 进行比较, 息和这些样本的原始信息 进行比较 建立代谢产物与这些原始信息的联系,筛选与原始信息相关的标记物 筛选与原始信息相关的标记物,进 建立代谢产物与这些原始信息的联系 筛选与原始信息相关的标记物 进 而考察其中的代谢途径。 而考察其中的代谢途径。 用于这个目的的方法没有可供学习利用的训练样本,所以称为非监 督(无师) 学习方法。应用在此领域的方法有: 主成分分析 主成分分析(principal componentsanalysis , PCA) 、非线性映射 nonlinear mapping ,NLM) 、 非线性映射( 非线性映射 簇类分析(hierarchical cluster analysis ,HCA) 等。 簇类分析
什么是代谢组学?
“代谢组学” = “代谢” + “组 学”
基因组学 genomics
DNA
转录组学 transcriptomics
mRNA
蛋白质组学 proteomics
Pr
代谢组学
研究一个细胞、组织或器官中,所有……的一门科学!
代谢组学的定义
代谢组指的是“一个细胞、组织或器官中, 所有代谢组分的集合,尤其指小分子物质”,而代 谢组学则是一门“在新陈代谢的动态进程中,系 统研究代谢产物的变化规律,揭示机体生命活动 代谢本质”的科学。它所关注的是相对分子质 量为1,000以下的小分子。
代谢组学的应用(4)
(4)医药领域:
药物安全性评价 细胞中代谢物和组织中代谢物处于生物体液的动态 平衡,机体中生物体液成分的变化反映了中毒或代谢损害而引起的细 胞功能异常。利用高分辨率的1H NMR 波谱可检测血浆、尿液、胆汁 等生物基质中的具有特殊意义的微量物质的异常成分,而且可以同时 对所有代谢物进行定量分析,且几乎不需要样品的前期准备,对任何 成分都有相同的灵敏度。1H NMR 谱所检测到的生物体液中的内源性 代谢物,完全依赖于动物体内的毒素类型;每一种类型的毒物和药物 都会在生物体液中产生特征的内源代谢物浓度和模式变化,这种特征 提供了毒性作用的机理和作用位置的信息,使先导化合物筛选更有效, 为新药临床前安全性评价提供可靠的技术支持与保障。因此,代谢组 学在毒物药物学的研究中发挥了极其重要的作用。
(2)生物学研究领域:
作为基因型与表型之间的桥梁, 代谢组学将基因产物和基因关联起来, 作为基因型与表型之间的桥梁 代谢组学将基因产物和基因关联起来 实现基因 功能的鉴定。 功能的鉴定。转基因生物和敲除突变体(knockout mutants) ,往往没有明显的 表型变化。比如拟南芥中就有90 %的突变体是沉默型突变体,人们很难通过表 现型的变化来确定有关基因的功能。而转基因生物和敲除突变体中某些代谢产 物的含量却常常会发生变化。通过代谢产物水平变化的分析 就可以把它们与 通过代谢产物水平变化的分析, 通过代谢产物水平变化的分析 野生型区分开来。 野生型区分开来。 将代谢组学技术与功能基因组学手段相结合,通过代谢产物的变化能成功推断 推断 有关基因的功能。Metanomics 公司的成立就是一个典型的代表,其思想就是 有关基因的功能 遵循代谢组学的研究方法,在改变植物的基因后,进行植物的代谢分析或记录 代谢产物,进而寻找植物代谢过程中的关键基因,如能够让植物耐寒的基因等; Fiehn 研究小组的利用GC/MS 技术,通过对不同表型阿拉伯荠的433 种代谢产 物进行代谢组学分析,结合化学计量学方法(PCA、ANN 和HCA) 对这些植物的 表型进行了分类,找到了4 种在分类中起着重要作用的代谢物质 种在分类中起着重要作用的代谢物质:苹果酸(malic acid) 、柠檬酸、葡萄糖和果糖,结果与线粒体和叶绿体中的基因型结果一致。
检测代谢产物的方法各 不相同
基因与蛋白质的表达紧密相连,代谢物则更多地反映了细胞所处的环境。正如 Billy David所言:“基因组学和蛋白质组学告诉你可能发生什么,而代谢组学则告诉你 已经发生了什么” 。
代谢组学研究过程
代谢组学研究过程包括:前期 的样品制备,中期的代谢产物分离、 检测与鉴定以及后期的数据分析与 模型建立三个部分。
代谢组学方法及其研究进展
2005.11.23.
代谢组学的历史
代谢组学的研究可以追溯至上世纪80 年代。 1985 年,英国帝国理工大学教授Nicholson的研究 小组利用核磁共振(NMR)技术分析大鼠的尿液, 并 于1999年,提出了代谢组学的概念。Nicholson教授 也由于其在代谢组学发展中的开拓性的贡献,而被 誉为“国际代谢组学之父”。
代谢组学的应用(3)
(3)农业和食品领域:
代谢组学技术通过促进植物基因功能组学的研究工作, 来加快农作物 加快农作物 品质改良的进程。 品质改良的进程 通过比较转基因生物和其野生型在代谢产物方面的差别, 来对转基因 对转基因 生物及其食品进行安全性评估。Roesnner 生物及其食品进行安全性评估 Roesnner 等人利用代谢组分析技术 对转基因植物进行了研究, 他们利用GS/ MS 分析技术对马铃薯块茎中 150 种化合物进行了定量和定质分析, 确定了过度表达葡萄糖激酶、 葡萄糖磷酸酶等不同基因之转基因植株的生物化学表现型。