聚类分析在中药研究中的运用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


聚类分析在中药研发中的用例

化合物聚类
数据:化合物的特 性(化合物结构, 化合物靶标,化合 物ADMET特性,质 谱分析结果等) 方法:根据化合物 的特性计算化合物 相似度,进行聚类 分析 结果:从分子层面 说明中药实现功能 的物质基础,确定 中药中的主要有效 成分

例:

针对步长脑心通方剂中每种化合物在靶标方面的相似性对化合 物进行聚类,结果有大量化合物聚为一类,这一类化合物靶标 都和脂蛋白,脂质的代谢、消化、运输相关,进而说明了该方 剂的主要成分,及其主要功能;
聚类分析概述

聚类分析的特点

聚类分析可以将一组数据按照本身的内在规律较合理 地分为几类,大大缩小了以往全凭主观判断所造成的 误差,使数据分析结果更具客观性。更重要的是,聚 类分析的应用可以完成以往人工所不能完成的工作。
聚类分析概述

聚类分析用于中药研究


中药复方中包括多味中药,通过不同的组合实现对疾病的 治疗; 每一种中药中包含了大量的化合物成分,不同功能的中药 中含有不同的化合物成分,也可能含有相同的成分,这些 化合物成分之间相互作用(协同或抑制)通过多靶点、多 途径而实现了药效; 因此,无论是复方还是单味中药其组成都很复杂,分析困 方剂 难;
常用聚类方法

划分的方法-以K均值方法为例
开始
读取数据
初始化K个聚类中心 将数据对象按照近邻原则分 配至各类 重新计算类中心 类中心是否 变化 否 算法结束 是 利用K均值分类:K=5 1,2,3,4,5是最后得到的聚类中心
常用聚类方法

层次聚类方法 层次聚类算法是将所有的样本点自底向上合并组 成一棵树或者自顶向下分裂成一棵树的过程,这 两种方式分别称为凝聚和分裂。
单味药 成分1 成分2 …… 成分m-1 成分m
药1 药2
药3 …… 药n
1 1
1 0 0
1 0
0 1 0
…… ……
…… …… ……
0 0
1 1 1
1 0
0 1 1
相关度

研究多个对象之间的相似性常用距离,研究指标(变 量)之间的相似性常用的有:夹角余弦和相关系数。 相关度方法


夹角余弦
r12
方剂 1 2 3 …… n
关联性度量

例子1:方剂相似性

每个方剂对应不同的功能,分别用0/1表示某种方剂是否 具有某种功能,通过关联度量来计算方剂之间的功能相 似性;
功能1
1 1 1 0 0
方剂
1 2 3 …… n
功能2
1 0 0 1 0
……
…… …… …… …… ……
功能k-1
0 0 1 1 1
功能k
1 0 0 1 1
关联性度量
例子2:中药相似性 每一味中药对应多种功能,通过关联度计算中 药在功能方面的相似性;
单味药 功能1 功能2 …… 功能k-1 功能k
药1
药2 药3 …… 药n
1
1 1 0 0
1
0 0 1 0
……
…… …… …… ……
0
0 1 1 1
1
0 0 1 1
关联性度量
例子2:中药相似性 每一味中药都包含很多成分,通过关联度计算中 药成分组成方面的相似性;
关联性度量

例子1:方剂相似性

每个方剂对应不同的中药组成,分别用0/1表示某种方剂 是否含有某味中药,通过关联度量来计算方剂之间在组 成的相似性;
中药1 0 1 0 1 0 中药2 1 0 1 0 0 …… …… …… …… …… …… 中药m-1 1 0 1 1 0 中药m 0 0 0 0 1
分类与现代客观分类之间结果的不同正是我们要思考和探索的问题。
聚类分析在中药研发中的用例

中药聚类
方法: 数据:
结果:分析聚类结果 是否符合中药的性、 味、归、经及功效, 找出不同性、味、归、 经及功效下的主要成 分,分析中药的传统 分类是否有着分子基 础
中药的组成成分
根据组成成分分析 中药间的相似度, 进行聚类
君 臣 佐 使
中药h
中药j
中药e
中药c
中药d
中药a
中药b
多种化合物
多种化合物
多种化合物
多种化合物
多种化合物
多种化合物
多种化合物
聚类分析概述

聚类分析用于中药研究

中药组成复杂这一特点使得对中 药作用机理的研究比较困难,如 果可以对这些复杂的成分进行分 类,在分类的基础上去分析每个 类内的成分特性,和类别之间的 关联,将有助于作用机理的研究。
聚类分析在中药研发中的用例

方剂聚类
数据:方剂的组 成、功效或者主 治
方法:计算方剂 (组成、功效等 方面)之间的相 似度,对方剂进 行聚类
结果:根据聚类结 果分析揭示方剂中 单药之间、方剂之 间的关系,进而揭 示方剂的配伍规律

例:
收集清代医籍中治疗噎膈的内服方剂,对其进行采集、
整理和编排,运用聚类分析总结用药规律,总结常用 有效药物,探索高频药物之间的配伍关系.
注意事项

数据的标准化问题:


以距离测度度量相似性时,聚类变量的量纲对度 量结果的影响较大,所以在计算相似测度之前, 通常需要进行标准化处理 在中药研发方法,根据中药资料等得到中药相关 信息,为了进行聚类分析,需要对这些信息进行 标准化处理,转变为统一的表示方式;
注意事项

相似性度量方法的选择:
聚类分析在中药研发中的用例

中药聚类
方法:根据不同 中药的特性计算 中药间的相似性, 进而进行聚类 结果:不同类别 中药进行划分, 对比划分结果与 传统的中药分类 方法的异同;
数据:中药的特 性或者功效等特 点

例:


对已知传统分类的解表、泻下、化湿药共5l味.根据性味归经及 功效等相关因素建立一个中药数据集.规范量化,作为自变量, 将中药药味作为因变量; 层次聚类:结果将聚类分析所得出的结果和传统的中药分类方法 大体相同,但也存在差别。 结论聚类分析方法用于中药分类有一定的可行性,从一定程度上 符合传统中药分类。归纳,整理.量化.赋值是客观分类的关键,传统主观

例:



原子吸收分光光度法检测了丹参、枸杞子等共11种中药中钾、钙、 镁、铁、锰、铜、锌和铬元素的含量; 运用模糊分类方法研究药物金属元素与药物疗效的相关性。 发现药物中金属元素含量丰富,相关系数较大的药物,其药物疗效 相似性较大,揭示中药中微量元素与药物疗效密切相关。 该研究为中药的质量评价,聚类分析为研制新型的药物提供了有用 的科学数据

欧式(Euclidian)距离
dij xi x j
xik x jk
k 1
r
n
2

明氏(Minkowski)距离
dij xi x j
r

x
k 1
n
ik
x jk
r

马氏(Mahalanobls)距离
dij xi x j 1 xi x j
类1
类4
复杂的 研究对 象
类2
类3
聚类分析相似度度量
聚类分析相似度度量

相似度度量方法

距离测度 关联性测度 相关性测度
距离测度


假设每个对象有n个相关变量,每个变量对应于一 个数值,则每个对象可以看成是n维空间的一个点, m个对象就是n维空间的m个点,通过计算两个点 之间的聚类表示相关度; 距离定义方法:
wenku.baidu.com
距离测度

例子:不同种类但药用类似的中药中往往含有相同 的化合物或金属元素,但它们含量不同,根据组成 成分的含量分析中药相关度可以采用距离测度,进而 运用聚类研究药物金属元素与药物疗效的相关性.如 下表(成分指成分的含量占整个中药的比例)
中药 1 2 3 …… m 0.022 0.04 …… 0.6 成分1 0.45 0.33 0.03 成分2 0.04 0.098 0.03 …… …… …… …… 成分n 0.31 0.12 0.24
聚类分析在中药研发中的用例

中医证候研究

目前,有很多种聚类分析的方法用于中医证候聚类分 型的研究当中。 由于对聚类分析方法优劣的评价至今尚无系统的检验 理论,因此在样品聚类分析中,常常是根据病人四诊 指标的变量类型,进行多种聚类方法下的探索性分析, 并且对每次聚类的结果结合专业知识进行判断,最后 选取较为符合专业特征的分类结果并给予临床较为合 理的证候名称。

根据分析问题的和数据不同选择不同的相似性度 量方法; 当研究对象可以用多维的数据进行量化表示可 以采用距离测度;当研究对象适合于用0/1类型 数据表示其功能或特性时则采用关联性测度; 当研究对象本事是变量时,则采用相关系数。
聚类分析方法
聚类分析方法

聚类方法 传统聚类方法:
(1)划分方法, (2)层次的方法, (3)基于密度的方法, (4)基于网格的方法, (5)基于模型的方法 其中(1)和(2)比较常用
聚类分析在中药研究中的应用
聚类分析

概述 相似性度度量 聚类分析方法 中药分析 聚类分析的应用 聚类分析的意义
概述
聚类分析概述

聚类分析

指将物理或抽象对象的集合分组成 为由类似的对象组成的多个类的分 析过程。

聚类的目的

根据已知数据,计算各观察个体或 变量之间亲疏关系的统计量(距离 或者相关系数)。根据某种准则 (最短距离法、最长距离法、中间 距离法、重心法),使得同一类内 的差别较小,而类与类之间差别较 大,最终将观察个体或变量分为若 干类。
关联性测度



当个案不能由有意义的n维数值来表示时,常根据 某些特征的存在与否来比较个案之间的相似性。 相似个案比不相似有更多的共同特征。 关联性度量时,研究对象有n个特征,可以用0/1表 示该对象是否符合某个特征,对两个研究对象各 个特征进行匹配计算其相似度。 关联性测度方法:

简单匹配系数:s=(a+d)/n;(a:1-1匹配的个数,d:0-0匹配的 个数,n:特征个数) 雅可比系数:s=a/n;

中药分析

聚类分析的方法运用到中药的分析当中,可以将功能相似 的对象(化合物/单味药/方剂/药物靶标等)聚集在一起, 将功能不同的对象区分开来,从而将中药的复杂的成分分 为几个不同的功能类别,这就从一定程度上降低了对中药 处理分析的复杂度。 在聚类的过程中,通过不同的特征的选择(比如:化合物 结构,化合物靶标,化合物ADME特性,中药的性、味、 归、经等)和相似度的定义方法,则可以从不同的角度对 化合物进行分类,从不同侧面来发现中药或复方的功能特 点及其组成规律。
X
i 1 n i 1 1i
n
1i
X 2i
n 2 2i
X X
2 i 1

Pearson相关系数
r12
(X
i 1
n
1i
X 1 )( X 2i X 2 )
2
(X
i 1
n
1i
X1 )
(X
i 1
n
2i
X 2 )2
相关度

例子:分析两味中药在某类功能的方剂中的相关 性(每个中药根据其在方剂中起到的作用进行排 序)

聚类分析在中药研发中的用例

中医证候研究

目前已经有很多聚类方法应用于中医证候分析中, 随着中医辨证的客观化、标准化的不断深入,将会 有更多的聚类分析方法运用于中医证候的聚类分析 中,而且随着更多的聚类分析方法的应用,中医证 候的聚类研究将更为客观化。
意义
聚类分析对于中药研发的意义

聚类分析的结果
方剂号 1 2 3 4 5 中药1排名 5 4 3 3 2 中药2排名 4 3 2 5 5

计算两种中药的相关性,辅助于分析两种不同中 药在实现某种药效的方剂中的相关性,进而在新 方研究中考虑对二者的处理。
相似度度量

小结

除了以上三种度量相似性的方法之外,针对中药研发中 遇到问题的实际情况,可以在这三种方法的基础上定义 新的相似性度量,以更好地表示研究对象在某个方面的 相似性程度;例如很多来自于中医药相关文献资料的关 于中医药的功效等文本的内容,则可以利用语义相似性 来分析
聚类分析在中药研发中的用例

化合物聚类

除了根据化合物性质对其聚类,另外, 每一种化合物出现在不同的中药中,针 对不同功能类型的中药,根据化合物对 应的中药对所有的化合物成分进行聚类, 从而分析化合物的划分是否符合中药的 功能类别的划分;

问题

中药的组成成分复杂,很多中药成分并 没有被识别出来或者可能是未知的化合 物,通过聚类分析有利于预测新化合物 的功能;

凝聚层次算法 分裂层次算法
图中,从上向下是凝聚方法; 从下到上是分裂方法
聚类分析方法

改进的聚类方法

系统聚类方法结合频数分析 系统聚类方法结合主成分分析 模糊聚类分析 主成分聚类分析 基于模型的神经网络聚类分析 基于扩展熵的无监督聚类分析
应用
聚类分析在中药研发中的应用
相关文档
最新文档