[医学]聚类分析在中药研究中的运用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

药n
0
0
……
功能k-1 0 0 1 1 1
功能k 1 0 0 1 1
关联性度量
例子2:中药相似性 每一味中药都包含很多成分,通过关联度计算中 药成分组成方面的相似性;
单味药
成分1
成分2
……
药1
1
1
……
药2
1
0
……
药3
1
0
……
……
0
1
……
药n
0
0
……
成分m-1 0 0 1 1 1
成分m 1 0 0 1 1 中药聚类Fra bibliotek数据:
中药的组成成分
方法:
根据组成成分分析 中药间的相似度,
进行聚类
结果:分析聚类结果 是否符合中药的性、 味、归、经及功效, 找出不同性、味、归、 经及功效下的主要成 分,分析中药的传统 分类是否有着分子基

例:
原子吸收分光光度法检测了丹参、枸杞子等共11种中药中钾、钙、 镁、铁、锰、铜、锌和铬元素的含量;
中药 1 2 3 …… m
成分1
成分2
……
0.45
0.04
……
0.33
0.098
……
0.03
0.03
……
0.022
0.04
……
成分n 0.31 0.12 0.24
0.6
关联性测度
当个案不能由有意义的n维数值来表示时,常根据 某些特征的存在与否来比较个案之间的相似性。 相似个案比不相似有更多的共同特征。
在聚类的过程中,通过不同的特征的选择(比如:化合物 结构,化合物靶标,化合物ADME特性,中药的性、味、 归、经等)和相似度的定义方法,则可以从不同的角度对 化合物进行分类,从不同侧面来发现中药或复方的功能特 点及其组成规律。
聚类分析在中药研发中的用例
化合物聚类
数据:化合物的特 性(化合物结构, 化合物靶标,化合
聚类分析在中药研发中的用例
中药聚类
数据:中药的特 性或者功效等特

方法:根据不同 中药的特性计算 中药间的相似性, 进而进行聚类
结果:不同类别 中药进行划分, 对比划分结果与 传统的中药分类
方法的异同;
例:
对已知传统分类的解表、泻下、化湿药共5l味.根据性味归经及 功效等相关因素建立一个中药数据集.规范量化,作为自变量, 将中药药味作为因变量;
聚类分析概述
聚类分析用于中药研究
中药组成复杂这一特点使得对中
药作用机理的研究比较困难,如
类1
果可以对这些复杂的成分进行分
类,在分类的基础上去分析每个
复杂的
类内的成分特性,和类别之间的 类4
研究对 象
类2
关联,将有助于作用机理的研究。
类3
聚类分析相似度度量
聚类分析相似度度量
相似度度量方法
重新计算类中心
类中心是否 变化

否 算法结束
利用K均值分类:K=5 1,2,3,4,5是最后得到的聚类中 心
常用聚类方法
层次聚类方法 层次聚类算法是将所有的样本点自底向上合并组
成一棵树或者自顶向下分裂成一棵树的过程,这 两种方式分别称为凝聚和分裂。
凝聚层次算法 分裂层次算法
图中,从上向下是凝聚方法; 从下到上是分裂方法
相似度度量
小结
除了以上三种度量相似性的方法之外,针对中药研发中 遇到问题的实际情况,可以在这三种方法的基础上定义 新的相似性度量,以更好地表示研究对象在某个方面的 相似性程度;例如很多来自于中医药相关文献资料的关 于中医药的功效等文本的内容,则可以利用语义相似性 来分析
注意事项
数据的标准化问题:
i 1
n
n
( X1i X1)2 ( X 2i X 2 )2
i 1
i 1
相关度
例子:分析两味中药在某类功能的方剂中的相关 性(每个中药根据其在方剂中起到的作用进行排 序)
方剂号 1 2 3 4 5
中药1排名 5 4 3 3 2
中药2排名 4 3 2 5 5
计算两种中药的相关性,辅助于分析两种不同中 药在实现某种药效的方剂中的相关性,进而在新 方研究中考虑对二者的处理。
聚类分析概述
聚类分析的特点
聚类分析可以将一组数据按照本身的内在规律较合理 地分为几类,大大缩小了以往全凭主观判断所造成的 误差,使数据分析结果更具客观性。更重要的是,聚 类分析的应用可以完成以往人工所不能完成的工作。
聚类分析概述
聚类分析用于中药研究
中药复方中包括多味中药,通过不同的组合实现对疾病的 治疗;
聚类分析在中药研究中的运用
聚类分析
概述 相似性度度量 聚类分析方法 中药分析 聚类分析的应用 聚类分析的意义
概述
聚类分析概述
聚类分析
指将物理或抽象对象的集合分组成 为由类似的对象组成的多个类的分 析过程。
聚类的目的
根据已知数据,计算各观察个体或 变量之间亲疏关系的统计量(距离 或者相关系数)。根据某种准则 (最短距离法、最长距离法、中间 距离法、重心法),使得同一类内 的差别较小,而类与类之间差别较 大,最终将观察个体或变量分为若 干类。
每个方剂对应不同的中药组成,分别用0/1表示某种方 剂是否含有某味中药,通过关联度量来计算方剂之间在 组成的相似性;
方剂 1 2 3 …… n
中药1
中药2
……
0
1
……
1
0
……
0
1
……
1
0
……
0
0
……
中药m-1 1 0 1 1 0
中药m 0 0 0 0 1
关联性度量
例子1:方剂相似性
每个方剂对应不同的功能,分别用0/1表示某种方剂是 否具有某种功能,通过关联度量来计算方剂之间的功能 相似性;
相关度
研究多个对象之间的相似性常用距离,研究指标(变 量)之间的相似性常用的有:夹角余弦和相关系数。
相关度方法
夹角余弦
r12
n
X1i X 2i
i 1
n
n
X1i2 X 2i2
i 1
i 1
Pearson相关系数
r12
n
( X1i X1)( X 2i X 2 )
对中药相关的研究对象进行聚类分析,根据不同的问题 从不同角度将研究对象划分为不同的类别,类别内的研 究对象有着相似的特点,类间的对象则有所不同;但是 类别之间也可能包含着某种意义的关联;
聚类分析在中药研发中的用例
化合物聚类
除了根据化合物性质对其聚类,另外, 每一种化合物出现在不同的中药中,针 对不同功能类型的中药,根据化合物对 应的中药对所有的化合物成分进行聚类, 从而分析化合物的划分是否符合中药的 功能类别的划分;
问题
中药的组成成分复杂,很多中药成分并 没有被识别出来或者可能是未知的化合 物,通过聚类分析有利于预测新化合物 的功能;
层次聚类:结果将聚类分析所得出的结果和传统的中药分类方法 大体相同,但也存在差别。
结论聚类分析方法用于中药分类有一定的可行性,从一定程度上 符合传统中药分类。归纳,整理.量化.赋值是客观分类的关键,传统主观
分类与现代客观分类之间结果的不同正是我们要思考和探索的问题。
聚类分析在中药研发中的用例
聚类分析方法
聚类分析方法
聚类方法 传统聚类方法:
(1)划分方法, (2)层次的方法, (3)基于密度的方法, (4)基于网格的方法, (5)基于模型的方法 其中(1)和(2)比较常用
常用聚类方法
划分的方法-以K均值方法为例
开始
读取数据
初始化K个聚类中心
将数据对象按照近邻原则分 配至各类

方法:计算方剂 (组成、功效等 方面)之间的相 似度,对方剂进
行聚类
结果:根据聚类结 果分析揭示方剂中 单药之间、方剂之 间的关系,进而揭
示方剂的配伍规律
例:
收集清代医籍中治疗噎膈的内服方剂,对其进行采集、 整理和编排,运用聚类分析总结用药规律,总结常用 有效药物,探索高频药物之间的配伍关系.
运用模糊分类方法研究药物金属元素与药物疗效的相关性。 发现药物中金属元素含量丰富,相关系数较大的药物,其药物疗效
相似性较大,揭示中药中微量元素与药物疗效密切相关。 该研究为中药的质量评价,聚类分析为研制新型的药物提供了有用
的科学数据
聚类分析在中药研发中的用例
方剂聚类
数据:方剂的组 成、功效或者主
xik x jk
k 1
明氏(Minkowski)距离
r
dij
xi x j

r
n
r
xik x jk
k 1
马氏(Mahalanobls)距离

dij xi xj
1 xi x j
距离测度
例子:不同种类但药用类似的中药中往往含有相同 的化合物或金属元素,但它们含量不同,根据组成 成分的含量分析中药相关度可以采用距离测度,进而 运用聚类研究药物金属元素与药物疗效的相关性.如 下表(成分指成分的含量占整个中药的比例)
以距离测度度量相似性时,聚类变量的量纲对度 量结果的影响较大,所以在计算相似测度之前, 通常需要进行标准化处理
在中药研发方法,根据中药资料等得到中药相关 信息,为了进行聚类分析,需要对这些信息进行 标准化处理,转变为统一的表示方式;
注意事项
相似性度量方法的选择:
根据分析问题的和数据不同选择不同的相似性度 量方法; 当研究对象可以用多维的数据进行量化表示可 以采用距离测度;当研究对象适合于用0/1类 型数据表示其功能或特性时则采用关联性测度; 当研究对象本事是变量时,则采用相关系数。
关联性度量时,研究对象有n个特征,可以用0/1 表示该对象是否符合某个特征,对两个研究对象 各个特征进行匹配计算其相似度。
关联性测度方法:
简单匹配系数:s=(a+d)/n;(a:1-1匹配的个数,d:0-0匹 配的个数,n:特征个数)
雅可比系数:s=a/n;
关联性度量
例子1:方剂相似性
聚类分析在中药研发中的用例
中医证候研究
目前已经有很多聚类方法应用于中医证候分析中, 随着中医辨证的客观化、标准化的不断深入,将会 有更多的聚类分析方法运用于中医证候的聚类分析 中,而且随着更多的聚类分析方法的应用,中医证 候的聚类研究将更为客观化。
意义
聚类分析对于中药研发的意义
聚类分析的结果
聚类分析方法
改进的聚类方法
系统聚类方法结合频数分析 系统聚类方法结合主成分分析 模糊聚类分析 主成分聚类分析 基于模型的神经网络聚类分析 基于扩展熵的无监督聚类分析
应用
聚类分析在中药研发中的应用
中药分析
聚类分析的方法运用到中药的分析当中,可以将功能相似 的对象(化合物/单味药/方剂/药物靶标等)聚集在一起, 将功能不同的对象区分开来,从而将中药的复杂的成分分 为几个不同的功能类别,这就从一定程度上降低了对中药 处理分析的复杂度。
距离测度 关联性测度 相关性测度
距离测度
假设每个对象有n个相关变量,每个变量对应于一 个数值,则每个对象可以看成是n维空间的一个点, m个对象就是n维空间的m个点,通过计算两个点 之间的聚类表示相关度;
距离定义方法:
欧式(Euclidian)距离
n
2
dij xi x j
聚类分析在中药研发中的用例
中医证候研究
目前,有很多种聚类分析的方法用于中医证候聚类分 型的研究当中。
由于对聚类分析方法优劣的评价至今尚无系统的检验 理论,因此在样品聚类分析中,常常是根据病人四诊 指标的变量类型,进行多种聚类方法下的探索性分析, 并且对每次聚类的结果结合专业知识进行判断,最后 选取较为符合专业特征的分类结果并给予临床较为合 理的证候名称。
方剂 1 2 3 …… n
功能1
功能2
……
1
1
……
1
0
……
1
0
……
0
1
……
0
0
……
功能k-1 0 0 1 1 1
功能k 1 0 0 1 1
关联性度量
例子2:中药相似性 每一味中药对应多种功能,通过关联度计算
中药在功能方面的相似性;
单味药
功能1
功能2
……
药1
1
1
……
药2
1
0
……
药3
1
0
……
……
0
1
……
物ADMET特性,质 谱分析结果等)
方法:根据化合物 的特性计算化合物 相似度,进行聚类
分析
结果:从分子层面 说明中药实现功能 的物质基础,确定 中药中的主要有效
成分
例:
针对步长脑心通方剂中每种化合物在靶标方面的相似性对化合 物进行聚类,结果有大量化合物聚为一类,这一类化合物靶标 都和脂蛋白,脂质的代谢、消化、运输相关,进而说明了该方 剂的主要成分,及其主要功能;
每一种中药中包含了大量的化合物成分,不同功能的中药 中含有不同的化合物成分,也可能含有相同的成分,这些 化合物成分之间相互作用(协同或抑制)通过多靶点、多 途径而实现了药效;
因此,无论是复方还是单味中药其组成都很复杂,分析困
难;
方剂



使
中药h
中药j
中药e
中药c
中药d
中药a
中药b
多种化合物 多种化合物 多种化合物 多种化合物 多种化合物 多种化合物 多种化合物
相关文档
最新文档