复杂网络方法在数据挖掘的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3页 共6页
痰湿蕴肺、痰瘀阻肺、痰热壅肺)分别建立困难网络子网络,运用 派系过滤算法发觉含药在 10 以上的根本方;李茹等[11]通过引入 ቤተ መጻሕፍቲ ባይዱ性扩展图建立治疗肺痿中药用药的困难网络模型,运用 CPM 派 系算法,设定 k 值为 4,共获得 19 个有价值的药物社团。
2.2 局部扩展算法 该方法主要采纳局部扩张的方法,依据扩展特性而快速确定 社团范围的一种贪心算法。2022 年,Lancichinetti 等[12]首次提 出了局域扩展的重叠社团挖掘算法(LocalFitnessMeasureLFM)。 该方法首先随机选择一个种子节点,然后遵照规那么不断地向外 扩张构建社团,当适应函数到达局部最优时完成构建过程。这种方 法由于设计简洁,快速有效,在中医药配伍挖掘领域应用广泛;周 伟等在建立肺痿用药困难网络的根底上,定义了一个节点对社团 的效用度增量,采纳 LFM 贪心算法的思想选择核心药物作为种子 节点进展社团扩展,共发觉 30 个药物组合;韩楠等[13]依据中药 方剂特性并结合点互式信息构建 TCM 网络模型,基于 LFM 算法改良 社团扩展方法,实现中药配伍组合的有效挖掘;杨铭等[14]通过对 药物配伍网络的极大团求解算法(LFM 算法的改良)得到中医药治 疗肺癌的核心有效处方;严明等[15]针对连花清瘟胶囊治疗上呼 吸道感染临床用药方案建立困难网络,运用基于 Louvain 聚类方 法(一种局部扩展算法)进展分析与探究。 2.3 标签传递算法
第4页 共6页
Zhu 等 人 [16] 首 先 提 出 了 标 签 传 递 算 法 (LabelPropa-gationAlgorithmLPA)的概念,该算法的思想是首先 为每一个节点添加一个唯一的标签,然后依据该节点四周邻居节 点中出现频率最高的标签来更新该节点的标签,最终将具有一样 标签的节点归为同一社团。该方法最早应用于非重叠社团的发 觉,Gregory[17]基于该算法进展了改良,将每个节点可标记标签 的个数设置为多个(COPRA 算法),从而实现了重叠社区的发觉,如 图 1 所示是该方法的运算过程。标签传递算法是目前中药配伍困 难网络方法中应用较多的一种,孙道同等[18]依据方剂药物奉献 度进展组网,运用改良的标签传递算法 COPRA 进展社团发觉,挖掘 中药配伍规律;吕庆莉[1]以脑血管疾病用药为例构建中药用药属 性扩展网络,并运用改良的重叠社团发觉算法 CO-PRA 进展方剂配 伍规律的开掘和分析;马宁等[19]在构建中药困难网络引入了方 剂中“君臣佐使”药物权重及药量,运用一种保存历史标签的标 签传递算法 SLPA 进展配伍规律的挖掘;张胤颖[20]建立药物节点、 药物性味节点、药物归经节点、药物成效节点 4 种节点的风湿方 剂用药困难网络模型,并运用 COPRA 算法进展用药社团获得。
第2页 共6页
合作用,为中药治疗疾病的分子机制供应了一种分析思路。这些尝 试使利用困难网络方法进展中药配伍规律挖掘的应用更加广泛。
2 困难网络进展中医药数据挖掘的方法 中药困难网络中药物配伍发觉的过程可以归结为困难网络社 团检测算法的应用。社团检测(CommunityDetection)又称为社团 发觉,该方法基于聚类的思想来实现具有一样特性节点的聚集。 2004 年,Newman 提出了一种模块度(Modularity)的概念,从而使 得网络社团划分的优劣可以有一个明确的评价指标来衡量[7],使 得社团发觉算法更加的系统化。遵照聚集的结果可以将社团发觉 算法归为非重叠社团发觉和重叠社团发觉两种,这里的主要差异 是同一节点是否会划分到多个聚类社团当中,很明显在中药配伍 规律探究中一种药可以出此时此刻多个配伍之中。因此,针对中药 配伍规律的探究主要采纳的是重叠社团发觉算法,目前常用的方 法主要有如下三种[8]: 2.1 派系过滤算法 派 系 过 滤 算 法 [9](CliquePercolationMethodCPM) 是 第 一 个 被提出的重叠社团发觉算法,该方法将社团定义为一类由全连通 子图构成的集合,从网络中找出全部大小为 k 的全连通子图作为 一个社团,由于一个点可以在多个连通子图中,因此可实现重叠社 团的发觉。运用 CPM 算法进展中药配伍规律探究在早期应用的比 拟多。黄源等[10]针对慢性堵塞性肺疾病的 4 种证型(肺肾两虚、
作者:马宁 邢俊凤 宋宽 单位:内蒙古科技大学包头医学院 计算机科学与技术学院
第6页 共6页
中药复方是指在遵循中医用药规那么的前提下,运用多种药 物混合组成的方剂。方剂中药物之间的配伍组合有着困难的联系 和约束,这种联系和约束是依据药物作用、禁忌关系、药性药效、 病症原由等所建立的具有科学依据的相互关系。通过探究方剂中 药物配伍关系,对于提醒用药配伍合理性、建立健全用药科学依据 具有重要的意义。传统的中药配伍数据挖掘方法基于统计学的探 究方法,如统计值法、聚类算法、关联规那么方法等,这些方法只 能挖掘浅层次的药物间关系,但无法提醒药物间深层次的联系[1]。 而困难网络方法的引入可以为探究重要配伍规律供应新的方法和 手段。
3 总结与展望 本文探讨了运用困难网络重叠社团发觉算法进展中药配伍规 律挖掘的几种方法,涵盖面并不必须很全,但包含了几种主要的挖 掘方法,虽然这些方法各自有各自的优势,但也都存在改良的地方,
第5页 共6页
例如,派系过滤算法的挖掘效果受 k 值设定大小的影响很大,局部 扩展算法受备选种子质量的好坏影响,标签传递算法识别精度不 稳定,须要人为设定阈值等诸多问题,但这些方法供应给了探究人 员进展中药复方配伍规律挖掘的一些新思路和新手段,同时供应 了一些有价值的探究成果。在将来随着在这些方法上的持续改良 以及与中药理论的深度结合,坚信会产生更多有价值和意义的探 究成果。
复杂网络方法在数据挖掘的应用
运用困难网络方法进展中药配伍规律挖掘相比于传统方法扩 展性更强,挖掘深度更深,目前已成为分析和探究重要配伍规律的 有力工具。本文在介绍困难网络相关概念的根底上,给出了运用重 叠社团发觉算法进展中药配伍规律挖掘的三种主要方法,并介绍 了这些方法在中药配伍规律探究中应用的案例。最终对相关方法 进展总结和展望。
1 困难网络概述 困难网络(ComplexNetwork),是一种特别的网络构造,它是将 困难系统中的元素抽象为节点,元素间的关系抽象成边的网络构
第1页 共6页
造模型,并不是全部的网络都属于困难网络,它须要满意如下的三 个特征:(1)小世界特性(SmallWorld),即网络中点与点之间的特 征路径长度值小,接近随机网络,但网络的聚合系数却很高,接近 规那么网络[2]。(2)无标度特性(Scale-free),即在网络中少数节 点的度值会很大,而大局部节点却很小,节点的度值分布符合幂率 分布规律[3]。(3)社团构造特性,困难网络中的节点往往会呈现出 集群特性,即社团区域内部节点之间的联系特别强,而社团内节点 与社团外节点的联系明显减弱。由于中医用药博大精深,方剂中药 物类型多且配伍关系困难,这种关系很适合利用困难网络模型来 表达,同时诸多论文也验证了运用药物作为节点,药物间关系作为 边所建立的网络模型具有困难网络的相关特性,基于建立在中药 困难网络模型上的数据挖掘方法已经成为分析中医用药配伍规律, 说明中药配伍科学内涵的有力工具。近年来,凭借困难网络良好的 扩展性和内在开掘机制,使得困难网络与中药理论得到了有机地 结合,孙正等[4]提取药物药性中的“性味”“归经”“成效”, 在向量空间模型上建立药物属性模型,提出了一种基于药物属性 相像度的度量方法,并运用困难网络方法进展分析;周伟等[5]从 药物与病症关系角度,基于药物在方剂中出现的次数,提出药物效 用度的概念,并进展组网和核心药物配伍规律挖掘;刘思鸿等[6] 通过网络药理学方法构建“中药-成分-靶点-疾病”网络,可从靶 点的作用通路和功能角度,说明中药复方的多通路、多层次协同整
相关文档
最新文档