数据挖掘技术在中医药现代化研究中的应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据挖掘技术在中医药现代化研究中的应用

吴立旗1童文新2徐凤芹3

摘要:信息技术的发展促进越来越多的传统中医药数据建成数据库,这无疑将会大大加快中医药现代化研究的进程。然而,随着数据量的激增,以及中医药数据特有的不完整性、表达形式多样化、数据的规范性较差等特点,传统的一些数据统计方式已比较难以有效的得出可靠结论。在解决复杂性、非线性问题方面,数据挖掘技术因其可从大量的、不完全的、有噪声的、模糊的随机数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用的信息和知识,所以将数据挖掘技术应用于中医药研究已经逐渐成为当前中医药科研领域的共识和一个新的热点。本文对当前数据挖掘在中医诊断、证候分析、方剂配伍以及中西医结合领域方面的一些应用进行了综述,认为寻找、开发出灵敏度、准确度均较高的适合中医药领域研究的数据挖掘算法至关重要,数据挖掘技术可望成为发展中医药现代化的重要工具。

传统的中医治疗是在辨证论治思维模式的指导下确立的理-法-方-药的治疗体系,是中医学的特色和精髓。然而,这种传统的中医辨证方法深受医师的经验、水平和学术流派等多方面因素的影响,致使中医的辨证论治主观性强、可重复性差,严重束缚了中医学的发展与推广。因此,如何将中医学从依赖于经验的不精确状态发展为定量的精确科学就成为中医现代化的一大挑战。

随着现代计算机技术的迅速发展,越来越多的中医药数据库被建立,数据量急剧增加,人们迫切希望能够采用新的技术对这些数据进行提炼,从中寻找有用的知识和规律,对中医的诊断、辨证、用药等方面进行规范化,从而促进中医药事业的发展与推广。面对中医药数据的不完整性、表达形式多样化、数据的规范性较差等特点,选择可以处理大量不完整的模糊数据的方法对中医药领域的数据进行分析显得至关重要。而数据挖掘就是从大量的、不完全的、有噪声的、模糊

1作者简介:吴立旗,女,北京中医药大学博士研究生在读

2作者简介:童文新,女,中国中医科学院西苑医院高干科副主任医师

3通讯作者:徐凤芹,女,中国中医科学院西苑医院,高干科主任医师,博士生导师

Email:xufengqin2000@y

的随机数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用的信息和知识。

近年来,数据挖掘技术已经逐渐得到中医药研究领域的关注,已有不少的研究采用数据挖掘技术得到了很多非常有意义的结果。本文通过对当前已经发表的文献进行检索,对数据挖掘技术在中医药研究的应用进行了综述,希望能够对促进数据挖掘技术在中医药研究更深入、更广泛的应用有所裨益。

目前数据挖掘技术在中医药研究的应用可大致分为以下几个方面;

1 在中医诊断、证候分析中的应用

近十年来,数据挖掘技术以其解决复杂性、非线性问题的良好能力被应用在中医诊断手段客观化、诊断规则提取和证候诊断模型的研究上,显示出良好的前景[1]。证候研究主要包括证候的基本特征、诊断标准与规范化等研究[2]。传统的统计方法基于正态分布假设,要求变量间相互独立并采用线型模型,中医证候复杂的非线性关系使得应用传统的统计方法无法深刻反映出中医的证候分布规律。数据挖掘可通过大量的临床数据模拟中医专家的诊断推理过程,发现证候和症状之间的关系[2]。

王学伟等[3]应用贝叶斯网络方法, 通过对474例血瘀证临床诊断数据进行血瘀证定量诊断与分析,结果发现血瘀证有7个关键症状, 通过定量计算其对血瘀证诊断的贡献度,建立了简单的贝叶斯分类器模型,此模型对血瘀证诊断的准确率达到了96.6%;该研究认为,从对血瘀证数据的分析结果来看,贝叶斯网络技术适合于解决中医定量诊断问题,应用贝叶斯网络等数据挖掘技术,有助于摸索出中医定量诊断的新方法,将有可能带来中医定量诊断研究的突破。徐蕾等[4]采用基于信息熵的决策树C4.5算法建立了慢性胃炎的中医辨证模型,筛选出对辨证分型有意义的26个因素并按其重要程度排序,建立了能区分各类证型并具有较高灵敏度和特异度的中医辨证模型;研究者认为决策树C4.5算法建立的模型效果较好,可用于慢性胃炎中医证型的鉴别诊断。李建生[5]、李亚[6]等人采用人工神经网络、模糊系统,获得有关疾病常见证候诊断标准的自适应模糊推理系统模型,结果经测试数据检验,诊断符合率较高,从而认为其模型适用于中医证候诊断标准的研究且方法合理。谢雁鸣等[7]采用决策树方法对原发性骨质疏松症的阴虚和阳虚两个证候因素进行探讨,结果显示训练集的判误率较低,同时采用聚类的方

法得出了原发性骨质疏松症的7个主要证候类型。孙继佳[8]等人采用粗糙集与支持向量机结合的数据挖掘方法对所收集的293例中医肝硬化患者进行辨证分型研究,结果采用粗糙集约简后其辨证的准确率为84.4%左右,此种数据挖掘方法在中医辨证方面有较高的可靠性。

2 在方剂配伍中的应用

所谓方剂配伍,可以简单理解成把两种以上的中药配在一起使用,能够发挥出中药的协同作用。蒋永光[9]认为数据挖掘适用于方剂配伍规律研究,因为方剂是集中医之理、法、方、药为一体的数据集合,具有以“方-药-证”为核心的多维结构,数据信息量巨大,而且中医辨证论治充满非线性思维,“方-药-证”间具有多层关联,数据挖掘能以线性和非线性方式解析数据,能进行高层次的知识整合,又善于处理模糊和非量化数据,因而具有解决这一问题的技术特征和条件。采用数据挖掘技术进行中药方剂配伍规律的研究,既能为中医新药的临床和实验研究提供目标和思路,减少盲目性,缩短研究周期;同时又能为大量古今验方研究探索出一条有价值的研究途径和方法[9]。

目前,在研究方剂配伍中的药对及药组间规律时,大多数学者[6, 10-13]均采用关联规则的数据挖掘方法对其进行研究,并得出了对临床有指导意义的结论,也证实了关联规则的挖掘方法在方剂配伍中应用的可行性。姚美村等[10]应用关联规则的方法,在单味药层次上进行消渴病复方组成药味之间的关联模式进行研究,结果发现不同专家在针对不同症状的治疗方法与对消渴病的认识和治疗原则基本一致,他认为数据挖掘技术能为核心处方的提取提供技术支持。陈波等[11]采用关联规则技术对李东垣脾胃方的配伍规律进行分析,总结出李东垣常用的药对及药组及其随症加减的用药规律,当然,如果想要生成一个可操作的数据挖掘系统,还需要足够的数据集支持进行测试、验证、训练,才能不断提高关联分析的准确率。张承江等人[12]收集了中医古籍文献中有名称的中医肾病治疗方剂,并建立相应的数据库,然后应用关联规则挖掘算法对该数据库进行复方配伍规律的研究,提出了一种肾病中医治疗信息的关联规则挖掘算法,实验结果证明该算法是实用而有效的。

3 在现代中西医结合领域中的应用

近年来,随着中医、西医、中西医结合在国内并存局面的出现,中医临床遣

相关文档
最新文档