数据挖掘在中医文献研究中的应用
数据挖掘在中医学术流派研究中的应用
摘 要 :在中医学术流派研究中 存在着大量的数据, 利用数据挖掘技术可以获得隐藏在这些数据中的有用信息。文章结
合赵炳南学术流 派研 究的实例 , 简要 阐述 了利用数据挖掘进行 中医学术流派研究 的可行性 和先进性 , 并提 出 了数 据挖掘 的实施 步骤和具体的工具 、 算法 。
.
相关 , 这在 国际国内均未见相应的科研报道 。 指导意义 , 有利于解决 医疗 纠纷 。 通过本课题 的研究 , 总结 出肛 管直肠 功能与疾病 本身 、 治疗 手段密切相关 , 多病 种、 大范围 的研究提供 了更科学 、 可靠的数 参 考文 献 : 更 据, 避免 了单个病种的研究对 肛肠科 临床 医生 的不利影 响 , 多种 [ 1] 黄乃健.肛肠解 剖学 [ . M] 济南 : 山东科学技术出版社 ,96: .4 19 18 . 手术方式的比较为 医生提供 了手术改进方式 的依据 , 并通 过科学 [ 张东铭. 2] 盆底与肛门病学 [ . M] 贵阳: 贵州科技出版社 ,00, ,7, 20 l l l 2 7 l 4. 8, 5, 6, 4 的数据进行评定 , 使其 量化 , 避免 了医生 对临床症状 的主观臆 测 [ 3] 张东铭.盆底与肛 门病学 [ . M] 贵阳: 贵州科技出版社,00:. 20 1 和患者的 自主描述形成的误 区, 肛管直肠功能的鉴定有 重要 的 对
◇学术探讨◇
数 据 挖 掘 在 中 医 学 术 流 派 研 究 中 的 应 用
谭 勇1 ,吕爱平 车念聪 诚 蔡念 宁 , , 2都 医科大学 中 医药学 院 , 北京 106 ; 009 2 中 国中医科学 院中 医临床 医学基础 研究所 , . 北京 10 0 ; 0 7 0
中医病证规律下的数据挖掘论文
中医病证规律下的数据挖掘论文1数据挖掘技术在中医病证规律研究中的应用数据挖掘技术已广泛应用于中医病证规律研究领域,其基本流程为针对所研究疾病或证候整理相关文献资料,搜集具备中医诊疗信息、处方信息的海量数据,使用数据挖掘技术相关算法及其程序系统实行数据分析[5],总结该病或该证候的核心理论、诊疗方法及特色方药,提炼具有中医特色的个性化诊疗方案。
因为疾病及中医证候种类繁多,作者通过中国知网信息检索平台,搜索关键词“数据挖掘”,查找并学习2010—2014年相关期刊文献,汇总中医病证诊疗方面的数据挖掘技术的应用成果,旨在为内、外、妇、儿等常见学科疾病的临床诊疗提供参考。
1.1内科疾病在心血管疾病方面,杨静等对冠心病的证候用药规律实行数据挖掘,结果显示冠心病以气虚血瘀证多见,另有心血瘀阻证、气阴两虚证,丹参、黄芪、葛根等为核心用药。
崔松等通过挖掘何立人治疗心悸的用药分析,总结其治疗心悸的基本方,归纳出以心悸为主重用淮小麦,以心律失常为主重用生黄芪等因症施药的特点。
赵健等通过对严季澜辨治的109例高血压病患者用方数据实行挖掘,总结出严季澜自拟调肝理血汤的用方要点与学术思想。
在消化系统疾病方面,王萍等挖掘整理了唐旭东治疗慢性萎缩性胃炎的辨证证型及用药规律。
Liu等[10]应用支持向量机技术研究中医舌诊舌象在胆囊炎患者中的分类,为数字化辨病辨证提供了可靠依据。
吴嘉瑞等[11]应用关联规则和复杂系统熵探索颜正华治疗泄泻用药经验。
杜斌等通过检索现代治疗溃疡性结肠炎的文献,挖掘出常用灌肠方药及药对。
在肾病及内分泌疾病方面,展俊平等[13]采用文本挖掘技术对慢性肾小球肾炎的证治方药规律实行总结分析,发现该病证候以气阴两虚、肝肾阴虚、脾肾阳虚为主,核心治法以益气养阴、化湿利水为主。
凌颖茹等挖掘了黄春林治疗肾病综合征的方药使用经验。
霍保民等[总结了戴希文教授分期诊疗慢性肾脏病的辨证及用药规律。
袁敏探析魏子孝教授诊治糖尿病善补气、活血的用药特点。
数据挖掘技术在医案研究中的应用与讨论_刘兴方
刘兴方,等: 数据挖掘技术在医案研究中的应用与讨论
爽等[39]利用粗糙集技术的 Johnson 算法对 776 首治 疗高血压病肝阳上亢证的中药处方中出现频率高的 53 种药物进行属性约简,进一步明确了高血压病肝 阳上亢证的用药规律。 3. 6 人工神经网络 特有的非线性适应性信息处 理能力克服了传统人工智能方法对于直觉,如非结 构化信息处理方面的缺陷,有较好的抑制噪声干扰 的能力。因此在医案挖掘中将两者结合起来,根据 粗集方法预处理后的信息结构构成神经网络信息处 理系统,不但可以减少信息表达的属性数量,减小神 经网络构成系统的复杂性,而且具有较强的容错及 抗干扰能力,为处理医案中不确定、不完整信息提供 了一条强有 力 的 途 径。 如 温 宗 良 等[40] 运 用 人 工 神 经网络技术,采用成比例的共轭梯度算法从 79 例高 血压病案样本中获取规则,建立高血压中医证候诊 断模型,并将其运用于新病例的判别,具有较好的诊 断、预测能力。 3. 7 贝叶斯网络 是目前不确定知识表达和推理 领域最有效的理论模型之一,是一种强有力的不确定 性推理方法,能在有限的,不完整的,不确定的信息条 件下进行学习和推理。如唐启盛等[41]运用贝叶斯网 络模型对 611 例抑郁症患者的横断面证候进行数据 研究,并结合前期聚类分析研究结果,拟定出抑郁症 的 6 个中医证型,认为基于贝叶斯网络研究的中医证 型具有一定客观性、科学性,较符合中医理论。 3. 8 典型相关分析 利用综合变量对之间的相关关 系来反映两组指标之间的整体相关性的多元统计分 析方法,其条件是两组变量都是连续变量,其资料都 必须服从多元正态分布。如张晶[42]对 743 例情志致 病症分类医案中的情志因子与左尺脉象进行典型相 关分析,总结出恐、烦、精神萎靡、郁、狂与左尺脉象的 相关性,为情志相关脉诊临床实践提供了文献支持。 4 讨论
数据挖掘技术在文献研究法中的应用——以RefViz为例
参 考 文 献
[] 9 于斐, 玉崧 成, 吴拥 军, . 等 卫生化 学实验教 学改革 与 实
践 [ ] 实验 室科 学 ,0 1 1 ( )4 4 4 J. 2 1 ,4 4 :1 2,5
[] 1 庞春红 , 郦晓 宁, 葵. 何 深化 实验教 学改革 , 高 高校 教 提 学质量 [ ] 科技信息 ,0 1 (0 :8 J. 2 1 ,2 ) 1 f ] 雪 飞. 于开 放 实验 室 的教 学 模 式 研 究一 以教 育技 术 2王 基 专业 为例 [ ] 长 沙铁道学 院学报 ,0 1 1 ( )2 829 J. 2 1 ,2 1 :4 —4 [] 3 林雅. 初探 提升 大学 生网络 自主 学习效果 的策略一 基 于
第2 6卷 第 4期 21 0 2年 8月
中
国
医
学
教
育
技
术
Vo _ 6 No 4 l2 .
Au . 2 1 g 02
CHI NA MEDI CAL EDUCAT 0N 1 TECHNOL OGY
数 据 挖掘 技 术 在 文 献 研 究 法 中 的应 用
一
以 R f i为 例 eVz
李华新 , 李望 秀
衡Байду номын сангаас 4 10 20 1
南华大学计算机学 院,湖南
【 摘要】在科学研 究文献激增 的今天, : 将数据挖掘技 术引入 文献研 究领域势在必行。R Ⅳi e z
是 一款 可视化 的数 据挖掘 工 具 , 用其独 特 的算 法能够发 现 文献之 间的关联性 , 利 并从 中挖 掘 出某一
研 究领域 的 热点 问题 和发展 趋 势 。
数据挖掘及其在中医领域的应用研究
信息或知识对 于所讨 论 的业务 或研 究领 域是有 效 的、 是有 实 用价值和可实现 的 , 常识性 的结 论 或 已被人们 掌握 的事 实或
无法实现 的推测都是 没有 意义的 。
掘 的结果一部分 可能 与传 统 的诊 疗规 律相符 , 合 的部分 不符 可能是潜在 的新 知 , 也可能是没有 意义 的, 这都需要 在相应 目
起来 的。 1 数 据 挖 掘 介 绍
数据挖掘 的任务 主要是预测 和描述 。预测是 指用 一些变 量或数据库 的若干 已知字段 预测其他感兴趣 的变量 或字段 的 未知的或未来 的值 。描述 是指 找到描 述数 据 的可理解 模 式 。 预测方法有统 计 分 析、 关联 规则 和 决策 树 预测 、 回归 树 预测 等 。其 中关联 规则 反 映 了一 个事 务 与其他 事 务 之 间存究
丁 维 蒋永光
摘
宋姚屏 吴孟旭 李 昆
成 都 60 7) 10 5
( 都 中医药大 学 图书馆 成
今后 的发展 趋势。
关键词 : 数据挖掘 ; 中医
要: 介 绍了数 据挖掘的意义和任务 , 综述 了近几年来数据 挖掘在 中医各领域 中的应用 , 分析 了 目 前存在 的问题 , 并探讨 了
代化过程 中建立 了很 多的数 据库 。堆积在 数据库 中的信 息呈 超指数爆炸式增 长 。例如 中 医药科技 信息 数据 库就有 5 O个 子数据库 、 1 个表 单及 数百个 自动生 成 的中间 表、 0 10 8 0余个
著 录项 目, 涵盖所有 中医药有关 医 、 药及 学术 的内容 。而数据 挖掘技术 的发展使我们有 可能从这些海量 数据 中发 现新 的知
的。
化研究 的重要组 成部 分[ , 1 必将 促进 中医药 的发展 。而数 据 ]
数据挖掘技术在中医药传承中的研究进展
李 玲 周 学 平
( 南京 中 医药大学 , 苏南京 2 0 4 ) 江 1 0 6
摘
要
数 据 挖 掘 技 术 作 为 一种 有 效 的信 息 处 理技 术 , 通过 分析 中 医个 体 化诊 疗信 息特 征 , 炼 出其 中蕴 藏 的 新 理 提
众 多 , 术 思 想 广 为 流 中 学
传 。中 医 药 事 业 的 发 展 需 要 “ 火 传 承 ” 传 统 的方 法 已 经越 薪 , 来 越 显 示其 不 足 。数据 挖 掘 技 术 作 为 一 种有 效 的信 息 处 理 技
术 , 过 分 析 中 医 个 体 化 诊 疗 信 息 特 征 , 炼 出 其 中蕴 藏 的 通 提
有 何关 系 , 尚待 进一 步研 究 。 5 参 考 文 献
[】 张 继 玲 , 曹碧 兰 .白癜 风 免 疫 学说 新 进 展 .遵 义 医 学 院 学报 , 1
2 o ,94)4 3 o 6 2 ( :0
中 国 药 物与 临床 ,0 7,( )2 1 20 7 4 :9 【l 张 玉 臣, 成 文 , 东 , . 7 熊 吕 等 虫草 提 取 物 抗 炎 及 免 疫 作 用 实 验 研
论、 方法 , 新 实现 中 医药 经 验 的有 效 总结 与 传 承 。目前 数 据 挖 掘 技 术在 中 医 药传 承 中的 应 用 主要 包括 : 疾病 研 究 中的 应 在 用 、 方 剂研 究 中的应 用 、 中 药研 究 中的 应 用 、 针 灸 临床 中 的应 用 。 同时 , 们 应 该 认 识 到 数 据 挖 掘 作 为 一 种 新 兴 的 在 在 在 我 前 沿技 术 , 多方 面 需要 完善 , 数 据 挖 掘 研 究 结 果 的不 确 定 性 , 据 挖 掘 系统 中的人 为 主观 影响 , 需 要 在 日后 的 实践 在 如 数 这 中予 以校 正和 改 良。
数据挖掘技术在中药属性关系中的应用研究
计 算 机 与 现 代 化 JS A J Y 1 N A H A IU N I U X A D I U
ቤተ መጻሕፍቲ ባይዱ
第 2 6期 0
数 据 挖 掘 技 术 在 中药 属 性 关 系 中 的应 用 研 究
3 oeeo omao c nea dT cnl y D nh aU i r t,Sa ga 2 12 ,C ia .C Ug f n r t nS i c n eho g , og u n esy hnh i 0 60 hn ) I f i e o v i
Absr c :Daa mi ig p o i e e h ia u p r f rt e mo e iain o rd t n lChn s d cn . T i p p r b i s t e ta t t n n rv d s tc n c ls p o o h d r z t ta i o a i e e me ii e t n o f i hs a e ul h d
2 D p rme to ce t c R s ac . e at n f i ni e e r h,He a i est fT a i o a Chn s d cn ,Zh n z o 5 0 0,C i a S i f n n Un v r i o rd t n 1 i e e Me ii e y i . e g h u4 0 0 hn ;
t c n l g fa s cain r l of d f q e ti ms t i e p o e t so h n s d cn .Th o g n x e i n s t i p — e h o o o s o i t u e t n e u n t es n t rp ri f ie e me ii e y o i r e h e C r u h ma y e p r me t , h s a p rb i s te c o ey r lt n h p o e u n t ms t n f n t n p a a oo y,f t n i d c t n,fn t a w s r d cn e u l h ls l ea i s i ff q e ti d o r e es i u c i — h r c lg l o m mc i ・n i ai o o o c i — e t n me ii e o e n me h r c lg —n i ain,p ama o o — se dcn a ,ec a ,p ama oo i d c t y o h r c l g we t r me ii e n me t ,w i h p o i e v u be i fr ai n fr f d n h y n h c r vd a a l no l m t o n ig te o i rl t n h p b t e n te p o e is o i e e me ii e ea i s i ew e h r p r e f o t Ch n s d c n . Ke r s aa mi i g s o it n n l ;p o e is o h n s d cn ;f q e ti ms t y wo d :d t n n ;a s cai I o e r p r e c ie e me ii e r u n t es t f e e
数据挖掘技术在中医医案研究中的应用
的 改善效果 明显 , 加强居 民健康教育是 吖行的 。 通过营养 知识 的宣传教育 能够提高 居 民学 习营养知 识的积极性 , 树立正 确的营 养观念 , 纠正 不 良的饮 食习惯和 改进 膳 食 的保健措施 。 随着我国人 民生活水平的提 高, 生活办式的 改变 , 膳食结构也随之改变。 在对居民实施膳 食营养的健 康教育 中 , 不但要关 注婴幼 儿、 青少年 的饮食健康 , 更应 关注老年 人的合理 膳食。 老年 人的合理膳 食町以减 少各 种慢 性病 的发 生机 会 , 高老年 人 的生 活质量 , 提 增进健 康, 延长寿命 。 【 参考文献】
承
德
学
院
学
报
Vo . 8 N0 3 2 l 12 . 0
J 0UlNAL OF CI E l NGDE MED1 CAL 0LL GEห้องสมุดไป่ตู้ C E
卜 高达7 .0 的 凋查对 象每年基 本不去医院进行体 检 , , 440 / 道 自己患有高血 压、 血脂 、 高 糖尿病和骨质疏松 的居 民 低 f50 4  ̄ 以上 的调查对 象不清 楚 自己是否 患有相 . %,0 0 / 父疾病 。 2 6 居 民获得 营 养信 息的途 径 调 查对 象 中营 养信息 来 源 于 电视/广播 的 有4 9人 , 58 o 来 源于 家 人/ 0 占6 .o; / 朋友 的有36人 ,i 37 来 源于报纸 书籍 的有10人 , 9 i6 . ! %; 0 f 6 1 来源 为讲 座 、 询 的有3 , . ̄; 中 电 1 . %; 咨 0人 占4 8 其 0 / 视/广播 为农村 老年人群获得营养信息的主要来源 。 3讨论 本次调 查结果 发现 , 农村老年 居 民中存 在诸 多不合 理的膳食 习惯 , 说明居 民对= 一 些食物 的营养成分 、 r 身体 营养需要和营养素来源以及食物营养合理搭配等知识还 缺乏基本的 了解 。 并且 , 在危害健康比较严重的膳食行为 方面 , 男性 高于女性 ; 听说过 ( ( 中国居 民膳 食指南 的居 民仅有5 5 而在今后的营养教育 中, .%, 应重点注意做到普 及基本营 养知识 和 ( 《 中国居 民膳食指南 内容 。 的 调 查发现 , 部分调查 对象对 改善 自身膳 食行 为习 人 惯 抱有 积极 的态度 ,7 3 7 .%人 的认 为有必 要进 行营养 知 以的宣传 ,42 6 .%对营 养知识感兴趣 , 说明居 民有主动获 舣 营养知识 和改变 不 良习惯 的意愿和可能 性 , 这肯定 了 进 行营养宣传和营养教育的可行性。 调 查发现 , 高达7 .%的居 民每年 基本 不去 医院进 44 行体 检 , 不清楚 自己是 否患有 高血压 、 高血 脂、 糖尿 病和 骨 质疏松等慢 性疾病 , 明该地区老年 人群 自我保 健意 说 识比较薄 弱 , 对预 防疾病 的意识较差 , 基本上是生病之后 或病情持续 恶化 后才去 医院 , 并且认为如果没 有生病 , 没 有去医院 的必要 。 并且 , 被调查者对营养与健康的重要性 认识不足 , 对饮食选择的重视程度不够 。 因此要通过各种
数据挖掘及其在中医药现代化研究中的应用
数据挖掘及其在中医药现代化研究中的应用一、本文概述随着信息技术的快速发展,数据挖掘作为一种高效的信息处理技术,已经在各个领域展现出其独特的优势。
在中医药现代化研究领域,数据挖掘技术的运用更是为传统中医药的现代化发展提供了新的视角和工具。
本文旨在探讨数据挖掘技术在中医药现代化研究中的应用,以期推动中医药领域的科技进步和创新发展。
本文将首先介绍数据挖掘技术的基本概念、原理和方法,然后重点分析数据挖掘技术在中医药现代化研究中的应用案例和效果。
我们将从中药材的种植、采摘、炮制、配伍、药效评价等多个环节入手,详细阐述数据挖掘技术在这些方面的具体应用,以及所带来的实际效果和潜在价值。
本文还将对数据挖掘技术在中医药现代化研究中面临的挑战和问题进行深入探讨,包括数据挖掘技术的局限性、中医药数据的复杂性、数据挖掘与中医药知识的融合等问题。
通过这些问题的分析,我们希望能够为数据挖掘技术在中医药现代化研究中的进一步应用提供有益的思考和建议。
本文旨在全面、系统地探讨数据挖掘技术在中医药现代化研究中的应用,以期为中医药领域的科技进步和创新发展贡献一份力量。
二、数据挖掘技术概述数据挖掘(Data Mining)是一门新兴的交叉学科,它融合了数据库技术、机器学习、统计学等多个学科的理论和方法。
数据挖掘的主要目的是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识。
这些信息和知识可以表示为概念、规则、规律、模式等形式,它们可以用于决策支持、过程控制、信息查询、科学研究等多个领域。
数据挖掘的过程通常包括数据预处理、数据挖掘、结果解释和评估等步骤。
数据预处理是对原始数据进行清洗、转换和整合的过程,以消除噪声、处理缺失值、标准化数据等,使得数据更适合于挖掘。
数据挖掘阶段则利用各种算法和工具,如聚类分析、决策树、神经网络、关联规则挖掘等,来发现数据中的模式和关联。
数据挖掘在中医药领域应用研究进展
数据挖掘在中医药领域应用研究进展标签:数据挖掘;中医药;应用研究;综述数据挖掘是指从大量数据中提取或挖掘有效、新颖、有潜在应用价值和最终可理解的模式、知识,其涉及多学科技术集成,包括数据库和数据仓库技术、统计学、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像处理以及空间或时间数据分析等。
数据挖掘技术在中医药研究领域得到广泛应用,兹将近年来研究进展作一综述。
1 中医药文献数据挖掘中医药文献数据来源主要包括中医药古典、名家医案、验方验案、书刊述评、期刊文献、中药词典等。
数据挖掘技术对这些数据整理挖掘,重新展现及总结名家学术思想、辨证论治、中药选材、中药炮制、中药制剂、用药规律等成果,对传承、借鉴与发展起到重要作用。
中医药数据具有非线性、模糊性、复杂性、非定量等特征,针对具体的中医药数据和不同的挖掘目标,往往要将几种方法融合起来应用,以发挥各自的技术优势,或引进其他学科方法共同解决一些问题,其中关联规则、频数分析、聚类、文本挖掘等为常用方法。
中医药文献数据研究,要求数据来源、文献纳入标准、排除标准、文献规范原则、证候名称规范、症状名称规范、中药名称规范、计量标准规范等进一步加强与完善,数据获取、保存、抽取等预处理及数据挖掘技术的运用也有待更科学深入。
1.1 关联规则郭氏等[1]采用关联规则分析方法分析了古医籍中治疗带下病的用药规律,发现明清时期治疗带下病的方药以健脾祛湿药物为最常用结构,其中又配伍一些专属度比较高的特色药物,如收涩止带药、补肾药、清热燥湿药等。
1.2 频数分析吴氏等[2]检索中国期刊全文数据库等1991-2011年发表的有关围绝经期综合征文献,进行整理及频数分析。
结果围绝经期综合征常见中医证候有49个,其中肝肾阴虚、肾阳虚、肾阴虚、肾阴阳两虚、心肾不交、肝郁气滞、脾肾阳虚最多见;提取常见症状共65个,包括月经紊乱、头晕耳鸣、失眠、烘热汗出、腰膝酸软、心悸、易怒、纳呆等;病位以肾、心、肝、脾为主;病性以虚为主;脉象以细数、沉细、弦细为主,舌象以舌淡或舌红、苔薄或少苔为主,说明围绝经期综合征的中医证候分布比较集中。
计算机技术在中医领域的应用及思考
计算机技术在中医领域的应用及思考计算机技术是20世纪人类最伟大的成就之一,它的出现给各个领域带来了突破性的发展。
中医是一门传统医学,中医现代化迫在眉睫,不管是医疗管理还是科学研究,计算机技术的应用已渗透到了各层面。
本文从中医相关系统与数据挖掘两大技术在中医领域的应用,阐述了计算机技术作出的贡献,同时指出可能产生的问题,并提出相应的思考。
Abstract:Computer technology is one of the greatest achievements of the 20th Century. Its appearance not only brings a breakthrough development in various fields,but also brings promotion to the development of traditional Chinese medicine (TCM). TCM is a traditional medicine,and the modernization of TCM is urgent. Whether in the medical management or scientific research,the application of computer technology has penetrated into all levels. The following article described the contribution made by computer technology,pointed out possible problems and provided relevant thinking based on the application of TCM related systems and data mining technology.Key words:computer technology;TCM expert system;TCM syndrome differentiation system;data mining20世纪人类最伟大的成就之一是计算机的出现及其技术的应用和发展。
基于CiteSpace软件中医数据挖掘文献的可视化分析研究
基于CiteSpace软件中医数据挖掘文献的可视化分析研究一、本文概述随着信息技术的飞速发展,数据挖掘技术在各个领域得到了广泛的应用。
在中医领域,数据挖掘技术的引入为中医药的研究和发展提供了新的视角和工具。
本文旨在利用CiteSpace软件对中医数据挖掘文献进行可视化分析,以期更深入地理解中医数据挖掘的现状、发展趋势以及研究热点。
本文首先介绍了中医数据挖掘的重要性和必要性,阐述了数据挖掘技术在中医领域的应用现状。
随后,详细介绍了CiteSpace软件的功能特点及其在文献分析中的应用优势。
在此基础上,本文利用CiteSpace软件对中医数据挖掘相关文献进行了可视化分析,包括文献的时间分布、关键词共现网络、主题演化等方面。
通过可视化分析,本文揭示了中医数据挖掘领域的研究热点和发展趋势,为中医药研究者提供了有价值的参考信息。
本文也指出了当前中医数据挖掘研究中存在的问题和不足,为进一步的研究提供了方向和建议。
本文的研究不仅有助于深入了解中医数据挖掘的研究现状和发展趋势,同时也为中医药的现代化、国际化提供了有力的支持。
未来,随着数据挖掘技术的不断进步和应用领域的不断拓展,相信中医数据挖掘研究将会取得更加丰硕的成果。
二、理论基础与文献综述随着信息技术的快速发展,数据挖掘技术在各个领域的应用日益广泛。
在中医领域,数据挖掘技术也被逐渐引入,以期通过对中医文献的深度挖掘和分析,发现传统医学知识中的新规律和新见解。
本文旨在利用CiteSpace软件对中医数据挖掘文献进行可视化分析,以期系统地梳理和归纳中医数据挖掘领域的研究现状和发展趋势。
理论基础方面,数据挖掘是一门通过特定算法对大量数据进行处理和分析,以发现数据中的潜在规律和有价值信息的科学。
在中医领域,数据挖掘技术可以应用于中药方剂配伍、疾病证候分析、名医经验传承等多个方面。
通过数据挖掘技术,可以对中医古籍、现代中医文献等海量数据进行深度挖掘,揭示传统医学知识中的隐藏规律和关联规则,为中医临床和科研提供新的思路和方法。
数据挖掘方法在中医医案研究中的应用
数据挖掘方法在中医医案研究中的应用作者:王康尹玉洁李雅文秘红英李红蓉贾振华来源:《世界中医药》2021年第11期摘要中医医案作为中医诊疗经验及学术观点的载体,历来是中医传承研究的重中之重。
传统的“个人领悟式”方法在分析医案时难以避免存在片面性和主观性。
因此,寻找一种可以全面、客观地反映医案中隐藏信息的医案研究方法就显得尤为重要。
近些年随着信息技术的飞速发展,数据挖掘技术在医案研究中的应用也日益深入。
现通过对目前医案研究领域常用的数据挖掘方法、软件及平台的应用现状进行梳理,并对每种方法在医案研究中的适用领域进行简要评述,以期为医案研究者选择合适的研究方法提供参考,为传承医案中蕴含的诊疗经验及发展中医药事业提供新思路。
关键词中医医案;中医诊疗经验;数据挖掘;统计学方法Abstract As the carrier of experience of traditional Chinese medicine(TCM) diagnosis and treatment and academic viewpoints,medical records of TCM have always been the most priority in TCM inheritance and research.The traditional comprehension-based analysis method is hard to avoid partial face and subjectivity in the analysis of medical records.Therefore,it is important to find a method of medical records research that can comprehensively and objectively reflect the hidden information in medical records.With the rapid development of information technology in recent years,the application of data mining technology in medical records research is increasingly in-depth.The author analyzes the application status of data mining methods,software and platform commonly used in the field of medical records research,briefly reviews the application of each method in medical records research,in order to provide a reference for medical records researchers to choose the appropriate methods,and provide methods to inherit the experience of diagnosis and treatment hidden in medical records of TCM and provide ideas to develop TCM.Keywords Medical records of traditional Chinese medicine; Experience of traditional Chinese medicine diagnosis and treatment; Data mining; Statistical method中圖分类号:R242;R249文献标识码:Adoi:10.3969/j.issn.1673-7202.2021.11.003中医医案,又称病案、诊籍、方案、脉案等,是记录中医医家临床辨证、立法、处方用药的第一手资料[1]。
数据挖掘技术在中医药领域的应用分析
据挖 掘 的条件
的关 系和 以数据 拥有 者 可 以理解 并 对其 有 价 值 的新 颖 方式来 总 结数 据 。这里所 说 的数 据是 为 了其 他某 个 目的 已经 收集好 的 ,而不 是 为 了数据 分 析 本 身 去 收集 的。如本 文下 面将 要 提 到 的 中 医药信 息 ,这些
重要 意义 。
关键词 中医药信息化 信息管理 数据挖掘
2 世 纪是 知识 经 济 占主导地 位 的 时代 ,具 有悠 l 久历 史 的 中医学 面临着 能否 拥 有持 续 创 新 发展 能力 的严 重挑 战 ,也 就是说 是 否 具 有 知识 创 新 、知 识 传
播 、知识交 换 和知识 利用 的能 力 。从 中医学 发 展 的 渊源不 难看其 拥 有数 据量 之 大 ,中医 学科 的发 展 迫
据 挖掘 技术 已经 被 广泛 的应 用 在经 济 管 理 以及 社会
生 产 的各个 领域 ,作 为 中 国传统 文 化 的 中 医学 如果
可 以将 数 据挖 掘 技 术 应 用 在 其 研 究 和 发 展 过 程 中 ,
切 需要 新技术 以便从 大量 的数据 中智 能 地 、 自动 地 抽 取有 价值 的知 识 。数据 挖掘 技 术 的应 用 和 中 医药 数据 库 系统 、中医药信 息 系统 的 研究 将 会 极 大地 推 动 中 医学 知 识 创 新 的 开 展 ,促 进 中 医 学 术 的 持 续
领域 。
方剂 配伍 中的应用
数 据 挖掘 亦 适 用 于 方 剂 配 伍 规 律 研 究 ,因 为 :
中医药数 据库 的大量涌现 为数 据挖 掘奠定 了
数据挖掘技术在中医药领域应用
中图分类号:R —3 20
文献标识码 :A
文章编号:10 —3 42 1)30 9 —2 0 55 0 (0 20 .0 90 湿热 的用药及配伍规律, 明清医家治疗脾 胃湿 热型黄疸 多用茵 陈蒿, 是清热 退黄 的主药 ; 而且, 茵陈蒿主要与利水渗湿药和行 气药配伍应用 。组方上 多在 “ 化湿 、健脾、清热、理气 ”中变 构 。张氏等 利用关联分析中医治疗肾病 用药得 出:人参与黄 芪在治疗 。 的方剂 中同时出现 的频数为 1 .% 在含 有人 参 肾病 1 1, 的治疗 肾病 的方剂 中, . 含有黄芪 的占 5 . % O 5 ;同时, 从上述关联
方 向及 可 发 展 性 。 1 数 据 挖 掘 技 术 应 用 于 中医 药 的 技 术 支持
中医证候系统庞大而复杂, 诊断系统 又是一个 非线性 的、
多 维 多 阶 的 、可 以无 限组 合 的复 杂 巨系 统 , 线 性研 究 的方 法 用
数据挖掘就是从海量 的、不完全 的、有噪声的、模 糊的、 看似 随机的数据集合中, 提取 隐含其 中的、事先未预知 的、但 又有价值的知识和规律 的过程 。 目前, 数据挖 掘的主要算法 有聚类 分析、因子分析 、 主成分分析 、 关联规则分析、粗糙集 、 贝叶斯网络、神经网络 、人 工智能等 。这 些算法各 有特 点, 根 据 主题 的不同, 以采用不 同的算法 。如 中医方剂研究多用关 可 联规 则分析, 出复方 中的主要及配伍规律 ;中医定量诊断可 找
处 理 工 具 和 浅 层 的 、 验 性 的 中医 信 息 分 析 处 理 已不 能解 决 中 经
医现代化发 展的根本要求 , 随着 用户需求 的不 断提高, 现有数 据库系统的模 式和 内容 已难 以满足需求 。 而数据挖掘技术 正适
浅析数据挖掘技术在中医药领域内的应用
考 虑到中医舌诊对各种舌 象的划分界限 比较模糊 , 对舌象的 自动识别运用模糊数学原理进行 聚类分析 , 效果 明显 。
33决 策 树 方 法 I
决策树算法 是一个类似于流程图 的树状结构 , 是一种用来表示人们 为了做 出某 一个决策而进行 的一系列判断过程 的树形 图 , 这 种方法用于表现“ 什么条件下会得到什么值” 在 之类的规则 。本质上决策树是通过一 系列规 则对数据进行分类 的过程 。决策树
31 联 规 则 .关
关 联规则用于发现在同一事件 中出现 的不 同项 的相关性 , 即找出事务 中频繁发生 的项或属性 的所有子集 , 以及项 目之 间的相 互关联性。关联 规则在 中医药领域 中得到 了广泛的应用 , 李振岳等n 对治疗伤寒病的中药复方药对配伍 的规律进行 了分析研究 , 以 文献 中收录的 2 0 治疗伤寒病的 中药复方为分析对象 , 0个 建立复方特征数据库 ; A 系统 中的 E trr eM nr 以S S ne i ie 为平 台 , ps 应用关联 规 则分析技术 , 按伤寒 六经分类 进行伤寒病复方药对配伍规律 的关联模 式研究。研究结果显示 , 得的六经药对与文献记录 的六 所 经主要药对组成基本一致 , 并且发现了一些治疗伤寒病的 中药 复方 的未知药对 。
Vo . , . 0 Ap i 2 2 1 No 1 , rl 01 . 8
浅 析 数据 挖 掘技 术 在 中 医药领 域 内的应 用
毕 华 吴 ,晶 雪 ,淼 吴
( 新疆 医科大学 , 新疆 乌鲁木齐 8 0 1 ) 30 1
摘要 : 该文介绍 了数据挖掘 的概念 , 中医药数据挖掘的特点 , 数据挖 掘技 术 中的主要方 法及其在 中医药领域 内的应用现状 。
【最新word论文】数据挖掘技术在中医药研究中的应用【医学专业论文】
数据挖掘技术在中医药研究中的应用随着医学机构积累的数据越来越多,促进了医学信息包括中医药信息的数字化;如何利用海量信息为防控疾病提供科学依据,总结优化各种诊治方案,已引起业内专家的高度关注。
于是数据挖掘技术在中医药研究被日益重视,它将有力促进中医药的现代化进程。
1 数据挖掘的概念、步骤及常用方法1.1 数据挖掘概念、步骤数据挖掘(Data mining,DM)即数据库中的知识发现,是从大型数据库的海量数据中提取人们感兴趣的知识,这些知识是隐藏的、事先未知的、潜在有用的信息,挖掘的知识表现为概念、规则、规律、模式等形式[1]。
数据挖掘的目的在于使用所发现的模式帮助解释当前的行为或预测未来的结果[2]。
挖掘步骤大致有:问题定义、数据提取、数据预处理、数据挖掘、知识评估、结果应用这六步。
1.2 数据挖掘常用方法1.2.1 描述统计数据总结的目的是对数据进行从低层次抽象、浓缩到高层次,得出它的紧凑描述。
最简单的数据总结方法是描述统计,它包括平均数、中位数、分位数等,它常和统计图配合应用。
1.2.2 关联规则关联规则从本质上讲是条件概率,即当A发生时、B同时出现的概率有多大?只要B离50%较远就有意义。
数据关联是数据库中存在的一类重要的可被发现的知识。
若两个或多个变量的取值之间存在某种规律性,就称为关联。
关联包括简单关联、时序关联、因果关联。
关联分析的目的是找出数据库中隐藏的关联网。
有时我们并不知道数据库中数据的关联函数,即使知道也不确定。
因此关联分析生成的规则带有可信度。
1.2.3 分类和聚类这是最常用的技术。
分类方法主要有:回归、决策树、神经网络。
分类分析在数据挖掘中是一项重要任务。
分类器的构造方法有统计方法、机器学习方法、神经网络方法等。
聚类是根据事物本身潜在的特性研究对象分类的方法。
通过聚类把一个数据集合中的个体按照相似性归成若干类别,使其“物以类聚”,将数据库中的记录划分为一系列有意义的子集。
聚类要解决的就是实现满足这种要求的类的聚合。
数据挖掘算法在中药方剂研究中的应用现状
·综述·数据挖掘算法在中药方剂研究中的应用现状Δ李蕙质*,周小玲,杨玉杰,章新友 #(江西中医药大学计算机学院,南昌 330004)中图分类号 R289;R2-03文献标志码 A 文章编号 1001-0408(2024)01-0112-07DOI 10.6039/j.issn.1001-0408.2024.01.20摘要近年来,数据挖掘算法在中药领域的科研中得到了广泛应用。
采用数据挖掘算法可处理和分析中药方剂中的多层次数据,并对其作用机制提供合理解释。
这一方法现已较好地应用于中医药的配伍规律和高频药组的挖掘中,提高了临床诊断、靶点筛选和新药研究的可靠性和准确性。
本文对147篇中药方剂研究中运用数据挖掘算法的文献进行了整理与分析,结果表明,数据挖掘算法在中药方剂作用机制研究、中药方剂量效研究、挖掘核心药对/药组、挖掘“方-药-证”间的关系、发现新方剂和挖掘配伍规律这6个子领域中发挥了独特优势,尤以关联规则和聚类分析算法最具有代表性。
关键词数据挖掘算法;中药方剂;文献计量法;应用Application of data mining algorithms in research on traditional Chinese medicine formulaLI Huizhi,ZHOU Xiaoling,YANG Yujie,ZHANG Xinyou(School of Computer Science,Jiangxi University of Chinese Medicine, Nanchang 330004, China)ABSTRACT In recent years,data mining algorithms have been widely employed in scientific research within the field of traditional Chinese medicine (TCM). The data mining algorithms are used to effectively handle and analyze the complex data in TCM formulas,providing a rational explanation for the mechanism of action. This method has proven particularly useful in uncovering patterns of compatibility and frequent combinations of herbs in TCM,thereby enhancing the reliability and accuracy of clinical diagnosis,target screening,and the study of new drugs. This paper reviews and analyzes 147papers on TCM formula research that utilize data mining algorithms. The results indicate that data mining algorithms play a unique advantage in six sub-areas,including the study on the mechanism of action in TCM formula,the dose-efficacy of TCM formulas,the identification of core drugs pairs/groups, mining the relationships among “formulas-drug-symptom”, the discovery of new formulas, and mining the compatibility law. Notably, association rules and clustering algorithms are the most representative.KEYWORDS data mining algorithms; traditional Chinese medicine formula; bibliometrics analysis; application中药方剂是中药学中的一个重要研究领域,其基于中医整体观的思想,通过对疾病的辨证施治来构建适用于不同疾病或病情的中药处方,以实现治疗和预防疾病的目的。
数据挖掘在中医治疗支气管扩张症方药文献研究中的应用
2462019.03医苑纵横数据挖掘在中医治疗支气管扩张症方药文献研究中的应用黄春燕 兰智慧江西中医药大学 江西省南昌市 330004【摘 要】数据挖掘技术广泛应用于中医药领域的文献研究,本文主要介绍了中医药治疗支气管扩张症方药文献研究的背景,分析了数据挖掘在中医药文献研究中的应用,讨论了数据挖掘在支气管扩张症文献研究中存在的问题,最后指出数据挖掘在中医治疗支气管扩张症方药文献研究的方向。
【关键词】支气管扩张症;方药文献;数据挖掘;应用支气管扩张症是以反复发作的咳嗽、咳大量脓痰和(或)反复咯血为主要临床表现的慢性气道疾病,临床治愈低,常反复发作,疾病后期出现肺组织损伤、肺功能下降而致残,常合并慢性阻塞性肺病、抑郁症等,导致患者死亡率升高、生活质量下降,对患者家庭甚至社会产生巨大经济负担。
目前支气管扩张症在医学界并未引起足够重视,远不如慢性阻塞性肺疾病、支气管哮喘、肺癌等。
文献报道,18-34岁的美国成年人支气管扩张症患病率为4.2/10万,75岁以上的美国老年人支气管扩张症患病率高达272/10万;2000-2007年,美国支气管扩张症患者以8.7%的速度逐年增加。
在我国京、沪、粤、辽、津、陕、渝七个城市的调查研究显示,10811名40《本草纲目》中记载山药能“益肾气、健脾胃、止泻痢、化瘫涎、润毛皮”。
在《医学衷中参西录》中以山药与黄芪配伍为主的玉液汤和滋培汤能够治疗消渴与虚劳喘逆。
有山药配伍的中药六味地黄丸、金匮肾气丸等也可以治疗糖尿病,同时治疗高血压。
薏苡仁性味甘淡凉,入脾、胃、肺经,具有健脾止泻、解毒散结的作用,用于此处主要是为了让患者有饱腹感,减少对食物的摄取,对减轻糖尿病症状有积极意义。
(3)对于阴虚化热无腹泻便溏的糖尿病患儿,可做菠菜粥:菠菜100-150克,粳米50克,煮粥食用。
菠菜性味甘平,入肝、胃、大肠、小肠经,可以清热解毒、通利血脉。
《本草纲目》引《经验方》记载:“治消渴引饮,日至一石者:菠薐根、鸡内金等分,为末。
数据挖掘及其在中医药领域中的应用的开题报告
数据挖掘及其在中医药领域中的应用的开题报告一、研究背景数据挖掘是从大量数据中提取有价值的信息和知识的一种技术。
随着计算机技术和存储技术的不断发展,数据挖掘已经成为了现代科学研究和工业应用中不可或缺的一项技术。
中医药是我国悠久的传统医学,其独特的理论体系和医疗实践备受世界各国的关注。
然而,因为中医药的观念和方法与现代医学有所不同,中医药的研究面临着一些挑战,如疾病分类的不确定性、药效评价的难度等。
在这种情况下,数据挖掘成为了一种非常有前途的研究方法,可以帮助我们发掘中医药中的有价值的信息和知识。
二、研究内容和目标本次研究的内容是探讨数据挖掘技术在中医药领域中的应用,具体包括以下方面:1.中医药疾病分类的数据挖掘方法2.中药成分与药效的关联分析3.药物相互作用网络的构建和分析本次研究的目标是:1.了解数据挖掘技术的基本原理和常用方法,掌握数据挖掘的流程和技巧。
2.掌握中医药领域的基本知识和研究方法。
3.针对中医药领域的一些研究问题,探索适合的数据挖掘方法,并应用于实际的研究中,以试图解决一些现有的问题和挑战。
三、研究方法和步骤本次研究将采用如下步骤:1.首先进行文献研究,了解数据挖掘技术在中医药领域中的应用现状和研究进展。
2.针对中医药领域的一些具体问题,如疾病分类、药效评价等,选取适合的数据挖掘方法,并进行模型建立和验证。
3.通过实验分析,验证所选方法的有效性和准确性,并探索数据挖掘技术在中医药领域中的推广和应用。
四、预期成果和意义本次研究的预期成果包括:1.针对中医药领域的一些具体问题,提出适合的数据挖掘方法,并进行实验验证。
2.通过对中医药数据的挖掘和分析,发掘其中的知识和规律,并为中医药的研究和应用提供科学依据。
3.为数据挖掘技术在中医药领域的推广和应用提供参考和借鉴。
本次研究的意义在于:1.为中医药领域的科学研究和实践提供新的思路和方法,有助于提升中医药的科学性和实用性。
2.为数据挖掘技术在中医药领域的应用提供借鉴,有助于推动数据挖掘技术在医学领域的发展。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据挖掘在中医文献研究中的应用作者:张胜男车立娟李明来源:《医学信息》2017年第13期摘要:大数据时代,数据挖掘作为有效地信息处理技术,可以在中医文献中提炼出潜在的、有用的信息。
数据挖掘广泛应用于特定疾病、方剂、医案、名老专家临床经验与针灸的文献研究中。
本文简要介绍了关联规则分析、聚类分析、决策树算法和神经网络数据挖掘方法,以及在中医文献研究中的应用情况。
关键词:中医;数据挖掘;文献研究中图分类号:R2-03 文献标识码:A 文章编号:1006-1959(2017)13-0022-03Abstract:The era of big data,data mining as an effective information processing technology,in the literature of traditional Chinese medicine extract potential and useful information.Data mining is widely applied to specific diseases,prescriptions,medical records,literature research and clinical experience of senior experts of acupuncture.This paper briefly introduces the association rules analysis,cluster analysis,decision making tree algorithm and neural network data mining method,and application in TCM literature research.Key words:Traditional Chinese medicine;Data mining;Literature research“大数据”已成为互联网信息技术行业的流行词汇。
大数据时代,人们不再追求精准和因果关系,而是更为关注相关关系[1]。
中医学也迎来了大数据时代,从海量中医数据中提取有用的信息也变得更加困难,数据挖掘作为有效地信息处理技术,可以帮助中医研究者挖掘海量数据中有用的信息。
数据挖掘(Data Mining,DM)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中、不为人知但又是潜在有用的信息和知识的过程[2],数据挖掘也被称为数据库中知识发现,即从一个大的数据堆中找出有用的知识,从数据中挖掘知识[3]。
这是一个从大量不完整的数据中发现、抽取有意义数据的过程。
数据库知识发现技术最早是在1989年的美国人工智能协会第11届年会上提出的[4],而后渐渐成为人们在海量数据中寻找有效知识的一个必备方法。
在中医文献研究中,常用的数据挖掘方法有关联规则分析、聚类分析、决策树算法和神经网络,尤其是关联规则分析和聚类分析最为常用。
也有很多中医文献研究需要综合应用多种数据挖掘方法。
1 关联规则分析关联规则分析又称为购物篮分析,目的是在一定的支持度和置信度限制下寻找事务之间的内在的联系。
它是由Agrawal等人于1993年提出来的。
关联规则里的重要概念[5]:项集、支持度、频繁项集、置信度。
支持度是度量一个项集出现的频率,例如项集{A,B}的支持度是由同时包含A和B的事务总数组成的。
频繁项集是在数据集中出现频率高的那些项集,利用这些频繁集创建描述关联关系的规则[6],这是关联规则的核心部分。
频率的阈值是用支持度来定义的。
概率(Probability)是关联规则的属性,规则A=>B的概率是使用{A}的支持度除项集{A,B}的支持度计算的,该概率在数据挖掘研究领域中也称置信度。
关联规则分析是数据挖掘领域中最活跃和成熟的方法之一,在中医文献研究中,关联规则分析常用在组方用药规律研究、病机的研究、针灸用穴规律的研究中,值得关注的是,关联规则分析在方证研究领域中也有所发展。
关联规则在用药规律研究中旨在寻找有用的药对、药组、药症,甚至可以发现新方;关联规则在症候病机的研究中着重挖掘病机与病机之间、症候与病机之间的关联;关联规则在针灸用穴研究中,着重发现特定疾病选穴与经络之间的联系;关联规则在方证研究中,旨在寻找经方里的规律,帮助临床更好的应用经方。
1.1组方用药规律的研究甘永康等[7]应用数据挖掘方法对叶天士《临证指南医案》治疗泄泻方剂的组方规律进行分析,得到叶天士治疗泄泻常用的药物、核心组合及发现新方,这为临床选方用药提供了新思路。
有些学者采用古今文献对比的思路研究了某病用药规律,沈劼等[8]运用关联规则分析并对比了古今医家治疗卵巢早衰的用药规律。
挖掘出古代中医治疗卵巢早衰的核心药物是当归、川芎、白芍、茯苓、熟地黄等,为八珍汤基础方加减。
得到关联度比较好的药对为当归-川芎、当归-白芍等。
现代中医治疗卵巢早衰的核心药物是当归、熟地黄、菟丝子、枸杞子、山药等。
得到关联度较好的药对为当归-熟地黄、熟地黄-菟丝子等;古代中医和现代中医治疗卵巢早衰共同选择的核心药物为当归、熟地黄、白芍、茯苓,核心药对为当归-熟地黄。
在分析古今医家治疗卵巢早衰时,得到支持度最高的药物为当归,可以认为古今医家均视阴血亏虚为本病的一个病理基础,但用药有一定区别,古代方用药立足于补益气血,现代方用药以滋补肝肾阴血为主。
1.2 症候病机的研究简维雄等[9]在基于现代文献研究高血压的证型病机特征时,运用了关联规则方法,得出高血压病机以肝肾阴虚为本,痰浊,瘀血为标,风阳内动为像。
瘀血与痰浊、阳亢、肝阳化风、肝肾阴虚、阴虚阳亢、肝火上炎等病机关联;痰浊与瘀血、肝阳化风、肝火上炎、肝肾阴虚、阳亢、阴虚阳亢、气虚、阴虚等病机关联;肝肾阴虚证与病机瘀血倾向关联;肝肾阴虚证和肝阳上亢证时与病机痰浊、肝阳化风、瘀血倾向关联;血瘀证与瘀血倾向关联。
1.3针灸用穴规律研究章薇等[10]运用关联规则探析古代针灸治疗尿失禁的用穴规律,得出治疗尿失禁多选阴经,重视手足三阴经腧穴偏重特定穴,阴经又以足厥阴肝经取穴最多,五输穴与其他特定穴配伍最为常用,原穴配伍五输穴支持度最高;而且发现古代医家治疗尿失禁不取膀胱经募穴中极。
这说明数据挖掘技术也可以用来研究针灸的用穴规律。
1.4方证研究在方证研究领域中,徐建虎等[11]运用数据挖掘技术分析古今医案专著、临床经验专著及期刊杂志中的小柴胡汤医案,发现小柴胡汤证临床病证规律。
子午二个时辰定时发作的病变常采用小柴胡汤治疗;少阳提纲证(口苦、咽干、目眩)和小柴胡汤四大主症(往来寒热、胸胁苦满、嘿(mo)嘿不欲饮食、心烦喜呕)具有诊断小柴胡汤证的指标意义;“但见一证”指往来寒热、胸胁苦满、心烦喜呕、嘿嘿不欲饮食四者之一;小柴胡汤证主脉是弦脉。
2 聚类分析聚类是指将物理或抽象对象集合构成为由类似的对象组成的多个类的过程[12],聚类分析是将数据进行类似对象组的划分,从而实现类的分析过程。
在人类的行为中是一项非常重要的分析方法,也是一种常见的数据挖掘方法。
聚类分析可分为R型聚类和Q型聚类。
R型聚类可以把有线性关系的变量归到一类,然后让研究者自己去根据变量的情况判断选择代表性指标。
而Q型聚类主要根据对象相似度,把整体分成若干类别,研究者在不同类别中寻找共同规律。
无论是R型还是Q型聚类分析,都仅仅归类而不呈现结论,需要完成下一步分析,属于探索性分析[4]。
多用于疾病的中医证候分类,为中医临床辨证论治依据提供分型的方法学[13],也应用于方剂中的用药规律、用药方案筛选等相关研究中。
刘嘉辉等[14]探讨名老中医治疗原发性肝癌的用药规律,搜集首届国医大师及首批国家级名老中医的医案提取方药信息,应用聚类分析和关联规则分析进行数据挖掘。
聚类分析显示名老中医治疗原发性肝癌的药物可归为5类:补益气血类、理气活血类、解毒软坚类、利水渗湿类和健脾消食类。
关联规则分析显示:关联性强的主要为益气健脾药和理气药、活血药、清热解毒药、消食药的配伍组合。
名老中医治疗原发性肝癌谨守“正虚邪实”的病机本质,在扶正健脾基础上辨证运用清热解毒、疏肝理气、活血散结等治法。
陈欣然[15]利用聚类分析和关联规则对近15年的反流性食管炎中医临床期刊文献进行了用药规律和证候研究。
药物聚类组得出7种证型,与《实用中医消化病学》中该病的5种分类证型比较,少1种脾虚胃热型,多出4种证型脾胃湿热证、气郁痰阻证、痰热互结证和脾虚痰湿证,证明临床用药的趋向已经改变。
在药物的研究中发现大部分排名靠前的药对中药物功能相近,如穿山甲、桃仁,穿山甲、红花均可活血化瘀、通络止痛;还有沿用经典用药配伍,如石青、寒水石出自《素问病机气宜保命集》中的双玉散等等。
对于药症研究,大便艰难与玉竹相关性最高,白花蛇舌草、太子参、丁香、大枣、槟榔、黄芪、竹茹均与烧心相关联,说明主症烧心的用药多选择扶正祛邪、清热解毒、软坚散结的药物。
3 决策树算法决策树算法是利用信息论中的信息增益,以寻找数据库中具有最大信息量的属性字段,建立一个决策树的节点,而后根据字段不同取之建立分支[4]。
这种方法以树状结构表示模型,容易理解。
国际上最早的最有影响的决策树算法是ID3算法。
决策树算法在基于临床病例数据探索辨证规则的研究中使用较多,可以是研究专家的辨证规律,也可以是临床专病的辨证规则研究。
决策树算法可用于中医临床疾病辨证的辅助诊断。
余学杰等[16]使用决策树算法将中医专家的临床诊断数据逐步分类以获得专家的辩证规律,研究者成功获取了多种证名与证候的规则,这说明利用决策树算法研究专家的辩证规律是可行的。
黄嘉韵等[17]收集临床鼻鼽病例资料,建立了鼻鼽辩证分型决策树模型,并且获得了较高的准确率。
通过决策树算法探索专病辨证规律具有可行性,在中医临床辨证过程中将会起到辅助诊断的作用。
4 神经网络神经网路又称为人工神经网络,是模仿人脑神经元而产生的一种仿生物技术类数据挖掘方法[4]。
神经网络的目的在于提取规则,在证候分类、证候诊断规则以及预测研究中经常使用,神经网络对已知证候与症状的关系或者对于建立专家系统都是有益的,但对某一个疾病的证候规律研究往往有局限性。
有学者将神经网络运用在诊断学中四诊的研究,例如张康等[18]通过神经网络对舌图像进行胖舌,瘦舌和正常舌的自动归类。
5 总结与展望数据挖掘技术在中医文献研究中已经得到广泛应用,在某一项研究中可以使用多种挖掘技术,这些挖掘技术不仅相互交叉又相互补充。
其中关联规则在中医文献研究中使用较多,也趋渐成熟。
聚类分析在中医文献研究中的使用频率也慢慢增多,然而在数据挖掘软件中,聚类分析呈现出的结果仅仅是归类而无结论,这就需要研究者深入探索再分析。