基于机器学习的失眠症中医证素辨证模型的构建思路

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Database Technology
电子技术与软件工程
Electronic Technology & Software Engineering
基于机器学习的失眠症中医证素辨证模型的构建思路
辜伟科」王艳2劳祥婷'刘洁清' 廉永红"
(1.广西中医药大学赛恩斯新医药学院广西壮族自治区南宁市536000 )(2.广西中医药大学第一附属医院广西壮族自治区南宁市530023 )
摘要:本文将中医证素辨证与机器学习方法相结合,构建智能化的失眠症中医证素辨证模型,能够对失眠症的中医症状与证素之间 复杂的对应关系进行精确地分析,从中筛选出具有典型特征的病位证素与病性证素,实现在失眠症的诊疗过程中症状-证素-证名的智能
化辨识,从而使失眠症的中医证素辨证分型更加便捷' 高效和准确,对于提高失眠症向中医疗效具有重要的现实意义.
关键词:机器学习系统;辨证模型;模型构建
失眠症是指因无法入睡或无法保持睡眠状态,临床特征表现为 经常不能获得正常睡眠的一种常见病证失眠症属于祖国医学"不 寐”的范畴,由于失眠症的发病原因十分复杂,中医诊断存在着病
机分析繁杂、辨证分型混乱等的弊端,直接影响到临床施治的效果,
因而亟需建立一种能够准确辨识失眠症不同证候的方法及标准。

中 医证素辨证是在中医四诊辨识的基础上确定疾病的病位和病性,以
此构成证名的基本要素即证素,并依据不同证素的分值水平和组合 规律来确定各种证候分型,从而获得疾病治则治法和处方遣药的依
据证素辨证能够将中医定性的病症特点与定量的客观指标结合 起来,推动中医辨证向客观化、标准化的方向发展。

由此,基于证 素辨证的理论和方法来构建失眠症的中医规范化辨证模型是目前较
为可行的实现路径。

1中医证候与证素辨证
辨证论治是具有中医特色的一种临床诊疗模式,即通过望、闻、 问、切等手段获取患者的疾病资料来进行综合分析,确定其在某一
阶段的证候特征,并在此基础上制定治疗干预的方法和手段。

中医
证候是疾病在发生和发展过程中某一阶段症状和体征的概括,包括
病位病性、病因病机及发展趋势等。

中医证候可以说是对机体的一
个或多个脏腑功能失调的综合反映,因此,如果能从疾病的病位和
病性的角度来对中医证候进行精细的描述,可能更有利于建立较为
统一规范的中医证候诊断标准。

所谓证素即证候的基本要素,由湖南中医药大学朱文峰教授首
次提出,主要指辨证所确定的病位和病性因素旳。

证素是组成证候
的最小有效单位,不同的证素可组成各种证候分型,疾病在不同阶
段的证候组合可以综合反映疾病进行动态演变的整个发展过程。


医四诊所釆集的信息是对机体自身感受与外在表现的概括,多为主 观感受的模糊信息,因而经验不足的中医师很容易发生误诊误治。

证素辨证能够通过建立症状与证素之间的量化关系,确定某一症状
在不同证素中的贡献度,从而根据患者症状贡献度的加权总值,确
定症状-证素权值之和是否超过某一设定的诊断阈值,进而形成最 终的中医证素辨证证型。

2证素辨证与机器学习
证素辨证的基本原则是以症为据,从症辨证。

由于中医四诊
信息具有多维性,失眠症的症状与证素、证素与证候之间的关系交
错,某一证素可能对应多个症状,而某一个症状又可能对应多个证
素,症状与证素之间的复杂对应关系体现了中医证素辨证的非线性
特征。

而证素辨证时不仅要建立证候与证素之间、证素与证名(型)
之间的多维网络联系,还应充分认识每个症状对不同证素或证候具
有不同的诊断价值,因而需要对这些关系的强度进行定量描述,明
确每一症状对有关证素、证型的诊断贡献度。

一般的分类统计方法
很难比较准确地模拟中医证候分类的非线性演变过程,由此,机器
学习方法被引入中医证素辩证的研究之中。

作为人工智能的重要分支,机器学习(Machine Leamin g, ML ) 方法越来越多地应用于中医的诊治决策的分析过程之中。

机器学习 具有能够高效处理非线性数据的优势,可以通过一定的映射方法将 高维空间的数据映射到低维度空间,从而实现多维数据的“降维”⑴。

此外,机器学习有类“黑箱系统”,即不必完全清楚系统内部的结
构和相互关系,而是通过对系统的输入输出的数据反馈特点进行学
习,从中获取经验进而改善系统的分类、回归或预测等性能。

机器
学习算法涉及贝叶斯网络、K-means 聚类、支持向量机、决策树、 随机森林、人工神经网络等,而尤以支持向量机、人工神经网络方
法最为普遍。

3机器学习系统的基本结构
机器学习能模拟人的学习行为,自动地通过学习来获取知识和
技能,不断改善性能,实现自我完善內。

一个典型的机器学习系统
的基本结构应当包括环境、学习、知识库和执行四个部分。

机器学
习系统的环境是指系统外界信息的来源,一般认为,环境提供给系
统的信息水平与质量对于机器学习系统有很大影响。

学习是机器学 习系统的核心部分,即通过比较、归纳、分析和推理等方式将环境
所提供的信息进行加工处理后存入知识库。

学习是一个有特定目的
的知识获取过程,主要任务就是降低环境提供的信息水平与执行环
节的信息水平之间的差距。

知识库代表目系统前所拥有的知识,可 用来存储学习部分得到的结果,也包括指导执行部分运行的方法。

执行部分用于处理系统面临的现实问题,以及对所做出的结论进行
评价,并将获得的评价信息反馈给学习部分,从而进一步强化学习 系统的能力。

从中医证素辨证的角度看,环境就是通过中医四诊所
釆集的与患者相关的症状和体征信息,知识库用于存储针对患者的 症状和体征等进行初步处理后的数据,学习部分负责指导对知识库
的数据进行补充和修改,执行部分在经过运算后得出中医证素分型
的判断,并对判定结论的准确性作出评价。

当评价较差时就会将结
果反馈到学习部分,从而激活新一轮的机器学习过程。

4基于机器学习构建失眠症中医证素辨证模型
189
Database Technology
电子技术与软件工程Electronic Technology&Software Engineering
4.1数据采集
制定失眠症的中医临床症状规范化采集量表,根据中医四诊的方法收集失眠症患者的症状和体征资料,并对各种症状的不同程度进行定义和分级,构建失眠症中医临床调查数据库。

4.2数据预处理
按照以症测证的方法列出每个症状所有可能对应的病位和病性属性,构建失眠症患者的证素数据量表。

对失眠症患者的症状和证素等数据进行预处理,包括缺失值处理、重复值处理、以及统一数据的度量、零均值化、属性的分解与合并等数据转换的处理。

4.3特征选择
查找失眠症患者的症状数据及其对应的证素数据,并进行同一个症状对应的所有证素数据的加权计算,构建失眠症患者的症状数据与证素数据“加权求和、浮动阈值”的映射函数。

比如失眠症患者“入睡困难”的症状对应的证素权值积分为心・5,肺-9,肝・6,阴虚-7,痰-8,热-6,寒・3等,就可以根据阈值确定证素,如阈值设置为6,则确定的证素为集合为{肺,肝,阴虚,痰,热}。

特征选择就是从原始特征数据集中选择出子集,依据上述方法可以确立症状数据与证素数据的对应关系,剔除掉无关特征和兀余特征,从中筛选出与失眠症患者的症状数据关联程度较高的证素数据最优特征子集。

4.4降维
当对失眠症中医临床数据的特征选择完成后,可能由于特征矩阵过大导致在建模过程中出现计算量大以及训练时间长等问题,因此降低特征矩阵维度是必不可少的。

机器学习常用的降维方法有主成分分析(PCA),独立成分分析(ICA),线性判别分析(LDA)等。

4.5构建模型
将失眠症的中医临床数据划分为训练数据集和测试数据集,选取训练数据和测试数据的特征和标签,并根据学习目标和数据要求选择合适的机器学习算法。

利用训练集建立失眠症中医证素辨证预测模型,配置和调整超参数以获得最佳性能,然后将这种训练好的模型应用于测试集上进行预测。

根据模型在测试集上的表现来选择最佳模型。

机器学习的模型构建其实是一个参数学习与调优的过程,对模型进行训练是模型参数的学习更新过程。

4.6评估模型
构建失眠症的中医证素数据与证名的映射函数,根据不同的的失眠症证素数据组合成相应的失眠症中医证候或证型。

使用验证数据集验证和评估失眠症的中医证素辨证模型,进一步调整超参数以获得最佳性能。

并将中医证素辨证与成熟的中医专家系统辨证模型进行比较,以确定所构建的机器学习模型是否具有更高的预测精度。

5总结
中医证候学的研究一直是中医临床医学研究的热门领域。

中医临床疗效的关键在于辨证论治的准确与否,而中医证候分析则是辨证论治的核心⑹。

传统的中医证候分析不仅需要专业的知识背景,还要依赖于医生的经验积累。

中医证素辨证方法使中医证候学的研
究更加科学、细致,在中医辨证论治的临床运用中重复性好,同时又能把握住疾病和体质的个体化特征,为中医临床研究的客观化、标准化、规范化发展奠定了坚实的基础。

失眠症的中医证候分型较为混乱,缺乏统一的标准,从而造成中医药对失眠症的辨证论治过程难以实现客观化、规范化。

失眠症是一类多元多因素影响的复杂性疾病,运用证素辨证有助于认识和把握失眠症的本质,有助于把握失眠症的病机演变规律,也有助于失眠症证候的规范化研究,可以为失眠症的中医临床诊疗提供坚实的理论支持。

中医证候分析往往具有一定的主观性和随意性,所涉及的资料大多通过中医四诊合参等方式获取,具有数据维数大、冗余度高、精确性低、价值密度低的特点,这些都影响到中医证候分析的准确性以及临床治疗的效果。

机器学习是一门多领域交叉学科,专门研究计算机怎样模拟或实现人类的学习行为,可以通过学习从已知的样本中构建模型对未知样本进行预测,并能够在学习过程中进行自我校正、不断改善自身的性能,其应用遍及人工智能的各个领域⑺。

本研究将中医证素辨证与机器学习方法相结合,构建智能化的失眠症中医证素辨证模型,能够对失眠症的中医症状与证素之间复杂的对应关系进行精确地分析,从中筛选出具有典型特征的病位证素与病性证素,实现在失眠症的诊疗过程中症状■证素-证名的智能化辨识,从而使失眠症的中医证素辨证分型更加便捷、高效和准确,对于提高失眠症的中医疗效具有重要的现实意义。

参考文献
[1]熊桂华,张展.中医治疗失眠症的研究进展[J].中国医药科
学,2016,6(3):46-48+163.
[2]朱文锋.证素辨证研究钩玄[J].河南中医,2009,29(1):1-4.
[3]王卓雅,曾光,向茗,林湘东,黄惠勇•证素辨证与中医药标
准化[J].中医药导报,2015,21(4):1-4.
⑷余大龙.基于特征选择的数据降维算法研究[D],安徽大
学,2017.
[5]汤胜男,辛学刚.机器学习在生物信息学领域的应用与研究进
展[J].人工智能,2020,14(1):85-94.
[6]张煜.辨证方法的综合运用[J].时珍国医国药,2007(11):
2844.
[7]徐艺.机器学习算法及其应用研究[D],湖南大学,2014.
作者简介
辜伟科,男,广西中医药大学赛恩斯新医药学院,大学本科学历。

研究方向为中医证候的现代生物学研究。

王艳,女,广西中医药大学第一附属医院,硕士学位。

研究方向为中医治未病与健康管理。

劳祥婷,女,广西中医药大学第一附属医院,硕士学位。

研究方向为针灸的临床应用及机理研究。

刘洁清,女,广西中医药大学赛恩斯新医药学院,大学本科学历。

研究方向为中医药治疗疑难杂症的经验挖掘。

廉永红(通讯作者),男,广西中医药大学第一附属医院,中医学博士,中西医结合博士后。

研究方向为中医药信息分析与数据挖掘。

190。

相关文档
最新文档