基于粗糙集的中医诊断算法实现

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(1. College of Business, Jiaxing University, Jiaxing Zhejiang 314000, China; 2. Jiaxing Traditional Chinese Medicine Hospital, Jiaxing Zhejiang 314000, China)
Abstract: The traditional way of TCM diagnosis is to judge symptoms by watching, hearing, interrogating and cutting, but these are qualitative descriptions, lack of quantitative criteria, and different people have different views on their classification and description. Data mining technology may complete the standardization and quantitative analysis of symptoms. It can assist clinicians to analyze and determine patients’ symptoms. Rough set can deal with a large number of data in the diagnosis of traditional Chinese medicine in the article.
关键词:数据挖掘;定量分析;粗糙集 中图分类号:TM711 文献标识码:A 文章编号:1003-9767(2019)21-048-03
Algorithmic Realization of TCM Diagnosis Based on Rough Set
Jiang Jiepin1, Wu Min1, Xu Jin2, Xie Xujin1, An Zhifei2
Key words: data mining; quantitative analysis; rough set
0 引言
随着信息化技术的发展,数据挖掘技术被不断应用在医 学上症状的规范化和定量分析中,可以帮助临床医生对于病 患的症状进行定量分析和定性判定。中医近百年来发展缓慢, 关键原因在于对大量数据信息的采集、存储、使用比较落后, 所以信息技术是中医发展的技术支撑。本文应用粗糙集对中 医诊断中的大量数据进行信息处理。
— 48 —
2019 年第 21 期
信息与电脑 China Computer & Communication
算法语言
不一致的。 命题 2:每个信息表都能唯一地分解成一个一致信息表
(y=1)和一个完全不一致信息表。
1.2 属性的重要度
1.2.1 定义 设 C 为条件属性集,D 为决策属性集,a ∈ C,那么属
第一,ZYD(a,C,D)∈ [0,1]。第二,若 ZYD(a,C, D)=0,则表示属性 a 对于决策属性 D 是可缺省的。因为从 属性集 C 中去除属性 a 后,原来可被准确分类所有对象仍能 够准确地被分类到各决策类中去。第三,ZYD(a,C,D) ≠ 0,则表示属性 a 对于决策属性 D 是不可省的。因为从属 性集 C 中去除属性 a 后,对于 C-{a} 中的信息,某些原来可 被准确分类的对象则不能被准确分类。
1 粗糙集方法中的属性约简 [1]
粗糙集方法中根据属性依赖程度确定属性的重要性,并 根据属性的重要性程度,找到一个符合条件的最小属性个数 的最小属性集。
1.1 属性的依赖度
1.1.1 定义 设信息表中有条件属性 C 和决策属性 D,那么决策属性
D 依赖条件属性 C 的依赖度可定义为:y(C,D)=|Pos(D) |/|U|。其中,|Pos(D)| 表示 Pos(D)的元素个数,|U| 表示 整个对象集合的个数。 1.1.2 计算 y(C,D)的取值 [2]
算法语言
信息与电脑 China Computer & Communication
基于粗糙集的中医诊断算法实现
2019 年第 21 期
蒋杰聘 1 吴 敏 1 徐 瑾 2 谢徐锦 1 安志飞 2
(1. 嘉兴学院商学院,浙江 嘉兴 314000;2. 嘉兴市中医医院,浙江 嘉兴 314000)
摘 要:中医诊断的传统方式是通过望、闻、问、切来判断症状,但这些症状通常都只是被定性描述,缺乏定量的 评价标准,并且对于最终的分类与描述,不同人也有不同的判定规则。数据挖掘技术能够进行症状的规范化和定量分析, 从而辅助临床医生对病患症状进行定量分析以及结合经验进行定性判定。粗糙集在本文中被应用到对中医诊断中的大量 数据进行信息处理及算法实现。
第三,若 y=0,意味着决策属性 D 完全不依赖于条件属 性 C,即利用条件属性 C 不能分类到决策属性 D 的类别中。 1.1.3 相关命题
根据属性依赖度定义,可以得到如下命题。 命题 1:如果依赖度 y=1,则信息表是一致的,否则是
基金项目:基于模糊语义规则的中医诊断分析平台(项目编号:201810354014)。 作者简介:蒋杰聘 (1998—),男,浙江台州人,本科在读。研究方向:信息系统、商务智能。
性 a 关于 D 的重要度则定义为 ZYD(a,C,D)=y(C,D)-y (C-{a},D)。其中,y(C-{a},D)表示当 C 中缺少属性 YD(a,C,D) 表示 C 中缺少属性 a 后,导致不能被准确分类的对象在系统 中所占的比例。 1.2.2 计算 ZYD(a,C,D)的取值
第一,若 y=1,意味着 IND(C)⊆ IND(D),即在已 知条件属性 C 的情况下,可将 U 上全部个体精确分类到决策 属性 D 的类别中去,即决策属性 D 完全依赖于条件属性 C。 第二,若 0 < y < 1,则称 D 部分依赖 C(D Rough 依赖于 C), 即在已知条件属性 C 下,只能将那些属于正域的个体分类到 决策属性 D 的类别中去。
相关文档
最新文档