浅谈医学数据挖掘技术
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
断、治疗 和 医学研 究的发 展具 有重大 意义 。
2医学数 据挖 掘应 用 1 )疾 病 诊 断、 预测 : 数据 挖掘 可 以通 过 对 患者 大量 的 数据 资料 的 处 理 ,挖掘 出有 价值 的诊 断 规则 ,建立 预 测 模型 ,再对 这 个 模 型进 行测 试 , 得 到合 适 的算 法模 型 ,利用 这 种模 型 可 以辅助 临床 医 学诊 断 。如借 助数 据 挖 掘技术 中 的贝叶斯 (a e )网络技 术来 研究抑 郁症 的 中医证 候规律 。 B ys 2 )遗 传 基 因 :遗 传 学 的 研 究 表 明 , 遗传 疾 病 的发 生 是 由基 因 决定 的,如何 从大量 的D A N 数据 中找 到具有 统计特 异性 的序 列就 成为 最迫切 需要 解 决的 问题 。建 立 良好 的系 统模 型将 基 因组 数据 进行 有 效地 存储 、分 析和 挖掘 ,从 而获取 大量 有价值 的 知识 。 3 )医 学 图像 挖掘 : 医学 图像是 利 用人 体 内不 同器 官和 组织 对x 射线 、
T T SLC II ON
VALL EY 一臻
【 科技刨新论坛 】
浅 谈 医 学 数 据 挖 掘 技 术
方 胜 吉
( 吉林医药学院 计算机教研室 吉林 吉林 12 1 ) 3 0 3
摘
要: 对数据挖掘的概念,医学数据 的特殊性 以及医学数据挖掘的关键 技术做详细 的阐述 ,介绍在医学当中数据挖掘 如何应用 ,并给出具体实例
超声 波 、光 线等 的散 射 、透射 、反射 和 吸收 的不 同特 性 而形成 的 ,为人 体
骨骼 、 内脏 器官疾 病 和损 伤 进行 诊 断 、定位 提供 了有 效 的手 段 ,对 医学 图 像 的存 储与 挖掘将 对 人体 内部器 官的 诊断 与治疗 具有 重大 意义 。
3应 用 举例
疾病 的主 观不 确切性 ,形成 了医学信 息 的不完整 性 。
规则 2 :脉 紧,得 出太 阳病 ( 支持 度 3% 0 ,置信度 1 )支 持度 与置信 度 % 小 ,故认 为不 能单独 凭脉紧 就 诊断为 太 阳病 。 规 ̄3 t :脉 弦,得 出太 阳病 ( J 支持 度 0 5 ,置信度 05 )支 持度与 置 .% .% 信度 都太 小 ,可 以认 为脉 弦根本 不是 太 阳病的 备选证 候 。 4结 束 语 医学数 据库 的信 息量 非 常庞 大 ,其数 据又 具有 自身 的独 特性 要 想充
度 ,医学检 测 的波型 、 图像 都是 时间 函数 ,这些 都具 有一 定的 时序性 。
4 )数据 冗 余性 :医学 数 据库 是 一个 庞 大 的数据 资源 ,有 大 量相 同的 或部 分相 同的信 息存储 在其 中 。 13 医学数 据挖掘 的关 键技术 . 医学数 据 的特 点使其 与 常规 的数据 挖掘 之 间存在 较 大的差 异 ,其关 键 技术 如下 :
关 联规 则在 中医疾 病症 候诊 断中 的应用 : [] 1 通 过采 用基 于关 联规 则 的数据 挖掘 方法 ,可 以得 到 很有价 值 的一些 规 则 ,如 从 《 寒 论 》 中的 病名 ,症 状 ,舌 苔分 别 作 为数 据 表 建立 数 据库 , 伤
挖 掘得 出:
规则l :发 热 、恶寒 、脉 浮身 ,能 够得 出太 阳病 ( 持度 6% 支 5 ,置 信度 5 ,兴趣 度 12 ,说 明 《 寒论 》 里提 到 的发 热 、恶寒 、脉 浮 、太 阳病 的 % .) 伤 条文 占6% 多 ,该规 则很有 意义 ,可 以认 为发热 、恶 寒 的确 是太 阳病 的诊 5之
断依 据 来自百度文库
2 )信 息 不完 整 性 :病例 和 病案 的有 限性 使 医学 数据 库 不可 能对 任 何
一
种疾 病信 息都 能全 面地 反 映 ,疾病 信 息所 体现 出 的客 观不 完整 性和 描述 3 )数 据 的时 序性 :病 人 的 就诊 、疾 病 的 发病 过程 在 时 间上 有一 个进
1医学 数据挖 掘技 术 1 1数据挖 掘 的定 义 .
数据 挖掘 是近 年来 随着 数据 库和 人工 智 能技术 发展 而 出现 的一种 新 兴 信 息技 术 就 是从 大 量 的 、 不完 全 的 、 有 噪声 的、 模 糊 的实 际应 用 数据
中 ,提取 隐含 在 其 中的 、人们 事先 不 知道 的 ,但 又是 潜在 有用 的信息 和 知 识 的过 程 ,它 能 高度 自动 化地 分 析 数据 仓 库 原有 数 据 ,做 出归 纳性 推 理 , 挖掘 出潜在 的模式 ,最 大效 能地 利用 已有信 息和数 据 。 1 医学数据 挖掘 的特殊 性 2 医学数据 挖 掘 的主要 研究对 象 是 i 医疗信 息 ,反 映了 医学信 息 的独 临床 特 之处 : 1 )模 式 多态 性 : 医学信 息 包括 纯 数据 、 信 号、 图像 、文 字 以及 语 音 和 视频信 息等 多态 性数据 。
关键词: 数据挖掘;医学:技术;应用 中图分类号:G 0 文献标识码:A 文章编号 :1 7 —7 9 2 1 )12 1O 1 34 1 5 7( 0 0 00 8 一0 6
O前言
和可靠 性 。
随着数 据库 技术 的迅 速发 展 ,在 医疗机 构 中大量 的 医疗数 据被 精确 地 统计 下 来 。 同 时 ,电 子病 例 和 病 案 的 大量 应 用 、 医疗 设 备 和 仪 器 的数 字 化 ,使 得 医院 数据 库 的信 息量剧 增 ,这 些珍 贵 的 医学信 息 资源 对于 疾病 的 诊断 、治 疗和研 究 都是 非 常有价 值 的 ,然而 目前的 数据 库系 统 无法 发现 数 据 中 存 在 的关 系 和 规 则 ,无 法 根 据现 有 的数 据 预 测 未来 的 发 展 趋 势 。 因 此 ,如 何 从这 些 海量 的数 据 中 , 挖掘 出有 用 的信 息 ,为 疾病 的 防控 、 诊
2医学数 据挖 掘应 用 1 )疾 病 诊 断、 预测 : 数据 挖掘 可 以通 过 对 患者 大量 的 数据 资料 的 处 理 ,挖掘 出有 价值 的诊 断 规则 ,建立 预 测 模型 ,再对 这 个 模 型进 行测 试 , 得 到合 适 的算 法模 型 ,利用 这 种模 型 可 以辅助 临床 医 学诊 断 。如借 助数 据 挖 掘技术 中 的贝叶斯 (a e )网络技 术来 研究抑 郁症 的 中医证 候规律 。 B ys 2 )遗 传 基 因 :遗 传 学 的 研 究 表 明 , 遗传 疾 病 的发 生 是 由基 因 决定 的,如何 从大量 的D A N 数据 中找 到具有 统计特 异性 的序 列就 成为 最迫切 需要 解 决的 问题 。建 立 良好 的系 统模 型将 基 因组 数据 进行 有 效地 存储 、分 析和 挖掘 ,从 而获取 大量 有价值 的 知识 。 3 )医 学 图像 挖掘 : 医学 图像是 利 用人 体 内不 同器 官和 组织 对x 射线 、
T T SLC II ON
VALL EY 一臻
【 科技刨新论坛 】
浅 谈 医 学 数 据 挖 掘 技 术
方 胜 吉
( 吉林医药学院 计算机教研室 吉林 吉林 12 1 ) 3 0 3
摘
要: 对数据挖掘的概念,医学数据 的特殊性 以及医学数据挖掘的关键 技术做详细 的阐述 ,介绍在医学当中数据挖掘 如何应用 ,并给出具体实例
超声 波 、光 线等 的散 射 、透射 、反射 和 吸收 的不 同特 性 而形成 的 ,为人 体
骨骼 、 内脏 器官疾 病 和损 伤 进行 诊 断 、定位 提供 了有 效 的手 段 ,对 医学 图 像 的存 储与 挖掘将 对 人体 内部器 官的 诊断 与治疗 具有 重大 意义 。
3应 用 举例
疾病 的主 观不 确切性 ,形成 了医学信 息 的不完整 性 。
规则 2 :脉 紧,得 出太 阳病 ( 支持 度 3% 0 ,置信度 1 )支 持度 与置信 度 % 小 ,故认 为不 能单独 凭脉紧 就 诊断为 太 阳病 。 规 ̄3 t :脉 弦,得 出太 阳病 ( J 支持 度 0 5 ,置信度 05 )支 持度与 置 .% .% 信度 都太 小 ,可 以认 为脉 弦根本 不是 太 阳病的 备选证 候 。 4结 束 语 医学数 据库 的信 息量 非 常庞 大 ,其数 据又 具有 自身 的独 特性 要 想充
度 ,医学检 测 的波型 、 图像 都是 时间 函数 ,这些 都具 有一 定的 时序性 。
4 )数据 冗 余性 :医学 数 据库 是 一个 庞 大 的数据 资源 ,有 大 量相 同的 或部 分相 同的信 息存储 在其 中 。 13 医学数 据挖掘 的关 键技术 . 医学数 据 的特 点使其 与 常规 的数据 挖掘 之 间存在 较 大的差 异 ,其关 键 技术 如下 :
关 联规 则在 中医疾 病症 候诊 断中 的应用 : [] 1 通 过采 用基 于关 联规 则 的数据 挖掘 方法 ,可 以得 到 很有价 值 的一些 规 则 ,如 从 《 寒 论 》 中的 病名 ,症 状 ,舌 苔分 别 作 为数 据 表 建立 数 据库 , 伤
挖 掘得 出:
规则l :发 热 、恶寒 、脉 浮身 ,能 够得 出太 阳病 ( 持度 6% 支 5 ,置 信度 5 ,兴趣 度 12 ,说 明 《 寒论 》 里提 到 的发 热 、恶寒 、脉 浮 、太 阳病 的 % .) 伤 条文 占6% 多 ,该规 则很有 意义 ,可 以认 为发热 、恶 寒 的确 是太 阳病 的诊 5之
断依 据 来自百度文库
2 )信 息 不完 整 性 :病例 和 病案 的有 限性 使 医学 数据 库 不可 能对 任 何
一
种疾 病信 息都 能全 面地 反 映 ,疾病 信 息所 体现 出 的客 观不 完整 性和 描述 3 )数 据 的时 序性 :病 人 的 就诊 、疾 病 的 发病 过程 在 时 间上 有一 个进
1医学 数据挖 掘技 术 1 1数据挖 掘 的定 义 .
数据 挖掘 是近 年来 随着 数据 库和 人工 智 能技术 发展 而 出现 的一种 新 兴 信 息技 术 就 是从 大 量 的 、 不完 全 的 、 有 噪声 的、 模 糊 的实 际应 用 数据
中 ,提取 隐含 在 其 中的 、人们 事先 不 知道 的 ,但 又是 潜在 有用 的信息 和 知 识 的过 程 ,它 能 高度 自动 化地 分 析 数据 仓 库 原有 数 据 ,做 出归 纳性 推 理 , 挖掘 出潜在 的模式 ,最 大效 能地 利用 已有信 息和数 据 。 1 医学数据 挖掘 的特殊 性 2 医学数据 挖 掘 的主要 研究对 象 是 i 医疗信 息 ,反 映了 医学信 息 的独 临床 特 之处 : 1 )模 式 多态 性 : 医学信 息 包括 纯 数据 、 信 号、 图像 、文 字 以及 语 音 和 视频信 息等 多态 性数据 。
关键词: 数据挖掘;医学:技术;应用 中图分类号:G 0 文献标识码:A 文章编号 :1 7 —7 9 2 1 )12 1O 1 34 1 5 7( 0 0 00 8 一0 6
O前言
和可靠 性 。
随着数 据库 技术 的迅 速发 展 ,在 医疗机 构 中大量 的 医疗数 据被 精确 地 统计 下 来 。 同 时 ,电 子病 例 和 病 案 的 大量 应 用 、 医疗 设 备 和 仪 器 的数 字 化 ,使 得 医院 数据 库 的信 息量剧 增 ,这 些珍 贵 的 医学信 息 资源 对于 疾病 的 诊断 、治 疗和研 究 都是 非 常有价 值 的 ,然而 目前的 数据 库系 统 无法 发现 数 据 中 存 在 的关 系 和 规 则 ,无 法 根 据现 有 的数 据 预 测 未来 的 发 展 趋 势 。 因 此 ,如 何 从这 些 海量 的数 据 中 , 挖掘 出有 用 的信 息 ,为 疾病 的 防控 、 诊