中医药古文献知识挖掘与利用研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
风温病辨治规律及特点总结
风温病因以风邪、温热、伏邪、误治四类为主,“误治”有待关注;
风温病位多在肺;
风温证候包括肺卫证候、气分证候、营血分证等;
风温治法以清热解表宣肺为主,清法兼有滋阴;
风温用药常以川芎-羌活、石膏-葛根、薄荷-连翘、杏仁-石膏配伍;
风温治疗常用方包括葳蕤汤加减等。
基于语义关联的温病古籍知识检索系统 研究方法与技术路线
46种温病古籍文本及医籍、医家、现代研究信息的采集、规范。 病、证、治、方、药、医籍、医家,7类概念术语的语义关联。
25种语义关系的定义,各类温病古籍知识的关联依据。
医家 …论述 …记载 包 含 疾病 由..导致 包 含 证候
语义关联示例 (疾病类)
医籍
治法
症状
影 响 由..治疗
由..治疗
方剂
病因
中药
组织方法
10种本草古籍概念类型词条分布
6755条本草数据
99352条知识术语
基于知识组织的本草知识检索系统
功能特色:
1、基于知识关联词表检索相关本草知识,检索结果不局限于本草本身,
同时能够检索到与其相关的其他概念类型,即本草的“知识体”。
2、其他各类概念类型知识与本草药物的“交互检索”,能够通过其他概
基于语义关联的温病古籍知识检索系统 研究方法与技术路线
温病古籍知识的语义关联检索,根据语义 检索相关知识点。 温病古籍知识检索系统 温病古籍和相关文献信息的整合,具有一 定的研究支持功能。 温病古籍知识及其概念属性关系的多维度、 可视化展示。
温病古籍全文检索及原文浏览功能
基于语义关联的温病古籍知识检索系统 研究方法与技术路线 检索结果界面
基于语义关联的温病古籍知识检索系统 研究方法与技术路线 检索结果的可视化展示(三仁汤)
基于语义关联的温病古籍知识检索系统 研究方法与技术路线 全文检索及浏览界面
基于知识组织的本草知识检索系统 研究方法与技术路线
•10种本草古籍; •根据概念类型提取归类本草知识 •根据概念关系实现本草知识关联 •数据整理和规范。
Valid Missing
对风温病因进行K-means聚类,经过5次
迭代,将其分为4类时较为合适: 第一类包含案例数109个----误治 第二类包含案例6个----毒邪 第三类案例49个----温邪和伏邪 第四类包含案例40个----热邪和风邪
古籍温病辨治特点的知识挖掘 研究方法与技术路线
因子分析与聚类相结合的风温证候挖掘
专家 指导 温病古籍知识分类与概念 关系定义(语义本体方法 )
(中医药学语言系统)
温病古籍
采集相关 文献信息
基于原文的知识提取
(中医大辞典、中医药学术语集成)
标准 规范
知识和术语的分类、规范
(温病大词典)
对知识、术语、文献信息 进行概念关系关联,形成 温病古籍知识体
温病古籍知识检索系统
基于语义关联的温病古籍知识检索系统 研究方法与技术路线
Factor 1: 身重、多眠、语言謇涩、鼾、汗、脉浮 Factor 2: 失溲、直视、小便不利 Factor 3: 咳嗽、恶风、烦、渴 Factor 4: 脉弦、脉数 Factor 5: 发黄、瘛疭 Factor 6: 谵语、利、神昏 Factor 7: 喘、痰、躁 Factor 8: 头痛 Factor 9: 热、身热、疹 Factor 10:咽痛、舌白
运用数理统计法对四时温病的病因、病位、症状、治法等信息进 行频次、频率、累积频率统计分析;
对四时温病病因进行聚类分析;
采用因子分析与聚类相结合探索四时温病证候;
基于关联规则挖掘药物配伍以及症状-中药间关系。
古籍温病辨治特点的知识挖掘 研究方法与技术路线
以风温病为例
风温病因、症状、病位、治法、方剂的频次分析
六种证候: 邪郁卫表; 邪热蕴内; 风热蕴肺; 邪入心包; 热入营分; 少阴证候。
古籍温病辨治特点的知识挖掘 研究方法与技术路线
基于关联规则风温病用药、症状-中药分析
频繁单项集----高频单味药
频繁 2项集----找寻药对
频繁 3项集 频繁 4项集----药物组合 频繁多项集
古籍温病辨治特点的知识挖掘 研究方法与技术路线
四时起居
节气、睡眠、服食 节气、睡眠、服食 、疾病、调养 ... 、疾病、调养 ...
存在问题及展望
中医古籍数字化及文本化是知识挖掘和深度利用的基础,
目前,中医古籍数字化的基础总体上依然薄弱。 古籍中概念知识的标准化、规范化研究有待进一步研究 应用知识挖掘、知识组织和语义网相关研究方法,能够对 中医古籍知识进行深度的解析、揭示及利用,为中医古籍 知识的深度挖掘与利用提供了新的途径。
念类型的知识检索到相关本草药物。
3、根据检索结果进行本草古籍的全文检索与阅读。
4、本草知识和关系的动态、可视化展示,本草知识展示的控制与交互。
基于知识组织的本草知识检索系统 研究方法与技术路线
检索结果-(古籍中黄芩的相关知识及可视化)
基于知识组织的本草知识检索系统 研究方法与技术路线
交互检索-(古籍中治疗黄疸的药物)
中医古籍 编辑平台
发布阅览 系统 服务器 数据库
解 析
电子古籍 阅览系统
用 户 管理
Web 界 面 检索
古籍图像 浏览
中医药古文献的知识挖掘与利用
利用现代信息技术和数据挖掘等手段对中医药古文献知识进行解析、 归类、重组和关联,使其成为结构化的知识库,从而实现中医药古文献的 知识发现与知识服务。 温病知识 检索系统
谢谢!
请各位专家指正!
•基于原文进行文献分析。
书文 目献 选调 取研
概概 念念 类关 型系
知知 识识 提关 取联
检组 索织 系方 统法
•梳理本草古籍中的概念类型 •定义本草知识的概念关系。
•设计构建本草古籍知识检索系统 •中医古籍资源的深度检索
基于知识组织的本草知识检索系统 研究方法与技术路线
63种概念类型定义,如名称、分类、来源、性能、配伍、功用、组方、 炮制等,是本草古籍中的主体知识组织结构。 定义各概念类型间的概念关系27种,是本草知识关联的依据。 基于原文的解析、概念类型的知识分类、概念关系关联的本草古籍知识
现状与趋势
古 籍
选 择 扫描
保 存 图 形 处 理 导 入 古 箱 图 片
•
• •
中医药古文献数字化及数据库建设 发展迅速。
中医药古代文献知识的深度开发与 利用不足。 从数字化、数据库建设到知识库构 建和知识服务的方向发展
二 次 校 对
压 缩 上 传
生 成 古籍电 子书 电子古籍 发布系统 发 布
中医药古文献知识挖掘与利用研究
中国中医科学院中医药信息研究所 李兵
2015.08.02
目录
一、背景 二、现状与趋势 三、中医古文献知识的挖掘与利用 四、温病古籍的知识挖掘与利用 五、基于知识组织的本草知识检索平台 六、问题与展望
Contents
背景
中医药古文献知识是现代中医药学知识的源泉。 古文献的特殊性使其知识的挖掘与利用较一般文献更加困难。 信息化,大数据,移动医疗的发展时代,挖掘和利用中医药古文献知识。
基于知识组织的本草知识检索系统 研究方法与技术路线
检索结果全文浏览
其他类中医药古文献的应用
阴阳、五行、气血、 经络...
七情、疾病、调节 ...
养生理论
食用本草、药性、功 用、疾病、用法...
wk.baidu.com
情志养生
饮食养生
中医养生
导引按摩
经穴、手法、疾病 、图示、...
针灸刮痧 拔罐... 经络、穴位、手法、 疾病....
数据挖掘方法 语义本体方法
温病和本草 古籍为例
10种温病 辨治规律 的知识挖掘
本草知识 检索平台
知识组织方法
古籍温病辨治特点的知识挖掘 研究方法与技术路线
古籍温病辨治特点的知识挖掘 研究方法与技术路线
采用相应的数据挖掘方法,分析古籍中10种温病的辨治规律和特点。
即古籍中记载10种温病的病因、病位、治法、药物配伍规律及常用方等 。
古籍温病辨治特点的知识挖掘 研究方法与技术路线
Number of Cases in each Cluster
基于K-mean聚类的风温病病因分析
Cluster
1 2 3 4
109.000 6.000 49.000 40.000 204.000 .000
K-means聚类
一种聚簇算法,也是一种最简单的无监督学习算法之一, 也称之为动态聚类或逐步聚类方法,是目前最著名和最常 用的基于划分的数据挖掘算法。本研究基于聚类对四时温 病病因研究。
成份 身重 多眠 1 .857 .842 2 3 4 5 6 7 8 9 10
语言謇 涩 鼾
汗 脉浮 失溲 直视 小便不 利 咳嗽 恶风 烦 渴 脉弦 脉数 发黄 瘛疭 谵语 利 神昏 喘 痰 躁 头痛 热 身热 疹 咽痛 舌白
.841
.840 .736 .577 .931 .912 .891 .736 .689 .665 .600 .822 .820 .953 .950 .778 .773 .471 .800 .724 .616 .802 .722 -.672 .553 .726 .408 .498
风温病因以风邪、温热、伏邪、误治四类为主,“误治”有待关注;
风温病位多在肺;
风温证候包括肺卫证候、气分证候、营血分证等;
风温治法以清热解表宣肺为主,清法兼有滋阴;
风温用药常以川芎-羌活、石膏-葛根、薄荷-连翘、杏仁-石膏配伍;
风温治疗常用方包括葳蕤汤加减等。
基于语义关联的温病古籍知识检索系统 研究方法与技术路线
46种温病古籍文本及医籍、医家、现代研究信息的采集、规范。 病、证、治、方、药、医籍、医家,7类概念术语的语义关联。
25种语义关系的定义,各类温病古籍知识的关联依据。
医家 …论述 …记载 包 含 疾病 由..导致 包 含 证候
语义关联示例 (疾病类)
医籍
治法
症状
影 响 由..治疗
由..治疗
方剂
病因
中药
组织方法
10种本草古籍概念类型词条分布
6755条本草数据
99352条知识术语
基于知识组织的本草知识检索系统
功能特色:
1、基于知识关联词表检索相关本草知识,检索结果不局限于本草本身,
同时能够检索到与其相关的其他概念类型,即本草的“知识体”。
2、其他各类概念类型知识与本草药物的“交互检索”,能够通过其他概
基于语义关联的温病古籍知识检索系统 研究方法与技术路线
温病古籍知识的语义关联检索,根据语义 检索相关知识点。 温病古籍知识检索系统 温病古籍和相关文献信息的整合,具有一 定的研究支持功能。 温病古籍知识及其概念属性关系的多维度、 可视化展示。
温病古籍全文检索及原文浏览功能
基于语义关联的温病古籍知识检索系统 研究方法与技术路线 检索结果界面
基于语义关联的温病古籍知识检索系统 研究方法与技术路线 检索结果的可视化展示(三仁汤)
基于语义关联的温病古籍知识检索系统 研究方法与技术路线 全文检索及浏览界面
基于知识组织的本草知识检索系统 研究方法与技术路线
•10种本草古籍; •根据概念类型提取归类本草知识 •根据概念关系实现本草知识关联 •数据整理和规范。
Valid Missing
对风温病因进行K-means聚类,经过5次
迭代,将其分为4类时较为合适: 第一类包含案例数109个----误治 第二类包含案例6个----毒邪 第三类案例49个----温邪和伏邪 第四类包含案例40个----热邪和风邪
古籍温病辨治特点的知识挖掘 研究方法与技术路线
因子分析与聚类相结合的风温证候挖掘
专家 指导 温病古籍知识分类与概念 关系定义(语义本体方法 )
(中医药学语言系统)
温病古籍
采集相关 文献信息
基于原文的知识提取
(中医大辞典、中医药学术语集成)
标准 规范
知识和术语的分类、规范
(温病大词典)
对知识、术语、文献信息 进行概念关系关联,形成 温病古籍知识体
温病古籍知识检索系统
基于语义关联的温病古籍知识检索系统 研究方法与技术路线
Factor 1: 身重、多眠、语言謇涩、鼾、汗、脉浮 Factor 2: 失溲、直视、小便不利 Factor 3: 咳嗽、恶风、烦、渴 Factor 4: 脉弦、脉数 Factor 5: 发黄、瘛疭 Factor 6: 谵语、利、神昏 Factor 7: 喘、痰、躁 Factor 8: 头痛 Factor 9: 热、身热、疹 Factor 10:咽痛、舌白
运用数理统计法对四时温病的病因、病位、症状、治法等信息进 行频次、频率、累积频率统计分析;
对四时温病病因进行聚类分析;
采用因子分析与聚类相结合探索四时温病证候;
基于关联规则挖掘药物配伍以及症状-中药间关系。
古籍温病辨治特点的知识挖掘 研究方法与技术路线
以风温病为例
风温病因、症状、病位、治法、方剂的频次分析
六种证候: 邪郁卫表; 邪热蕴内; 风热蕴肺; 邪入心包; 热入营分; 少阴证候。
古籍温病辨治特点的知识挖掘 研究方法与技术路线
基于关联规则风温病用药、症状-中药分析
频繁单项集----高频单味药
频繁 2项集----找寻药对
频繁 3项集 频繁 4项集----药物组合 频繁多项集
古籍温病辨治特点的知识挖掘 研究方法与技术路线
四时起居
节气、睡眠、服食 节气、睡眠、服食 、疾病、调养 ... 、疾病、调养 ...
存在问题及展望
中医古籍数字化及文本化是知识挖掘和深度利用的基础,
目前,中医古籍数字化的基础总体上依然薄弱。 古籍中概念知识的标准化、规范化研究有待进一步研究 应用知识挖掘、知识组织和语义网相关研究方法,能够对 中医古籍知识进行深度的解析、揭示及利用,为中医古籍 知识的深度挖掘与利用提供了新的途径。
念类型的知识检索到相关本草药物。
3、根据检索结果进行本草古籍的全文检索与阅读。
4、本草知识和关系的动态、可视化展示,本草知识展示的控制与交互。
基于知识组织的本草知识检索系统 研究方法与技术路线
检索结果-(古籍中黄芩的相关知识及可视化)
基于知识组织的本草知识检索系统 研究方法与技术路线
交互检索-(古籍中治疗黄疸的药物)
中医古籍 编辑平台
发布阅览 系统 服务器 数据库
解 析
电子古籍 阅览系统
用 户 管理
Web 界 面 检索
古籍图像 浏览
中医药古文献的知识挖掘与利用
利用现代信息技术和数据挖掘等手段对中医药古文献知识进行解析、 归类、重组和关联,使其成为结构化的知识库,从而实现中医药古文献的 知识发现与知识服务。 温病知识 检索系统
谢谢!
请各位专家指正!
•基于原文进行文献分析。
书文 目献 选调 取研
概概 念念 类关 型系
知知 识识 提关 取联
检组 索织 系方 统法
•梳理本草古籍中的概念类型 •定义本草知识的概念关系。
•设计构建本草古籍知识检索系统 •中医古籍资源的深度检索
基于知识组织的本草知识检索系统 研究方法与技术路线
63种概念类型定义,如名称、分类、来源、性能、配伍、功用、组方、 炮制等,是本草古籍中的主体知识组织结构。 定义各概念类型间的概念关系27种,是本草知识关联的依据。 基于原文的解析、概念类型的知识分类、概念关系关联的本草古籍知识
现状与趋势
古 籍
选 择 扫描
保 存 图 形 处 理 导 入 古 箱 图 片
•
• •
中医药古文献数字化及数据库建设 发展迅速。
中医药古代文献知识的深度开发与 利用不足。 从数字化、数据库建设到知识库构 建和知识服务的方向发展
二 次 校 对
压 缩 上 传
生 成 古籍电 子书 电子古籍 发布系统 发 布
中医药古文献知识挖掘与利用研究
中国中医科学院中医药信息研究所 李兵
2015.08.02
目录
一、背景 二、现状与趋势 三、中医古文献知识的挖掘与利用 四、温病古籍的知识挖掘与利用 五、基于知识组织的本草知识检索平台 六、问题与展望
Contents
背景
中医药古文献知识是现代中医药学知识的源泉。 古文献的特殊性使其知识的挖掘与利用较一般文献更加困难。 信息化,大数据,移动医疗的发展时代,挖掘和利用中医药古文献知识。
基于知识组织的本草知识检索系统 研究方法与技术路线
检索结果全文浏览
其他类中医药古文献的应用
阴阳、五行、气血、 经络...
七情、疾病、调节 ...
养生理论
食用本草、药性、功 用、疾病、用法...
wk.baidu.com
情志养生
饮食养生
中医养生
导引按摩
经穴、手法、疾病 、图示、...
针灸刮痧 拔罐... 经络、穴位、手法、 疾病....
数据挖掘方法 语义本体方法
温病和本草 古籍为例
10种温病 辨治规律 的知识挖掘
本草知识 检索平台
知识组织方法
古籍温病辨治特点的知识挖掘 研究方法与技术路线
古籍温病辨治特点的知识挖掘 研究方法与技术路线
采用相应的数据挖掘方法,分析古籍中10种温病的辨治规律和特点。
即古籍中记载10种温病的病因、病位、治法、药物配伍规律及常用方等 。
古籍温病辨治特点的知识挖掘 研究方法与技术路线
Number of Cases in each Cluster
基于K-mean聚类的风温病病因分析
Cluster
1 2 3 4
109.000 6.000 49.000 40.000 204.000 .000
K-means聚类
一种聚簇算法,也是一种最简单的无监督学习算法之一, 也称之为动态聚类或逐步聚类方法,是目前最著名和最常 用的基于划分的数据挖掘算法。本研究基于聚类对四时温 病病因研究。
成份 身重 多眠 1 .857 .842 2 3 4 5 6 7 8 9 10
语言謇 涩 鼾
汗 脉浮 失溲 直视 小便不 利 咳嗽 恶风 烦 渴 脉弦 脉数 发黄 瘛疭 谵语 利 神昏 喘 痰 躁 头痛 热 身热 疹 咽痛 舌白
.841
.840 .736 .577 .931 .912 .891 .736 .689 .665 .600 .822 .820 .953 .950 .778 .773 .471 .800 .724 .616 .802 .722 -.672 .553 .726 .408 .498