电子病历数据挖掘与智能分析(万振)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
电子病历数据挖掘与智能分析
天津市海河医院
万振
天津市呼吸病研究所
应用范围
☐仅针对医院内部信息系统中电子数据的分析、挖掘、整合。
☐包括HIS、LIS、PACS、EMR、手麻、体检等多个存有科研相关电子医疗信息的子系统。
☐仅对科研的数据统计分析部分提供支持,尽量涵盖大部分常用的数据处理节点。
☐重点对内网数据挖掘及整合的方法做分析,对于所实现的功能仅举例叙述。
传统研数据获取及处理模式
确定科研患者名单查阅纸质病历
抄录相关数据利用EXCEL 等工具对相关数据进行电子化利用EXCEL 等工具进行筛选、排序、公式等处理
对多个基础EXCEL 表格进行组合交互处理借助统计分析软件进行
统计分析初步得出科研结论整体进一步分析完善补抄数据补抄数据
补抄数据补抄数据
传统科研数据获取的弊端
⏹纸质病历查阅步骤繁琐(手续、找到、翻阅、记录)
⏹科研人员手工抄录数据容易造成错误
⏹Excel等办公软件统计、分析、处理数据的能力有限
⏹科研人员手工抄录数据,再利用EXCEL等工具对相关数据进
行电子化,极大浪费人力,给科研人员带来巨大的工作量
HIS 基础架构平台LIS PACS 电子病历临床路径体检管理手麻管理院感管理移动医疗院长决策支持卫生部HQMS
医院信息集成平台(HIEP 平台)
信息集成平台建设(2012年-至今)
电子科研数据获取的难度
⏹基础医疗数据大多存在于HIS、LIS、PACS、EMR、手术麻醉、体检、心
电等多个子系统中。各系统来源于不同的生产厂商,数据存放在不同的数据库,数据多而散,数据库的设计缺乏标准化
⏹不同数据库中的数据靠患者主索引等进行关联,关联关系相当复杂
⏹各自厂家研发人员除了对自家系统的数据结构非常了解之外,缺乏对其
他系统数据结构的了解,整体数据分析能力较差
⏹专业做数据分析及整合的公司,缺乏对医院实际操作流程的深入了解,
导致对数据流向及关联关系的分析不够准确,且很难准确的拿到各子系统的基础数据,最终未必能做到数据全面、准确
HIS
患者基本信息
HIS
临时医嘱信息
PACS
影像检查信息
LIS
检验单主表
LIS 细菌表
LIS 药敏表
电子数据获取的步骤
对单个数据库,搞清基础数据的存放位置
(数据库、数据表、字段)
对多个数据库,搞清之间的关联关系
(主索引或其他标志)
做到对多个数据库中基础数据的任意抽取及整合
(保证数据准确、全面)
HIS :患者基本信息表、诊断表、用药表、医嘱表、费用表等。EMR :主诉表、现病史表、个人史表、体格检查、病程记录表、 会诊记录表、出院记录表等。
LIS :检验项目表、子项目表、细菌表、涂片表、药敏表等。PACS :检查名称表、检查方法表、影像表现表、印象表等。…………………………..
搞清基础数据都存放在哪些数据库中
(整体定位)HIS 、LIS 、PACS
EMR ………
对单个数据库,搞清相关字段之间的关系
(主键或组合主键)
HIS :患者基本信息表、诊断表、用药表、医嘱表、费用表、…..
HIS(字段)…..(字段)
LIS (字段)PACS(字段)
…..(字段)
EMR(字段)HIS
LIS PACS EMR ……
科 研 辅 助 管 理 系 统(中间数据库)
任意数据获取任意条件设定数据、图形及报表输出
多重交互分析
医院自身信息技术员在科研
数据获中的重要性
⏹基础数据获取是第一步,数据整合是第二步。如基础数据不能做到全
面、准确,数据整合将无从谈起
⏹基础数据获取是基于对基础数据存放位置、数据流向及关联关系的准
确掌握
⏹数据整合更多是基于对医院实际科研需求的准确掌握
⏹编程能力并不是最关键的因素
⏹鉴于日常参与开发维护的因素,医院自身信息技术人员对医院各个系
统的数据结构和数据流向都非常了解,同时与科研人员沟通顺畅,既懂技术、又熟知流程,可以最快速定位到科研人员的真实需求
⏹医院自身信息技术人员参与科研数据的挖掘及分析具有更大优势
科研数据辅助管理系统设计
☐设计原理
⏹对HIS、LIS、PACS、EMR等多个医疗信息数据库的表结构进
行深入分析,熟练掌握各项信息的准确存储位置,以及各系
统中相关信息的关联机制
⏹做到可根据用户设定的多个、多层规则条件,将所有相关电
子医疗信息挖掘出来
⏹根据关联机制对这些医疗数据进行整合,通过该软件最终实
现科研人员所需要的信息数据以及各类直方图、柱状图的自
动绘制等
涂片结果统计Array
该功能分别从LIS
(Sqlsever数据库)
和HIS(Oracle数据
库)两个数据库抓
取数据,查询某一
时间段做结核涂片
患者的基本信息和
涂片结果
分枝杆菌培养的结果统计
根据初治阳性患者姓名、年龄等信息制成外部文件,系统自动读取文件后,在数据库中检索出其基本信息和药敏结果并显示出来
根据复治阳性患者姓名、年龄等信息制成外部文件,系统自动读取文件后,在数据库中检索出其基本信息和药敏结果并显示出来