中文分词技术在电子病历系统中的应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中文分词技术在电子病历系统中的应用

二〇一二年十月

摘要

电子病历(Electronic Medical Record,EMR)是医疗机构医务人员对门诊、住院患者临床诊疗和指导干预的、使用信息系统生成的文字、符号、图表、图形、数据、影像等数字化的医疗服务工作记录,是居民个人在医疗机构历次就诊过程中产生和被记录的完整、详细的临床信息资源,它可在医疗卫生服务中作为主要的信息源,取代纸张病历,医院通过电子病历以电子化方式记录患者就诊的信息,包括:首页、病程记录、检查检验结果、医嘱、手术记录、护理记录等等,其中既有结构化信息,也有非结构化的自由文本,还有图形图象信息,在医疗中作为主要的信息源,提供超越纸张病历的服务,满足医疗、法律和管理需求。

电子病历系统(Electronic Medical Record System, EMRs)是针对基于计算机和信息网络的电子病历进行采集、储存、传输、展现、检索、质量控制、统计和利用的系统。

为了进一步推进以电子病历为核心的医院信息化建设工作,提高医院信息化管理水平,截止2012年1月底,卫生部先后制定下发了《电子病历基本规范(试行)》、《电子病历系统功能规范(试行)》、《电子病历系统功能应用水平分级评价方法及标准》、《电子病历基本数据集(征求意见稿)》等法规和规范性文件。

在《电子病历系统功能规范(试行)》中明确了对电子病历书写需要将自然语言方式录入的医疗文书按照医学信息学的要求进行结构化以及对结构化数据的检索和统计进行了要求。在《电子病历基本数据集(征求意见稿)》中进一步确定了电子病历数据进行数据交换的基本数据集模型。由此可见电子病历的“结构化”是电子病历系统设计和实施的重点和难点。

本文将阐述如何通过在目前新版电子病历系统中引入中文分词技术,解决目前电子病历系统中电子病历数据的“结构化”难题,实现电子病历用户在实际应用中通过自然语言进行自由文本方式的输入的同时,能够通过计算机的辅助进行病历内容的结构化,为日后的查询、统计、数据交换提供基础。

本文阐述的主要内容如下:

(1)目前电子病历系统的结构化问题;

(2)中文分词技术概述;

(3)中文分词技术在电子病历系统结构化中的具体应用;

(4)中文分词技术应用的分析总结及展望。关键词:中文分词、电子病历系统、结构化

第一章电子病历的结构化

1.1为什么要结构化

电子病历相对于传统手写病历的优点是显而易见的,并且随着IT技术的发展,以及医疗信息化建设的利益加强,电子病历的发展是必然的趋势。而且顺应以电子病历为核心的医院信息化建设工作的推进,电子病历已经成为医疗信息化的重要组成部分。

国内电子病历开始于2000年左右,在此之前所开发的电子病历只能称之为病历电子文档化,基本上都是基于Word或写字板的功能,目前这种电子文档化病历目前仍然在一些医院正在使用。国内较早的一些结构化电子病历采用全结构化的书写方式,比如南京海泰基于WEB架构的表格式电子病历,东软的自定义报表式电子病历。

所谓的电子病历的“结构化”是指从医学信息学的角度将以自然语言方式录入的医疗文书按照医学术语的要求进行结构化分析,并将这些语义结构最终以关系型结构的方式保存到数据库中。

例如:

如果描述一个“腹部疼痛2日,伴呕吐”的病症,按照词语的类别,把它划分为“腹部”(名词)、“疼痛”(动词)、“2”(数词)和“日”(单位名词),“伴呕吐”(动词)5个部分。如果按照医学术语进行结构化分类分析,“腹部”是这一句话中描述“身体部位“的元素,”疼痛“是描述“症状“的元素,”2“是“数值”元素,“日”是“时间单位”元素。

这样电子病历的内容就成了结构化的描述,上述的结构不仅在编辑过程中使用,在保存时依然可以保持这些结构以便后续的利用。

电子病历结构化的优势表现在于以下几个方面:

1.降低了病历出错的概率,多层次的结构化病历通过数据量化标准模式,

把文字录入式的描述降低到最少,操作简单,同时避免了书写病历过程

中用词的随意性,为今后的数据收集,研究提供了方便;

2.优化了电子病历通过结构化中的元数据信息进行查询和统计分析;

3.实现了共享和交换,电子病历和医院中其它系统的数据交换是必然的。

这意味着,只有遵循国标所规定的全结构化的病历文档结构才是自由交

换数据的前提。

4.更适合临床信息化的需要,通过结构化电子病历,才能将病历中的病史、

临床检查检验结果、诊断治疗信息进行提取和关联,并分析出最科学的

临床路径。

1.2结构化的挑战

结构化电子病历相对于传统的电子文档化病历有很多现实性的意义和优势,在实际应用中,结构化电子病历在教学、科研方面的优势也得到了大家一致认可。但是,电子病历不应该为结构化而结构化,比如,前文所提到的一些早期的一些结构化电子病历产品,就是强制的将病历划分成几个条目或者区域,要医生逐条逐项的去输入,不仅输入起来很不方便,而且灵活性也很差。

而且,结构电子病历虽然从某种程度上减轻了医生的工作量,提高了书写效率,改善了病历正规化,但是也存在一些弊端,一是医生可以对电子化内容进行复制粘贴,影响了医生的思维过程,虽然节约了书写的时间,使得病历本身的内容失去了科研循证的价值和病历质量;二是医生依赖于电子病历的结构化辅助输入,不能起到业务训练的效果和目的,所以,现在有些医院要求实习医师、试用期医务人员不允许采用结构化电子病历模板进行病历书写,而且为了防止实习医师、试用期医务人员依赖范文,减少差错,还要求注册医生对病历进行审阅,并保留双签名。

从结构化电子病历的各个优势比较来看,电子病历的存储结构的“结构化”的需求更甚于电子病历输入方式的“结构化”的需求,所以,电子病历更应该是“可结构化”的电子病历,即电子病历在存储结构上应当是“可结构化”的。

这里的“可结构化”的含义是,在占有合理的存储空间和高效的性能的基础上能够根据医疗工作中不同情况的实际需求实现病历数据的结构化、非结构化和半结构化存储。这就是说,当仅仅为了记录医疗经过,不需要快速查询的情况下,病历应当是非结构化的。当需要快速检索和结构化查询的情况下,病历应当时结构化的。要在同一病历中同时出现上述两种情况复合存在的时候,病历应当是半结构化的。

电子病历系统在实际临床环境的运用情况是,医生希望书写病历时采用自由文本录入的方式录入,能够对病历内容的进行复制、粘贴操作,同时通过病历记

相关文档
最新文档