智能在线提示系统及其在中医临床的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

智能在线提示系统及其在中医临床的应用
1.北京航空航天大学软件学院,北京100191;
2.中国中医科学院中医药信息研究所,北京100700;
3.中国科学院计算技术研究所,北京100190)
目的将中医病案文本信息环境、知识需求、知识需求常见行为及现有的知识环境有机结合起来,建立一个相互联系、相互支撑的嵌入式知识智能在线提示系统。

方法系统利用了量表、规则提示和异名病症术语发现的方法,集成了文本提取、术语自动获取、术语检索、术语发现和智能提示的功能。

内容本研究提出了一种在中医临床应用上的智能在线提示系统。

它通过收集关于药物、方剂、症状、诊断等相关数据,集成了强大的数据库词典,并利用量表和规则,对医疗病案实现了智能化在线分析。

最后,用100份病案数据对系统进行了试验。

结果量表证候提示实验,召回率为63.33%,准确率为76.00%;病症异名发现实验,召回率为58.06%,准确率为77.78%。

结论该系统可以提供即时的中医药知识服务,提高用户的知识查询、利用的效率。

本研究也揭示了临床量表的制定与临床实际存在一定的差距。

Abstract:Objective The paper’s aim is t o build an inter-connected,mutual supported embedded intelligent online clinic alert system,which associated with TCM’s medical record text information environment,knowledge requirement’s common behavior and existing knowledge environment. Methods The system adopts the methods of scale table,rule promptness and Symptom terminologies’synonyms detection.It also integrates the functions of text extraction and terminologies’automatic acquisition,searching,detection and intelligent promptness. Content This research proposes an Intelligent Online Clinic Alert System which are applied on Traditional Chinese Clinical Medicine. By collecting the data of herbs,prescriptions,systems and diagnosis,the system builds a strong dictionary and achieves intelligent online analysis by scales and rules.At last,100 medical records are used to test the system. Results The recall and accuracy rates of the syndrome prompted experiment by scale table are 63.33% and 76.00%.The recall and accuracy rates of the symptom terminologies’sy nonyms detection experiment are 58.06% and 77.78%. Conclusions The system can provide instant Chinese medical knowledge service,which improves the effectiveness of knowledge searching and utilization.
Key words:Intelligent Online Clinic Alert System,Embedded Knowledge Services,Clinical Medicine,Scale Table,Symptom Terminologies’Synonyms Detection
1系統研究背景
1.1相关工作随着全球信息化浪潮和中医国际化的发展,中医数字化和标准
化研究日益深入,应用现代的计算机技术和因特网进行中医交流、教学、科研的需求不断增加。

智能中医诊断信息处理技术作为中医现代化的重要内容,也越来越引起科技界的高度重视。

朱文峰在《中医(辅助)诊疗系统的研究》[1]一文中提到,在原有”辨证论治电脑系统”的基础上,研制成”WF-Ⅲ中医(辅助)诊疗系统”。

该诊疗系统在分析研究中医诊断治疗思维原理和方法的基础上,建立起辨证论治与辨病论治整体方案,病、证、症结合,理、法、方、药俱备,在中医医疗、科研以及教学等方面具有广泛的实用性。

徐元景、牛欣在《中医辅助诊疗系统的研制》[2]一文中提到,在原有的TCMCADS生成系统的基础上,从中医的脉诊和舌诊数字化入手,可采集并重现中医的脉图、舌图,并建立了以中医教材为基础的中医诊疗数据库,为中医师临床工作提供易用的辅助诊疗系统平台,也为中医学生和海外中医师提供远程的交流和学习平台。

朱文峰在《创立以证素为核心的辨证新体系》[3]一文中提到,在揭示辨证原理与规律的基础上,构建以证素为核心的辨证新体系。

认为”证素”是通过对”证候”的辨识而确定的病位和病性,是构成”证名”的基本要素也是辨证的核心和关键;证素辨证可涵盖以往诸种辨证方法的实质内容,为把握灵活复杂的”证”找到了执简驭繁的要领,便于临床操作。

瞿年清、谢梦洲在《中医智能(辅助)诊疗系统的设计》[4]一文提到,经过不断完善2002年”WF-Ⅲ中医(辅助)诊疗系统”,系统诊疗的智能和准确性都不断提高。

新系统优化并重新排列了症状、证素、证名以及其计量标准,新增了自动问诊模式,使用更方便,诊疗更准确。

周小青、梁昊、雷丽萍在《症状计量与证素辨证》[5]一文中提到,从症状计量角度阐述计量诊断如何与证素辨证结合,提高诊断的准确性。

孙萌等在《中风方剂数据初步分析》[6]一文中提到,通过数据统计分析、频繁项集挖掘等现代技术,对现有中医典籍中治疗中风的方剂进行了用药统计分析、频繁项分析、中医典籍分布分、朝代分布分析等处理,可以了解中风方剂的从汉代到近现代时间的发展脉络,对中风方剂的用药特点有深层认识,为临床医师提供中风方剂应用和研究提供参考。

1.2临床科研人員围绕文献、围绕知识、围绕系统的知识服务方式浪费巨大时间、精力目前中医药的知识服务模式,虽然越来越个性化、定制化,但仍然是临床科研人员寻找多来源的知识系统过程。

一方面临床科研人员,需要适应不同的系统,适应不同的知识服务方式,获取的知识后整合方能应用,即使有的知识需求很简单,但在寻找知识系统、整合多来源、多方式的知识仍然浪费大量时间和精力。

另一方面中医药信息人员仍然是在建立功能越来越强大的知识服务系统,尽管系统提供越来越深层次的知识服务功能,但却逐渐丧失了服务的易用性。

中医药临床科研人员需要更加简单的知识环境,知识服务的效率需要进一步提高。

1.3应用中医药病案文本时需要即时即地被提供相关知识服务目前越来越多的临床数据脱离纸质形式,而是以病案文本的形式存储。

无论是临床人员还是科研人员,在书写、阅读、应用病案文本的不同内容时,非常需要同步获取知识服务,需求不甚复杂,而且有重复性,但以目前的知识服务条件,却无法快速提供答案。

因此,系统需要根据中医药病案文本的信息环境和问题,把整合后的知识信息即时推送给用户,形成嵌入病案文本的知识服务模式。

本文提出了一种在中医临床应用上的智能在线提示系统。

它通过收集关于药物、方剂、症状、诊断等相关数据,集成了强大的数据库词典,并利用量表和规则,对医疗病案实现了智能化在线分析,从而满足上述需求。

2系统概况
系统采用为N客户/服务器模型。

服务器端的数据库存储所有中医临床相关知识,包括数据库词典、规则和量表。

客户端程序使用Java语言编写,负责提供中医临床的智能在线提示服务。

系统主要分为三大功能模块:文本载入模块在客户端提取病案文本;术语搜索匹配模块和服务器端数据库词典进行交互,对相关操作进行响应;智能提示模块和服务器端的规则和量表数据进行交互,在客户端执行分析,呈现结果给用户。

2.1功能1:病案文本获取首先,点击”启动取词”按钮,按钮文字变成”停止取词”,此时进入取词状态。

此时切换到其他任意程序的界面,比如记事本,Word 或者浏览器。

然后用鼠标框选文本,并按下热键Alt+Z,系统自动获得鼠标所选文本。

如果用户提取的内容有误,比如少选了某句话,可以再次用热键进行文本提取。

2.2功能2:中医术语标注考虑到病历的文本可能很长,用户需要知道他所感兴趣的词条的大致位置,从而更好的指导接下来的操作,因此系统需要对病历中出现的中医术语进行标注,和原文本区分开。

此外,用户可在甄选类别区域,提前选择他感兴趣的词条的类型,选择后系统只会在数据库相应的表中进行匹配。

单击”中医术语标注”按钮,系统会对文本进行如下处理:①寻找文本中是否有词语和数据库存储的术语完全匹配,并将这些关键词在文本中用蓝色标注出来。

例如,在下图中可以看到,文本中的”肥胖”等病症术语已经在病历载入区用蓝色标注出。

②寻找文本中是否有量表症状,并更新量表信息。

在本例中,在按下”术语标注”按钮后,系统已经自动获取了病案文本中的量表症状信息。

见图1。

图1 对病历文本的术语进行标注
2.3功能3:中医术语获取考虑到用户仅对文本的某些词条感兴趣,系统会
将以当前光标位置为中心一定范围内的出现的词条,在结果展示窗口按照类别逐条显示并对每个词条提供链接,从而减少了用户在结果展示区定位该词条的时间。

由于已经对文本进行标注,用户将很容易定位。

如果用户想进一步查看该词条信息,可以点击相应的链接,进入词典窗口。

系统还提供类似搜索引擎的搜索服务:在”病历载入区”输入一个关键字或词,然后点击”中医术语查询”按钮,系统可以检索到包含数据库中该词的所有词条,并在结果展示窗口按照类别逐条显示,并对每个词条提供链接。

如果想进一步查看该词条信息,可以点击相应的链接。

系统在词典窗口显示术语相关的知识信息,不同的词条以不同的选项卡显示。

如果用户对某一词条解释内容中的某些术语感兴趣,可以在该界面直接进行二次检索查询:①点击”查询”按钮对该词条的内容进行检索标注。

例如,在下图中点击”查询”按钮后,”躁扰不宁”词条内容中和数据库术语一致的词语会被用蓝色标注出。

②之后点击该词语将光标移到该词语附近的位置,并点击”提取词语”按钮,右侧会出现相应的词语。

例如,点击左侧文本框的”躁扰不宁”将光标移到该处,然后点击”提取词语”按钮,右侧会按照类型显示出出现在”躁扰不宁”附近的术语。

单击下侧区域的词条链接可以继续进行查询。

见图2。

图2 词典窗口
2.4功能4:异名术语发现将语料库文本输入系统中,在菜单中点击”病症术语异名发现”,即可对现有文本进行异名发现操作。

结果在异名发现窗口中显示,左侧为新发现的异名,右侧为新异名对应的正名。

2.5功能5:量表证候提示根据量表方法,对病案中的患者所属的证候进行智能提示。

首先,系统会检索量表症状是否在病案文本中出现。

如果出现,系统会记录其所代表的证候的相应分值,会统计得到各个证候的总分值。

对于总分值达到10分的证候,系统会做出提示。

以上面”患者形体肥胖……”病案文本为例,单击”量表证候计算”按钮,弹出量表窗口。

左侧以身体部位为分类显示量表症状,右侧显示量表症状的统计结果:各个证候的得分情况和证候要素提示。

可以看到检索到的”喉中痰鸣”“口臭”等量表症状已经在左侧被勾选出。

右侧显示了量表症状的统计情况,其中内风、内火、痰湿、血瘀、气虚、阴虚证候得分分别为10、26、41、15、0、5,其中证候要素”内风”、”内火”、”痰湿”、”血瘀”得分大于等于10,系统将这些证候标红提示。

该窗口还支持对量表症状的重新计算:用户可在左侧的选框重新勾选量表症状,然后点击”重新计算”按钮,可以获得新的统计结果。

2.6功能6:诊疗规则提示根据诊疗规则方法,进行智能提示。

首先,系統会检索每条规则中的症状是否在病案文本中出现。

一旦在规则中作为条件的症状在病案中出现,该条规则会被触发,系统会提示相应的诊断和检查项目。

3系统中的关键技术
现在分析系统中运用的方法的合理性,以及这些方法是如何实现来满足需求的。

3.1量表方法在医学领域,学者们引入了量表的方法,用一种疾病和其他疾病或正常人群作比较,一种疾病的不同程度作比较,便形成了等级。

这就是医用量表最基本的概念。

中医症状量表方法是以统计学概率论为基础,依据有关医学理论将症状、体征及各种化验结果进行量化。

通过概率运算,使其成为诊断和鉴别诊断的重要依据,成为重要的辅助诊断方法。

在本系统中,将病案文本中出现的症状和量表中的症状进行匹配。

如果匹配成功,将其对应证型、数值标记。

通过统计,计算出各种证型的分值总和。

如果一种证型的总分值超过量表规定的界限,则向医生提示该证型。

3.2规则提示方法中医学的诊断学知识可以表示成规则集合。

换言之,通过患者的症状,医生可以推断患者的病证,而这一基于经验和统计得到的诊断,本研究采用合取范式形式的规则进行表示。

也就是说,系统可以根据从病案文本检索到的病症术语和其存储的规则集合,可以判断哪些证型、病因或检查需要被执行,并向医生提示这些结果。

例如规则:If occurs(病症A)& occurs(病症B)& occurs(病症C)then prompt(中风)
意思是如果病案文本中同时检测到”病症A”“病症B”和”病症C”,则系统会向医生提出相应的病证提示”中风”。

再例如规则:If occurs(病症A)& !occurs(病症B)& occurs(病症C)then prompt(呕吐)
意思是如果病案文本中同时出现”病症A”和”病症C”,且没有出现”病症B”,则系统会向用户提出相应的提示”呕吐”。

有时会出现规则的冲突,例如规则1:If occurs(病症A)then prompt(中风)和规则2:If occurs(病症A)& occurs(病症B)then prompt(呕吐)。

这种情况下系统会优先选择条件中逻辑运算符多的规则,在本例中系统激活规则2。

3.3异名病症术语发现方法中医学病症术语存在着大量的同义异名的现象,例如”脑卒中”和”脑中风”。

如果不能很好的解决病症术语的非规范性带来的问题,将异名病症识别出来,系统将很难准确地处理病历。

然而,目前的技术只能识别名称完整、定义明确的标准术语,通用的做法是
将标准术语整理好存入数据库中,识别时将文档中的文本和数据库中的词条进行匹配。

由于汉语语义的模糊性及其所带来的巨大数量的衍生词汇,通过语义分析在有限的上下文内判断出异名术语难度很大。

因此本研究从另一个角度出发,通过行业相关的丰富的语料文档库和已有的正异名术语表,不断发现语料库未识别的异名术语,扩充已有的异名术语表。

通过大量的浏览病症名称发现,病症名称大都由两部分构成,即”对象词”和”表现词”。

本文定义对象词为病症的病变主体的名词词汇,定义表现词为指描述对象主体表现情况的词汇。

例如,”脑卒中”中对象词是”脑”,表现词是”卒中”。

病症术语异名现象的原因,大都是病症术语中对象词和表现词的近义词造成的。

例如,”口唇紫暗”和”口唇紫绀”,其中”紫暗”和”紫绀”是近义词。

据此可以设计一种方法,将未被发现的异名症状发现。

系统需要:①病症正异名术语表,可用来构造对象词和表现词的近义词表。

②对象词的近义词表。

每项两个词,对象异名和对象正名,例如”目”和”眼”。

③表现词的近义词表。

每项两个词,表现异名和表现正名,例如”中风”和”卒中”。

方法步骤:①将语料库的病案文本,以标点、数字和现有术语为间隔,将其拆分成一段段的短语。

理论上异名应该存在在这些短语中。

②扫描每段短语,如果其中存在一个对象近义词和一个表现近义词,且两个词语的间隔不超过两个字时,将这两个词以及它们之间的部分提取出来,作为候选异名。

间隔不超过两个字的原因是防止两个词来源于两个不同异名的情况,且通常情况下,异名病症不会很长。

③对每个候选词条,看它们的对象词、表现词二元组的原义,是否和已有的正名对应。

如果对应,则该异名很可能和该正名对应,否则它便不是个合适的异名,将其淘汰。

经过上述三个步骤,可以从语料库中发现较为贴切的异名病症名称。

系统管理人员可以通过该方法,发现术语并进行人工筛除,能够便利快捷的充实数据库,减轻病症术语的非规范性对系统的影响。

算法步骤示例:
For(每条短语){
For(每个对象词异名)
For(每个表现词异名){
If(短语包含对象词异名&&短语包含表现词异名)then
If(两词间隔不超过2个字)then提取作为候选异名;
}
}
For(每个候选异名){
A1=候选异名中对象词对应的正名;
A2=候选异名中表现词对应的正名;
For(每个症状正名){
B1=症状正名中对象词对应的正名;
B2=症状正名中表现词对应的正名;
If (A1==B1 && A2==B2 && 症状正名候选异名)then 候选异名成为新异名;
}
}
4 系统评测实验
4.1量表提示实验本研究所采用的量表为北京中医药大学东直门医院的高颖等编写的《缺血性中风证候要素诊断量表》[7]。

使用系统对于10个出自中风相关论文的病案,运用量表方法进行了分析,结果如下。

其中标红的证候是系统提示的证候。

病历病症描述原文:①患者于1994年3月4日在劳动中突然晕倒,不省人事,语不能发,二便失禁,双侧肢体不用,于发病40min后住进洛阳市某医院,经20d的抢救,才睁开双目,1个月后形如植物人,出院回家。

四肢瘫痪,语不能言,二便失禁,不会饮食,饮水则呛,面目痴呆,没有表情,舌体瘦小,质淡暗红,脉:沉、弦、细、弱。

②于9月10日下午出诊返家途中,突发昏仆,被路过人发现抬回。

请医治疗至第2d神志稍有清醒,但很快又进入昏迷状态,且出现壮热、阵发性呼吸困难。

……神志昏迷,面红目赤,瞳孔小如针尖,左肢偏瘫,呼吸不规则,时有憋气,憋气时面唇紫绀,夜晚发作更甚,口渴喂水能吞咽,大便自发病至今未解,小便给予导尿。

舌质红,苔黄厚少津,脉弦数有力。

③2006 年12 月21 日,因操劳过度,晚饭后,突发右侧肢体无力,跌倒在地,呼之不应,小便失禁,家人按人中,刺十宣,大声呼唤后苏醒,右侧偏瘫,急送至本院,因在发病3 h内,试用巴曲酶溶栓治疗,第2d,因口鼻出血,而停用。

予以甘露醇、甘油果糖降低颅压,依达拉奉针脑保护剂,清除自由基,川穹嗪针改善血循环等治疗。

因是本院家属,早期请中医会诊及康复介入。

诊见半身不遂,口舌歪斜,语言蹇涩,吞咽呛咳。

舌胖有瘀斑、苔白,脉结代。

④患者5 h前卒然昏仆,不省人事,左半身不遂,舌口歪斜,伴有恶心呕吐,
面赤气粗,舌质红,苔黄腻,脉弦大有力。

⑤患者于8 h前突然昏倒,意识不清,遂左侧上下肢瘫痪,口眼歪斜,口角流涎,舌强语謇,面色潮红,腹满呕恶,便干溲闭,舌红、苔腻,脉滑有力。

⑥患者因情志不畅,随即昏倒在地,神志不清,右上下肢不能活动,口舌歪斜,面赤气粗,痰声漉漉,躁扰不宁,腹部胀满,呕恶时作,两便闭,舌体大、质暗红,苔白腻,脉洪大有力。

⑦患者形体肥胖,高血压病史5年。

因3h前家庭纠纷突感头痛,左侧肢体活动不利,继而昏仆,不省人事,家属急送医院,经西药常规抢救治疗1d,病情仍未缓解,伴鼻鼾痰鸣、烦躁不宁、气粗口臭、腹胀,家属言其3d未大便,舌红或暗红、苔黄腻,脉弦滑数。

⑧收内科住院治疗。

会诊后决定输液消栓治疗。

但1w后患者仍不清醒,右侧肢体瘫痪,檢查项强口噤。

大小便失禁需两个人服侍。

舌苔厚腻,脉弦数,喉中痰鸣。

⑨因头晕,伴左上肢活动障碍2 d人院。

患者晨起时,突感头晕口唇麻木,左上肢不能上举,左手指抓握无力。

平时嗜睡,鼾声大。

食纳佳,大便偏干结。

⑩因流涎.失语1d人院。

患者有高血压病史9 年。

失语当日晨,觉头昏,两下肢麻木。

午餐后突然舌宠不能语,伴流涎。

经过统计可得,被原文标出且被系统提示的证候共计19个,被原文标出但没有被系统提示的证候共计11个,没有被原文标出但被系统提示的证候共计6个。

因此,量表证候提示实验的召回率为63.33%,准确率为76.00%。

可以看到,系统所提示的症候比较接近论文中注明的症候,这说明量表方法是有效的。

然而,某些病历的最终得出的量表评分与病历中医生所做的证候判断有所出入,究其原因,主要有以下几个方面:①用词非规范性造成的理解差异。

由于中医症状名称用语简练,含义丰富,加工人员对微小的差异理解不同就会造成这种正异名的匹配与量表症状定义的不符,进而造成量表评分与病历中证候判断的出入。

另一方面,本研究使用的病历来自于文献数据库,均为临床医生对医疗实践的记述。

由于每位作者习惯的不同,在描述病患症状时所使用的具体词汇、语法、语句随意性强,差异较大。

这是造成量表评分与病历中证候判断的有所出入的重要原因。

②医生对中风的不同理解。

医生对于中风治疗有自己的理解,证候的判定可能与量表规则并不一致。

③量表规则的局限。

量表规则规定,只有在证候得分超过10分时予以提示,这样某些证候得分即使不为0,也不会提示。

例如第4个病历,内火9分,痰湿8分,然而并未提示。

④病历文本的局限。

显然,越是完整的病历,系统相应的量表提示越准确。

病历文本过短,会对实验造成显著影响。

第9、10个病历就是如此。

4.2病症异名发现实验首先对已有正异名进行人工分析,得到对象词和表现词的近义词表。

已有正异名共计175个,从中得到对象近义词52个,表现近义词91个。

系统对于上述10个出自中风相关论文的病案进行了病症异名发现实验。

病案中未被发现的病症共计31个,系统发现了18个,召回率为58.06%。

其中又有14个和正名准确对应,准确率为77.78%。

见表2。

经研究,发现造成召回率和准确率降低的原因有以下几点:①只能在现有正
名的基础上发现异名。

这样,一些未计入数据库的正名和其对应的异名就无法被发现。

②症状”描述”和”名称”的界限不清。

许多症状只是描述,并非严格意义上的病证名称。

③无对象词或多表现词。

例如”抽搐”、”脉沉细”一类的词语,前者由于缺少对象无法被发现,后者由于其多义性无法被对应到一个唯一的正名。

总体看来,该方法还是能有效处理中医学上病症异名发现的问题。

已有的正名和对象、表现近义词越全,异名发现的召回率和准确率越高。

5结论
本研究的创新点在于把可嵌入式知识服务的概念引入到中医药领域,结合中医药领域的知识特点和知识结构,为中医药临床科研提供知识服务。

本研究提出了一种在中医临床应用上的智能在线提示系统,它围绕个人病案知识活动链路,实现中医药数据整合、知识单元提取、病案信息环境识别、嵌入知识服务模式构建,并以部分中医病案文本为范例,实现部分嵌入式知识服务,形成知识服务工具。

本系统具有很好的推广应用前景,它可以降低医生的误诊率,增加中医临床教研中学生的练习机会和效率,以及实现病案的自动化分析。

另外,本系统的设计理念同样可应用于其他领域,完成类似的智能提示任务。

参考文献:
[1]朱文峰.中医(辅助)诊疗系统的研究[J].中国中医基础医学杂志,2003,9(10).
[2]徐元景,牛欣.中医辅助诊疗系统的研制.世界科學技术[J].中药现代化,2003,5(3).
[3]朱文锋.创立以证素为核心的辨证新体系[J].湖南中医学院学报,2004.06.
[4]瞿年清,谢梦洲.中医智能(辅助)诊疗系统的设计.朱文锋学术思想研讨会暨中医诊断师资班30周年纪念大会论文集[C].2012.
[5]周小青,梁昊,雷丽萍.症状计量与证素辨证.朱文锋学术思想研讨会暨中医诊断师资班30周年纪念大会论文集[C].2012.
[6]高颖等,缺血性中风证候要素诊断量表编制及方法学探讨[J].中医杂志,2011(24):2097-2101.
[7]孙萌等.中风方剂数据初步分析[J].中国中医药信息杂志,2013.12.。

相关文档
最新文档