医疗行业大数据应用实例
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
静态知识的表示(属性特性的表示)
从临床参数(属性)的角度来看,可认为每个临床参数都 具很多种特性。主要特性有:
MEMBEROF:按所描述的对象不同迸行分类时,临床参数所 属的类型名,例如:PRO-PTo VALUTYPE:临床参数是单值、二值还是多值。 PROMPT:用于向用户提问一个单值或二值参数的值。
(1) 赋于这个上下文一个名称; (2) 把这个上下文加到上下文树上去; (3) 马上跟踪这类上下文的MAINPROPS表中的参数。
实例示范:
系统首先在数据库中建立一棵上下文树的根节点,并为该根节点指 定一 个名字PATIENT-1 (病人-1),其类型为PERSON。 PERSON的属性为(NAME AGE SEX REGIMEN),其中前三项都具LABDATA特性, 即可通过向用户询问得到其值。于是系统向用户提出询问。 用户输人病人的姓名、年龄及性别,并以三元组形式存入数据中。 REGIMEN不是LABDATA属性,必须由系统推出。
例都会出错),使用临床决策支持系统,可以提醒专家没在意的 或没有发现到的病人信息,从而提高诊断准确性 对医学院学生,成熟专业的临床支持系统可能是他们学习专业 知识和专家经验的方便可得的廉价的老师,同时也是他们初入 医院实习工作的非常好的助手。
案例分析
临床 决策 支持 系统
基于知识库的 CDSS
非基于知识库的 CDSS
预测建模 疾病模式的分析 提高临床试验设计的统计工具和算法
一、 医疗与大数据的趋势 二、医疗大数据的应用场景
三、 案例分析
临床决策支持系统的功能和作用
临床医生的知识更新无法与急剧增长的医学知识同步。 对大批量的常规决策工作,自动化决策效率更高(如大量的常规
实验室检测和数据分析等)。 人有时会犯错误或失误,当然医生也不例外(复杂病例和常见病
NONLABDATA,因而系统调用TREATFOR的UPDATEI-BY特性 所指出的第一条规则090。
规则090: IF 已知细菌的类别 存在和这种细菌的出现有关的显著的病症 THEN 肯定存在一种需要处理的细菌(可信度1.0)
检查它的前提是否为真,此时如果该前提所涉及到的 值是可向用户询问的,就直接询问用户,否则再找出可 推出该值的规则。如此反复进行,直到最后推出 PATIENT-1的主要临床参数 REGIMEN为止。
❖ 领域知识用规则表示,其一般形式为:
RULE * * * IF <前提> THEN <行为>
❖ 例如对如下规则:
❖ RULE 047
❖ 如果:(1)病原体的鉴别名不确定,且
❖
(2)病原体来自血液,且
❖
(3)病原体的染色是革兰氏阴性,且
❖
(4)病原体的形态是杆状的,且
❖
(5)病原体呈赭色
❖ 那么:该病原体的鉴别名是假单胞细菌,可信度为0.4。
一、 医疗与大数据的趋势
二、医疗大数据的应用场景
三、 案例分析
医疗大数据应用场景
医疗行业产生的数据量 主要来自于PACS影像、B 超、病理分析等业务所产 生的非结构化数据。人体 不同部位、不同专科影像 的数据文件大小不一, PACS网络存储和传输要采 取不同策略。面对大数据, 医疗行业遇到前所未有的 挑战和机遇。
动态数据库中的数据表示
• 数据库中的数据都用如下形式的三元组描述: (对象 属性 值)
• 1. “对象”又称为上下文,它是系统要处理的实体, 例如: PERSON(病人)
• 2. “属性”又称临床参数,用于描述相应对象的特征,例如“病 人”的姓名、年龄、性别。
• 3. “值”是指相应属性的值,根据属性的不同类别,其值可以是 一个或多个。
正向推理(数据驱动)
用户通过人机界面输入一批事实,推理机用 这些事实,一次雨知识库中的规则前提匹配,若某 规则前提全被事实满足,则规则可以被运用。规则 的结论作为新的事实存储,然后用更新过的事实再 与其他规则的前提匹配,直到不再有可匹配的规则。
应用
Thanks
为了得到REGIMEN,系统将开始推理过程。推理时首先运用的 一条规则是 RULE 092 。
规则092 IF 存在一种病菌需要处理 某些病菌虽然没有出现在目前的培养物中,但已经
注意到它们需要处理 THEN 根据病菌对药物的敏感情况,编制一个可能抑制
该病菌的处方表 从处方表中选择最佳的处方
ELSE 病人不必治疗 规则092的前提部分涉及到临床参数TREATFOR,它是一个
一个CT图像含有大 约150MB的数据,而一个基 因组序列文件大小约750MB, 一个标准的病理图则大得多, 接近5GB。
如果将这些数据量乘以 人口数量和平均寿命,仅一 个社区医院或一个中等规模 制药企业就可以生成和累积 达数个TB甚至数个PB级的结 构化和非结构化数据。
到2020年,医疗数据将会急剧增长到35 ZB,相当于2009年数据量的44倍增长。
断所发现的细菌是否引起了疾病。 (2) 确定疾病可能是由哪种病菌引起的。 (3) 判断哪些药物对抑制这种病菌可能有效。 (4) 根据病人的情况,选择最适合的药物。
• 咨询开始时,先启动咨询系统,进入人机对话状态。在对话过程 中,系统向用户提出必要的问题,进行推理。当结束咨询时,系 统自动地转入解释子系统。解释子系统回答用户的问题,并解释 推理过程。解释时,系统显示说明为什么需要某种信息,以及如 何得到某个结论。这样做的主要目的是为了使医生容易接受系统 的结论。
LABDATA:用于指出相应参数的值是否可从用户那里获得。
对象 BURN BURN BURN BURN
属性 MEMBEROF VALUTYPE
PROMPT LABDATA
值 PRO-PT BINARY Is * a burn patient ?
1
推理策略:
MYCIN的咨询系统采用逆向推理(目的驱动)过程。在咨询 开始时,首先例示上下文树中的根节点。根节点属于PERSON类型 的上下文。例示包括以下3步:
% of population over age 60
30+ % 25-29% 20-24%
10-19% 0-9%
2050
WW Average Age 60+: 21%
Source: United Nations “Population Aging 2002”
全球老龄化 平均年龄60+的人 : 目前的10%, 到 2050年将到达20%
MYCIN系统
• MYCIN系统是由斯坦福(Stanford)大学建立的对细菌感染疾病的诊断 和治疗提供咨询的计算机咨询专家系统。医生向系统输入病人信息, MYCIN系统对之进行诊断,并提出处方。
细菌传感疾病专家在对病情诊断和提出处方时,大致遵循下列4 个步骤: (1) 确定病人是否有重要的病菌感染需要治疗。为此,首先要判
以美国为例:Biblioteka Baidu医疗大数据的价值
3千亿美元/年, 相当于每年生成总 值增长0.7%
趋势分析:我们正处在医疗行业的一个重要转折点
存储的增长
15000 10000
5000 0
医疗服务产生的数据总量(PB)
2010 2011 2012 2013 2014 2015
Admin Imaging EMR Email File Non Clin Img Research
基于知 识库的 CDSS
大部分CDSS属于此类,它由三大模块组成: 知识库、推理机和通讯模块。知识库存储着编 译好的医学知识,推理机则根据知识库里的规 则,以及患者的资料进行自动分析。分析的结 果通过通讯模块反馈给用户。例如:MYCIN
非基于 知识库 的CDSS
主要是通过机器学习从已有的经验中自动 攫取规则。
对象 病人-1
属性 性别
值 ((男 1.0))
病人-1 药物过敏 ((青霉素1.0)(氣苄青霉素1.0))
病原体-1 鉴别名 <(链球菌0.6)(葡萄球菌0.4))
MYCIN采用上下文树(Context tree)来表示问题, 一棵上下文树构成了对一个病人的完整描述。
知识库的知识表示
领域知识的表示
发展障碍
医学知识的复杂性导致了系统设计时需要考虑非常多的因素, 如患者的症状、体征、实验室检查数据、家族史、基因、流行病学 资料、现有的医学文献等等。而且,每年发表的临床研究数以千计, 而且不少研究彼此矛盾,大量的数据导致了系统维护上存在困难。 目前成功用于诊断环节的CDSS常常局限于某个领域,比如,1971年 上线使用的Leeds腹痛诊断系统,其诊断的正确率高达91.8%,而医 生的诊断正确率在79.6%。但这套系统仅能用于腹痛的诊断。
医疗行业大数据应用场 景非常多,右图仅以临床 操作和研发为例,展示医 疗行业大数据应用场景。
对于公共卫生部门,可 以通过过覆盖全国的患者 电子病历数据库,快速检 测传染病,进行全面的疫 情监测,并通过集成疾病 监测和响应程序,快速进 行响应。
7
临床操作 研发
医疗数据透明度 远程病人监控 临床决策支持系统 比较效果研究
大数据
医疗领域应用
演讲人: 崔浩博 时间:2014.10.13 ppt制作: 崔浩博
outline
一、 医疗与大数据的趋势 二 、医疗大数据的应用场景 三、 案例分析
一、 医疗与大数据的趋势
二、医疗大数据的应用场景 三、 案例分析
趋势分析: 我们正处在医疗行业的一个重要转折点
医疗费用在不断上升 GDP的占比非常高
临床工作的复杂性也增加了系统整合的难度。目前大多数系统 仍独立于临床工作流程,这导致了医生需要独立打开CDSS,然后花 费时间录入患者资料,降低了工作效率。目前整合比较成功的案例 是药房系统和账单系统。因为药房工作相对简单,CDSS主要解决药 物相互作用问题,比较容易设计。
CDSS经常产生大量的警告信息,很容易导致医护人员疲劳应付。