【医疗信息化】医疗大数据研究热点与趋势分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医疗大数据研究热点与趋势分析
范美玉①
摘要随着卫生信息化建设进程的不断加快,医疗数据的类型和规模正以前所未有的速度增长,医疗卫生领域已进入“大数据时代”。文章介绍了医疗大数据概念、特点及研究意义,在研究国内外发展现状的基础上,分析当前医疗大数据研究热点,提出未来医疗大数据的发展趋势。
关键词医疗大数据研究热点发展趋势
随着大数据的飞速发展,它已经把触角触及到很多领域。在医疗健康领域,数据逐渐成为行业的核心资产,基于大数据的研究应用优化了医院业务流程、管理模式和决策方式,对医疗行业发展健康管理、数字医院、移动医疗等有深远意义。
1医疗大数据概念
1.1医疗大数据概念
大数据概念早在上个世纪80年代就有美国人提出[1]。2008年9月,《Nature》杂志发表文章《Big data: Science in the Petabyte Era》,大数据概念开始广泛传播。
麦肯锡是研究大数据的先驱,其给出的定义:大数据指的是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。同时强调,并不是说一定要超过特定TB值的数据集才能是大数据。
国际数据公司(IDC)从大数据的四个特征来定义,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)。
亚马逊的大数据科学家John Rauser给出了一个简单的定义:大数据是任何超过了一台计算机处理能力的数据量。
维基百科中,巨量资料(big data)或称大数据,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策目的的资讯[2]。
在我国,大数据作为一个较新的概念,目前尚未直接以专有名词被我国政府提出来给予政策支持。不过,在2012年12月8日工信部发布的物联网“十二五”规划上,信息处理技术作为四项关键技术创新工程之一已经被提出来,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这都是大数据的重要组成部分。医疗卫生信息诸如PACS影像、B超、病理分析等业务所产生的非结构化数据,促使医疗数据量急剧增长,这些非结构化数据的类型也很复杂,我国医疗正在迈入“大数据(big data)”时代。医疗大数据是指某个数据存取点的数据量非常之大,以至于利用常规的软件工具已经难以对其进行搜集、管理和加工,其数据规模往往达到了PB(1024TB)级[3]。医疗大数据的问题是在于复杂性,而不是数量。
1.2特征
⑴规模大
据估算,中国一个中等城市(按一千万人口)50年所积累的医疗数据量就会达到10PB 级。未来随着个人健康管理的推进,会出现越来越多的个人日常健康监测信息,所产生的数据规模是难以估量的。
⑵多样性
主要表现在两个方面,一是数据来源多样,医疗数据包括患者的基本信息、影像信息与其他特殊诊疗信息。数据通常来源于院内系统(HIS、LIS、PACS、EMR等)、公共卫生系统(妇幼、防疫、血站等)、及对两种系统融合的区域卫生平台。二是数据类型多样:不仅有各种结构化数据表,病历中的XML文件,还有医疗影像相关的DICOM、JPG文件,手术系统中的视频文件等。
⑶高速性
医疗大数据区别于传统的海量医疗数据,一方面,医疗大数据的数据规模更大;另一方面,医疗大数据对处理数据的响应速度有更严格的要求。实时分析而非批量分析,数据输入、处理与丢弃几乎无延迟。数据的增长速度和处理速度是大数据高速性的重要体现。
⑷价值性
医疗大数据的价值性体现在从大量不相关的各种类型的数据库中,挖掘出对未来趋势与模式预测分析有价值的数据,并通过机器学习方法、人工智能方法或数据挖掘方法深度分析,应用于临床诊断、临床科研、卫生决策、医疗行为模式预测分析等。
1.3研究意义
⑴提升医疗价值
利用大数据技术,可以提升医疗价值,形成个性化医疗。在大数据医疗背景下,可以进行人体体征的连续监测,积累丰富的数据,在此基础上做出纵向的分析和比对,了解现在的健康状况并及时发现异常趋势,从“治病”到“治未病”模式转变,便于对个人健康进行全生命周期管理。此外,个人还可以通过对人群医疗大数据的横向比较进行健康风险评估,从而获得个性化的健康管理方案。
⑵创造经济效益
医疗大数据及相关处理技术的研究应用可带来巨大的社会及经济价值。例如,利用医疗卫生数据监视医疗体制的运行状况和民众健康的变化趋势,协助政府评估和选择恰当的医疗改革方案;在药品研发过程中,利用大数据技术从大量潜在药物中筛选出可能的药物,以及在现成的药物里发现新功能,节省大量人力和实验花费;利用欺诈预防系统实时甄别高风险医疗保健提供者的欺诈、浪费与滥用行为,降低费用。
⑶促进方法学研究新发展
在方法学上,大数据为医疗科学研究提供了一个新方向。过去的“假说驱动”强调的是微观、局部,只能解决“Know Know Problem”,且耗费大、产出低,收集的数据无法再利用。而利用“数据驱动”或“发现驱动”可以解决传统医学中的“Unknown Problem”,具有低成
本、可持续的特点。医疗大数据是“新石油”,一旦累积了足够多的数据和样本,放到专业的医疗人员手里,应用新的技术方法进行研究,对医疗事业的推动将是革命性的。
2医疗大数据国内外研究现状
2.1国外
美国高度重视大数据的开发和应用,先后发布一系列促进医疗信息交换和数据开发利用的法令。此外,政府向社会公众开放各职能部门所掌握的医疗信息数据库,如美国联邦医疗保险与医疗补助服务中心、药监局和疾控中心的数据库。2013年9月,美国国立卫生研究院(NIH)宣布,今后4年每年提供2400万美元,资助6至8个“从大数据到知识发现的卓越中心”,以开发和推广大数据共享、集成、分析与管理的创新方法、软件和工具,从而帮助研究人员提升利用大规模复杂数据集的能力。2014年5月,白宫发布白皮书《大数据:抓住机遇,保存价值》,阐述了大数据与个人、数据开放和隐私保护、医疗保健服务等公共部门数据管理、私营部门数据管理、大数据政策框架等方面的内容。
2009年,Google通过所拥有的庞大的数据资源、处理能力和统计技术(如HDFS、GFS、MapReduce、Hadoop、Storm、HBase、MongoDB)对人群上网搜索记录进行分析预测美国甲型H1N1流感的爆发,并可以具体到特定的地区和州,准确率高达97%[4]。美国西奈山医院启动大数据医疗,将网络广告的数据分析技术运用于采集医疗咨询的引擎上,搜寻数据相关性,生成预测结果,旨在节约医疗成本。
2012年7月,日本提出以电子政府、电子医疗、防灾等为中心制定新ICT(信息通讯技术)战略,发布“新ICT计划”,重点关注大数据研究和应用。
2013年1月,英国政府宣布将在对地观测、医疗卫生等大数据和节能计算技术方面投资1.89亿英镑。
加拿大多伦多一家医院通过实时分析早产婴儿健康数据,预测早产儿突发事件,提前采取针对性措施,降低婴儿夭折率。
2.2国内
2012年12月,国家发改委数据分析软件开发和服务列入专项指南。2013年,上海市科学技术委员会发布《上海推进大数据研究与发展三年行动计划(2013-2015年)》[5],拟建立全民医疗健康公共服务平台,在健康信息网已有数据的基础上,汇聚整合医疗、药品、气象和社交网络等大数据资源,形成智能临床诊治模式、自助就医模式等服务模式创新,为市民、医生、政府提供医疗资源配置、流行病跟踪与分析、临床诊疗精细决策等服务。2014年1月,中南大学启动湘雅临床大数据建设项目,开展国内首例大数据在临床医学领域大范围、系统性的探索和应用。
2014年科技部发布863计划,将生物大数据开发与利用关键技术归入生物和医药技术领域,包含生物大数据标准化和集成、心血管疾病和肿瘤疾病大数据处理分析与应用研究、基于区域医疗与健康大数据处理分析与应用研究、组学大数据中心和知识库构建与服务技术等。此外,国家发展与改革委员会与地方政府主导的“智慧城市”计划已开始实施,部分省