大数据在医疗行业的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Databases DBMS / NoSQL 10GBe Fast Fabric MPP Databases DW Appliances
Data Velocity Data Vulnerability
Data Sources
Diagnostic Images
Surveillance and Medical Medical Device Devices Streaming Data
需要新技术的支持
数据量
检验结果, 费用数据, 影像, 设备产生的感应数据, 基因数据等
类型
• •
结构化数据, 遵循标准的数据标准(如,HL7) 非结构化数据, 如口述、手写、照片、影像等
价值
基于现有数据库中的数据进行分析,来支持不同种类的业务:如 费用及报销、患者病史、归档影像分析、实时临床决策支持(数 据分析)
趋势分析:我们正处在医疗行业的一个重要转折点
存储的增长
医疗服务产生的数据总量(PB)
15000 10000 5000 0 2010 2011 2012 2013 2014 2015 Admin Imaging EMR Email File Non Clin Img Research
医疗影像归档
一个医疗系统案例的数据
Data Sources
Diagnostic Images
Surveillance and Medical Medical Device Devices Streaming Data
Log Files
Text, Video and Audio
Social Media
Medical Records
GIS
丰富的视觉化效果– 安全的数据分析和缓存
14
Compute – Storage & Infrastructure Platforms
大数据解决方案的部署方式(参考)
结构化 数据平台 企业应用工具
遗留系统
Node
Node
Node
ODS & 数据集市 数据挖掘 集成开发工具 IMPORT
企业级数据仓库
我们如何利用大数据创造价值? (示例)
1. 个体化医疗 2. 临床决策支持
3. 欺诈监测得以加强
4. 由生活方式和行为引发的疾病分析
McKinsey Global Institute Analysis
8
医疗大数据相关解决方案
健康信息服务
基础医疗服务 个人健康管理 老龄社会
新兴的医疗服务 应用
临床决策支持
个体化医疗
肿瘤基因组学
数据分析及 视觉化处理
类SQL的检索
机器学习
医疗影像分析
数据处理/ 管理
医疗记录
基因数据
医疗影像
分布式平台
存储优化
安全和隐私
影像数据处理加速
9
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
10
大数据的挑战不仅来自于数据量的增长...
到2020年, 医疗数据将急剧增长到35 Zetabytes, 相当于2009年数据量的44倍 增长
Source: McKinsey Global Institute Analysis ESG Research Report 2011 – North American Health Care Provider Market Size and Forecast 6
Data Characteristics
Data Volume and Quality
Cloud
NAS - SAS and Distributed Storage Human Genome & Drug Discovery
Provisioning Models-Storage & Connectivity Considerations
% o f popu lation over age 60
30+ %
25- 29%
20- 24%
10- 19%
0-9 %
2050
WW Average Age 60+: 21%
Source: U nited Nation s “Po pulati on Agi ng 200 2”
医疗费用在不断上升 GDP的占比非常高
NAS - SAS and Distributed Storage Human Genome & Drug Discovery Databases DBMS / NoSQL 10GBe Fast Fabric MPP Databases DW Appliances
Data Velocity Data Vulnerability
Data Sources
• 实时数据分析,而非传统的批量处理分析
速度
• 数据以流的方式进入系统,进行抽取和分析 • 对于实时运行中的每个时间节点产生影响,而不是事后处理
在传统的解决方案之上,引入新的数据及分析模型和技术,
11
实时有效的商业价值
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
Security Services Privacy Compliance
Provisioning Models Can Vary by Data Characteristics
16
大数据解决方案的整体框架架构
Data as a Services
HPC / TCP MIC
Virtual Persistence EDW, Marts Real-Time, Cached, Federated Event, Message Distributed
Data Volume and Quality Data Velocity Data Vulnerability
Provisioning Models-Storage & Connectivity Considerations
Databases DBMS / NoSQL 10GBe Fast Fabric MPP Databases DW Appliances
Data ingestion, Integration and Processing Services
Distributed High Performance Data Processing Hadoop* MapReduce
Integration Tools
源自文库
Vertically Integrated Software Intel AIM Suite
Log Files
Text, Video and Audio
Social Media
Medical Records
GIS
Security Services Privacy Compliance
Provisioning Models Can Vary by Data Characteristics
17
本课程演示文稿(PDF)发布在技术课程目录网站: intel.com/go/idfsessionsBJ 该网址同时打印于会议指南中专题讲座日程页的上方
3
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
4
趋势分析: 我们正处在医疗行业的一个重要转折点
Hadoop*
日志 CONSUME 非结构化
Create Map
REDUCE
视觉化工具
社交 & 网络
No-SQL INSIGHTS 内存数据库 SQL
电子表格 应用
传统的文件格 式
录音文件& 笔记等
Web Apps MashUps 关系型数据库
15
大数据解决方案的整体框架架构
Provisioning Models-Storage & Connectivity Considerations
大数据解决方案的整体框架架构
User Authentication
Data Access
Data Visibility
NLP/Semantic Search/ Machine Learning Knowledge Management
Custom Analytic Solutions
MapReduce Textual Analytics Streaming Analytics
12
关注数据的价值
大数据存储的考虑 传统存储方式 大规模数据分析 – Hadoop* 海量数据库 – Hive* 大规模备份 – Lustre* 传统解决方案 环境 ERP, CRM, Batch, OLTP-DB
边缘服务器(Edge) 分析 同步 端到端 Machine-to-Machine Source-to-Source
Virtual Persistence EDW, Marts Real-Time, Cached, Federated Event, Message Distributed
Data ingestion, Integration and Processing Services
Distributed High Performance Data Processing Hadoop* MapReduce
全球老龄化 平均年龄60 + : 目前的10%, 到 2050年将达到20%
以美国为例: 医疗大数据的价值 3千亿美元/年, 相当于每年生成总 值增长0.7%
Source: McKinsey Global Institute Analysis ESG Research Report 2011 – North American Health Care Provider Market Size and Forecast 5
Data Center Provisioning Discrete Virtual Cloud – As A Service HPC
边缘服务器(Edge) 分析 同步 端到端 Machine-to-Machine Source-to-Source
可行的解决方案体系(示例)
数据源 文本-语音-视频-传感器 Requesting Or M2M 通讯 批量 – 商业应用
Integration Tools
Vertically Integrated Software Intel AIM Suite
Data Characteristics
Cloud
NAS - SAS and Distributed Storage Human Genome & Drug Discovery
Applications & Services Visualization – File Structure & Analytical Tools Data Delivery, Operational & Graphical Analytics Data Management & Computational Analytics
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
7
医疗大数据简介
数据来源包括哪些?
1. 制药企业/生命科学 2. 临床决策支持 & 其他临床应用 (包括诊 断相关的影像信息) 4. 患者行为/社交网络
3. 费用报销, 利用率 和 欺诈监管
大数据在医疗行业的应用
吴闻新, Global Health Solution Architect, Intel 丁 华, Healthcare Solution Architect, Intel
BIGS001
2
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
Integrated Analytics with Hadoop Support
BI & Predictive Analytics
Existing BI/Analytics with in-database data processing support
Data as a Services
HPC / TCP MIC
数据源 文本-语音-视频-传感器 Requesting Or M2M 通讯 批量 – 商业应用
丰富的视觉化效果– 安全的数据分析和缓存
13
关注数据的价值
大数据存储的考虑 传统存储方式 大规模分析 – Hadoop* 海量数据库 – Hive* 大规模备份 – Lustre* 传统解决方案 环境 ERP, CRM, Batch, OLTP-DB
Data Velocity Data Vulnerability
Data Sources
Diagnostic Images
Surveillance and Medical Medical Device Devices Streaming Data
需要新技术的支持
数据量
检验结果, 费用数据, 影像, 设备产生的感应数据, 基因数据等
类型
• •
结构化数据, 遵循标准的数据标准(如,HL7) 非结构化数据, 如口述、手写、照片、影像等
价值
基于现有数据库中的数据进行分析,来支持不同种类的业务:如 费用及报销、患者病史、归档影像分析、实时临床决策支持(数 据分析)
趋势分析:我们正处在医疗行业的一个重要转折点
存储的增长
医疗服务产生的数据总量(PB)
15000 10000 5000 0 2010 2011 2012 2013 2014 2015 Admin Imaging EMR Email File Non Clin Img Research
医疗影像归档
一个医疗系统案例的数据
Data Sources
Diagnostic Images
Surveillance and Medical Medical Device Devices Streaming Data
Log Files
Text, Video and Audio
Social Media
Medical Records
GIS
丰富的视觉化效果– 安全的数据分析和缓存
14
Compute – Storage & Infrastructure Platforms
大数据解决方案的部署方式(参考)
结构化 数据平台 企业应用工具
遗留系统
Node
Node
Node
ODS & 数据集市 数据挖掘 集成开发工具 IMPORT
企业级数据仓库
我们如何利用大数据创造价值? (示例)
1. 个体化医疗 2. 临床决策支持
3. 欺诈监测得以加强
4. 由生活方式和行为引发的疾病分析
McKinsey Global Institute Analysis
8
医疗大数据相关解决方案
健康信息服务
基础医疗服务 个人健康管理 老龄社会
新兴的医疗服务 应用
临床决策支持
个体化医疗
肿瘤基因组学
数据分析及 视觉化处理
类SQL的检索
机器学习
医疗影像分析
数据处理/ 管理
医疗记录
基因数据
医疗影像
分布式平台
存储优化
安全和隐私
影像数据处理加速
9
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
10
大数据的挑战不仅来自于数据量的增长...
到2020年, 医疗数据将急剧增长到35 Zetabytes, 相当于2009年数据量的44倍 增长
Source: McKinsey Global Institute Analysis ESG Research Report 2011 – North American Health Care Provider Market Size and Forecast 6
Data Characteristics
Data Volume and Quality
Cloud
NAS - SAS and Distributed Storage Human Genome & Drug Discovery
Provisioning Models-Storage & Connectivity Considerations
% o f popu lation over age 60
30+ %
25- 29%
20- 24%
10- 19%
0-9 %
2050
WW Average Age 60+: 21%
Source: U nited Nation s “Po pulati on Agi ng 200 2”
医疗费用在不断上升 GDP的占比非常高
NAS - SAS and Distributed Storage Human Genome & Drug Discovery Databases DBMS / NoSQL 10GBe Fast Fabric MPP Databases DW Appliances
Data Velocity Data Vulnerability
Data Sources
• 实时数据分析,而非传统的批量处理分析
速度
• 数据以流的方式进入系统,进行抽取和分析 • 对于实时运行中的每个时间节点产生影响,而不是事后处理
在传统的解决方案之上,引入新的数据及分析模型和技术,
11
实时有效的商业价值
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
Security Services Privacy Compliance
Provisioning Models Can Vary by Data Characteristics
16
大数据解决方案的整体框架架构
Data as a Services
HPC / TCP MIC
Virtual Persistence EDW, Marts Real-Time, Cached, Federated Event, Message Distributed
Data Volume and Quality Data Velocity Data Vulnerability
Provisioning Models-Storage & Connectivity Considerations
Databases DBMS / NoSQL 10GBe Fast Fabric MPP Databases DW Appliances
Data ingestion, Integration and Processing Services
Distributed High Performance Data Processing Hadoop* MapReduce
Integration Tools
源自文库
Vertically Integrated Software Intel AIM Suite
Log Files
Text, Video and Audio
Social Media
Medical Records
GIS
Security Services Privacy Compliance
Provisioning Models Can Vary by Data Characteristics
17
本课程演示文稿(PDF)发布在技术课程目录网站: intel.com/go/idfsessionsBJ 该网址同时打印于会议指南中专题讲座日程页的上方
3
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
4
趋势分析: 我们正处在医疗行业的一个重要转折点
Hadoop*
日志 CONSUME 非结构化
Create Map
REDUCE
视觉化工具
社交 & 网络
No-SQL INSIGHTS 内存数据库 SQL
电子表格 应用
传统的文件格 式
录音文件& 笔记等
Web Apps MashUps 关系型数据库
15
大数据解决方案的整体框架架构
Provisioning Models-Storage & Connectivity Considerations
大数据解决方案的整体框架架构
User Authentication
Data Access
Data Visibility
NLP/Semantic Search/ Machine Learning Knowledge Management
Custom Analytic Solutions
MapReduce Textual Analytics Streaming Analytics
12
关注数据的价值
大数据存储的考虑 传统存储方式 大规模数据分析 – Hadoop* 海量数据库 – Hive* 大规模备份 – Lustre* 传统解决方案 环境 ERP, CRM, Batch, OLTP-DB
边缘服务器(Edge) 分析 同步 端到端 Machine-to-Machine Source-to-Source
Virtual Persistence EDW, Marts Real-Time, Cached, Federated Event, Message Distributed
Data ingestion, Integration and Processing Services
Distributed High Performance Data Processing Hadoop* MapReduce
全球老龄化 平均年龄60 + : 目前的10%, 到 2050年将达到20%
以美国为例: 医疗大数据的价值 3千亿美元/年, 相当于每年生成总 值增长0.7%
Source: McKinsey Global Institute Analysis ESG Research Report 2011 – North American Health Care Provider Market Size and Forecast 5
Data Center Provisioning Discrete Virtual Cloud – As A Service HPC
边缘服务器(Edge) 分析 同步 端到端 Machine-to-Machine Source-to-Source
可行的解决方案体系(示例)
数据源 文本-语音-视频-传感器 Requesting Or M2M 通讯 批量 – 商业应用
Integration Tools
Vertically Integrated Software Intel AIM Suite
Data Characteristics
Cloud
NAS - SAS and Distributed Storage Human Genome & Drug Discovery
Applications & Services Visualization – File Structure & Analytical Tools Data Delivery, Operational & Graphical Analytics Data Management & Computational Analytics
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
7
医疗大数据简介
数据来源包括哪些?
1. 制药企业/生命科学 2. 临床决策支持 & 其他临床应用 (包括诊 断相关的影像信息) 4. 患者行为/社交网络
3. 费用报销, 利用率 和 欺诈监管
大数据在医疗行业的应用
吴闻新, Global Health Solution Architect, Intel 丁 华, Healthcare Solution Architect, Intel
BIGS001
2
议程
• 医疗与大数据的趋势 • 什么是医疗大数据? • 大数据面临的挑战 • 如何管理和利用大数据 • 案例分享 • 总结与展望
Integrated Analytics with Hadoop Support
BI & Predictive Analytics
Existing BI/Analytics with in-database data processing support
Data as a Services
HPC / TCP MIC
数据源 文本-语音-视频-传感器 Requesting Or M2M 通讯 批量 – 商业应用
丰富的视觉化效果– 安全的数据分析和缓存
13
关注数据的价值
大数据存储的考虑 传统存储方式 大规模分析 – Hadoop* 海量数据库 – Hive* 大规模备份 – Lustre* 传统解决方案 环境 ERP, CRM, Batch, OLTP-DB