大数据的基本概念与应用前景(PPT 39页)

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

TB的1000倍
TB:2的40次方,
GB:2的30次方, MB的1000倍
GB的1000倍
MB:2的20次方,
KB:2的10次方,
KB的1000倍
1024=1KB
http://baike.baidu.com/view/2166859.htm
一个英文字母=1字节(byte)
1980以来,每40个月翻一番

facebook 社交网络
电子商务
淘宝、 ebuy


微博、 Apps
移动互联网
21世纪是数据信息大发展的时代,移动互 联、社交网络、电子商务等极大拓展了互联网的 边界和应用范围,各种数据正在迅速膨胀并变大 。
互联网(社交、搜索、电商)、移动互联网(微 博)、物联网(传感器,智慧地球)、车联网、 GPS、医学影像、安全监控、金融(银行、股市 、保险)、电信(通话、短信)都在疯狂产生着 数据。
大数据技术将被设计用于在成本可承 受的条件下,通过非常快速(velocity) 的采集、发现和分析,从大量化(volume s)、多类别(variety)的数据中提取价 值(value)
Acquisition Storage
Processing Integration Retrieval
Display
2013年3月 发布大数据战略报告,宣布将于2013年7月前完成政 府大数据制定,促进大数据在政府中的应用
2014年3月5日,“大数据”首次进入我国政府工作报告, 11月15日李克强总理提出在疾病防治、灾害预防、 社会保障、电子政务等领域开展大数据应用示范。
Source: Nigel Holmes 2012 / Smolan & Erwitt: The Human Face of Big Data
2012年7月 《面向2020年的ICT综合战略》将“通过大数据应用促 进社会发展经济增长”作为五大重点之一,并提出活 力数据战略,提升日本竞争力
2012年9月 联合欧洲整体力量,制定大数据战略,作为欧盟 Horizon 2020战略一部分,加速追赶
2013年1月 英国把大数据作为八大关键技术领域之一,计划两年 内向大数据关键技术投入1.89亿英镑,抢占先机
没有强大的计算能力,数据宝藏终究是镜中花; 没有大数据的积淀,云计算也只能是杀鸡用的宰牛刀。
大数据与云计算(2)
大数据的基本概念与应用前景
内容
一、大数据的重要性 二、大数据的基本特点 三、大数据的相关技术与概念 四、大数据的医学应用 五、大数据的机遇与挑战
不同国家的大数据战略
国家/地区
时间
内容
美国
日本
欧盟 英国 澳大利亚 中国
2012年3月 启动由联邦政府六个部门组织的大数据研究计划,投 资两亿美元。将“大数据战略”上升为国家战略,认为 大数据为“未来的新石油”
数据量增速,是GDP增速的4倍

数据处理能力,是GDP增速的9倍

数据 量
2000年人类信息75%是模拟数据,2007年 是6%,现在1%?

ZB

Value 价值
• 挖掘大数据的价值类似沙里淘金,从海量数据中挖掘稀疏但珍贵的信息. • 价值密度低,是大数据的一个典型特征.
内容
一、大数据的重要性 二、大数据的基本特点 三、大数据的相关技术与概念 四、大数据的医学应用 五、大数据的机遇与挑战
计算结果展示
• 标签云 (Tag Cloud) • 聚类图 (Clustergram) • 空间信息流 (Spatial information flow) • 热图 (Heatmap)
大数据与云计算(1)
蓝蓝的天上白云飘
白云下面数据跑
如果数据是财富,那么大数据就是宝藏,而云计算就是挖掘和利 用宝藏的利器。
内容
一、大数据的重要性 二、大数据的基本特点 三、大数据的相关技术与概念 四、大数据的医学应用 五、大数据的机遇与挑战
“大数据”的诞生:
半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积 累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信 息,而且其增长速度也在加快。
信息爆炸的学科如天文学和基因学,创造出了“大数据”这个概念 。如今,这个概念几乎应用到了所有人类智力与发展的领域中。
大数据时代的演变
大数据的4V特性
DB:2的110次方,
NB的1000倍
NB:2的100次方,
BB:2的90次方,
BB的1000倍
绝大部分 应用在这 两个数量 级
YB的1000倍
YB:2的80次方,
ZB:2的70次方,
ZB的1000倍
EB的1000倍
EB:2的60次方,
PB:2的50次方,
PB的1000倍
数据、信息、知识与智能
Data Information
Descriptive:
What happened? • Disease categories
• Adverse events
wk.baidu.com
Knowledge
Wisdom Take Tylenol
Predictive:
What might happen? • High-risk patients
• Genetic risks
39°= Fever 39°C 39
Prescriptive:
What should we do? • Minimize readmissions • Personalized therapeutics
Biomedical Discovery
Healthcare Delivery
Health Prevention
大数据的相关技术
数据采集
统计分析、预测与挖掘
数据储存与管理
• ETL工具( ExtractionTransformation -Loading,数据 提取、转换和加 载)
• 数据众包 (CrowdSouring)
• 结构化、非结构化 和半结构化数据
• 分布式文件系统 • 关系数据库 • 非关系数据库
(NoSQL) • 数据仓库 • Hadoop • 云计算和云存储 • 实时流处理
• A/B Testing • 关联规则分析 • 分类 • 聚类 • 遗传算法 • 神经网络 • 预测模型 • 模式识别 • 时间序列分析 • 回归分析 • 系统仿真 • 机器学习 • 优化 • 空间分析 • 社会网络分析 • 自然语言分析 • MapReduce • R语言
相关文档
最新文档