大数据时代信息化发展趋势概述(PPT 62张)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
材料
管理 信息 能源
二、信息技术为大数据开辟了前进道路
信息技术进展是大数据产生和发展的主要动力
• 传感技术:大数据的主要来源
• 存储技术:不仅数据量大,而且要有信息存储模式
• 传输技术:不仅提供传输能力,还是数据的创造者
• 处理技术:不仅是处理能力,更是处理方法(结构化语义
处理)
信息技术继续快速发展,技术 体系更趋完善
2019/2/17
主要内容
1. 大数据的由来和发展
2.
3. 4.
信息技术为大数据开辟了前进道路
大数据是走向信息时代的奠基石 大数据发展的关键环节
5.
电子政务发展中的大数据
一、大数据的由来和发展
大数据是一个自然形成的发展中、阶段性概念
本报告所称大数据是指具有数量巨大、
在计算机处理 能力不断发展 、信息系统处 理的信息日益 增长,特别是 互联网(包括 移动互联网) 的发展、传感 技术的广泛应 用,大数据概 念应运而生 在这里,大数 据和信息、信 息资源是同义 词
信息内容的技术:走向智能的核心
信 息 组 织 、 管 理 和 利 用
2019/2/17
应对数量变化, 2的50-100次方
应对音视频信 息类型的变化
应对应用需求 的变化
文字声音的转化、声音处理、图像处理 机器翻译为代表的自然语言处理
概念体系为基础、不同粒度、不同场景的wenku.baidu.com
年还多 • 每天Twitter上发布5000万
• 2020年数据产出量将比 2009年的44倍还多 • 2006年全球生成、复制的 数字化信息量大约16.1万 PB,当年的信息产生量约
条微博
• 每天Google处理的数据24PB • 2012年11月11日第一秒,用 户向阿里网购提出1千万请 求
是历史上图书信息总量的
绝大部分 应用在这 两个数量 级
YB:2的80次方 ,ZB的1000倍
PB:2的50次方 ,TB的1000倍
EB:2的60次方 ,PB的1000倍
GB:2的30次方 ,MB的1000 倍
TB:2的40次方 ,GB的1000 倍
•
我们每个人都在制造和使用信 过去3年数据量比以往数万息 • 每秒发出290万条短信
2019/2/17
处理存储技术:20年内提升3个数量级 处 理 存 储
高性能,一些重要 的应用,需要继续 沿摩尔定律提升3 个以上数量级 更加复杂和 智能化的应 用,需要寻 找新的技术 处理能力的 集成,更加 复杂的存储 与处理系统
2019/2/17
/
集成度,从当前的32/28nm,快步前进到14/16nm及以下 低功耗、嵌入式、可靠性、小型、可移动
多类型、不同结构化程度、不均衡价值密度
、不一致动态特征、不同应用处理特征等特 点信息集合。 本报告所称大数据系统是指一个围绕特 定目的而形成的数据及其处理系统。并不是
每一个大数据系统的信息集合都具有上述全
部特征,一种或两种类型,数量巨大,也是 大数据。
为什么叫大数据:一是数量大
ZB:2的70次方 ,EB的1000倍
/
字声 转音 换文 /
显示反应技术:走向智能
字声 转音 换文 /
磁生 转物 换光
/
清晰
色彩 轻便 控制技术
节能
适应 可靠 机器人
显 示 反 应
3D及多维 表 语 文 情 言 字 虚拟现实 虚实结合 的现实
2019/2/17
/
打印机、 复印机、 传真机、 三维空间 扫描仪 精确行为
与感知、网络能力并行的 反应、行动能力,在不同 空间范围信息系统的物理 行为无需人来执行
软件和系统集成:承载信息社会运行控制
使设备和系统变 成可靠的工作系 统
软 件 和 系 统 集 成
2019/2/17
应对设备和系 统复杂化和多 样化的进程
Saas及新的 业态,构建智 能的系统
设备和技术的多样复杂、非结构化事务和信息的处理 、2的50-100次方级大数据的组织与利用、跨领域且 物理世界相对松散的事务处理、设备(系统)控制与 事务处理的融合,复杂系统、不同类型对象的建模 重用、测试、可靠性、安全性、生产率、适应新模式 建模技术、软件工程技术、自动编程技术、验证技术
3000倍
• 全球新增网页571个
为什么叫大数据:二是类型多
• 二是类型多
结构特征:结 构化、半结构 化、非结构化 拥有特征:私有 、共有、公开 形态特征: 语音、文本 、数值、图 像、视频
三是更接近把握信息资源的本质
• 大数据真正开始把信息变成资源
• 有的文章将大数据看作石油,大数据研究与 自然资源利用发现、开采、提炼存在一定的 相似之处 • 研究大数据,首先要研究各种有用的信息在 何处,就是找矿 • 其次是把满足特定需求的信息收集过来,就 是开矿 • 第三是把收集的信息按应用需求进行结构化 处理,就是提炼,如同石油必须经过炼化才 能变成消费用的汽油、柴油或作为原料用的 聚乙烯、聚丙烯
大数据是一个阶段性的概念
大数据是信息和信息资源 开发利用这个稳定概念在今天 这个特定时期的代表名词。关 于大数据所有作用和意义的期 待,都包含在1970年哈佛大学 关于资源三角形的论述中。这 个论述简而言之就是材料、能 源、信息是推动社会发展的三 种基本资源。美国人相信它40 多年了,并为之持续不断地做 了大量的工作,也是美国在IT领 域,包括信息资源领域,一家 独大的一个原因。
高性能,超级计算机、汇聚计算资源能力
感知获取技术: 一组需求驱动快速发展的技术
空间、地球、生物、生命、 社会等全方位、细粒度的感 知
热、压、声 构成、损伤 、关系 技术类型 RFID
2019/2/17
感知什么
感 知 获 取
遥感
声纳
磁生 转物 换光 /
机器阅读 及其他语 义信息的 获取 各类感知 远、细、 清的要求
1、处理、传输、存储技术延续高速发展 2、感知、显示、获取技术驶入快车道 3、内容处理、智能系统技术不断成熟 4、技术体系不断完善
11
传输技术:走向宽带泛在普及
传 输
人与人
走向 G级
物与人
从个位数 到T级P级 甚至更高
超高速
泛在 新的体系 架构
人与物
物与物
端到端数百兆到吉比特,4个以上数量级的汇接带宽,3D 及虚拟现实等传输要求,许多场景下并发数量急剧增加 更加深入的融合:三网、固移,工作网、物联网、互联网 当前的关键技术:端到端G级、下一代互联网、新技术条 件下的城域网和骨干网体系架构,……