大数据与云计算
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据增长迅速
Intel:人类文明开始到2003年,地球共产生5EB数据。 2012年全年,全球产生数据2.7ZB是2003年以前的500倍。 2015年,全球估计产生数据8ZB,等于1800万个美国国会图 书馆。
大数据的定义
• 大数据或称巨量资料
指的是所涉及的资料量规模巨大到无法透过目前主流软件 工具,在合理时间内达到撷取、管理、处理、并整理成为 帮助企业经营决策更积极目的的资讯。 大数据分析相比与传统的数据仓库应用,具有数据量大、 查询分析复杂等特点。
Baidu Nhomakorabea
云计算之我见
• 提供资源的网络被称为“云”。“云”中 的资源在使用者看来是可以无限扩展的, 并且可以随时获取。这种特性经常被比喻 为像水电一样使用硬件资源,按需购买和 使用。 • 把所有本地的事情,都可以放在云端上来 完成就是云计算。
云计算的工作原理与关键技术
• 云计算的工作原理 在典型的云计算模式中,用户通过终端接入网络,向“云” 提出需求;“云”接受请求后组织资源,通过网络为“端” 提供服务。用户终端的功能可以大大简化,诸多复杂的计 算与处理过程都将转移到终端背后的“云”上去完成。用 户所需的应用程序并不需要运行在用户的个人电脑、手机 等终端设备上,而是运行在互联网的大规模服务器集群中; 用户所处理的数据也无需存储在本地,而是保存在互联网 上的数据中心里。提供云计算服务的企业负责这些数据中 心和服务器正常运转的管理和维护,并保证为用户提供足 够强的计算能力和足够大的存储空间。在任何时间和任何 地点,用户只要能够连接至互联网,就可以访问云,实现 随需随用。
21世纪是数据信息大发展的时
…
faceb ook
社交网络
代,移动互联、社交网络、电子 商务等极大拓展了互联网的边界 和应用范围,各种数据正在迅速 膨胀并变大。
互联网(社交、搜索、电商)
电子商务
淘宝、 ebuy
…
…
微博、 Apps
移动互联
、移动互联网(微博)、物联网 (传感器,智慧地球)、车联网 、GPS、医学影像、安全监控、 金融(银行、股市、保险)、电 信(通话、短信)都在疯狂产生 着数据。
大数据与云计算
2014年10月
目 录
• • • • 大数据的由来 大数据的定义 大数据的4V 大数据关键技术
• • • •
云计算的定义 云计算的体系结构 云计算的特征和类型划分 云计算和大数据的关系
•大数据的经典应用
•身边的大数据应用
•贵州大数据产业“七朵云”工程
大数据的由来
• 最早提出“大数据”时代到来的是全球知名咨询 公司麦肯锡,麦肯锡称“数据,已经渗透到当今 每一个行业和业务职能领域,成为重要的生产因 素。人们对于海量数据的挖掘和运用,预示着新 一波生产率增长和消费者盈余浪潮的到来。” • “大数据”在互联网行业指的是这样一种现象: 互联网公司在日常运营中生成、累积的用户网络 行为数据。
云计算
• 在2006年8月召开的“搜索引擎战略大会” 上由google公司首席执行官Eric Schmidt再 次提出云计算,后台被广泛接受的信息技 术新名词。
云计算的定义
云计算是一种商业计算模型。它将计算任务 分布在大量计算机构成的资源池上,使各种应用 系统能够根据需要获取计算力、存储空间和各种 软件服务。 本质是将所有的计算(社会)资源集中起来 ,并有软件(平台)实现自动管理,使得各种服 务提供商和应用者无需为细节而操心,能够更加 专注于自己的业务,有利于创新和降低成本。
大数据的起始计量单位至少是P、E或Z。
大数据到底有多大?
从Byte、KB、MB、GB、TB到PB、EB、ZB、YB。
• • • • • • TB(1024GB=1TB) 2的40次方 PB(1024TB=1PB) 2的50次方 100万G EB(1024PB=1EB) 2的60次方 10亿G ZB(1024EB=1ZB) 2的70次方 1万亿G 15寸500G电脑(22亿台)排成行可以往返一次月球。 YB(1024ZB=1YB) 2的80次方 1千万亿G
云计算
• 在过去的几十年里,“并行计算”、“分布式计 算”、“网格计算”等与云计算类似的概念和理 论以不同的方式进行着尝试与实践。 • 人们希望能够更好地整合互联网和不同设备上的 信息和应用,把所有的计算、存储资料连接在一 起,实现最大范围的协作与资源分享。 • 云计算式这些计算计算的融合和发展,强调基于 网络化计算与存储资料,达到高效率、低成本计 算的理念。“按需计算”、“软件即服务”、 “平台即服务”等新理念和新模式,都是各企业 对云计算的各自解读或云计算发展的不同阶段。
获得的各种类型的结构化、半结构化(或称之为弱结 构化)及非结构化的海量数据,是大数据知识服务模 型的根本。
主要完成对已接收数据的辨析、抽取、清洗等操作。
大数据存储与管理要用存储器把采集到的数据存储起 大数据存储及管理技术 来,建立相应的数据库,并进行管理和调用。重点解 决复杂结构化、半结构化和非结构化大数据管理与处 理技术。 从大量的、不完全的、有噪声的、模糊的、随机的实 大数据分析及挖掘技术 际应用数据中,提取隐含在其中的、人们事先不知道 的、但又是潜在有用的信息和知识的过程。 重点应用于以下三大领域:商业智能、政府决策、公 大数据展现与应用技术 共服务。
“大数据”的诞生:
大数据时代的背景
半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了 一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增 长速度也在加快。信息爆炸的学科如天文学和基因学,创造出了“大数据”这 个概念*。如今,这个概念几乎应用到了所有人类智力与发展的领域中。
大数据的4V特性
Volume---(大量化) 数据量巨大。IDC预 测到2020年全球将共 有35ZB的数据量。 Variety(多样化)
越来越多非结构化数据。音频 、订单、日志、地理位置信息 等多类型数据对数据处理能力 提出更高要求。
Velocity(快速化)
实时获取所需要的数据 。在海里的数据面前, 处理数据的效率就是企 业的生命。
Value(价值密度低)
沙里淘金,价值密度低。如一 段一小时的视频,有能有用的 数据只有一两秒。
只有具备这些特点的数据,才是大数据。
大数据关键技术
大数据处理关键技术一般包括:大数据采集、大数据预处理、 大数据存储及管理、大数据分析及挖掘、大数据展现和应用。
大数据关键技术
大数据采集技术
大数据预处理技术