大数据时代概述.

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
目 录
引言 第一部分:大数据时代的思维变革
第二部分:大数据时代的商业变革
第三部分:大数据时代的管理变革 结语
引 言 一场生活、工作与思维的大变革
大数据开启了一次重大的时代转型。就想望远镜让我们能够感受宇宙,显微 镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式, 成为新发明和新服务的源泉,而更多的改变正蓄势待发……
•大数据,变革公共卫生 •大数据,变革商业 •大数据,变革思维 •大数据,开启重大的时代转型 •预测,大数据的核心 •大数据,大挑战
大数据
《红楼梦》含标点87万字(不含标点853509字) 每个汉字占两个字节:1汉字=16bit = 2*8位=2bytes 1GB 约等于671部红楼梦 1TB 约等于631,903 部 1PB 约等于647,068,911部 美国国会图书馆藏书(151,785,778册)(2011年4月:收录数 据235TB ) 1EB = 4000倍美国国会图书馆存储的信息量
大数据
何为大?—数据度量 1Byte = 8 Bit 1KB = 1,024 Bytes 1MB = 1,024 KB = 1,048,576 Bytes 1GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes 1TB = 1,024 GB = 1,048,576 MB = 1,099,511,627,776 Bytes 1PB = 1,024 TB = 1,048,576 GB =1,125,899,906,842,624 Bytes 1EB = 1,024 PB = 1,152,921,504,606,846,976 Bytes 1ZB = 1,024 EB = 1,180,591,620,717,411,303,424 Bytes 1YB = 1,024 ZB = 1,208,925,819,614,629,174,706,176 Bytes
大 数 据 时 代 生活、工作与思维的 大变革
作者 作者:【英】维可托.迈尔-舍恩伯 格 肯尼斯.库克耶 译者:周涛
维克托· 迈尔-舍恩伯格(Viktor MayerSchönberger),被誉为“大数据时代的预言家”,也 是最受人尊敬的权威发言人之一。现任牛津大学网络 学院互联网研究所治理与监管专业教授,曾任哈佛大 学肯尼迪学院信息监管科研项目负责人,新加坡国立 大学信息政策研究中心主任。一百多篇论文公开发表 在《科学》《自然》等著名学术期刊上。 备受众多世界知名企业、机构和国家政府高层信 赖的信息权威与智囊。他的咨询客户包括微软、惠普 和IBM等全球顶级企业;他是欧盟互联网官方政策背 后真正的制定者与参与者,也是世界经济论坛、马歇 尔计划基金会等重要机构的咨询顾问;还先后担任新 加坡商务部高层、文莱国防部高层、科威特商务部高 层、迪拜及中东政府高层的咨询顾问。他所著的《删 除》一书,获得美国政治科学协会颁发的“唐· K· 普赖 斯奖”,以及媒介环境学会颁发的“马歇尔· 麦克卢汉 奖 ”。 肯尼斯· 库克耶(Kenneth Cukier),《经济学人》 数据编辑,曾任职于《华尔街日报》(亚洲版)和 《国际先驱论坛报》。他是美国外交关系协会成员, CNN、BBC和NPR的定期商业和技术评论员之一。
大数据时代的爆炸增长
地球上至今总百度文库的数据量:
TB
GB
1PB = 2^50字节 1EB = 2^60字节 1ZB = 2^70字节
Z EB PB
在2006 年,个人用户才刚刚迈进TB时代, 全球一共新产生了约180EB的数据; 在2011 年,这个数字达到了1.8ZB。 而有市场研究机构预测: 到2020 年,整个世界的数据总量将会增长 44 倍,达到35.2ZB(1ZB=10 亿TB)!
一天之间,互联网上要发生多少事
每天有2940亿封电子邮件发出,如果这些是纸质信件,在美国需要花费两年时间处 理; 每天有200万篇博客在网上发布,这些文章相当于《时代》杂志刊发770年的总量; 每天有2.5亿张照片上传至社交网站Facebook,如果都打印出来,摞在一起能有80个 埃菲尔铁塔那么高; 每天有86.4万小时视频被上传至视频网站Youtube,相当于不间断播放视频98年; 每天有1.87亿个小时的音乐会在流媒体音乐网站Pandora上播放,如果一台电脑从公 元元年就开始播放这些音乐会,到现在还没完没了地接着放; 未来:物联 谷歌翻译每天处理的文字数量,每天翻译次数达十亿次,相当于一百万册图书,超过 网每天产生 了全世界的专业翻译人员一年能够翻译的文字规模; 的数据将会 百度每天的关键词搜索量50亿,谷歌33.3亿; 是海量的。 淘宝天猫双11那一天营业额达571亿人民币。中国小商品城全年成交额才580.03亿元 人民币; 累积起来,互联网一天之内产生的信息总量,可以装满1.68亿张DVD光盘。 ……
B
想驾驭这庞大的数据,我们必 须了解大数据的特征。
大数据的构成
大数据包括: 交易数据和交互数据 集在内的所有数据集
大数据 = 海量数据 + 复杂类型的数据
海量交易数据: 企业内部的经营交易信息主要包括联机交易数据和联机 分析数据,是结构化的、通过关系数据库进行管理和访 问的静态、历史数据。通过这些数据,我们能了解过去 发生了什么。 海量交互数据: 源于Facebook、Twitter、LinkedIn及其他来源的社交 媒体数据构成。它包括了呼叫详细记录CDR、设备和传 感器信息、GPS和地理定位映射数据、通过管理文件传 输Manage File Transfer协议传送的海量图像文件、 Web文本和点击流数据、科学信息、电子邮件等等。可 以告诉我们未来会发生什么。 海量数据处理: 大数据的涌现已经催生出了设计用于数据密集型处理的 架构。例如具有开放源码、在商品硬件群中运行的 Apache Hadoop。
相关文档
最新文档