虚拟仿真大数据和云计算
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
云计算又进一步激发了人们对大 数据的认识。IT技术有过两次重要 的变革,一次是上世纪80年代, 以微软和苹果为代表的PC革命, 推动了信息技术的普及;另一次 是本世纪初,以雅虎和谷歌为代 表的互联网革命,实现了信息共 享;依照螺旋上升的原理,大数 据和云计算将掀起第三次技术革 命,其影响会远远超过前两次变 革。
mj88rk8o 虚拟仿真www.hlld.com.cn
云计算
更实际的问题是,即使认识到 这些,我们该用什么样的方法去 存储与处理大数据-----如果离开云 计算来谈大数据,则容易浮在云 端;而如果离开大数据来谈云计 算,则变成无本之木。
云计算的概念最早出现在2006 年,在当年8月举行的搜索引擎战 略大会上,谷歌CEO施密特在回答 主持人提问的时候,第一次使用 了“ 云”(cloud)这个词来描述他 的服务器。但是,在现实中,业 界对这一计算方式的探索则要早 得多。
一个转折点,亚马逊的贝索斯为 云技术找到了一个行之 有效的商 业模式,也让云计算通过一种具 体的服务方式落了地。而这事之 所以由亚马逊公司首创,也在情 理之中。作为号称销售一切的电 子商务网站,为了应对高峰 期大 规模的交易业务,亚马逊一直在 不断扩充其服务器等基础设施建 设。但是,这些耗资巨大的服务 器,过了销售高峰期就会陷入大
虚拟仿真大数据和云计算
大数据
乐,购物,社交,搜索,找路等 等,但我们没有意识到,所有这 些便利的功能,背后都依赖海量 数据的运算。同时,我们自己也 成为数据“供应商”---当我们使 用微信,数据会保存在腾讯的服 务器上:当我们查阅天气预报, 客气质量,搜索路线,接发邮件, 不仅第三方服务商掌握了这些数 据,通讯运营商也会了解我们一 天的活动轨迹。至于看电影和购 物,服务商很容易就此可以判定
如果将它们链接起来,通过软件 实现资源的统一调配,存储和计 算能力将会进一步释放。顺着贝 索斯 思考的方向延伸下去,以英 特尔和微软主导的产业方向,一 直在追求更高的CPU性能、更大的 存储空间,但承载他们的是一台 台独立的PC,只是每个人对PC的 使用,毕竟各不相同,总会有很 多资源处于闲置状态。如果能够 将这些暂时闲置的计算资源整合 起来,形成一团虚拟的“ 云” ,
传统思维对数据的认识大多局限 在记录和查找上,但大数据时代, 我们需要重新来认识数据的价值。 比如以前不会计入交易记录的点 击浏览,实际上反映了你的兴趣 偏好,是有价值的。必须要转变 思维----首先,样本=总体;其次, 承认数据的混杂性;再者,重视 数据之间的相关关系,而非因果 关系。
系的认识则更需要我们来一场思 维革命。IBM新兴市场部大数据中 心总监王晓梅向我们强调,传统 的数据库处理方式一直强调因果 关系,为的是做预测性分析,而 大数据时代的思维,则更强调从 大量、混沌的数据去寻找规律。 “ 不需要追究为什么,只需要告 诉我是什么,只要数据本身是真 实的,哪怕不精确,也应该大胆 拥抱,只要大到一定量级,自然 可以弥补不精确性的缺陷。”
的由来。简而言之,就像是工业 革命时期的“福特生产线”一样, 云计算就是信息时代的社会分工---主机即将消失,未来不管你使用 什么设备,一台手机或者一部平 板电脑,都只是一款简单的显示 屏和操作平台,而把复杂的存储 和计算交给“云”端的专业机构---也许是建在荒漠里的大型数据中 心,也许是坐落在城市郊区的小 型数据工厂,由此形成“厚云薄 端”的格局。
大数据(Big Data)并非新鲜事物, 但直到2011年6月,麦肯锡咨询公 司发布了《大数据:下一个竞争, 创新和生பைடு நூலகம்力的前沿领域》的研 究报告,这一概念才成为业界竞 相解读的对象。2012年,牛津大 学教授维克托.迈尔.舍恩伯格与 《经济学人》数据编辑肯尼迪.库 克耶合著的《大数据时代》一书 出版,顿时掀起一股大数据风潮。
“网络计算机”的设备,当时售 价500美元,不需要安装微软的操 作系统就可以使用。埃里森揶揄 道:“个人电脑(PC)是一种可笑 的设备。”他设想这样一台设备, 可以像插入插座获得电力一样即 插就能获得数据。但是,这款设 备生不逢时,很快就退出了市场, 因为当时的网络传输速度极慢, 产生的数据也没有那么大,在自 家的电脑上就能轻松完成。但是,
像今天这样与数据紧密相连,各 种各样的智能终端设备使得数据 生产无处不在。同时,社交媒体, 即时通讯和视频网站的普及,又 使得我们产生的数据不再局限于 传统的文字,表格,非结构数据 已经远远超越了结构化数据。单 纯以量来说,一家谷歌公司每天 要处理的数据量就超过 24PB(1PB=1024TB,
1TB=1024GB)相当于美国国家图书 馆所有纸质出版物数据量的上千 倍。人们用了很多种类比方式来 描述今天的数据量之庞大,但其 实,在超越了一定量级之后,数 据到底有多少已经不再是最主要 的问题。更重要的问题是,我们 该如何面对海量的数据?