大数据将给我们带来怎样的变化

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据带来的工作、学习和生活的变化以及给我们的启示

我们都听过这个预测:到2020年,电子数据存储量将在2009年的基础上增加44倍,达到35万亿GB。根据IDC数据显示,截止到2010年,这个数字已经达到了120万PB,或1.2ZB。如果把所有这些数据都存入DVD光盘,光盘高度将等同于从地球到月球的一个来回——也就是大约480,000英里。

对于那些喜欢杞人忧天的人来说,这是数据存储的末日即将到来的不祥预兆。而对于机会主义者们而言,这就好比是个信息金矿,随着技术的进步,金矿开采会变得越来越容易。

走进大数据--一种新兴的数据挖掘技术,它正在让数据处理和分析变得更便宜更快速。大数据技术一旦进入超级计算时代,很快便可应用于普通企业,在遍地开花的过程中,它将改变许多行业业务经营的模式。

在计算机世界里,大数据被定义为一种使用非传统的数据过滤工具,对大量有序或无序数据集合进行的挖掘过程,它包括但不仅限于分布式计算(Hadoop)。

大数据已经站在了数据存储宣传的风口浪尖,也存在着大量不确定因素,这点上非常像“云”。我们请教了一些分析人士和大数据爱好者,请他们解释一下大数据究竟是什么,以及它对于未来数据存储的意义。

大数据走进历史舞台

适用于企业的大数据已经出现,这在部分程度上要归功于计算能耗的降低以及系统已具备执行多重处理的能力这样一个事实。而且随着主存储器成本的不断下降,和过去相比,公司可以将更多的数据存到存储器中。并且,将多台计算机连到服务器集群也变得更容易了。这三个变化加在一起成就了大数据,IDC 数据库管理分析师Carl Olofson如是说。

“我们不仅要把这些事情做好,还要能承受得起相应的开支”,他说。“过去的某些超级计算机也具有执行系统多重处理的能力,(这些系统紧密相连,形成了一个集群)但因为要使用专门的硬件,它的成本高达几十万美元甚至更多。”现在我们可以使用普通硬件完成相同的配置。正因为这样,我们能更快更省得处理更多数据。"

大数据技术还没有在有大型数据仓库的公司中得到广泛普及。IDC认为,想让大数据技术得到认可,首先技术本身一定要足够便宜,然后,必须满足IBM称之为3V标准中的2V,即:类型(variety),量(volume)和速度(velocity)。

种类要求指的是待存储数据的类型分为结构化数据和非结构化数据。量是指存储和分析的数据量可以很庞大。“数据量不只是几百TB,” Olofson说:“要视具体情况而定,因为速度和时间的关系,有时几百GB可能就算很多了。如果我现在一秒能完成过去要花一小时

才能完成的300GB的数据分析,那结果将大为不同。大数据就是这样一种技术,它可以满足这三个要求中的至少两个,并且普通企业也能够部署。”

关于大数据的三大误解

对于大数据是什么以及大数据能干什么存在很多误会。下面就是有关大数据的三个误解:

1、关系数据库无法大幅增容,因此不能被认为是大数据技术(不对)

2、无需考虑工作负载或具体使用情况,Hadoop或以此类推的任何MapReduce都是大数据的最佳选择。(也不对)

3、图解式管理系统时代已经结束。图解的发展只会成为大数据应用的拦路虎。(可笑的错误)

大数据带来的工作变化

‘大数据时代’的来临,对我们统计数据的生产方式带来了很大的挑战。统计部门要充分利用‘海量数据’并对其进行标准化处理,发掘这一数据‘宝库’,认真把握好这一促进政府统计改革发展的难得机遇。”在2012年12月27日开幕的全国统计工作会议上,国家统计局局长马建堂首次对“大数据时代”进行解读,并对政府统计部门如何应对“大数据时代”的机遇和挑战提出要求。

传统数据采集方式不仅需要科学地确定调查对象,还需要通过标准化的报表进行数据采集、汇总和分析。然而随着信息化、网络化时代的到来,行政管理、生产经营、商务活动等众多领域正在源源不断地产生海量的、即时的电子化数据,国内许多企业和民间调查机构已经在开发、挖掘和利用这些数据资源,为用户提供咨询服务。随着“大数据”资源的急剧增加和数据挖掘技术的日益成熟,为用户提供的服务正在从商务领域向公共领域渗透,官方统计作为公共统计数据信息主渠道的地位面临一定的挑战。

谈及一些发达国家政府统计工作的经验,马建堂指出,近年来,国外许多政府统计机构已经开始积极应用现代化信息技术,广泛利用行政记录、企业财务会计资料来采集数据,积极研究使用“大数据”生产统计信息,努力减轻调查对象的负担。

统计工作必须适应“大数据时代”的变化和要求,马建堂强调,通过有效利用客观存在的海量数据,能够有效降低统计调查成本,有效减轻被调查者的负担,缓解被调查者配合程度降低的矛盾,能够提高统计数据的即时性,缩短统计数据生产周期,改善统计数据的质量。统计部门要勇敢面对挑战,顺应历史发展潮流,积极使用科学方法发掘这一巨大的“数据宝库”。

大数据对生活的改变

“(大数据)在人的生活方方面面都可以体现,比如我们说的电子商务,也是这样,现在是需要你在网上通过海量的数据去找,找你喜欢的东西,当我了解到你偏好、你的年龄、你的职业、你的收入、你的生活习惯之后,在你需要这个产品之前的时候,我就推送给你。这个就很可怕了,作为人,你所有方方面面的需求,我都可以通过数据的分析以后推送给你,就意味着你生活的每个方方面面,这个时候它产生的广告价值是巨大的。”

):“大数据”已成为目前使用频率最高的技术热词之一,想象未来寻常的一天:清晨,智能闹钟在你的浅睡眠时间而非预设时间唤醒你;起床后,衣橱里的衣服会根据你当天的活动进行推荐搭配。此时,车库里的汽车正在根据你的设定进行预热或冷却;驾车上班,你的自动汽车会根据交通状况规划路线并持续更新;走在路上或在室内,你的可穿戴设备记录着你的运动水平、情绪波动、心率、血压和食物摄取等信息,还有许多你能想象到的和想象不到的应用场景,而这一切都是大数据在背后支撑的,几乎所有人都在讨论大数据背后所带来的科技方面、技术方面的进步,观念上的改变,以及背后所蕴含的巨大价值。

如果你要知道,北京人、上海人、广州人他们各自最想去哪些城市旅游?本周那个热点人物的搜索最多,哪款手机受关注最高? 百度指数可以直接为你解答。全国哪个地方的男士为女士购买商品最大方?哪个星座的女生网上花钱最多,淘宝指数可以为你呈现。在美国热播美剧《纸牌屋》,就是通过海量数据库调研分析,预测了观众的喜好口味,搭配出来剧情、导演、演员班底,并一炮走红。全球零售巨头沃尔玛对消费者购物进行数据分析,发现男性顾客在购买婴儿尿布湿时,常常会顺便搭配购买几瓶啤酒来犒劳自己,于是推出了将啤酒和尿布捆绑销售的促销手段。如今这个啤酒+尿布的数据分析成果,已成为科学家通俗解释“大数据”的科学案例。

大数据对学习的改变

大数据可以收集足够多的信息,且覆盖面广泛。我们在制作和利用大数据时,需要用个性化的方法把它们组织起来,将其运用于教育领域,进而帮助我们以前所未有的视角判断什么可行、什么不可行;展示那些以前不可能观察到的学习层面,实现学生学业表现的提升;基于学生的需求而非统一的课程标准来定制个性化课堂,促进理解并提高成绩。

200多年以来,学习一直是学校体系的一部分。但其实在此之前,还没有现代意义上的学校或者大学,教育基本上是以个人形态存在的。一些富人家的孩子会获得一个一对一的导师,但这样的教育只有少数人才可以享有。现在教育是由普通大众来获得,这无论如何都是一个好事,是前进的一大步。但是,目前的这种情况还是不够的。

为什么这么说呢?因为,作为学生,其实我们每一个人都有自己独特的个性、需求和学习上的倾向。但是,目前我们这个教育系统还没有办法支持这个个性。如何才可以改变、完善这个系统?就是要通过对数据的收集和利用。如今一些技术上的进展已经为有关数据的大规模

相关文档
最新文档