大数据的实际应用及未来展望
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据的实际应用及未来展望
计172(10170828)程慧艳
摘要:近年来,“大数据”已然成为IT界如火如荼的词,与“云计算”并驾齐驱,成为带领IT行业发展的两列火车。尤其在当今这个物联网快速发展的时代,数据已经成为新的资源,是支撑物联网发展的基石。本文通过对大数据的简要诠释以及一些大数据在国内外的应用实例来对大数据产业的发展、社会定位以及价值实现途径进行探索,最后分析未来大数据产业的发展。
关键词:大数据,大数据技术,数据挖掘,数据变现,应用
1.大数据时代
大数据?多么时髦的词!就连农民看新闻的时候,都会听到它。只要是能涉及到大数据的,各个行业都不会放过,比如汽车、医疗、教育、金融、饮食、传媒、零售业、农业等。如你所见,大数据已经不是IT行业的专有名词了,而是与我们生活息息相关的事物,我们已经进入了大数据时代。
相信对于大多数人来说,大数据也就只是一个经常听到的似乎很高端大气的词罢了,其实不然,要认识大数据,首先就要知道它是什么。那么,什么是大数据呢?我们来看看官方的定义:大数据(Bigdata),或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工在合理时间内截取、管理、处理并整理成人类所能解读的信息。
IBM提出了大数据的5个特点:大量、高速、多样、价值、真实性。
维克托·迈尔·舍恩伯格教授在《大数据时代》一书中指出,大数据不用随机分析法(抽样调查)这样的捷径,而是采用所有数据进行分析处理。简言之,从各种类型数据中快速获得有价值信息的能力就是大数据技术,也正是这一特点促使该技术具备了走向实际应用的潜力。
2. 数据资源(数据就是“金库”)
从数据类型来看,大数据可分为三类。
·传统企业数据:包括CRM Systems的消费者数据、传统的ERP数据、库存数据及账目数据等。
·机器和传感器数据:包括呼叫记录、智能仪表、工业设备传感器、设备日志、交易数据等。越来越多的机器配备了连续测量和报告运行情况的装置。几年前,跟踪遥测发动机运行仅限于价值数百万美元的航天飞机。现在,汽车生产商在汽车中加入了监视器,连续提供车辆机械系统的整体运行情况。
·社交数据:包括用户行为记录、反馈数据等。计算机产生的数据可能包含着关于因特网和其他使用者行动与行为的有趣信息,从而提供了对他们的愿望和需求潜在的有用认知。还有人们通过短信、QQ、微博、微信、电子邮件等产生的文本及图像信息。
这三种数据都价值连城,甚至有说法称,谁掌握数据资源,谁就掌握了“金库”。当然,要将数据变成正真的“金库”,还需要一个过程,一个分析的过程,一个总结的过程,一个预测的过程。最终,数据能帮人们提高预测的能力。通过大数据的处理工具,提取精华,总结规律,预测行为。
随着计算机处理能力的日益强大,获得的数据量越大,挖掘到的价值就越多从目前大数据的格式和内容来看,产生的数据内容中有90%是非结构化数据,如短信和微博生成的信息,以及视频和音频,情况将变得越来越复杂(至今最大的数据是音频、视频和符号数据,这些数据结构松散、数量巨大,挖掘难度很大)。无论身处哪个行业,围绕大数据及管理这些数据的挑战无处不在。
据麦肯锡全球研究院计算,大数据将给美国医疗服务带来3000亿美元的价值,使美国零售业净利润增长达到60%,使制造业产品开发、组装成本下降50%。而大数据所带来的新的技术应用需求将带动整个信息技术产业的创新发展。
3.大数据的应用
(1)预测未来
目前来说,预测未来是大数据最被期待的应用。
这里简单介绍一种用大数据预测未来的方法--时间序列法:
通过分析序列进行合理预测,提前掌握未来的发展趋势,为业务决策提供依据,这也是决策科学化的前提。
时间序列分析:时间序列就是按照时间顺序排列的一组数据序列。时间数列分析就是发现这组数据的变动规律并用于预测的统计技术。
分析工具:SPSS(数据分析的重量级应用,与SAS二选一)
实践案例:通过历史数据预测未来数据,所涉及的都是最简单实践,抛砖引玉,重在方法,不论多复杂的数据,方法是一样的。
时间序列分析有三个基本特点:
并不是所有的时间序列都一定包含四种因素,如以年为单位的诗句就可能不包含季节变动因素。
四种因素通常有两种组合方式:
原始时间序列值和长期趋势可用绝对数表示;
季节变动、循环变动、不规则变动可用相对数(变动百分比)表示。
这种方法通常被用来预测和时间变化有关的未来,比如由近几年的销售量预测明年的销售量。
还有其他根据数据分析进而预测未来的一些实例,举例如下:
电商利用用户行为分析预测用户人群,品类,时间,数量等等;金融业(特别是资本市场业)利用舆情预测股票走势,从而量化决定投资组合;制造业公司利用收集设备使用信息预测产品/组件的失效期,从而进行主动/预测性维护。
(2)大数据帮助我们购物
相信大家平时会在在淘宝或京东等这样的购物平台上购物,如果你细心,你会发现,当你打开浏览器时,它在顶部显示的一些商品都是你近期搜索或浏览的感兴趣的东西。这其实就是后台大数据服务器运行的结果。它根据你的浏览记录或购买记录,分析你的行为,挖掘你的喜好,进而为你推荐相关的产品。
(3)大数据让我们避免堵车
我们每天在公路上行驶时,可以通过智能手机查看道路信息,从而判断前面的路是否通畅,进而选择最佳的行车路线。同时可以快速的找出附近的餐馆、银行、超市、加油站等信息。
(4)大数据帮我们治疗疾病
很多科幻大片中都有机器人帮人类治病的镜头,实际上这已经不再是幻想,很多医院都已经引入机器人帮患者诊疗甚至做手术。大数据告诉我们各种症状的真正原因及解决方案。2017年2月十四日,科技巨头IBM跨界医疗对抗癌症,通过IBM Watson计算系统,几分钟就可以处理完一支专家团队通常要处理几小时甚至几天的数据。虽然目前大数据在医疗方面的应用并不广泛,但是大数据医疗已经成为一种趋势。
(5)大数据帮助反腐
大数据可以对一个人的财产进行统计分析,及时显示其清廉与否。还可以迅速查证其偷税漏税的情况(已有实例)。
(6)大数据帮助我们做检查
健身腕带可以收集有关我们走路或者慢跑的数据,例如我们走了多少步、燃烧了多少卡路里、我们的睡眠模式或者其他数据,然后结合这些数据与健康记录来改善我们的健康状况。