浅析大数据技术的应用风险
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
郭晨晨山西师范大学数计学院
【摘要】从大数据的提出到现在仅仅几年时间,但已经成为整个社会各个领域的热门话题。从事大数据工作的人才更是受到了包括百度、腾讯、阿里巴巴等互联网掌舵公司的追捧。但是需要注意的是任何技术或者科学成果都有的局限性,让大数据更好的为人类服务需要我们更多的理性。
【关键词】大数据局限性理性
一、大数据时代的到来
提到“大数据”,需要对“数据”的重要性做简单的分析。本质上数据都是人创造的,它伴随人类历史的发展,从古至今一直影响着人类的思考、行为,改变着人类的世界观、价值观。大数据时代的核心仍然是数据。传统数据是一个个数字或者可以进行编码的简单文本,是一种结构化的信息量,分析起来要简单很多。
而大数据却包罗万象,以文本、图片、视频、音频等等众多形式出现。它包含很多非结构化数据和半结构化数据。
麦肯锡是研究大数据的先驱,在其报告中给出的大数据定义是:大数据指的是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。但它同时强调,并不是说一定要超过特定TB 值的数据集才能算是大数据。
维基百科对于大数据的描述是在无法容许的时间里,用常规软件对其内容进行抓取、管理和处理的数据集合。
大数据时代的到来与其说是人类智慧的创造性成果,不如说是对于信息爆炸时代处理海量信息的一种无奈的解决方法。
二、大数据的技术特点
任何一种新技术的应用都是水到渠成的结果,假如环境没有准备好,无论什么样的技术想取得预期的效果都是极为困难的,大数据应用对于环境的要求是极其苛刻的。
V olume、Velocity、Variety、V eracity 是大数据的4V 特点,处理数量巨大、结构博闻新闻复杂、类型众多数据构成的数据集合自然不能仅仅使用单一简单的技术来完成。
大数据是基于云计算的移动互联网、物联网、社交网络、电子商务、智慧城市的跨界融合。云计算广泛应用了分布式技术,它是一个体系架构,包含分布是数据处理技术、分布式文件系统、分布式数据库等。
正是云技术给了人们廉价获取海量计算和存储的能力,使大数据处理技术成为可能。
三、大数据应用的副作用
3.1 大数据应用需要更多理性思考
大数据的热潮其提出之初就被人们所预料到。
麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”
然而,在大数据热一浪高过一浪之时,很需要给大数据泼一盆凉水降降温。
信息化宣传言过其实已经是“新常态”,人们宣传数据库、信息共享、物联网、云计算,发布会和研讨会上这些新事物、往往赋予了它超过现实本身的意义。
每次都会描述一个无限乐观的前景,然而现实的发展和人们本来的预期并不是同样的轨迹。信息化效益不是一个短期工程,技术亦不是最关键的因素,理性的思考才是长久之计。
3.2 大数据热产生的浮躁社会氛围
纵观人类历史,人们对于预测未知的热衷从未消失过。现实世界中,缺少实时记录的工具,许多行为看起来是“人似秋鸿有来信,事如春梦了无痕”,互联网“处处行迹处处痕”的特点确
实为人们发现规律,预测未来提供可能。
非理性的宣传夸张了大数据的成果,增大了大数据的迷惑性,大数据在这种影响下变得无所不能。我们不能盲目神化大数据。
3.3 大数据应用的局限性和危害
“大数据”,简单来说就是无限规模的数据量。需要正确认识的是接收海量的信息带来的并不一定是可以高效利用的信息。
在这个信息爆炸的时代,整个互联网充斥着大量负面、虚假的信息。在利用大数据技术分析数据时,这些信息可能会使“规律”变得“非规律”。
例如在教育方式的选择问题上,如果利用大数据分析,我们貌似从海量数据中把握出了多数人接收知识的“规律”,然而对于那些并不适合的孩子来说就应该被所谓的“规律”所限定发展,被“规律”所拖垮吗?
数据的增长并不意味着有用信息的增长,更不意味着人们放弃独立思考、独立决策的能力。过度膨胀的数据让人们在遇到具体问题时过分依赖网络搜索查询,这在一定程度上限制了人们智慧的创造性。
大数据规律始于分析者的感觉和猜测,是一种人为创新和思想成果,分析结果除了技术层面还受分析者本身文化层次和悟性的影响,规律的主观性不可避免,大数据的虚假规律也不可避免。
这在很大程度上构成了大数据的局限性。大数据说到底仅仅是一种工具,走向成功,独立思考,发挥思维的创造性是关键问题。