大数据的基本特性

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对大数据的基本特征有很多看法,但学术界普遍认可的是“3V”或“4V”的说法。3V特性是指容量巨大(V olume)、品种复杂(Velocity)、处理速度快,4V在此基础之上增加了价值密度低(Value)。随着数据挖掘技术和数据处理技术的发展,大数据的价值开始体现出来。

(1)容量巨大。十年前,我们对数据容量认知单位仅限于MB 和GB,但现在业务中使用的最基本的数据容量单位已达到TB。百度、腾讯、阿里等网络公司已经达到ZB(1ZB=1万亿GB)。目前,全球数据量仍在增长,年增长率超过40%。

(2)种类复杂。我们通常所说的数据是一个整体性的概念,按照不同的划分方式,数据可以被划分为多种类型,最常用和最基本的就是利用数据关系进行划分,有结构化数据、半结构化数据和非结构化数据,在小数据时代基本以结构化数据为主,随着数据技术的不断发展才出现了半结构化和非结构化数据。另外,从数据来源上划分,有社交媒体数据、传感器数据和系统数据。从数据格式上划分,有文本数据、图片数据、音频数据、视频数据等。近几年数据的种类增加

了很多,主要原因是移动设备、传感器以及通讯手段的增加,如此复杂多变的数据种类,带来的将是数据分析和数据处理的困难,势必会引发相应技术的变革。

(3)处理速度快。数据的数量和类型都在不断增加,直接影响到的就是数据的处理速度。大数据时代的基本要求就是速度要快,在数据资源化的趋势下,当今时代数据已然成为一种资源,但数据同现实中的物质资源不同,物质资源是不会消失和失去自身价值的,由于数据自身具有时效性,其所能挖掘的价值可能稍纵即逝,如果大量的数据来不及处理,就会变成数据垃圾。所以,现在的网络市场,各大互联网公司进行的不仅仅是数据的竞争,同时还是速度的竞争,要想在市场中占据主动地位,就必须要对拥有的数据进行快速的、实时的处理。

(4)价值密度低。价值性是大数据最本质的特性之一,大数据之所以能够得到各行各业的重视,主要原因就是其背后巨大的潜在价值,但是它的价值密度却很低。价值密度我们可以理解成有用数据在总数据中所占的比例。价值密度低的原因一方面是因为庞大的数据量和复杂的数据类型,基数过大带来的不仅是有价值的数据,更多的是垃圾数据和无用数据;另一方面是因为处理速度过慢,无法迅速准确的获取有价值的数据。纵使价值密度低,也无法阻挡人们对大数据的狂热,其根源还是在于数据背后所隐藏的巨大价值,大数据预测,将是大数据发展的主要方向。

以上就是全部内容,希望对大家有所帮助,感谢您的阅读!

相关文档
最新文档