大数据的概念
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对于大数据的概念,麦肯锡认为“大数据是一种数据聚合,其数据容量超过了传统数据技术获取、存储、处理和应用的能力”。
这个定义的主观性很强。
它只定义了一个多大的数据集才能被称为是大数据。
也许现在我们可以将容量超过TB的数据集称为大数据。
但随着技术的发展,大数据的标准也将发生变化,只会越来越大。
维基百科:“表面上,大数据指的是大量的数据收集。
实际上,从技术角度来看,它是指使用常用的硬件和软件工具获取和分析数据所需的时间超过可接受时间的数据集,“这是一个非常容错的定义,既不限制常用软件的范围,也不提出容错时间的标准。
EMC对大数据的定义是:“大数据可以看作是一个描述性的术语,它可以用来描述结构复杂且呈指数增长的数据集。
这种数据集不能被关系数据库分析和处理。
它代表了各种数据(其中大多数是非结构化的)的永无止境的累积。
因此,无论是TB 数量级还是PB 数量级,即使数据的准确量更多,也不如最终的数据使用结果重要。
EMC强调数据的价值,也就是说,大数据的本质不在于数据的巨大,而在于数据背后隐藏的价值。
许多机构和学者对大数据进行了定义。
大数据的定义主要从两个方面出发:一方面是技术,主要从大数据的采集、存储和应用过程进行分析,如麦肯锡;另一方面是价值。
主要从大数据的潜在价值和被挖掘的可能性进行分析,如像EMC。
大数据技术是指利用非常规软、硬件工具对大量复杂数据进行处理,以获得分析预测结果的数据处理技术。
大数据通常包括数据采集、存储、分析和应用等相关技术。
从技术哲学的角度看,大数据不仅具有技术的自然属性和社会属性,而且还具有价值。
自然界的三个要素是物质、能量和信息,数据本身属于一种信息,它是人们在计算机网络和各种电子终端上留下的印记。
数据本身是客观存在,具有自然属性。
大数据的出现是时代的产物,是社会自动化发展的结果,大数据的发展受到政治、经济、文化等诸多社会因素的制约,具有社会属性。
同时,大数据导致的数据安全和隐私泄露问题也引起了广泛关注,大数据本身就承载着价值。
以上就是全部内容,希望对大家有所帮助,感谢您的阅读!。