大数据引发传媒业的大变革

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据引发传媒业的大变革

2002年,有一部上映的科幻片——《少数派报告》,讲述的是在2054年的美国,谋杀已经消失,犯罪可以被预知。有三个具有感知未来超能力的人——先知,可以在事前得到犯罪的信息,经过司法部的预防犯罪小组破译犯罪证据之后,罪犯在实施犯罪之前就会得到惩罚。而这一切似乎将要变为现实,只不过电影中用的是超能力,而今运用大数据。

2009年,在甲型H1N1流感爆发的前几周,谷歌通过观察人们在网上的搜索记录就提前预测了流感的传播。谷歌保存了多年来所有的搜索记录,每天收到来自全球超过30亿条的搜索指令,通过分析这些庞大的数据资源,而得出了这个结论。

世界著名咨询机构麦肯锡公司于2011年5月发布了《大数据:下一个创新、竞争和生产力的前沿》报告,掀开了大数据研究的序幕。作为从经济和商业维度诠释大数据发展潜力的第一份专题研究成果,该报告系统阐述了大数据概念,详细列举了大数据的核心技术,深入分析了大数据在不同行业的应用,明确提出了政府和企业决策者应对大数据发展的策略。

一、大数据简介

麦肯锡认为,“大数据”是指其大小超出了典型数据库软件的采集、储存、管理和分析等能力的数据集。该定义有两方面内涵:一是符合大数据标准的数据集大小是变化的,会随着时间推移、技术进步而增长;二是不同部门符合大数据标准的数据集大小会存在差别。目前,大数据的一般范围是从几个TB到数个PB。

大数据(big data),究竟这个数据有多大。很多人试图测量出一个确切的数字。南加利福尼亚大学的马丁?希尔伯特(Martin Hilbert)试图得出人类所创造的、存储和传播的一切信息的确切数目。据他估算,2007年,人类大约存储了超过300艾字节的数据[1]。他预测,到2013年,世界上存储的数据能达到约1.2泽字节。这意味着:如果把这些数据全部记在书中,可以覆盖整个美国52次,如果将其存储在只读光盘上,这些光盘可以堆成五堆,每一堆都可以延伸到月球[2]。

IBM将大数据的特点总结为4个V:

(一) Volume

数据体积巨大,在我们需要处理数据的时候,不再需要随机样本,而是全体数据。即样本=全体。小数据时代随机抽样,我们用最少的数据获得最多的信息。因为技术的限制,取得过多的样本会消耗大量的成本和精力。现在,技术环境已经有了很大的改善,依然进行抽样分析就类似于在汽车时代依然骑马一样。大数据注定对社会科学有最大的撼动,因为我们再也不用依赖抽样调查了。

(二)Variety

数据的类型及来源繁多并且包含越来越多的非结构化数据(如图像、声音等信息);大数据的来源主要有这样几个方面[3]:

一是媒体数据,特别是互联网、社交媒体产生的数据,包括人们浏览网页的数字化记录等;

二是各类企业的生产、销售、管理等等数据;

三是政府部门的数据;

四是物联网、各种传感器产生的数据,以及未联网的各种摄像头拍摄的数据;

五是民众个人留存的数据,包括个人、家庭文字及音像数据。

数据类型和数量的繁多,各种数据鱼龙混杂,直接带来的结果就是错误数据的增多,精确度的下降。在小数据时代,在抽样调查的时候我们要对我们的调查的信度和效度负责,所以数据越精确越好。但是现在不是这样了,在大数据时代,我们掌握的数据越来越全面,它不仅包括现象的一点点数据,而是包括了与这些现象相关的大量甚至全部的数据。我们要做的就是接受这些纷繁的数据并从中获益,而不是以高昂的代价消除所有的不确定性。

(三)Velocity

数据增长速度快,其对于实时处理速度的要求也很高。

(四)Value

数据价值高但密度低,海量数据背后拥有价值的数据比例低。

二、大数据对传媒的影响

(一)对传统媒体的影响

传统的纸媒在互联网的冲击下依然摇摇欲坠,报纸、杂志的受众纷纷转投更先进、更具现代气息的互联网,或者手机、iPad等移动终端。更不用提现在这些新媒体有了大数据作为支撑。

亚马逊网站最初的时候,聘请了20多个书评家和编辑组成的团队,他们写书评、推荐新书,挑选非常有特色的新书标题放在亚马逊的网页上。这个团队创立了“亚马逊声音”这个版块,成为当时公司这顶皇冠上的一颗宝石,是其竞争优势的重要来源。后来林登创立了基于大数据分析的系统,应用在网站上之后,亚马逊可以根据客户个人以前的购物喜好,为其推荐具体的书籍,而且除了书籍,更可以推荐电子用品,烤面包机这些产品。这个系统创造了亚马逊销售额的三分之一。最终,书评组被解散了。很多大型书店和音乐唱片商店也歇业了。

现在的网络已经可以在新闻下方列出一长串的相关新闻的链接了,视频新闻也会在播放完毕之后自动弹出相似视频供挑选。而纸媒还完全做不到这一点,如果继续发展下去,任由新媒体在用户个性化方面做的更好,纸媒势必也面临着亚马逊书评组的命运。

(二)对传播效果的影响

大数据时代,新闻传播将更有针对性,更精准,传播将更有效果。大众传播是粗放型、广种薄收的传播,把所有的新闻信息向所有人传播,缺乏针对性、精确度。受众必须从众多新闻信息中寻找自己需要的、感兴趣的内容。

新闻媒体自产生以来,都是以大众传播为主,综合性报纸、综合性的广播电台电视台都是传播界的王者。能做大做强的,都是面向大众的综合性媒体。大数据时代,情况将发生变化,人们上网浏览都会留下“足迹”——各种数字化记录,即浏览数据。对一位受众——固定IP 地址或同一终端浏览器上的所有浏览数据或相当长时间的浏览数据进行分析,便可获知其上网习惯、喜好等等,根据这些数据,在最合适的时间以最恰当的方式向他推送最感兴趣的新闻,这就是精准传播、“长尾营销”,这样的新闻不仅不会被当做垃圾,还很可能被定制。随着大数据时代的发展,精准传播会越来越普及,越来越受欢迎。

(三)对新闻价值的影响

智能手机普及、社交媒体发达,使得人人都是记者,手机便是媒体,新闻报道、信息发布已经不再是媒体人的专利了。“我在现场”曾经是传媒业及其从业人员倍感骄傲的事情,时效性也成为业内比拼最为激烈的指标。大数据时代,联网的网民和各种电子记录设备(如摄像头)散布在社会各个角落,不断观察和上传实时情况,在经过网民们的“分布式”集体选择后,形成热点新闻。甬温动车事故,雅安地震,第一时间传出来的消息都来自于事件现场的人的微博。都说明最有时效的新闻来自“在现场”的人,而不是“到现场”的人。“独家新闻”已经成为了明日黄花,再也没有媒体用时效性来标榜自己。

更加具有颠覆性的是,应用了大数据分析的网站如果能够判断哪些新闻更加符合大众的口味,新闻价值将失去其意义,新闻编辑的新闻敏感性也将无用武之地。读者喜欢什么样的新闻,编辑所要做的就是按照大数据分析的结果去呈现那样的新闻,只要“知其然”,无需“知其所以然”。只需要关注新闻类型和读者的相关关系,无需花费多余的精力深究因果关系。除非是要进行学术研究。

(四)媒体数据库

相关文档
最新文档