网易“数读”的数据新闻实践探析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
属问题,数据的使用边界,数据挖掘结果的呈现方式,受益分成等问题,均有待于在实践探索中,逐步建立合理、规范的制度和流程。
(三)企业品牌和社会责任的协调套用好莱坞电影《蜘蛛侠》中的一句台词:今天的搜索引擎企业是“能力越大,责任越大”。
未来,搜索引擎企业在承担社会责任中发挥的作用,将成为其品牌建设中的重要因素。
从个人用户层面来说,大数据时代,搜索引擎不但是每个用户在信息海洋中的舢板,更是连接用户和媒
体海量数据之间的“信息中枢”。
从
国家宏观层面而言,搜索引擎作为网
络战略枢纽,承载着大量的经济、政
治、国防信息,其中有很多关于国家
安全和社会稳定的内容。
其中难免鱼
龙混杂、良莠不齐,亟待通过强化搜
索引擎企业的社会责任意识,在社会
舆论安全和信息传播伦理道德领域发
挥积极、正面的引导作用。
综上,本文以大数据时代的环
境为背景,从搜索引擎的价值、原理
和趋势三个方面,思考了搜索引擎的
现状和发展,这一今天司空见惯的媒
体应用,从诞生之日起就成为了连接
网络虚拟世界与现实生活的桥梁;今
天,当网络越来越具象,虚拟空间与
现实世界越来越同步,搜索引擎对日
常生活和社会发展中的影响力也在不
断加强;未来,我们将能够更加深刻
地体会到这种影响带来的力量,见证
搜索引擎新的成长和突破,真正实现
从“信息舢板”到“数据之舟”的蜕
变。
■
(作者单位:中国传媒大学协同
创新中心新媒体研究院)
“新闻的未来,是分析数据。
”2009年,有着“互联网之父”之称的蒂姆·伯纳斯·李爵士这样描绘新闻未来的发展方向。
随后,2013年就被媒体称为大数据元年,到如今大数据已成为一股社会浪潮,影响着人类生活的方方面面。
伴随此,作为社会瞭望者的新闻界也开始自身变革,数据新闻就是这场变革浪潮中涌
起的一朵澎湃浪花。
何谓数据新闻
关于数据新闻的定义,目前新
闻学界尚未给出统一的说法。
但明确
的是,数据新闻又被称作数据驱动新
闻(data-driven journalism),是通过
对数据进行分析过滤而创作出的新闻
报道。
近年来,西方新闻界对数据新
闻关注越来越普遍,也进而引发国内
学者关于数据新闻的研究。
其中代表
性的有中国人民大学方洁博士根据外
国媒体实践人员对数据新闻的介绍、
总结的博客、视频和其他相关资料,
网易“数读”的数据新闻实践探析
文|吴静
Uniting修炼
认为狭义上可从新闻呈现形态、新闻生产流程、新闻行业发展这三个角度来理解数据新闻的内涵:即基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式。
清华大学郭晓科博士对全世界有关数据新闻的介绍进行过梳理和总结,认为数据新闻为记者将传统的新闻嗅觉与运用规模庞大的数据信息报道新闻创造了可能。
目前来看,数据新闻在全球范围内已普遍实践,西方媒体对数据新闻的认知和实践水平领先于我国。
从2012年美国总统大选报道期间英美各大主流媒体数据新闻的大行其道、全球首届数据新闻奖中西方媒体的参与量都可看出近年来国外媒体对于数据新闻所花费的功力。
如表1所示。
尽管我国媒体对于数据新闻的研究和应用有待提高,但实际上数据新闻对我们并不陌生。
1821年5月5日创刊第一期上的一篇调查未成年教育系统的报道被视为英国《卫报》最早的数据新闻。
目前虽然未考究我国最早的数据新闻出自哪里,但可以看出数据新闻也可认为是很早年代以前就已出现但形态较为初级,近年来在信息技术革命及媒介融合趋势推动下,新闻界正在进行积极探索发展的一大领域。
其中,网络媒体、平面媒体、商业机构与个人都在对数据新闻进行有益的尝试。
相比而言,以网易为代表的门户网站尤为甚。
网易“数读”作品分析
网易“数读”(网址http:// /special/datablog/)是网易近年来新开的一个栏目。
该栏目设计主旨是用数据说话,提供轻量化的阅读体验。
与其他网页新闻不同
的是,在该栏目版块中,可视化的信
息图表和说明文字相结合构成一篇新
闻报道,其中信息图表占据了重要一
部分,改变了传统的以文字见长的新
闻报道方式。
(一)议题选择:牵涉公众利益 寻
找个人关联
网易“数读”作品的新闻议题大
多是某一时段内全球媒体共同关注的
话题,平均两天出一期。
以2013年11
月份为例,该栏目的新闻标题如表2
所示。
欧洲新闻学中心(E u r o p e a n
Journalism Centre)和开放知识基金
会(Open Knowledge Foundation)
共同开发的《数据新闻学手册》是针
对数据新闻这一新兴领域出版的最
早的一本免费开源的工具书。
该书由
全球多个国家的数据新闻领域的倡导
者与资深专家以网络协作方式编写而
成。
认为数据新闻的意义是能够帮助
记者使用数据图表讲述一个错综复杂
的故事,还可以帮助解释新闻事件和
个人之间的关联。
从这个层面看,网
易“数读”在议题选择上较为成功,
创作者对于受众的分析把握也很准
确。
从表2可看出,网易“数读”专
栏的新闻选题基本上是在国际传播视
阈下关于中国的话题,比如“中国女
性”“中国父母”“中国创业环境”
等,网络传播的主力军又是以拼搏中
的70后至90后的中青年为主,新闻传
递的有关中国的政治、经济、军事、
生活等信息与他们的实际生活息息相
关,正好满足受众环境监测的需求。
数据新闻的议题也并非全都重
大,覆盖范围广,关键是能找到事件
与受众个人的关联,即新闻透明度:
关注公共数据哪些是可用的,哪些不
是;哪些是有用并与人们的生活息息
相关的。
例如在2013年10月13日的报
道《大陆考生雅思口语世界最差 哑
巴英语困境难破》中,就以曲线图的
形式展示了全球41个主要雅思考试国
(地区)考生的听力、阅读、写作、
口语成绩,图表中的各组数据串联成
一条条线索,引导受众将数据应用到
自身的生活中去,数据新闻价值得以
有效实现。
(二)报道方式:用数据说话 建立
相关关系
与纸媒和网络媒体上其他报道最
大不同是,网易“数读”专栏中的数
据图表很大程度上代替了传统的新闻
叙事。
数据占据了报道的重要部分,
文字只是其中一小部分,这也正体现
出数据新闻的特征。
网易“数读”作品的数据大多来
源于政府部门公布的统计数据,公司
在官网上发布的公司财报以及其他媒
体的公开报道中的数据或者由媒体自
行调查抓取的第一手数据。
在这里,
数据成为了报道的信源。
记者首先
在对来自各方面的原始数据进行抓取
后,再按照既定的选题聚焦部分专门
信息,过滤和筛选数据,最后通过重
组来深度挖掘数据背后的意义。
这是
最能体现数据新闻本质的一个环节。
例如网易“数读”专栏2013年7月15
日的报道《青年就业怪现象:没好工
作宁愿待业》中,记者通过展示分析
青年失业率与受教育程度之间的关
系,发现中国的青年就业呈现出了怪
异的态势:受教育越多越可能失业;
之后再通过剖析西南财经大学对城镇
居民的调查数据,明确教育并没有降
低青年劳动者的失业率。
最后记者再
将两组数据与美国的情况以及中国大学生报考公务员的数量进行对比,分析认为造成中国这一怪异现象的原因主要是教育结构与劳动力需求的错位以及青年人扭曲的就业预期。
如图1所示。
从客观冷静的数据分析,对受众关注的事件予以科学解读,这也正是数据新闻的魅力所在。
受众能在数据背后找到自己与所发生的新闻事件的联系。
正如同数据可视化专
家、斯坦福大学杰夫·麦考吉(Geoff McGhee)教授在其制作的《数据时
代的新闻学》(Journalism in the Age of Data)教学视频中所描述的那样:“在一个连线世界中,数据越来越成为个人表达的载体。
”数据新闻作为精确新闻的一种延伸,较之传统的新闻报道方式而言,它更能做到新闻的事实真实和逻辑真实。
“相关关系成为数据新闻的出发点,数据新闻也因此具有预测和寻找规律等特质。
”
(三)分析方法:多法并用 彰显新闻价值
分析方法包括统计、关联、对比、换算、量化、溯源、发散、综评等。
通过利用不同的数据分析方法是数据新闻价值彰显的关键。
网易“数读”作品中,经常通过对比、关联等多法并用,凸显新闻价值。
例如:其中一篇《中国三大主粮靠进口 自给自足不应成唯一选择》的数据新闻报道中,通过将国家统计局公布的2013年中国粮食总产量数与近十年来中国粮食总产量进行纵向比,再将近年来中国三大主粮进口情况进行统计和对比,结合官方公布的95%粮食自给率红线进行量化换算,就得出了一个非
常有参考价值的结论:在耕地不断被消耗、粮食生产成本逐渐增加的情况下,粮食单纯依赖国产日益变得成本高昂且不现实。
每一个新闻事件都有其不同其特点,分析方法很多,采用最合适的,是一件“数读”作品成功与否的关键点。
数据背后是逻辑存在,网易“数读”中有很多报道都是结合往年积累的翔实的数据,通过各个数据的对比、换算、分析、整合,对媒体新发布的数据进行二度剖析和反思,并从受众的角度进行重新审视,找到各种数据之间的相关性,为读者解读数据背后的意义,及时满足“公众知情权”。
这样一来也就自然会产生有价值的报道。
由此可见,大数据时代媒体的责任转变之一就是“如何向公众解释复杂难懂的数据——既给予足够的信息,又不至于危言耸听。
(四)新闻呈现形态:可视化手段创新新闻表达方式
伴随着新媒体技术和可视化的发展,数据新闻的制作已成为囊括多媒体设计、视觉艺术在内的多学科融
表2:网易“数读”栏目2013年11月份的新闻标题一览表
(资料来源:根据网易“数读”专栏的数据整理)
表1:全球首届数据新闻奖参选情况
地区 参赛项目数量(个)
参选国家 欧洲 116 英国 荷兰 西班牙 北美洲 80 美国 加拿大 墨西哥 非洲 22 肯尼亚 尼日利亚 埃及 亚洲 21 菲律宾 印度 中国香港 东欧 18 罗马尼亚 俄罗斯 乌克兰
南美 12 巴西 阿根廷
中东 11 吉尔吉斯斯坦 巴基斯坦 阿联酋
大洋洲
6
澳大利亚 新西兰
日期
新闻标题
2013-11-01 “黑色预算”:美国情报网2013年烧钱526亿美元2013-11-03 冰岛女性能顶“半边天” 中国女性地位落后世界2013-11-06 中国为员工最不敬业的国家之一,敬业者仅占6%2013-11-07 美国民众紧盯中国动态 巨额美债成最大忧患2013-11-11 各国民众隐私态度调查:中国、日本意识淡薄2013-11-12 可怜中国父母心:健康、价值观、教育事事操心2013-11-14 美军频赴灾区,国际救援中美军扮演关键角色2013-11-17 中国创业环境世界96位,仍有9成富豪白手起家2013-11-19 另类世界地图:各国不为人知的“世界第一”2013-11-22 低效、垄断的国企越来越成为经济增长拖累2013-11-25 大陆人较港人更满意空气质量,香港空气更糟?2013-11-26 4分之1中国女性遭家庭暴力 目前尚无立法保障2013-11-29
全球养老金指数:中国可持续性远低世界平均
Uniting
修炼
合的课程。
网易“数读”通过创新图表表达方式、移除无用元素、创造视觉层级、设计精确的比例,定义调色板,巧搭说明文字、利用交互式设计等多种艺术设计手段,为读者展现出了一组组大量的精美信息图表,使得数据新闻叙事变得可视化,让人们对数据不再感到冰冷和陌生。
例如在《美国民众紧盯中国动态 巨额美债成最大忧患》这篇报道中,读者可滚动页面或点击地图坐标,浏览自己需要的信息。
正是利用这些可视化的手段将数据不再枯燥地呈现出来,数据新闻才将信息有效地传递给受众。
网易“数读”的不足及建议
目前,我国有越来越多的网络媒
体开始涉足数据新闻服务,除了网易“数读”外,类似的还有新浪图解新闻、搜狐数字之道等。
尽管这些门户网站的数据新闻业务发展方兴未艾,但却并未成为核心竞争力。
单从网易“数读”栏目官方微博发布的招聘信息中我们也不难看出,我国网络媒体的数据新闻发展任重而道远。
(一)数据抓取可充分利用社交媒体
新闻的数据化除了可以进行深度数据挖掘、发展和拓展新闻线索与深度之外,媒体自身还可以依靠数据整合技术,自动进行新闻采集和编辑。
而社交媒体的日趋兴盛给新闻业的生产与消费带来了很大的冲击,记者可充分挖掘社交媒体上的原始信息作为数据来源。
但在目前网易的“数
读”作品中,以社交媒体上的数据作为信息来源的鲜为少见。
社交媒体的互动性、分享性、开放性、及时性等特征优势远没有充分发挥出来。
而从技术层面上看,这些特征优势能使得社交媒体能提供比其他渠道更加丰富的第一手资料,数据新闻完全可以借助社会化媒体得以更好的发展。
例如在英国《卫报》2012年美国总统
大选报道专辑中,就有多篇是通过抓取、分析推特(Twitter)上的信息制作而成且大受欢迎。
(二)数据可视化手段需丰富
网易“数读”作品在呈现形态上多是以静态图表为主,缺乏交互式信息图表和动态信息图表,数据可视化手段较为单一。
数据新闻的最终呈现方式应是丰富的具有互动性的可视化手段。
“可视化是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。
”随着数据新闻的不断实践,原本掌握不同学科知识之间的人的关系也发生了改变。
“数据新闻已经不仅仅是华丽丽而讨巧地视觉展示,而已经加入越来越多的互动的成分”。
数据新闻是跨学科的,数据新闻业的发展除了需要
传媒领域的知识,还需要懂得数理统
图1:网易“数读”专栏报道《青年就业怪现象:没好工作宁愿待业》
图2:网易“数读”专栏报道《美国民众紧盯中国动态 巨额美债成最大忧患》
计、计算机绘图等理工科知识。
“数据新闻学使新闻生产过程更为精细化,它对新闻工作者的技能要求除传统的文字写作,音视频制作外,还包括社科研究方法,计算机数据抓取、处理、可视化,平面/交互设计,计算机编程等多个领域。
也就是说,随着全媒体时代的到来和可视化技术的进一步发展,新闻媒体要更进一步发展,必须整合技术资源,重组新闻编辑室,让程序员和设计师共同来制作互动式图表,给全媒体的读者提供更好玩的互动式阅读体验。
(三)与受众互动交流渠道单一 ,原始数据可向读者开放
尽管受众在进行阅读体验后可将网易“数读”作品一键分享到QQ 空间、微信、人人网等社会化媒体平台,但受众与创制者之间的交流却仅能通过栏目下方评论功能和栏目官方微博,互动渠道相对单一。
在此方面做的比较突出的,不得不提英国《卫报》。
该报一直倡导开放新闻,在《卫报》网站上的“开放新闻”栏目中,公民个人可以针对数据表达自己的分析和理解。
随着数据可视化技术日渐走向大众,《卫报》已实现公民自身参与到数据新闻的制作当中,实现数据新闻的众包运作。
《卫报》的数据博客(Datablog)里也为数据新闻的爱好者提供了有关新闻可视化的知识,受众允许在线上自主获取和检测数据新闻的相关数据,同时可以线下自主进行数据新闻再创作。
就目前国内门户网站的数据新闻实践而言,不妨借鉴西方一些主流媒体在数据新
闻的制作方式,在法律范围内,向用
户开放、分享原始数据,让受众参与
社会议题,鼓励用户参与制作数据新
闻,再通过社交媒体与创制者、专家
进行交流互动,让数据新闻得到二次
传播。
这本身就是以互动为主要特征
的网络媒体的优势。
另外也可在栏目
官方微博上展示或提供有关数据新闻
可视化的视频和网站,供有兴趣的读
者学习下载,实现对忠实用户群体的
新闻生产结构的开放和移动服务。
(四)不能将数据新闻报道仅仅停
留在视觉化报道层面
数据新闻本质还是新闻,其价值
在于新闻中的数据对受众个人有什么
影响,读者希望和每天出现在新闻中
的数字发生联系。
目前网易“数读”
专栏的作品均为独立作品,整体而
言,传媒公信力尚未树立。
另外,在
数据分析过程中,应该避免为比较而
比较,不能将数据新闻仅仅停留在视
觉化报道层面,洞悉数据和解读数据
背后的意义才是关键。
(五)对数据要持怀疑态度,数据
挖掘应避免眼球经济
尽管数据新闻已在全球媒体平
台上大行其道,但对于记者而言,不
能被海量数据“淹没”。
在原始信息
数据的抓取上要心存求证意识。
绝大
部分记者数据挖掘大多源自政府部
门公布的统计数据,公司在官网上发
布的公司财报等,或者对网友的调查
数据、公众爆料的众包数据、通过不
同渠道爆料得出的数据等。
在筛选分
析数据时应先求证其是否真实准确,
因为真实是新闻的生命。
同时,记者
还应避免在数据处理上“只看树木,
不见森林”。
例如,看报表时不能仅
仅看“三公”消费等几个公众普遍关
心的数据,不去关注别的领域公共开
支中的数据,在展示通过对比得出的
数据时应将比较的前提和方法告知公
众,筛选数据不能仅仅追求眼球效
应,应注意避免社会化思维。
总 结
在传媒业正在受到巨大挑战和发
生根本性变化之时,媒体也需要作出
相应的转型,对策之一就是数据化。
数据新闻对新闻记者提出了更高的要
求。
不仅要求记者具备新闻专业知
识,更要懂得数据挖掘分析、可视化
技术的掌握。
既要有理性思维,同时
又要有深刻的人文素养。
面对数据,
记者的“新闻鼻”要更加灵敏。
目前
来看,尽管我国网络媒体数据新闻业
务尚缺成熟,但不可否认数据新闻作
为一片新的疆域,为新闻业的发展提
供了宽阔的舞台。
有着互动优势的新
媒体平台在发展数据业务上存在着巨
大的生存空间,相信国内新闻学界和
新闻界也将会对此投入越来越多的力
量,以充分地发挥媒体传播信息、环
境监测、沟通服务等职能。
■
(作者单位:湖南师范大学)。