2003-2014 中美自媒体研究和比较分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2003-2014中美自媒体研究和比较分析
—基于数据挖掘1的视角
摘要:自媒体本世纪初兴起以来,伴随着互联网技术的飞速发展,各种新的自媒体媒介形式不断涌现,引起了中美两国学术界的高度关注。运用数据挖掘和语料分析技术,
研究分析2003年至2014年中美两国有关自媒体研究的5226篇论文可以发现,由
于两国研究者知识背景和视角不同,两国互联网科技发展水平各异,以及两国学者
对传播学基础理论不同的解读,在应对自媒体冲击的对策、微博与博客的关系、公
民参与、教育、商业与经济、政党政治与行政法治、出版7个相同领域的研究中,
中美两国学者的研究重点存在着明显的差异。自媒体的功能研究十分重要,但是自
媒体所带来的传播模式结构的变化更应引起我国学者足够重视。
关键词:自媒体数据挖掘比较研究
2002年和2003年间,美国学者丹·吉尔默(Dan Gillmor)2对自媒体(We Media,也译作公民媒体)现象如网络论坛、社交网络、博客等网络新媒介的特点进行了比较分析,他认为这种新媒介最显著的特点在于它在传播信息的同时,可以实现传播者与受众间的互动交流,而参与传播过程的所有人都可以获得即时表达自身见解的机会。他同时指出这种新媒体不同于以往所有传统媒体的传播模式,将会引发传播领域的变革。3
2003年7月,美国新闻学会4媒体中心公开发布了由肖恩·鲍曼(Shayne Bowman)和克里斯·威尔斯(Chris Wills)撰写的全球首份自媒体专题报告《自媒体:大众将如何塑造未来的新闻和信息》(We Media: How audiences are shaping the future of news and information,以下简称自媒体报告),初步界定了自媒体的基本概念5:“自媒体是大众借助数字化、信息化技术,与全球信息及知识系统连接后所展现出来的大众如何提供、分享他们自身的信息、新闻的渠道和方式。6”也就是指大众发布自己所知所用的媒介平台,如各种网络论坛、微博、微信、社交网络等。
美国新闻学会发布自媒体报告以来,自媒体发展至今已逾11年。自媒体随着信息技术在不断发展,国内外相关研究与日俱增。目前国内的研究到底处于什么状况?与美国的研究相比存在什么差异?我们依托数据挖掘技术,对中国知网、JSTOR,谷歌学术搜索等中美主流期刊数据库和重要学术搜索引擎获取的2764篇相关论文和2462项谷歌学术搜索专题检索词条进行了分析,对比分析了11年来中美自媒体研究情况,为今后的自媒体系统研究提供参考。
一、自媒体基本特点及本文研究概述
(一)自媒体的基本特点
目前对自媒体特点的概括,比较公认的是丹·吉尔默2002年在其博客中对自媒体发展特点的总结7:一是读者比作者知道得更多;二是自媒体发展是机会而不是威胁;三是利用自媒体这种形式可以发起各种多元化讨论,从而使所有人都受益;四是基于互联网的各种互动性技术,如电邮、论坛、博客、各种网站等,正在推动着以上三点不断发展。此外,针对
互联网出现后的传播技术发展变化,丹·吉尔默提出了一种目前认可度较高的分类方式。即新闻传播1.0阶段,以传统的电视、广播、报纸、杂志等为传播媒介;新闻传播2.0阶段,即少数主流网站以向广大受众传播新闻;新闻传播3.0阶段,即“草根传媒”阶段,新闻传播作为一种职业的方式受到挑战,即人人可传播、发布、传递新闻。但不管怎样划分,自媒体较之于之前的媒体形式,有着鲜明的特点。
2003年是美国新媒体蓬勃发展的时期,自媒体的异军突起,更是引起了业界的广泛关注。正如时任美国媒体中心副主任戴尔·佩斯金(Dale Peskin)在解释为什么要委托肖恩·鲍曼和克里斯·威尔斯撰写首份自媒体研究报告时所说:“纵观历史,新闻和信息的获取渠道都是一种根据掌权当局的权力体制或者财富支配体系分配的特权。在过去的两个世纪中,独立媒体(美国)作为社会及其自身权利的倡导者,在民主启蒙时代扮演了核心的角色。然而,似乎现在有一个全新的时代强加给了我们——我们比以前任何时代都知道的要多,但在生硬的现实、困惑与矛盾之上,我们的知识在创造着焦虑。在新的时代,“讲故事的人(新闻工作者)”到底扮演着什么角色?当今信息灵通、相互连接的社会怎样再塑造新闻业?当新闻和信息变成可以相互分享的个人体验的一部分时,这个世界会变成什么样子?”8首份自媒体报告所提出的各种问题,引起了全球传播学领域的关注,国内学者也在稍后2年陆续开始研究相关问题。
(二)本文研究概述
1. 研究对象
中国和美国11年来自媒体社会科学领域相关研究概况、及其差异和原因分析。
2. 样本选择
本文所有样本采集时间跨度以自媒体报告发布当年,即2003年1月1日开始,至2014年9月30为止9。样本选择遵循两个原则,一是各相关研究点尽可能覆盖全面;二是样本选取尽量减少数据冗余重复、降低不相干样本干扰。具体见表1。
10
3. 研究方式
本文在信息分类的基础上,进行分析对比和差异化综述性研究。依托数据挖掘,对国内和美国自媒体研究情况进行定量分析。
4. 研究随机性和准确性控制方法
我们对中英文论文内容抓取分析都借鉴了语料分析12方法,并重点阅读了重点论文,通过人和计算机相结合的方式,尽量减少分析的非客观性。其中对于中文重点论文的选择,主要参考论文下载量和论文引用率两个指标,同时参考了CNKI自有的关联性文献分析系统的分析结果。对于英文文献主要是通过对主流数据库的检索,并依托数据库自有影响力因子排序进行选择,同时还阅读分析了关键重点论文和书籍全文。
5. 已有相关研究情况及本文研究定位
目前我国自媒体的综述性研究,国内只有一篇发表于2014年《视听》杂志第9期的《国内自媒体研究现状综述》(作者谢琳)13。该文对CNKI中2005-2013年,以“自媒体”为关键词进行文献检索获得的578篇文章进行了定性分析(具体检索方法作者没有说明)。并基于文献检索,对自媒体形式、特征、影响、营销、及传播学相关研究等五个方面进行了简短的概况性综述。作者主要采用的是以点带面的方式对研究状况进行概述,在论文中引证了不到30篇自媒体不同方面的研究论文。由于受限于定性研究的模糊性和局限性,无法进一步准确对现有研究状况进行较为精确的描述。
6. 定量分析存在的问题及解决方法
问题:数据挖掘属于定量分析范畴的研究方法。与其他研究方法一样,量化分析也有其自身的局限性,一是在数据采样、指标设置等方面,并不能涵盖所有内容,更不可能做到百分之百精确,存在一定的误差。二是在进行论文核心内容提取时本文借助了语言学中定量分析方法,即语料分析法。但语料分析只能对语言本身的规律及关键词上下文关联性进行统计分析,并不能辨别具体关键词在某一内容方面的重要性。
解决办法:一是在数据采用方面,尽最大可能采取了全样本分析方法,即将样本选取范围设置到足够大。如中文文献,11年来,凡是CNKI数据库中存在,且其文章标题中含有“自媒体”三个字的文章,全部下载进行分析。英文文献类似,因涉及知识产权问题,无法像中文文献一样,进行海量全文下载,但对近11年来JSTOR及谷歌学术中相关论文的标题、摘要等进行了全部通读与分析,并阅读了JSTOR中的76篇重点论文。二是在语料分析方面,在计算机已有的词频统计的基础上,采用人工介入的方式,通过对计算机提取的目标核心关键词相关上下文进行通读。在了解语料中内容的大致趋势后,再进行二次统计,通过人与计算机分析相结合的方式尽量克服语料分析的不足。
二、中国的自媒体研究
(一)从论文引用率和阅读量看国内自媒体研究关注热点
判别自媒体研究关注点的两个重要指标:一是引用率,二是下载(阅读量)14。根据以上两个指标(引用率或者下载量排在前50名),共获取100篇文章。因分别满足以上两个指标的文章有相当一部分重复,消除重复文章后,本文整理出了关注度最高的67篇文章,约占1432篇总研究样本文章(以下简称总样本)的5%15。其中期刊论文49篇、硕士学位论文18篇,共计下载1152次、引用11031次。主要情况如表2所示,占比5%的文章的引用率竟然达到了总样本引用次数的58%,下载量占比达38%。引用率和下载率的高占比表明