国内社会舆情研究热点及趋势探讨
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
国内社会舆情研究热点及趋势探讨
摘要:本文在提取了以社会舆情为主题的近千余篇CNKI期刊论文的关键词后,筛选出词频最高的前63个,在此基础上运用了文献计量研究的共词分析方法,采用SPSS19.0软件为工具,通过统计学的因子分析,聚类分析,研究得出了当前国内社会舆情研究的热点以及发展趋势,主要研究热点包括:舆情引导机制,公众意见管理,舆论问题的对策研究,社会矛盾与意识形态分析,媒体影响力与舆情传播,社会舆情监督等六大研究热点,以及逐渐向网络舆情监督,和大众媒体的管理研究,舆情的传播模式发展的研究趋势。
关键词:社会舆情;共词分析法;热点趋势;多维统计分析;文献计量
1 引论
所谓社会舆情,就是针对特定的现实客体,一定范围内的“多数人”基于一定的需要和利益,通过言语、非言语形式公开表达的态度、意见、要求、情绪,通过一定的传播途径,进行交流、碰撞、感染,整合而成的、具有强烈实践意向的表层集合意识,是“多数人”整体知觉和共同意志的外化。
随着中国经济的发展,人民也渐渐开始发表自己的意见
和主张了,或是在网络上,或是在现实生活中。社会群体的事件通常又是突发性的,会在短时间内取得社会大量的关注,例如2010年10月的药家鑫案件、2014年3月暴恐案件、2014年12月内蒙古呼格吉勒图故意杀人案件等;如何监控、处理好社会舆情是当今政府和全社会的共同责任。不能任由不良的社会舆论继续传播下去,也要积极弘扬倡导正面的社会舆论,构建和谐社会主义社会。
2 共词分析方法基本原理
共词分析法(Co-term Analysis)是信息资源管理文献计量研究中的常用的方法,也是内容分析的重要方法之一。其原理即是:源于两个能表达某一学科领域研究主题或研究方向的专业术语(一般为文章关键词或主题词)在同一篇文献中出现时,表明这两个词之间具有一定的内在关系,并且出现的次数越多,表明俩者的关系越密切,距离越近。共词分析方法通常与现代统计方法如常见的因子分析、聚类分析以及多维尺度分析等多元分析方法一起结合使用,可以将某些学科研究领域中的关键词或主题词按“距离“加以分类,从而科学的归纳出该学科的研究热点,结构以及范式。同时,借助于一些图形软件,还可以将这些研究热点可视化的显示出来。
另外,值得注意的是,在文献计量研究中存在另一种共引分析法,由于作者文章发表可能滞后,因而此方法不能准
确的反映出当前某学科领域的研究热点以及趋势发展,所以此方法常用于学科成熟、结构稳定的研究领域;而共词分析方法所研究的是某学科研究领域当前文献集中关注的主题,所以比较适合一些新兴的,热点的学科领域的探讨和热点研究。例如,我国的社会舆情研究正是这样的一个学科研究领域,本文将基于共词分析的方法,探究我国社会舆情的研究热点以及未来的发展趋势。
3 共词分析方法的运用:以国内社会舆情研究领域为例
3.1 文献处理
3.1.1 文献下载
本文采用的是中国学术期刊网CNKI全文数据库并选择的是中国学术期刊网络出版总库,时间是从2004年10月至2014年10月,主题搜索为:社会舆情。
3.1.2 文献预处理
本次一共检索到1164篇期刊,并全部下载完毕。按照列名:题名,作者,单位,文献来源,关键词,发表时间等,将论文导入EXCEL表单。
3.1.3 文献初步处理
⑴对文献进行初步筛选,将一些不符合本次研究目的的文献删除。删除原则:无作者、电视、网络报道的文献。删除完成后一共剩余有论文:1037篇。再将数据进行合并汇总。
⑵关键词的处理:将筛选后的文献进行关键词统计,运
用EXCEL提供分列功能,将关键词列分成多个关键词组成的多列,运用分列功能分列:
⑶关键词筛选:将所有关键词复制粘贴到同一列,共获得原始关键词2452个,并统计每个关键词的数目,将其降序排列选取频数大于10的关键词共计64个关键词如下图1:但是由于本次研究的主题词为:社会舆情,所以将社会舆情关键词删除,最终剩下关键词数目为63个。
⑷构建关键词的共词矩阵:本次研究的共词矩阵是将63个关键词两两匹配,生成一个63*63的方阵,并在最终保留的1037篇论文中共同出现的次数。
⑸关键词相似矩阵由于本研究最后要采用SPSS的多元统计方法(如系统聚类,K均值聚类,因子分析等)对共词矩阵进行统计分析,所以要将共词矩阵化为相对应的相似矩阵。本研究将共词矩阵化为相似矩阵的方法采用的是Ochiia 系数将共词矩阵化为相似矩阵,即将共词矩阵中的每个数字都除以与之相关联的总频次的开方的乘积,计算公式如下:此时对角线上的数据表示自身与自身的相似度,计算结果为1,利用公式转换后的相似矩阵
相似矩阵中的数字表示两个关键词的相似程度,即是两个词共同出现的在同一篇文章中的次数多少,也就是两个关键词的密切程度。由于相似矩阵中有大量的0,在进行SPSS 统计分析的时候容易产生误差,所以将相似矩阵的转为相异
矩阵,效果是一样的,原因是,多元统计分析的时候,用到的只是两个关键词的相对关系,而不是绝对关系。因此用相似矩阵还是用相异矩阵进行统计分析结果都是一致的,由于考虑到误差的问题,我们最终采用相异矩阵。相异矩阵表示的是两个关键词的相异程度。
相异矩阵(部分)如下图3:
3.2 文献的多元统计分析以及数据分析
常用的三种多元统计分析的方法主要有:聚类分析,因子分析,和多为尺度分析,本文将采用前两种方法对以社会舆情为主题的文献处理结果进行多元统计分析,对其进行类属分析,从而归纳其研究热点。
3.2.1 聚类分析(Cluster Analysis)
本研究采用系统聚类分析的方法,具体选择Wards Method方法,聚类分析的结果部分树状图4如下所示,从这个树状图,大致可以初步观察到各个关键词的关联程度。
3.2.2 因子分析(Factor Analysis)
因子分析的目标是用尽可能少的因子去描述众多的指标或者因素之间的联系,其基本原理是根据相关性的大小把研究对象的变量进行分组,使得同组内的变量之间的相关性较高,而不同组内的变量相关性较低。这样便可以利用因子分析的方法,抽取出能反映原始数据大部分信息的几个公共因子,从而既简化了研究,又达到了客观的分类的目的。