网络舆情分析概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
舆情分析也称倾向性分析(Orientation Analysis)、观点分析(Opinion Analysis)或者统计调查,是借助于技术手段对大众就某一个(些)事物或者某一个(些)事务的看法进行了解。
传统的舆情分析,通常采用采样调查方式,也称为民意调查或者市场调查,被广泛地应用于选举预测、产品市场预研、市场评估等领域,更有专业的市场调查公司来提供这样的调查服务。采样调查的渠道包括电话采访、面对面采访、邮寄问答表格等。但这些做法都存在人力消耗大、采样数量偏少的问题,还有答卷及答题的可选项设计可能存在偏差,被调查者也由于各种原则隐匿个人真实想法等问题。所以,传统舆情分析的研究点在于如何设计问卷、如何确定样本量和样本选择方法等。
随着互联网各类应用中对用户生成内容功能的支持,尤其是互联网社交网络、博客、微博等信息发布平台的兴盛,个人表达自己观点的渠道日益畅通,手段日益便捷。更可贵的是,信息的流动不再是单方向的。报纸的信息流动是从报纸到读者,而在互联网应用中,可以方便地通过“评论”、“回复”等技术手段,使信息流动变成双向的,甚至评论和回复成为信息中的有机组成部分,进一步地丰富原有信息的内容。例如,在淘宝应用中,人们通常会将评论的内容作为对商品描述的一个补充。
因此,从互联网上主动地收集信息,用数据挖掘方法或者自然语言处理的方法来分析信息中用户的观点,成为当前舆情分析的一种非常重要和直接的手段,也就是“网络舆情分析”。
1、网络舆情分析简介
网络舆情分析用数据说话,跟踪网络舆情的起源和演变,最终是为了给出建议性结果,它渐渐成为政府、企业乃至个人都需要的舆情应对基础。网络舆情分析有2个工作重点:一是还原舆情发展过程,找到舆情产生的根源;二是预测,分析出网络舆情的未来走向,再根据预测结果提出应对方案。
网络舆情分析的主体是网络舆情分析师,对此,各界有多层次的解读。
网络舆情分析面临着与传统舆情分析完全不同的问题和研究难点。传统舆情的样本存在内容有效性较高但样本数量少的问题;在网络舆情分析中,则存在信息数量巨大但信息有效性差的问题。信息有效性差的原因有很多,首先是难以确定信息来源,其次信息中的观点大都是附带的,很多并非有意为之。但正因为如此,网络舆情分析具备传统舆情分析不可替代的优势:一是无答卷设计问题,信息中反映的观点较为真实;二是数据多,成本低廉,采样广泛,很大程度上弥补了信息来源不确定的问题,宏观上能更好地反映真实舆情。网络舆情分析还有一个特别的优势在于能长时间重复地进行舆情分析,对舆情趋势及其变化的把握更为及时。
由于网络舆情分析具备传统舆情分析所不具备的一些优势,因此,网络舆情系统理论上可以有更全面和细致的分析成果。但由于网络舆情系统的分析是基于在互联网中收集到的文本等信息,而同时自然语言处理技术在现阶段存在很大
的局限性,即机器并不能真正做到理解人的语言,网络舆情系统在现阶段还不能做到尽善尽美,因此,网络舆情系统的发展空间非常大。
网络舆情分析系统如图1所示,可以大体分为4个层次。图1简要列举了每一层可能具备的分析模块(更多的分析模块没有在图中列出)。信息采集层负责收集互联网上的信息(以文本为主,多媒体信息为辅),并将它们整理存储下来。趋势分析层实现对信息的进一步整理,识别话题(连续时间框架下有关某一主题的相关信息)的延续和传播,将信息组织为话题。根据信息传播的广度、发展时间的长短等数据判断热点,实现对热点的识别,并持续地进行跟踪、观察和统计。大数据分析层从大数据处理、互联网纵深角度,将多源数据进行融合,将零散的信息整合起来,从而能够得到一个更为全面的视图。语义分析层借助自然语言处理技术,对话题信息进行进一步的处理,得出信息发布者对话题的倾向性看法,抽取出信息发布者的观点,最终达成传统舆情分析所能够达到的分析深度。
图1 网络舆情系统基本模块
2、网络舆情分析市场需求
经过多年发展,网络舆情服务的市场已日趋成熟,并发展出多层次的业务需求。
由于近年来我国网络舆情危机事件多爆发在城管、维稳、拆迁、上访等领域,政府部门往往是危机事件的涉事主体,所以,政法舆情发展迅速。目前,敏感领域的政府部门多数都设置了网络舆情监测部门,或者设置专人进行网络舆情监测。
从服务内容来看,主要有以下几类:
(1)适时、动态的舆情预警服务,这类服务一般为全天候24 h不间断的舆情预警,一旦发现负面舆情,及时上报客户;
(2)基于网络舆情监测系统的智能分析,通过向客户提供智能分析系统满足舆情服务;
(3)针对日常性负面舆情或某一特定事件进行监测与趋势研判,主要体现在各类舆情报告中,如日报、周报、月报、专报;
(4)舆情修复,为客户策划访谈节目、设置网络专题,有针对性地解读舆情事件,引导舆论发展方向,降低舆情事件风险;
(5)为客户提供网络舆情管理师、分析师等专业培训,扩充专业舆情人才队伍;
(6)建立舆情研判指标体系,发布舆情榜单、报告,如网络舆论形象排行榜、政务微博排行榜、政务微博报告等。
3、网络舆情分析特征
(1)跨学科研究
在中国知网,以“网络舆情分析”为关键词进行检索,多篇文献来自情报学、新闻学、社会学、政治学领域。其中,情报学主要针对舆情抓取阶段,通过系统建模的方法,致力于早期发现网络舆情,包括层次分析法、网页挖掘、聚类、熵理论、文本挖掘等;新闻学主要涉及舆情传播阶段,探讨新媒体与传统媒体的发展以及传播影响力、媒体关系以及舆论引导等;社会学和政治学则多致力于寻求解决方案,对舆情事件进行深度剖析,观察个体事件乃至大形势对参政议政以及社会阶层变动的影响。
这一跨学科特征也在“网络舆情分析师”招聘信息中得以充分体现,综合多个招聘网站,专业要求多为具有政治学、社会学、经济学、统计学、新闻传播学、公共管理学等多学科知识与跨学科视野。
(2)技术与文字的关系
从网络舆情分析发展历史来看,技术应用经历了2个阶段:人工搜索阶段和引入舆情监测软件阶段。早期网络舆情分析服务于特定对象(多为政府特殊部门或高层),搜索引擎数据更多被看作选题是否热门的一个重要指标,在搜索之外,则依赖于分析师自身业务素养,尤其对话题重要性、敏感性的判断,以及对重要舆论观点的抓取、提炼和升华,综合研判出重大事件的舆论动向。
近年来,随着技术的发展,涌现出大量舆情监测软件,更有不少是基于大数据和云计算技术,给网络舆情分析带来了有力的工具。据统计,中国网民每天发布和转发微博信息达2.5亿条,每天发送微信等即时通信工具信息超过200亿条。根据对新浪微博和腾讯微信等7家网站所发帖文的统计,在网民关注的20大热点事件中,前12位的帖文都超过了200万条,其中,排第一位的帖文数量