舆情监测系统建设方案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.热点人名
系统自动抽取文章中的人名,并按该人名出现的文章次数进行统计,可查看热点人名的传播趋势。可按日期查询热点词语。
4.热点地名
系统自动抽取文章中的地名,并按该地名出现的文章次数进行统计,可查看热点地名的传播趋势。可按日期查询热点地名。
5.热点机构
系统自动抽取文章中的机构名,并按该机构名出现的文章次数进行统计,可ቤተ መጻሕፍቲ ባይዱ看热点机构的传播趋势。可按日期查询热点机构。
12)舆情报警系统:对突发事件、涉及内容安全的敏感话题及时发现并报警,系统提供多种报警方式。
2)完善的信息预处理机制:超链分析,编码识别,URL去重,锚文本处理,垃圾信息过滤,内容去重,关键字抽取,正文抽取等。
3)强大的索引分词机制,对舆情信息实施双重过滤,具有自动分类、自动聚类、相似性排重功能,系统能够自动完成热点发现。
4)热点舆情:系统自动识别出热点焦点事件,以舆情形式分新闻、论坛和博客三种类别呈现。及时发现网络热点信息。
对热点问题和重要领域实施监控,前提是必须通过人机交互建立舆情监测的知识库,用来指导智能分析的过程。对热点问题的智能分析,首先基于传统基于向量空间的特征分析技术上,对抓取的内容做分类、聚类和摘要分析,对信息完成初步的再组织。然后在监控知识库的指导下进行基于舆情的语义分析、倾向性分析,使管理者看到的民情民意更有效,更符合现实。最后将监控的结果,分别推送到不同的职能部门,供制定对策使用。
二、需求分析
由于互联网有越来越多的网民乐意通过BBS论坛、博客、新闻跟贴/转贴等渠道来表达观点传播思想。如果引导不善,负面网络舆情将对社会公共安全形成威胁。对我们电业局来说,加强对网络舆论的及时监测、有效引导,以及对网络舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。
通过对网页、论坛、博客、新闻评论信息的深度搜索和挖掘,实时对突发公共卫生事件的媒体报道和公众舆论信息进行汇聚和统计分析,使市电业局应急办人员能够及时了解社会公众的声音,每天自动生成舆情监测专报,上报相关领导,为领导决策提供准确、全面的信息。
三、建设方案
1.
自动24小时采集网络媒体发布的网络新闻、BBS论坛信息、博客内容信息,舆情采集用户只需输入一个待采集的目标网址即可实现图文结合采集到本地。网页采集模块在互联网上不断采集新闻信息,并对这些信息统一加工过滤、自动分类,保存新闻的标题、出处、发布时间、正文、新闻相关图片等信息,对下载本地的信息,进行初步的过滤和预处理,减少智能分析的工作量。
3.
自动对每天采集的海量的、无类别的舆情进行归类,把内容相近的文档归为一类,并自动为该类生成主题词。可支持自动生成新闻专题、重大新闻事件追踪、情报的可视化分析等诸多应用。
4.
1.热点专题统计
热点专题总体分布、重点预警事件总分布、各类重点预警事件分布。
2.站点统计
可统计各采集站点的采集文章数、统计各论坛站点的采集文章数。
互联网舆情监控
系统
一、
根据中国互联网络信息中心(CNNIC)的统计,截至2011年12月底,中国网民规模达到5.13亿,互联网普及率攀升至43.3%,其中20岁以上网民占80%。随着因特网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”网络成为反映社会舆情的主要载体之一。网络环境下的舆情信息的主要来源有:新闻评论、BBS、博客、聚合新闻(RSS)。网络舆情表达快捷、信息多元,方式互动,具备传统媒体无法比拟的优势。
2.
对重要的热点新闻信息进行分析和追踪,对于突发事件引起的网络舆情,可以及时掌握舆情爆发点和事态。系统会根据新闻文章数及文章在各大网站和社区的传播链进行自动跟踪统计,提供不同时间段(1天、3天、7天、10天)的热点新闻。对每条热点新闻还可以查看新闻相关传播链,了解在某一时间段该热点新闻在哪些站点的传播数量。同样也提供热点帖子、热点专题等功能。
网络的开放性和虚拟性,决定了网络舆情具有以下特点:1、直接性,通过BBS,新闻点评和博客网站,网民可以立即发表意见,下情直接上达,民意表达更加畅通;2、突发性,网络舆论的形成往往非常迅速,一个热点事件的存在加上一种情绪化的意见,就可以成为点燃一片舆论的导火索;3、偏差性,由于发言者身份隐蔽,并且缺少规则限制和有效监督,网络自然成为一些网民发泄情绪的空间。在现实生活中遇到挫折,对社会问题片面认识等等,都会利用网络得以宣泄。因此在网络上更容易出现庸俗、灰色的言论。
8)突发事件分析:对突发事件进行预警,跨时间、跨空间综合分析,获知事件发生全貌。
9)多种舆情检索方式:可按网站、类别、时间段、关键词等条件进行专项化全文检索,并可生成查询时间和次数、关键词查询频率等查询统计数据。另外还将结合检索关键词,随时补充全文检索库中的关键词,有机结合个人操作习惯,可在检索结果中进行二次检索。
6.热点词语
系统自动抽取文章中的热点词语,并按该词语出现的文章次数进行统计,可查看热点词语的传播趋势。可按日期查询热点词语。
5.
根据配置的关键词信息,自动定时生成要求格式的舆情专报,提供给领导进行参考。
四、系统功能
1)深度多渠道网络信息采集,为用户提供监控源配置功能,可以对监控源的优先级进行配置调整。
5)专题追踪:生成专题报道对网络话题进行专题化的侦测和追踪,如两会、奥运会,对专题话题形成系统性的掌握和监控。
6)分站/分类浏览:对系统中舆情可以按网站和不同的分类进行浏览。同时可以对显示的舆情进行操作(设置影响、入简报、专题、收藏、删除)。
7)趋势分析:来源载体/站点分布、单个/多个关键词热度曲线图、主题/关键词热度的整体趋势、文章转载量日均/总体趋势分析、舆情信息的地域分布、网民检索行为分析。
10)舆情统计报告:根据舆情分析引擎处理后生成报告,用户可通过浏览器浏览,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。
11)统计报表:系统生成各种形式的报表。报表包括图表和数据表格,图表包括饼图、折线图、直方图等,如总量图、趋势图等;数据表格是对舆情信息的数理统计,以数字的形式记录各项舆情数据。另外用户可以自己需求定制报表模版,比如日报、周报、月报等。
系统自动抽取文章中的人名,并按该人名出现的文章次数进行统计,可查看热点人名的传播趋势。可按日期查询热点词语。
4.热点地名
系统自动抽取文章中的地名,并按该地名出现的文章次数进行统计,可查看热点地名的传播趋势。可按日期查询热点地名。
5.热点机构
系统自动抽取文章中的机构名,并按该机构名出现的文章次数进行统计,可ቤተ መጻሕፍቲ ባይዱ看热点机构的传播趋势。可按日期查询热点机构。
12)舆情报警系统:对突发事件、涉及内容安全的敏感话题及时发现并报警,系统提供多种报警方式。
2)完善的信息预处理机制:超链分析,编码识别,URL去重,锚文本处理,垃圾信息过滤,内容去重,关键字抽取,正文抽取等。
3)强大的索引分词机制,对舆情信息实施双重过滤,具有自动分类、自动聚类、相似性排重功能,系统能够自动完成热点发现。
4)热点舆情:系统自动识别出热点焦点事件,以舆情形式分新闻、论坛和博客三种类别呈现。及时发现网络热点信息。
对热点问题和重要领域实施监控,前提是必须通过人机交互建立舆情监测的知识库,用来指导智能分析的过程。对热点问题的智能分析,首先基于传统基于向量空间的特征分析技术上,对抓取的内容做分类、聚类和摘要分析,对信息完成初步的再组织。然后在监控知识库的指导下进行基于舆情的语义分析、倾向性分析,使管理者看到的民情民意更有效,更符合现实。最后将监控的结果,分别推送到不同的职能部门,供制定对策使用。
二、需求分析
由于互联网有越来越多的网民乐意通过BBS论坛、博客、新闻跟贴/转贴等渠道来表达观点传播思想。如果引导不善,负面网络舆情将对社会公共安全形成威胁。对我们电业局来说,加强对网络舆论的及时监测、有效引导,以及对网络舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。
通过对网页、论坛、博客、新闻评论信息的深度搜索和挖掘,实时对突发公共卫生事件的媒体报道和公众舆论信息进行汇聚和统计分析,使市电业局应急办人员能够及时了解社会公众的声音,每天自动生成舆情监测专报,上报相关领导,为领导决策提供准确、全面的信息。
三、建设方案
1.
自动24小时采集网络媒体发布的网络新闻、BBS论坛信息、博客内容信息,舆情采集用户只需输入一个待采集的目标网址即可实现图文结合采集到本地。网页采集模块在互联网上不断采集新闻信息,并对这些信息统一加工过滤、自动分类,保存新闻的标题、出处、发布时间、正文、新闻相关图片等信息,对下载本地的信息,进行初步的过滤和预处理,减少智能分析的工作量。
3.
自动对每天采集的海量的、无类别的舆情进行归类,把内容相近的文档归为一类,并自动为该类生成主题词。可支持自动生成新闻专题、重大新闻事件追踪、情报的可视化分析等诸多应用。
4.
1.热点专题统计
热点专题总体分布、重点预警事件总分布、各类重点预警事件分布。
2.站点统计
可统计各采集站点的采集文章数、统计各论坛站点的采集文章数。
互联网舆情监控
系统
一、
根据中国互联网络信息中心(CNNIC)的统计,截至2011年12月底,中国网民规模达到5.13亿,互联网普及率攀升至43.3%,其中20岁以上网民占80%。随着因特网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”网络成为反映社会舆情的主要载体之一。网络环境下的舆情信息的主要来源有:新闻评论、BBS、博客、聚合新闻(RSS)。网络舆情表达快捷、信息多元,方式互动,具备传统媒体无法比拟的优势。
2.
对重要的热点新闻信息进行分析和追踪,对于突发事件引起的网络舆情,可以及时掌握舆情爆发点和事态。系统会根据新闻文章数及文章在各大网站和社区的传播链进行自动跟踪统计,提供不同时间段(1天、3天、7天、10天)的热点新闻。对每条热点新闻还可以查看新闻相关传播链,了解在某一时间段该热点新闻在哪些站点的传播数量。同样也提供热点帖子、热点专题等功能。
网络的开放性和虚拟性,决定了网络舆情具有以下特点:1、直接性,通过BBS,新闻点评和博客网站,网民可以立即发表意见,下情直接上达,民意表达更加畅通;2、突发性,网络舆论的形成往往非常迅速,一个热点事件的存在加上一种情绪化的意见,就可以成为点燃一片舆论的导火索;3、偏差性,由于发言者身份隐蔽,并且缺少规则限制和有效监督,网络自然成为一些网民发泄情绪的空间。在现实生活中遇到挫折,对社会问题片面认识等等,都会利用网络得以宣泄。因此在网络上更容易出现庸俗、灰色的言论。
8)突发事件分析:对突发事件进行预警,跨时间、跨空间综合分析,获知事件发生全貌。
9)多种舆情检索方式:可按网站、类别、时间段、关键词等条件进行专项化全文检索,并可生成查询时间和次数、关键词查询频率等查询统计数据。另外还将结合检索关键词,随时补充全文检索库中的关键词,有机结合个人操作习惯,可在检索结果中进行二次检索。
6.热点词语
系统自动抽取文章中的热点词语,并按该词语出现的文章次数进行统计,可查看热点词语的传播趋势。可按日期查询热点词语。
5.
根据配置的关键词信息,自动定时生成要求格式的舆情专报,提供给领导进行参考。
四、系统功能
1)深度多渠道网络信息采集,为用户提供监控源配置功能,可以对监控源的优先级进行配置调整。
5)专题追踪:生成专题报道对网络话题进行专题化的侦测和追踪,如两会、奥运会,对专题话题形成系统性的掌握和监控。
6)分站/分类浏览:对系统中舆情可以按网站和不同的分类进行浏览。同时可以对显示的舆情进行操作(设置影响、入简报、专题、收藏、删除)。
7)趋势分析:来源载体/站点分布、单个/多个关键词热度曲线图、主题/关键词热度的整体趋势、文章转载量日均/总体趋势分析、舆情信息的地域分布、网民检索行为分析。
10)舆情统计报告:根据舆情分析引擎处理后生成报告,用户可通过浏览器浏览,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。
11)统计报表:系统生成各种形式的报表。报表包括图表和数据表格,图表包括饼图、折线图、直方图等,如总量图、趋势图等;数据表格是对舆情信息的数理统计,以数字的形式记录各项舆情数据。另外用户可以自己需求定制报表模版,比如日报、周报、月报等。