舆情监控系统介绍
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
舆情监控系统介绍
目录
舆情监控系统介绍 (1)
1. 系统简介 (3)
2. 功能架构 (3)
3. 功能介绍 (4)
3.1 信息采集 (4)
3.1.1 采集特性 (4)
3.1.2 采集任务 (4)
3.1.3 采集源管理 (5)
3.1.4 采集模板 (7)
3.1.5 参数设置 (8)
3.2 监控设置 (8)
3.2.1. 分类管理 (8)
3.2.2. 监控设置 (9)
3.3 信息管理 (11)
3.3.1. 简报管理 (11)
3.3.2. 信息管理 (11)
3.4 统计分析 (12)
3.4.1. 统计 (12)
3.4.2. 分析 (15)
3.5 门户管理 (15)
3.5.1. 用户管理 (15)
3.5.2. 门户管理 (16)
3.5.3. 访问统计 (17)
3.6 系统设置 (18)
3.6.1. 管理员管理 (18)
3.6.2. 数据管理 (18)
3.6.3. 数据设置 (19)
3.6.4. 系统设置 (19)
3.7 前台展示 (20)
3.7.1. 首页 (21)
3.7.2. 舆情汇总 (21)
3.7.3. 专题浏览 (23)
3.7.4. 热点舆情 (23)
3.7.5. 趋势分析 (23)
3.7.6. 舆情简报 (23)
3.7.7. 统计分析 (23)
3.7.8. 我的关注 (23)
3.7.9. 用户设置 (23)
1.系统简介
舆情监控系统集成了舆情采集、舆情监测、舆情智能分析、舆情处理、舆情预警、舆情搜索、舆情报告辅助生成、动态图表统计分析等核心功能。实现把互联网“读薄”,把“热点”读懂,大浪淘沙般萃取舆情,深度透析热点难点,掌握潜在的变化规律。实现“帮领导干部读网”,该系统在加强互联网信息监管,应对网络突发的公共事件,掌握社情民意方面,可向领导提供准确、有效的信息分析结果以供决策参考。
2.功能架构
3.功能介绍
3.1信息采集
3.1.1采集特性
✓可以多台服务器,多线程分布同时采集。
✓提供全网采集和定点采集。
✓对于有些论坛博客必须登陆才能采集时,系统在规则编写时可填写登陆账号密码登陆采集。
✓对同一链接数据发生变化时,系统可进行更新采集。
✓通过灵活方便的采集调度系统,支持全天24小时对数百上千个网站进行采集监控、分过滤。
✓支持图片、文档等多种媒体格式文件下载,并实现可自定义媒体格式。
✓界面化的规则定制工具,帮助系统更准确地配置采集抽取规则。
✓实时地采集监控与数据统计功能,帮助全面了解系统运行状态。
3.1.2采集任务
3.1.2.1启动/停止采集
启动/停止采集的主要功能是对采集状态进行实时监控,点击
按钮,系统爬虫会抓取系统当前配置的站点,并实时显示抓取状态信息。
3.1.2.2地址库管理
地址库主要是存储爬虫从各个站点获取的所有的地址,管理员可以通过地址库查看某个站点的采集情况,已获取的地址的状态有三种:正常采集,未采集,出错。
3.1.3采集源管理
3.1.3.1站点分类
站点分类主要作用是有效的管理站点,用户可以根据业务需要添加有意义的分类即可。
3.1.3.2更新策略
更新策略的主要作用是设置站点的采集地址扩展方式和站点采集数据更新时间方式,每个站点都必须对应一个更新策略,系统会根据更新策略来调度爬虫对各个站点的采集先后顺序。
扩展方式:站点对应上一个设置了扩展方式的更新策略后,以站点URL 为入口的地址获取需要以此扩展方式过滤地址,只有符合此扩展方式的地址才能存进地址库,爬虫才会解析其内容。
更新方式:站点对应上此更新策略后则按照此更新方式中设置的时间去更新已经采集过的站点。
3.1.3.3站点管理
舆情监控系统数据采集功能的核心配置在于站点管理的配置,一般可以整个网站首页作为站点入口,也可以某网站的栏目入口作为站点入口。此时不同的站点可以对应相同的数据采集模板。站点也可以添加只用于解析本站点的采集规则。新建站点后,可以对站点进行增加,修改,删除,查找及禁用和启用的操作。
3.1.3.4抓取测试
抓取测试主要是在进行站点配置过程中先用具体的地址进行测试规则配置的正确性,可以使用户更快速准确的找到配置的问题。
选择一个要测试的站点,输入一个地址,如地址匹配正确,点击测试后页面会直接显示数据采集结果,结果会显示页面中抽取的作者,日期,浏览数,评论数,正文等内容。如匹配错误,页面会有相应的提示。
3.1.3.5截图设置
截图设置的主要功能点是定时对自己配置的网站地址进行截图:
✓刷新纪录:刷新当前页面
✓新增设置:新增一个截图站点
✓删除选中的设置:删除截图站点
✓名称:新增的站点名称
✓url:需要截图的url地址
✓执行时间一:指定周期截图的每天截图时间
✓执行时间二:指定周期截图的每天截图时间
✓执行时间三:指定周期截图的每天截图时间
✓保留时间:图片在服务器上保存的天数
✓保存:保存当前设置
3.1.4采集模板
3.1.
4.1.采集分类管理
模板分类管理主要是管理模板资源库中的采集模板,添加一级分类,点击
添加二级分类,同理添加三级分类,最多可以添加3级。选中一级或二级分类,点击【查看子类】可以查看当前选择的分类的子类。
3.1.
4.2.采集模板管理
模板管理的主要功能是设置采集站点的模版,系统可以根据模板配置解析获取地址中指定的内容。
管理员可以对采集模板进行修改,删除,检索,导入,导出的操作。