大数据时代如何运用指数分析舆情(共 57张PPT)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
来源
政府网站 新闻媒体
权威度
高 高 低
准确度
高 高 低
参与度
低 中 高
针对性
低 中 中
社交平台 网络媒体 主动报送
中
中
中
中
中
高
中
高
2.5
网络舆情传播的特点
1
跨时空性:信息突破了空间的限制,实现了信息的跨时空传播
2
3 4
群体极化性:信息的倾向性对受众的思想形成一定的支配性,形成群体极化
强制互动性:信息由单向传播变成双向互动,公众由接受者变为参与者和生产者
3.2
网络舆情指数体系构建的基本原则
可行性
目标性
系统性
稳wk.baidu.com性
明确性 全面性
动态性
科学性
3.3
互联网大数据挖掘技术
数据库理论
机器学习
人工智能
现代统计学
3.3
互联网大数据挖掘技术
统计技术:对给定数据集合假设一个分布或者概率模型 关联规则:目的是找出数据库中隐藏的关联网
连接分析:从一些用户的行为中分析出一些模式, 同时将产生的概念应用于更广的用户群体中
舆 情 影 响
启动舆情监测 制定应急预案 制定保障方案 实施信息公开
专家网上答疑 关注意见领袖 网民互动交流 事件初步解决 公开进展信息 引导舆情过渡 事件经验总结 监测衍生舆情
危险
不安全 隐患 正常 良好
萌芽
扩散
爆发
波动消退
经历时期
表2.3:政府应对舆情模型
3
舆情指数
3.1
网络舆情指数的概念
舆情指数是通过对网络中各种类型媒体所发布的信息进行独立的第三方观察,形成量 化统计和定性分析,并结合算法推导、归纳总结而最终形成的一套网络舆情指数体系。
是不确定、不准确的信息
着重在了解是“什么”而不是“为什么”
《大数据时代》 维克托· 迈尔· 舍恩伯格
1.1
大数据的概念
大数据本身不是一种新的产品或新的技术
大数据的出现只是数字化时代数据量不断增加的一种现象
1.1
大数据的概念
B
GB MB
海量数据
TB
PB
ZB
大数据
EB
1.1
大数据的概念
1.2
大数据的发展进程
广义的舆情,就是指民众的全部生活状况、社会环境和民众的主观 意愿,也就是通常所说的“社情民意”。
2.2
网络舆情的概念
事件 传播互动 影响力 网络 情感互动 网民
网络舆情是社会舆情的一种表现 形式,指在一定的网络空间中, 各种社会群体对自己关心或与自 身利益相关的热点事件或事物所 表现出来的具有一定影响力并带
2016
大数据时代 如何运用指数分析舆情
韩少卿、王闯 郑州大学
CONTENTS
目录
网络大数据 网络舆情 舆情指数
案例分析 研究与反思
1
网络大数据
1.1
大数据的概念
感知数据
1
2 3
人类原创数据
运营数据
人类社会数据生产方式
1.1
大数据的概念
世界知名的咨询公司麦肯锡最早提出了“大数据” 的概念,麦肯锡认为大数据是指无法在一定时间 内用传统数据库软件工具对其内容进行采集、存 储、管理和分析的数据集合。
有倾向性的认知、情绪、态度和
意见的总和。
2.3
网络舆情的特点
广泛性
参与人员类型广泛 涉及地域范围广泛
01
主观性与非理性
02
社会情绪的原生态表达 网络谣言与负面情绪扩散
突发性
基于网络双向传播 社会舆论导火索
03
多元性
04
信息内容多元
传播途径与表达方式多元 意识形态与观点内容多元
2.4
网络舆情的信息来源 网络舆情信息来源指标特点
决策树:一种预测模型,是直观运用概率分析的一种图解法
人工神经网络:是一种模仿动物神经网络行为特征, 进行分布式并行信息处理的算法数学模型
差别分析:目的是发现数据中的异常情况,从而获得有用信息 概念描述:对某类对象的内涵进行描述,并概括其有关特征
3.4
网络舆情监测指数体系(兰月新)
传播扩散
指数一
1
指数 体系
在合理时间内达到截取、管理、处理、并整理成
为人类所能解读的信息。
1.1
大数据的概念
传媒专家刘建明教授认为:“大数据”同信息是不
可分离的,是指信息浩大数量的统计与技术运作。 作为人类认知社会方法的一次飞跃,“大数据”技
术将给企业运营、政府管理和媒体传播的科学化
创造有效机制。
1.1
大数据的概念
“大数据”不是部分,而是全部数据
指数四
舆情受众
4
指数二
1 2 3
大数据=传统的小数据+现代的大记录
大数据=结构化数据+非结构化数据 大数据=大价值+大容量
1.4
大数据如何产生 托马斯· H· 达文波特:大数据之所以产生,是因为传感
微博
器和微型计算机处理器在人们日常生活中无处不在。
LB S
物联网
云 计算
10:02
1.4
大数据如何产生
1.5
网络大数据
大量交互数据被记录和保存,数据 规模从TB到PB数量级
Variety(流动速度快)
数据自身的状态与价值随着 时空变化而不断发生演变
Velocity(数据类型繁多)
结构化数据、半结构化数据 和非结构化数据
Value(价值巨大但密度低)
数据的价值没有随数据量的指数 增长呈现出同比例上升
1.3
大数据的特点
1.1
大数据的概念
研究机构 Gartner 将大数据定义为:需要新处 理模式才能具有更强的决策力、洞察发现力和流 程优化能力的海量、高增长率和多样化的信息资 产。
1.1
大数据的概念
维基百科对“大数据”的解读是:“大数据”(Big
data),或称巨量数据、海量数据、大资料, 指的是所涉及的数据量规模巨大到无法通过人工,
及时性:即时编辑、及时发布、即时传播、即时互动、及时反馈
2.6
网络舆情的演变过程
舆 情 影 响
萌芽
扩散
爆发
波动消退
经历时期
表2.1:网络舆情演变模型
2.7
网络舆情的演变过程
舆 情 影 响
危险
不安全 隐患 正常 良好
萌芽 扩散 爆发 波动消退 经历时期
表2.2:网络舆情预警模型
2.7
网络舆情的演变过程
1966年
摩尔定律提出,为大数据 现象的形成奠定物理基础
1989年
数据挖掘技术产生, 大数据有了大价值
2004年
社交媒体出现, 全世界每个 人都变成了潜在数据生成器
01 02 03
1.3
大数据的特点
4 个 V: Volume、Velocity、Variety、Value
Volume(数据体量巨大)
2
Facebook
1
Google
网络舆情的大数据时代来临
微信 月活8亿
10亿照片 300TB
3
400PB
百度云 5000国图
4 5
每个人 1天200G
2
网络舆情
2.1
舆情的概念
舆情指在一定的社会空间内, 围绕中介性社会事项的发生、发展和变化, 作为舆情主体的民众对国家管理者产生和持有的社会政治态度。
政府网站 新闻媒体
权威度
高 高 低
准确度
高 高 低
参与度
低 中 高
针对性
低 中 中
社交平台 网络媒体 主动报送
中
中
中
中
中
高
中
高
2.5
网络舆情传播的特点
1
跨时空性:信息突破了空间的限制,实现了信息的跨时空传播
2
3 4
群体极化性:信息的倾向性对受众的思想形成一定的支配性,形成群体极化
强制互动性:信息由单向传播变成双向互动,公众由接受者变为参与者和生产者
3.2
网络舆情指数体系构建的基本原则
可行性
目标性
系统性
稳wk.baidu.com性
明确性 全面性
动态性
科学性
3.3
互联网大数据挖掘技术
数据库理论
机器学习
人工智能
现代统计学
3.3
互联网大数据挖掘技术
统计技术:对给定数据集合假设一个分布或者概率模型 关联规则:目的是找出数据库中隐藏的关联网
连接分析:从一些用户的行为中分析出一些模式, 同时将产生的概念应用于更广的用户群体中
舆 情 影 响
启动舆情监测 制定应急预案 制定保障方案 实施信息公开
专家网上答疑 关注意见领袖 网民互动交流 事件初步解决 公开进展信息 引导舆情过渡 事件经验总结 监测衍生舆情
危险
不安全 隐患 正常 良好
萌芽
扩散
爆发
波动消退
经历时期
表2.3:政府应对舆情模型
3
舆情指数
3.1
网络舆情指数的概念
舆情指数是通过对网络中各种类型媒体所发布的信息进行独立的第三方观察,形成量 化统计和定性分析,并结合算法推导、归纳总结而最终形成的一套网络舆情指数体系。
是不确定、不准确的信息
着重在了解是“什么”而不是“为什么”
《大数据时代》 维克托· 迈尔· 舍恩伯格
1.1
大数据的概念
大数据本身不是一种新的产品或新的技术
大数据的出现只是数字化时代数据量不断增加的一种现象
1.1
大数据的概念
B
GB MB
海量数据
TB
PB
ZB
大数据
EB
1.1
大数据的概念
1.2
大数据的发展进程
广义的舆情,就是指民众的全部生活状况、社会环境和民众的主观 意愿,也就是通常所说的“社情民意”。
2.2
网络舆情的概念
事件 传播互动 影响力 网络 情感互动 网民
网络舆情是社会舆情的一种表现 形式,指在一定的网络空间中, 各种社会群体对自己关心或与自 身利益相关的热点事件或事物所 表现出来的具有一定影响力并带
2016
大数据时代 如何运用指数分析舆情
韩少卿、王闯 郑州大学
CONTENTS
目录
网络大数据 网络舆情 舆情指数
案例分析 研究与反思
1
网络大数据
1.1
大数据的概念
感知数据
1
2 3
人类原创数据
运营数据
人类社会数据生产方式
1.1
大数据的概念
世界知名的咨询公司麦肯锡最早提出了“大数据” 的概念,麦肯锡认为大数据是指无法在一定时间 内用传统数据库软件工具对其内容进行采集、存 储、管理和分析的数据集合。
有倾向性的认知、情绪、态度和
意见的总和。
2.3
网络舆情的特点
广泛性
参与人员类型广泛 涉及地域范围广泛
01
主观性与非理性
02
社会情绪的原生态表达 网络谣言与负面情绪扩散
突发性
基于网络双向传播 社会舆论导火索
03
多元性
04
信息内容多元
传播途径与表达方式多元 意识形态与观点内容多元
2.4
网络舆情的信息来源 网络舆情信息来源指标特点
决策树:一种预测模型,是直观运用概率分析的一种图解法
人工神经网络:是一种模仿动物神经网络行为特征, 进行分布式并行信息处理的算法数学模型
差别分析:目的是发现数据中的异常情况,从而获得有用信息 概念描述:对某类对象的内涵进行描述,并概括其有关特征
3.4
网络舆情监测指数体系(兰月新)
传播扩散
指数一
1
指数 体系
在合理时间内达到截取、管理、处理、并整理成
为人类所能解读的信息。
1.1
大数据的概念
传媒专家刘建明教授认为:“大数据”同信息是不
可分离的,是指信息浩大数量的统计与技术运作。 作为人类认知社会方法的一次飞跃,“大数据”技
术将给企业运营、政府管理和媒体传播的科学化
创造有效机制。
1.1
大数据的概念
“大数据”不是部分,而是全部数据
指数四
舆情受众
4
指数二
1 2 3
大数据=传统的小数据+现代的大记录
大数据=结构化数据+非结构化数据 大数据=大价值+大容量
1.4
大数据如何产生 托马斯· H· 达文波特:大数据之所以产生,是因为传感
微博
器和微型计算机处理器在人们日常生活中无处不在。
LB S
物联网
云 计算
10:02
1.4
大数据如何产生
1.5
网络大数据
大量交互数据被记录和保存,数据 规模从TB到PB数量级
Variety(流动速度快)
数据自身的状态与价值随着 时空变化而不断发生演变
Velocity(数据类型繁多)
结构化数据、半结构化数据 和非结构化数据
Value(价值巨大但密度低)
数据的价值没有随数据量的指数 增长呈现出同比例上升
1.3
大数据的特点
1.1
大数据的概念
研究机构 Gartner 将大数据定义为:需要新处 理模式才能具有更强的决策力、洞察发现力和流 程优化能力的海量、高增长率和多样化的信息资 产。
1.1
大数据的概念
维基百科对“大数据”的解读是:“大数据”(Big
data),或称巨量数据、海量数据、大资料, 指的是所涉及的数据量规模巨大到无法通过人工,
及时性:即时编辑、及时发布、即时传播、即时互动、及时反馈
2.6
网络舆情的演变过程
舆 情 影 响
萌芽
扩散
爆发
波动消退
经历时期
表2.1:网络舆情演变模型
2.7
网络舆情的演变过程
舆 情 影 响
危险
不安全 隐患 正常 良好
萌芽 扩散 爆发 波动消退 经历时期
表2.2:网络舆情预警模型
2.7
网络舆情的演变过程
1966年
摩尔定律提出,为大数据 现象的形成奠定物理基础
1989年
数据挖掘技术产生, 大数据有了大价值
2004年
社交媒体出现, 全世界每个 人都变成了潜在数据生成器
01 02 03
1.3
大数据的特点
4 个 V: Volume、Velocity、Variety、Value
Volume(数据体量巨大)
2
1
网络舆情的大数据时代来临
微信 月活8亿
10亿照片 300TB
3
400PB
百度云 5000国图
4 5
每个人 1天200G
2
网络舆情
2.1
舆情的概念
舆情指在一定的社会空间内, 围绕中介性社会事项的发生、发展和变化, 作为舆情主体的民众对国家管理者产生和持有的社会政治态度。