培训材料5定量数据分析方法.pptx
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
餐
X4 购物时我尽力拿到最好 的价钱
X5 我不关心购物 X6 货比三家可以使你省许
多钱
▪ 类中心
第一类 第二类 第三类 X1 5.75 1.67 3.50 X2 3.62 3.00 5.83 X3 6.00 1.83 3.33 X4 3.13 3.50 6.00 X5 1.75 5.50 3.50 X6 3.87 3.33 6.00
• 2个独立样本均值差异检验 • 相关样本均值差异检验 • 与交叉表相关的假设检验 • 比率的差异检验 • 相关系数的检验
▪ 正确理解假设检验
10
为何需要假设检验
▪ 广告运动是否达到了预定的效果? ▪ 观众更喜欢哪个电视广告? ▪ 新产品是否优于老产品? ▪ 某品牌在2个不同地区的市场占有率有差别吗? ▪ 洗衣机品牌的选择与家庭月收入有关吗? ▪ 购买意向与产品独特性有关吗?
▪ 集中趋势度量
• 平均数 • 中数 • 众数
▪ 离中趋势度量
• 全距 • 四分差 • 方差与标准差
▪ 变量之间关系的描述
• 积差相关 • 交叉表(列联表,Cross-Tabulation, Contingency Table)
9
假设检验
▪ 为何需要假设检验 ▪ 假设检验的基本步骤 ▪ 市场研究中最常见的假设检验问题
21
回归分析应用
▪ 问题:哪些因素影响产 品使用?
▪ 因变量:产品使用 Y
▪ 自变量:
X1 送货速度 X2 价格 X3 价格弹性 X4 制造商形象 X5 服务 X6 销售人员形象 X7 产品质量
▪ 回归方程 Y= -6.52+3.38X3+ 7.62X5+1.41X6
▪ 或变量标准化后 Y= .52X3+.647X5+.12X6
4
7%
3
5%
2
5%
1
4%
21% 20% 21% 19%
16
?
数据排序
原始数据
A
25
B
12
C
14
D1
E1
F
19
G
3
H
5
I1
J2
K
12
L
9
17
排序后数据
A
25
F
19
C
14
B
12
K
12
L
9
H
5
百度文库
G
3
J2
D1
E1
I1
数据对角排列
原始数据
10-14 15-19 20-24 25-29
A动机 0.2 0.3 0.1 -0.2 B动机 -0.3 0.0 0.0 0.2 C动机 0.3 0.0 0.0 -0.1 D动机 -0.1 0.2 0.1 -0.1 E动机 -0.3 -0.1 0.2 0.1 F动机 -0.3 0.0 -0.1 0.2
▪ R2=0.761
22
因子分析应用
▪ 问题:确定影响产品购 买的潜在消费者利益
▪ 变量(测量指标) 7分量表
X1 防止蛀牙 X2 牙齿洁白 X3 坚固牙龈 X4 清新口气 X5 防止牙齿老化 X6 使牙齿漂亮 X7 使牙齿坚固
▪ 因子载荷阵
因子1 因子2
X1 0.86 0.04
X2 0.09 0.89
7
理解数据的性质:变量的4个水平
▪ 命名变量:数值无大小
• 性别,职业,商店类型
▪ 顺序变量:数值有大小但不等间距
• 偏好排序,社会阶层
▪ 等距变量:数值有大小且等间距但无绝对零点
• 态度量表
▪ 比率变量:数值有大小,等间距并有绝对零点
• 收入,年龄,销量
8
描述统计
▪ 数据的分布
• 次数分布 (Frequency Distribution)
4
数据的编辑与清理
▪ 数据的完整性 ▪ 数据的合法性 ▪ 数据的一致性 ▪ 极端数值 ▪ 缺失值处理
5
数据的调整
▪ 数据加权:使样本数据有效代表研究的总体 ▪ 变量的重新赋值:使数据含义更加明确或缩减
数据 ▪ 变量转换:使变量适合统计方法 ▪ 变量组合:产生新的变量
6
基本统计方法
▪ 理解数据的性质 ▪ 描述统计基础 ▪ 假设检验简介
合理使用图形
C
C
10%
15%
B
A
30%
40%
B
50%
A
55%
19
C 10%
15%
50%
30%
B
55% A 40%
合理使用图形
% 100
80 60 40 20
0
阿尔卑斯
20
品牌知名度
大白兔
第一提及率
喔喔
无提示
提示
真味
多元统计方法简介
常用方法
▪ 回归分析:表达因变量
于自变量之间的关系
▪ 因子分析:以较少的潜
在维度解释众多变量之间 的相关关系
▪ 聚类分析:将研究对象
分为同质的一些类
▪ 多维标度法:以空间方
式表达认知
▪ 对应分析:Perceptual
Mapping 的另一种方法
典型的应用
▪ 预测,比较营销中的各 因素对于销售量影响的 重要性
▪ 理解消费动机和品牌选 择的影响因素
▪ 市场细分 ▪ 品牌形象与定位
X3 0.83 0.11
X4 0.11 0.89
X5 0.85 0.07
X6 0.13 0.88
X7 0.86 0.21
▪ 相关统计量
特征值 累积贡献率
因子1 3.38
48%
因子2 1.96
76%
23
聚类分析应用
▪ 问题:根据购物态度细 分消费者群体
▪ 变量 (7分量表)
X1 购物很好顽 X2 购物使人经济拮据 X3 我购物的同时会在外就
18
对角化之后
10-14 15-19 20-24 25-29
C动机 0.3 0.0 0.0 -0.1 A动机 0.2 0.3 0.1 -0.2 D动机 -0.1 0.2 0.1 -0.1 E动机 -0.3 -0.1 0.2 0.1 B动机 -0.3 0.0 0.0 0.2 F动机 -0.3 0.0 -0.1 0.2
13
数据的有效表达与释义
▪ 减少数据中的“噪音”,清晰表达数据之间的 关系
• 缩减小数位 • 去除冗余数据 • 合并数据 • 排序 • 对角排列数据
▪ 合理使用图形
14
去除冗余数据
20%
NO
30%
50%
80%
YES
70%
50%
A
B
C
15
80% 70%
50%
A
B
C
合并数据
喜欢程度
9 1%
8
7
6
5
定量数据分析方法
1
本讲将讲述:
▪ 定量数据分析的基本程序 ▪ 数据分析的准备工作 ▪ 基本统计方法 ▪ 数据的有效表达和释义 ▪ 研究报告的基本原则与格式 ▪ 口头报告的基本原则与技巧
2
定量数据分析的三个步骤
▪ 数据分析的准备 ▪ 数据的统计计算 ▪ 数据的表达与释义
3
数据分析的准备
▪ 编码:对开放问题答案进行分类并赋值 ▪ 数据编辑与清理:使数据干净起来 ▪ 数据调整:使数据(更)适合统计与分析
11
假设检验的基本步骤
1. 设定零假设H0和备择假设H1 2. 选择合适的检验方法和与之对应的检验统计量 3. 设定显著水平a,并查表找出对应统计量的数值(临
界值) 4. 计算检验统计量 5. 比较计算所得的统计量与临界值:
▪ 若大于,则拒绝H0, ▪ 否则,不拒绝H0
12
正确理解假设检验
▪ 差异不显著≠没有差异 ▪ 差异显著≠差异有实际意义
X4 购物时我尽力拿到最好 的价钱
X5 我不关心购物 X6 货比三家可以使你省许
多钱
▪ 类中心
第一类 第二类 第三类 X1 5.75 1.67 3.50 X2 3.62 3.00 5.83 X3 6.00 1.83 3.33 X4 3.13 3.50 6.00 X5 1.75 5.50 3.50 X6 3.87 3.33 6.00
• 2个独立样本均值差异检验 • 相关样本均值差异检验 • 与交叉表相关的假设检验 • 比率的差异检验 • 相关系数的检验
▪ 正确理解假设检验
10
为何需要假设检验
▪ 广告运动是否达到了预定的效果? ▪ 观众更喜欢哪个电视广告? ▪ 新产品是否优于老产品? ▪ 某品牌在2个不同地区的市场占有率有差别吗? ▪ 洗衣机品牌的选择与家庭月收入有关吗? ▪ 购买意向与产品独特性有关吗?
▪ 集中趋势度量
• 平均数 • 中数 • 众数
▪ 离中趋势度量
• 全距 • 四分差 • 方差与标准差
▪ 变量之间关系的描述
• 积差相关 • 交叉表(列联表,Cross-Tabulation, Contingency Table)
9
假设检验
▪ 为何需要假设检验 ▪ 假设检验的基本步骤 ▪ 市场研究中最常见的假设检验问题
21
回归分析应用
▪ 问题:哪些因素影响产 品使用?
▪ 因变量:产品使用 Y
▪ 自变量:
X1 送货速度 X2 价格 X3 价格弹性 X4 制造商形象 X5 服务 X6 销售人员形象 X7 产品质量
▪ 回归方程 Y= -6.52+3.38X3+ 7.62X5+1.41X6
▪ 或变量标准化后 Y= .52X3+.647X5+.12X6
4
7%
3
5%
2
5%
1
4%
21% 20% 21% 19%
16
?
数据排序
原始数据
A
25
B
12
C
14
D1
E1
F
19
G
3
H
5
I1
J2
K
12
L
9
17
排序后数据
A
25
F
19
C
14
B
12
K
12
L
9
H
5
百度文库
G
3
J2
D1
E1
I1
数据对角排列
原始数据
10-14 15-19 20-24 25-29
A动机 0.2 0.3 0.1 -0.2 B动机 -0.3 0.0 0.0 0.2 C动机 0.3 0.0 0.0 -0.1 D动机 -0.1 0.2 0.1 -0.1 E动机 -0.3 -0.1 0.2 0.1 F动机 -0.3 0.0 -0.1 0.2
▪ R2=0.761
22
因子分析应用
▪ 问题:确定影响产品购 买的潜在消费者利益
▪ 变量(测量指标) 7分量表
X1 防止蛀牙 X2 牙齿洁白 X3 坚固牙龈 X4 清新口气 X5 防止牙齿老化 X6 使牙齿漂亮 X7 使牙齿坚固
▪ 因子载荷阵
因子1 因子2
X1 0.86 0.04
X2 0.09 0.89
7
理解数据的性质:变量的4个水平
▪ 命名变量:数值无大小
• 性别,职业,商店类型
▪ 顺序变量:数值有大小但不等间距
• 偏好排序,社会阶层
▪ 等距变量:数值有大小且等间距但无绝对零点
• 态度量表
▪ 比率变量:数值有大小,等间距并有绝对零点
• 收入,年龄,销量
8
描述统计
▪ 数据的分布
• 次数分布 (Frequency Distribution)
4
数据的编辑与清理
▪ 数据的完整性 ▪ 数据的合法性 ▪ 数据的一致性 ▪ 极端数值 ▪ 缺失值处理
5
数据的调整
▪ 数据加权:使样本数据有效代表研究的总体 ▪ 变量的重新赋值:使数据含义更加明确或缩减
数据 ▪ 变量转换:使变量适合统计方法 ▪ 变量组合:产生新的变量
6
基本统计方法
▪ 理解数据的性质 ▪ 描述统计基础 ▪ 假设检验简介
合理使用图形
C
C
10%
15%
B
A
30%
40%
B
50%
A
55%
19
C 10%
15%
50%
30%
B
55% A 40%
合理使用图形
% 100
80 60 40 20
0
阿尔卑斯
20
品牌知名度
大白兔
第一提及率
喔喔
无提示
提示
真味
多元统计方法简介
常用方法
▪ 回归分析:表达因变量
于自变量之间的关系
▪ 因子分析:以较少的潜
在维度解释众多变量之间 的相关关系
▪ 聚类分析:将研究对象
分为同质的一些类
▪ 多维标度法:以空间方
式表达认知
▪ 对应分析:Perceptual
Mapping 的另一种方法
典型的应用
▪ 预测,比较营销中的各 因素对于销售量影响的 重要性
▪ 理解消费动机和品牌选 择的影响因素
▪ 市场细分 ▪ 品牌形象与定位
X3 0.83 0.11
X4 0.11 0.89
X5 0.85 0.07
X6 0.13 0.88
X7 0.86 0.21
▪ 相关统计量
特征值 累积贡献率
因子1 3.38
48%
因子2 1.96
76%
23
聚类分析应用
▪ 问题:根据购物态度细 分消费者群体
▪ 变量 (7分量表)
X1 购物很好顽 X2 购物使人经济拮据 X3 我购物的同时会在外就
18
对角化之后
10-14 15-19 20-24 25-29
C动机 0.3 0.0 0.0 -0.1 A动机 0.2 0.3 0.1 -0.2 D动机 -0.1 0.2 0.1 -0.1 E动机 -0.3 -0.1 0.2 0.1 B动机 -0.3 0.0 0.0 0.2 F动机 -0.3 0.0 -0.1 0.2
13
数据的有效表达与释义
▪ 减少数据中的“噪音”,清晰表达数据之间的 关系
• 缩减小数位 • 去除冗余数据 • 合并数据 • 排序 • 对角排列数据
▪ 合理使用图形
14
去除冗余数据
20%
NO
30%
50%
80%
YES
70%
50%
A
B
C
15
80% 70%
50%
A
B
C
合并数据
喜欢程度
9 1%
8
7
6
5
定量数据分析方法
1
本讲将讲述:
▪ 定量数据分析的基本程序 ▪ 数据分析的准备工作 ▪ 基本统计方法 ▪ 数据的有效表达和释义 ▪ 研究报告的基本原则与格式 ▪ 口头报告的基本原则与技巧
2
定量数据分析的三个步骤
▪ 数据分析的准备 ▪ 数据的统计计算 ▪ 数据的表达与释义
3
数据分析的准备
▪ 编码:对开放问题答案进行分类并赋值 ▪ 数据编辑与清理:使数据干净起来 ▪ 数据调整:使数据(更)适合统计与分析
11
假设检验的基本步骤
1. 设定零假设H0和备择假设H1 2. 选择合适的检验方法和与之对应的检验统计量 3. 设定显著水平a,并查表找出对应统计量的数值(临
界值) 4. 计算检验统计量 5. 比较计算所得的统计量与临界值:
▪ 若大于,则拒绝H0, ▪ 否则,不拒绝H0
12
正确理解假设检验
▪ 差异不显著≠没有差异 ▪ 差异显著≠差异有实际意义