市场调查数据分析的基本方法培训课程
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
观察值
B1
因
B2
素
B
…
Br 列总计
因素A
A1
A2
…
x11
x12
…
x21
x22
…
…
…
…
xr1
xr 2
…
r
r
xi1
xi 2
…
i 1
i 1
As
x1s
x2s
…
xrs
r
xis
i 1
行总计
s
x1 j j 1 s
x2 j j 1
…
s
xrj
j 1 rs
xij
i 1 j 1
5.3.2 双因素方差分析(2)
rj
4 4 4 12
j 1
S B
i
(
K
2 i
i
si
j xij ) 2 60 2 452 30 2 212 156 2 294
s
si
3
3
3
3
12
i 1
ST i
(
xi2j i
j
j xij ) 2 20 2 16 2 ... 112 6 2 156 2 302
5.1.6 四分位差的计算
四分位差是一种按照位置来测定数据离散趋势的计量方 法,它只取决于位于样本排序后中间50%位置内数据的 差异程度。即第一个四分位与第三个四分位数据之间的 差异。例2的四分位差计算过程如下
30 3
Q1 90
4 7
10 96.43 万元
30 3 10
Q3 100 4 13
第五章 市场调查的数据分析
市场调查数据分析的基本方法 假设检验法 方差分析法 聚类分析法 判别分析法
5.1 市场调查数据分析的基本方法
频数、频率分析 数据集中趋势分析
算术平均数 中位数 众数
数据分散趋势分析
全距(极差) 四分位差 标准差
5.1.1 频数、频率分析(1)
例1:假设有样本数据
双因素方差分析表
方差来源 平方和 自由度 方差
F
因素A 因素B 误差
SA
s 1
S A (s 1)
FA
SE
SA (r
(s 1) 1)(s 1)
SB
r 1
SB (r 1)
FB
SE
SB (r
(r 1) 1)(s 1)
SE
(r 1)(s 1)
SE (r 1)(s 1)
总计
ST
rs 1
5.3.2 双因素方差分析(3)
2
根据U的计算结果,比较U的绝对值与 U 的大小。若有 U U 则接
受H0,否则拒绝H0 。
2
2
百 分 比 检 验(U)
假设有
H 0 : P P0
H 1 : P P0
选取统计量
U
pP
P(1 P)
n
设定显著性水平 0.05 查表得到 U 1.96
2
根据U的计算结果,比较U的绝对值与 U 的大小。若有 U U 则接
2
2
双样本百分比差异的检验(U)
假设有
H 0 : P1 P2
H 1 : P1 P2
选取统计量
U
p1 p2
p1 (1 p1 ) p2 (1 p2 )
n1
n2
设定显著性水平 0.05 查表得到 U 1.96
2
根据U的计算结果,比较U的绝对值与U 的大小。若有 U U 则接
受H0,否则拒绝H0 。
分组数据的中位数计算 下式中L为中位数所在组的下限值,fm为中位数所在组的 组频数, Sm-1为至中位数组时累计总频数,h为组距。
1
Me L 2
f Sm1 •h
fm
5.1.3 中位数的计算(3)
例2:假设有分组数据如下(销售额单位为万元)
年销售额 80-90 90-100
100-110 110-120 120-130
n
rj
12
j 1
S E ST (S A S B ) 7.5
5.3.2 双因素方差分析(6)
FA
S A (s 1) S E (r 1)(s 1)
0.5 (3 1) 7.5 (4 1)(3 1)
0.20
FB
S B (r 1) S E (r 1)(s 1)
294 (4 1) 7.5 (4 1)(3 1)
10 109.62 万元
四分位差 Q3 Q1 109.62 96.43 6.60 万元
2
2
5.1.7 标准差的计算(1)
未分组数据的标准差计算
s (x x)2
n
x x
n
5.1.7 标准差的计算(2)
分组数据的标准差的计算
s (x x)2 f f
x
xf f
5.2 市场调查数据的假设检验
双因素方差分析的数学表达式
SA
T
2 j
j
rj
(
xij ) 2
i
j
r
rj
j 1
SB
K
2 i
i
si
(
xij ) 2
i
j
s
si
i 1
(
xij ) 2
ST
xi2j
ij
ij
n
rj
j 1
SE ST (S A SB )
s
K i
xij
j 1
5.3.2 双因素方差分析(4)
ABCDE FGH
I
J
1
1
2
2
1
4
6
5
3
3
2
2
6
1
1
2
2
3
2
5
4
3
3
4
4
1
3
3
1
4
3
3
5
4
1
3
4
5
6
4
2
4
6
3
53521121146
6
2
6
3
4
5
5
1
3
2
2
7
6
3
6
6
2
3
6
5
1
1
8
4
1
5
3
3
6
4
6
3
4
95132522262
10 3
2
5
2
3
4
1
4
4
5
5.1.1 频数、频率分析(2)
22
20
18
16
14
百分比差异的检验(t)
假设有
H 0 : p1 p2
H 1 : p1 p2
选取统计量
t
p1 p2
p(1 p)( 1 1 )
n1 n2
其中 p n1 p1 n2 p2 n1 n2
设定显著性水平 0.01 查表得到 t (n1 n2 2)
根据t的计算结果,比较t的绝对值与 t (n1 n2 2) 的大小。若有 t t (n1 n2 2) 则接受H0,否则拒绝H0 。
5.2.3 非参数检验(X2)
在市场调查中常获得一些量表数据,对量表数据
求取平均数与方差都是毫无意义的。对量表数据
的处理更适宜于采用非参数检验方法。非参数检
验中常用的方法是X2检验。 X2检验的统计量是
X 2 k (Qi Ei ) 2
i 1
Ei
上述统计量中,Qi 表示第 i 类别在样本中实际出现
5
195 2
15
70
S E
i
j
xi2j
j
Tj
152
10 2
... 162
17 2
55 2 (
60 2
80 2 ) 122
mj
5
5
5
ST S A S E 70 122 192
F S A (n 1) 70 2 3.44 S E (mn n) 122 12
5.3.1 单因素方差分析(6)
查表求得 F (n 1, mn n) 的值。比较 F (n 1, mn n) 与 的 大小。若有 F F (n 1, mn n,) 则认为因素无显著性影响。 反之则认为影响较显著。本例中n=3, m=5。
F
5.3.2 双因素方差分析(1)
双因素方差分析分析两个同时存在的因素在不同水平状态下独立作用对分 析对象的影响的显著性。双因素分析的常用数据表
2
2
5.2.2 t检验
当样本容量小于30时,不可以使用U检验,而需 要使用t检验。
均值检验 均值差异的检验 百分比差异的检验
均 值 检 验(t)
假设有 选取统计量
H0 : 0 H1 : 0
t x
s n 1
设定显著性水平 0.01 查表得到 t (n 1)
根据t的计算结果,比较t的绝对值与 t (n 1)的大小。若有 t t (n 1) 则接受H0,否则拒绝H0 。
均值差异的检验(t)
假设有 选取统计量
H 0 : 1 2 H1 : 1 2
t
x1 x2
n1 s12
n2
s
2 2
(
1
1)
n1 n2 2 n1 n2
设定显著性水平 0.01 查表得到 t (n1 n2 2)
根据t的计算结果,比较t的绝对值与 t (n1 n2 2) 的大小。若有 t t (n1 n2 2) 则接受H0,否则拒绝H0 。
12 1.00
VAR00001
2.00
3.00
4.00
5.00
6.00
Count
5.1.1 频数、频率分析(3)
5.1.2 算术平均数
未分组数据的平均数计算
x x
n
分组数据的平均数计算
x
xf f
x
f
f
上例的计算结果
100
xi
x i1 3.270 100
f 为组频数
5.1.3 中位数的计算(1)
参数假设检验 U检验 t检验
非参数检验
5.2.1 U检验
当样本容量大于30时,可以采用U检验。
均值检验 百分比检验 双样本平均数差异的检验 双样本百分比差异的检验
均 值 检 验(U)
假设有 选取统计量
H0 : 0 H1 : 0
U x
sn
设定显著性水平 0.05 查表得到 U 1.96
例
试验点
1 2 3 4 5 合计
包装1 15 10 9 5 16 55
月销售量(吨) 包装2 15 10 12 11 12 60
包装3 19 12 16 16 17 80
5.3.1 单因素方差分析(5)
S A
T
2 j
j mj
(
xij ) 2
i
j
n
mj
j 1
55 2
5
60 2
5
80 2
13
5.1.4 众数的计算
未分组数据的众数为出现次数最多的数。
分组数据的众数依据下式计算获得。
表达式中△1表示众数所在组与前一组的频数差,△2表示众数所在 组与后一组的频数差。依据公式,例2分组数据的众数为104.29万 元。
Mo
L
1 1 2
•h
5.1.5 全距(极差)的计算
全距指的是样本数据中最大值与最小值之间的距离,因 而也叫极差。例1中最小值为1,最大值为6,因而全距 为6-1=5。
…
x2n
…
…
…
…
M
xm1
xm2
…
xmn
平均值
x1
x2
…
xn
5.3.1 单因素方差分析(2)
单因素方差分析的一般形式
方差来源 平方和 自由度
组间方差
SA
n 1
组内方差
SE
mn n
方差总和 ST S A S E mn 1
方差
SA n 1 SE mn n
F
S A (n 1) SE (mn n)
合计
组中值 85 95 105 115 125
商店数目 3 7 13 5 2 30
累计频数 3 10 23 28 30
5.1.3 中位数的计算(4)
依据公式
1
Me L 2
f S m1 •h
fm
例2的中位数为
1
Me L 2
f
S m1
•h
100
30 10
2
10 103.85
ቤተ መጻሕፍቲ ባይዱ
万元
fm
5.4 因子聚类分析
距离聚类法
最短距离法 最长距离法
相关系数聚类法
5.4.1 最短距离聚类法(1)
计算样本间距离,并列出初始距离矩阵。 选取初始距离矩阵中的最小值,并对该值对应的样本进
5.3.1 单因素方差分析(3)
单因素方差分析的数学计算表达式
S A
T
2 j
(
i
xij ) 2
j
j mj
n
mj
j 1
S E
i
xi2j
j
T
2 j
j mj
(
xij ) 2
ST S A S E
xi2j
ij
ij
n
mj
mj
j 1
T j xij
i 1
5.3.1 单因素方差分析(4)
受H0,否则拒绝H0 。
2
2
双样本平均数差异的检验(U)
假设有
H 0 : 1 2 H1 : 1 2
选取统计量
U
x1 x2
s12
s
2 2
n1
n2
设定显著性水平 0.05 查表得到 U 1.96
2
根据U的计算结果,比较U的绝对值与U 的大小。若有 U U 则接
受H0,否则拒绝H0 。
例
销地
B1 B2 B3 B4 列总计
销量
包装A1 包装A2 包装A3
20
19
21
行总计 60
16
15
14
45
9
10
11
30
8
7
6
21
53
51
52 156(总)
5.3.2 双因素方差分析(5)
S A
T
2 j
(
i
j rj
j xij ) 2 532 512 522 1562 0.50
r
的次数,E表i 示期望出现的次数,k 为类别数。
5.3 市场调查的方差分析
单因素方差分析 双因素方差分析
5.3.1 单因素方差分析(1)
单因素方差分析研究一个因素在不同水平下对研究对象 影响的显著性。单因素方差分析的数据表如下:
试验水平
试验数
A1
A2
…
An
1
x11
2
x21
x12
…
x1n
x22
78.4
5.3.2 双因素方差分析(7)
查表求得F (s 1, (s 1)(r 1)) 与 F (r 1, (s 1)(r 1)) 的值。比 较 F (s 1, (s 1)(r 1)) 与 F (r 1, (s 1)(r 1)) 与 FA 、FB 的大 小。若有FA F (s 1, (s 1)(r 1)),则认为因素A无显著性影 响;反之则认为影响较显著。若有FB F (r 1, (s 1)(r 1)), 则认为因素B无显著性影响;反之则认为影响较显著。
未分组数据的中位数计算
对所有数据进行排序,当数据量为奇数时,取中间数为 中位数,当数据量为偶数时,取最中间两位数的平均数 为中位数。上例中数据量为100,是偶数,所以应取排 序后第50位数和第51位数的平均值作为中位数。第50位 数是3,第51位数也是3,所以中位数为3。
5.1.3 中位数的计算(2)