第七讲卡方检验和方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
旧金山 23 18 21 17 15
一电台想了解在加利福尼亚州的三个
不同城市观众的收视习惯方面是否存在差异。 调研者随机从三个城市分别抽出5人组成随 机样本,要求每组人员报出其上周收看电视 所花的时间(小时),数据见表内。取显著 系数0.05,试问他能否得出三个城市在收看 电视上所花的时间方面存在差异吗?
如果拟定假设为真,则各类农户的期望频数如下:
2 (观察值期望期值望值)2
D3:D5=B3:B5*$B$6
EXCEL的chitest函数计算卡方统计量 后直接报告P值。
由于P值非常 小,有足够的 信心拒绝拟定
假设。
C5:c8=binomdist(b5:b8, $b$2,$b$4,false)
15.367
F 14.659
Si g. .001
样本成双比均值,独立配对法不一。 配对小样先算差,显著与否看t值。 样本独立路有歧:西格码已知直求z; 西格码未知s代,合并估计再求t。
处置是否有效果, 方差分析列表格。 组间组内均方比, F分布右尾拖。 P值偏大均值等, P值偏小拒假设。
卡方分布用处多, 非负分布右尾拖。 交叉列表判独立, 观察期望审拟合。
F(10,50)
F
一向方差分析的方差分析表
变异源 处置 误差 总
自由度
k-1
n-k n-1
平方和 均方和
F值
P-值
SSC MSC=SSC/(k-1)
SSE MSE=SSE/(n-k)
SST
MSC/MSE
当检验统计量( MSC/MSE)超过对应于显著系数的F
值时,拒绝“所有总体平均数都相等”的假设。
57 206.7947
59
你的 结论 如何
?
方差分析的前提条件和程序
假定前提:
(1)各总体都服 从正态分布;
(2)各总体方差 相等;
(3)样本间相互 独立。
程序:
(1)提出假设; (2)根据指定的显著
水平和观察值总数目、
处置数目确定拒绝的
最小F 值; (3)求出SSC和SSE, 计算样本F 值;
(4)比较检验统计量, 得出结论 。
Min Max im imu um m 18 31 28 36 15 23 15 36
HOUR
Between Groups Within Groups T o ta l
Sum of Squares 450.533 184.400 634.933
ANOVA
df 2
12 14
M ea n Square 225.267
从样本数据看,三家公司得分 是有差别的。那么,只是否能 说明总体上得分不一致呢?
或者说,样本数据反映的是随 机误差还是本质上的不同呢?
也可以问:三组数据是来自一 个总体,还是来自平均数不等 的三个总体呢?
处置1
处置2
处置3
X11
X21 X21 X21 X21
处置
内差
异
处置间 差异
X12 X22 X32 X42 X52
处置内
差异
处置间 差异
X13 X23 X33 X43 X53
处置内
差异
如果处置间差异显著地大于处置内差异, 则认为各样本所来自的总体并非具有相等的平均数
差异的表述
绝对差异的表述:(离差)平方和 相对差异的表述:均方和=(离差)平方和
除以自由度
处置(列)间平方和 处置(列)内平方和 总平方和 总自由度:
SSC k 1
处置(列)内均方和:
SSE MSE
nk
方差分析的逻辑
零假设:各样本(处置结果)来自平均数相等的总体。
若要推翻以上假设,则处置间差异必须显著地大于处置内差异。 两者对比采用列间均方和与列内均方和的比值形式表示。即:若要推翻 以上假设,则此比值必须“显著地大”。
此比值服从以ν1和ν2为自由度的F分布。所谓“比值显著地大”, 就是超过指定显著系数所对应的F分布临界值。
假定前提: (1)各总体都服从正态分布; (2)各总体方差相等; (3)样本间相互独立。
程序: (1)提出假设; (2)根据指定的显著水平和观察 值总数目、处置数目确定拒绝的
最小F 值; (3)求出SSC和SSE,计算样本F
值; (4)比较检验统计量,得出结论 。
SALES
Sum of Squares Between Groups 12535.714
本检验的结论是 什么?
第七讲 卡方检验和方差分析
二、方差分析 1. 方差分析的基本思想和原理 1) 处置的概念 2)平方和与均方和 3)F分布曲线 4)方差分析中的基本假设 2. 单因素方差分析的程序 3. 单因素方差分析方法的应用
三家航空公司顾客满意得分
100
80
60
甲
乙
40
丙
20
0
1 4 7 10 13 16 19
第七讲 卡方检验和方差分析
一、卡方检验 1. 拟合优度检验 1)指定分布率的拟合优度检验 2)理论概率分布的拟合优度检验 2. 独立性检验 1)列联表 2)独立性检验
Chi-square Curve
Probability
0.100 0.090 0.080 0.070 0.060 0.050 0.040 0.030 0.020 0.010 0.000
或:一个较小的P-值使得决策者更有信心拒绝“所有总 体平均数都相等”的假设。
F3:F22=(B3:B22-$B$23)^2 G3:G22=(C3:C22-$C$23)^2 H2:H22=(D3:D22-$D$23)^2
方差分析表(ANOVA)
航空公司满意分一例EXCEL输出
方差分析:单因素方差分析
0
0. 05
10
20
30
40
Chi-square(d.f.=10)
?18.307
P( 2 10,0.05
18?.307)
0.05
已知自由度=10,右尾面积=0.05,求卡方变量值, 用EXCEL函数
CHIINV(右尾面积,自由度)
本例有
Probability
0.100 0.090 0.080 0.070 0.060 0.050 0.040 0.030 0.020 0.010 0.000
HOUR
Descriptiv es
1 2 3 T o ta l
Std. N Mean Deviation
5 24.80
4.82
5 32.20
3.56
5 18.80
3.19
15 25.27
6.73
Std. Error
2.15 1.5Fra Baidu bibliotek 1.43 1.74
95% Confidence Interval for Mean Lower Upper Bound Bound 18.82 30.78 27.78 36.62 14.83 22.77 21.54 29.00
SUMMARY 组
甲 乙 丙
计数 20 20 20
求和 779
1177 1458
平均 方差 38.95 196.1553 58.85 230.9763 72.9 193.2526
方差分析 差异源
组间 组内
SS 11640.1 11787.3
总计
23427.4
df
MS
F P-value F crit
2 5820.05 28.14409 3.15E-09 3.158846
D5:d8=c5:c8*$b$9)
你将得 出什么 结论?
H0:行车意外独立于手 机使用情况。 H1:行车意外与于手机 使用情况有关。
B11=B6*$E$4/$E$6, 拖动到C11,D11。
B12=B6*$E$5/$E$6, 拖动到C12,D12。
对话框 内填入 什么?
这是什么数值?
本检验自由度是 多少?
0
Chi-square Curve
?0.5496
10
20
30
40
Chi-square(d.f.=11)
18
P( 2 10,0.05
18)
0.0?5496
已知自由度=10,卡方变量值=18,求右尾面积, 用EXCEL函数
CHIDIST(变量值,自由度)
本例有
自由度=分类数 - 1
卡方检验统计量
Within Groups 427300.0
T o ta l
439835.7
包装 方式 促销 的数 据和 方差 分析 表
ANOVA
M ea n
df
Square
2 6267.857
11 38845.455
13
F .161
Si g. .853
圣地亚哥 25 31 18 23 27
洛杉矶 28 33 35 29 36
0.100
0.080
0.060
0.040
0.020
0.000
0
10
20
临界值 Fα
比值与1无显著差异
α
30
F40ν1,ν2
比值显著地大
F分布
两个独立的 t分布被各
F分布的图形
自的自由度去除,所得 P 之商的比率服从F分布.
F(10,4)
它是一种非对称分布,图
F(10,10)
形的形状取决于分子和
分母的自由度.
k
2
SSC= n j X j X
j 1
k ni
2
SSE
X Xij
j1 i1
k nj
SST ( Xij X )2 j1 i1
n-1
处置(列)间自由度:ν1=k-1
处置(列)内自由度:ν2=( n-1)-( k-1)= n-k
处置(列)间均方和 : MSC=