第讲卡方检验和方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
此比值服从以ν 1和ν 2为自由度的F分布。所谓“比值显著地大”, 就是超过指定显著系数所对应的F分布临界值。
0.100
0.080
0.060
0.040
0.020
0.000
0
10
20
临界值 Fα
比值与 1无显著差异
α
30
F40ν1,ν2
比值显著地大
F分布
Fra Baidu bibliotek
两个独立的 t分布被各
F分布的图形
自的自由度去除,所得 P 之商的比率服从 F分布.
F(10,4)
它是一种非对称分布 ,图
F(10,10)
形的形状取决于分子和 分母的自由度 .
F(10,50)
F
一向方差分析的方差分析表
变异源 处置 误差 总
自由度
k-1
n-k n-1
平方和 均方和
F值
P-值
SSC MSC=SSC/(k-1)
SSE MSE=SSE/(n-k)
SST
MSC/MSE
当检验统计量( MSC/MSE)超过对应于显著系数的F
处置(列)间平方和 处置(列)内平方和 总平方和 总自由度:
? ? SSC=
k
?
nj
Xj? X
2
j?1
? ? k ni
2
SSE ? ?? X ? Xij
j? 1 i?1
k nj
SST ? ? ? ( X ij ? X )2 j?1i?1
n-1
处置(列)间自由度:ν 1=k-1
处置(列)内自由度:ν 2=( n-1)-( k-1)= n-k
方差分析:单因素方差分析
SUMMARY
组 甲 乙 丙
计数 20 20 20
求和 779
1177 1458
平均
方差
38.95 196.1553
58.85 230.9763
72.9 193.2526
方差分析 差异源
组间 组内
SS 11640.1 11787.3
总计
23427.4
df
MS
F
P-value F crit
2 5820.05 28.14409 3.15E-09 3.158846
57 206.7947
59
你的 结论 如何

方差分析的前提条件和程序
假定前提:
(1)各总体都服 从正态分布; (2)各总体方差 相等;
(3)样本间相互 独立。
程序: (1)提出假设; (2)根据指定的显著
水平和观察值总数目、
处置数目确定拒绝的
处置
内差

处置间 差异
X12 X22 X32 X42 X52
处置内
差异
处置间 差异
X13 X23 X33 X43 X53
处置内
差异
如果处置间差异显著地大于处置内差异, 则认为各样本所来自的总体并非具有相等的平均数
差异的表述
绝对差异的表述:(离差)平方和 相对差异的表述:均方和=(离差)平方和
除以自由度
CHIDIST(变量值,自由度)
本例有
自由度=分类数 - 1
卡方检验统计量
如果拟定假设为真,则各类农户的期望频数如下:
? 2 ? ?(观察值期?望期值望值)2
D3:D5=B3:B5*$B$6
EXCEL的chitest函数计算卡方统计量 后直接报告P值。
由于P值非常 小,有足够的 信心拒绝拟定
假设。
处置(列)间均方和 : MSC=
SSC k?1
处置(列)内均方和:
SSE MSE ?
n? k
方差分析的逻辑
零假设:各样本(处置结果)来自平均数相等的总体。
若要推翻以上假设,则处置间差异必须显著地大于处置内差异。 两者对比采用列间均方和与列内均方和的比值形式表示。即:若要推翻 以上假设,则此比值必须“显著地大”。
0.080
Probability
0.070 0.060 0.050 0.040 0.030
0.020
0.010
0.000
0
Chi-square Curve
?0.5496
10
20
30
40
Chi-square(d.f.=11)
18
? P( 2 10, 0.05
?
18)
?
0.0?5496
已知自由度=10,卡方变量值=18,求右尾面积, 用EXCEL函数
第七讲 卡方检验和方差分析
一、卡方检验 1. 拟合优度检验 1)指定分布率的拟合优度检验 2)理论概率分布的拟合优度检验 2. 独立性检验 1)列联表 2)独立性检验
Chi-square Curve
0.100
0.090
0.080
Probability
0.070 0.060
0.050 0.040 0.030
值时,拒绝“所有总体平均数都相等”的假设。
或:一个较小的P-值使得决策者更有信心拒绝“所有总 体平均数都相等”的假设。
F3:F22=(B3:B22-$B$23)^2 G3:G22=(C3:C22-$C$23)^2 H2:H22=(D3:D22-$D$23)^2
方差分析表(ANOVA)
航空公司满意分一例EXCEL输出
100
80

60

40

20
0
1470369 1111
从样本数据看,三家公司得分 是有差别的。那么,只是否能 说明总体上得分不一致呢?
或者说,样本数据反映的是随 机误差还是本质上的不同呢?
也可以问:三组数据是来自一 个总体,还是来自平均数不等 的三个总体呢?
处置1
处置2
处置3
X11
X21 X21 X21 X21
C5:c8=binomdist(b5:b8, $b$2,$b$4,false)
D5:d8=c5:c8*$b$9)
你将得 出什么 结论?
H0:行车意外独立于手 机使用情况。 H1:行车意外与于手机 使用情况有关。
B11=B6*$E$4/$E$6, 拖动到C11,D11。
B12=B6*$E$5/$E$6, 拖动到C12,D12。
0.020
0.010
0.000
0
0. 05
10
20
30
40
Chi-square(d.f.=10)
?18.307
? P( 2 10,0.05
?
18?.307)
?
0.05
已知自由度 =10,右尾面积 =0.05 ,求卡方变量值, 用EXCEL函数
CHIINV(右尾面积,自由度)
本例有
0.100
0.090
对话框 内填入 什么?
这是什么数值?
本检验自由度是 多少?
本检验的结论是 什么?
第七讲 卡方检验和方差分析
二、方差分析 1. 方差分析的基本思想和原理 1) 处置的概念 2)平方和与均方和 3)F分布曲线 4)方差分析中的基本假设 2. 单因素方差分析的程序 3. 单因素方差分析方法的应用
三家航空公司顾客满意得分
最小F 值; (3)求出SSC和SSE, 计算样本F 值;
(4)比较检验统计量, 得出结论 。
假定前提: (1)各总体都服从正态分布; (2)各总体方差相等; (3)样本间相互独立。
相关文档
最新文档