第七讲卡方检验和方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

旧金山 23 18 21 17 15
一电台想了解在加利福尼亚州的三个
不同城市观众的收视习惯方面是否存在差异。 调研者随机从三个城市分别抽出5人组成随 机样本,要求每组人员报出其上周收看电视 所花的时间(小时),数据见表内。取显著 系数0.05,试问他能否得出三个城市在收看 电视上所花的时间方面存在差异吗?
如果拟定假设为真,则各类农户的期望频数如下:
2 (观察值期望期值望值)2
D3:D5=B3:B5*$B$6
EXCEL的chitest函数计算卡方统计量 后直接报告P值。
由于P值非常 小,有足够的 信心拒绝拟定
假设。
C5:c8=binomdist(b5:b8, $b$2,$b$4,false)
15.367
F 14.659
Si g. .001
样本成双比均值,独立配对法不一。 配对小样先算差,显著与否看t值。 样本独立路有歧:西格码已知直求z; 西格码未知s代,合并估计再求t。
处置是否有效果, 方差分析列表格。 组间组内均方比, F分布右尾拖。 P值偏大均值等, P值偏小拒假设。
卡方分布用处多, 非负分布右尾拖。 交叉列表判独立, 观察期望审拟合。
F(10,50)
F
一向方差分析的方差分析表
变异源 处置 误差 总
自由度
k-1
n-k n-1
平方和 均方和
F值
P-值
SSC MSC=SSC/(k-1)
SSE MSE=SSE/(n-k)
SST
MSC/MSE
当检验统计量( MSC/MSE)超过对应于显著系数的F
值时,拒绝“所有总体平均数都相等”的假设。
57 206.7947
59
你的 结论 如何

方差分析的前提条件和程序
假定前提:
(1)各总体都服 从正态分布;
(2)各总体方差 相等;
(3)样本间相互 独立。
程序:
(1)提出假设; (2)根据指定的显著
水平和观察值总数目、
处置数目确定拒绝的
最小F 值; (3)求出SSC和SSE, 计算样本F 值;
(4)比较检验统计量, 得出结论 。
Min Max im imu um m 18 31 28 36 15 23 15 36
HOUR
Between Groups Within Groups T o ta l
Sum of Squares 450.533 184.400 634.933
ANOVA
df 2
12 14
M ea n Square 225.267
从样本数据看,三家公司得分 是有差别的。那么,只是否能 说明总体上得分不一致呢?
或者说,样本数据反映的是随 机误差还是本质上的不同呢?
也可以问:三组数据是来自一 个总体,还是来自平均数不等 的三个总体呢?
处置1
处置2
处置3
X11
X21 X21 X21 X21
处置
内差

处置间 差异
X12 X22 X32 X42 X52
处置内
差异
处置间 差异
X13 X23 X33 X43 X53
处置内
差异
如果处置间差异显著地大于处置内差异, 则认为各样本所来自的总体并非具有相等的平均数
差异的表述
绝对差异的表述:(离差)平方和 相对差异的表述:均方和=(离差)平方和
除以自由度
处置(列)间平方和 处置(列)内平方和 总平方和 总自由度:
SSC k 1
处置(列)内均方和:
SSE MSE
nk
方差分析的逻辑
零假设:各样本(处置结果)来自平均数相等的总体。
若要推翻以上假设,则处置间差异必须显著地大于处置内差异。 两者对比采用列间均方和与列内均方和的比值形式表示。即:若要推翻 以上假设,则此比值必须“显著地大”。
此比值服从以ν1和ν2为自由度的F分布。所谓“比值显著地大”, 就是超过指定显著系数所对应的F分布临界值。
假定前提: (1)各总体都服从正态分布; (2)各总体方差相等; (3)样本间相互独立。
程序: (1)提出假设; (2)根据指定的显著水平和观察 值总数目、处置数目确定拒绝的
最小F 值; (3)求出SSC和SSE,计算样本F
值; (4)比较检验统计量,得出结论 。
SALES
Sum of Squares Between Groups 12535.714
本检验的结论是 什么?
第七讲 卡方检验和方差分析
二、方差分析 1. 方差分析的基本思想和原理 1) 处置的概念 2)平方和与均方和 3)F分布曲线 4)方差分析中的基本假设 2. 单因素方差分析的程序 3. 单因素方差分析方法的应用
三家航空公司顾客满意得分
100
80
60


40

20
0
1 4 7 10 13 16 19
第七讲 卡方检验和方差分析
一、卡方检验 1. 拟合优度检验 1)指定分布率的拟合优度检验 2)理论概率分布的拟合优度检验 2. 独立性检验 1)列联表 2)独立性检验
Chi-square Curve
Probability
0.100 0.090 0.080 0.070 0.060 0.050 0.040 0.030 0.020 0.010 0.000
或:一个较小的P-值使得决策者更有信心拒绝“所有总 体平均数都相等”的假设。
F3:F22=(B3:B22-$B$23)^2 G3:G22=(C3:C22-$C$23)^2 H2:H22=(D3:D22-$D$23)^2
方差分析表(ANOVA)
航空公司满意分一例EXCEL输出
方差分析:单因素方差分析
0
0. 05
10
20
30
40
Chi-square(d.f.=10)
?18.307
P( 2 10,0.05
18?.307)

0.05
已知自由度=10,右尾面积=0.05,求卡方变量值, 用EXCEL函数
CHIINV(右尾面积,自由度)
本例有
Probability
0.100 0.090 0.080 0.070 0.060 0.050 0.040 0.030 0.020 0.010 0.000
HOUR
Descriptiv es
1 2 3 T o ta l
Std. N Mean Deviation
5 24.80
4.82
5 32.20
3.56
5 18.80
3.19
15 25.27
6.73
Std. Error
2.15 1.5Fra Baidu bibliotek 1.43 1.74
95% Confidence Interval for Mean Lower Upper Bound Bound 18.82 30.78 27.78 36.62 14.83 22.77 21.54 29.00
SUMMARY 组
甲 乙 丙
计数 20 20 20
求和 779
1177 1458
平均 方差 38.95 196.1553 58.85 230.9763 72.9 193.2526
方差分析 差异源
组间 组内
SS 11640.1 11787.3
总计
23427.4
df
MS
F P-value F crit
2 5820.05 28.14409 3.15E-09 3.158846
D5:d8=c5:c8*$b$9)
你将得 出什么 结论?
H0:行车意外独立于手 机使用情况。 H1:行车意外与于手机 使用情况有关。
B11=B6*$E$4/$E$6, 拖动到C11,D11。
B12=B6*$E$5/$E$6, 拖动到C12,D12。
对话框 内填入 什么?
这是什么数值?
本检验自由度是 多少?
0
Chi-square Curve
?0.5496
10
20
30
40
Chi-square(d.f.=11)
18
P( 2 10,0.05
18)

0.0?5496
已知自由度=10,卡方变量值=18,求右尾面积, 用EXCEL函数
CHIDIST(变量值,自由度)
本例有
自由度=分类数 - 1
卡方检验统计量
Within Groups 427300.0
T o ta l
439835.7
包装 方式 促销 的数 据和 方差 分析 表
ANOVA
M ea n
df
Square
2 6267.857
11 38845.455
13
F .161
Si g. .853
圣地亚哥 25 31 18 23 27
洛杉矶 28 33 35 29 36
0.100
0.080
0.060
0.040
0.020
0.000
0
10
20
临界值 Fα
比值与1无显著差异
α
30
F40ν1,ν2
比值显著地大
F分布
两个独立的 t分布被各
F分布的图形
自的自由度去除,所得 P 之商的比率服从F分布.
F(10,4)
它是一种非对称分布,图
F(10,10)
形的形状取决于分子和
分母的自由度.
k
2
SSC= n j X j X
j 1
k ni
2
SSE
X Xij
j1 i1
k nj
SST ( Xij X )2 j1 i1
n-1
处置(列)间自由度:ν1=k-1
处置(列)内自由度:ν2=( n-1)-( k-1)= n-k
处置(列)间均方和 : MSC=
相关文档
最新文档