拟合优度检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例 下表给出不同给药方式与给药效果
给药方式 口服(B)
有效(A) 58
无效( A ) 总数 有效率
40
98 59.2%
注射( B )
64
总数
122
31
95 67.4%
71
193
列 联 表 χ2 检 验 的 原 理
若事件 A 和事件 B 是相互独立的,则
P(AB)=P(A)P(B)
列联表 χ2 检验一般步骤
pi e0.69 0.69i / i!,i 0,1, 2,3, 4
将有关计算结果列表如下:
战争次数 x
0
1 23 4
实测频数 fi 223 142 48 15 4
pi 0.58 0.31 0.18 0.01 0.02 npi 216.7 149.5 51.6 12.0 2.16
14.16
fi npi 2 0.183 0.376 0.251 1.623
在 F(x) 尚未完全给定的情况下,每个未知 参数用相应的估计量代替,就相当于增加一个 制约条件,因此,自由度也随之减少一个。
若有 r 个未知参数需用相应的估计量来代替, 自由度就减少 r 个。
故统计量 2 渐近 (k-1-r) 个自由度的 2分布。
根据皮尔逊定理,对给定的显著性水平 α,
查 2分布表可得临界值 2 ,使得
这种检验通常称作拟合优度检验,它 是一种非参数检验。
拟合优度检验的一般步骤
1. 将总体 X 的取值范围分成 k 个互不重叠 的小区间,记作A1, A2, …, Ak。
2. 把落入第 i 个小区间 Ai 的样本值的个数 记作 fi ,称为实测频数; 所有实测频数 之和(f1+ f2+ …+ fk)等于样本容量 n。
3. 根据所假设的理论分布,可以算出总体 X 的值落入每个 Ai 的概率 pi,npi就是 落入区间 Ai 的样本值的理论频数。
4. 观测频数与理论频数比较,判断二者 不符合程度是否由于机会所造成。
实测频数
fi npi 理论频数
皮尔逊引进如下统计量表示经验分布与理论分布
之间的差异:
2 k ( fi npi )2
P( 2 2 )
得拒绝域:
2
2 k 1,
(不需估计参数)
2
2
k 1r,
(估计 r 个参数)
如果根据所给的样本值 X1,X2, …,Xn算得统
计量 2的实测值落入拒绝域,则拒绝原假设,
否则就认为差异不显著而接受原假设。
连续性矫正
当df=1时应做连续性矫正,矫正方法如 下:
k
2
2.43
npi
1. 将npi < 5的组予以合并,即将发生3次及4次战争 的组归并为一组。
2. 因H0所假设的理论分布中有一个未知参数 λ, 故自由度为4-1-1=2。
按α =0.05,自由度为4-1-1=2,查表得:
2 2,0.05
5.991
统计量:
2 2.43 5.991
未落入拒绝域。
故认为每年发生战争的次数 X 服从参数 为 0.69的泊松分布。
例 下表给出不同给药方式与给药效果
给药方式 口服(B)
有效(A) 58
无效( A ) 40
总数 98
有效率 59.2%
注射( B )
64
总数
122
31
95 67.4%
71
193
列检联 验表 统χ 2 计检 验量的:原 理
k
2
Oi Ti
2
k
i 1
Ti
i 1
fi npi 2 npi
【例】下表给出不同给药方式与给药效果, 求列证联:表给χ2 检药验方属式独立与性给检验药。效果有无关联。
i 1
npi
在理论分布 已知的条件下,
npi是常量
两个问题:
统计量 2 ห้องสมุดไป่ตู้分布是什么?
皮尔逊为什么会选用这个统计量?
关于第一个问题,皮尔逊证明了如下定理:
若原假设中的理论分布 F(x) 已经完全给定, 那么当 n → ∞ 时,统计量:
2 k ( fi npi )2
i 1
npi
的分布渐近 (k-1) 个自由度的 2分布。
问该厂生产的钟的误差是否服从正态分布?
【引例3】某工厂制造了一 批骰子,声称它是均匀的。
为检验骰子是否均匀,要把骰子实地投掷 若干次,统计各点出现的频率与1/6的差距。 问题是:
得到的数据能否说明“骰子均匀”的假 设是可信的?
解决这类问题的工具是英 国统计学家K.皮尔逊在1900 年发表的一篇文章中介绍了 χ2 检验法。
每个理论值用Tij表示,Tij=(i行总数)(j列总数)/总数。
列联表 χ2 检验一般步骤
3. 计算 χ2 值:若 χ2 < χ2α,则接受H0;若 χ2 > χ2α,则拒绝H0。
4. 确定 df:因为每一行的各理论数受该行总数 约束,每一列的各理论数受该列总数约束, 所以 df=(r-1)(c-1)。
如果理论分布 F(x) 中有 r 个未知参数需用相
应的估计量来代替,那么当 n → ∞ 时,统计
量 2的分布渐近 (k-1-r)个自由度的 2分布。
皮尔逊定理的几点说明
统计量的选择 自由度的确定 连续性矫正
统计量的选择
求 k 个 Oi-Ti 之和,显然它们恒等于0 求 k 个 (Oi-Ti)2 之和,得不出相对的不符合程度
72.75
24.25
按 α =0.05,自由度为1,查表得
2 1,0.05
3.841
由于统计量
2 =0.4158<3.841 未落入拒绝域。
故认为试验结果符合孟德尔的3:1理论。
【引例1】某地区在1500到1931 年的432年间,共爆发了299次战
争,具体数据如下(每年爆发战
争的次数可以看作一个随机变量
Oi Ti 0.5 2
i 1
Ti
皮尔逊定理小结
皮尔逊定理是在 n 无限增大时推导出来 的,因而在使用时要注意 n 要足够大,以 及 npi 不太小这两个条件。
根据计算实践,要求 n 不小于50,以及 npi 都不小于 5。否则应适当合并区间,使 npi 满足这个要求 。
以遗传学上的一项伟大发现为例,说明统计 方法在研究自然界和人类社会的规律性时,是 起着积极的、主动的作用。
Oi=9、Ti=6,Oi-Ti=3;Oi=49、Ti=46,Oi-Ti=3。 前者的不符合程度远大于后者。
求 k 个 [(Oi-Ti)/Ti]2 之和,但仍有问题
如:Oi=8、Ti=5以及Oi=80、Ti=50时 (Oi-Ti)/Ti 都 等于0.6。
统计量的选择
为了解决上述问题,以 Ti 为权求加权值
奥地利生物学家孟德尔进行了长达 八年之久的豌豆杂交试验,并根据试 验结果,运用他的数理知识,发现了 分离规律。
孟德尔
【例1】 …
黄色纯系
… 子一代 绿色纯系
子二代
根据他的理论,子二代中,黄、绿之比 近似为3:1,他的一组观察结果为:
黄70,绿27 近似为2.59:1,与理论值相近。
检验孟德尔的3:1理论:
5. 给出结论。
1. 零假设H0:O-T=0 2. 计算理论数:
上例的计算T结ij果=如(i下行:总数)(j列总数)/总数
有效
无效
口服 O1=58
O2=40
注射
T1=(98)(122)/193=61.95 O3=64
T2=(98)(71)/193=36.05 O4=31
总数
T3=(95)(122)/193=60.05 122
T4=(95)(71)/193=34.95 71
总数 98
95
193
上例的计算结果如下:
有效
口服 O1=58
注射
T1=(98)(122)/193=61.95 O3=64
总数
T3=(95)(122)/193=60.05 122
无效 O2=40 T2=(98)(71)/193=36.05 O4=31 T4=(95)(71)/193=34.95 71
r×c 列联表 χ2 检验
r×c列联表是 2×2 表的扩展;反之, 2×2 表也可以看成是 r×c列联表的一个 特例。
r×c 列联表理论数的计算与2×2列联表 相同:
Tij=(i行总数)(j列总数)/总数。 df=(r-1)(c-1)。
【例】检查鱼的饲养方式与鱼的等级是否有
关,设计了如下试验:按不同方式分为三种 网箱饲养类型:A、B、C,统计不同饲养方 式下鱼的等级情况,得如下数据,试分析。
第七章 拟合优度检验
拟合优度检验的应用
总体分布未知,从样本数据中发 现规律(总体分布),再利用拟 合优度检验对假设的总体分布进 行验证。
【引例1】某地区在1500到1931 年的432年间,共爆发了299次战
争,具体数据如下(每年爆发战
争的次数可以看作一个随机变量
X):
战争次数 X 发生 X 次战争的年数
X):
战争次数 X 发生 X 次战争的年数
0
223
1
142
2
48
3
15
4
4
【例2】引例1,检验每年爆发战争次数分 布是否服从泊松分布。 解:H0:O-T=0 (X 服从参数为 λ 的泊松分布)
根据观察结果,得参数 λ 的极大似然估计为:
X 0.69
按参数 λ 为0.69的泊松分布,计算事件X=i 的概率pi ,pi的估计是:
等级
甲 乙 丙 丁 总数
饲养方式
A
B
C
22
18
16
18
16
14
11
13
14
8
11
10
59
58
54
总数
56 48 38 29 171
1. 零假设H0:O-T=0 2. 计算理论数:
提出假设H0: O-T=0 (p1=3/4,p2=1/4) 这里,n=70+27=97,k=2, 理论频数为: np1=72.75,np2=24.25 实测频数为70(黄),27(绿)。
22
2 ii11
ffii nnppii nnppii
22
~
12
自由度为 2-1=1
(70 72.75)2 (27 24.25)2 0.4158
总数 98
95
193
3. 计算 χ2 值
4
2
Oi Ti 2
i 1
Ti
58 61.952 40 36.052 64 60.052 31 34.952
61.95
36.05
60.05
34.95
0.252 0.433 0.260 0.466
1.391
4. 确定df
df=(r-1)(c-1)
χ2 检验的另一应用-独立性检验
是指研究两个或两个以上的计数资料 (或属性资料)之间是否相互独立的 假设检验,先假设所观测的各属性之 间没有关联,然后检验这种无关联的 假设是否成立。
方法1:列联表 χ2 检验
【例】下表给出不同给药方式与给药效果, 问列给联药表方χ2 检式验与属给独立药性效检验果。是否有关联。
1. 提出零假设:假设实测数与理论数无差异。即 H0:O-T=0。
2. 计算理论数:若事件 A 和事件 B 是相互独立 的,则 P(AB)=P(A)P(B)。
例如:在给药方式和效果之间是相互独立的前提下 ,计算口服(事件B)有效(事件A)的概率 P(BA) =P(B)P(A) = (98/193) (122/193)。其理论数T1= (98/193)(122/193) 193 = (98)(122)/193 。
K.皮尔逊
拟合优度检验的工具- χ2 检验
χ2 检验法是在总体 X 的分布未知时, 根据来自总体的样本,检验关于总 体分布的假设的一种检验方法。
使用 χ2 检验法对总体分布进行检验时,
先提出原假设:
H0:总体 X 的分布函数为 F(x)
然后根据样本的经验分布和所假设的 理论分布之间的吻合程度来决定是否接 受原假设。
0
223
1
142
2
48
3
15
4
4
根据我们对泊松分布产生的一般条件的理 解,可以用一个泊松随机变量来近似描述每 年爆发战争的次数。也就是说,我们可以假 设每年爆发战争次数分布 X 近似泊松分布。
现在的问题是:
上面的数据能否证实 X 具有泊松分布的 假设是正确的?
【引例2】某钟表厂对生产的 钟进行精确性检查,抽取100个 钟作试验,校准24小时后进行 检查,将每个钟的误差(快或 慢)按秒记录下来。
kk
ii11
TTii
OOii TTii TTii
2
kk ii11
Oii Ti Tii
22
k
i 1
fi npi 2 npi
自由度的确定
2 k ( fi npi )2
i 1
npi
变量之间存在着一个制约关系:
k
( fi npi ) 0
i 1
故统计量 2渐近 (k-1) 个自由度的 2分布。
=(2-1)(2-1)
H0 : O T =0,1 0.05, df 2 12 1 1,
取
α
=0.05,
2 0.05
3.841,
2
12.39102.05
2 0.05
5. 给出结论: 接受H0,不同给药方式的治疗效果没有显著
不同。
注意:本例的 df =1应当矫正,矫正后的 χ2 值更 小,不会影响结论,可以不再矫正。
给药方式 口服(B)
有效(A) 58
无效( A ) 总数 有效率
40
98 59.2%
注射( B )
64
总数
122
31
95 67.4%
71
193
列 联 表 χ2 检 验 的 原 理
若事件 A 和事件 B 是相互独立的,则
P(AB)=P(A)P(B)
列联表 χ2 检验一般步骤
pi e0.69 0.69i / i!,i 0,1, 2,3, 4
将有关计算结果列表如下:
战争次数 x
0
1 23 4
实测频数 fi 223 142 48 15 4
pi 0.58 0.31 0.18 0.01 0.02 npi 216.7 149.5 51.6 12.0 2.16
14.16
fi npi 2 0.183 0.376 0.251 1.623
在 F(x) 尚未完全给定的情况下,每个未知 参数用相应的估计量代替,就相当于增加一个 制约条件,因此,自由度也随之减少一个。
若有 r 个未知参数需用相应的估计量来代替, 自由度就减少 r 个。
故统计量 2 渐近 (k-1-r) 个自由度的 2分布。
根据皮尔逊定理,对给定的显著性水平 α,
查 2分布表可得临界值 2 ,使得
这种检验通常称作拟合优度检验,它 是一种非参数检验。
拟合优度检验的一般步骤
1. 将总体 X 的取值范围分成 k 个互不重叠 的小区间,记作A1, A2, …, Ak。
2. 把落入第 i 个小区间 Ai 的样本值的个数 记作 fi ,称为实测频数; 所有实测频数 之和(f1+ f2+ …+ fk)等于样本容量 n。
3. 根据所假设的理论分布,可以算出总体 X 的值落入每个 Ai 的概率 pi,npi就是 落入区间 Ai 的样本值的理论频数。
4. 观测频数与理论频数比较,判断二者 不符合程度是否由于机会所造成。
实测频数
fi npi 理论频数
皮尔逊引进如下统计量表示经验分布与理论分布
之间的差异:
2 k ( fi npi )2
P( 2 2 )
得拒绝域:
2
2 k 1,
(不需估计参数)
2
2
k 1r,
(估计 r 个参数)
如果根据所给的样本值 X1,X2, …,Xn算得统
计量 2的实测值落入拒绝域,则拒绝原假设,
否则就认为差异不显著而接受原假设。
连续性矫正
当df=1时应做连续性矫正,矫正方法如 下:
k
2
2.43
npi
1. 将npi < 5的组予以合并,即将发生3次及4次战争 的组归并为一组。
2. 因H0所假设的理论分布中有一个未知参数 λ, 故自由度为4-1-1=2。
按α =0.05,自由度为4-1-1=2,查表得:
2 2,0.05
5.991
统计量:
2 2.43 5.991
未落入拒绝域。
故认为每年发生战争的次数 X 服从参数 为 0.69的泊松分布。
例 下表给出不同给药方式与给药效果
给药方式 口服(B)
有效(A) 58
无效( A ) 40
总数 98
有效率 59.2%
注射( B )
64
总数
122
31
95 67.4%
71
193
列检联 验表 统χ 2 计检 验量的:原 理
k
2
Oi Ti
2
k
i 1
Ti
i 1
fi npi 2 npi
【例】下表给出不同给药方式与给药效果, 求列证联:表给χ2 检药验方属式独立与性给检验药。效果有无关联。
i 1
npi
在理论分布 已知的条件下,
npi是常量
两个问题:
统计量 2 ห้องสมุดไป่ตู้分布是什么?
皮尔逊为什么会选用这个统计量?
关于第一个问题,皮尔逊证明了如下定理:
若原假设中的理论分布 F(x) 已经完全给定, 那么当 n → ∞ 时,统计量:
2 k ( fi npi )2
i 1
npi
的分布渐近 (k-1) 个自由度的 2分布。
问该厂生产的钟的误差是否服从正态分布?
【引例3】某工厂制造了一 批骰子,声称它是均匀的。
为检验骰子是否均匀,要把骰子实地投掷 若干次,统计各点出现的频率与1/6的差距。 问题是:
得到的数据能否说明“骰子均匀”的假 设是可信的?
解决这类问题的工具是英 国统计学家K.皮尔逊在1900 年发表的一篇文章中介绍了 χ2 检验法。
每个理论值用Tij表示,Tij=(i行总数)(j列总数)/总数。
列联表 χ2 检验一般步骤
3. 计算 χ2 值:若 χ2 < χ2α,则接受H0;若 χ2 > χ2α,则拒绝H0。
4. 确定 df:因为每一行的各理论数受该行总数 约束,每一列的各理论数受该列总数约束, 所以 df=(r-1)(c-1)。
如果理论分布 F(x) 中有 r 个未知参数需用相
应的估计量来代替,那么当 n → ∞ 时,统计
量 2的分布渐近 (k-1-r)个自由度的 2分布。
皮尔逊定理的几点说明
统计量的选择 自由度的确定 连续性矫正
统计量的选择
求 k 个 Oi-Ti 之和,显然它们恒等于0 求 k 个 (Oi-Ti)2 之和,得不出相对的不符合程度
72.75
24.25
按 α =0.05,自由度为1,查表得
2 1,0.05
3.841
由于统计量
2 =0.4158<3.841 未落入拒绝域。
故认为试验结果符合孟德尔的3:1理论。
【引例1】某地区在1500到1931 年的432年间,共爆发了299次战
争,具体数据如下(每年爆发战
争的次数可以看作一个随机变量
Oi Ti 0.5 2
i 1
Ti
皮尔逊定理小结
皮尔逊定理是在 n 无限增大时推导出来 的,因而在使用时要注意 n 要足够大,以 及 npi 不太小这两个条件。
根据计算实践,要求 n 不小于50,以及 npi 都不小于 5。否则应适当合并区间,使 npi 满足这个要求 。
以遗传学上的一项伟大发现为例,说明统计 方法在研究自然界和人类社会的规律性时,是 起着积极的、主动的作用。
Oi=9、Ti=6,Oi-Ti=3;Oi=49、Ti=46,Oi-Ti=3。 前者的不符合程度远大于后者。
求 k 个 [(Oi-Ti)/Ti]2 之和,但仍有问题
如:Oi=8、Ti=5以及Oi=80、Ti=50时 (Oi-Ti)/Ti 都 等于0.6。
统计量的选择
为了解决上述问题,以 Ti 为权求加权值
奥地利生物学家孟德尔进行了长达 八年之久的豌豆杂交试验,并根据试 验结果,运用他的数理知识,发现了 分离规律。
孟德尔
【例1】 …
黄色纯系
… 子一代 绿色纯系
子二代
根据他的理论,子二代中,黄、绿之比 近似为3:1,他的一组观察结果为:
黄70,绿27 近似为2.59:1,与理论值相近。
检验孟德尔的3:1理论:
5. 给出结论。
1. 零假设H0:O-T=0 2. 计算理论数:
上例的计算T结ij果=如(i下行:总数)(j列总数)/总数
有效
无效
口服 O1=58
O2=40
注射
T1=(98)(122)/193=61.95 O3=64
T2=(98)(71)/193=36.05 O4=31
总数
T3=(95)(122)/193=60.05 122
T4=(95)(71)/193=34.95 71
总数 98
95
193
上例的计算结果如下:
有效
口服 O1=58
注射
T1=(98)(122)/193=61.95 O3=64
总数
T3=(95)(122)/193=60.05 122
无效 O2=40 T2=(98)(71)/193=36.05 O4=31 T4=(95)(71)/193=34.95 71
r×c 列联表 χ2 检验
r×c列联表是 2×2 表的扩展;反之, 2×2 表也可以看成是 r×c列联表的一个 特例。
r×c 列联表理论数的计算与2×2列联表 相同:
Tij=(i行总数)(j列总数)/总数。 df=(r-1)(c-1)。
【例】检查鱼的饲养方式与鱼的等级是否有
关,设计了如下试验:按不同方式分为三种 网箱饲养类型:A、B、C,统计不同饲养方 式下鱼的等级情况,得如下数据,试分析。
第七章 拟合优度检验
拟合优度检验的应用
总体分布未知,从样本数据中发 现规律(总体分布),再利用拟 合优度检验对假设的总体分布进 行验证。
【引例1】某地区在1500到1931 年的432年间,共爆发了299次战
争,具体数据如下(每年爆发战
争的次数可以看作一个随机变量
X):
战争次数 X 发生 X 次战争的年数
X):
战争次数 X 发生 X 次战争的年数
0
223
1
142
2
48
3
15
4
4
【例2】引例1,检验每年爆发战争次数分 布是否服从泊松分布。 解:H0:O-T=0 (X 服从参数为 λ 的泊松分布)
根据观察结果,得参数 λ 的极大似然估计为:
X 0.69
按参数 λ 为0.69的泊松分布,计算事件X=i 的概率pi ,pi的估计是:
等级
甲 乙 丙 丁 总数
饲养方式
A
B
C
22
18
16
18
16
14
11
13
14
8
11
10
59
58
54
总数
56 48 38 29 171
1. 零假设H0:O-T=0 2. 计算理论数:
提出假设H0: O-T=0 (p1=3/4,p2=1/4) 这里,n=70+27=97,k=2, 理论频数为: np1=72.75,np2=24.25 实测频数为70(黄),27(绿)。
22
2 ii11
ffii nnppii nnppii
22
~
12
自由度为 2-1=1
(70 72.75)2 (27 24.25)2 0.4158
总数 98
95
193
3. 计算 χ2 值
4
2
Oi Ti 2
i 1
Ti
58 61.952 40 36.052 64 60.052 31 34.952
61.95
36.05
60.05
34.95
0.252 0.433 0.260 0.466
1.391
4. 确定df
df=(r-1)(c-1)
χ2 检验的另一应用-独立性检验
是指研究两个或两个以上的计数资料 (或属性资料)之间是否相互独立的 假设检验,先假设所观测的各属性之 间没有关联,然后检验这种无关联的 假设是否成立。
方法1:列联表 χ2 检验
【例】下表给出不同给药方式与给药效果, 问列给联药表方χ2 检式验与属给独立药性效检验果。是否有关联。
1. 提出零假设:假设实测数与理论数无差异。即 H0:O-T=0。
2. 计算理论数:若事件 A 和事件 B 是相互独立 的,则 P(AB)=P(A)P(B)。
例如:在给药方式和效果之间是相互独立的前提下 ,计算口服(事件B)有效(事件A)的概率 P(BA) =P(B)P(A) = (98/193) (122/193)。其理论数T1= (98/193)(122/193) 193 = (98)(122)/193 。
K.皮尔逊
拟合优度检验的工具- χ2 检验
χ2 检验法是在总体 X 的分布未知时, 根据来自总体的样本,检验关于总 体分布的假设的一种检验方法。
使用 χ2 检验法对总体分布进行检验时,
先提出原假设:
H0:总体 X 的分布函数为 F(x)
然后根据样本的经验分布和所假设的 理论分布之间的吻合程度来决定是否接 受原假设。
0
223
1
142
2
48
3
15
4
4
根据我们对泊松分布产生的一般条件的理 解,可以用一个泊松随机变量来近似描述每 年爆发战争的次数。也就是说,我们可以假 设每年爆发战争次数分布 X 近似泊松分布。
现在的问题是:
上面的数据能否证实 X 具有泊松分布的 假设是正确的?
【引例2】某钟表厂对生产的 钟进行精确性检查,抽取100个 钟作试验,校准24小时后进行 检查,将每个钟的误差(快或 慢)按秒记录下来。
kk
ii11
TTii
OOii TTii TTii
2
kk ii11
Oii Ti Tii
22
k
i 1
fi npi 2 npi
自由度的确定
2 k ( fi npi )2
i 1
npi
变量之间存在着一个制约关系:
k
( fi npi ) 0
i 1
故统计量 2渐近 (k-1) 个自由度的 2分布。
=(2-1)(2-1)
H0 : O T =0,1 0.05, df 2 12 1 1,
取
α
=0.05,
2 0.05
3.841,
2
12.39102.05
2 0.05
5. 给出结论: 接受H0,不同给药方式的治疗效果没有显著
不同。
注意:本例的 df =1应当矫正,矫正后的 χ2 值更 小,不会影响结论,可以不再矫正。