第七章_总体分布的拟合优度检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0
二、Poisson分布的拟合优度检验
【例7.3】将酵母细胞的稀释液置于某种计量 仪器上,数出每一小方格内的酵母细胞数, 共观察了413个小方格,结果见表7.3第1、2 列,试问该资料是否服从Poisson分布?
H0:方格内酵母细胞的个数服从 Poisson 分布; H1:…个数不服从 Poisson 分布 α =0.05 x
第一节 卡方拟合优度检验 的原理与计算步骤
1. 原理
判断样本观察频数(Observed frequency)
与理论(期望)频数(Expected frequency )之差 是否由抽样误差所引起。
2014-7-16
华中科技大学同济医学院 宇传华(yuchua@163.com)制作
数据格式与计算公式
解:H0:IQ 得分服从正态分布,H1:不服从正态,α =0.05, X 101.294
2014-7-16
S =15.585
华中科技大学同济医学院 宇传华(yuchua@163.com)制作
表 7.3 正态分布拟合优度χ 2 检验的计算表
实际观 IQ 得分组限 (1) 测频数 Oi (2) 标准化 组限 Zi (3) (4) (5) 累计概率 概 率 理论频数 Ei (6)=150*(5)
Oi Ei
(5) 3.061 1.198 2.601 5.580 1.122 2.799
Oi Ei
(6)
2
Oi Ei Ei
(7)
2
09.3697 01.4352 06.7652 31.1364 01.2589 07.8344
0.09375 0.01012 0.06723 0.65446 0.07462 1.26461 2.16478
类别或组段 观察频数 理论频数 O1 E1 1 O2 E2 2 … … … k Ok Ek 问题:试判断这份样本,是否来自该理论分布?
k 2
(Oi Ei ) , Ei i 1
2 P
k 1 a
注意:理论频数Ei不宜过 小(如不小于5),否则需 要合并组段!
a为参数的个数
2014-7-16
理论概率 P( x)
x! e
0 103 1 143 7 1 586 fx 1.41889 n 413 413
2014-7-16 华中科技大学同济医学院 宇传华(yuchua@163.com)制作
P(7)=0.000556
卡方分量
2
表 7.3
方格内 细胞数 (X) (1) 0 1 2 3 4 5 6 7 合计 实际 方格数 (Oi) (2) 103 143 98 42 18 6 2 1 413
1.2660 5.3790 15.3150 29.2905 37.6230 32.4660 18.8190 7.3260 1.9140 0.3360
0.00149~ 0.00993~ 0.04579~ 0.14789~ 0.34316~ 0.59398~ 0.81042~ 0.93588~ 0.98472~ 0.99748~ 0.99972
0.00844 0.03586 0.10210 0.19527 0.25082 0.21644 0.12546 0.04884 0.01276 0.00224
2014-7-16 华中科技大学同济医学院 宇传华(yuchua@163.com)制作
一、采用卡方检验进行正态性检验
例 7.5 下面是 150 名 10 岁儿童的 IQ 得分,请检验其是否服从正态分布
125.9 143.8 66.1 118.5 84.0 83.9 77.6 90.9 86.6 85.5 92.6 93.7 102.0 98.0 99.4 99.3 116.7 111.8 112.3 113.2 112.8 113.2 110.8 118.6 122.5 92.3 95.8 104.1 57.5 104.1 133.4 151.1 68.9 119.0 81.2 84.5 76.9 87.6 93.6 88.2 86.6 87.6 88.6 99.5 104.2 100.0 104.9 103.2 114.1 107.8 113.4 108.4 113.7 113.9 112.5 121.7 123.6 108.0 103.9 95.0 131.9 75.3 73.0 121.9 83.3 79.9 85. 88.6 89.1 93.6 94.6 93.3 86.9 98.6 104.3 98.2 95.0 99.8 111.4 108.5 108.6 105.9 109.3 113.2 113.1 115.9 124.7 109.6 99.1 101.4 137.1 78.6 74.1 123.7 83.9 78.9 89.6 93.6 87.6 90.1 87.3 89.6 103.2 95.8 96.8 97.4 97.7 103.2 109.5 115.7 120.1 115.7 108.2 113.1 114.1 99.8 101.4 104.1 99.0 102.3 135.9 76.3 73.4 127.8 82.7 84.8 92.6 93.8 89.9 93.4 89.2 94.6 95.2 101.8 97.0 105.9 114.9 109.1 109.3 113.2 109.8 105.5 106.8 119.7 95.9 107.7 109.2 98.9 103.0 103.5
2
自由度=6-1-1=4。 0.05,4 9.49 ,本例 P 〉0.05,表示服从 Poisson 分布。
2wenku.baidu.com
2014-7-16
华中科技大学同济医学院 宇传华(yuchua@163.com)制作
其他离散型变量分布的拟合优度检验
1. 2. 3. 4. 二项分布 Poisson分布 超几何分布 负二项分布
χ2分布(chi-square distribution)
0.5 0.4 0.3
f ( ) 2( / 2) 2
2
1
2
( / 21)
e
2 / 2
ß ×· Ý
× Ô Ó É ¶ È £ ½ 1
0.2 0.1 0.0 0 3
3.84
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
2014-7-16
华中科技大学同济医学院 宇传华(yuchua@163.com)制作
本章介绍的拟合优度检验方法 1. 卡方检验
2. 正态性检验的W法(Shapiro-wilk法)、D法( Kolmogorov-Smirnov法)
2014-7-16
华中科技大学同济医学院 宇传华(yuchua@163.com)制作
华中科技大学同济医学院 宇传华(yuchua@163.com)制作
2. 计算步骤
(1) H 0 :样本的总体分布与该理论分布无区别 H 1 :样本与该理论分布有区别 0.05 (2)列出各组的实际频数与理论频数 (3) Pearson 2 统计量 2 k (实际频数-理论频数) 2 P 理论频数 i 1
Oi E i Ei
(7)
2
Oi E i Ei
(8)
2
55.0 ~ 65.0 ~ 75.0 ~ 85.0 ~ 95.0 ~ 105.0~ 115.0~ 125.0~ 135.0~ 145.0~155
1 5 15 31 39 36 15 4 3 1
-2.97048~ -2.32882 -1.68717 -1.04551 -0.40386 0.23780 0.87945 1.52111 2.16276 2.80441~ 3.44607
第七章 总体分布的拟合优度检验
Goodness of Fit Test for Distribution of Population
2014-7-16
华中科技大学同济医学院 宇传华(yuchua@163.com)制作
为什么要知道总体分布?
1. 参数统计学推断方法(如t检验、F检验)均以 服从某一分布(如正态分布)为假定条件。 2. 实际工作中需要了解样本观察频数(Observed frequency,简记为O)是否与某一理论频数( Expected frequency,简记为E)相符。
P=0.05的临界值
7.81 12.59
6
9 12 ¿ ¨· ½ Ö µ
15
18
2014-7-16
华中科技大学同济医学院 宇传华(yuchua@163.com)制作
卡方分布下的检验水准及其临界值
2014-7-16
华中科技大学同济医学院 宇传华(yuchua@163.com)制作
第二节 离散型随机变量分布的 拟合优度检验
2
理论概率 P( X 0) 3 0.140 0.863 0.63606 ,… 理论家庭数=150*理论概率 =3-1-1=1。 2 χ 0.05,1=3.84, ∴p<0.05,…具有家庭聚集性
2014-7-16 华中科技大学同济医学院 宇传华(yuchua@163.com)制作
2 1.41889 P(2) e 0.24198 0.24359, P(7) 1 P( x 6) 0.00067 2! 2 理论细胞计数为 0 的方格数应等于 0.24198×413=99.939,…。 因细胞计数为 5、6、7 的三组,理论频数均小于 5,故将这三组数据合并
解:如果家庭成员之间的发病与否(X)互 不影响,则X符合二项分布(两种互斥结果 、试验条件不变、各次试验独立)。也就 表明疾病不具有家族聚集性。
2014-7-16 华中科技大学同济医学院 宇传华(yuchua@163.com)制作
表 7.2 二项分布的拟合优度χ 检验计算表 2 2 每户发 观察 理论概率 理论 χ 分量 累计χ 值 病人数 家庭数 家庭数 (1) (2) (3) (4) (5) (6) 0 112 0.6360 95.4084 2.885 2.885 1 20 0.3106 46.5948 15.179 18.065 2 11 0.0505 7.5852 7.996 12.513 30.578 3 7 0.0027 0.4116 8 150 H0:该病分布服从二项分布,H1:不服从二项分布 α =0.05 发病总人数 0 112 1 20 2 11 3 7 63 ˆ 0.14 调查总人数 3 150 450 ˆ 1 0.14 0.86 1
可仿照上述二项分布、Poisson分 布的方法进行分布的拟合优度检验。
2014-7-16
华中科技大学同济医学院 宇传华(yuchua@163.com)制作
第三节 连续型随机变量分布的 拟合优度检验
一、采用卡方检验进行正态性检验 二、采用Shapiro-Wilk法进行正态性 检验 三、采用Kolmogorov-Smirnov法进行 正态性检验
O1 E1 E1
自由度
2
k 1 (计算理论分布时所用
参数的个数)
(Ok Ek ) 2 (O2 E2 ) 2 ... E2 Ek
(4) 确定概率 P 并作出统计推论。
2014-7-16
注意:理论频数不宜过小,否则需要合并 华中科技大学同济医学院 宇传华(yuchua@163.com)制作
Poisson 分布的拟合优度χ 检验计算表
理论概率 (Pi) (3) 0.24198 0.34335 0.24359 0.11521 0.04087 0.01160 0.00274 0.00067 理论 方格数 (Ei) (4) 099.939 141.802 100.601 047.580 016.878 004.790 001.133 6.201 000.278
一、二项分布的拟合优度检验
二、Poisson分布的拟合优度检验
2014-7-16
华中科技大学同济医学院 宇传华(yuchua@163.com)制作
一、二项分布的拟合优度检验
【例7.4】某研究人员在某地随机抽查了150 户3口之家,结果全家无某疾病有112户,家 庭中1人患病的有20户,2人患病的有11户, 3人全患病有7户,问该病在该地是否有家族 聚集性。