卡方拟合优度检验的原理与计算步骤
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因细胞计数为 5、6、7 的三组,理论频数均小于 5,故将这三组数据合并
自由度=6-1-1=4。
2 0.05,4
9.49 ,本例 P
〉0.05,表示服从 Poisson 分布。
2020/5/6
其他离散型变量分布的拟合优度检验
1. 二项分布 2. Poisson分布 3. 超几何分布 4. 负二项分布
方格内 细胞数
(X) (1)
0 1 2 3 4 5 6 7 合计
实际 方格数 (Oi)
(2)
103 143
98 42 18
6 2 1 413
理论概率 (Pi) (3)
0.24198 0.34335 0.24359 0.11521 0.04087 0.01160 0.00274 0.00067
理论 方格数 (Ei)
0.140
0.863
0.63606 ,…
理论家庭数=150*理论概率 =3-1-1=1。
χ20.05,1=3.84, ∴p<0.05,…具有家庭聚集性
2020/5/6
二、Poisson分布的拟合优度检验
【例7.3】将酵母细胞的稀释液置于某种计量 仪器上,数出每一小方格内的酵母细胞数, 共观察了413个小方格,结果见表7.3第1、2 列,试问该资料是否服从Poisson分布?
(4)
099.939 141.802 100.601 047.580 016.878 004.790 001.133 6.201 000.278
Oi Ei
(5) 3.061 1.198 2.601 5.580 1.122
2.799
Oi Ei 2
(6) 09.3697 01.4352 06.7652 31.1364 01.2589
0.5 0.4 0.3 0.2 0.1 0.0
0
f
( Βιβλιοθήκη Baidu)
1
2( / 2)
2
2
( / 21)
e2 / 2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
1122.59 15
18
卡方值
2020/5/6
卡方分布下的检验水准及其临界值
2020/5/6
第二节 离散型随机变量分布的 拟合优度检验
07.8344
Oi Ei 2 Ei
(7) 0.09375 0.01012 0.06723 0.65446 0.07462
1.26461
2.16478
P(2) 2 e 1.418892 0.24198 0.24359, P(7) 1 P(x 6) 0.00067
2!
2
理论细胞计数为 0 的方格数应等于 0.24198×413=99.939,…。
H0:方格内酵母细胞的个数服从 Poisson 分布;
H1:…个数不服从 Poisson 分布
α=0.05
理论概率 P( x) x e
x!
fx 0 103 1143 7 1 586 1.41889
n
413
413
2020/5/6
P(7)=0.000556
卡方分量
表 7.3 Poisson 分布的拟合优度χ2 检验计算表
2020/5/6
表 7.2 二项分布的拟合优度χ2 检验计算表
每户发 观察 理论概率 理论
χ2 分量
累计χ2 值
病人数 家庭数
家庭数
(1)
(2)
(3)
(4)
(5)
(6)
0
112 0.6360 95.4084
2.885
2.885
1
20 0.3106 46.5948
15.179 18.065
2
11 0.0505
2020/5/6
本章介绍的拟合优度检验方法 1. 卡方检验
2. 正态性检验的W法(Shapiro-wilk法)、D法( Kolmogorov-Smirnov法)
2020/5/6
第一节 卡方拟合优度检验 的原理与计算步骤
1. 原理
判断样本观察频数(Observed frequency) 与理论(期望)频数(Expected frequency )之差
一、二项分布的拟合优度检验 二、Poisson分布的拟合优度检验
2020/5/6
一、二项分布的拟合优度检验
【例7.4】某研究人员在某地随机抽查了150 户3口之家,结果全家无某疾病有112户,家 庭中1人患病的有20户,2人患病的有11户, 3人全患病有7户,问该病在该地是否有家族 聚集性。
解:如果家庭成员之间的发病与否(X)互 不影响,则X符合二项分布(两种互斥结果 、试验条件不变、各次试验独立)。也就 表明疾病不具有家族聚集性。
例 7.5 下面是 150 名 10 岁儿童的 IQ 得分,请检验其是否服从正态分布
125.9 143.8 66.1 118.5 84.0 83.9 77.6 90.9 86.6 85.5 92.6 93.7 102.0 98.0 99.4
总体分布的拟合优度检验 Goodness of Fit Test
for Distribution of Population
2020/5/6
为什么要知道总体分布?
1. 参数统计学推断方法(如t检验、F检验)均以 服从某一分布(如正态分布)为假定条件。
2. 实际工作中需要了解样本观察频数(Observed frequency,简记为O)是否与某一理论频数( Expected frequency,简记为E)相符。
7.5852
3
7 0.0027
0.4116 7.996 12.513 30.578
150
8
H0:该病分布服从二项分布,H1:不服从二项分布
α=0.05
ˆ
发病总人数 调查总人数
01121 20 211 3 7 3150
63 450
0.14
1ˆ 1 0.14 0.86
理论概率 P( X
0)
3 0
是否由抽样误差所引起。
2020/5/6
数据格式与计算公式
2 P
k i 1
(Oi
Ei )2 , Ei
a为参数的个数
2020/5/6
k 1 a
注意:理论频数Ei不宜过 小(如不小于5),否则需 要合并组段!
2. 计算步骤
2020/5/6
注意:理论频数不宜过小,否则需要合并
纵高
χ2分布(chi-square distribution)
可仿照上述二项分布、Poisson分 布的方法进行分布的拟合优度检验。
2020/5/6
第三节 连续型随机变量分布的 拟合优度检验
一、采用卡方检验进行正态性检验
二、采用Shapiro-Wilk法进行正态性
检验
三、采用Kolmogorov-Smirnov法进行
正态性检验
2020/5/6
一、采用卡方检验进行正态性检验