卡方拟合优度检验的原理与计算步骤
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0.05
(2)列出各组的实际频数与理论频数
(3) Pearson 2 统计量
2 P
k (实际频数-理论频数)2
i 1
理论频数
O1 E1 2 (O2 E2 )2 ... (Ok Ek )2
E1
E2
Ek
k 1 (计算理论分布时所用
自由度 参数的个数)
(4) 确定概率 P 并作出统计推论。
01121 20 211 3 7 3150
63 450
0.14
1ˆ 1 0.14 0.86
理论概率 P( X
0)
3 0
0.140
0.863
0.63606 ,…
理论家庭数=150*理论概率 =3-1-1=1。
χ20.05,1=3.84, ∴p<0.05,…具有家庭聚集性
二、Poisson分布的拟合优度检 验
【例7.3】将酵母细胞的稀释液置于某种计量 仪器上,数出每一小方格内的酵母细胞数, 共观察了413个小方格,结果见表7.3第1、2 列,试问该资料是否服从Poisson分布?
H0:方格内酵母细胞的个数服从 Poisson 分布;
H1:…个数不服从 Poisson 分布
α=0.05
理论概率 P( x) x e
18
卡方值
卡方分布下的检验水准及其临界值
第二节 离散型随机变量分布的 拟合优度检验
一、二项分布的拟合优度检验
二、Poisson分布的拟合优度检 验
一、二项分布的拟合优度检验
【例7.4】某研究人员在某地随机抽查了150 户3口之家,结果全家无某疾病有112户,家 庭中1人患病的有20户,2人患病的有11户, 3人全患病有7户,问该病在该地是否有家族 聚集性。
本章介绍的拟合优度检验方法
1. 卡方检验
2. 正态性检验的W法(Shapiro-wilk法)、D法 (Kolmogorov-Smirnov法)
第一节 卡方拟合优度检验 的原理与计算步骤
1. 原理
判断样本观察频数(Observed frequency )与理论(期望)频数(Expected frequency )
2!
2
理论细胞计数为 0 的方格数应等于 0.24198×413=99.939,…。
因细胞计数为 5、6、7 的三组,理论频数均小于 5,故将这三组数据合并
自由度=6-1-1=4。
2 0.05,4
9.49 ,本例 P
〉0.05,表示服从 Poisson 分布。
其他离散型变量分布的拟合优度检验
1. 二项分布 2. Poisson分布 3. 超几何分布 4. 负二项分布
可仿照上述二项分布、Poisson 分布的方法进行分布的拟合优度检验 。
第三节 连续型随机变量分布的 拟合优度检验
一、采用卡方检验进行正态性检验
二、采用Shapiro-Wilk法进行正态性
检验
三、采用Kolmogorov-Smirnov法进
行正态性检验
一、采用卡方检验进行正态性检验
例 7.5 下面是 150 名 10 岁儿童的 IQ 得分,请检验其是否服从正态分布
卡方拟合优度检验的原理与计算步骤
为什么要知道总体分布?
1. 参数统计学推断方法(如t检验、F检验)均以 服从某一分布(如正态分布)为假定条件。
2. 实际工作中需要了解样本观察频数( Observed frequency,简记为O)是否与某一理 论频数(Expected frequency,简记为E)相符 。
之差是否由抽样误差所引起。
数据格式与计算公式
类别或组段 观察频数
理论频数
1
O1
E1
2
O2
E2
…
…
…
k
Ok
Ek
问题:试判断这份样本,是否来自该理论分布?
P2
k
i1
(Oi Ei)2, Ei
a为参数的个数
k1a
注意:理论频数Ei不宜过 小(如不小于5),否则需 要合并组段!
2. 计算步骤
(1) H 0:样本的总体分布与该理论分布无区别 H1 :样本与该理论分布有区别
Oi Ei Oi Ei 2
(5)
(6)
Oi Ei 2
Ei
(7)
0 1 2 3 4 5 6 7 合计
103 0.24198 143 0.34335
98 0.24359 42 0.11521 18 0.04087
6 0.01160 2 0.00274 1 0.00源自文库67 413
099.939 141.802 100.601 047.580 016.878 004.790 001.133 000.278
解:如果家庭成员之间的发病与否(X)互 不影响,则X符合二项分布(两种互斥结果 、试验条件不变、各次试验独立)。也就 表明疾病不具有家族聚集性。
表 7.2 二项分布的拟合优度χ2 检验计算表
每户发 观察 理论概率 理论
χ2 分量
累计χ2 值
病人数 家庭数
家庭数
(1)
(2)
(3)
(4)
(5)
(6)
0
x!
fx 0 103 1143 7 1 586 1.41889
n
413
413
P(7)=0.000556
卡方分量
表 7.3 Poisson 分布的拟合优度χ2 检验计算表
方格内 细胞数
(X) (1)
实际 方格数 (Oi)
(2)
理论概率 (Pi) (3)
理论 方格数 (Ei)
(4)
112 0.6360 95.4084
2.885
2.885
1
20 0.3106 46.5948
15.179 18.065
2
11 0.0505
7.5852
3
7 0.0027
0.4116 7.996 12.513 30.578
150
8
H0:该病分布服从二项分布,H1:不服从二项分布
α=0.05
ˆ
发病总人数 调查总人数
6.201
3.061 1.198 2.601 5.580 1.122
2.799
09.3697 01.4352 06.7652 31.1364 01.2589
07.8344
0.09375 0.01012 0.06723 0.65446 0.07462
1.26461
2.16478
P(2) 2 e 1.418892 0.24198 0.24359, P(7) 1 P(x 6) 0.00067
注意:理论频数不宜过小,否则需要合并
χ2分布(chi-square distribution)
纵高
0.5 0.4 0.3 0.2 0.1 0.0
0
f(2)2(1/2)22(/21)e2/2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
1122.59 15
(2)列出各组的实际频数与理论频数
(3) Pearson 2 统计量
2 P
k (实际频数-理论频数)2
i 1
理论频数
O1 E1 2 (O2 E2 )2 ... (Ok Ek )2
E1
E2
Ek
k 1 (计算理论分布时所用
自由度 参数的个数)
(4) 确定概率 P 并作出统计推论。
01121 20 211 3 7 3150
63 450
0.14
1ˆ 1 0.14 0.86
理论概率 P( X
0)
3 0
0.140
0.863
0.63606 ,…
理论家庭数=150*理论概率 =3-1-1=1。
χ20.05,1=3.84, ∴p<0.05,…具有家庭聚集性
二、Poisson分布的拟合优度检 验
【例7.3】将酵母细胞的稀释液置于某种计量 仪器上,数出每一小方格内的酵母细胞数, 共观察了413个小方格,结果见表7.3第1、2 列,试问该资料是否服从Poisson分布?
H0:方格内酵母细胞的个数服从 Poisson 分布;
H1:…个数不服从 Poisson 分布
α=0.05
理论概率 P( x) x e
18
卡方值
卡方分布下的检验水准及其临界值
第二节 离散型随机变量分布的 拟合优度检验
一、二项分布的拟合优度检验
二、Poisson分布的拟合优度检 验
一、二项分布的拟合优度检验
【例7.4】某研究人员在某地随机抽查了150 户3口之家,结果全家无某疾病有112户,家 庭中1人患病的有20户,2人患病的有11户, 3人全患病有7户,问该病在该地是否有家族 聚集性。
本章介绍的拟合优度检验方法
1. 卡方检验
2. 正态性检验的W法(Shapiro-wilk法)、D法 (Kolmogorov-Smirnov法)
第一节 卡方拟合优度检验 的原理与计算步骤
1. 原理
判断样本观察频数(Observed frequency )与理论(期望)频数(Expected frequency )
2!
2
理论细胞计数为 0 的方格数应等于 0.24198×413=99.939,…。
因细胞计数为 5、6、7 的三组,理论频数均小于 5,故将这三组数据合并
自由度=6-1-1=4。
2 0.05,4
9.49 ,本例 P
〉0.05,表示服从 Poisson 分布。
其他离散型变量分布的拟合优度检验
1. 二项分布 2. Poisson分布 3. 超几何分布 4. 负二项分布
可仿照上述二项分布、Poisson 分布的方法进行分布的拟合优度检验 。
第三节 连续型随机变量分布的 拟合优度检验
一、采用卡方检验进行正态性检验
二、采用Shapiro-Wilk法进行正态性
检验
三、采用Kolmogorov-Smirnov法进
行正态性检验
一、采用卡方检验进行正态性检验
例 7.5 下面是 150 名 10 岁儿童的 IQ 得分,请检验其是否服从正态分布
卡方拟合优度检验的原理与计算步骤
为什么要知道总体分布?
1. 参数统计学推断方法(如t检验、F检验)均以 服从某一分布(如正态分布)为假定条件。
2. 实际工作中需要了解样本观察频数( Observed frequency,简记为O)是否与某一理 论频数(Expected frequency,简记为E)相符 。
之差是否由抽样误差所引起。
数据格式与计算公式
类别或组段 观察频数
理论频数
1
O1
E1
2
O2
E2
…
…
…
k
Ok
Ek
问题:试判断这份样本,是否来自该理论分布?
P2
k
i1
(Oi Ei)2, Ei
a为参数的个数
k1a
注意:理论频数Ei不宜过 小(如不小于5),否则需 要合并组段!
2. 计算步骤
(1) H 0:样本的总体分布与该理论分布无区别 H1 :样本与该理论分布有区别
Oi Ei Oi Ei 2
(5)
(6)
Oi Ei 2
Ei
(7)
0 1 2 3 4 5 6 7 合计
103 0.24198 143 0.34335
98 0.24359 42 0.11521 18 0.04087
6 0.01160 2 0.00274 1 0.00源自文库67 413
099.939 141.802 100.601 047.580 016.878 004.790 001.133 000.278
解:如果家庭成员之间的发病与否(X)互 不影响,则X符合二项分布(两种互斥结果 、试验条件不变、各次试验独立)。也就 表明疾病不具有家族聚集性。
表 7.2 二项分布的拟合优度χ2 检验计算表
每户发 观察 理论概率 理论
χ2 分量
累计χ2 值
病人数 家庭数
家庭数
(1)
(2)
(3)
(4)
(5)
(6)
0
x!
fx 0 103 1143 7 1 586 1.41889
n
413
413
P(7)=0.000556
卡方分量
表 7.3 Poisson 分布的拟合优度χ2 检验计算表
方格内 细胞数
(X) (1)
实际 方格数 (Oi)
(2)
理论概率 (Pi) (3)
理论 方格数 (Ei)
(4)
112 0.6360 95.4084
2.885
2.885
1
20 0.3106 46.5948
15.179 18.065
2
11 0.0505
7.5852
3
7 0.0027
0.4116 7.996 12.513 30.578
150
8
H0:该病分布服从二项分布,H1:不服从二项分布
α=0.05
ˆ
发病总人数 调查总人数
6.201
3.061 1.198 2.601 5.580 1.122
2.799
09.3697 01.4352 06.7652 31.1364 01.2589
07.8344
0.09375 0.01012 0.06723 0.65446 0.07462
1.26461
2.16478
P(2) 2 e 1.418892 0.24198 0.24359, P(7) 1 P(x 6) 0.00067
注意:理论频数不宜过小,否则需要合并
χ2分布(chi-square distribution)
纵高
0.5 0.4 0.3 0.2 0.1 0.0
0
f(2)2(1/2)22(/21)e2/2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
1122.59 15