第09章新卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2)两种属性或两个变量之间有无关联性及相关 程度;
3)频数分布的拟合优度检验; 4)配对计数资料的两率之间有无差别的比较。
χ2检验的基本思想:
以χ2值的大小来反映理论频数(T)与实际频数 (A)的吻合程度。在零假设H0成立的条件下 (H0:π1=π2 ),实际频数和理论频数应该相差不 大,即χ2值不应该很大,若实际算出的χ2值较 大,超过了设定的检验水准所对应的界值,则有
T11
T12
T21
T22
(AT )2 , (行数-1)(列数1)
T
式中,A为实际频数(actual frequency) T为理论频数(theoretical frequency)
TRC
nRnC n
例7-2的计算结果
2
A11 T11 2 ( A12 T12 )2 ( A21 T21)2 ( A22 T22 )2
2分布曲线的特点:
1)χ2值不小于0,其取值范围为(0,∞); 2)χ2分布曲线形状随自由度υ而变化,即不
同的自由度有不同的曲线。
不同自由度的χ2分布右侧尾部面积为 a时的临界值记为χ2a,υ
卡方分布的一个基本性质:可加性
X1
~
2 1
,
X2
~
2 2
(X1 X2)
2 1 2
第二节 独立性检验
理由怀疑H0的真实性,从而拒绝H0 ,接受H1,即
π1≠π2 ,就有理由认为原假设不成立 。
第一节 2 分布
(1) 自由度为 1 的 2 分布
若 Z ~ N (0,1),则 Z 2的分布称为自由度为 1 的 2 分布.
(chi-square
distribution),记为
2 (1)
或
2
(1)
2
(ad bc)2n
(ab)(ac)(bd)(cd)
发生数 未发生数 合计
样本 1
a
b
a+b
样本 2
c
dBaidu Nhomakorabea
c+d
合 计 a+c
b+d
n
表 7-3 两 种 药 物 治 疗 消 化 道 溃 疡 效 果
处理
愈 合 未 愈 合 合 计 愈 合 率 (%)
洛赛克
64(a) 21(b) 85
75.29
雷 米 替 叮 51(c) 33(d)
84
60.71
合 计 115
54
169(n)
用 表 7-3 资 料 , 代 入 式 (7-10), 求 2 值 如 下 :
2 (64 33 21 51)2169 4.13 ,
85 84 115 54
与前面计算的结果一致。
3.四格表资料检验的连续性校正公式
c2
( A T 0.5)2 T
T11
T12
T21
T22
, (64 57.84)2 (21 27.16)2 (51 57.16)2 (33 26.84)2
4.13
57.84
27.16
57.16
26.84
(行数-1)(列数1) (21)(21) 1
因
2
4.13
2 0.05,1
3.84,
所以P
0.05,拒绝H
0
2. 四格表资料检验的专用公式
.
图形:从纵轴某个点开始单调下降,先凸后凹.
0.3
0.2
0.1
0.0
0
2
4
6
8
10
2 0.05(1)
3.84
(1.96)2
Z2 0.05 / 2
2 0.01(1)
6.63
(2.5758)2
Z2 0.01/ 2
(2) Z1, Z2,..., Z 互相独立,均服从 N (0,1),
则
Z12
Z
2 2
...
反应结果
观察
阳性
阳性
阴性
总频数
频率
样本 1
A11
A12
n1 ( 给 定 ) P1 A11 / n1
样本 2
A21
A22
n2 ( 给 定 ) P2 A21 / n2
合计
m1
m2
n ( 给 定 ) P m1 n
表 反应变量按二项分类的两个独立样本资料
反应结果
观察
阳性
阴性
总频数
样本 1
A11
A12
第九章 2 检验
χ2检验(Chi-square test)是现代统计学的
创始人之一,英国人Karl Pearson( 18571936 )于1900年提出的一种具有广泛用途的 统计方法,常用于计数资料的统计分析。
Karl Pearson
χ2检验的应用:
1)推断两个或多个相互独立的总体率与总体构 成比之间有无差别;
c2
=
(a
(|
ad
-
bc
|
-
n 2
)2
n
+b)(c + d )(a + c)(b+
d)
四格表资料 2 检验公式选择条件:
n≥40且T≥5, 专用公式或基本公式
n≥40但有1≤T<5,校正公式;Fisher确 切概率
Z2的分布称自由度为
的
2
分布,
记为
2 (
)
或
2
(
)
,或简记为
2
.
* 图形:单峰,正偏峰;
自由度 很大时, (2) 近似地服从正态分布.有
Z
(2
) 2
,
(2
)服从均数为,方差为2的正态分布
2分布是一种连续型随机变量的概率
分布,概率密度函数与自由度有关。
不同自由度有不同分布曲线,所以卡
方分布为一簇分布曲线 。
一、四格表(2×2表)卡方检验 二、行×列表(R×C表)卡方检验 三、配对四格表卡方检验
一、独立样本2×2列联表资料的χ2检验
目的:两独立样本率差异的比较。即根据两独 立样本的频率分布,检验两个样本的总 体分布是否相同。
一 、 四 格 表 (fourfold table)资 料 的 2 检 验 (两 个 样 本 率 的 比 较 )
表 7-2 两 种 药 物 治 疗 消 化 道 溃 疡 4 周 后 疗 效
处理 洛赛克 雷米替叮
合计
愈合
未愈合
64(57.84) 21(27.16)
51(57.16) 33(26.84)
115
54
合计 85 84
169
愈 合 率 (%) 75.29 60.71 68.05
表 反应变量按二项分类的两个独立样本资料
n1 (给定)
样本 2 合计
A21
A22
n2 (给定)
m1
m2
n (给定)
阳性 频率
P1 A11 / n1 P2 A21 / n2 P m1 n
H0 : 1 2 (分别为样本率P1、P2、P的总体率)
(1)检验 H1 : 1 2
0.05
(2)用 P m1 n 近似地代替 ,理论上应有:
T11
n1
n1m1 n
T12
n1(1 )
n1m2 n
T21
n2
n2 m1 n
T22
n2 (1 )
n2 m2 n
一般地,
理论频数
(行合计)(列合计) = nRnC
总计
n
1. 基本公式
2
A11 T11 2 ( A12 T12 )2 ( A21 T21)2 ( A22 T22 )2
3)频数分布的拟合优度检验; 4)配对计数资料的两率之间有无差别的比较。
χ2检验的基本思想:
以χ2值的大小来反映理论频数(T)与实际频数 (A)的吻合程度。在零假设H0成立的条件下 (H0:π1=π2 ),实际频数和理论频数应该相差不 大,即χ2值不应该很大,若实际算出的χ2值较 大,超过了设定的检验水准所对应的界值,则有
T11
T12
T21
T22
(AT )2 , (行数-1)(列数1)
T
式中,A为实际频数(actual frequency) T为理论频数(theoretical frequency)
TRC
nRnC n
例7-2的计算结果
2
A11 T11 2 ( A12 T12 )2 ( A21 T21)2 ( A22 T22 )2
2分布曲线的特点:
1)χ2值不小于0,其取值范围为(0,∞); 2)χ2分布曲线形状随自由度υ而变化,即不
同的自由度有不同的曲线。
不同自由度的χ2分布右侧尾部面积为 a时的临界值记为χ2a,υ
卡方分布的一个基本性质:可加性
X1
~
2 1
,
X2
~
2 2
(X1 X2)
2 1 2
第二节 独立性检验
理由怀疑H0的真实性,从而拒绝H0 ,接受H1,即
π1≠π2 ,就有理由认为原假设不成立 。
第一节 2 分布
(1) 自由度为 1 的 2 分布
若 Z ~ N (0,1),则 Z 2的分布称为自由度为 1 的 2 分布.
(chi-square
distribution),记为
2 (1)
或
2
(1)
2
(ad bc)2n
(ab)(ac)(bd)(cd)
发生数 未发生数 合计
样本 1
a
b
a+b
样本 2
c
dBaidu Nhomakorabea
c+d
合 计 a+c
b+d
n
表 7-3 两 种 药 物 治 疗 消 化 道 溃 疡 效 果
处理
愈 合 未 愈 合 合 计 愈 合 率 (%)
洛赛克
64(a) 21(b) 85
75.29
雷 米 替 叮 51(c) 33(d)
84
60.71
合 计 115
54
169(n)
用 表 7-3 资 料 , 代 入 式 (7-10), 求 2 值 如 下 :
2 (64 33 21 51)2169 4.13 ,
85 84 115 54
与前面计算的结果一致。
3.四格表资料检验的连续性校正公式
c2
( A T 0.5)2 T
T11
T12
T21
T22
, (64 57.84)2 (21 27.16)2 (51 57.16)2 (33 26.84)2
4.13
57.84
27.16
57.16
26.84
(行数-1)(列数1) (21)(21) 1
因
2
4.13
2 0.05,1
3.84,
所以P
0.05,拒绝H
0
2. 四格表资料检验的专用公式
.
图形:从纵轴某个点开始单调下降,先凸后凹.
0.3
0.2
0.1
0.0
0
2
4
6
8
10
2 0.05(1)
3.84
(1.96)2
Z2 0.05 / 2
2 0.01(1)
6.63
(2.5758)2
Z2 0.01/ 2
(2) Z1, Z2,..., Z 互相独立,均服从 N (0,1),
则
Z12
Z
2 2
...
反应结果
观察
阳性
阳性
阴性
总频数
频率
样本 1
A11
A12
n1 ( 给 定 ) P1 A11 / n1
样本 2
A21
A22
n2 ( 给 定 ) P2 A21 / n2
合计
m1
m2
n ( 给 定 ) P m1 n
表 反应变量按二项分类的两个独立样本资料
反应结果
观察
阳性
阴性
总频数
样本 1
A11
A12
第九章 2 检验
χ2检验(Chi-square test)是现代统计学的
创始人之一,英国人Karl Pearson( 18571936 )于1900年提出的一种具有广泛用途的 统计方法,常用于计数资料的统计分析。
Karl Pearson
χ2检验的应用:
1)推断两个或多个相互独立的总体率与总体构 成比之间有无差别;
c2
=
(a
(|
ad
-
bc
|
-
n 2
)2
n
+b)(c + d )(a + c)(b+
d)
四格表资料 2 检验公式选择条件:
n≥40且T≥5, 专用公式或基本公式
n≥40但有1≤T<5,校正公式;Fisher确 切概率
Z2的分布称自由度为
的
2
分布,
记为
2 (
)
或
2
(
)
,或简记为
2
.
* 图形:单峰,正偏峰;
自由度 很大时, (2) 近似地服从正态分布.有
Z
(2
) 2
,
(2
)服从均数为,方差为2的正态分布
2分布是一种连续型随机变量的概率
分布,概率密度函数与自由度有关。
不同自由度有不同分布曲线,所以卡
方分布为一簇分布曲线 。
一、四格表(2×2表)卡方检验 二、行×列表(R×C表)卡方检验 三、配对四格表卡方检验
一、独立样本2×2列联表资料的χ2检验
目的:两独立样本率差异的比较。即根据两独 立样本的频率分布,检验两个样本的总 体分布是否相同。
一 、 四 格 表 (fourfold table)资 料 的 2 检 验 (两 个 样 本 率 的 比 较 )
表 7-2 两 种 药 物 治 疗 消 化 道 溃 疡 4 周 后 疗 效
处理 洛赛克 雷米替叮
合计
愈合
未愈合
64(57.84) 21(27.16)
51(57.16) 33(26.84)
115
54
合计 85 84
169
愈 合 率 (%) 75.29 60.71 68.05
表 反应变量按二项分类的两个独立样本资料
n1 (给定)
样本 2 合计
A21
A22
n2 (给定)
m1
m2
n (给定)
阳性 频率
P1 A11 / n1 P2 A21 / n2 P m1 n
H0 : 1 2 (分别为样本率P1、P2、P的总体率)
(1)检验 H1 : 1 2
0.05
(2)用 P m1 n 近似地代替 ,理论上应有:
T11
n1
n1m1 n
T12
n1(1 )
n1m2 n
T21
n2
n2 m1 n
T22
n2 (1 )
n2 m2 n
一般地,
理论频数
(行合计)(列合计) = nRnC
总计
n
1. 基本公式
2
A11 T11 2 ( A12 T12 )2 ( A21 T21)2 ( A22 T22 )2