统计学:卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4581.25%=36.56
此结果称为理论频数,记为T11, 由上述计算过程可推出其它理论数为:
T12=8.44,T21=28.44,T22=6.56
则格子中理论频数和实际频数分别相对应:
41(36.56) 24(28.44) 4(8.44) 11(6.56)
2 检验统计量
经上述推导,两样本率的差别就演绎为实际数与理论数之间的差别。即,两样 本率相差越大,则实际数与理论数的差别就越大。实际数与理论数的差值A–T服 从2分布,在H0的条件下,上述差值是随机误差,统计量为:
2 i 1 k
Ai Ti ~ 2
Ti
,v
也称pe rson 统计量
2
v k 1 计算T 时利用样本资料估计的 参数个数
3.确定概率P值,做出推断结论
7 1
例7-1
对表7-1所示数据做正态分布拟合优度检验。
136例体模骨密度测量值的均数为1.26,标准差为0.01
2 统计学:
检验
( chi-square test )
要求:
1.理解2检验的基本思想和方法
2.熟练掌握四格表资料的2检验
3.掌握双向无序和有序的R×C表资料的2检验
4.了解fisher确切概率计算法
卡方检验的用途
卡方(x2)检验是一种用途较广的假设检验方法。可用于:
1.推断多个总体率(也适用于两个率)或总体构成比之间有无差别
H0:资料X~N(1.26 , 0.01) α=0.01
H1:资料X不服从N(1.26 , 0.01)
组段 (1) 1.228 观察频数A (2) 2 概率P(X) (3) 0.00397 理论频数T (4)=(3) ×n 0.5405 (A-T)2/T (5) 3.94143
1.234
1.240 1.246
本思想是以2 值来反映实际数与理论数的吻合程度,这里的理论数按某分
布的公式计算,在图形上是与实际散点与理论曲线的吻合程度,因而称之 为拟合优度检验。
拟合优度检验步骤
1. 建立检验假设
H0:研究的总体分布等于给定的理论分布
H1:研究的总体分布不等于给定的理论分布 2. 计算统计量
A表示频数,T表示理论频数,则大样本时统计量为:
需处理数 Number Needed to Treat, NNT
NNT=(有效率之差)-1=(p1-p2)-1
意义:为了增加一例有效者而需要改变治疗的人数。
NNT越小,差异的显著性越大。 上例,NNT=(91.11% – 68.57%)-1= 4.44
四格表资料 χ 2 检验的专用公式
2 ( ad bc ) n 2 x (a b)(c d )(a c)(b d )
2.判断两种属性或两个变量之间是否独立 3.资料分布的拟合性检验
第一节 一、χ 2 分布
频数分布拟合优度2 检验
goodness of fit 2 test for frequency distribution
χ 2分布是一种连续型随机变量的概率分布。
2 若Z i ~ N (0,1) , 则称 2 Z12 Z 2 Z 32 ... Z v2
2
7 17
0.01809
0.05801 0.13110
2.4601
7.8889 17.8924
0.08605
0.10016 0.03859
1.252
1.258 1.264 1.270 1.276 1.282 合计
25
37 25 16 4 1 136(n)
0.20888
0.23468 0.18592 0.10386 0.04090 0.01135 1.000
24 65
11 15
35 80
68.57 81.25
四格表资料
41 24
4 11
在表 7-2 中这四个格子的数据是基本的,其余数据都是由这 四个数据推算出来的,称之为四格表(fourfold table )。
不妨假设H0 为两率相等,且等于两样本合并的阳性率Pc=81.25%,按合计率推 算,本例第一行第一列理论上的阳性数为:
为服从自由度为v 的 2 分布。
2 记作 2 度 的大小,当自由度 2 时,随着 。 分布的形状依赖于自由
的增加,曲线逐步趋于 对称,当自由度无穷大 时, 2分布逼近正态分布。 各种自由度的 2分布右侧尾的面积为 的临界值见附表 8。
图7-1
不同自由度下 2 分布图
( A T )2 X T
2
v 1
本例的2 统计值为:
(41 36.56) (4 8.44) (24 28.44) 11 6.562 6.565 36.56 8.44 28.44 6.56
2 2 2 2
由此可见 ,2值是以理论数为基数的相对误差,它反映了实际数与理论数吻合的 程度。如果检验假设成立,则实际数与理论数的差别不会很大,出现大的2值的概率 P是很小的,若P检验水准,就怀疑假设,因而拒绝H0;反之不拒绝H0。 本例查表8,得P<0.025,按α=0.05水平拒绝H0,认为两药的总体有效率不等。
6.26692 6.35
2
2 0.5, 7
P 0.50
2
可认为资料 X ~ N 1.26 , 0.01
第二节 完全随机设计下两组频数分布的2检验
一、 二分类情形——2×2列联表
例7-2
慢性咽炎两种药物疗Hale Waihona Puke Baidu资料
药物
兰芩口服液
有效数
41
无效数
4
合计
45
有效率%
91.11
银黄口服液 合计
附表8卡方界值表
二、拟合优度检验
医学工作中,常需要判定某事物的频数分布是否符合某一理论分布,
如果符合就可以将它按此理论分布分析和处理资料。例如,判定资料符合
正态分布后,就可以对它按正态分布原理来研究它。正态性检验就是解决
这一问题,但只适合用于正态分布。
2 检验则广泛适用于二项分布和Poisson分布等常见的分布类型,其基
28.4083
31.9167 25.2855 14.1244 5.5618 1.5434 -
0.40892
0.80961 0.00322 0.24906 0.43858 0.19130 6.26692
分析
k 10
2 ( A T ) 2 6.26692 T
=组数-拟合分布的参数个数-1 =10-2-1=7