卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Pearson Chi-Square Continuity Correctiona Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases
.058
.041
a. Computed only for a 2x2 table b. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 4.67.
2016/3/1 医学统计学
甲 乙
99 75
5 21
13
Pearson 检验的基本公式
2
(公式7-1)
(A T) T
2
2
式中符号含义: A:实际频数,表中实际 发生的阳性或阴性频数 T:理论频数,按某H0假 设计算理论上的阳性或阴 性频数
(公式7-3)
TRC
2016/3/1
nR nC N
P=0.05的临界值
3
3.84
6
7.81
9 12 ¿ ¨· ½ Ö µ
12.59
15
18
6
医学统计学
不同χ2分布的界值(附表 8 )823页
附表 8
自由度 υ 1 2 3 4 5 6 7 8
2016/3/1
χ2 界值表
概率,P
0.995 0.990
…
0.100 0.050 0.025 2.71 3.84 5.99 7.81 5.02 7.38 9.35
本例ν=(2-1)×(2-1)=1
2016/3/1 医学统计学 18
本例
2
与
2 0.05, 比较,得到p值
2 2 12.86 0.05,1 3.84, P 0.05
12.86
2
2 0.01,1
6.63, P 0.01
5.结论:在=0.05水准上,p<0.01,拒绝H0, 两样本率差别有统计意义,具本例可认为试验 组对降低颅内压有效率高于对照组。
2016/3/1 医学统计学 17
Pearson
2
检验计算与步骤
1.建立假设: H0:1= 2 = c (两组总体率相等) H1:1 2 (两组总体率不等) 2. =0.05 2 ( A T ) 2 2 3.计算 统计量
T
4.确定概率(P)和自由度(ν) 自由度(ν)=(行数-1)×(列数-1)
男 B 16.80 37.6
疗效 X6 有效 有效 有效 无效
无效
2016/3/1
医学统计学
11
计数资料数据检验的列连表
两组或多组比较数据的交叉表 行(Row)×列(Column)表 行分类 列分类 (Y) 合计数 ( X) 阳性数 阴性数 甲组 A11 A12 n1 乙组 A21 A22 n2 合计 A11 + A21 A12+ A22 n
1)四格表形式
组别 甲组 乙组 合计 阳性数 a c a+c
各组样本例数是固定的
阴性数 合计 b a+b=n1 d c+d=n2 b+d N
率% a/n1 c/n2
2)四格表不配对资料检验的专用公式 (公式 7-4)
2 ( ad bc ) N 2 (a b)( a c)(c d )(b d )
T=n ×π
2 2
(99 90.48) (5 13.52) (75 83.52) (21 12.48) 12.86 90.48 13.52 83.52 12.48
2 2 2
TRC
2016/3/1
nR nC N
104 174 T11 90.48 医学统计学 200
2 i
f ( ) 2 ( / 2) 2
2
1
2
( / 2 1)
e
2 / 2
χ2分布是一个连续型变量的分布,分布的参数 2 2 2 2 为自由度 (ν) 。 2016/3/1 医学统计学 u u u 5
1 2 v
2分布的概率密度函数曲线
2.检验两个事物的分类是否独立
列连表数据 ( Contingency Table)
2016/3/1 医学统计学 9
2. χ2检验的基本思想
例7-1: 某院比较异梨醇(试验组)和氢氯塞嗪(对照 组)降低颅内压的疗效,将200名患者随机分为 两组,试验组104例中有效的99例,对照组96例中 有效的78例,问两种药物对降低颅内压疗效有无 差别? 数据整理为四格表形式(二维交叉表)
2
( 46 8 18 6 78 / 2) 78 (52) (26) (64) (14)
3.14 3.84
P>0.05
.
不校正χ2=4.35 p<0.05
2016/3/1 医学统计学
24
表7-2 数据用SPSS统计软件计算结果
Chi-Square Tests Value 4.353b 3.145 4.126 4.297 78 df 1 1 1 1 Asymp. Sig. (2-sided) .037 .076 .042 .038 Exact Sig. (2-sided) Exact Sig. (1-sided)
2016/3/1
医学统计学
25
第二节、配对设计两个样本率的χ2检验 ( McNemer检验 )
• 用途常用于比较两种检验方法或两种培养基的 阳性率是否有差别。 • 特点:对同一观察对象分别用两种方法处理, 观察其阳性与阴性结果。
• 资料整理为配对四格表形式.
2016/3/1 医学统计学 26
•
A:表示某组某分类的例数(频数)
2016/3/1 医学统计学 12
表7-1两组降低颅内压有效率比较
疗法 有效人数 试验组 99(A11) 对照组 75(A21) 合计 174 无效数 合计 有效率% 5(A12) 104 95.20 21(A22) 96 78.13 26 200 87.00
问:两组有效率差别是否是抽样误差或是不同药 物的作用? 组别 + — 四格表 的数字
2016/3/1 医学统计学 15
Class n Hypothesized Observed 试验组 104 有效概率π=0.87 99 试验组 无效概率π1=0.13 5 对照组 96 有效概率π=0.87 75 对照组 无效概率π1=0.13 21
2 ( A T ) 2 T
Expected=T 90.48 13.52 83.52 12.48
2 ( A T ) (实际数-理论数) 2 T 理论数
上述公式实际应用于检验计数资料组间率、构 成比一致程度的公式。
2016/3/1 医学统计学 8
Pearson
•
检验的用途
2
1. 用于检验计数资料的两组(多组)样本率 差别有无统计意义。
如二项分布数据 ( binomial proportions)
4.61 6.25 7.78
9.49 11.14
9.24 11.07 12.83 10.64 12.59 14.45 12.02 14.07 16.01 13.36 15.51 17.53
在υ=1,
2 医学统计学 2 0.05,1 0.05/ 2
u
1.96
2
K.Pearson的χ2统计量
• 1900年K.Pearson提出下述公式,在n≥40时 下式值与χ2分布近似,在理论数>5,近似程 度较好。
2 2
2016/3/1 医学统计学 22
三、四格表χ2 检验的校正公式
(两组不配对资料wk.baidu.com (1) 校正公式的条件: 1<T<5,同时N≥40,用校正公式计算 (2) 连续校正(continuity correction)公式:
2
( A T 0.5) 2 T
公式7-5
2
( ad bc N / 2) 2 N (a b)( a c)(c d )(b d )
第七章 检验
2
(chi-square test)
分类数据组间比较的假设检验
计数资料组间的比较
2016/3/1
医学统计学
1
第七章 2 检验内容
(计数资料组间的比较)
第一节 第二节 第三节 第四节 四格表资料的χ2检验* 配对四格表资料的χ 2检验* Fisher确切概率检验 行×列表资料的χ2检验*
16
假定两组总体率相等的理论数与实际数
组别 死亡人数 抗凝血组 20(20) 对照组 20(20) 合计 40
2
生存数 80(80) 80(80) 160
2
合计 死亡率% 100 20.0 100 20.0 200 20.0
(A T) T
0
2
Χ2检验是考察实际频数与假设理论频数是否一 致 的统计量。
• 二项分布的两个样本率的检验同样可用χ2检 验。
2016/3/1 医学统计学 3
第一节、四格表资料的 检验
2
一、χ2检验的基本思想
2016/3/1
医学统计学
4
1. 2 分布
1875年 F. Helmet提出2 统计量,设Xi为 来自正态总体的连续性变量。
xi 2 2 ( ) ui
2016/3/1 医学统计学 19
二、四格表资料 检验 2 (两组样本率间差别 检验)
2
两组样本率比较的设计分类: 1.两组(独立) 样本率的比较 组间数据是相互独立,非配对设计。 2.配对设计两组样本率的比较 组间数据是相关的。
2016/3/1 医学统计学 20
两组(不配对)样本率的比较
公式7-6
(3) 当T<1,或N<40,用 Fisher确切概率法 2016/3/1 医学统计学
23
表7-2 两药物治疗脑血管病有效率比较
组别 甲药 乙药 合计 有效数 46 18 64 无效数 6 8 (4.67) 14 合计 52 26 78
2
有效率% 88.46 69.23 82.05
校正公式
2016/3/1
2 ( A T ) 2 T 医学统计学
二者结果等价
21
表7-1两组降低颅内压有效率比较
疗法 有效人数 无效数 合计 试验组 99(a) 5(b) 104(a+b) 对照组 75(c) 21(d) 96 (c+d) 合计 174(a+c)26(b+d) 200 (N)
(99 21 5 75) 200 12.86 104 96 174 26
2016/3/1 医学统计学 10
表 100例高血压患者治疗后临床记录
编号
1 2 3 4 100
年龄 X1 37 45 43 59
54
性别 治疗组 舒张压 体温 X2 X3 X4 X5 男 A 11.27 37.5 女 B 12.53 37.0 男 A 10.93 36.5 女 B 14.67 37.8
第五节
第六节
多个样本率比较的χ2分割法
有序分组资料的线性趋势检验
第七节
2016/3/1
频数分布的拟合优度检验
医学统计学 2
*为重点掌握
概念回顾
• 在总体率为π的二项分布总体中做n1和n2抽 样,样本率p1和p2与π的差别,称为率抽样误 差。
• 在总体率为π1和π2的不同总体中抽样,得p1 和p2,在nπ>5,可通过率的u检验推断是否 π1=π2。 p1 p2 u s p1 p2
0.5 0.4 0.3
f ( ) 2 ( / 2) 2
2
1
2
( / 2 1)
e
2 / 2
ß ×· Ý
× Ô Ó É ¶ È £ ½ 1
0.2 0.1 0.0 0
2016/3/1
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
… … … … … … … … …
0.005 7.88 10.60 12.84 14.86 16.75 18.55 20.28 21.95
7
0.01 0.07 0.21 0.41 0.68 0.99 1.34
0.02 0.11 0.30 0.55 0.87 1.24 1.65
… … … … … … …
医学统计学
14
表7-1两组疗法降低颅内压有效率(%)
疗法 试验组 对照组 合计 有效人数 99(90.48) 75(83.52) 174 无效人数 合计 有效率 5(13.52) 104 95.2 21(12.48) 96 78.1 26 200 87.0
注:括号内为理论数(T)
假设: H0:1= 2 = c = 87.00 (两组总体有效率相等) H1:1 2 (两组总体有效率不等) 假定两组有效率均为174/200=87%