统计学8 卡方检验课件
合集下载
医学统计学课件-卡方检验
理论数T
34.44 12.56 61.56 22.44
χ2检验的基本思想(2)
如果H0假设成立,则实际频数与理论频数应该比
较接近。差值 A T属于随机误差,用χ2 统计量表
示:
2
( A T )2 ~ 2分布 T
H0成立时,实际数与理论数的差别不会很大,出现较大χ2 值概率很小。 若P≤α,则拒绝H0; 若P>α,则尚无理由拒绝它。
按 = (2-1)×(2-1)= 1查附表3,2界值表,得 P>0.05。 按=0.05水准不拒绝H0,差别无统计学意义。
故尚不能认为单纯手术疗法与联合疗法对乳腺癌 患者治疗效果有差别。
总结
比较两个样本率所代表的总体率是否有差别, 实质是考察现有的样本频数分布是否与假设 下的理论频数分布间差异到底是否包含了本 质上的差异。
表 穿新旧两种防护服工人的皮肤炎患病率比较
防护服种类 阳性例数 阴性例数
合计 患病率(%)
新
1
14
15
6.7
旧
10
18
28
35.7
合计
11
32
43
25.6
χ2检验相关问题源自文库应用条件
H0:两组工人的皮肤炎患病率无差别,即π1=π2; H1:两组工人的皮肤炎患病率有差别,即π1≠π2;
=0.05。
最小的理论频数T11=15×11/43=3.84, 1<T11<5且 n=43>40,所以宜用χ2检验的校正公式。
秩和卡方检验课件PPT
在经济学研究中,秩和卡方检验常用于比较不同经济指标的分布或相关性。例如,比较不同国家的经济增长率与 失业率之间的关系,或比较不同行业的利润率与研发投入的关联性。此外,秩和卡方检验还可用于评估经济政策 或市场变化对经济指标的影响。
感谢您的观看
THANKS
当样本量较小,无法 满足参数检验的条件 时,可以考虑使用秩 和检验。
秩和检验的基本思想
将原始数据按照大小顺序排列, 并赋予秩次。
利用秩次的统计分析推断总体 分布情况。
通过比较两组或多组数据的秩 和,进行差异显著性检验。
02 卡方检验概述
定义与特点
定义
卡方检验是一种统计假设检验方 法,用于检验两个分类变量之间 是否独立。
03 秩和卡方检验的步骤
数据收集与整理
收集数据
数据编码
收集相关数据,确保数据来源可靠、 准确。
对分类变量进行编码,以便进行统计 分析。
数据整理
对数据进行整理,确保数据格式统一、 无缺失值。
建立假设
01
02
03
确定研究目的
明确研究目的,确定研究 假设。
建立假设
根据研究目的,建立原假 设和备择假设。
非参数方法
不需要假设数据符合特定的概率分布,具有更广泛的适用范围。
适用于小样本和偏态分布数据
由于是对秩次进行分析,因此对样本量和数据分布的要求相对较低。
感谢您的观看
THANKS
当样本量较小,无法 满足参数检验的条件 时,可以考虑使用秩 和检验。
秩和检验的基本思想
将原始数据按照大小顺序排列, 并赋予秩次。
利用秩次的统计分析推断总体 分布情况。
通过比较两组或多组数据的秩 和,进行差异显著性检验。
02 卡方检验概述
定义与特点
定义
卡方检验是一种统计假设检验方 法,用于检验两个分类变量之间 是否独立。
03 秩和卡方检验的步骤
数据收集与整理
收集数据
数据编码
收集相关数据,确保数据来源可靠、 准确。
对分类变量进行编码,以便进行统计 分析。
数据整理
对数据进行整理,确保数据格式统一、 无缺失值。
建立假设
01
02
03
确定研究目的
明确研究目的,确定研究 假设。
建立假设
根据研究目的,建立原假 设和备择假设。
非参数方法
不需要假设数据符合特定的概率分布,具有更广泛的适用范围。
适用于小样本和偏态分布数据
由于是对秩次进行分析,因此对样本量和数据分布的要求相对较低。
卡方检验 ppt课件
57.84
27.16
57.16
26.84
3.确定 P 值,做出推断
首先,按公式(9-2)计算自由度。这里 k = 4,计算 Ti 时利用样本资 料估计的参数个数有两个 1 和 2 ,故自由度为
ν= k-1-s=4-1-2 =1
14
查附表
8,20.05,
1
=
3.84。本例
2
=
4.13
>
2 0.05,
合计
m1 a c
m2 b d
n abcd
9
H0成立的条件下,四格表中每一格相应的理
论频数分别近似地等于
T11n1(mn1)n1nm1
,
T12n1(mn2)n1nm2
,
T21n2(m n1)n2nm1
T22n2(mn2)n2nm2
10
第二节 独立样本2×2列联表资料的2检验
例9-2 将病情相似的169名消化道溃疡患者随 机分成两组,分别用洛赛克与雷尼替丁两种药 物治疗,4周后疗效见表9-2。问两种药物治疗 消化道溃疡的愈合率有无差别?
0.2 0.1 0.0
3.84 6.565
23
四格表资料的2检验
(4)下结论
拒绝H0,两样本频率的差别具有统计学意义。 可以认为,兰芩口服液和银黄口服液的总体有 效概率不同。
24
卡方检验PPT课件
卡方检验
第三节 2 检验(Chi-square test)
1. 基本思想 2. 四格表资料的卡方检验 3. 配对设计分类变量资料的卡方检验 4. 行×列表资料Байду номын сангаас卡方检验
2
2检验(Chi-square test)
是现代统计学的创始人之一,英国 统计学家K.Pearson于1900年提出的 一种具有广泛用途的假设检验方法。 常用于分类变量资料的统计推断。
TRC
nRnC n
5
TRC
nRnC n
男生:理论感染人数 T11=80×36/165=17.45 理论未感染人数 T12=80×129/165=62.55
女生:理论感染人数 T21=85× 36/165=18.55 理论未感染人数 T22=85×129/165=66.45
感染人数 未感染人数 合计
85(c+d) 15.29
合计 36(a+c) 129(b+d) 165(a+b+c+d=n) 21.82
----2×2表或四格表 (fourfold table)
4
2检验的基本思想
某山区小学男女生的肺吸虫感染率比较
感染人数未感染人数 合计 感染率(%)
男生 23(a)
57 (b)
80(a+b) 28.75
第三节 2 检验(Chi-square test)
1. 基本思想 2. 四格表资料的卡方检验 3. 配对设计分类变量资料的卡方检验 4. 行×列表资料Байду номын сангаас卡方检验
2
2检验(Chi-square test)
是现代统计学的创始人之一,英国 统计学家K.Pearson于1900年提出的 一种具有广泛用途的假设检验方法。 常用于分类变量资料的统计推断。
TRC
nRnC n
5
TRC
nRnC n
男生:理论感染人数 T11=80×36/165=17.45 理论未感染人数 T12=80×129/165=62.55
女生:理论感染人数 T21=85× 36/165=18.55 理论未感染人数 T22=85×129/165=66.45
感染人数 未感染人数 合计
85(c+d) 15.29
合计 36(a+c) 129(b+d) 165(a+b+c+d=n) 21.82
----2×2表或四格表 (fourfold table)
4
2检验的基本思想
某山区小学男女生的肺吸虫感染率比较
感染人数未感染人数 合计 感染率(%)
男生 23(a)
57 (b)
80(a+b) 28.75
《卡方检验》课件
无法处理连续变量
卡方检验只能用于分类变量,对于连续变量则无法使用。
对数据独立性要求高
卡方检验要求数据之间相互独立,否则可能会导致结果偏差。
如何选择合适的统计方法
根据数据类型选择
对于分类数据,可以选择卡方检 验等方法进行分析;对于连续数 据,则可以选择回归分析等方法 。
根据研究目的选择
不同的研究目的需要选择不同的 统计方法,例如,如果想要比较 两组数据的差异,可以选择卡方 检验;如果想要预测一个变量的 值,则可以选择回归分析等方法 。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
P值的解释
在卡方检验中,P值用于解释卡方值的意义。如果卡方值对应的P值小于预设的显著性水 平,则可以认为卡方值显著,观测频数与期望频数之间的差异具有统计意义。
实际应用中的注意事项
样本量问题
在应用卡方检验时,需要注意样本量的大小。样本量过小可能导致卡方值不稳定,从而影响检验结果的准确性。因此 ,在分析时应确保样本量足够大。
卡方检验只能用于分类变量,对于连续变量则无法使用。
对数据独立性要求高
卡方检验要求数据之间相互独立,否则可能会导致结果偏差。
如何选择合适的统计方法
根据数据类型选择
对于分类数据,可以选择卡方检 验等方法进行分析;对于连续数 据,则可以选择回归分析等方法 。
根据研究目的选择
不同的研究目的需要选择不同的 统计方法,例如,如果想要比较 两组数据的差异,可以选择卡方 检验;如果想要预测一个变量的 值,则可以选择回归分析等方法 。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
P值的解释
在卡方检验中,P值用于解释卡方值的意义。如果卡方值对应的P值小于预设的显著性水 平,则可以认为卡方值显著,观测频数与期望频数之间的差异具有统计意义。
实际应用中的注意事项
样本量问题
在应用卡方检验时,需要注意样本量的大小。样本量过小可能导致卡方值不稳定,从而影响检验结果的准确性。因此 ,在分析时应确保样本量足够大。
卡方检验PPT课件
一致性检验
结果分析
❖ 如果在crosstab过程的 statistics子对话框中勾选上Kappa 复选框,则有以下结果:
Symmetric Measures
Asymp. ValueStd. ErrAaoprproAxb.pTprox. Sig.
Measure of AgKraepepmaent .455 .115 3.762 .000
两种方法的检测结果
免疫荧光法 + -
合计
乳胶凝集法
+
-
11
12
2
33
13
45
合计 23 35 58
配对卡方检验
首先建立数据文件,如下。
配对卡方检验
同理,由于是频数表数据,应该先用weight cases进行预 处理。
不能忘记 哦!
配对卡方检验
在此选入频数变量即可进 行下一步的分析。
配对卡方检验
单用药 物
合计
有效 42
疗效 无效 13
合计 55
48
3
51
90
16
106
四格表卡方检验
首先建立数据文件,如下。
四格表卡方检验
注意:由于上表给出的不是原始数据,而是频数表数据, 应该进行预处理。
四格表卡方检验
四格表卡方检验
四格表卡方检验
计数资料的统计描述与卡方检验课件
✓条件:比较双方应同质、同时、同地,比较 的两组应选用同一标准。
✓标准选用不同,标化率可不同。标准化率只 是两组的相对水平,不反映实际的情况,只 能用于比较。
✓总体标准化率比较也需进行假设检验。
(五)以率/比基础的二级指标
• 相对危险度(RR) • 比数比(OR) • 绝对危险度(AR) • NNT 用来表达危险度的大小或关联程度
OR、RR
• OR(比数比)、RR(相对危险度) • 适用条件:
对于RCT试验:可以计算OR、RR 对于病例对照研究:只能计算OR
1、相对危险度(率比)
组别 感染 未感染 合计 感染率
治疗组 a 对照组 c 合计 a+c
b
a+b
Pe
d
c+d
Pc
b+d a+b+c+d
RR(相对危险度)为治疗组与对照组的感染 率之比。RR=Pe/Pc
12
3
4?
采用哑变量方法:dummy variable
革阳菌的哑变量赋值为(1,0,0),革阴菌哑变量 赋值为(0,1,0),真菌哑变量赋值为(0,0,1)
一、计数资料的统计描述方法
(一)图表: 频数表,直条图,饼图
变量类型的判断
病例号
1 2 3 4 5 6 7 8 9
年龄 (岁)
35 44 26 25 41 45 50 28 31
✓标准选用不同,标化率可不同。标准化率只 是两组的相对水平,不反映实际的情况,只 能用于比较。
✓总体标准化率比较也需进行假设检验。
(五)以率/比基础的二级指标
• 相对危险度(RR) • 比数比(OR) • 绝对危险度(AR) • NNT 用来表达危险度的大小或关联程度
OR、RR
• OR(比数比)、RR(相对危险度) • 适用条件:
对于RCT试验:可以计算OR、RR 对于病例对照研究:只能计算OR
1、相对危险度(率比)
组别 感染 未感染 合计 感染率
治疗组 a 对照组 c 合计 a+c
b
a+b
Pe
d
c+d
Pc
b+d a+b+c+d
RR(相对危险度)为治疗组与对照组的感染 率之比。RR=Pe/Pc
12
3
4?
采用哑变量方法:dummy variable
革阳菌的哑变量赋值为(1,0,0),革阴菌哑变量 赋值为(0,1,0),真菌哑变量赋值为(0,0,1)
一、计数资料的统计描述方法
(一)图表: 频数表,直条图,饼图
变量类型的判断
病例号
1 2 3 4 5 6 7 8 9
年龄 (岁)
35 44 26 25 41 45 50 28 31
医学统计学--卡方检验
甲法
+ - 合计
表 两种血清学检查结果比较
乙法
+
-
45
22
6
20
51
42
合计
67 26 93
22
1. 建立假设检验,确定检验水准。 H 0: B ,C即两种方法的总体检测结果相同
H1: B ,C即两种方法的总体检测结果不相同
0.05
2. 计算统计量
由于 b c 2,8需作4连0续性校正,计算卡方值:
的Fisher确切概率法。
3.作出统计结论
以 =1查 界值表2 ,若
,按P 0.05检验水准拒0绝.05 ,
接受 ,可认为两总H体0 率不同;H若1
,按检验水准
不拒绝 ,P尚不0.能05认为两总体率不同。 0.05
H0
10
两样本率比较的资料,既可用 检验也可用u 检验来
推断两总体率2 是否有差别,且在不校正的条件下两种检验
时:用1四 T格表5资
料 检验的校正公式;或改2用四格表资料的Fisher确切概率法。
校正公式 校正公式
2 c
( A T 0.5) 2 T
c
2=
(a
(|a
d
-b
c|-
n 2
)2
n
+b)(c+d)(a+c)(b
医学统计学8课件
生物标志物与 诊断试剂研发
统计学方法在生物标志物 和诊断试剂的发现与验证 中发挥重要作用,如相关 性分析、受试者工作特性 曲线和ROC分析等
预后与生存分 公共卫生与流
析
行病学研究
运用统计学方法对患者的 预后情况和生存时间进行 分析和预测,如KaplanMeier分析和Cox比例风险 模型等
统计学方法在公共卫生和 流行病学研究中广泛应用 ,如描述性统计、队列研 究和病例对照研究等
Logistic回归分析
逻辑回归模型
逻辑回归模型是一种概率模型,用于预测 一个事件是否发生,以及其发生的概率。
似然比检验
似然比检验是用于比较两个模型或一组模 型之间的优劣程度,通过计算似然值来进 行比较。
05
实验设计
实验设计的原则和分类
实验设计原则
科学性、可行性、随机性、重复性、合理性。
实验设计分类
03
Hardy-Weinberg平衡定律可以用于评估遗传变异在群体中的分布情况,以及 推断基因型频率。
单基因遗传病分析
单基因遗传病是指由单个基因变异导致的疾病,如囊性 纤维化、血友病等。
单基因遗传病分析是遗传流行病学中的一项重要任务, 可以通过研究单基因遗传病的遗传模式和基因变异情况 ,了解其发病机制和病理生理过程。
2023
医学统计学8课件
目录
• 引言 • 基本概念 • 推断性统计分析 • 相关与回归分析 • 实验设计 • 临床试验设计 • 生存分析 • 遗传流行病学
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
nR nC
ν=(3-1)(2-1)=2
(3)查表得,P<0.005,按α=0.05水准,拒绝H0,接受H1, 差异具有统计学意义,可认为3种疗法的疗效不全相 同。
卡方分割
二、多个样本构成比的比较
例5 随机选择239例胃、十二指肠疾病患者和187例健康 输血员,其血型分布见表6。问胃、十二指肠疾病患者和 健康输血员血型分布有无差异?
z 推算理论频数 T = nRRnCC
n
表1 两种药物治疗牙科术后疼痛控制有效率的比较
处理
有效
无效
合计 有效率(%)
A药 68(63.71) 22(26.29) 90
75.56
B药 合计
58(62.29) 30(25.71) 88
126
52
178
65.91 70.79
卡方检验的基本公式:
χ 2 = ∑ (A − T )2
T
A:实际频数 T:理论频数
T = nRRnCC n
上 式 由 Pearson 提 出 , 因 此 常 称 这 种 检 验 为 Pearson卡方检验。
χ 2 = ∑ (A − T )2
T
χ2值反映了实际频数和理论频数吻合程度。A与T相差越大,则∑(AT)2越大,反之越小。
若H0成立,则4个格子的实际频数与理论频数相差不应很大,即χ2值不 应很大。χ2值越大,相应的P值就越小,若P<α,则A与T相差太大, 即推断H0成立是小概率事件,故拒绝H0,接受H1,认为π1≠π2。 同时,单元格越多,χ2值也会越大,因此,考虑χ2值的意义时,应同 时考虑到格子数(自由度)的影响。这样χ2值才能反映A与T的吻合程 度。
表6 239例胃、十二指肠疾病患者和187例健康输血员血型分布
分组
A
B AB O 合 计
胃、十二指肠疾病患者 47 66 20 106 239
健康输血员
52 54 19 62 187
合计
99 120 39 168 426
(1) H0 :胃、十二指肠疾病患者与健康输血员血型分布的构成相同 H1 :胃、十二指肠疾病患者与健康输血员血型分布的构成不同 α=0.05
校正公式: χ 2 = ∑ ( A − T − 0.5)2
T
χ 2 = ( ad − bc − n / 2)2 n
(a + b)(c + d )(a + c)(b + d )
例2 为观察甲、乙两药对治疗胃溃疡的疗效,将 70名患者随机分为两组,一组30人服用甲药,另 一组40人服用乙药,结果如表2。问两药的胃溃 疡治愈率有无差别?
63.71
26.29
62.29
25.71
= 2.00
ν =(2−1)(2−1) =1
(3)确定P值,做出推论
χ20.05,1 =3.84, χ20.01,1 =6.63
χ2=2.00 < χ20.05,1 =3.84,故P>0.05,不拒绝H0 ,差 异无统计学意义,尚不能认为两药疗效不同。
四格表专用公式:
§1 四格表资料的卡方检验
一. 卡方检验概述 (卡方分布、基本思想)
二. 四格表卡方检验的专用公式 三. 四格表卡方检验的校正公式
1、卡方分布
♦ 卡方分布是一种连续型随机变量的概率分布。 ♦ 卡方分布的形状依赖于自由度υ的大小。当υ>2
时,随着υ的增加,曲线逐渐趋于对称,当υ趋于 ∞时,卡方分布逼近于正态分布。 ♦ 各种自由度的卡方分布右侧尾部面积为α时的临界 值记为χ2α,υ 。
一、多个样本率的比较
行列表卡方检验的通式:
χ 2 = n(∑ A2 −1)
nR nC
ν =(R-1)(C-1)
例4 将133例尿路感染患者随机分为3组,甲组44例,乙 组45例,丙组44例,分别接受治疗。一个疗程后观察疗 效,结果如表5,问3种疗法的尿培养阴转率有无差别?
表5 三种疗法对尿路感染患者的治疗效果比较
由 R.A.Fisher 提 出 , 其理论依据是超几何 分 布 。 简 称 为 Fisher 确切概率法。
适用情况
z 适用条件:四格表中有理论频数小于1或n 小于40的情况;特别是用其它检验方法所
得的P值接近检验水准α时。
z 注意:不属于卡方检验,但是四格表卡方 检验的补充。
例 将23名精神抑郁症患者随机分到两组,分别接 受两种药物治疗,结果如下表,问两种药物的治疗 效果是否不同。
(1)写出统计分析的方法 (2)统计量值 (3)P值及结论
案例2
(1)该资料类型是什么?设计类型呢? (2)本研究是否需要进行连续性校正?为什么? (3)两组降低颅内压的总体有效率有无差别?(写出详细 假设检验步骤)
H1 :两种药物的治疗效果不等 α=0.05
(2)计算概率:在四格表边缘合计不变的情况下, 用依次增减样本四格表第一个格子的数据可得 到各种组合的四格表。
(3)确定P值,做出推断结论。 本例P=0.214>0.05,不拒绝H0,尚不能认为两 药的疗效不同。
§4 行列表资料的卡方检验
一. 多个样本率的比较 二. 多个样本构成比的比较 三. 双向无序分类资料的关联性检验 四. 行列表卡方检验的注意事项
注意:
本法一般用于样本含量不太大的资料。因为它仅考 虑了两法结果不一致的两种情况(b, c),而未考虑样 本含量n和两法结果一致的两种情况(a, d)。所以, 当n很大且a与d的数值很大(即两法的一致率较 高),b与c的数值相对较小时,即便是检验结果有 统计学意义,其实际意义往往也不大。
§3 Fisher确切概率法
(2)
χ 2 = n(∑ A2 −1) = 6.76
nR nC
ν=(4-1)(2-1)=3
(3) P>0.05,按α=0.05水准,不拒绝H0,差别无统计学意 义,尚不能认为胃、十二指肠疾病患者与健康输血 员血型分布的构成不同。
四、行列表卡方检验的注意事项
z 理论数不宜太小。(不能有1/5以上格子的理论频数小于5或者 有一个格子的理论频数小于1)
表 2 两种药物治疗胃溃疡的比较
药物 治愈
未愈 合计 有效率(%)
甲 2(2 25.29) 8(4.71) 30
73.33
乙 3(7 33.71) 3(6.29) 40
92.50
合计
59
11
70
84.29
1. 建立检验假设,确定检验水准 2. 计算检验统计量和自由度
(先计算理论频数T,根据T值选择计算公式)
《M《eMdiecdailcsatlastitsattiicssti》cs
χ2 检验
精选案例:injury.sav
χ2检验(Chi-square test)
是现代统计学的创始人之 一,英国统计学家 K.Pearson于1900年提出。 常用于分类变量资料的统 计推断。
理论依据:卡方分布和拟合优度检验
(1) H0 :两种方法检出率相同,即B = C H1 :两种方法检出率不同,即B ≠ C α=0.05
(2)
b+c =118>40
χ 2 = (110 − 8)2 = 88.17
(110 + 8)
(3)查表得,P<0.005,按α=0.05水准,拒绝H0,接受H1, 差别有统计学意义,可以认为两种方法的检出率不 同,甲法较高。
两种药物治疗精神抑郁症疗效比较
药物
甲药 乙药 合计
疗效
有效
无效
7
5
3
8
10
13
合计
12 11 23
在四格表的边缘合计不变的条件下,直 接计算各种事件发生的概率。
P(a) = (a + b)! (c + d )! (a + c)! (b + d )! a! b! c! d! n!
(1) H0 :两种药物的治疗效果相等
卡方检验的用途
♦ 两个总体率或构成比之间的比较 ♦ 多个总体率或构成比之间的比较 ♦ 两个分类变量之间的关联性检验 ♦ 趋势检验 ♦ 拟合优度检验等
内容提要
§ 1 四格表资料的卡方检验 § 2 配对四格表资料的卡方检验 § 3 Fisher确切概率法 § 4 行列表资料的卡方检验 § 5 多个样本率间的多重比较
χ2 =
(ad − bc)2 n
(a + b)(c + d )(a + c)(b + d )
本例, χ 2 = (68× 30 − 22× 58)2 ×178 = 2.00
90×88×126× 52
适用条件
♦ 当 n≥40 且 T≥5时,用基本公式或专用公式;若 P≈α,则改用四格表确切概率法;
z 对于单项有序行列表,在比较各处理组的效应有无差别时,应 该用秩和检验或Ridit检验;
z 多个样本率(构成比)比较的卡方检验,结论为拒绝H0时, 只能认为各总体率(总体构成比)有差别,但不能说明哪两者 之间有差别;若要进一步了解哪两者之间有差别,可用卡方分 割法,或者借鉴均数多重比较的原理。
理论频数太小的3种处理方法
(b + c) b + c < 40, χ 2 = ( b − c − 1)2
(b + c)
例3 某研究室用甲、乙两种血清学方法检查410 例确诊的鼻咽癌患者,结果如表4,问两种方法 检出率有无差别?
表4 两种血清学方法检验结果
甲
+ 合计
乙
+
-
261
110
8
31
269
141
合计
371 39 410
处理 有效 无效 合计 有效率(%)
A药 68 22 90 B药 58 30 88
75.56 65.91
合计 126 52 178
70.79
z 实际情况:
A药-75.56%;B药-65.91%
z 两样本率不同的可能原因:
差别仅由抽样误差所致 两种药物有效率确有不同
z 假 设 H0 成 立 , 即 两 药 物 有 效 率 相 同 , π 1= π2,即假设差别是由抽样所致。
3. 确定P 值,做出推论
不校正公式计算结果:
χ2 = 4.75
结 论
相
反
连续性校正卡方检验结果:
χ2 = 3.42
所以,一定要注意卡方检验的应用条件,这样才 不至于得出错误的结论。
结果表达:
A、B两组之间痊愈率比较,采用四格表卡方检验, 结 果 显 示 , χ 2 = 0.95 , P = 0.33 , 差 异 无 统 计 学 意 义,尚不能认为两组总体痊愈率有差异。
χ20.05,1 =3.84, χ20.01,1 =6.63
卡方分布
2、卡方检验的基本思想
例1 在某项治疗牙科术后疼痛控制的双盲临床研究中,将 178例患者随机分为两组,A药组90人,有效人数68人。 B组88人,有效人数58人。问两药有效率是否有差别?
表1 两种药物治疗牙科术后疼痛控制有效率的比较
疗法 阴转人数 阳性人数 合计 阴转率(%)
甲
30
14
44
68.2
乙
9
36
45
20.0
丙
32
12
44
wenku.baidu.com
72.7
合计 71
62 133
53.4
(1) H0 :3种疗法阴转率相同,即π1=π2 =π3 H1 :3种疗法阴转率不全相同,即π1,π2 ,π3不全相同 α=0.05
(2) χ 2 = n(∑ A2 −1) = 30.64
1) 增大样本含量,以达到增大理论频数的目 的;
2) 删去理论频数太小的格子对应的行或列; 3) 合理合并:结合专业,将理论频数太小的行
或列与性质相近的行或列合并。
§5 多个样本率间的多重比较
♦ 基本思想:重新规定检验水准,使得第一类错 误的概率保持不变。
α’=
α
比较的次数
案例讨论
案例1
♦ 为观察某新药的疗效,某厂家进行了随机双盲对 照临床实验,40例肝炎患者接受新药治疗,而30 例患者接受传统药物的治疗,对两组患者进行疗 效观察,结果见下表。
四格表资料
处理
+
A
a
B
c
合计
a+c
-
合计
b
a+b
d
c+d
b+d
n(a+b+c+d)
(1) 建立检验假设,确定检验水准
H0 :两药有效率相同,即π1=π2 H1 :两药有效率不同,即π1 ≠ π2 α=0.05
(2)计算检验统计量和自由度
n>40,Tmin>5
χ2 = (68−63.71)2 + (22−26.29)2 + (58−62.29)2 + (30−25.71)2
案例:湛江海大教职工脂肪肝患病情况调查
§2 配对四格表资料的卡方检验
原始数据
Id A B 1+ + 2+ …… j -+ …… n- -
表 3 配对四格表形式
甲
乙
合计
+
-
+
a
b
a+b
-
c
d
c+d
合计 a+c b+d
n
配对卡方检验又称McNemar检验:
b + c ≥ 40, χ 2 = (b − c)2
♦ 当n≥40且1≤T<5时,用校正公式; ♦ 当n<40或T<1时,不能用卡方检验,应当用四格
表确切概率法。
校正的目的: 英国统计学家(Yates)认为χ2分布是一种连续性分布,而四 格表中的资料属离散性分布,得到的χ2统计量的抽样分布 也是离散的。因此,为改善χ2统计量分布的连续性,建议 进行校正,又称Yates校正。
ν=(3-1)(2-1)=2
(3)查表得,P<0.005,按α=0.05水准,拒绝H0,接受H1, 差异具有统计学意义,可认为3种疗法的疗效不全相 同。
卡方分割
二、多个样本构成比的比较
例5 随机选择239例胃、十二指肠疾病患者和187例健康 输血员,其血型分布见表6。问胃、十二指肠疾病患者和 健康输血员血型分布有无差异?
z 推算理论频数 T = nRRnCC
n
表1 两种药物治疗牙科术后疼痛控制有效率的比较
处理
有效
无效
合计 有效率(%)
A药 68(63.71) 22(26.29) 90
75.56
B药 合计
58(62.29) 30(25.71) 88
126
52
178
65.91 70.79
卡方检验的基本公式:
χ 2 = ∑ (A − T )2
T
A:实际频数 T:理论频数
T = nRRnCC n
上 式 由 Pearson 提 出 , 因 此 常 称 这 种 检 验 为 Pearson卡方检验。
χ 2 = ∑ (A − T )2
T
χ2值反映了实际频数和理论频数吻合程度。A与T相差越大,则∑(AT)2越大,反之越小。
若H0成立,则4个格子的实际频数与理论频数相差不应很大,即χ2值不 应很大。χ2值越大,相应的P值就越小,若P<α,则A与T相差太大, 即推断H0成立是小概率事件,故拒绝H0,接受H1,认为π1≠π2。 同时,单元格越多,χ2值也会越大,因此,考虑χ2值的意义时,应同 时考虑到格子数(自由度)的影响。这样χ2值才能反映A与T的吻合程 度。
表6 239例胃、十二指肠疾病患者和187例健康输血员血型分布
分组
A
B AB O 合 计
胃、十二指肠疾病患者 47 66 20 106 239
健康输血员
52 54 19 62 187
合计
99 120 39 168 426
(1) H0 :胃、十二指肠疾病患者与健康输血员血型分布的构成相同 H1 :胃、十二指肠疾病患者与健康输血员血型分布的构成不同 α=0.05
校正公式: χ 2 = ∑ ( A − T − 0.5)2
T
χ 2 = ( ad − bc − n / 2)2 n
(a + b)(c + d )(a + c)(b + d )
例2 为观察甲、乙两药对治疗胃溃疡的疗效,将 70名患者随机分为两组,一组30人服用甲药,另 一组40人服用乙药,结果如表2。问两药的胃溃 疡治愈率有无差别?
63.71
26.29
62.29
25.71
= 2.00
ν =(2−1)(2−1) =1
(3)确定P值,做出推论
χ20.05,1 =3.84, χ20.01,1 =6.63
χ2=2.00 < χ20.05,1 =3.84,故P>0.05,不拒绝H0 ,差 异无统计学意义,尚不能认为两药疗效不同。
四格表专用公式:
§1 四格表资料的卡方检验
一. 卡方检验概述 (卡方分布、基本思想)
二. 四格表卡方检验的专用公式 三. 四格表卡方检验的校正公式
1、卡方分布
♦ 卡方分布是一种连续型随机变量的概率分布。 ♦ 卡方分布的形状依赖于自由度υ的大小。当υ>2
时,随着υ的增加,曲线逐渐趋于对称,当υ趋于 ∞时,卡方分布逼近于正态分布。 ♦ 各种自由度的卡方分布右侧尾部面积为α时的临界 值记为χ2α,υ 。
一、多个样本率的比较
行列表卡方检验的通式:
χ 2 = n(∑ A2 −1)
nR nC
ν =(R-1)(C-1)
例4 将133例尿路感染患者随机分为3组,甲组44例,乙 组45例,丙组44例,分别接受治疗。一个疗程后观察疗 效,结果如表5,问3种疗法的尿培养阴转率有无差别?
表5 三种疗法对尿路感染患者的治疗效果比较
由 R.A.Fisher 提 出 , 其理论依据是超几何 分 布 。 简 称 为 Fisher 确切概率法。
适用情况
z 适用条件:四格表中有理论频数小于1或n 小于40的情况;特别是用其它检验方法所
得的P值接近检验水准α时。
z 注意:不属于卡方检验,但是四格表卡方 检验的补充。
例 将23名精神抑郁症患者随机分到两组,分别接 受两种药物治疗,结果如下表,问两种药物的治疗 效果是否不同。
(1)写出统计分析的方法 (2)统计量值 (3)P值及结论
案例2
(1)该资料类型是什么?设计类型呢? (2)本研究是否需要进行连续性校正?为什么? (3)两组降低颅内压的总体有效率有无差别?(写出详细 假设检验步骤)
H1 :两种药物的治疗效果不等 α=0.05
(2)计算概率:在四格表边缘合计不变的情况下, 用依次增减样本四格表第一个格子的数据可得 到各种组合的四格表。
(3)确定P值,做出推断结论。 本例P=0.214>0.05,不拒绝H0,尚不能认为两 药的疗效不同。
§4 行列表资料的卡方检验
一. 多个样本率的比较 二. 多个样本构成比的比较 三. 双向无序分类资料的关联性检验 四. 行列表卡方检验的注意事项
注意:
本法一般用于样本含量不太大的资料。因为它仅考 虑了两法结果不一致的两种情况(b, c),而未考虑样 本含量n和两法结果一致的两种情况(a, d)。所以, 当n很大且a与d的数值很大(即两法的一致率较 高),b与c的数值相对较小时,即便是检验结果有 统计学意义,其实际意义往往也不大。
§3 Fisher确切概率法
(2)
χ 2 = n(∑ A2 −1) = 6.76
nR nC
ν=(4-1)(2-1)=3
(3) P>0.05,按α=0.05水准,不拒绝H0,差别无统计学意 义,尚不能认为胃、十二指肠疾病患者与健康输血 员血型分布的构成不同。
四、行列表卡方检验的注意事项
z 理论数不宜太小。(不能有1/5以上格子的理论频数小于5或者 有一个格子的理论频数小于1)
表 2 两种药物治疗胃溃疡的比较
药物 治愈
未愈 合计 有效率(%)
甲 2(2 25.29) 8(4.71) 30
73.33
乙 3(7 33.71) 3(6.29) 40
92.50
合计
59
11
70
84.29
1. 建立检验假设,确定检验水准 2. 计算检验统计量和自由度
(先计算理论频数T,根据T值选择计算公式)
《M《eMdiecdailcsatlastitsattiicssti》cs
χ2 检验
精选案例:injury.sav
χ2检验(Chi-square test)
是现代统计学的创始人之 一,英国统计学家 K.Pearson于1900年提出。 常用于分类变量资料的统 计推断。
理论依据:卡方分布和拟合优度检验
(1) H0 :两种方法检出率相同,即B = C H1 :两种方法检出率不同,即B ≠ C α=0.05
(2)
b+c =118>40
χ 2 = (110 − 8)2 = 88.17
(110 + 8)
(3)查表得,P<0.005,按α=0.05水准,拒绝H0,接受H1, 差别有统计学意义,可以认为两种方法的检出率不 同,甲法较高。
两种药物治疗精神抑郁症疗效比较
药物
甲药 乙药 合计
疗效
有效
无效
7
5
3
8
10
13
合计
12 11 23
在四格表的边缘合计不变的条件下,直 接计算各种事件发生的概率。
P(a) = (a + b)! (c + d )! (a + c)! (b + d )! a! b! c! d! n!
(1) H0 :两种药物的治疗效果相等
卡方检验的用途
♦ 两个总体率或构成比之间的比较 ♦ 多个总体率或构成比之间的比较 ♦ 两个分类变量之间的关联性检验 ♦ 趋势检验 ♦ 拟合优度检验等
内容提要
§ 1 四格表资料的卡方检验 § 2 配对四格表资料的卡方检验 § 3 Fisher确切概率法 § 4 行列表资料的卡方检验 § 5 多个样本率间的多重比较
χ2 =
(ad − bc)2 n
(a + b)(c + d )(a + c)(b + d )
本例, χ 2 = (68× 30 − 22× 58)2 ×178 = 2.00
90×88×126× 52
适用条件
♦ 当 n≥40 且 T≥5时,用基本公式或专用公式;若 P≈α,则改用四格表确切概率法;
z 对于单项有序行列表,在比较各处理组的效应有无差别时,应 该用秩和检验或Ridit检验;
z 多个样本率(构成比)比较的卡方检验,结论为拒绝H0时, 只能认为各总体率(总体构成比)有差别,但不能说明哪两者 之间有差别;若要进一步了解哪两者之间有差别,可用卡方分 割法,或者借鉴均数多重比较的原理。
理论频数太小的3种处理方法
(b + c) b + c < 40, χ 2 = ( b − c − 1)2
(b + c)
例3 某研究室用甲、乙两种血清学方法检查410 例确诊的鼻咽癌患者,结果如表4,问两种方法 检出率有无差别?
表4 两种血清学方法检验结果
甲
+ 合计
乙
+
-
261
110
8
31
269
141
合计
371 39 410
处理 有效 无效 合计 有效率(%)
A药 68 22 90 B药 58 30 88
75.56 65.91
合计 126 52 178
70.79
z 实际情况:
A药-75.56%;B药-65.91%
z 两样本率不同的可能原因:
差别仅由抽样误差所致 两种药物有效率确有不同
z 假 设 H0 成 立 , 即 两 药 物 有 效 率 相 同 , π 1= π2,即假设差别是由抽样所致。
3. 确定P 值,做出推论
不校正公式计算结果:
χ2 = 4.75
结 论
相
反
连续性校正卡方检验结果:
χ2 = 3.42
所以,一定要注意卡方检验的应用条件,这样才 不至于得出错误的结论。
结果表达:
A、B两组之间痊愈率比较,采用四格表卡方检验, 结 果 显 示 , χ 2 = 0.95 , P = 0.33 , 差 异 无 统 计 学 意 义,尚不能认为两组总体痊愈率有差异。
χ20.05,1 =3.84, χ20.01,1 =6.63
卡方分布
2、卡方检验的基本思想
例1 在某项治疗牙科术后疼痛控制的双盲临床研究中,将 178例患者随机分为两组,A药组90人,有效人数68人。 B组88人,有效人数58人。问两药有效率是否有差别?
表1 两种药物治疗牙科术后疼痛控制有效率的比较
疗法 阴转人数 阳性人数 合计 阴转率(%)
甲
30
14
44
68.2
乙
9
36
45
20.0
丙
32
12
44
wenku.baidu.com
72.7
合计 71
62 133
53.4
(1) H0 :3种疗法阴转率相同,即π1=π2 =π3 H1 :3种疗法阴转率不全相同,即π1,π2 ,π3不全相同 α=0.05
(2) χ 2 = n(∑ A2 −1) = 30.64
1) 增大样本含量,以达到增大理论频数的目 的;
2) 删去理论频数太小的格子对应的行或列; 3) 合理合并:结合专业,将理论频数太小的行
或列与性质相近的行或列合并。
§5 多个样本率间的多重比较
♦ 基本思想:重新规定检验水准,使得第一类错 误的概率保持不变。
α’=
α
比较的次数
案例讨论
案例1
♦ 为观察某新药的疗效,某厂家进行了随机双盲对 照临床实验,40例肝炎患者接受新药治疗,而30 例患者接受传统药物的治疗,对两组患者进行疗 效观察,结果见下表。
四格表资料
处理
+
A
a
B
c
合计
a+c
-
合计
b
a+b
d
c+d
b+d
n(a+b+c+d)
(1) 建立检验假设,确定检验水准
H0 :两药有效率相同,即π1=π2 H1 :两药有效率不同,即π1 ≠ π2 α=0.05
(2)计算检验统计量和自由度
n>40,Tmin>5
χ2 = (68−63.71)2 + (22−26.29)2 + (58−62.29)2 + (30−25.71)2
案例:湛江海大教职工脂肪肝患病情况调查
§2 配对四格表资料的卡方检验
原始数据
Id A B 1+ + 2+ …… j -+ …… n- -
表 3 配对四格表形式
甲
乙
合计
+
-
+
a
b
a+b
-
c
d
c+d
合计 a+c b+d
n
配对卡方检验又称McNemar检验:
b + c ≥ 40, χ 2 = (b − c)2
♦ 当n≥40且1≤T<5时,用校正公式; ♦ 当n<40或T<1时,不能用卡方检验,应当用四格
表确切概率法。
校正的目的: 英国统计学家(Yates)认为χ2分布是一种连续性分布,而四 格表中的资料属离散性分布,得到的χ2统计量的抽样分布 也是离散的。因此,为改善χ2统计量分布的连续性,建议 进行校正,又称Yates校正。