卡方检验及SPSS分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 (AT0.5)2 T
2 (ad bcn/2)2n
(ab)c(d)a (c)b (d)
themegallery
SPSS操作过程
❖ ①建立数据文件:chis01.sav
数据格式:包括4行3列的频数格式,3个变量即行变量 (group)、列变量(effect)和频数变量(freq)。
第一节 四格表资料的 2 检验 x2 test of fourfold data
themegallery
目的:推断两个总体率(构成比)是否有差 别(和率的u检验等价)
要求:两样本的两分类个体数排列成四格表 资料
themegallery
一、x 2检验的基本思想
❖ x 2值计算
Pearson卡方值: 2
程以指明反映频数的变量。
❖ 枚举格式:
themegallery
交叉表(Crosstabs)过程
❖ Crosstabs过程用于对分类资料和有序分类资料进行 统计描述和统计推断。
❖该过程可以产生2维至n 维列联表,并计算相应的百 分数指标。
❖ 统计推断包括了常用的x2检验、Kappa值,分层X2 (X2M-H),以及四格表资料的确切概率(Fisher’s Exact Test)值。
效率高于氢氯噻嗪+地塞米松的有效率。
themegallery
2值的校正
❖ 四格表 2 检验的条件:
1) n40 且 T5,用不校 2 正 公的 式;
2) n4且 0 1 至 个少 1 格 T 子 5 ,用校 2 公 正 式
3) n40或T1,需用确切概率法 ❖ 校正公式:
用于当两变量均为等级变量的资料。
注意检查样本例数n和理论频数T是否满足条件: N≥40且理论频数T≥5。
themegallery
第二节 配对四格表资料的 2 检验
x2 test of paired fourfold data
themegallery
实例分析
例7-3 某实验室分别用乳胶凝集法和免疫荧 光法对58名可疑系统红斑狼疮患者血清中 抗核抗体进行测定,结果见表7-3。问两种 方法的检测结果有无差别?
(行数 1)(列数 1)
themegallery
一、多个样本率的比较
themegallery
themegallery
表7-3 两种方法的检测结果
免 疫 荧 光 法
乳 胶 凝 集 法
+
-
合 计
+
11( a)
12( b) 23
-
2( c)
33( d) 35
合 计
13
45
58
themegallery
上述配对设计实验中,就每个对子而言, 两种处理的结果不外乎有四种可能:
①两种检测方法皆为阳性数(a); ②两种检测方法皆为阴性数(d); ③免疫荧光法为阳性,乳胶凝集法为
df
(双侧) (双侧) (单侧)
1
.000
连续校正 a
11.392
1
.001
似然比
13.588
1
.000
Fisher 的精确检验
.001
.000
线性和线性组合 12.793
1
.000
有效案例中的 N
200
a. 仅对 2x2 表计算
b. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 12.48。
结论:x2=12.857, df=1,双侧P<0.01,按照α=0.05检验水准,可 认为两组总体有效率差异显著,即试验组的疗效优于对照组。
themegallery
结果中的其他检验方法
❖连续性校正的卡方检验 Continuity Correction ❖Fisher’s确切概率法 Fisher’s Exact Test ❖似然比卡方 Likelihood Ratio ❖线性相关性检验 Linear-by-Linear Association:仅
themegallery
卡方检验
SPSS结果输出
精确 Sig.
值
(双侧)
McNemar 检验
.013a
有效案例中的 N
58
a. 使用的二项式分布。
对称 度量
一致性度K量 appa
值 渐进标准近 误 a 似 差值 近b似 T 值 Sig.
.455
.115 3.762 .000
有效案例中的 N
58
a.不假定零假设。
b.使用渐进标准误差假定零假设。
结论:配对x2检验的P<0.05,可以认为两种方法的检测结果差别
显著,免疫荧光法的总体阳性检出率要高于乳胶凝集法;对两种 检测方法的一致性检验Kappa=0.455,P<0.01,说明两种方法的 吻合度有统计学意义,但吻合度一般。
themegallery
第四节
行×列表资料的 2 检验
卡方检验及SPSS分析
Chi-Square Test
主要内容
❖第一节 四格表资料的 2 检验 ❖第二节 配对四格表资料的 2 检验 ❖第三节 四格表资料的Fisher确切概率法 ❖第四节 行×列表资料的 2 检验 ❖第五节 多个样本率间的多重比较
themegallery
SPSS统计分析
test of R×C table
themegallery
行×列表资料
① 多个样本率比较时,有R行2列,称为R ×2表; ② 两个样本的构成比比较时,有2行C列,称2×C表; ③ 多个样本的构成比比较,以及双向无序分类资料关联
性检验时,称为R ×C表。
themegallery
检验统计量
2 n( A2 1) nR nC
themegallery
Crosstabs过程祥解
❖ 界面说明 -[行Rows框]用于选择行×列表中的行变量。 -[列Columns框]用于选择行×列表中的列变量。 -[层Layer框]指定分层变量,即控制变量。如果要指定
不同的分层变量做分析,则将其选入Layer框,并 用Previous和Next钮设为不同层。 -[Display clustered bar charts 复选框]:显示复式条图 -[Suppress table复选框]:不在输出结果中给出行×列 表。
列百分数(Column)以及合计百分数(Total) -Residuals复选框:选择残差的显示方式 ➢ 格式(Format)子对话框:用于选择行变量是升序
还是降序排列。
themegallery
SPSS结果输出
group* effect 交叉制表
group 实验组 计数
期望的计数
对照组 计数
期望的计数
❖②说明频数变量:数据 加权个案
Data Weight Cases
❖③ x2检验:从菜单选择 分析 描述统计 交叉表
Analyze Descriptive Statistics Crosstabs ❖ 结合例7-1数据(chis01.sav)演示操作过程。
themegallery
分类数据录入格式
❖频数格式:用数据 加权个案(Weight Cases)过
合计
计数
期望的计数
effect
有效
无效
99
5
90.5
13.5
75
21
83.5
12.5
174
26
174.0
26.0
合计 104
104.0 96
96.0 200
200.0
themegallery
SPSS结果输出(续)
卡方检验
Pearson 卡方
值 12.857b
渐进 Sig.精确 Sig.精确 Sig.
检验步骤:
H 0: B C , H 1 : B C , 0 .05
b c 12 2 14 40,用校正公式
2Fra Baidu bibliotekc
(12 2 1)2 12 2
5.79
1 ,查 2 界值表得0.01 P 0.025 。
按 0.05检验水准拒绝H0 ,接受H1 ,可
90.48
13.52
83.52
12.48
12.86
(21)2 (1)1
themegallery
3. 确定 P 值,作出推论:
结论:由于
2
>
x2 (0.05,1)
3.84 ,按
0.05 检验水准
拒绝 H 0 ,接受 H1 ,可以认为两组降低颅内压总体
有效率不等,即可认为异梨醇口服液降低颅内压的有
表7-1 两组降低颅内压有效率的比较
themegallery
χ 2检验基本步骤
1. 建立检验假设
H0 : 两总体阳性率相等 1 2 pc
H1 : 两总体阳性率不等 1 2
计算理论频数:
2. 计算 2 统计量
TRC
nR nc n
2(9990.48)2(513.52)2(7583.52)2(2112.48)2
算X2M-H统计量、X2CMH,可在下方输出H0假设的OR 值,默认为1。
themegallery
Crosstabs过程祥解
❖界面说明 ➢ 单元格(Cells)子对话框:用于定义列联表单元格
中需要计算的指标。 -Counts复选框:是否输出实际观察数(Observed)
和理论频数(Expected) -Percentages复选框:是否输出行百分数(Row)、
数和Spearman等级相关系数。
themegallery
Crosstabs过程祥解
❖界面说明 -Kappa复选框:计算Kappa值,即内部一致性系数,
介于0~0.7071之间; -Risk复选框:计算比数比OR值、RR值; -McNemanr复选框:进行配对卡方检验的McNemanr
检验(一种非参数检验) -Cochran’s and Mantel-Haenszel statistics复选框:计
❖ 交叉表(Crosstabs)过程 (一)四格表(fourfold data)资料的x2检验 (二)配对(paired data)资料的x2检验 (三)R×C表资料的x2检验 (四)两分类变量有无关联分析及列联系数C
❖ 卡方(Chi-Square)过程 (五)拟合问题-比较样本与已知总体的分布
themegallery
阴性数(b); ④乳胶凝集法为阳性,免疫荧光法为
阴性数(c)。
themegallery
其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。
检验统计量为
2 (b c)2 , 1
bc
2 c
( b c 1)2 bc
,
=1
themegallery
(AT)2 T
自由度: (R1)C (1)
themegallery
themegallery
x 2 分布
x2
themegallery
实例分析
例7-1 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞 米松(对照组)降低颅内压的疗效。将200例颅内压增高症患 者随机分为两组,结果见表7-1。问两组降低颅内压的总体有 效率有无差别?
注意:
本法一般用于样本含量不太大的资料。因为它仅 考虑了两法结果不一致的两种情况(b, c),而未考虑样 本含量n和两法结果一致的两种情况(a, d)。所以,当n 很大且a与d的数值很大(即两法的一致率较高),b 与c的数值相对较小时,即便是检验结果有统计学意义, 其实际意义往往也不大。
themegallery
Analyze Descriptive Statistics Crosstabs ❖ 统计量Statistics: √ McNemar
√ Kappa
themegallery
❖ 一致性检验:计算Kappa系数 ❖Kappa系数:为吻合度测量(measure of agreement)
系数,用以测量两个观测者或两观测设备之间的吻 合程度,取值在-1至+1之间,取值越大,说明吻合 程度越高。该系数利用了列联表的全部信息,包括 表格中的数据a和d。 ❖ Kappa≥0.75一致性好 0.75>Kappa ≥0.4一致性一般 Kappa<0.4一致性较差
themegallery
Crosstabs过程祥解
❖ 界面说明 ➢ 精确(Exact)子对话框:针对2×2以上的行×列表
设计计算确切概率的方法。 ➢ 统计量(Statistics)子对话框:用于定义所需计算
的统计量 -Chi-square 复选框:计算pearson卡方值,对四格表
资料自动给出校正卡方检验和确切概率法结果。 -Correlations复选框:计算行列变量的pearson相关系
以认为两种方法的检测结果不同,免疫荧
光法的阳性检测率较高。
themegallery
SPSS操作过程
❖ ①建立数据文件:chis03.sav 数据格式:包括4行3列的频数格式,三个变量分别为行变量、 列变量和频数变量。
❖ ②说明频数变量:数据 加权个案
Data Weight Cases
❖ ③ x2检验:从菜单选择 分析 描述统计 交叉表
2 (ad bcn/2)2n
(ab)c(d)a (c)b (d)
themegallery
SPSS操作过程
❖ ①建立数据文件:chis01.sav
数据格式:包括4行3列的频数格式,3个变量即行变量 (group)、列变量(effect)和频数变量(freq)。
第一节 四格表资料的 2 检验 x2 test of fourfold data
themegallery
目的:推断两个总体率(构成比)是否有差 别(和率的u检验等价)
要求:两样本的两分类个体数排列成四格表 资料
themegallery
一、x 2检验的基本思想
❖ x 2值计算
Pearson卡方值: 2
程以指明反映频数的变量。
❖ 枚举格式:
themegallery
交叉表(Crosstabs)过程
❖ Crosstabs过程用于对分类资料和有序分类资料进行 统计描述和统计推断。
❖该过程可以产生2维至n 维列联表,并计算相应的百 分数指标。
❖ 统计推断包括了常用的x2检验、Kappa值,分层X2 (X2M-H),以及四格表资料的确切概率(Fisher’s Exact Test)值。
效率高于氢氯噻嗪+地塞米松的有效率。
themegallery
2值的校正
❖ 四格表 2 检验的条件:
1) n40 且 T5,用不校 2 正 公的 式;
2) n4且 0 1 至 个少 1 格 T 子 5 ,用校 2 公 正 式
3) n40或T1,需用确切概率法 ❖ 校正公式:
用于当两变量均为等级变量的资料。
注意检查样本例数n和理论频数T是否满足条件: N≥40且理论频数T≥5。
themegallery
第二节 配对四格表资料的 2 检验
x2 test of paired fourfold data
themegallery
实例分析
例7-3 某实验室分别用乳胶凝集法和免疫荧 光法对58名可疑系统红斑狼疮患者血清中 抗核抗体进行测定,结果见表7-3。问两种 方法的检测结果有无差别?
(行数 1)(列数 1)
themegallery
一、多个样本率的比较
themegallery
themegallery
表7-3 两种方法的检测结果
免 疫 荧 光 法
乳 胶 凝 集 法
+
-
合 计
+
11( a)
12( b) 23
-
2( c)
33( d) 35
合 计
13
45
58
themegallery
上述配对设计实验中,就每个对子而言, 两种处理的结果不外乎有四种可能:
①两种检测方法皆为阳性数(a); ②两种检测方法皆为阴性数(d); ③免疫荧光法为阳性,乳胶凝集法为
df
(双侧) (双侧) (单侧)
1
.000
连续校正 a
11.392
1
.001
似然比
13.588
1
.000
Fisher 的精确检验
.001
.000
线性和线性组合 12.793
1
.000
有效案例中的 N
200
a. 仅对 2x2 表计算
b. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 12.48。
结论:x2=12.857, df=1,双侧P<0.01,按照α=0.05检验水准,可 认为两组总体有效率差异显著,即试验组的疗效优于对照组。
themegallery
结果中的其他检验方法
❖连续性校正的卡方检验 Continuity Correction ❖Fisher’s确切概率法 Fisher’s Exact Test ❖似然比卡方 Likelihood Ratio ❖线性相关性检验 Linear-by-Linear Association:仅
themegallery
卡方检验
SPSS结果输出
精确 Sig.
值
(双侧)
McNemar 检验
.013a
有效案例中的 N
58
a. 使用的二项式分布。
对称 度量
一致性度K量 appa
值 渐进标准近 误 a 似 差值 近b似 T 值 Sig.
.455
.115 3.762 .000
有效案例中的 N
58
a.不假定零假设。
b.使用渐进标准误差假定零假设。
结论:配对x2检验的P<0.05,可以认为两种方法的检测结果差别
显著,免疫荧光法的总体阳性检出率要高于乳胶凝集法;对两种 检测方法的一致性检验Kappa=0.455,P<0.01,说明两种方法的 吻合度有统计学意义,但吻合度一般。
themegallery
第四节
行×列表资料的 2 检验
卡方检验及SPSS分析
Chi-Square Test
主要内容
❖第一节 四格表资料的 2 检验 ❖第二节 配对四格表资料的 2 检验 ❖第三节 四格表资料的Fisher确切概率法 ❖第四节 行×列表资料的 2 检验 ❖第五节 多个样本率间的多重比较
themegallery
SPSS统计分析
test of R×C table
themegallery
行×列表资料
① 多个样本率比较时,有R行2列,称为R ×2表; ② 两个样本的构成比比较时,有2行C列,称2×C表; ③ 多个样本的构成比比较,以及双向无序分类资料关联
性检验时,称为R ×C表。
themegallery
检验统计量
2 n( A2 1) nR nC
themegallery
Crosstabs过程祥解
❖ 界面说明 -[行Rows框]用于选择行×列表中的行变量。 -[列Columns框]用于选择行×列表中的列变量。 -[层Layer框]指定分层变量,即控制变量。如果要指定
不同的分层变量做分析,则将其选入Layer框,并 用Previous和Next钮设为不同层。 -[Display clustered bar charts 复选框]:显示复式条图 -[Suppress table复选框]:不在输出结果中给出行×列 表。
列百分数(Column)以及合计百分数(Total) -Residuals复选框:选择残差的显示方式 ➢ 格式(Format)子对话框:用于选择行变量是升序
还是降序排列。
themegallery
SPSS结果输出
group* effect 交叉制表
group 实验组 计数
期望的计数
对照组 计数
期望的计数
❖②说明频数变量:数据 加权个案
Data Weight Cases
❖③ x2检验:从菜单选择 分析 描述统计 交叉表
Analyze Descriptive Statistics Crosstabs ❖ 结合例7-1数据(chis01.sav)演示操作过程。
themegallery
分类数据录入格式
❖频数格式:用数据 加权个案(Weight Cases)过
合计
计数
期望的计数
effect
有效
无效
99
5
90.5
13.5
75
21
83.5
12.5
174
26
174.0
26.0
合计 104
104.0 96
96.0 200
200.0
themegallery
SPSS结果输出(续)
卡方检验
Pearson 卡方
值 12.857b
渐进 Sig.精确 Sig.精确 Sig.
检验步骤:
H 0: B C , H 1 : B C , 0 .05
b c 12 2 14 40,用校正公式
2Fra Baidu bibliotekc
(12 2 1)2 12 2
5.79
1 ,查 2 界值表得0.01 P 0.025 。
按 0.05检验水准拒绝H0 ,接受H1 ,可
90.48
13.52
83.52
12.48
12.86
(21)2 (1)1
themegallery
3. 确定 P 值,作出推论:
结论:由于
2
>
x2 (0.05,1)
3.84 ,按
0.05 检验水准
拒绝 H 0 ,接受 H1 ,可以认为两组降低颅内压总体
有效率不等,即可认为异梨醇口服液降低颅内压的有
表7-1 两组降低颅内压有效率的比较
themegallery
χ 2检验基本步骤
1. 建立检验假设
H0 : 两总体阳性率相等 1 2 pc
H1 : 两总体阳性率不等 1 2
计算理论频数:
2. 计算 2 统计量
TRC
nR nc n
2(9990.48)2(513.52)2(7583.52)2(2112.48)2
算X2M-H统计量、X2CMH,可在下方输出H0假设的OR 值,默认为1。
themegallery
Crosstabs过程祥解
❖界面说明 ➢ 单元格(Cells)子对话框:用于定义列联表单元格
中需要计算的指标。 -Counts复选框:是否输出实际观察数(Observed)
和理论频数(Expected) -Percentages复选框:是否输出行百分数(Row)、
数和Spearman等级相关系数。
themegallery
Crosstabs过程祥解
❖界面说明 -Kappa复选框:计算Kappa值,即内部一致性系数,
介于0~0.7071之间; -Risk复选框:计算比数比OR值、RR值; -McNemanr复选框:进行配对卡方检验的McNemanr
检验(一种非参数检验) -Cochran’s and Mantel-Haenszel statistics复选框:计
❖ 交叉表(Crosstabs)过程 (一)四格表(fourfold data)资料的x2检验 (二)配对(paired data)资料的x2检验 (三)R×C表资料的x2检验 (四)两分类变量有无关联分析及列联系数C
❖ 卡方(Chi-Square)过程 (五)拟合问题-比较样本与已知总体的分布
themegallery
阴性数(b); ④乳胶凝集法为阳性,免疫荧光法为
阴性数(c)。
themegallery
其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。
检验统计量为
2 (b c)2 , 1
bc
2 c
( b c 1)2 bc
,
=1
themegallery
(AT)2 T
自由度: (R1)C (1)
themegallery
themegallery
x 2 分布
x2
themegallery
实例分析
例7-1 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞 米松(对照组)降低颅内压的疗效。将200例颅内压增高症患 者随机分为两组,结果见表7-1。问两组降低颅内压的总体有 效率有无差别?
注意:
本法一般用于样本含量不太大的资料。因为它仅 考虑了两法结果不一致的两种情况(b, c),而未考虑样 本含量n和两法结果一致的两种情况(a, d)。所以,当n 很大且a与d的数值很大(即两法的一致率较高),b 与c的数值相对较小时,即便是检验结果有统计学意义, 其实际意义往往也不大。
themegallery
Analyze Descriptive Statistics Crosstabs ❖ 统计量Statistics: √ McNemar
√ Kappa
themegallery
❖ 一致性检验:计算Kappa系数 ❖Kappa系数:为吻合度测量(measure of agreement)
系数,用以测量两个观测者或两观测设备之间的吻 合程度,取值在-1至+1之间,取值越大,说明吻合 程度越高。该系数利用了列联表的全部信息,包括 表格中的数据a和d。 ❖ Kappa≥0.75一致性好 0.75>Kappa ≥0.4一致性一般 Kappa<0.4一致性较差
themegallery
Crosstabs过程祥解
❖ 界面说明 ➢ 精确(Exact)子对话框:针对2×2以上的行×列表
设计计算确切概率的方法。 ➢ 统计量(Statistics)子对话框:用于定义所需计算
的统计量 -Chi-square 复选框:计算pearson卡方值,对四格表
资料自动给出校正卡方检验和确切概率法结果。 -Correlations复选框:计算行列变量的pearson相关系
以认为两种方法的检测结果不同,免疫荧
光法的阳性检测率较高。
themegallery
SPSS操作过程
❖ ①建立数据文件:chis03.sav 数据格式:包括4行3列的频数格式,三个变量分别为行变量、 列变量和频数变量。
❖ ②说明频数变量:数据 加权个案
Data Weight Cases
❖ ③ x2检验:从菜单选择 分析 描述统计 交叉表