比较不错卡方检验及SPSS分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卡方检验及SPSS分析
Chi-Square Test
主要内容
第一节 第二节 第三节 第四节 第五节 四格表资料的 检验 2 检验 配对四格表资料的 四格表资料的Fisher确切概率法 2 检验 行×列表资料的 多个样本率间的多重比较
2
www.themegallery.com
SPSS统计分析
有效案例中的 N a. 不假定零假设。 b. 使用渐进标准误差假定零假设。
(b c) , 1 bc
2 2
2 c
( b c 1) bc
2
, =1
www.themegallery.com
注意:
本法一般用于样本含量不太大的资料。因为它仅
考虑了两法结果不一致的两种情况(b, c),而未考虑样
本含量n和两法结果一致的两种情况(a, d)。所以,当n
c2
( 12 2 1) 2 12 2
5.79
1
,查 2 界值表得 0.01 P 0.025 。
按 0.05 检验水准拒绝 H 0 ,接受 H 1 ,可 以认为两种方法的检测结果不同,免疫荧 光法的阳性检测率较高。
www.themegallery.com
交叉表(Crosstabs)过程 (一)四格表(fourfold data)资料的x2检验 (二)配对(paired daHale Waihona Puke Baidua)资料的x2检验 (三)R×C表资料的x2检验 (四)两分类变量有无关联分析及列联系数C 卡方(Chi-Square)过程 (五)拟合问题-比较样本与已知总体的分布
www.themegallery.com
√ Kappa
Crosstabs
统计量Statistics: √ McNemar
www.themegallery.com
一致性检验:计算Kappa系数 Kappa系数:为吻合度测量(measure of agreement) 系数,用以测量两个观测者或两观测设备之间的吻 合程度,取值在-1至+1之间,取值越大,说明吻合 程度越高。该系数利用了列联表的全部信息,包括 表格中的数据a和d。 Kappa≥0.75一致性好 0.75>Kappa ≥0.4一致性一般 Kappa<0.4一致性较差
SPSS操作过程
①建立数据文件:chis03.sav 数据格式:包括4行3列的频数格式,三个变量分别为行变量、 列变量和频数变量。 ②说明频数变量:数据 Data
加权个案
Weight Cases
③ x2检验:从菜单选择 分析
描述统计
交叉表
Analyze
Descriptive Statistics
www.themegallery.com
SPSS结果输出
group * effec t 交 叉 制 表 effect 有效 group 实验组 对照组 合计 计数 期望的计数 计数 期望的计数 计数 期望的计数 99 90.5 75 83.5 174 174.0 无效 5 13.5 21 12.5 26 26.0 合计 104 104.0 96 96.0 200 200.0
www.themegallery.com
SPSS结果输出
卡方检验 值 McNemar 检验 58 有效案例中的 N a. 使用的二项式分布。
对称度量 一致性度量 Kappa 值 .455 58
a 渐进标准误差 .115
精确 Sig. (双侧) .013 a
近似值 Tb 3.762
近似值 Sig. .000
描述统计
交叉表
Descriptive Statistics
Crosstabs
结合例7-1数据(chis01.sav)演示操作过程。
www.themegallery.com
分类数据录入格式
频数格式:用数据 加权个案(Weight Cases)过 程以指明反映频数的变量。
枚举格式:
www.themegallery.com
值的校正
2
四格表 检验的条件: n 40且T 5, 用不校正的 2公式; 1)
2
n 40且至少1个格子1 T 5, 用校正的 2公式; 2)
3)
n 40或T 1, 需用确切概率法
2
( A T 0.5) 2 T
校正公式:
2
( ad bc n / 2) 2 n (a b)(c d )( a c)(b d )
www.themegallery.com
Crosstabs过程祥解
界面说明 单元格(Cells)子对话框:用于定义列联表单元格 中需要计算的指标。 -Counts复选框:是否输出实际观察数(Observed) 和理论频数(Expected) -Percentages复选框:是否输出行百分数(Row)、 列百分数(Column)以及合计百分数(Total) -Residuals复选框:选择残差的显示方式 格式(Format)子对话框:用于选择行变量是升序 还是降序排列。
www.themegallery.com
Crosstabs过程祥解
界面说明
-[行Rows框]用于选择行×列表中的行变量。 -[列Columns框]用于选择行×列表中的列变量。
-[层Layer框]指定分层变量,即控制变量。如果要指定 不同的分层变量做分析,则将其选入Layer框,并 用Previous和Next钮设为不同层。
米松(对照组)降低颅内压的疗效。将200例颅内压增高症患
者随机分为两组,结果见表7-1。问两组降低颅内压的总体有 效率有无差别? 表7-1 两组降低颅内压有效率的比较
www.themegallery.com
χ 检验基本步骤
1. 建立检验假设
2
H0 : 两总体阳性率相等
H1 : 两总体阳性率不等
计算理论频数: T n R nc RC 2 n 统计量 2. 计算
www.themegallery.com
SPSS操作过程
①建立数据文件:chis01.sav
数据格式:包括4行3列的频数格式,3个变量即行变量 (group)、列变量(effect)和频数变量(freq)。
②说明频数变量:数据
Data Analyze
加权个案
Weight Cases
③ x2检验:从菜单选择 分析
x
2
值计算
2 2
(A T) Pearson卡方值: T
自由度: ( R 1)(C 1)
www.themegallery.com
www.themegallery.com
x
2 分布
x2
www.themegallery.com
实例分析
例7-1 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞
3.
确定 P 值,作出推论:
2
2
结论: 由于 > x( 0.05,1) 3.84 ,按 0.05 检验水准 拒绝 H 0 ,接受 H 1 ,可以认为两组降低颅内压总体 有效率不等, 即可认为异梨醇口服液降低颅内压的有 效率高于氢氯噻嗪+地塞米松的有效率。
www.themegallery.com
www.themegallery.com
第二节 配对四格表资料的 检验
2
x2 test of paired fourfold data
www.themegallery.com
实例分析
例7-3 某实验室分别用乳胶凝集法和免疫荧 光法对58名可疑系统红斑狼疮患者血清中
抗核抗体进行测定,结果见表7-3。问两种
①两种检测方法皆为阳性数(a); ②两种检测方法皆为阴性数(d); ③免疫荧光法为阳性,乳胶凝集法为 阴性数(b); ④乳胶凝集法为阳性,免疫荧光法为 阴性数(c)。
www.themegallery.com
其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。
检验统计量为
1 2 pc 1 2
(99 90.48) 2 (5 13.52) 2 (75 83.52) 2 (21 12.48) 2 2 90.48 13.52 83.52 12.48 12.86
(2 1)( 2 1) 1
www.themegallery.com
方法的检测结果有无差别?
www.themegallery.com
表7-3 两种方法的检测结果
免疫荧光法 + - 合计 乳胶凝集法 + 11(a) 2(c) 13 - 12(b) 33(d) 45 合计 23 35 58
www.themegallery.com
上述配对设计实验中,就每个对子而言, 两种处理的结果不外乎有四种可能:
www.themegallery.com
Crosstabs过程祥解
界面说明 -Kappa复选框:计算Kappa值,即内部一致性系数, 介于0~0.7071之间; -Risk复选框:计算比数比OR值、RR值; -McNemanr复选框:进行配对卡方检验的McNemanr 检验(一种非参数检验) -Cochran’s and Mantel-Haenszel statistics复选框: 计算X2M-H统计量、X2CMH,可在下方输出H0假设的 OR值,默认为1。
Pearson 卡方
a 连续校正
似然比 Fisher 的精确检验 线性和线性组合 有效案例中的 N a. 仅对 2x2 表计算
b. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 12.48。
结论:x2=12.857, df=1,双侧P<0.01,按照α=0.05检验水准,可 认为两组总体有效率差异显著,即试验组的疗效优于对照组。
-[Display clustered bar charts 复选框]:显示复式条图 -[Suppress table复选框]:不在输出结果中给出行×列 表。
www.themegallery.com
Crosstabs过程祥解
界面说明 精确(Exact)子对话框:针对2×2以上的行×列表 设计计算确切概率的方法。 统计量(Statistics)子对话框:用于定义所需计算 的统计量 -Chi-square 复选框:计算pearson卡方值,对四格表 资料自动给出校正卡方检验和确切概率法结果。 -Correlations复选框:计算行列变量的pearson相关系 数和Spearman等级相关系数。
www.themegallery.com
结果中的其他检验方法
连续性校正的卡方检验 Continuity Correction Fisher’s确切概率法 Fisher’s Exact Test 似然比卡方 Likelihood Ratio 线性相关性检验 Linear-by-Linear Association:仅 用于当两变量均为等级变量的资料。 注意检查样本例数n和理论频数T是否满足条件: N≥40且理论频数T≥5。
交叉表(Crosstabs)过程
Crosstabs过程用于对分类资料和有序分类资料进行 统计描述和统计推断。 该过程可以产生2维至n 维列联表,并计算相应的百 分数指标。 统计推断包括了常用的x2检验、Kappa值,分层X2 (X2M-H),以及四格表资料的确切概率(Fisher’s Exact Test)值。
www.themegallery.com
SPSS结果输出(续)
卡方检验 值 12.857 b 11.392 13.588 12.793 200 df 1 1 1 1 渐进 Sig. (双侧) .000 .001 .000 .001 .000 .000 精确 Sig. (双侧) 精确 Sig. (单侧)
第一节 四格表资料的 检验
2
x2 test of fourfold data
www.themegallery.com
目的:推断两个总体率(构成比)是否有差 别(和率的u检验等价) 要求:两样本的两分类个体数排列成四格表 资料
www.themegallery.com
一、x 检验的基本思想
2
很大且a与d的数值很大(即两法的一致率较高),b
与c的数值相对较小时,即便是检验结果有统计学意义,
其实际意义往往也不大。
www.themegallery.com
检验步骤: H 0 : B C , H 1 : B C , 0.05
b c 12 2 14 40 ,用校正公式
Chi-Square Test
主要内容
第一节 第二节 第三节 第四节 第五节 四格表资料的 检验 2 检验 配对四格表资料的 四格表资料的Fisher确切概率法 2 检验 行×列表资料的 多个样本率间的多重比较
2
www.themegallery.com
SPSS统计分析
有效案例中的 N a. 不假定零假设。 b. 使用渐进标准误差假定零假设。
(b c) , 1 bc
2 2
2 c
( b c 1) bc
2
, =1
www.themegallery.com
注意:
本法一般用于样本含量不太大的资料。因为它仅
考虑了两法结果不一致的两种情况(b, c),而未考虑样
本含量n和两法结果一致的两种情况(a, d)。所以,当n
c2
( 12 2 1) 2 12 2
5.79
1
,查 2 界值表得 0.01 P 0.025 。
按 0.05 检验水准拒绝 H 0 ,接受 H 1 ,可 以认为两种方法的检测结果不同,免疫荧 光法的阳性检测率较高。
www.themegallery.com
交叉表(Crosstabs)过程 (一)四格表(fourfold data)资料的x2检验 (二)配对(paired daHale Waihona Puke Baidua)资料的x2检验 (三)R×C表资料的x2检验 (四)两分类变量有无关联分析及列联系数C 卡方(Chi-Square)过程 (五)拟合问题-比较样本与已知总体的分布
www.themegallery.com
√ Kappa
Crosstabs
统计量Statistics: √ McNemar
www.themegallery.com
一致性检验:计算Kappa系数 Kappa系数:为吻合度测量(measure of agreement) 系数,用以测量两个观测者或两观测设备之间的吻 合程度,取值在-1至+1之间,取值越大,说明吻合 程度越高。该系数利用了列联表的全部信息,包括 表格中的数据a和d。 Kappa≥0.75一致性好 0.75>Kappa ≥0.4一致性一般 Kappa<0.4一致性较差
SPSS操作过程
①建立数据文件:chis03.sav 数据格式:包括4行3列的频数格式,三个变量分别为行变量、 列变量和频数变量。 ②说明频数变量:数据 Data
加权个案
Weight Cases
③ x2检验:从菜单选择 分析
描述统计
交叉表
Analyze
Descriptive Statistics
www.themegallery.com
SPSS结果输出
group * effec t 交 叉 制 表 effect 有效 group 实验组 对照组 合计 计数 期望的计数 计数 期望的计数 计数 期望的计数 99 90.5 75 83.5 174 174.0 无效 5 13.5 21 12.5 26 26.0 合计 104 104.0 96 96.0 200 200.0
www.themegallery.com
SPSS结果输出
卡方检验 值 McNemar 检验 58 有效案例中的 N a. 使用的二项式分布。
对称度量 一致性度量 Kappa 值 .455 58
a 渐进标准误差 .115
精确 Sig. (双侧) .013 a
近似值 Tb 3.762
近似值 Sig. .000
描述统计
交叉表
Descriptive Statistics
Crosstabs
结合例7-1数据(chis01.sav)演示操作过程。
www.themegallery.com
分类数据录入格式
频数格式:用数据 加权个案(Weight Cases)过 程以指明反映频数的变量。
枚举格式:
www.themegallery.com
值的校正
2
四格表 检验的条件: n 40且T 5, 用不校正的 2公式; 1)
2
n 40且至少1个格子1 T 5, 用校正的 2公式; 2)
3)
n 40或T 1, 需用确切概率法
2
( A T 0.5) 2 T
校正公式:
2
( ad bc n / 2) 2 n (a b)(c d )( a c)(b d )
www.themegallery.com
Crosstabs过程祥解
界面说明 单元格(Cells)子对话框:用于定义列联表单元格 中需要计算的指标。 -Counts复选框:是否输出实际观察数(Observed) 和理论频数(Expected) -Percentages复选框:是否输出行百分数(Row)、 列百分数(Column)以及合计百分数(Total) -Residuals复选框:选择残差的显示方式 格式(Format)子对话框:用于选择行变量是升序 还是降序排列。
www.themegallery.com
Crosstabs过程祥解
界面说明
-[行Rows框]用于选择行×列表中的行变量。 -[列Columns框]用于选择行×列表中的列变量。
-[层Layer框]指定分层变量,即控制变量。如果要指定 不同的分层变量做分析,则将其选入Layer框,并 用Previous和Next钮设为不同层。
米松(对照组)降低颅内压的疗效。将200例颅内压增高症患
者随机分为两组,结果见表7-1。问两组降低颅内压的总体有 效率有无差别? 表7-1 两组降低颅内压有效率的比较
www.themegallery.com
χ 检验基本步骤
1. 建立检验假设
2
H0 : 两总体阳性率相等
H1 : 两总体阳性率不等
计算理论频数: T n R nc RC 2 n 统计量 2. 计算
www.themegallery.com
SPSS操作过程
①建立数据文件:chis01.sav
数据格式:包括4行3列的频数格式,3个变量即行变量 (group)、列变量(effect)和频数变量(freq)。
②说明频数变量:数据
Data Analyze
加权个案
Weight Cases
③ x2检验:从菜单选择 分析
x
2
值计算
2 2
(A T) Pearson卡方值: T
自由度: ( R 1)(C 1)
www.themegallery.com
www.themegallery.com
x
2 分布
x2
www.themegallery.com
实例分析
例7-1 某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞
3.
确定 P 值,作出推论:
2
2
结论: 由于 > x( 0.05,1) 3.84 ,按 0.05 检验水准 拒绝 H 0 ,接受 H 1 ,可以认为两组降低颅内压总体 有效率不等, 即可认为异梨醇口服液降低颅内压的有 效率高于氢氯噻嗪+地塞米松的有效率。
www.themegallery.com
www.themegallery.com
第二节 配对四格表资料的 检验
2
x2 test of paired fourfold data
www.themegallery.com
实例分析
例7-3 某实验室分别用乳胶凝集法和免疫荧 光法对58名可疑系统红斑狼疮患者血清中
抗核抗体进行测定,结果见表7-3。问两种
①两种检测方法皆为阳性数(a); ②两种检测方法皆为阴性数(d); ③免疫荧光法为阳性,乳胶凝集法为 阴性数(b); ④乳胶凝集法为阳性,免疫荧光法为 阴性数(c)。
www.themegallery.com
其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。
检验统计量为
1 2 pc 1 2
(99 90.48) 2 (5 13.52) 2 (75 83.52) 2 (21 12.48) 2 2 90.48 13.52 83.52 12.48 12.86
(2 1)( 2 1) 1
www.themegallery.com
方法的检测结果有无差别?
www.themegallery.com
表7-3 两种方法的检测结果
免疫荧光法 + - 合计 乳胶凝集法 + 11(a) 2(c) 13 - 12(b) 33(d) 45 合计 23 35 58
www.themegallery.com
上述配对设计实验中,就每个对子而言, 两种处理的结果不外乎有四种可能:
www.themegallery.com
Crosstabs过程祥解
界面说明 -Kappa复选框:计算Kappa值,即内部一致性系数, 介于0~0.7071之间; -Risk复选框:计算比数比OR值、RR值; -McNemanr复选框:进行配对卡方检验的McNemanr 检验(一种非参数检验) -Cochran’s and Mantel-Haenszel statistics复选框: 计算X2M-H统计量、X2CMH,可在下方输出H0假设的 OR值,默认为1。
Pearson 卡方
a 连续校正
似然比 Fisher 的精确检验 线性和线性组合 有效案例中的 N a. 仅对 2x2 表计算
b. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 12.48。
结论:x2=12.857, df=1,双侧P<0.01,按照α=0.05检验水准,可 认为两组总体有效率差异显著,即试验组的疗效优于对照组。
-[Display clustered bar charts 复选框]:显示复式条图 -[Suppress table复选框]:不在输出结果中给出行×列 表。
www.themegallery.com
Crosstabs过程祥解
界面说明 精确(Exact)子对话框:针对2×2以上的行×列表 设计计算确切概率的方法。 统计量(Statistics)子对话框:用于定义所需计算 的统计量 -Chi-square 复选框:计算pearson卡方值,对四格表 资料自动给出校正卡方检验和确切概率法结果。 -Correlations复选框:计算行列变量的pearson相关系 数和Spearman等级相关系数。
www.themegallery.com
结果中的其他检验方法
连续性校正的卡方检验 Continuity Correction Fisher’s确切概率法 Fisher’s Exact Test 似然比卡方 Likelihood Ratio 线性相关性检验 Linear-by-Linear Association:仅 用于当两变量均为等级变量的资料。 注意检查样本例数n和理论频数T是否满足条件: N≥40且理论频数T≥5。
交叉表(Crosstabs)过程
Crosstabs过程用于对分类资料和有序分类资料进行 统计描述和统计推断。 该过程可以产生2维至n 维列联表,并计算相应的百 分数指标。 统计推断包括了常用的x2检验、Kappa值,分层X2 (X2M-H),以及四格表资料的确切概率(Fisher’s Exact Test)值。
www.themegallery.com
SPSS结果输出(续)
卡方检验 值 12.857 b 11.392 13.588 12.793 200 df 1 1 1 1 渐进 Sig. (双侧) .000 .001 .000 .001 .000 .000 精确 Sig. (双侧) 精确 Sig. (单侧)
第一节 四格表资料的 检验
2
x2 test of fourfold data
www.themegallery.com
目的:推断两个总体率(构成比)是否有差 别(和率的u检验等价) 要求:两样本的两分类个体数排列成四格表 资料
www.themegallery.com
一、x 检验的基本思想
2
很大且a与d的数值很大(即两法的一致率较高),b
与c的数值相对较小时,即便是检验结果有统计学意义,
其实际意义往往也不大。
www.themegallery.com
检验步骤: H 0 : B C , H 1 : B C , 0.05
b c 12 2 14 40 ,用校正公式