卡方检验的SPSS操作
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
似然比χ2检验:
当n>40,最小期望频数>5时,结论与Pearson χ2基本一致;
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
在Pearson卡方检验中,对行列变量的相关性作了检 验,其中的行列变量是一个事物的两个不同属性。 实际应用中,还有一种列联表,其中的行列变量反映的 是一个事物的同一属性。例如把每一份标本分为两份,分 别用两种方法进行化验,比较两种化验方法的结果是否有 本质不同;或分别采用甲、乙两种方法对同一批病人进行 检查,比较此两种方法的结果是否有本质不同,此时要用 配对卡方检验。 浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室 沈毅 沈毅
配对卡方检验
配对卡方检验公式:
若b+c>40,则用公式:
χ
2
(b − c ) = b + c
2
若b+c≤40,则用公式:
பைடு நூலகம்χ =
2
( b − c − 1) b+c
2
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
例2 某实验室分别用乳胶凝集法和免疫荧光法对58名
又如模拟值和实际值之间的检验
两种治疗方法的疗效比较
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
首先建立数据文件,如下。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
注意:由于上表给出的不是原始数据,而是频数表数据,应 该进行预处理。
沈毅 沈毅
卡方检验基础-卡方分布
当n比较大时, χ2 统计量近似服从k -1个自由度的χ2分布。 在自由度固定时,每个χ 2 值与一个概率值( P 值)相对 应,此概率值即为在H0 成立的前提下,出现这样一个样本 或偏离假设总体更远的样本的概率。如果 P 值小于或等于 显著性水准,则拒绝H0,接受H1,即观察频数与期望频数不 一致。如果 P 值大于显著性水准,则不拒绝H0 ,认为观察 频数与期望频数无显著性差异。 P 值越小,说明H0 假设正 确的可能性越小; P 值越大,说明H0 假设正确的可能性越 大。 浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室 沈毅 沈毅
1、方差同质性测验(又称Bartlett test):用于做正态性检验的条件。 无效假设:方差同质;(P<0.05) 备择假设,方差异质;(P>0.05) 2、适合性检验:Test for goodness-of-fit 无效假设:符合理论分布;(P<0.05) 备择假设,不符合理论分布;(P>0.05) 3、独立性检验:Test for independence,用于检验两个变数是否相关 无效假设:两个变数相互独立;不相关;(P<0.05) 备择假设,两个变数彼此相关;(P>0.05)
一致性检验
结果分析
如果在crosstab过程的 statistics子对话框中勾选上Kappa 复选框,则有以下结果:
Symmetric Measures Asymp. a b Value Std. ErrorApprox. T Approx. Sig. Measure of Agree Kappa N of Valid Cases a.Not assuming the null hypothesis. b.Using the asymptotic standard error assuming the null hypothesis. .455 58 .115 3.762 .000
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
一致性检验
一般认为, 当Kappa≥0.75时,表明两者一致性较好; 0.75>Kappa ≥0.4时,表明一致性一般; Kappa<0.4时,表明两者一致性较差。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
卡方检验基础 χ2检验的基本思想
首先假设H0成立,计算出χ2值,它表示观察值与理论值之间 的偏离程度。根据χ 2 分布,χ 2 统计量以及自由度可以确定 在H0成立的情况下获得当前统计量及更极端情况的概率P。 如果P 很小,说明观察值和理论值偏离程度太大,应当拒 绝原假设,表示比较资料之间有显著性差异;否则就不能 拒绝原假设,尚不能认为样本所代表的实际情况与理论假 设有差别。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
几种卡方检验的比较: 连续性校正χ2检验:
仅适用于四格表资料,在n>40,所有期望频数均大于1,只有1/5单元 格的期望频数大于1小于5时;
Fisher精确概率法:
在样本含量<40或有格子的期望频数<1的列联表,应该采用该法;
Value Pearson Chi-Square Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association McNemar Test N of Valid Cases a. Computed only for a 2x2 table 14.154b 14.550
沈毅 沈毅
配对卡方检验
首先建立数据文件,如下。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
同理,由于是频数表数据,应该先用weight cases进行预 处理。
不能忘记 哦!
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
在此选入频数变量即可进 行下一步的分析。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
一致性检验
注意:
Kappa检验会利用列联表的全部信息,而McNemar 检验 只会利用非主对角线单元格上的信息。因此,对于一 致性较好,即绝大多数数据都在主对角线的大样本列 联表,McNemar检验可能会失去实用价值。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
卡方检验基础-用途
检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态 分布,Possion分布等 检验某个分类变量各类的出现概率是否等于指定概率 检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关 检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是 否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关 检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊 断,其诊断结果是否一致
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
卡方检验基础
χ2值的计算:
( A − E) χ =∑ E
2
2
由英国统计学家Karl Pearson首次提出,故被 称为Pearson χ2 。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
其他的检验见下文。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室 沈毅 沈毅
卡方检验基础
χ2检验是以χ2分布为基础的一种假设检验方法,主 要用于分类变量,根据样本数据推断总体的分布与 期望分布是否有显著差异,或推断两个分类变量是 否相关或相互独立。其原假设为: H0:观察频数与期望频数没有差别
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
检验两个变量是否存在显著性差异
例1 某种药物加化疗与单用某种药物治疗的两 种处理方法,观察对某种癌症的疗效,结果见下 表。(数据见cancer.sav)
疗效 处理 药物加化疗 单用药物 合计 有效 42 48 90 无效 13 3 16 合计 55 51 106
沈毅 沈毅
一致性检验
在Pearson 卡方检验中,对行变量和列变量的相关性作检 验,其中行变量和列变量是一个事物的两个不同属性。 在实际中,还有一种列联表,其行变量和列变量反映的是 一个事物的同一属性的相同水平,只是对该属性各水平的 区分方法不同。其特征是:行的数目和列的数目总是相同 的。如果希望检验这两种区分同一属性的方法给出的结果 是否一致,则不应当使用Pearson χ2检验,而应该采用 Kappa一致性检验对两种方法一致程度进行评价。 浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室 沈毅 沈毅
a Continuity Correction 11.836
df
b. 0 cells (.0%) have expected count less than 5. The minimum expected count 16. c. Binomial distribution used.
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
卡方检验
`
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
内容提要
卡方检验基础 四格表卡方检验 配对卡方检验与一致性检验 两分类变量间关联程度的度量 分层卡方检验 小结
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
卡方检验用途:
可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结 果见下表,问两种方法的检测结果有无差别?(数据见 McNemar.sav)
两种方法的检测结果
乳胶凝集法 免疫荧光法 + - 合计 + 11 2 13 - 12 33 45 合计 23 35 58
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
两分类变量间关联程度的度量 χ2检验可以从定性的角度说明两个变量是否存在关联,当
拒绝原假设时,在统计上有把握认为两个变量存在相关。 但接下来的问题是,如果两变量之间存在相关性,它们之 间的关联程度有多大?针对不同的变量类型,在SPSS中可 以计算各种各样的相关指标,而且Crosstabs过程也对此提 供了完整的支持,此处只涉及两分类变量间关联程度的指 标,更系统的相关程度指标见相关与回归一章。
沈毅 沈毅
配对卡方检验
选中进行配对 卡方检验
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
配对卡方检验
Chi-Square Tests
结果分析
Asymp. Sig. Exact Sig. Exact Sig. (2-sided) (2-sided) (1-sided) 1 1 1 .000 .001 .000 .000 13.910 1 .000 .013c 58 .000
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
结果分析
表示药物加化疗与单用药物治疗某种癌症的疗效比较的行 ×列表,除了观察值以外,还有期望值。 浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室 沈毅 沈毅
四格表卡方检验
结果分析
此为四格表χ2检验的结果,χ2=6.508,P=0.011,差异有显著性 意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。