SPSS卡方检验操作大全
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
Chi-Square Tests
结果分析
Asymp. Sig. Exact Sig. Exact Sig. (2-sided) (2-sided) (1-sided) 1 1 1 .000 .001 .000 .000 13.910 1 .000 .013c 58 .000
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
在Pearson卡方检验中,对行列变量的相关性作了检 验,其中的行列变量是一个事物的两个不同属性。 实际应用中,还有一种列联表,其中的行列变量反映的 是一个事物的同一属性。例如把每一份标本分为两份,分 别用两种方法进行化验,比较两种化验方法的结果是否有 本质不同;或分别采用甲、乙两种方法对同一批病人进行 检查,比较此两种方法的结果是否有本质不同,此时要用 配对卡方检验。 浙江大学医学院流行病与卫生统计学教研室 沈毅
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
检验两个变量是否存在显著性差异
例1 某种药物加化疗与单用某种药物治疗的两 种处理方法,观察对某种癌症的疗效,结果见下 表。(数据见cancer.sav)
疗效 处理 药物加化疗 单用药物 合计 有效 42 48 90 无效 13 3 16 合计 55 51 106
其他的检验见下文。
浙江大学医学院流行病与卫生统计学教研室 沈毅
卡方检验基础
χ2检验是以χ2分布为基础的一种假设检验方法,主 要用于分类变量,根据样本数据推断总体的分布与 期望分布是否有显著差异,或推断两个分类变量是 否相关或相互独立。其原假设为: H0:观察频数与期望频数没有差别
浙江大学医学院流行病与卫生统计学教研室
浙江大学医学院流行病与卫生统计学教研室
沈毅
两分类变量间关联程度的度量
分别指定 行列变量到 Row(s)和 Columns中。
浙江大学医学院流行病与卫生统计学教研室
沈毅
两分类变量间关联程度的度量
选中可得到OR值
浙江大学医学院流行病与卫生统计学教研室
沈毅
两分类变量间关联程度的度量
结果分析
food * poison Crosstabulation poison Yes food Yes No Total Count Expected Count Count Expected Count Count Expected Count 10 6.4 6 9.6 16 16.0 No 30 33.6 54 50.4 84 84.0 Total 40 40.0 60 60.0 100 100.0
沈毅
四格表卡方检验
几种卡方检验的比较: 连续性校正χ2检验:
仅适用于四格表资料,在n>40,所有期望频数均大于1,只有1/5单元 格的期望频数大于1小于5时;
Fisher精确概率法:
在样本含量<40或有格子的期望频数<1的列联表,应该采用该法;
似然比χ2检验:
当n>40,最小期望频数>5时,结论与Pearson χ2基本一致;
沈毅
一致性检验
在Pearson 卡方检验中,对行变量和列变量的相关性作检 验,其中行变量和列变量是一个事物的两个不同属性。 在实际中,还有一种列联表,其行变量和列变量反映的是 一个事物的同一属性的相同水平,只是对该属性各水平的 区分方法不同。其特征是:行的数目和列的数目总是相同 的。如果希望检验这两种区分同一属性的方法给出的结果 是否一致,则不应当使用Pearson χ2检验,而应该采用 Kappa一致性检验对两种方法一致程度进行评价。 浙江大学医学院流行病与卫生统计学教研室 沈毅
卡方检验基础-用途
检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态 分布,Possion分布等 检验某个分类变量各类的出现概率是否等于指定概率 检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关 检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是 否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关 检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊 断,其诊断结果是否一致
沈毅
卡方检验基础 χ2检验的基本思想
首先假设H0成立,计算出χ2值,它表示观察值与理论值之间 的偏离程度。根据χ 2 分布,χ 2 统计量以及自由度可以确定 在H0成立的情况下获得当前统计量及更极端情况的概率P。 如果 P 很小,说明观察值和理论值偏离程度太大,应当拒 绝原假设,表示比较资料之间有显著性差异;否则就不能 拒绝原假设,尚不能认为样本所代表的实际情况与理论假 设有差别。
浙江大学医学院流行病与卫生统计学教研室
沈毅
卡方检验基础
χ2值的计算:
( A − E) χ =∑ E
2
2
由英国统计学家Karl Pearson首次提出,故被 称为Pearson χ2 。
浙江大学医学院流行病与卫生统计学教研室
沈毅
卡方检验基础-卡方分布
当n比较大时, χ2 统计量近似服从k -1个自由度的χ2分布。 在自由度固定时,每个χ 2 值与一个概率值( P 值)相对 应,此概率值即为在H0 成立的前提下,出现这样一个样本 或偏离假设总体更远的样本的概率。如果 P 值小于或等于 显著性水准,则拒绝H0,接受H1,即观察频数与期望频数不 一致。如果 P 值大于显著性水准,则不拒绝H0 ,认为观察 频数与期望频数无显著性差异。 P 值越小,说明H0 假设正 确的可能性越小; P 值越大,说明H0 假设正确的可能性越 大。 浙江大学医学院流行病与卫生统计学教研室 沈毅
结果分析
表示药物加化疗与单用药物治疗某种癌症的疗效比较的行 ×列表,除了观察值以外,还有期望值。 浙江大学医学院流行病与卫生统计学教研室 沈毅
四格表卡方检验
结果分析
此为四格表χ2检验的结果,χ2=6.508,P=0.011,差异有显著性 意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。
浙江大学医学院流行病与卫生统计学教研室
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
Value Pearson Chi-Square Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association McNemar Test N of Valid Cases a. Computed only for a 2x2 table 14.154b 14.550
不能忘记 哦!
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
在此选入频数变量即可进 行下一步的分析。
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
浙江大学医学院流行病与卫生统计学教研室
Βιβλιοθήκη Baidu
沈毅
配对卡方检验
选中进行配对 卡方检验
一致性检验
结果分析
如果在crosstab过程的 statistics子对话框中勾选上Kappa 复选框,则有以下结果:
Symmetric Measures Asymp. a b Value Std. ErrorApprox. T Approx. Sig. Measure of Agree Kappa N of Valid Cases a.Not assuming the null hypothesis. b.Using the asymptotic standard error assuming the null hypothesis. .455 58 .115 3.762 .000
卡方检验
`
浙江大学医学院流行病与卫生统计学教研室
沈毅
内容提要
卡方检验基础 四格表卡方检验 配对卡方检验与一致性检验 两分类变量间关联程度的度量 分层卡方检验 小结
卡方检验用途:
1、方差同质性测验(又称Bartlett test):用于做正态性检验的条件。 无效假设:方差同质;(P<0.05) 备择假设,方差异质;(P>0.05) 2、适合性检验:Test for goodness-of-fit 无效假设:符合理论分布;(P<0.05) 备择假设,不符合理论分布;(P>0.05) 3、独立性检验:Test for independence,用于检验两个变数是否相关 无效假设:两个变数相互独立;不相关;(P<0.05) 备择假设,两个变数彼此相关;(P>0.05)
两种方法的检测结果
乳胶凝集法 免疫荧光法 + - 合计 + 11 2 13 - 12 33 45 合计 23 35 58
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
首先建立数据文件,如下。
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
同理,由于是频数表数据,应该先用weight cases进行预 处理。
浙江大学医学院流行病与卫生统计学教研室
沈毅
一致性检验
一般认为, 当Kappa≥0.75时,表明两者一致性较好; 0.75>Kappa ≥0.4时,表明一致性一般; Kappa<0.4时,表明两者一致性较差。
浙江大学医学院流行病与卫生统计学教研室
沈毅
一致性检验
注意:
Kappa检验会利用列联表的全部信息,而McNemar 检验 只会利用非主对角线单元格上的信息。因此,对于一 致性较好,即绝大多数数据都在主对角线的大样本列 联表,McNemar检验可能会失去实用价值。
配对卡方检验
配对卡方检验公式:
若b+c>40,则用公式:
χ
2
(b − c ) = b + c
2
若b+c≤40,则用公式:
χ =
2
( b − c − 1) b+c
2
浙江大学医学院流行病与卫生统计学教研室
沈毅
配对卡方检验
例2 某实验室分别用乳胶凝集法和免疫荧光法对58名
可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结 果见下表,问两种方法的检测结果有无差别?(数据见 McNemar.sav)
a Continuity Correction 11.836
df
b. 0 cells (.0%) have expected count less than 5. The minimum expected count 16. c. Binomial distribution used.
浙江大学医学院流行病与卫生统计学教研室
浙江大学医学院流行病与卫生统计学教研室
沈毅
两分类变量间关联程度的度量 χ2检验可以从定性的角度说明两个变量是否存在关联,当
拒绝原假设时,在统计上有把握认为两个变量存在相关。 但接下来的问题是,如果两变量之间存在相关性,它们之 间的关联程度有多大?针对不同的变量类型,在SPSS中可 以计算各种各样的相关指标,而且Crosstabs过程也对此提 供了完整的支持,此处只涉及两分类变量间关联程度的指 标,更系统的相关程度指标见相关与回归一章。
浙江大学医学院流行病与卫生统计学教研室
沈毅
两分类变量间关联程度的度量
相对危险度RR:是一个概率的比值,指试验组人群反应阳性概率 与对照组人群反应阳性概率的比值。数值为1,表明试验因素与 反应阳性无关联;小于1时,表明试验因素导致反应阳性的发生 率降低;大于1时,表明试验因素导致反应阳性的发生率增加。 优势比OR:是一个比值的比,是反应阳性人群中试验因素有无的 比例与反应阴性人群中试验因素有无的比例之比。 当关注的事件发生概率比较小时(<0.1),优势比可作为相对危 险度的近似。
又如模拟值和实际值之间的检验
两种治疗方法的疗效比较
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
首先建立数据文件,如下。
浙江大学医学院流行病与卫生统计学教研室
沈毅
四格表卡方检验
注意:由于上表给出的不是原始数据,而是频数表数据,应 该进行预处理。
浙江大学医学院流行病与卫生统计学教研室
沈毅
浙江大学医学院流行病与卫生统计学教研室
沈毅
两分类变量间关联程度的度量
例3 某次食物中毒,现想通过调查发现,吃某海产品 (food)和食物中毒发生(poison)是否具有相关 性,以及吃了某食物的人是没吃海产品的人的几倍。 数据文件见poison.sav。
浙江大学医学院流行病与卫生统计学教研室
沈毅
两分类变量间关联程度的度量