第8章卡方检验 SPSS卫生统计学_
统计学方法总结2spss做卡方检验的方法
统计学方法总结2spss做卡方检验的方法第一篇:统计学方法总结2spss做卡方检验的方法通过看网上的spss教程,发现用spss做卡方检验有俩种方法,特简单介绍下,若有错漏请补充,安江。
以比较两个组别(实验组与对照组)的男女差异为例。
方法一、 如下图所示设置三个变量(组别、性别、人数)再给“组别”以及“性别”变量添加值点输入数据(我是随机的)④如下图进行数据加权(教程上要求有这步,原因不明,查了一下有人说是因为这些数据不是原始数据,而是频数表数据,所以要进行预处理)⑤依次打开:分析(analyze)--描述统计(descriptive)--交叉表(crosstabs),打开交叉表对话框,按图所示将“组别”“性别”分别添加进“行”“列”中,点击交叉表对话框里的“统计量”(statistics),勾选“卡方”以及“McNemar”,点击交叉表对话框里的“单元格”(cell),勾选“行”。
⑥点击“确定”,出现最后结果。
会出现三张表,主要看第三张表的pearson卡方检验,渐进sig(双侧)值大于0.05,因此认为不同的性别对两组无显著的差别。
最后还得看一下第三张表下面的a中小于5的理论频数不能超过20%,超过了则本次检验不正确,需要(1)增加样本含量,(2)进行合理合并或删除分类。
方法二、貌似方法二只适用于俩个变量的,列如比较若干组的人数差异性 如下图所示设置两个变量(组别、人数)再给“组别”变量添加值输入数据(我是随机的)④加权处理不知道需不需要,教程上并没有,不过方法一中的解释如果正确,那么次方法也是需要预处理的。
⑤找到非参数检验->旧对话框->卡方检验,将其单击单击打开,将“人数”添加到“检验变量列表”中,点击“选项”,勾选“描述性”⑥点击“确定”,出现最后结果。
会出现三张表,主要看第三张表的渐进显著性值小于0.05,因此认为人数对组别有显著的差别。
最后还得看一下第三张表下面的a中小于5的理论频数不能超过20%,超过了则本次检验不正确,需要(1)增加样本含量,(2)进行合理合并或删除分类。
卫生统计学卡方检验课件
2/19/2021
卫生统计学卡方检验
7
若H0成立,则理论上:
奥美拉唑组愈合人数:
115
T11
85 57.84 169
奥美拉唑组未愈合人数:
T12
8554 27.16 169
雷尼替丁组愈合人数:
T21
8411557.16 2/19/2012619
T nRnC n
雷尼替丁组未愈合人数:
T22
8454 26.84 169
2/19/2021
卫生统计学卡方检验
3
表1 两药治疗消化道溃疡4周后疗效
两组的愈合率不同有两种可能:
1. 两药的总体愈合率无差别,两样本率的差别仅由抽 样误差所致。
2. 两种药物的总体愈合率确有不同。
2/19/2021
卫生统计学卡方检验
4
一、卡方检验的基本思想
表1中,64、21、51、33 是整个表的基本数据,其余
卫生统计学卡方检验
8
TRC
nR nC n
n R 为相应行的合计
n C 为相应列的合计
n 为总例数。
2/19/2021
卫生统计学卡方检验
9
表1 两药治疗消化道溃疡4周后疗效
2/19/2021
卫生统计学卡方检验
10
2 检验的基本公式:
2 (AT)2
T
2/19/2021
从基本公式可以看出, 2 统计量值反映了实际频数和理 论频数的吻合程度。如果假设检验H0 (π1=π2)成立,则 实际频数和理论频数之差一 般不会相差太大, 2值相 应也不会太大; 反之,实际频数和理论频数之差相差 很大卫,生则统计 学2 值卡相方检应验也会很大,11 相应的P值也就越小,
卡方检验的SPSS操作
df
b. 0 cells (.0%) have expected count less than 5. The minimum expected count 16. c. Binomial distribution used.
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
又如模拟值和实际值之间的检验
两种治疗方法的疗效比较
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
首先建立数据文件,如下。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
注意:由于上表给出的不是原始数据,而是频数表数据,应 该进行预处理。
沈毅 沈毅
卡方检验基础-卡方分布
当n比较大时, χ2 统计量近似服从k -1个自由度的χ2分布。 在自由度固定时,每个χ 2 值与一个概率值( P 值)相对 应,此概率值即为在H0 成立的前提下,出现这样一个样本 或偏离假设总体更远的样本的概率。如果 P 值小于或等于 显著性水准,则拒绝H0,接受H1,即观察频数与期望频数不 一致。如果 P 值大于显著性水准,则不拒绝H0 ,认为观察 频数与期望频数无显著性差异。 P 值越小,说明H0 假设正 确的可能性越小; P 值越大,说明H0 假设正确的可能性越 大。 浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室 沈毅 沈毅
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
一致性检验
卫生统计学卡方检验
卫生统计学卡方检验
26/94
(一) 多个样本率比较
例3 某研究者欲比较A、B、C 三种方案治疗轻、中度 高血压疗效,将年纪在50~70岁240例轻、中度高血压患 者随机等分为3组,分别采取三种方案治疗。一个疗程 后观察疗效,结果见表11.4。问三种方案治疗轻、中度 高血压有效率有没有差异?
卫生统计学卡方检验
卫生统计学卡方检验
29/94
④ 确定P值
υ=(3-1)(2-1)=2,查 2 界值表得P<0.01。
⑤ 下结论
因为P<0.01,按α=0.05水准,拒绝H0,接收 H1,差异有统计学意义。即可认为三种方案治疗轻 、
中度高血压有效率不等或不全等
卫生统计学卡方检验
30/94
例 某市重污染区、普通污染区和农村出生婴儿致畸情 况以下表,问三个地域出生婴儿致畸率有没有差异?
① 建立假设 H0:π1=π2 H1:π1≠π2
② 确定检验水准
α=0.05
③ 计算统计量 2 值
2(2 62-73 6-7 1/2 )27 12 .7 5 3 33 86 29
④ 确定P值
υ=(2-1) (2-1)=1,查 2界值表得P>0.05。
卫生统计学卡方检验
24/94
⑤ 下结论 因为P>0.05,按α=0.05水准,不拒绝H0,差 异无统计学意义。尚不能认为甲、乙两疗法对小 儿单纯性消化不良治愈率不等。
9/94
TRC
nR nC n
n R 为对应行累计
n C 为对应列累计
n 为总例数。
卫生统计学卡方检验
10/94
表1 两药治疗消化道溃疡4周后疗效
卫生统计学卡方检验
11/94
卡方检验SPSS操作
卡方检验SPSS操作卡方检验是一种统计方法,用于比较观察频数与期望频数之间的差异是否显著。
它适用于比较两个或多个分类变量之间的关系,并确定这些变量是否相互独立。
在SPSS中,可以使用交叉表和卡方检验命令来执行卡方检验。
首先,打开SPSS软件并导入待分析的数据文件。
然后,选择“数据”菜单中的“交叉表”选项。
在弹出的交叉表对话框中,将要分析的变量拖拽到“行”和“列”的方框中。
假设我们要比较性别和喜好电影类型之间的关系,那么将性别拖拽到“行”,将电影类型拖拽到“列”。
接下来,在交叉表对话框中,点击“统计”按钮。
在弹出的统计对话框中,选择“卡方”选项,并点击“继续”按钮。
然后,点击“确定”按钮生成交叉表。
SPSS将显示交叉表的结果,包括观察频数、期望频数、卡方值和p值等。
在卡方检验中,我们通过观察频数和期望频数之间的差异来判断两个变量是否相关。
如果差异较大,卡方值较大,p值较小,则说明两个变量之间存在显著关系。
不管是使用交叉表还是描述统计方法进行卡方检验,都需要注意以下几点:1.样本数据应该是随机抽取的,并且足够大。
2.对于交叉表中的每个单元格,期望频数应当大于等于5,以确保卡方检验的可靠性。
3.卡方检验只能检验两个或多个分类变量之间的关系,不能用于比较连续变量。
4.如果卡方检验结果显著,表明两个变量之间存在关联,但不能确定关联的性质或因果关系。
卡方检验在数据分析中有着广泛的应用,可以用于医学研究、市场调查、社会科学等领域。
通过SPSS软件的操作,可以便捷地进行卡方检验,并获取检验结果。
spss卡方检验
Likelihood Ratio
73.739
9
.000
Linear-by -Linear
A s sociation
63.389
1
.000
N of Valid Cases
278
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5.42.
例6 某医院观察了三年间四个季节中四种甲状腺疾病检出情 况,整理资料如表6,问四种甲状腺疾病检出情况是否与 季节有关联?
表6 某院季节与甲状腺疾病检出情况关联性分析
甲状腺疾病分类
季节
合计
春
夏
秋
冬
甲亢
411
451
294
284
1440
亚甲炎
249
329
331
204
1113
甲低
60
61
59
52
232
甲状腺肿瘤
Estimate ln(Estimate) Std. Error of ln(Estimate)
2.791 1.026
.177
Asymp. Sig. (2-sided)
Asymp. 95% ConfidencCeommon Odds
Interval
Ratio
Lower Bound Upper Bound
*
卫生统计学教研组
SPSS卡方检验
河北医科大学公共卫生学院 卫生统计学教研组
内容
1
完全随机设计两样本率比较的假设检验
2
配对设计四格表资料的假设检验
3
医学统计学之卡方检验SPSS操作
Likelihood Ratio
3.159
3
.368
L i ne a r-b y-L i ne a r
Asso ci a tio n
2.358
1
.125
N of Valid Cases
280
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 6.43.
Descriptive Statistics
crosstabs…
25
步骤: 5、定义:行 (row=group)和列(Column= effect)
26
用Statistics 选择要输出的统计量, 选择Chi-square 。
27
检验结果
Co un t g rou p T o ta l
group * effect Crosstabulation
检验水准:a’=0.05/3=0.0167 40
X2=24.894,p=0.000,按a=0.0167水准, 拒绝H0,接受H1,差异有统计学意义, 可认为乙、丙两种疗法对尿路感染治疗效 果有差别,丙疗法优于乙疗法。
41
补充 P100 行×列表资料的x2检验 两组构成比的比较
步骤:1、定义变量并输入数据
Asso ci a ti on
20.217
1
.000
N of Valid Cases
44
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 8. 59.
第8章卡方检验 SPSS卫生统计学
结果
五、配对设计 (二)R×R列联表
例8-6
六、四格表的确切概率法(例8-7)
总例数小于40,且有1个格子的理论频数小 于5,读取fisher‘s exact test结果p=0.214
练习
课本169-171页 练习题1、3、5、6
课外延伸内容
Kappa一致性检验
用于检验两种方法结果的一致程度。 crosstabs→statictics:选Kappa exact:选exact
其他两两比较时
设定A组与C组比较 If:组别~=2 或者:If:组别=1∣组别=3
如果想对其中的两个率进行相 互比较时,最好能够采用更加复 杂的分类数据模型,如对数线性 模型或者logistic回归模型进行分 析。 采用列联表分割等方法只能得 到近似的结果。
五、配对设计 (一)配对设计四格表(2×2列联表)
3、anylyze→descriptive statistics→crosstabs
第一个表显示数据处理概况:有效数据 例数、无效数据例数、总例数
第二个表显示列联表的资料,一个期望频数小于5(4.8)
结论:有1个格子的期望频数大于1,小于5,最小 期望频数为4.80 连续校正卡方值(continuity correction) x2=2.624, p=0.105>0.05,差别没有统计学意义。
Kappa检验会利用列联表中的全部信息,而 McNemar检验只关心两者不一致的情况。 对于一致性较好,即绝大多数数据都在主对 角线上的大样本列联表, McNemar检验 可能会失去使用价值。 如对1万个案例进行一致性评价,9995个都 是完全一致的,显然,一致性相当的好, 但McNemar检验只考虑不一致的数据, 反而可能得出有差异的结论。
SPSS 卡方
表11-3 试验组与对照组疗效 组别 试验组 对照组 合计 有效 116 82 198 无效 4 35 39 合计 120 117 237 有效率(%) 96.67 70.09 83.54
“Crosstabs:Statistics”对话框
“Crosstabs:Cell Display”对话框
编号 白斑部位 正常部位 (1) 1 2 3 4 5 6 7 8 (2) 40.03 97.13 80.32 25.32 19.61 14.50 49.63 44.56 (3) 88.57 88.00 123.72 39.03 24.37 92.75 121.57 89.76
差值 d (4)=(3)-(2) 48.54 -17.13 43.40 13.71 4.76 78.25 71.94 45.20
SPSS 卡方检验
卫生统计学教研室 武振宇
zyw@
1. 无序分类资料的统计分析
在实际应用中,无序分类资料也是一种常 见的数据类型。比较变量之间不同水平下的频 数分布是否相同,常用卡方检验。 此外,卡方检验还可应用到拟合优度、 分析行变量与列变量之间是否独立性或一定的 相关性等。
血型 人数 O 50 A 70 B 50 AB 30 合计 200
1.1 四格表资料卡方检验
例11-2 某研究小组为研究慢支口服液II号对慢性支气管炎治疗效果,以口服消咳喘为对 照进行了临床试验,试验组120人、对照组117人(两组受试者病程、病情等均衡),疗程 2周,两组治疗后有效的患者分别为116人、82人。问慢支口服液II号与消咳喘治疗慢性支 气管炎的疗效是否相同?
1.5 四格表资料配对卡方检验
例 11-7 将 100 份样品一分为二,分别用含血培养基与无血培养基接种培养,观察弯曲菌检出情 况,为表 11-13 形式
第八章 检验(卡方检验)
乙疗法
45
50
95
47.37
合计
97
84
181
53.59
6. 2界值表
表 8-4 2 界值表
自由度
概率:(P)
0.05
0.01
1
3.84
6.63
2
5.99
9.21
3
7.81 11.34
4
9.49 13.28
…
20 31.41 37.57
图8.1 不同自由度的2分布曲线图
小结:2检验的基本思想
2
A T 2
1、四格表资料的2检验
• 基本公式:
专用公式:
2
A
T T
2
2
(ad bc)2 n
(a b)(c d)(a c)(b d)
应用条件:n≥40,且T≥5。 SPSS 输出结果选择:
• 校正公式:
Pearson’s Chi-Square。
2
( AT
0.5)2
T
2 (| ad bc | n / 2)2 n
34
86
60.47
乙疗法
45
50
95
47.37
合计
97
84
181
53.59
男 女 合计
表 8-2 四格表资料示意
有
无
a(A11) c(A21)
a+c
b(A12) d(A22)
b+d
合计 a+ b c+d n
2. 检验假设: π1=π2=π,如检验假设成立,则两样本合计率 是π的最佳估计值。
3. 理论频数:
TRC = n R n C / n n R 为第R行合计数, n C为第C列合计数。 如:T11=86×97/181=46.09 T21=95×97/181=50.91
SPSS卡方检验步骤
SPSS卡方检验步骤
1.打开数据集:在SPSS中打开包含要进行卡方检验的数据的数据集。
确保数据集中包含分类变量的数据。
2. 创建交叉表:选择"分析"菜单中的“描述性统计”选项,然后选
择“交叉表”。
将一个或多个分类变量移动到"Row(s)"和"Column(s)"框中,以创建交叉表。
3.运行卡方检验:在交叉表创建好后,选择“统计”按钮。
在弹出的
对话框中,勾选“卡方”复选框。
4.设置期望频数:默认情况下,SPSS使用观察到的频数计算期望频数。
如果需要自定义期望频数,可以选择“卡方”对话框中的“期望频数”选项,并在弹出的对话框中进行设置。
5.查看结果:点击“确定”按钮后,SPSS将计算卡方统计量,并在
输出窗口中显示结果。
通过查看卡方检验的结果,可以确定观察到的频数
与期望频数之间是否存在显著差异。
6.解释结果:卡方检验的结果通常包括卡方统计量、自由度和P值。
卡方统计量越大,意味着观察到的频数与期望频数之间的差异越大。
P值
表示观察到的差异是由于抽取误差而不是真正的相关性引起的概率。
如果
P值小于显著性水平(通常为0.05),则可以拒绝原假设,即认为两个变
量之间存在显著相关性。
7.建立交叉表图:在结果显示后,可以选择将结果导出为交叉表图。
在输出窗口中选择“图形”菜单,并选择适当的交叉表图类型。
总之,SPSS卡方检验可以通过计算卡方统计量和P值来确定分类变量之间是否存在显著关联。
通过遵循上述步骤,可以在SPSS中进行卡方检验,并解释其结果。
SPSS 卡方检验课件
学习交流PPT
29
学习交流PPT
30
结果1:男性卡方检验p=0.000 女性p=0.584
学习交流PPT
31
结果2:风险估计,男性组OR=14.043,95%置信区 间不包括1。女性OR=1.222, 95%置信区间包括1。 提示,对于男性而言吸烟史发生肺癌的危险因素,
女性则不是。
学习交流PPT
学习交流PPT
22
• 文件diagnosis.sav为例
• 操作过程:
• 分析
• 统计描述
•
交叉表
• 行变量:treat_b
• 列变量:treat_a
• 统计量:McNemar
Kappa
学习交流PPT
23
结果解释:McNemar 检验结果p=0.057,两法诊断 结果差异无统计学意义
学习交流PPT
学习交流PPT
33
• 结果3:OR的均一性检验,用两种方法比较性别之 间OR是否存在差异(p=0.001)。说明男性高于女 性
学习交流PPT
34
• 结果4:又称协变量分析,将性别当做协变量,即 剔除性别这个影响后吸烟与肺癌的关系。结果显 示在剔除性别影响后,吸烟和肺癌仍然显著相关, 即吸烟史导致肺癌的危险因素。
学习交流PPT
43
• 练习2:某医师研究物理疗法、药物治疗和外用膏 药三种方法治疗周围性面神经麻痹的疗效。
• 问题1:三种疗法的有效率有无差别
• 问题2:如果三种疗法存在差异,是否任意两组疗 法均有差别
学习交流PPT
44
素材猫
学习交流PPT
45
spss18.0 卡方检验
学习交流PPT
1
主要内容
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
皮尔逊卡方值x2(pearson chi-square)=4.130 连续校正x2(continuity correction):仅在2×2表计算.(n≥40, 有
1≤T<5) 似然比值(likelylihood ratio):处理多维表时有更大优势。 费歇尔精确检验(fisher‘s exact test) (n<40或有T<1,四格表
非整数加权
单元格累计权重进行四舍五入 加权前,对个案权重进行四舍五入
加权后,对单元格的累计权重 截去小数点
加权前,对个案权重进行舍位
如果数据文件当前的加权是将函数值作为加 权变量,那么单元格计数就有可能是非整 数加权,此处5个选项,用于处理非整数情 况。
即进行处理后再计算检验统计量。
Exact 对话框
将频数f放入frequency variable栏中
3、anylyze→descriptive statistics→crosstabs
Statistics对话框
Cells对话框
第一个表:显示数据处理概况:有效数据 例数、无效数据例数、ts
第8章卡方检验 SPSS卫生统计学
第八章 χ2 检 验
χ2检验(chi square test)是以χ2 分布为 理论基础的检验方法。
主要用于: 1、分类资料的假设检验。 2、频数分布的拟合优度检验。
2 (A T )2, (行 数 - 1 )(列 数 1 ) T
TRC
皮尔逊卡方值x2=4.130,p=0.042<0.05, 差别有统计学意义。
三、四格表校正卡方检验
1、定义变量,输入数据(例8-2) 设三个变量:
四格表校正卡方检验
例题8-2
2、data→weight cases--激活weight cases对话框。
将频数f放入frequency variable栏中
首先是处理记录缺失情况报告,可见24例 均为有效值。
二、独立样本2×2列联表 卡方检验
例题:例8-1
步 骤:
1、定义变量,输入数据 设三个变量:
处理(r):即行号 状况(c):即列号 频数(f)
加权数据——data-weight cases
2、data→weight cases…激活weight cases对话框。
Crosstabs(列联表)过程构成 两维或多维的各水平的列联表。并 为两维表提供多种检验与相关的计 算。
如果研究者想知道性别和病情分级的交叉频 数分布,以及各种百分比的情况,怎么做? (数据:病人基本资料)
操作步骤: analyze→descriptive statistics→crosstabs Rows框:sex columns框:x0 cells:
4.156
1
.041
Fis her's Exact Tes t
.049
.031
Linear-by-Linear As sociation
4.106
1
.043
N of Valid Cas es
169
puted only for a 2x2 table
b.0 cell s (.0% ) have expected count les s than 5. The m i ni m um expec 84.
如果掌握的是原始资料,可不必转 换成列联表,直接录入即可
程序操作
1、Analyze-Descriptives statistics-Crosstabs
Statistics对话框:选择chi-square
四、R×c列联表的卡方检验
多用于多个率、构成比的比较 例题8-3,步骤 1、定义变量,设三个变量,输入数据 2、weight cases 3、crosstabs
Value Pears on Chi-Square4.130b
Conti nuity Correaction3.487
As ym p. Si g. Exact Sig. Exact Sig.
df
(2-s ided) (2-s ided) (1-s ided)
1
.042
1
.062
Likeli hood Rati o
nR nC n
A:实际频数(actual frequency)
T:理论频数(theoretical frequency)
TRC :第R 行C 列的理论频数 nR :相应的行合计,nC :相应的列合计
一、分类变量的统计描述
1、使用frequencies过程输出频数表 如病例基本资料:
如果研究者希望了解共有多少个患者, 男性和女性各为多少,不同病情等级的人 数有多少?(数据:病人基本资料)
应用frequencies:选入性别(sex)、 病情等级(x0)
首先给出的是统计量列表,因没有选择输出任何统 计量,所以只给出有效统计量。可见共有24名患者的数 据,且这些数据都是完整的,没有缺失值。
接着给出的是性别的频数表
接着给出的是病情分析的频数表
2、使用crosstabs过程输出频数表
percentages:选择row、column、total →continue→ok
Cells 按钮
Residuals:残差 Unstandardized:单元格观
察频数与理论频数之差A-T Standardized: 对(A-T)进行标准化变换 Adjusted Standardized:
调整后的标准化残差,单 元格残差除以标准误
3、anylyze→descriptive statistics→crosstabs
第一个表显示数据处理概况:有效数据 例数、无效数据例数、总例数
第二个表显示列联表的资料,一个期望频数小于5(4.8)
结论:有1个格子的期望频数大于1,小于5,最小 期望频数为4.80
连续校正卡方值(continuity correction) x2=2.624, p=0.105>0.05,差别没有统计学意义。
资料自动给出确切概率法结果)。
线性相关(linear-by-linear association):行、列变量有无线性关 系,列联表分类变量中少用,多用于连续变量。
有效例数(N of valid cases)
结论:有0个格子的期望频数小于5,最 小期望频数为26.84,符合pearson x2 检验的要求。