四格表卡方检验讲解学习

合集下载

6-1卡方检验PPT课件

6-1卡方检验PPT课件

分 组 * 性 别 Crosstabulation
性别


分 组 试 验 药 Count
20
10
% within 分 组 66.7% 33.3%
安 慰 剂 Count
16
14
% within 分 组 53.3% 46.7%
T ot al
Count
36
24
% within 分 组 60.0% 40.0%
• 本例操作如下:
第9页/共52页
3、Crosstabs 过程对话框操作提示 • 单击Analyze/Descriptive Statistics/ • Crosstabs打开相关分析对话框,选择分析。 • 本例操作如下:
选择行、列变量后,打开统计量选项对话框。
第10页/共52页
选择卡方检验选项
实验分组变量—ecg 分析变量性别—gender 数据为原始数据
第26页/共52页
6.2 连续校正四表格卡方检验
例6-3 冠心病复发与体育锻炼关系研究,结果见
下表,(输入数据文件格式见data6-3)问两组的疗
效有无差异?
体育锻炼
冠心病复发情况合计是否来自参加262
64
未参加
8
42
50
合计
10
104
114
61
83
32
19
93
102
合计
144 51 195
第2页/共52页
6.1.1 四格表χ2检验知识回顾
概念 它是完全随机设计下两行两列的卡方检验。
检验目的 1、推断两个二分类变量总体率的差异性。 2、推断两个二分类变量总体构成比的差异性。
第3页/共52页

四格表卡方检验 46页PPT文档

四格表卡方检验 46页PPT文档
相对数:计数资料常用的统计指标, 又
称相对指标(Relation number)
常用相对数
率 构成比 相对比
2019年8月1日
常用相对数
1. 率 (Rate) * 频率指标,表示某现象发生的频率和强度
* 计算公式: 发生某现象的个体数
率= ———————————— × K 可能发生某现象的个体数
( K为比例基数,可为100%或1000‰……等) 如:发病率、死亡率、发生率、阳性率、患病率 、有效率等
成(%) =③/② =④/② =⑤/② =⑤/③
0~ 90319 501 145 11 45.05 5.55 1.61 0.12 2.60
30~ 63223 254 122 12 31.54 4.02 1.93 0.19 5.51
55~ 36584 214 125 15 18.25 5.85 3.42 0.41 7.94
的 2检验。
2019年8月1日
Karl Pearson (1857~1936) 英国统计学家 1901年10月与 Weldon,Galton 一起创办 Biometvika
2019年8月1日
例8-1 某医院收治376例胃脘痛患者,随机分 为两组,分别用新研制的中药胃金丹和西药治疗。 结果如表8-1,探讨两药疗效有无差别。
表8-1 两药治疗胃脘痛的疗效四格表
10
8
6
5.55
4
2
0 0~岁

患病率(0/00)
9.18
4.02
5.85
患病率
30~岁
55~岁
65~岁
2019年8月1日
三、应用相对数应注意的问题
1.分析时不能以构成比代替率

40第四节-四格表的卡方检验

40第四节-四格表的卡方检验
例2: 教科书第238页。
第四节 四格表旳卡方检验
• 一、独立样本四格表旳卡方检验 • 独立样本四格表旳χ2检验,就是最简朴旳双向表 即22表旳χ2检验。它既能够用缩减公式来计算χ2值, 又能够用χ2检验旳基本公式来计算χ2值。
例1: 教科书第240页。
例如: 教科书第242页。
例如: 教科书第244页。
关键词:普小教师 有特殊教育需要旳学生 随班就读态度

2.校正χ2值旳计算
• 在有关样本四格表中,假如(b+c)<30或 (b+c)<50(即要求比较严格),则要对χ2值进 行亚茨连续性校正。其校正公式为:
2 ( b c 1)2
bc
例1: 教科书第246页。
北京、香港两地普小教师对有特殊教育需要学生
随班就读态度旳比较研究
韦小满、袁文得、刘全礼
摘要:从北京、香港两个地域旳一般小学中随机抽取了 225名教师进行问卷调查。成果表白,在对有特殊教育需要学 生在一般班级随班就读旳基本态度上,香港地域持赞同态度旳 教师百分比高于北京地域。但对各类有特殊教育需要学生旳随 班就读,两地教师旳态度既有相同旳方面,也有不同旳方面。 两地教师对随班就读旳接受程度明显受学生旳残疾类型和残疾 程度旳影响。

四格表卡方检验结果解读

四格表卡方检验结果解读

四格表卡方检验结果解读
卡方检验是一种统计方法,用于判断两个分类变量之间是否存在关联性。

四格表卡方检验是卡方检验的一种特殊形式,常用于比较两个变量的分布,特别是当变量有两个分类且分别为两个互斥的水平时。

四格表卡方检验的结果解读主要包括卡方值、自由度和显著性水平等。

卡方值是用于衡量观察到的频数与期望频数之间的偏离程度。

自由度是指用于计算卡方值的度量数量,计算方法为(行数-1)*(列数-1)。

显著性水平是指判断卡方值是否显著的阈值,通常使用0.05或0.01作为判断标准。

当卡方值显著小于显著性水平时,我们可以认为两个变量之间不存在关联性。

这意味着两个变量的分布在统计上没有差异,变量之间的关联是由于随机差异引起的。

反之,当卡方值显著大于等于显著性水平时,我们可以认为两个变量之间存在关联性。

这意味着两个变量的分布在统计上存在差异,变量之间的关联是非随机的。

需要注意的是,卡方检验只能表明两个变量之间是否存在关联性,不能确定关联性的方向和强度。

如果想要探究更深入的关系,可以使用其他统计方法,如相关分析或回归分析等。

四格表卡方检验是一种常用的统计方法,用于判断两个变量之间的关联性。

通过解读卡方值、自由度和显著性水平,可以得出两个变量之间是否存在关联性的结论。

然而,卡方检验只能表明是否存在关联性,不能确定其方向和强度。

如需深入了解两个变量的关系,可以考虑其他统计方法。

四格表卡方检验结果解读

四格表卡方检验结果解读

四格表卡方检验结果解读在统计学中,卡方检验是一种常用的统计方法,用于检验两个或多个分类变量之间是否存在关联性。

四格表卡方检验是其中的一种形式,通常用于分析两个分类变量的关联性。

四格表是由两个分类变量所组成的一个二维交叉表,其中每个分类变量各有两个水平(类别)。

卡方检验的目的是判断这两个分类变量是否独立,即变量之间是否存在关联性。

卡方检验的原假设为“两个变量之间独立”,备择假设则为“两个变量之间不独立”。

进行卡方检验的关键是计算出卡方值,并将其与临界值进行比较。

若计算得到的卡方值大于临界值,则认为两个变量之间存在显著关联性;反之,若计算得到的卡方值小于或等于临界值,则认为两个变量之间不相关。

卡方值的计算是基于四格表中的观察频数与期望频数的比较。

观察频数是指四格表中每个单元格中的实际观察到的频数,而期望频数是指基于假设模型下,每个单元格中的预期频数。

解读四格表卡方检验的结果时,首先需要查看输出的卡方检验统计量和自由度。

卡方检验统计量通常表示为χ2(读作“卡方”),其数值越大,说明两个变量之间的差异越显著。

自由度表示独立变量的自由度和独立变量水平数目之间的关系。

自由度越大,说明检验结果越可靠。

在解读卡方检验结果时,需要关注的重要指标有四个:卡方值,自由度,P值和显著性水平。

卡方值越大,表明差异越显著,与假设模型越不符合。

自由度越大,卡方值越大,相应的P值越小,表明差异越显著。

P值是在给定假设模型成立的条件下,观察到卡方值或更极端的情况发生的概率。

一般而言,当P值小于等于0.05时,我们可以拒绝原假设,认为两个变量之间存在显著关联性。

当P值大于0.05时,我们无法拒绝原假设,即无法得出两个变量之间存在关联性的结论。

显著性水平是事先确定的一个阈值,通常取0.05。

当P值小于等于显著性水平时,拒绝原假设;当P值大于显著性水平时,无法拒绝原假设。

在解读四格表卡方检验结果时,需要同时综合考虑卡方值、自由度、P值和显著性水平这四个指标来进行判断。

完全随机设计四格表资料的卡方检验,其校正公式

完全随机设计四格表资料的卡方检验,其校正公式

完全随机设计四格表资料的卡方检验,其校正公式完全随机设计四格表资料的卡方检验及校正公式 卡方检验是一种常用的统计方法,用于判断两个或多个分类变量之间是否存在关联性。

在实际应用中,有一类叫做四格表的数据分析问题,即由两个分类变量构成的表格。

本文将介绍如何进行完全随机设计四格表资料的卡方检验,并给出相应的校正公式。

一、完全随机设计四格表资料的卡方检验的步骤:1. 确定研究问题和假设: 在进行卡方检验之前,需要明确研究问题和研究假设。

例如,我们想知道两个分类变量X和Y是否存在关联性,即是否存在某种程度的相关关系。

2. 构建四格表: 根据研究问题,我们需要构建一个四格表来表示变量X和Y的关系。

四格表由两个分类变量构成,每个变量有两个水平。

研究中可以将观察单位按照两个变量进行分类,并统计每个分类组合的数量。

将这些数量填入四格表格中,得到以下形式:Y=1 Y=03. 计算期望频数: 在进行卡方检验时,需要计算期望频数,即在假设不存在关联性的情况下,每个格子的期望数量。

计算方法为:在保持边际分布不变的条件下,计算每个格子的期望频数。

即计算每个分类组合的边际比例乘以总体数量。

4. 计算卡方统计量: 卡方统计量用于判断观察频数和期望频数之间的差异。

计算方法为:将每个格子的观察频数与期望频数之差的平方,除以期望频数,然后将所有格子的结果相加。

得到的卡方统计量符合自由度为1的卡方分布。

5. 判断是否存在关联性: 根据卡方统计量的分布,可以计算出其对应的p值。

通过比较p值和显著性水平(通常为0.05),可以判断是否存在关联性。

若p 值小于显著性水平,即拒绝原假设,说明存在关联性。

二、校正公式: 在实际应用中,四格表可能会出现某个格子的期望频数小于5的情况。

这会导致卡方统计量的计算结果不准确,影响判断结果的可靠性。

为了解决这个问题,可以使用校正公式进行修正。

1. 构建校正后的四格表: 在校正前,首先需要确定哪些格子的期望频数小于5。

四格表分析

四格表分析

2 P
k i 1
( Ai
Ti )2 Ti
服从自由度为k-1旳卡方分布。
即:
2 P
2,v,拒绝H0。
上述卡方检验由此派生了不同应用背景旳多种问 题旳检验,尤其最常用旳是两个样本率旳检验等。
措施原理
牙膏类型 含氟牙膏 一般牙膏 合计
表 6.2 使用含氟牙膏与一般牙膏儿童的龋患率
患龋齿人数 70(76.67) 45(38.33) 115
此时,能够考虑边际卡方检验,见P130
注意事项
配对四格表卡方与成组设计卡方
因为配对设计旳资料同一对观察成果间一般是非独 立旳,而成组设计旳资料一般能够以为是独立旳, 所以配对四格表资料不能用成组设计旳2或 Fisher检验旳,而要用配对设计旳2或配对设计 旳直接计算概率法进行检验。
Poisson分布资料推断
累计概率 0.0106 0.0895 0.3138 0.6306 0.8726 0.9745 0.9974 0.9999 1.0000
*本例现有样本情况 d=6。
❖ 然后将其中不大于等于既有样本概率旳概率值相加,即为
P值:
▪ 本例中P值=P(0)+ P(6)+P(7)+P(8)=0.0361<0.05
措施原理
❖ 理论频数
▪ 基于H0成立,两样本所在总体无差别旳前提下
计算出各单元格旳理论频数来
TRC
nR nC n
牙膏类型 含氟牙膏 一般牙膏 合计
患龋齿人数 70(76.67) 45(38.33) 115
未患龋齿人数 130(123.33) 55(61.67) 185
调查人数 200 100 300
❖ 使用不同旳牙膏并不会影响龋齿旳发生(两个分 类变量间无关联) ▪ 两变量旳有关分析

医学统计方法之卡方检验教学内容

医学统计方法之卡方检验教学内容

1、建立检验假设并确定检验水准 H0:π1=π2 ,即试验组与对照组的总体有效率相等 H1 :π1≠π2 ,即试验组与对照组的总体有效率不等 α=0.05 2、计算检验统计量
T1147404125.8
T1247420918.2
T2127604115.2 T2227620910.8
用基本公式计算卡方值:
2
2
3.62
(25)2( 69)2(2)65(9)
3、查界值表,确定P值,做出推断结论
自由度=1, Χ20.05(1)=3.84, Χ2< Χ20.05(1), 所以 , P>0.05,在α=0.05的检验水准下,不拒绝H0,说明四年 级与五年级学生近视眼患病率差别没有统计学意义,可 认为尚未发现四年级与五年级学生近视眼患病率有显著 性差异。
2 连续性校正仅用于 1的 四格表资料,当 2 时,一般不 作校正。
例8.2 某医学院抽样调查大学四年级和五年级学生近视 眼患病情况,四年级学生的近视率为7.14%,五年级学 生的近视率为35.71%,调查结果见下表,试问该大学四 年级与五年级学生的近视眼患病率是否一样?
表8-2 两个年级大学生的近视眼患病率比较
组别
有效 无效 合计 有效率(%)
西药组
51
49 100
51.00
中药组
35
45
80
43.75
合计
86
94 180
47.78
1、建立检验假设并确定检验水准
H0:西药与中药治疗肝炎的有效率相同; H1 :西药与中药治疗肝炎的有效率的有效率不同; α’=0.05/3=0.017
2、计算检验统计量
2 1 8 0 (5 1 2 4 9 2 3 5 24 5 2 1 ) 0 .9 4 1 0 0 8 61 0 0 9 48 0 8 68 0 9 4

四格表卡方检验

四格表卡方检验
自由度的确定
通常为分类数减去1
理论次数的计算
根据某种经验或理论
二、配合度检验的应用
1、检验无差假说 理论次数=总数*1/分类项数 例题p.332
2、检验假设分布的概率 理论次数的计算按照理论分布求得 例题p.333
三、连续变量分布的吻合性检验
对于连续随机变量的计量数据,有时在 实际研究中预先不知道其总体分布,而 是要根据对样本的次数分布来判断是否 服从某种指定的具有明确表达式的理论 次数分布。 关于分布的假设检验方法有很多,运用 卡方值所做的配合度检验是最常用的一 种。
举例:正态分布吻合性检验
例题:p.336
四、比率或百分数的配合度检验
如果计数资料用百分数表示,最后计算 出来的卡方值要乘以100/N后,再与查表 所得的临界值进行比较。 例题:p.337
五、二项分类的配合度检验与比 率显著性检验的一致性
二者实质相同,只是表示方式不同。 相比较而言,配合度检验计算方法更为 简单。
在独立性检验和同质性检验中,如果两 个变量或两个样本无关联时,期望值为 列联表中各单元格的理论次数,即各个 单元格对应的两个边缘次数的积除以总 次数。
五、小期望次数的连续性校正
如果个别单元格的理论次数小于5,处理 方法有以下四种:
1、单元格合并法 2、增加样本数 3、去除样本法 4、使用校正公式
主要内容
第一节 卡方检验的原理 第二节 配合度检验 第三节 独立性检验 第四节 同质性检验
为什么叫作卡方检验
计数数据一般应用属性统计方法,因为 这类数据是按照事物属性进行多项分类 的。 而且,对这些计数数据的统计分析是根 据卡方分布进行的。
卡方检验的功能
处理一个因素两项或多项分类的实际观 察频数与理论频数分布是否相一致的问 题,或者说有无显著差异的问题。

完全随机设计四格表资料的卡方检验,其校正公式

完全随机设计四格表资料的卡方检验,其校正公式

完全随机设计四格表资料的卡方检验,其校正公式在统计学中,卡方检验是用来检验观测频数与期望频数是否存在显著差异的一种常用方法。

在实际应用中,我们经常会遇到完全随机设计四格表资料的情况,而对这种情况进行卡方检验时,需要使用相应的校正公式,以确保检验结果的准确性和可靠性。

让我们来理解一下完全随机设计四格表资料的含义。

完全随机设计是实验设计中的一种常见形式,它要求实验对象被随机分配到各个处理组中,各处理之间相互独立,且每个处理组中的实验对象也是相互独立的。

四格表则是指实验结果按照两个因素分组,形成四个格子,每个格子中包含了不同处理的观测频数。

在这种情况下,我们需要进行卡方检验来判断两个因素之间是否存在相关性或独立性。

在进行卡方检验时,我们首先需要计算期望频数。

期望频数是指在假设两个因素之间不存在相关性或独立性的情况下,每个格子中的理论频数。

一般情况下,完全随机设计四格表资料的期望频数可以通过计算公式进行推导。

在这里,我们就需要使用校正公式来确保计算的准确性。

校正公式是针对完全随机设计四格表资料计算期望频数时可能出现的分母为0或者过小的情况而设计的。

当实际观测频数与期望频数之间存在很大差异时,校正公式能够有效地调整计算结果,提高卡方检验的准确性。

一般来说,校正公式的具体形式会根据不同的实验设计和数据特点而有所不同,需要根据具体情况进行选择和应用。

在进行卡方检验时,我们需要使用校正公式来计算期望频数,并将实际观测频数与校正后的期望频数进行比较,进而得出检验结果。

通过对实际情况进行充分的了解和分析,我们可以更好地理解和运用卡方检验,从而做出科学合理的决策。

回顾本文所涉及的内容,完全随机设计四格表资料的卡方检验及其校正公式是统计学中一个重要且常见的问题,它在实际应用中具有广泛的意义。

通过了解和掌握相关的知识和方法,我们可以更好地进行数据分析和推断,为科学研究和决策提供可靠的依据。

在个人观点和理解方面,我认为掌握卡方检验及其校正公式是统计学学习中的一项基本能力,它不仅可以帮助我们理解实验设计和数据分析的原理,还可以为科学研究和实践工作提供重要的支持。

完全随机设计四格表资料的卡方检验,其校正公式

完全随机设计四格表资料的卡方检验,其校正公式

完全随机设计四格表资料的卡方检验,其校正公式摘要:I.引言- 介绍完全随机设计四格表资料的卡方检验- 说明卡方检验的重要性II.卡方检验原理- 定义卡方统计量- 说明卡方检验与期望频数的关系III.校正公式- 介绍校正公式的由来- 说明校正公式的作用IV.应用实例- 举例说明卡方检验在实际研究中的应用- 展示校正公式在具体研究中的使用V.结论- 总结卡方检验在校正四格表资料中的作用- 强调卡方检验在研究中的重要性正文:I.引言完全随机设计四格表资料的卡方检验,是一种用于检验两个分类变量之间是否独立的方法。

在实际研究中,我们常常需要分析不同变量之间的关系,以期发现它们之间的关联性。

卡方检验就是在这种背景下应运而生的。

通过卡方检验,我们可以推断出实际观测频数与期望频数之间的差异,从而判断两个变量之间是否存在关联。

II.卡方检验原理卡方检验的原理是通过计算卡方统计量,来推断观测频数与期望频数之间的差异是否显著。

卡方统计量是由观测频数和期望频数的差异所组成的。

在进行卡方检验时,我们需要计算卡方统计量的值,并与临界值进行比较。

若卡方统计量的值大于临界值,则说明观测频数与期望频数之间的差异显著,从而拒绝原假设;反之,若卡方统计量的值小于临界值,则说明观测频数与期望频数之间的差异不显著,不能拒绝原假设。

III.校正公式在完全随机设计四格表资料的卡方检验中,由于观测频数和期望频数的计算涉及到概率乘法原理和加法原理,因此可能会出现期望频数小于5 的情况。

为了保证卡方检验的准确性,当期望频数小于5 时,我们需要使用校正公式来进行计算。

校正公式是通过对期望频数进行修正,从而使得卡方检验的计算结果更加接近真实值。

IV.应用实例在实际研究中,卡方检验被广泛应用于检验两个分类变量之间的关联性。

例如,在医学研究中,研究者可能会使用卡方检验来分析不同治疗方法对患者病情的改善情况;在社会学研究中,研究者可能会使用卡方检验来分析不同社会因素对个体行为的影响。

SPSS学习笔记-四个表的卡方检验

SPSS学习笔记-四个表的卡方检验

四格表的卡方检验1.录入数据:组(Row,R),图1中的gr1,例如医学中常见的实验组和对照组;列(Column,C),图1中的gr2,例如医学中的阳性和阴性;频数,也就是各个格子(Cell)中的例数,这里是实际频数。

这几个项目分别成一列(见图1)。

图1.2.定权重:先在Data中找到Weight case(见图2-1),打开后见图2-2,此时将ff选作权重(见图2-3),点·“OK”,完成此步。

图2-1图2-2图2-33.打开列联表设置:从Analyze(分析)菜单中找到Descriptive Statistics(描述性统计),再找到Crosstabs(列联表),打开(见图3-1)图3-1进入该界面后(见图3-2),将gr1加入行(Row),而gr2加入列(Column)(图3-3)。

图3-2图3-3此时,根据分析目的,打开Statistics(统计),选择统计方法,这里我们是要对两个组的率进行比较,所以选择卡方检验Chi-squair和kappa(见图3-4)。

点Continue(继续),继续下一步设置。

图3-4现在,再对Cell(格子)进行设置,点击Cells,选定Observed(实际频数)和Expected(理论频数)(图3-5),如果要计算率,可以继续选R和C。

还可以选残差(Residuals).这里举例没有再分析这些内容。

图3-54.结果解释:选完上面这些,就可以点击“OK”了,这时结果就出来了(图4)第1个表就是经典的四格表,每个格子上面数字为实际频数,下面数字是理论频数。

第2个表格是卡方检验的结果,根据适应条件:四格表,n>=40,理论频数>=5,随机成组两组设计的计数资料,适宜使用Pearson 卡方检验,结果:卡方值(value)23.117,自由度(df);1,双侧概率(Asymp.Sig.)(2-sided);0.000.结论:按照双侧a=0.05的水准,拒绝两组率相等的假设,可以认为两组的(阳性)率有差别。

四格表卡方检验

四格表卡方检验

目的和意义
目的
通过四格表卡方检验,可以了解两个 分类变量之间的关系,判断它们是否 独立或者存在某种关联性。
意义
四格表卡方检验在医学、生物学、社 会学等领域有广泛的应用,可以帮助 研究者了解不同类别数据之间的关系 ,为进一步的研究提供依据。
02 卡方检验基础知识
卡方检验的定义
总结词
卡方检验是一种统计方法,用于比较实际观测频数与预期频 数之间的差异。
详细描述
卡方检验适用于分析两个分类变量之间的关系,特别是当样本量较小或理论频数较低时。 它可以用于检验两个分类变量之间是否存在关联性,以及这种关联性是否具有统计学显 著性。此外,卡方检验还可以用于评估分类变量的一致性,例如诊断准确率、调查问卷
的一致性等。
卡方检验的基本步骤
• 总结词:卡方检验的基本步骤包括选择适当的卡方检验类型、构建期望 频数、计算卡方统计量、选择合适的显著性水平以及解释结果。
社会学研究
在社会学研究中,四格表卡方检验用于分析两个分类变量之间的关系, 例如调查不同人群的婚姻状况与性别比例的关系。
生物学研究
在生物学研究中,四格表卡方检验用于分析物种分布、生态位和种群 遗传结构等。
心理学研究
在心理学研究中,四格表卡方检验用于分析不同心理特征或行为模式 在不同人群或条件下的分布情况。
样本量大小的要求
足够大的样本量
四格表卡方检验需要足够的样本量才能获得 可靠的统计结果。通常来说,样本量越大, 结果的稳定性越高。
考虑最小样本量
在选择样本量时,需要考虑最小样本量的要 求。根据研究目的和预期效应大小,确定合 适的样本量。
卡方检验的局限性
1 2 3
适用范围有限
四格表卡方检验主要用于比较两组分类变量之间 的关联程度,对于连续变量或等级变量则不太适 用。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2 值的大小反映了实际频数A与理论频数T的吻合程度
2020年8月10日
2分布(chi-square distribution)
纵高
0.5 0.4 0.3 0.2 0.1 0.0
0
f(2)2(1/2)22(/21)e2/2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
表8-1 两药治疗胃脘痛的疗效四格表
疗法 胃金丹 西药 合计
有效
无效
271(253.24) 5(22.76)
74(91.76) 26(8.24)
345
31
合计 276% 91.76%
2020年8月10日
列联表资料分析
把全部数据按两个分类变量(原因变量、结 果变量)进行完全分类列成的频数表格称为列联 表,R行C列的列联表简称R×C表,2×2列联表 也称为四格表,利用列联表进行分类资料的检验 称为列联表分析。
例8-1 用专用公式 计算 2 值:
2 (271 26 5 74 )2 376 56 .77
276 100 345 31
查 2界值表,
2 0.05 ,1
3 . 84
下结论:
, df 1
2
2 0.05 ,1
3.84 ;
P 0.05,按 0.05 水准,
拒绝
H
,接
0

H

2020年8月10日
一、卡方检验的基本思想
例8-1 对表8-1资料推断两药的疗效有无差别
H0: 1 2,即两药总体有效率相等
由于总体有效率未知,将两组数据合并,计算合并
样本有效率(称为理论有效率)
p =345/376=91.76%,
据此推算两组的理论有效数:
T11=276×345/376=253.24, T21=100×345/376=91.76,
的“行×列表”资料。
2020年8月10日
二、四格表专用公式
为了不计算理论频数T, 可由基本公式推导出, 直接由各格子的实际频数(a、b、c、d)计算卡方 值的公式:
基本公式 2 :(AT)2
T
(adbc)2n
(ab)(cd)(ac)(bd)
df1
-------四格表专用公式
2020年8月10日
1122.59 15
18
卡方值
2020年8月10日
2 检验的基本公式
2 (A T T )2 d f(R 1 )C ( 1 )
上述基本公式由Pearson提出,因此软件上 常称这种检验为Peareson卡方检验,下面将要 介绍的其他卡方检验公式都是在此基础上发展起 来的。它不仅适用于四格表资料,也适用于其它
衡量理论数与实际数的差别
检验统计量 2 值:
2R,C(ArcTrc)2
( AT) 2
T r,c1
rc
T
2020年8月10日
2(27125.324)2(522.76)2(7491.76)2
25.324
22.76
91.76
(268.24)2 56.77 8.24
df(21)(21)1
Pearson 2 值近似服从自由度为 df=(R-1)(C-1)的 2 分布
理论无效数: T12=276 -253.24=22.76,
T22=100 -91.76=8.24 2020年8月10日
理论数公式
Trc
nrnc n
,nr表示r第 行的合计数;
nc表示c第 列的合计n数 表; 示总合计。
271 5 74 26
253.24 22.76 91.76 8.24
2020年8月10日
四格表卡方检验
2020年8月10日
第一节 四格表 2检验
卡方检验的基本思想 四格表专用公式 四格表卡方检验的应用条件 校正卡方检验
2020年8月10日
2 检验
2 检验(Chi-square test)是现代统计学的
创始人之一,英国人K . Pearson(1857-1936 )于1900年提出的一种具有广泛用途的统计方 法,可用于两个或多个率间的比较,计数资料 的关联度分析,拟合优度检验等等。
配对四格表卡 方检验
2020年8月10日
主要输出结果
校正只适用于四格表 理论数小于5的格子数为0(占0%),最小理论数为8.24
2020年8月10日
结果分析
由总频数n=376>40,最小理论频数8.24 >5,使用Pearson卡方检验。
结果分析:Pearson 2=56.77,双侧P=
0.000<0.05,以α=0.05水准拒绝H0,差 异有统计学意义,可认为两药疗效不同。
从菜单选择 Analyze→Descriptive
Statistics→Crosstable(交叉表) 指定 Row(s):组别 Columns(s):疗效 击Statistics按钮选择Chi-square。
2020年8月10日
列联表分析
2020年8月10日
统计量
卡方 检验
一致性检验 危险度分析
本章仅限于介绍两个和多个率或构成比比较
的 2检验。
2020年8月10日
Karl Pearson (1857~1936) 英国统计学家 1901年10月与 Weldon,Galton 一起创办 Biometvika
2020年8月10日
例8-1 某医院收治376例胃脘痛患者,随机分 为两组,分别用新研制的中药胃金丹和西药治疗。 结果如表8-1,探讨两药疗效有无差别。
1





效不


2020年8月10日
1.建立数据文件
在SPSS数据编辑窗,建立数据文件Li81.sav。
行变量:“组别”,Values为:1=“胃金 丹”,2=“西药”
列变量:“疗效”,Values为:1=“有效 ”,2=“无效”;
频数变量:“频数”。
2020年8月10日
2. spss操作过程
(1)在spss中调出数据文件Li8-1.sav (2)频数变量加权。 从菜单选择 Data→Weight Cases 弹出Weight Cases对话框,选择
Weight Cases by框,框内选入“频数 ”,即指定该变量为频数变量
2020年8月10日
加权变量
2020年8月10日
(3) 2检验
2020年8月10日
三、四格表 2检验的应用条件
(1)当n≥40,且所有T≥5时,用Pearson 2 检验 (2)当n≥40,而有1≤T<5时,用校正2检验
(3)当n<40或T<1时,用Fisher精确检验(Fisher exact test )
相关文档
最新文档