四格表卡方检验文稿演示
四格表卡方检验
本章结构
第一节 四格表 2检验
第二节 四格表确切概率法
第三节 R×C 表资料的 2检验
第四节 配对四格表资料的 McNemar检验
第五节 多个样本率的两两比较
2023年3月29日
第一节 四格表 2检验
卡方检验的基本思想 四格表专用公式 四格表卡方检验的应用条件 校正卡方检验
2023年3月29日
表8-4 两组疗效比较
05水准不拒绝H0,不能认为两法疗效不同。
第五节 多个样本率的两两比较
2023年3月29日
衡量理论数与实际数的差别
检验统计量 2 值:
2R,C(ArcTrc)2
( AT) 2
T r,c1
rc
T
2023年3月29日
2(27125.324)2(522.76)2(7491.76)2
Statistics→Crosstable(交叉表) 指定 Row(s):组别 Columns(s):疗效 击Statistics按钮选择Chi-square。
2023年3月29日
输出结果
理论数小于5的格子数为2(占50%),最小理论数为4.18 卡方检验:有效观测数 n=71>40,有两个格子理论数T<5,故用
2 检验
2 检验(Chi-square test)是现代统计学的
创始人之一,英国人K . Pearson(1857-1936 )于1900年提出的一种具有广泛用途的统计方 法,可用于两个或多个率间的比较,计数资料 的关联度分析,拟合优度检验等等。
本章仅限于介绍两个和多个率或构成比比较
的 2检验。
2023年3月29日
相反
2023年3月29日
1.建立数据文件
6-1卡方检验PPT课件
分 组 * 性 别 Crosstabulation
性别
男
女
分 组 试 验 药 Count
20
10
% within 分 组 66.7% 33.3%
安 慰 剂 Count
16
14
% within 分 组 53.3% 46.7%
T ot al
Count
36
24
% within 分 组 60.0% 40.0%
• 本例操作如下:
第9页/共52页
3、Crosstabs 过程对话框操作提示 • 单击Analyze/Descriptive Statistics/ • Crosstabs打开相关分析对话框,选择分析。 • 本例操作如下:
选择行、列变量后,打开统计量选项对话框。
第10页/共52页
选择卡方检验选项
实验分组变量—ecg 分析变量性别—gender 数据为原始数据
第26页/共52页
6.2 连续校正四表格卡方检验
例6-3 冠心病复发与体育锻炼关系研究,结果见
下表,(输入数据文件格式见data6-3)问两组的疗
效有无差异?
体育锻炼
冠心病复发情况合计是否来自参加262
64
未参加
8
42
50
合计
10
104
114
61
83
32
19
93
102
合计
144 51 195
第2页/共52页
6.1.1 四格表χ2检验知识回顾
概念 它是完全随机设计下两行两列的卡方检验。
检验目的 1、推断两个二分类变量总体率的差异性。 2、推断两个二分类变量总体构成比的差异性。
第3页/共52页
四格表卡方检验
第29页/共42页
• (3) 2检验 从菜单选择 Analyze→Descriptive Statistics→Crosstable(交叉表) 指定 Row(s):组别 Columns(s):疗效 击Statistics按钮选择Chi-square。
第30页/共42页
输出结果
理论数小于5的格子数为2(占50%),最小理论数为4.18 卡方检验:有效观测数 n=71>40,有两个格子理论数T<5,故用
校正卡方检验2 =2.746,P=0.098,不能认为两药疗效不同。
第31页/共42页
第二节 四格表确切概率法
四格表确切概率法基本思想 实例
第32页/共42页
36
2
38
合计
62
9
71
第25页/共42页
例8-2 对表8-4资料推断两组的疗效有无差别
(1) H0: 1 2 ,即两组疗效相同
H1: 1 2 ,即两组疗效不同 , α=0.05
(2)计算2值,最小理论数
9 33 T12 71 4.18
因有理论数1<T<5,n>40,故用校正2检验
第26页/共42页
一致性检验 危险度分析
配对四格表卡 方检验
第20页/共42页
主要输出结果
校正只适用于四格表 理论数小于5的格子数为0(占0%),最小理论数为8.24
第21页/共42页
结果分析
四格表卡方检验PPT课件
2021/3/7
CHENLI
22
主要内容
第一节 卡方检验的原理 第二节 配合度检验 第三节 独立性检验 第四节 同质性检验
2021/3/7
CHENLI
23
独立性检验
独立性检验主要用于两个或两个以上因素多项
分类的计数资料分析,也就是研究两类变量之 间的关联性和依存性问题。
如果两变量无关联即相互独立,说明对于其中
三、连续变量分布的吻合性检验
对于连续随机变量的计量数据,有时在
实际研究中预先不知道其总体分布,而 是要根据对样本的次数分布来判断是否 服从某种指定的具有明确表达式的理论 次数分布。
关于分布的假设检验方法有很多,运用
卡方值所做的配合度检验是最常用的一 种。
2021/3/7
CHENLI
18
举例:正态分布吻合性检验
相关样本四格表卡方检验
用简捷公式较为简单 例题:p.349
2021/3/7
CHENLI
26
二、四格表的独立性检验
四格表卡方值的近似校正
当四格表的任一格理论次数小于5时,要用Yates连续 性校正公式计算卡方值(具体公式见书p.349)。
实际频数:指在实验或调查中得到的计数资 料。
理论次数:指根据概率原理、某种理论、某 种理论次数分布或经验次数分布计算出来的 次数。
2021/3/7
CHENLI
7
一、卡方检验的假设
分类相互排斥、互不包容; 观测值相互独立; 每一个单元格中的期望次数至少为5。
2021/3/7
CHENLI
8
二、卡方检验的类别
第十章 卡方检验
教科所 张念成
2021/3/7
CHENLI
四格表分析
2 P
k i 1
( Ai
Ti )2 Ti
服从自由度为k-1旳卡方分布。
即:
2 P
2,v,拒绝H0。
上述卡方检验由此派生了不同应用背景旳多种问 题旳检验,尤其最常用旳是两个样本率旳检验等。
措施原理
牙膏类型 含氟牙膏 一般牙膏 合计
表 6.2 使用含氟牙膏与一般牙膏儿童的龋患率
患龋齿人数 70(76.67) 45(38.33) 115
此时,能够考虑边际卡方检验,见P130
注意事项
配对四格表卡方与成组设计卡方
因为配对设计旳资料同一对观察成果间一般是非独 立旳,而成组设计旳资料一般能够以为是独立旳, 所以配对四格表资料不能用成组设计旳2或 Fisher检验旳,而要用配对设计旳2或配对设计 旳直接计算概率法进行检验。
Poisson分布资料推断
累计概率 0.0106 0.0895 0.3138 0.6306 0.8726 0.9745 0.9974 0.9999 1.0000
*本例现有样本情况 d=6。
❖ 然后将其中不大于等于既有样本概率旳概率值相加,即为
P值:
▪ 本例中P值=P(0)+ P(6)+P(7)+P(8)=0.0361<0.05
措施原理
❖ 理论频数
▪ 基于H0成立,两样本所在总体无差别旳前提下
计算出各单元格旳理论频数来
TRC
nR nC n
牙膏类型 含氟牙膏 一般牙膏 合计
患龋齿人数 70(76.67) 45(38.33) 115
未患龋齿人数 130(123.33) 55(61.67) 185
调查人数 200 100 300
❖ 使用不同旳牙膏并不会影响龋齿旳发生(两个分 类变量间无关联) ▪ 两变量旳有关分析
卡方检验PPT课件
配对卡方检验
配对卡方检验
选中进行配对 卡方检验
配对卡方检验
结果分析
Chi-Square Tests
Pearson Chi-Square Continuity Correctiona
V al ue 14 .15 4b
11.836
df 1 1
Asymp. Sig. (2-si de d) .000
c. Binom ial distribution used.
R×C表卡方检验
▪ 1979年某地发生松毛虫病,333例患者按年龄分为2组,资料如下,分析 不同年龄人群病变类型结构有无区别?
某地松毛虫患者病变构成
年龄分 皮炎型 骨关节 软组织炎 混合
组
型
型
型
合计
儿童组 50
48
成人组 105
10
合计
两种方法的检测结果
免疫荧光法 + -
合计
乳胶凝集法
+
-
11
12
2
33
13
45
合计 23 35 58
配对卡方检验
首先建立数据文件,如下。
配对卡方检验
同理,由于是频数表数据,应该先用weight cases进行预 处理。
不能忘记 哦!
配对卡方检验
在此选入频数变量即可进 行下一步的分析。
配对卡方检验
❖ 表示药物加化疗与单用药物治疗某种癌症的疗效比较的行 ×列表,除了观察值以外,还有期望值。
四格表卡方检验
结果分析
❖ 此为四格表2检验的结果,2=6.508,P=0.011,差异有显著性
意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。
医学统计方法之卡方检验PPT课件
3、查界值表,确定P值,做出推断结论
查χ2界值表,υ=6,χ20.05(6)=12.59, χ2 > χ20.05(1) ,则 P<0.05,在α=0.05的水准下,拒绝H0,认为三个不同地区 的人群血型分布总体构成比有差别。
.
38
二、多个样本率间多重比较
行×列表χ2检验的结果说明差异有统计学意义,需作两 两比较时,先调整α值,再进行率的两两比较。
配对检验公式推导:
bc
(+,)和(,+)两个格子中的理论频数均为
2
b c 40时
2
(AT)2(b b c )2 2(c b c)22
T
bc
bc
2
2
(b c)2
bc
~ 2 分布
同理可得b c 40时
1
校正公式: 2 (| A T | 0.5)2 (| b c | 1)2
表8-5 两种培养基的培养结果
B培养基
A培养基
+
-
合计
+
48
24
72
-
20
106
126
合计
68
130
198
A 培养基 B培养基
痰标本 1 2 3 4 5 6 7 8 9 10 11 12 13 14
结果统计
A培养基 + + + + + + + + + + -
B培养基 + + + + + + + -
合计
145 109 254 57.09
1.建立检验假设并确定检验水准
卡方检验正式文稿演示
组别 甲组 乙组 合计
阳性数 a c
a+c
阴性数 b d
b+d
合计 a+b=n1 c+d=n2
N
率% a/n1 c/n2 (a+c)/N
各组样 本例数 是固定 的
另一个同样重要的分布—χ2卡方分布(Chisquared distribution)。
此分布在1875年,首先由F. Helmet所提出, 而且是由正态分布演变而来的,即标准正态 分布Z值之平方而得
设Xi为来自正态总体的连续性变量。
ui
Xi
u2 i
(Xi )2 2
12
n
u2 i
类似于方差的计算思想,
(x i X ) (A T 0 )2 (A T )2
Pearson χ2检验的基本公式
残差大小是一个相对的概念,
相对于期望频数为10时,20
的残差非常大;可相对于期
望频数为1000时20就很小了。
因此又将残差平方除以期望
频数再求和,以标准化观察
Karl Pearson (1857 – 1936) 频数与期望频数的差别。
检验统计量:χ2 应用:计数资料
基本概念
例1 某院比较异梨醇(试验组)和氢氯塞嗪 (对照组)降低颅内压的疗效,将200名患者 随机分为两组,试验组104例中有效的99例,对 照组96例中有效的78例,问两种药物对降低颅 内压疗效有无差别?
表 200名颅内高压患者治疗情况
编号 年龄 性别 治疗组 舒张压 体温 疗效
行分类
列分类(Y)
合计
(X) 发生数 未发生数
甲
a=a99
b=b5
1a0+4b
卡方检验ppt课件
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=பைடு நூலகம்0
0.0
0
5
10
15
20
25
1
主要内容
2分布
– 了解2分布的基本思想和2分布曲线
四格表资料的2检验
– 掌握应用条件、基本思想和检验过程
配对设计资料的2检验
– 掌握应用条件、基本思想和检验过程
2分布的形状依赖于自由度ν的大小,当 ν≤2时,曲线呈L型;随着ν的增加,曲线 逐渐趋于对称;当ν→∞时, 2分布趋向正 态分布。
3
2分布曲线
.5
.4
ν=1
.3
.2
ν=3
ν=6
.1
ν=10
0.0 0
5
10
15
20
25
4
2 检验
2检验是一种用途非常广泛的以2分布 为理论依据的假设检验方法,主要用于:
14
本例的2检验
H0:π1=π2,即两种给药方法的总体不良 反应发生率相同
H1:π1≠π2,即两种给药方法的总体不良 反应发生率不同
α=0.05
15
本例的2检验
2 (A T )2 (35 30.76)2 (74 78.24)2 (22 26.24)2 (71 66.76)2 1.771
实际频数:表内各格数字为实际资料的数字。
10
2 检验的基本思想
实际频数和理论频数差异的大小可以用2值的大
小来说明,当样本量n和各个按检验假设计算的理
论频数T都足够大时,比如n≥40,T≥5, 似于2分布,n越大,近似程度越好。
统计方法 SPSS实例: 四格表卡方检验完整
统计方法SPSS实例:四格表卡方检验(可以直接使用,可编辑实用优秀文档,欢迎下载)SPSS实例:四格表卡方检验我们先来讲一个案例,我们想要知道两个年龄组的儿童在同一个问题上回答的正确性是否不同,统计出来的四格表是这样的:年龄组分为0和1两个水平,是否正确分为0和1两个水平,怎样检验不同年龄组回答正确性是否相同?这就用到了四格表卡方检验。
从上表中知道,表中任何一个单元格的数字都大于5,说明可以使用正常的卡方检验,如果有一个或者多个单元格数字少于5,需要进行精确卡方检验,以后会有教程。
下面先看一下具体这个案例的操作过程:情况1:有原始数据1.原始数据的数据结构,见下图。
在这里没有频数,只有年龄组和是否正确这两个变量2.在菜单栏上执行:分析--描述统计--交叉表3.将年龄组设置为行变量,是否正确设置为列变量;然后设置统计量,点击statistic4.勾选卡方值,这样才能输出卡方值5.首先看到的表格是基本的频数统计,没什么好说的,大家都懂6.看第二个表格是最关键的信息,我们看sig值,如果小于0.05就可以认为达到了显著水平,拒绝虚无假设,认为年龄对答案的正确性产生了影响。
情况2:没有原始数据假如没有原始数据,只有一个四个表,如下图:我们只需要将数据进行加权就可以了。
下面是具体的步骤:1.先整理数据,数据结构见下图2.接着进行加权3.用频数进行加权,点击ok4.接下来的步骤都是一样的,见上面。
常见离子的检验方法一、常见阳离子的检验二、常见阴离子的检验去Ps:红色字为较好方法第二章描述统计:表格与图形方法第一节数据的预处理一、数据审核1、准确性审核的对象就登记性误差(非抽样误差)采取逻辑检查和计算检查方法·逻辑检查:主要看调查数据的内容是否合理,项目之间是否有矛盾的地方,以及与有关数据进行对照,或者检查数据的平衡关系,以暴露逻辑上的矛盾·计算检查:主要是从数字上检查,如各分项之和是否等于总计,计量单位是否合适,计算方法上是否合理等等2、全面性核对应调查的单位是否有遗漏,应调查的内容是否齐全3、及时性即是否按规定的时间获取数据资料二、数据筛选1、当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选2、数据筛选的内容(1)将某些不符合要求的数据或有明显错误的数据予以剔除(2)将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除3、数据筛选可借助计算机完成三、数据排序1、按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索2、排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3、在某些场合,排序本身就是分析的目的之一4、排序可借助于计算机完成第二节定性数据的图表分析一、频数分布:将统计数据分组后,各组数据出现的次数被称为频数(次数)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有效
无效
271(253.24) 5(22.76)
74(91.76) 26(8.24)
345
31
合计 276 100 376
有效率 98.19% 74.00% 91.76%
列联表资料分析
把全部数据按两个分类变量(原因变量、结 果变量)进行完全分类列成的频数表格称为列联 表,R行C列的列联表简称R×C表,2×2列联表 也称为四格表,利用列联表进行分类资料的检验 称为列联表分析。
列变量:“疗效”,Values为:1=“有效 ”,2=“无效”;
频数变量:“频数”。
2. spss操作过程
(1)在spss中调出数据文件Li8-1.sav (2)频数变量加权。 从菜单选择 Data→Weight Cases 弹出Weight Cases对话框,选择
Weight Cases by框,框内选入“频数 ”,即指定该变量为频数变量
四格表卡方检验文稿演示
四格表卡方检验
本章结构
第一节 四格表 2检验
第二节 四格表确切概率法
第三节 R×C 表资料的 2检验
第四节 配对四格表资料的 McNemar检验
第五节 多个样本率的两两比较
第一节 四格表 2检验
卡方检验的基本思想 四格表专用公式 四格表卡方检验的应用条件 校正卡方检验
2 检验
2 值的大小反映了实际频数A与理论频数T的吻合程度
2分布(chi-square distribution)
纵高
0.5 0.4 0.3 0.2 0.1 0.0
0
f(2)2(1/2)22(/21)e2/2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
一、卡方检验的基本思想
例8-1 对表8-1资料推断两药的疗效有无差别
H0: 1 2,即两药总体有效率相等
由于总体有效率未知,将两组数据合并,计算合并
样本有效率(称为理论有效率)
p =345/376=91.76%,
据此推算两组的理论有效数:
T11=276×345/376=253.24, T21=100×345/376=91.76,
主要输出结果
校正只适用于四格表 理论数小于5的格子数为0(占0%),最小理论数为8.24
结果分析
由总频数n=376>40,最小理论频数8.24 >5,使用Pearson卡方检验。
结果分析:Pearson 2=56.77,双侧P=
0.000<0.05,以α=0.05水准拒绝H0,差 异有统计学意义,可认为两药疗效不同。
二、四格表专用公式
为了不计算理论频数T, 可由基本公式推导出, 直接由各格子的实际频数(a、b、c、d)计算卡方 值的公式:
基本公式 2 :(AT)2
T
(adbc)2n
(ab)(cd)(ac)(bd)
df1
-------四格表专用公式
例8-1 用专用公式 计算 2 值:
2 (271 26 5 74 )2 376 56 .77
三、四格表 2检验的应用条件
(1)当n≥40,且所有T≥5时,用Pearson 2 检验 (2)当n≥40,而有1≤T<5时,用校正2检验
(3)当n<40或T<1时,用Fisher精确检验(Fisher exact test )
2分布是一连续型分布,而四格表资料属离散型
分 布 , 对 其 进 行 校 正 称 为 连 续 性 校 正 (correction for continuity), 又 称 Yates 校 正 ( Yates' correction)。
(1857~1936)
英国统计学家
1901年10月与 Weldon,Galton 一起创办 Biometvika
例8-1 某医院收治376例胃脘痛患者,随机分 为两组,分别用新研制的中药胃金丹和西药治疗。 结果如表8-1,探讨两药疗效有无差别。
表8-1 两药治疗胃脘痛的疗效四格表
疗法 胃金丹 西药 合计
2R,C(ArcTrc)2
( AT) 2
T r,c1
rc
T
2(27125.324)2(522.76)2(7491.76)2
25.324
22.76
91.76
(268.24)2 56.77 8.24
df(21)(21)1
Pearson 2 值近似服从自由度为 df=(R-1)(C-1)的 2 分布
理论无效数: T12=276 -253.24=22.76,
T22=100 -91.76=8.24
理论数公式
Trc
nrnc n
,nr表示r第 行的合计数;
nc表示c第 列的合计n数 表; 示总合计。
271 5 74 26
253.24 22.76 91.76 8.24
衡量理论数与实际数的差别
检验统计量 2 值:
276 100 345 31
查 2界值表,
2 0.05 ,1
3 . 84
下结论:
, df 1
2
2 0.05 ,1
3.84 ;
P 0.0H
,接
0
受
H
,
1
可
以
认
为
疗
效不
同
。
1.建立数据文件
在SPSS数据编辑窗,建立数据文件Li81.sav。
行变量:“组别”,Values为:1=“胃金 丹”,2=“西药”
加权变量
(3) 2检验
从菜单选择
Analyze→Descriptive Statistics→Crosstable(交叉表)
指定 Row(s):组别 Columns(s):疗效 击Statistics按钮选择Chi-square。
列联表分析
统计量
卡方 检验
一致性检验 危险度分析
配对四格表卡 方检验
1122.59 15
18
卡方值
2 检验的基本公式
2 (A T T )2 d f(R 1 )C ( 1 )
上述基本公式由Pearson提出,因此软件上 常称这种检验为Peareson卡方检验,下面将要 介绍的其他卡方检验公式都是在此基础上发展起 来的。它不仅适用于四格表资料,也适用于其它
的“行×列表”资料。
2 检验(Chi-square test)是现代统计学的
创始人之一,英国人K . Pearson(1857-1936 )于1900年提出的一种具有广泛用途的统计方 法,可用于两个或多个率间的比较,计数资料 的关联度分析,拟合优度检验等等。
本章仅限于介绍两个和多个率或构成比比较
的 2检验。
Karl Pearson