统计学--第十二章卡方检验1
统计学--第十二章卡方检验
统计学--第十二章卡方检验
第二节 行×列表的2检验
• 当行或列超过2组时通称为行×列表,或 R×C表,亦称列联表contingency table。 可用于
• 1、多个率的比较 • 可用以下简化公式(无相应校正公式)
2 n( O2 1) nrnc 统计学--第十二章卡方检验
• 4、理论数:
– 一般溃疡患者80,按理论治愈率应治 愈80×52.51%=42.01,称theoretical value, theoretical frequency. 记为T。同理可得
统计学--第十二章卡方检验
其余理论数。亦可由减法求得
– Trc=(nrnc)/n:理论数为行合计乘列合计 除总合计
好转为2,显效为3,痊愈为4,计算其均 数,称行平均分row mean score
统计学--第十二章卡方检验
• aj为各疗效得分,n1j为第一行各疗效的频数,n1+ 为第一行合计
• 同理计算第二行平均分
• 再进行行平均得分差检验—χs2
f1
4 j1
ajn1j n1
s2
( f1 )2
(n n1 ) /[n1 (n 1)]}
特 殊 类 型 31(51.99) 68(47.01) 99
合计
94
85
179
统计学--第十二章卡方检验
– 为检验是否为第二种情况,无效假设 为两种治愈率本无不同,差别仅由抽 样误差所致。
• 3、理论治愈率:
– 根据两组治愈率相同的假设,合计治 疗179人,总治愈94人,得理论治愈率 为 94/179=52.51%
– HO:1=2,即两总体阳性率相等 – H1:12,即两总体阳性率不等 – =0.05
医学统计学课件-卡方检验
联合治疗 39 34.44 8 12.56 47 73.3 单纯治疗 57 61.56 27 22.44 84 73.3
合计
96
35
131 73.3
Trc
nr nc n
理论频数= 84 73.3%
χ2检验的基本思想(1)
通过构造A与T吻合程度的统计量来反 映两样本率的差别!
实际数A
39
8
57
27
污染率 (%)
甲
6
23
29
79.3
乙
30
14
44
31.8
丙
8
3
11
27.3
合计
44
40
84
47.6
理论数的计算
实际数A
6
23
29
30
14
44
8
3
11
44
40
84
(52.4%) (47.6%)
理论数T
15.2 13.8
23.0 21.0
5.8
5.2
T
nR
nC N
nR nC N
2值的计算
实际数A
χ2检验相关问题-应用条件
某矿石粉厂当生产一种矿石粉石时,在数天内即有 部分工人患职业性皮肤炎,在生产季节开始,随机 抽取15名车间工人穿上新防护服,其余仍穿原用的 防护服,生产进行一个月后,检查两组工人的皮肤 炎患病率,结果如表 ,问两组工人的皮肤炎患病 率有无差别?
χ2检验相关问题-应用条件
Total
When the variables are independent, the proportion in
both groups is close to the same size as the proportion
统计学-第十二章卡方检验
避免误用与误判的建议
充分理解卡方检验的原理 和适用条件,避免在不满 足条件的情况下使用。
结合专业知识判断观察频数与 期望频数的差异是否具有实际 意义,避免过度解读统计结果 。
ABCD
在进行卡方检验前,对数据 进行充分的描述性统计分析 ,了解数据的分布特点。
统计学-第十二章卡方检验
目 录
• 第十二章概述 • 卡方检验的基本原理 • 卡方检验的应用场景 • 卡方检验的步骤与实现 • 卡方检验的优缺点及注意事项 • 实例分析与操作演示
01
第十二章概述
章节内容与目标
01
掌握卡方检验的基本原理和假设检验流程
02
了解卡方检验在不同类型数据中的应用
能够运用卡方检验进行实际问题的分析和解决
THANK YOU
卡方分布及其性质
卡方分布的定义
若$n$个相互独立的随机变量$X_1, X_2, ldots, X_n$均服从标准正态分布$N(0,1)$,则它们的 平方和$X^2 = sum_{i=1}^{n}X_i^2$服从自 由度为$n$的卡方分布,记为$chi^2(n)$。
期望和方差
$E(X) = n$,$D(X) = 2n$,其中$X sim chi^2(n)$。
运行分析
点击“确定”按钮,运行卡方检验分 析。
结果解读与报告撰写
结果解读
根据卡方检验的结果,判断各组分类数据的 分布是否存在差异,以及差异的显著性水平 。
报告撰写
将分析结果以文字、表格和图表的形式呈现 出来,包括研究目的、数据收集与整理过程 、卡方检验结果和结论等部分。同时,需要
注意报告的规范性和可读性。
统计学卡方检验
根据分析结果,为患者提供个体化的干预措施,提高生存质量。
06
卡方检验注意事项及局限 性讨论
样本量要求及抽样方法选择
样本量要求
卡方检验对样本量有一定的要求,通常建议每个单元格的期望频数不小于5,以确保检验结果的稳定性和可靠性 。当样本量不足时,可能会导致检验效能降低,增加第二类错误的概率。
抽样方法选择
在进行卡方检验时,应选择合适的抽样方法。简单随机抽样是最常用的方法,但在某些情况下,如分层抽样或整 群抽样可能更适合。选择合适的抽样方法有助于提高检验的准确性和可靠性。
期望频数过低时处理策略
合并类别
当某个单元格的期望频数过低时,可以考虑 合并相邻的类别,以增加期望频数。合并类 别时应注意保持类别的逻辑性和实际意义。
适用范围及条件
适用范围
卡方检验适用于多个分类变量之间的独立性或相关性检验,如医学、社会科学等领域的调查研究。
条件
使用卡方检验需要满足一些前提条件,如样本量足够大、每个单元格的期望频数不宜过小等。此外, 对于有序分类变量或存在空单元格的情况,需要采用相应的处理方法或选择其他适合的统计方法。
02
卡方检验方法
统计学卡方检验
目录
• 卡方检验基本概念 • 卡方检验方法 • 数据准备与预处理 • 卡方检验实施步骤 • 卡方检验在医学领域应用举例 • 卡方检验注意事项及局限性讨论
01
卡方检验基本概念
定义与原理
01
02
定义
原理
卡方检验是一种基于卡方分布的假设检验方法,用于推断两个或多个 分类变量之间是否独立或相关。
确定分组界限
在确定分组界限时,可以采用等距分组、等频分组或 基于数据分布的分组方法。选择合适的分组界限有助 于保持各组之间的均衡性,减少信息损失。
9 第十二章 卡方检验(一)
确切概率法计算公式
在四格表的周边合计不变的条件 下 , 用下式直接计算表内四个数据 的各种组合之概率。 的各种组合之概率。 式中a、b、c、d为四格表的实际 频数
(a+b)!(c+d)!(a+c)!(b+d)! P= a!b c!d!n ! !
四格表资料的精确检验法基本步骤
1、建立假设 Ho:假设差别是由抽样误差引起的 H1:假设差别是本质上存在的 确定显著性水准: 2、确定显著性水准:α=0.05 3、计算确切概率P 周边合计不变,列出各种组合的四格表; (1)周边合计不变,列出各种组合的四格表; 计算各个四格表的| (2)计算各个四格表的|A-T|值; 样本| (3)求|A-T|值≥样本|A-T|值的所有四格表的Pi 值; Pi=(a+b)!(c+d)!(a+c)!(b+d)!/[a!b!c!d!n!] (4)求出确切概率P:P=ΣPi 结果判断: 4、结果判断:在事先确定的显著性水准α下作 出专业结论。 出专业结论。
行×列表资料χ2检验时的注意事项
1、行×列表资料χ2检验对资料的要求是:不宜有1/5以上 检验对资料的要求是:不宜有1 格子的理论数小于5 且理论数应大于1 格子的理论数小于 5 , 且理论数应大于 1 , 若发生上述情 可选用下述三种处理方法 三种处理方法: 况 , 可选用下述 三种处理方法 : ① 适当增大样本含量以 增大理论频数; 增大理论频数 ; ② 将理论数过小的格子所在的行或列与 性质相近的行或列中的实际数合并, 性质相近的行或列中的实际数合并 , 使重新计算的理论 数增大; 删去理论数过小的行或列。 数增大 ; ③ 删去理论数过小的行或列 。 后两种处理方法 有可能损失资料信息, 且可能破坏样本随机性, 有可能损失资料信息 , 且可能破坏样本随机性 , 故不宜 常规使用。 常规使用。 2、当试验效应按照强弱分为若干个级别,试验结果可整理 当试验效应按照强弱分为若干个级别, 为单向有序行×列表资料, 为单向有序行 × 列表资料 , 在比较各处理组间的效应有 无差别时,宜选用秩和检验、Ridit分析 趋势检验等, 分析、 无差别时,宜选用秩和检验、Ridit分析、趋势检验等, 检验只能说明各组构成比的差别有无显著性。 如作χ2检验只能说明各组构成比的差别有无显著性。 3、多个样本率或多个构成比的χ2检验,结果有显著性意义 检验, 只能认为总体率或总体构成之间总的来说有差别, 时,只能认为总体率或总体构成之间总的来说有差别, 不能说明两两之间皆有差别, 不能说明两两之间皆有差别,若要对每两个率或每两个 构成比进行比较,应采用行× 构成比进行比较,应采用行×列表的χ2分割法或者采用 其它率或构成比的多重比较。 其它率或构成比的多重比较。
卡方检验-适合性检验
本科学生实验报告学号姓名学院生命科学学院专业、班级生物科学15C班实验课程名称生物统计学<实验>指导教师及职称孟丽华开课时间2016 至2017 学年下学期填报时间2017 年 5 月26 日云南师范大学教务处编印的检验,而是对总体分布的假设检验。
适合性检验(吻合度检验):是指对样本的理论数先通过一定的理论分布推算出来,然后用实际观测值与理论数相比较,从而得出实际观测值与理论数之间是否吻合。
因此又叫吻合度检验。
实验流程:(1)听老师讲解理论知识;(2)结合书上习题5.4进行练习,加强对知识的掌握:设置变量输入各组数据进行加权进行适合性检验4、实验方法步骤及注意事项:实验方法步骤:1、打开SPSS页面。
2、设置变量,将变量名分别设置为“类型”和“数量”,将Decimals改为0,在“类型”变量中,点击Values进行赋值,将“钩芒”赋值为1,“长芒”赋值为2,“短芒”赋值为3,设置好变量后,输入各组数据。
3、点击Date——Weight Cases…进行加权,在跳出的Weight Cases框中点二、输入各组数据三、进行加权四、进行适合性检验2、对实验现象、数据及观察结果的分析与讨论:(1)假设H0:大麦F2代芒性状表型的比率符合9:3:4的理论比率;H A:其比率不符合9:3:4的理论比率。
(2)选取显著水平为α=0.05。
(3)计算统计数χ2:采用χ2值计算简式可得χ2=1/n∑O i2/Pi-n=1/(348+115+157)×[3482/(9/16)+1152/(3/16)+1572/(4/16)]-(348+115+157)=0.041或利用SPSS软件进行计算。
(4)查χ2值表,df=2时,χ20.05=5.99,χ2<χ20.05,所以,接受H0,认为大麦F2代芒性状表型比率符合9:3:4的理论比例。
或由SPSS的计算结果可知:Asymp.sig.=0.980,因为0.980>0.05,所以接受H0,认为大麦F2代芒性状表型比率符合9:3:4的理论比例。
《卡方检验》课件
制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。
卡方检验实例1
463人手术患者,预测并发症人数为169位,实际并发症人数201位,该如何用卡方检验判断有无统计学意义?是配对X2检验吗?该如何将数据列表?如何用Spss得出结果呢?方法一:把数据转化成四格表,然后你就明白了。
然后用卡方检验。
发病不发病实际(fo)201 262 共463人期望(fe) 169 294 共463人X2=4.789由于df=1,查表得,P<0.05显著,说明这个预测是具有统计学意义的。
方法二:用spss做,是列联表分析。
数据录入格式为:建立两个变量,变量1是实际和期望,实际用数据1表示,那期望就用数据2表示;变量2是发病情况,发病用1表示,不发病用2表示,也就是说,你的变量1中应该数据463个1,然后输入463个2,变量2中,先输入201个1,再输入262个2,再输入169个1,再输入294个2,建议你用EXCL来数据方便的多。
直接可以复制。
数据录入完成后,点analyze-descriptive statistics-crosstabs-把变量1选到rows里,把变量2选到column里,然后点击下面的statistics,打开对话框,勾选chi-squares,然后点continue,再点ok,出来结果的第3个表就是你要的卡方检验,第一行第一个数是卡方值,后面是自由度,然后是P值。
我算过了,卡方值应该是4.609,df=1,P值=0.032,P<0.05,所以显著。
预测是有统计学意义的。
如果按照你叙述的来看,其实是按照“teng7925 |”这位说的去做,只不过在SPSS输入数据的时候,不需要按照他说的那样,只需要设计三个变量,第一个变量输入:1 1 2 2;第二个变量输入:1 2 1 2;第三个变量输入:201 262 169 294。
输入完,按照他说的步骤,可以得到他说的同样的结果,得到的结果说明预测与实际的发症人数有显著差异。
但是我仔细想了下,你书上说的思路可能不是上面那种想法。
卡方检验解释
了自由度ν的影响, 2值才能正确地反映实际频数A和理论
频数T 的吻合程度。
检 2验的自由度取决于可以自由取值的格子
数目,而不是样本含量n。四格表资料只有
两行两列,=1,即在周边合计数固定的情
况下,4个基本数据当中只有一个可以自由
取值。
(三) 假设检验
(1) 建立检验假设,确定检验水平。
H0:π1=π2 H1:π1≠π2
理论频数由下式求得:
TRC
nR nC n
式中,TRC 为第R 行C 列的理论频数 nR 为相应的行合计 nC 为相应的列合计
检验统计量 2 值反映了实际频数与 理论频数的吻合程度。
若检验假设H0:π1=π2成立,四个格子的实际 频数A 与理论频数T 相差不应该很大,即统计量
不应该很大。如果 2 值很大,即相对应的P 值很
24.08, P0.05
结论与之相反。
(四)卡方检验的连续性校正问题
赞成依据是:这样做可使卡方统计量抽样 分布的连续性和平滑性得到改善,可以降 低I类错误的概率,连续性校正后的卡方检 验,其结果更接近于Fisher确切概率法。不 过,校正也不是无条件的,它只适合于自 由度为1时,样本含量较小,如n<40,或 至少有一个格子的理论频数太小,如T<5 的情形。
R ×C表 2 检验
行×列表资料
① 多个样本率比较时,有R行2列,称为R ×2表; ② 两个样本的构成比比较时,有2行C列,称
2×C表; ③ 多个样本的构成比比较,以及双向无序分类资
料关联性检验时,有行列,称为R ×C表。
检验统计量
2 n(
A2 1)
nR nC
(行数 1)(列数 1)
感染率(%)
2.36 0.62 0.26 1.45
第十二章卡方检验
果是:优8名、良20 良 20 21.5 2.25 0.10
名,中18名,差4名。中 18 21.5 12.25
试检验其评定的分布
差 ∑
4 50
3.5 50
0.25 —
与正态分布所期待的
2(3)0.05=7.81
结果有无显著差别?
0.57 0.07 6.53
例12-7:测得 551名学生的身高 如下表。试问学 生的实际身高是 否符合正态分布?
148-150 80 149 –1.21 .21540 .12746 70
145-147 25 146 –1.70 .09400 .05562 31
142-144 139-141
8 143 –2.29 .02890 .01710 9 4 140 –2.88 .00670 .00396 121
∑ 551 - -
551
身高 f0 ft
2
169-171 0.125
2
18
166-168 7 7
163-165 22 23 0.043
160-162 57 60 0.150
157-159 110 104 0.471
154-156 124 130 0.277 151-153 112 114 11 0.035
148-150 80 70
求2
df=k-3 =9-
3=6 2(6)0.05=12.6
第三节 独立性检验
• 定义:检验两个变量是独立的,还是相关 的 性。 质:二元分类资料的χ 2检验。 方法
r×c列联表的χ 2检验 2×2列联表的χ 2检验
一、r×c列联表的χ 2检验
例12-7:某小学三、四年级独立概括某种 教
nr nc
统计学教程-卡方检验
Lower
Upper
3.000
.992
9.068
2.500
.987
.833
.684
100
6.334 1.016
❖ 结果显示,OR=3.00,说明吃了该食物者发生食物中
毒的可能性是没有吃该食物者的3.00倍?
分层卡方检验
例4 某研究人员对3家医院的卫生服务情况进行 了调查,现希望分析寻求就诊和性别之间有无 联系。(数据见cmh.sav)
Exact Sig. (1-sided)
Likelihood Ratio
14.550
1
.000
Fisher's Exact Test
.000
.000
Linear-by-Linear Associ ati on
13.910
1
.000
McNemar Test
.013c
N of Valid Cases
58
poison
Yes 10
No 30
6.4
33.6
6
54
9.6
50.4
16
84
16.0
84.0
Total 40
40.0 60
60.0 100 100.0
❖ 这就是两变量的四格表。
两分类变量间关联程度的度量
结果分析
Chi-Square Tests
Pearson Chi-Square Continuity Correction a
a. Computed onlyfor a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5. 16.
卡方检验详述
卡方检验什么是卡方检验卡方检验是一种用途很广的计数资料的假设检验方法。
它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。
其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。
它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
卡方检验的基本原理卡方检验是以χ2分布为基础的一种常用假设检验方法,它的无效假设H0是:观察频数与期望频数没有差别。
该检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。
根据χ2分布及自由度可以确定在H0假设成立的情况下获得当前统计量及更极端情况的概率P。
如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。
卡方值的计算与意义χ2值表示观察值与理论值之问的偏离程度。
计算这种偏离程度的基本思路如下。
(1)设A代表某个类别的观察频数,E代表基于H0计算出的期望频数,A与E之差称为残差。
(2)显然,残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。
因为残差有正有负,相加后会彼此抵消,总和仍然为0,为此可以将残差平方后求和。
(3)另一方面,残差大小是一个相对的概念,相对于期望频数为10时,期望频数为20的残差非常大,但相对于期望频数为1 000时20的残差就很小了。
考虑到这一点,人们又将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。
进行上述操作之后,就得到了常用的χ2统计量,由于它最初是由英国统计学家Karl Pearson在1900年首次提出的,因此也称之为Pearson χ2,其计算公式为:其中,Ai为i水平的观察频数,Ei为i水平的期望频数,n为总频数,pi为i水平的期望频率。
统计方法卡方检验
卡方检验用途:可以对两个率或构成比以及多个率或构成比间的差异做统计学检验第一节. 四格表资料的χ2检验例8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表8.1,问铅中毒病人和对照人群的尿棕色素阳性率有无差别?表8.1 两组人群尿棕色素阳性率比较组别阳性数阴性数合计阳性率%病人29(18.74) 7(17.26) 36 80.56对照9(19.26)28(17.74) 37 24.32合计38 35 73 52.05卡方检验的基本思想表1中29、7、9、28是构成四格表资料的四个基本格子的数字,其余行合计和列合计以及总的合计都可以根据该四个数字推算出来,故该类资料被称为四格表资料四格表卡方检验的步骤以例8.1为例1.建立假设:H0:π1 = π2H1:π1≠π2α=0.05四格表的四格子里的数字是实际数,在表1中四个数字旁边括号中的四个数字为理论数,其含义是当无效假设成立的时候,理论上两组人群各有多少阳性和阴性的人数。
若H0:π1=π2成立→p1=p2=p即假设两组间阳性率无差别,阳性率都是等于合计的52.05%,那么铅中毒病人36人,则理论上有36 ╳52.05%=18.74人为阳性;对照组37人,则理论上有37 ╳52.05%=19.26人为阳性。
故每个实际数所对应的理论数算法是,该实际数对应的行和乘列和再除以总的N样本含量。
即TRC=nR nC / n2.计算理论数第1行1列: T11=36×38/73= 18.74依次类推T12 = 17.26T21 = 19.26T22 = 17.74四格表中理论数的两大特征:(1)理论频数表的构成相同,即不但各行构成比相同,而且各列构成比也相同;(2)各个基本格子实际数与理论数的差别(绝对值)相同。
一、卡方检验基本公式A: 实际数 T: 理论数卡方检验的基本思想是看理论数与实际数的吻合程度上述公式中卡方统计量的大小取决于实际数和理论数的相差大小情况,如果无效假设成立的话,那么实际数和理论数不应该相差过大,所以卡方统计量应该较小,而如果卡方统计量越大,则越有可能推翻无效假设而得出有统计差异的结论。
40. 什么是统计学中的卡方检验?
40. 什么是统计学中的卡方检验?40、什么是统计学中的卡方检验?在统计学这个广袤的领域中,卡方检验是一种非常重要且常用的方法。
那么,究竟什么是卡方检验呢?卡方检验,简单来说,就是一种用于比较观察值和期望值之间差异的统计方法。
它通过计算一个叫做卡方值的统计量,来判断两个或多个变量之间是否存在显著的关联。
为了更清楚地理解卡方检验,让我们先从一个简单的例子说起。
假设我们想研究吸烟是否与患肺癌有关系。
我们可以收集一组人群的数据,其中一部分人吸烟,另一部分人不吸烟,然后观察他们中患肺癌和未患肺癌的人数。
在这个例子中,我们可以先根据一些已知的信息或者假设,计算出在没有任何关联的情况下,吸烟和不吸烟人群中患肺癌和未患肺癌的理论人数,也就是期望值。
然后,将实际观察到的人数与这些期望值进行比较。
卡方检验的核心思想就是,如果观察值与期望值之间的差异非常小,那么我们就可以认为吸烟与患肺癌之间可能没有关联;但如果差异很大,那就说明两者之间很可能存在关联。
那么,卡方值是怎么计算出来的呢?其实就是将每个类别中的观察值与期望值相减,然后平方,再除以期望值,最后把所有类别的结果相加。
卡方检验有不同的类型,其中最常见的是拟合优度检验和独立性检验。
拟合优度检验主要用于检验一组观察数据是否符合某种理论分布,比如正态分布、泊松分布等。
比如说,我们想知道某个城市中家庭人口数量的分布是否符合某种预期的模式,就可以使用拟合优度检验。
独立性检验则用于判断两个分类变量之间是否相互独立。
就像前面提到的吸烟与患肺癌的例子,吸烟与否和是否患肺癌就是两个分类变量。
在实际应用中,卡方检验有着广泛的用途。
比如在医学研究中,它可以帮助研究人员判断某种治疗方法是否有效;在市场调查中,可以了解消费者的不同特征与购买行为之间的关系;在社会学研究中,能够探究不同社会因素之间的相互影响。
不过,使用卡方检验也有一些需要注意的地方。
首先,样本量不能太小,否则卡方检验的结果可能不准确。
卫生统计学---卡方检验
例 某市重污染区、一般污染区和农村的出生婴儿的致畸情况如下 表,问三个地区的出生婴儿的致畸率有无差别?
表 某市三个地区出生婴儿的致畸率比较
① 建立假设 H0:π1=π2=π3 H1:π1,π2,π3之间不等或不全等。
② 确定检验水准
α=0.05
③ 计算统计量
值
2
2 n(
A2 1) nR nC
⑤ 下结论
因为P<0.05,按α=0.05的水准,拒绝H0,接受H1, 差异有统计学意义。即可认为两药治疗消化 道溃
疡的愈合率有差别,其中奥美拉唑的愈合率比雷
尼替丁愈合率高。
ห้องสมุดไป่ตู้二) 四格表的专用公式
2
(ad - bc)2 n
(a b)(c d)(a c)(b d)
a、b、c、d 分别为四格表中的四个实际频数,n为总
例3 某研究者欲比较A、B、C 三种方案治疗轻、中度高血压的疗 效,将年龄在50~70岁的240例轻、中度高血压患者随机等分为3组, 分别采用三种方案治疗。一个疗程后观察疗效,结果见表11.4。问 三种方案治疗轻、中度高血压的有效率有无差别?
表3 三种方案治疗轻、中度高血压的效果
① 建立假设
H0:π1=π2=π3 H1: 三种方案治疗轻、中度高血压的有效率不等或
(二) 两个或多个构成比的比较
例4 为了解新型农村合作医疗对于农村贫困居民住院服务利用的 影响,在经济条件相似的甲、乙两个国家级贫困县(其中甲县2006 年已开展新型农村合作医疗,乙县2006年尚未开展)分别进行抽样 调查,得到2006年应住院者未住院原因,见表11.5。问甲、乙两县 应住院者未住院原因构成比是否不同?
论频数之差相差很大,则 值相应也会很大,相应的P值也就2 越小,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• • • •
二、行为名义变量列为顺序变量的行×列表 1、行平均分的计算 行平均分可采用:整数给分法 2、行平均分差别统计意义检验
( n 1) n1 ( Fi )
s
2
s
2 2
i 1
n
s 值服从自由度为行数 1 的卡方分布
第六节 行列变量的相关检验
• 行与列变量都是顺序变量时可检验两者是否相 关:P166例12-12 • 行c与列a都给予得分 • 用a和c计算线性函数f • 再分别计算行平均分和列平均分 • f的期望E(f)=行平均分×列平均分 • 计算f的方差var(f) • 计算卡方值,自由度为1
• 基本思想:在四格表周边合计不变的情 况下,获得某个四格表的概率为
P ( a b )! ( c d )! ( a c )! ( b d )! a ! b! c! d ! n!
• a!表示factorial a 或a factorial • 0!=1; 3!=3×2×1=6 • 该方法计算出的概率为分布中单侧的概 率,故双侧时应以0.025为显著性水平。 结合实际确定采用单侧还是双侧
两种类型胃溃疡病内科疗法治疗结果
组别 治愈 未愈 合计
一般类型
6 3 (4 2 .0 1 ) 1 7 (3 7 .9 9 )
80
特殊类型
3 1 (5 1 .9 9 ) 6 8 (4 7 .0 1 )
99
合计
94
85
179
– 为检验是否为第二种情况,无效假设 为两种治愈率本无不同,差别仅由抽 样误差所致。 • 3、理论治愈率: – 根据两组治愈率相同的假设,合计治 疗179人,总治愈94人,得理论治愈率 为 94/179=52.51% • 4、理论数: – 一般溃疡患者80,按理论治愈率应治 愈80×52.51%=42.01,称theoretical value, theoretical frequency. 记为T。同理可得 其余理论数。亦可由减法求得
=
2
( ad bc ) n
2
( a b )( c d )( a c )( b d )
校正公式为:
=
2
( ad bc - n / 2 ) n
2
( a b )( c d )( a c )( b d )
组别 甲 乙 合计
阳性 a c a+c
阴性 b d b+d
合计 a+b c+d a+b+c+d= n
第二节 行×列表的2检验
• 当行或列超过2组时通称为行×列表,或 R×C表,亦称列联表contingency table。 可用于 • 1、多个率的比较 • 可用以下简化公式(无相应校正公式)
2
n (
O
2
1)
nr nc
• 适用条件:不能有理论数小于1,并且1T5
• 2检验条件:(四格表) – 1、当n40且所有T5时,用普通的2 检验;若所得P ,改用确切概率法。 – 2、当n40但有1T<5时,用校正2检 验 – 3、当n<40或有T<1时,不能用2检验, 改用确切概率法。
( O - T - 0 .5 ) = T
2 2
• 8、四格表专用公式 • 为方便起见,当基本格子的实际数命名 为a,b,c,d;行合计写为a+b、c+d,列合计 写为a+c、b+d,n为总观察数
2
(O T ) T
– 2值是以理论数为基数的相对误差, 它反映了实际数与理论数吻合的程度 (差别的程度)。若检验假设成立,则实 际数与理论数的差别不会很大,出现 大的2值的概率是很小的,若P,就 怀疑假设,因而拒绝它;若P>,则尚 无理由拒绝它 – 2值的大小随着格子数的增加而变大, 即2分布与自由度有关。因而考虑2值 大小的意义时,要考虑到格子数。当 周边合计数固定的情况下,四个基本 数据当中只有一个可以自由取值,即 自由度为1。
• 二、两种以上处理方法的比较 • 见P170~171例12-15 • 仅供了解
第五节 列变量为顺序变量的列联 表—行平均分差检验
• 一、2×C表 • P163 例12-10 • Pearson 卡方只能得出两组构成是否相同 的结论,不能得出哪组疗效较好的结论 • 人为地给各疗效一个分数,如无效为1, 好转为2,显效为3,痊愈为4,计算其均 数,称行平均分row mean score
• 1、有实际数为0的情况下,只需代入公 式计算P值即可 • 2、没有实际数为0的情况时,要把更加 极端的情况都算入。 – 更加极端的情况是指:原来治愈率高 的治愈人数更要加多,治愈率低的治 愈人数更要减少,直至出现0为止,但 保持合计及总合计数字不变。见P157 例12-4 – 最后将几情况的概率相加得P值(单侧) – 可用查表法或计算机直接给出
• 1)实际数与理论数之间的差别等价于两 样本率的差别 • 2)检验假设H0:四格表的构成比相同, 等价于H0:两总体率相等 • 3)对实际数与理论数差值的假设检验, 等价于对两样本率差值的假设检验
• 6、2检验的基本思想(及计算步骤) • 1)假设两总体率相等(构成比相同) – HO:1=2,即两总体阳性率相等 – H1:12,即两总体阳性率不等 – =0.05 – 不妨把H0看作:1=2=两样本合并的 阳性率 • 2)实际数与理论数的差值服从2分布,又 称pearson 2 : 2
– P<0.001, 按=0.05水准,拒绝H0接受 H1,因而认为两总体的阳性率有差别 (统计学推论)。结果说明,两组胃溃疡 病人治愈率的差别有高度统计意义, • 7、 2值的校正、四格表2检验的条件 • 实际上2值是根据正态分布中2 =[(xi) /]2的定义计算出来的,用前述公式算 得的值只能说近似于2分布,在自由度 大于1,理论数皆大于5时,这种近似较 好;自由度为1,当有理论数小于5时, 需进行(连续性)校正
第十二章 卡方检验(一)
用于检验: 1)两组或几组率或构成比的差异有 无显著性 2)各行的平均分间有无差异 3)行与列两个顺序分类变量之间是 否相关 4)拟合优度检验
第一节 四格表资料的2检验
• 以P153例12-1为例 • 1、四格表:将资料列成表格,表格中四 个数字是基本的:63、17、31、68,称 四格表fourfold table • 2、实际数:表内各格数字为实际资料的 数字,称observed value, actual frequency, 记为O或A – 两样本率不同的原因:抽样误差、总 体率确实不同
• =(R-1)(C-1) – R行C列时,R行中有一行数据受到列 合计的限制而不能自由变动,C列中亦 有一列数据在行合计的限制下不能自 由取值 • 3)查2分布界值表确定P值并作出推论 – 2 =39.93,自由度为1,查附表6-7 – 2 0.05(1)=3.84; 2 0.01(1) =6.63; 2 0.001(1) =10.83 – 一般类型的治愈率高于特殊类型(结合 样本率作实际推论)
• 2、多个构成比比较 • 3、双向有序分类资料的关联性检验 – 表格是按两个变量从小到大顺序分类 整理出来的,目的是研究两变量间有 无关联性。从左上角往右下角看,频 数有无集中在此对角线上的趋势,即 两变量有关联。若频数在这些格子均 匀分布,或各行分布(构成比)相同,且 各列分布(构成比)相同,则表示两个变 量无关联性了。
a
j 1 r
r
j
n j
各疗效得分 各疗效合计人数
总例数
2
n
(a j ) (n j )
2 j 1
n
s 近似服从自由度为1 的卡方分布
• 平均得分统计量的样本大小较容易达到: 只要主观确定一个分割点,把列分为1 ~J和J+1~r两部分,变成四格表,把新的 四格中各部分实际数相加,只要四格表 中大部分超过5即可
– Trc=(nrnc)/n:理论数为行合计乘列合计 除总合计 – 理论数有两个特征:1)理论频数表的构 成比相同,即不但各行构成比相同, 而且各列亦相同;2)各个基本格子实际 数与理论数的差别(绝对值)相同 • 5、样本率的差别演绎为实际数与理论数 的差别: – 两样本率相差愈大,则实际数与理论 数的差别就愈大。若无效假设成立, 实际数与理论数之差就不会很大。
• 如果把数据排成等级rank,而不用整数评分法则 卡方检验与Spearman等级相关结果极为接近。 可任选其一
cs rs ( N 1)
2 2
第七节 多层列联表的分析
• 一、多层2C表 • 采用扩展的Mantel-Haenszel 平均得分统 计量—χ2SMH • 各层间效应的方向一致时,检验效果较 好。
• 双侧检验时: • 1)单侧概率加倍 • 2)加上对侧<当前四格表的概率的所有概 率。 • 这两种方法的结果有时可能会有所不同, 教科书建议以第二种方法为准
第四节 配对计数资料的2检验
• 一、两种处理方法的比较,P169
乙培养基 生长 不生长 合计 甲培养基 生长 3 6 (a ) 0 (c ) 36 不生长 3 4 (b ) 1 3 5 (d ) 169 70 135 205 合计
• R×C表2检验注意事项 – 若表格有一个方向按多个等级分类, 则称为单向有序行列表,当等级数大 于3时,一般用秩和检验分析更为合适。
似然比卡方统计量
• Likelihood ratio chi-square • 自由度的确定及临界值与Pearson卡方一致
L 2 Ai ln(
的格子数不超过总格子数1/5。
• 条件不足时的三种处理方法: – 1)增大样本例数使理论数变大 – 2)删除理论数太小的行或列 – 3)将理论数太小的行或列与性质相近的 邻行或邻列合并,使重新计算的理论 数增大。但是此处理可能损失信息, 也会损害样本的随机性,不同的合并 方式所得的结果也不一样,因而在不 得已时慎用