第十一章卡方检验
第十一章 卡方检验
第一节 独立样本列联表的χ2检验
四格表资料: 1.完全随机设计的两样本率比较的χ2检验
2. 2 × 2列联表资料的χ2检验
3.R × C列联表资料的χ2检验
一、 χ2检验的基本思想
例11.1 某研究者欲比较甲、乙两药治疗小儿上消化 道出血的效果,将90名患儿随机分为两组,一组采 用甲药治疗,另一组采用乙药治疗,一个疗程后观 察结果,见下表。问两药治疗小儿上消化道出血的 有效率是否有差别?
Likelihood Ratio
10.338
1
.001
Fisher's Exact Test
.003
.002
Linear-by-Linear Association
9.761
1
.002
N of Valid Cases
90
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 11. 50.
理论频数(theoretical frequency)
理论频数的计算方法: 在H0成立的情况下,即甲药治疗小儿上消化道出
血的有效率与乙药治疗小儿消化道出血的有效 率相同。 则理论上两种人群有相同的有效率74.44%,这时 计算出其相应的各个格子的理论频数。
(a) T11
(b) T12
(c) T21
(d) T22
其基本公式:
∑ χ2 = (A - T)2
T
2
0.5
0.4
0.3
纵高
理 解χ2值
0.2 0.1
统计学卡方检验
根据分析结果,为患者提供个体化的干预措施,提高生存质量。
06
卡方检验注意事项及局限 性讨论
样本量要求及抽样方法选择
样本量要求
卡方检验对样本量有一定的要求,通常建议每个单元格的期望频数不小于5,以确保检验结果的稳定性和可靠性 。当样本量不足时,可能会导致检验效能降低,增加第二类错误的概率。
抽样方法选择
在进行卡方检验时,应选择合适的抽样方法。简单随机抽样是最常用的方法,但在某些情况下,如分层抽样或整 群抽样可能更适合。选择合适的抽样方法有助于提高检验的准确性和可靠性。
期望频数过低时处理策略
合并类别
当某个单元格的期望频数过低时,可以考虑 合并相邻的类别,以增加期望频数。合并类 别时应注意保持类别的逻辑性和实际意义。
适用范围及条件
适用范围
卡方检验适用于多个分类变量之间的独立性或相关性检验,如医学、社会科学等领域的调查研究。
条件
使用卡方检验需要满足一些前提条件,如样本量足够大、每个单元格的期望频数不宜过小等。此外, 对于有序分类变量或存在空单元格的情况,需要采用相应的处理方法或选择其他适合的统计方法。
02
卡方检验方法
统计学卡方检验
目录
• 卡方检验基本概念 • 卡方检验方法 • 数据准备与预处理 • 卡方检验实施步骤 • 卡方检验在医学领域应用举例 • 卡方检验注意事项及局限性讨论
01
卡方检验基本概念
定义与原理
01
02
定义
原理
卡方检验是一种基于卡方分布的假设检验方法,用于推断两个或多个 分类变量之间是否独立或相关。
确定分组界限
在确定分组界限时,可以采用等距分组、等频分组或 基于数据分布的分组方法。选择合适的分组界限有助 于保持各组之间的均衡性,减少信息损失。
第十一章 统计分析和调查报告
• 2、定序变量 • 3、定距或定比变量
第十三章 撰写研究报告
• 研究研究报告及其类型 • 研究报告是反映社会调查成果的一种书面 报告,它以文字、图表等形式将调查研究 的过程、方法和结果表现出来。其目的是 告诉有关读者,对于所研究的问题是如何 进行调查的,取得了哪些结果,这些结果 对于认识和解决这一问题有哪些理论意义 和实际意义等等
其它故事与发表情况
• 另外两种形式的故事叫做批判的故事(吸 引读者对社会问题的注意和重视)和形式 的故事(理论的表述)。 • 民族志写作惯例发生了变化。今天,被发 表的现实主义的故事越来越少,而印象主 义或坦白的故事则相对越来越多。 • 没有完美的理论,也没有完美的报告。
• 导言部分 • 普通调查报告的第一部分称作导言,它的主要任务是向读者简要地介绍 整个调查的有关背景。其中,最主要的内容包括调查的目的、调查的内 容、调查的对象、调查的时间、地点、调查的方法等等。导言的具体写 法有下列几种常见的方式。 • (1)直述式 • 即开门见山,平铺直述,直接把调查的目的,内容,对象,范围等一一写出.例 如: • 为了全面了解老年人的生活状况,加强老年人的社会保障工作,沈阳 师范大学社会学系于2003年2月至4月,在辽宁省沈阳市调查了300位老 年人的家庭与生活情况。下面是这次调查的方法及主要结果。 • (2)悬念式。 • 即先描述某种社会现象和社会问题,然后对这种社会现象和问题产生的 原因、它的影响等等提出一系列疑问,最后介绍调查的基本情况.例如: • 老年人丧偶是生活中十分普遍的现象,而老年人再婚,则是近年来出 现在我国社会中的一种新的社会现象。据有关部门统计,本市1980年再 婚老年夫妇为68对,1984年为116对,1988年为302对;1991年为: 495对;1994年为623对。促使老年人再婚比例提高的原因是什么?;社 会舆论对老年人再婚的评价如何?老年人再婚给他们的家庭及其生活带 来了哪些变化?;为了弄清这些问题,沈阳师范大学社会学系于今年3—5月,对沈阳市180对再婚老年夫妇进行了调查。
卡方检验算法范文
卡方检验算法范文卡方检验是一种用于确定两个类别变量之间是否存在显著关联的统计方法。
它基于观察值与期望值之间的差异来判断关联性。
在卡方检验中,我们将观察到的频数与预期的频数进行比较,以确定它们是否有显著的差异。
卡方检验的基本原理是假设零假设,即两个变量之间没有关联。
然后根据观察情况得到的频率表,计算出预期频率表。
最后,使用其中一种统计量来比较观察频率和预期频率。
卡方检验的步骤如下:1.构建频数表:根据研究问题,将两个类别变量的数据构建成一个二维频数表。
其中,行可以表示一个类别变量的不同取值,列可以表示另一个类别变量的不同取值。
然后将观察到的频数填入表格中。
例子:类别变量B类别变量AA1A2A3A4B1n11n12n13n14B2n21n22n23n24B3n31n32n33n342.计算预期频数:根据零假设,我们可以通过行和列的边际频数计算出期望频数。
每个单元的期望频数可以使用以下公式计算:期望频数=(行的边际频数*列的边际频数)/总频数例子:类别变量B类别变量AA1A2A3A4B1e11e12e13e14B2e21e22e23e24B3e31e32e33e34其中,eij表示第i行,第j列的预期频数。
3.计算卡方统计量:通过使用观察频数和预期频数,可以计算出卡方统计量,用于比较差异的程度。
卡方统计量的计算公式如下:χ²=Σ[(观察频数-预期频数)²/预期频数]其中,Σ表示对所有单元进行求和。
4.自由度和临界值:计算自由度和基于显著水平的临界值。
自由度的计算公式为:自由度=(行数-1)*(列数-1)临界值可以从卡方分布表中获取,根据给定的显著水平和自由度。
5.判断显著性:根据卡方统计量和临界值的比较,判断是否存在显著性差异。
如果卡方统计量大于临界值,则拒绝零假设,认为两个变量之间存在显著关联。
卡方检验的应用广泛,特别适用于两个分类变量之间的关联性分析。
它可以用于许多领域的研究和实践,例如医学、社会科学、市场研究等。
医学统计学(6) 卡方检验
•进一步的两两比较
•P<0.017才有 统计学意义!!
【例6】某中医院用三种治疗方法治疗413例糖尿病患者, 资料见表。为避免中医不同证型对疗效比较的影响,分 析3种疗法治疗的病人按3种中医分型的构成比有无差别?
SPSS软件操作
• 第1步:定义变量
• 第2步:输入 原始数据
• 第3步:定义频数 • 选择数据→加权个案 • 频数→加权个案(频 数变量)
CMH多维卡 方检验
• 第4步:x2检验(2) • 选择统计 量按钮 • 在交叉表: 统计量对 话框:勾 上卡方
• 第4步:x2检验(3) • 选择单元 格按钮 • 在交叉表: 单元显示 对话框: 勾上观察 值、百分 比:行、 列
• 第5步:结果解读(1)
• 结果解读:中西医组的治愈率为98.2%,西 医组的治愈率为74.0%。
【例4】某医师为研究乙肝免疫球蛋白预防胎儿宫内感 染HBV的效果,将33例HBsAg阳性孕妇随机分为预防 注射组和非预防组,结果见表。问两组新生儿的HBV总 体感染率有无差别?
• 第1步:定义变量
SPSS软件操作
• 第2步:输入 原始数据
• 第3步:定义频数 • 选择数据→加权个案 • 频数→加权个案(频 数变量)
医学统计学 (6 )
《中华医学杂志》对来稿统计学处理的有关要求
卡方检验(chi-square test)
• χ2检验是现代统计学的创始人之一,英国人 Karl . Pearson于1900年提出的一种具有广 泛用途的统计方法。 • 可用于两个或多个率间的比较,计数资料 的关联度分析,拟合优度检验等等。
关联性分析
列联系数的意义 • |rp|<0.4,关联程度低 • 0.4≤|rp|<0.7,关联程度中等 • |rp|≥0.7,关联程度高
第11章卡方检验(0429修改)
第十一章2χ检验2χ检验(chi-square test)是英国统计学家K. Pearson于1900年提出的,以2χ分布(chi-square distribution)和拟合优度检验(goodness-of-fit test)为理论依据,是一种应用范围很广的统计方法。
本章主要介绍率或构成比比较的2χ检验,频数分布的拟合优度2χ检验,线χ检验,以及四格表的Fisher确切概率法。
性趋势2第一节2χ检验的基本思想2χ检验是在2χ分布的基础上,利用样本信息考察样本频数分布与假设成立条件下的理论频数分布之间差异的假设检验方法。
下面以例11.1为例,说明2χ检验的基本思想。
例11.1 某研究者欲比较血塞通注射液和银杏达莫注射液治疗急性脑梗死的效果,将240例急性脑梗死患者随机分为两组,一组给予血塞通注射液治疗,另一组给予银杏达莫注射液治疗,一个疗程后观察结果,见表11.1。
问两种针剂治疗急性脑梗死的有效率是否有差别?表11.1 血塞通和银杏达莫治疗急性脑梗死的疗效血塞通114 6 120 95.00银杏达莫104 16 120 86.67合计218 22 240 90.83表11.1中,114、6、104、16这4个数据是分组变量药物(一般作为行变量)与效应指标疗效(一般作为列变量)交叉分组后,基于样本观察到的发生频数,称为实际频数(actual frequency),用符号A表示。
行合计、列合计、总合计及有效率是根据这4个基本数据计算而来。
该类型资料称为22⨯列联表资料,亦称四格表(fourfold table)资料。
血塞通组的有效率(95.00%)和银杏达莫组的有效率(86.67%)仅是样本观察的结果,由于存在抽样误差,需进行假设检验,才能得到关于两种针剂治疗急性脑梗死的总体有效率是否有差别的结论。
当两样本含量均比较大时,可以采用第十章介绍的两样本率比较的Z检验,还可采用本章介绍的2χ检验。
一、对总体建立假设例11.1的无效假设为012:H ππ=,即两种针剂治疗急性脑梗死的有效率相同。
统计学教程-卡方检验
Lower
Upper
3.000
.992
9.068
2.500
.987
.833
.684
100
6.334 1.016
❖ 结果显示,OR=3.00,说明吃了该食物者发生食物中
毒的可能性是没有吃该食物者的3.00倍?
分层卡方检验
例4 某研究人员对3家医院的卫生服务情况进行 了调查,现希望分析寻求就诊和性别之间有无 联系。(数据见cmh.sav)
Exact Sig. (1-sided)
Likelihood Ratio
14.550
1
.000
Fisher's Exact Test
.000
.000
Linear-by-Linear Associ ati on
13.910
1
.000
McNemar Test
.013c
N of Valid Cases
58
poison
Yes 10
No 30
6.4
33.6
6
54
9.6
50.4
16
84
16.0
84.0
Total 40
40.0 60
60.0 100 100.0
❖ 这就是两变量的四格表。
两分类变量间关联程度的度量
结果分析
Chi-Square Tests
Pearson Chi-Square Continuity Correction a
a. Computed onlyfor a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5. 16.
《卫生统计学》课后思考题答案
《卫生统计学》思考题参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标(2)确定调查对象和观察单位(3)选择调查方法和技术(4)估计样本大小(5)编制调查表(6)评价问卷的信度和效度(7)制定资料的收集计划(8)指定资料的整理与分析计划(9)制定调查的组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
第十一章_卡方检验
准,拒绝H0,接受H1,差异有统计学意义。结论相反。
例 某医师用甲 、乙两疗法治疗单纯消化不良 ,结
果如下表,问两种疗法的治愈率有无差别? 表 两种疗法对单纯消化不良的治愈率比较
① 建立假设 H0:π1=π2 H1:π1≠π2 ② 确定检验水准 α=0.05
2 ③ 计算统计量 值
2
( 26 2 - 7 36 - 71 / 2)2 71 33 38 62 9
2 三、R×C列联表资料的 检验。
当基本数据的行数或列数大于2时,统称为行列表或 RC表。
2 RC表的 检验主要用于多个样本率(或构成比)的比
较。 行列资料 检验的专用公式
2
A n( 1) nR nC
2
2
n为总例数,A为每个格子的实际频数,nR为与A同
行的行合计,nC为与A同列的列合计。
自由度=(行数-1)(列数-1)=(2-1)(2-1)=1, 2 查 界值表得P<0.01。
⑤ 下结论
因为P<0.01,按α=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。即可认为两药治疗小儿 上消化道出血的有效率有差别,其中乙药的有效 率高于甲药。
(二) 四格表的专用公式
2 (ad bc) n 2 (a b)(c d)(a c)(b d)
2.75
④ 确定P值 υ=(2-1)x(2-1)=1,查
2 界值表得P>0.05。
⑤ 下结论
因为P>0.05,按α=0.05的水准,不拒绝H0,差 异无统计学意义。尚不能认为甲、乙两疗法对小 儿单纯性消化不良的治愈率不等。
完全随机设计四格表资料χ2检验适用条件
当n≥40且Tmin ≥ 5时,χ2检验基本公式或四格表专用公式;
卡方检验的构造原理_解释说明以及概述
卡方检验的构造原理解释说明以及概述1. 引言1.1 概述卡方检验,也称为卡方拟合度检验,是一种常用的统计方法,用于判断观察数据与期望数据之间是否存在显著差异。
它是由1880年代英国统计学家皮尔逊(Karl Pearson)提出的,并成为统计学中一项重要的假设检验工具。
1.2 文章结构本文将首先介绍卡方检验的构造原理,包括该方法的背景与发展历程、假设检验基本概念以及构造原理及假设条件。
接着,文章会详细解释说明卡方检验的相关内容,包括检验统计量及其分布、P值的计算方法与判断标准,以及常见误差类型与校正方法。
然后,我们将对卡方检验在不同领域中的应用进行概述:生物医学研究、社会科学和工程技术。
最后,在结论部分总结了卡方检验的重要性和优缺点,并展望了未来在该研究领域可能出现的发展趋势。
1.3 目的本文旨在深入探讨卡方检验这一统计学方法,全面阐述其构造原理、解释说明以及应用领域概述。
希望通过本文的阐述,读者能够更好地理解和运用卡方检验,为相关领域的研究提供参考,并促进该方法在未来的发展与应用。
2. 卡方检验的构造原理2.1 背景与发展历程在统计学中,卡方检验是一种常用的假设检验方法,用于判断观察值与期望值之间的差异是否显著。
卡方检验最早由卡尔·皮尔逊(Karl Pearson)在19世纪末提出,并受到了罗纳德·费舍尔(Ronald Fisher)等人的进一步发展和推广。
2.2 假设检验基本概念在进行卡方检验时,我们需要建立一个原假设(Null Hypothesis,H0)和一个备择假设(Alternative Hypothesis,H1)。
原假设通常表示无关性、随机性或相等性的假设,而备择假设则表明存在相关性、差异或不相等性。
2.3 构造原理及假设条件卡方检验基于观察频数与期望频数之间的差异来判断数据是否遵循某种分布或相互独立。
其构造原理可以简单描述如下:步骤1:收集数据并得到数据表格。
11练习题解答:第十一章 相关分析
第十一章 相关分析练习题:1.某大型公司为了了解公司员工对于公司福利的满意程度,做了一个抽样调查,结果如下:老员工 新员工 合计 满意 90 35 125 一般 50 40 90 不满意 42 61 103 合计182136318(1)新老员工对于公司福利的满意程度是否有差异?(显著性水平为0.05) (2)如果有显著性差异,请计算Lambda 系数和tau -y 系数。
(3)请用第十章讲到的内容,计算C 系数,比较一下C 系数与Lambda 系数、tau -y 系数有多大差异。
解:(1)研究假设H 1:两者有显著差异 无假设H 0:两者没有显著差异df =(r -1)(c -1)=(3-1)⨯(2-1)=2 2()222.64o e ef f f χ-==∑显著性水平为0.05,查卡方分布表可得,当自由度为2时,0.05的显著性水平下的临界值为5.991,检验统计值22.64>5.991,落在否定域内,因此否定虚无假设,接受研究假设,即在0.05的显著性水平下,新老员工对于公司福利的满意程度有显著差异。
(2)非对称形式:Lambda 系数=90611250.135318125yyyx ymM n M λ-+-===--∑tau-y 测量法: 1()(318125)125(31890)90(318103)103318318318y yn F F E n--⨯-⨯-⨯==++∑=210.032()(18290)90(18250)50(18242)42182(13635)35(13640)40(13661)61136201.93x xF f fE F -=-⨯+-⨯+-⨯=-⨯+-⨯+-⨯+=∑121210.03201.930.04210.03E E tau y E ---==≈ (3)0.25780.26C ===≈由上面的三个系数结果可以看出,同样是计算两个变量之间的相关关系,选用不同的方法进行计算时,结果存在很大的差异。
卡方检验
假设检验方法
01 基本原理
03 检验方法 05 代码实现
目录
02 步骤 04 资料检验
卡方检验,是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用,包括两个率或两个构成比 比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
基本原理
卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程 度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡 方值就为0,表明理论值完全符合。
卡方检验要求:最好是大样本数据。一般每个个案最好出现一次,四分之一的个案至少出现五次。如果数据 不符合要求,就要应用校正卡方。
谢谢观看
注意:卡方检验针对分类变量。
步骤
(1)提出原假设: H0:总体X的分布函数为F(x). 如果总体分布为离散型,则假设具体为 H0:总体X的分布律为P{X=xi}=pi, i=1,2,... (2)将总体X的取值范围分成k个互不相交的小区间A1,A2,A3,…,Ak,如可取 A1=(a0,a1],A2=(a1,a2],...,Ak=(ak-1,ak), 其中a0可取-∞,ak可取+∞,区间的划分视具体情况而定,但要使每个小区间所含的样本值个数不小于5, 而区间个数k不要太大也不要太小。 (3)把落入第i个小区间的Ai的样本值的个数记作fi,成为组频数(真实值),所有组频数之和 f1+f2+...+fk等于样本容量n。 (4)当H0为真时,根据所假设的总体理论分布,可算出总体X的值落入第i个小区间Ai的概率pi,于是,npi 就是落入第i个小区间Ai的样本值的理论频数(理论值)。
检验方法
(医统)卡方检验
2
观测值的自由度(vi>2),Si为第i组观测值的标 准差 2 • 拒绝原假设的条件为: 2 ,
F检验
• 检验两组观测值的方差的齐性 • 原假设: 2 2
1 2
• 检验统计量:
2 2 2 S1 F 2 2 ~ F( 1 , 2 ) 1 S2
• 拒绝条件: F F /2 (1, 2 )或F F1 /2 (1, 2 )
2.拟合优度检验
• B.表征实验分布,即用卡方统计量检验实验分布 是否服从某一理论分布(正态、二项等) • 步骤:1.将总体X的取值范围分成k个互不重迭的 小区间 • 2.计算落入第i个小区间的样本值的观测频数 • 3. 根据所假设的理论分布, 算出总体X的值落入每 个小区间的概率p,于是np就是落入该区间的样本 值的理论频数 • 4.计算卡方统计量 • 5.与临界值进行比较,进行决策
χ2 检验 数据资料 总体 检验对象
离散型资料 总体分布是未知的
连续型资料假设检验
连续型资料 正态分布 对总体参数或几个总体 参数之差
不是对总体参数的检 验,而是对总体分布 的假设检验
三、χ2 检验的用途
适合性检验
是指对样本的理论数先通过一定的理
论分布推算出来,然后用实际观测值与理论
数相比较,从而得出实际观测值与理论数之
理论值(E)
696.75 232.25 929
O-E
+8.25 -8.25 0
由于差数之和正负相消,并不能反映实 际观测值与理论值相差的大小。
为了避免正、负相抵消的问题,可将实际 观测值与理论值的差数平方后再相加,也就是 计算:
∑(O-E)2
O--实际观察的频数 E--无效假设下的期望频数
第十一章 卡方检验
2
(4111 24 4) 2 80 6.565 45 35 65 15
有效 41(a) 24(c) 65 (a+c) 无效 4( b) 11(d) 15 (b+d) 合计 45 (a+b) 35 (c+d) 80 (n=a+b+c+d)
α=0.05
2 ( A T ) 2 2 ~ ( ) , 1 T
查ν=1的χ2界值表,确定P值
P≤α
拒绝H0 接受H1
作出推断结论
P>α
不拒绝H0
基本思想概括
若H0成立,则四个格子的实际频数A与理论频数T之差异纯 系抽样误差所致,故一般不会很大,卡方值也就不会很大; 在一次随机试验中,出现大的卡方值的概率P是很小的。 因此,若根据实际样本资料求得一个很小的P,且P≤α(检验 水准),根据小概率原理,就有理由怀疑H0的真实性,因而 拒绝它;若P>α,则没有理由拒绝H0
(A T) T
2
2
A—实际频数 T— 根据H0确定的理论频数
2检验基本思想
2值反映了样本实际频数与理论频数的符合程度。 如果原假设成立, 2值不会太大;反之,A若与T 差距大, 2值也大;当2值超出一定范围时,就有
理由认为原假设不成立。
第二节、独立样本2×2资料的2检验 1、四格表(2×2列联表)
2
=(2-1)(2-1)=1
3)确定P值:
P>0.1,高于检验水准,不能拒绝H0,差 别无统计学意义,尚不能认为两种治疗方案的总体缓解概率 不同。
完全随机设计两组频数分布2检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十一章卡方检验
2统计量的条件:T≥5
2
(AT)2 T
校正的2
2 (AT0.5)2
T
第十一章卡方检验
2检验的基本公式
2 (AT)2
T
❖ A—实际频数 ❖ T— 根据H0确定的理论频数
第十一章卡方检验
2检验基本思想
2值反映了样本实际频数与理论频数的符合程度。 如果原假设成立, 2值不会太大;反之,A若与T差 距大, 2值也大;当2值超出一定范围时,就有理
有效率 % 70.7 70.7
70.7
T a 8 7 0.7 % 0 5 6 .6 T b 8 0 2.3 % 9 2.4 3
T c 6 7 0.7 % 0 4.4 2 T d 6 2 0.3 % 9 1.6 7
第十一章卡方检验
四格表的理论频数由下式求得 :
nn
T RC
RC
n
式中:TRC为第R 行C 列的理论频数, nR为相应的行合计, nC为相应的列合计。
➢ 四格表资料比较的是两种处理的效果。 ➢ 每种处理只产生两种相互对立的结果,如生与死,有
效与无效,患病与未患病,阳性与阴性,检出与未检 出,等等。
第十一章卡方检验
四格表资料的一般形式
处理组 A B
合计
发生数 a c
a+c
未发生数 合计
b
a+b
d
c+d
b+d
n=a+b+c
+d
第十一章卡方检验
例11-1 某医师为比较中药和西药治疗胃炎的疗效,随机 抽取140例胃炎患者分成中药组和西药组,结果中药组 治疗80例,有效64例,西药组治疗60例,有效35例, 问中药和西药治疗胃炎的效果是否相同?
查附表
说明
2 0.01,1
6.6
3
2 0.005,1
7.88
0.00P 50.01
按P=0.05的检验水准,拒绝原假设,接受备择假设,差异有 统计学意义,可认为中西药治疗胃炎的效果不同
2(AT)2
T
式中: A 为实际频数(actual frequency) T 为理论频数(theoretical frequency)
第十一章卡方检验
要计算2统计量,必须先计算H0条件下的理论频数T :
处理
中药 西药 合计
有效
56.6 42.4 99
无效
23.4 17.6 41
合计
80 60 140
第十一章 2检验
第十一章卡方检验
2检验
❖ 完全随机设计四格表资料的χ2检验 ❖ 完全随机设计行×列表资料的χ2检验 ❖ 配对设计两组频数分布的χ2检验 ❖ 四格表的确切概率法
第十一章卡方检验
〔例11-1〕某医师为比较中药和西药治疗胃炎的疗效,随 机抽取140例胃炎患者分成中药组和西药组,结果中药组 治疗80例,有效64例,西药组治疗60例,有效35例,中、 西药治疗胃炎的效果是否有差别。 [方法与结论]
处理
有效
无效
合计 有效率%
中药 西药 合计
64
16
80
80.0
35
25
60
58.3
99
41
140
70.7
第十一章卡方检验
[检验步骤] 第一步:建立检验假设
H0:中药和西药的有效率相同,即1=2 H1:中药和西药的有效率不同,即12
第二步:确定检验水准
= 0.05
第十一章卡方检验
第三步:计算检验统计量
第十一章卡方检验
0.4
V=1
0.3
V=4
0.2
V=6
0.1
V=9
0.0 0
3
6
9
12
15
不同自由度ν下χ2分布曲线
第十一章卡方检验
2.2界值表(见教材482页附表8)
χ2α,ν——自由度为ν时2分布右侧尾部面积(概
率)为α的临界值
.5
.4
.3
.2
.1
0
0
2 ,
对于同一自由度,
2
,
越大,对应的P值越小
第十一章卡方检验
2检验(chi square test) 常用于分类变量资料的统计推断 2检验是以2分布为理论依据的
第十一章卡方检验
一、 2分布和拟合优度检验
❖ 2分布(chi square distribution )
2分布是一种连续型随机变量的概率分布 若有k个相互独立的标准正态分布随机变量
第十一章卡方检验
结合本例:
处理
有效Βιβλιοθήκη 中药64西药
35
合计
99
无效
16 25 41
合计
80 60 140
有效率 % 80.0 58.3
70.7
Ta810490956.6
Tc610490942 .4
Tb810440123.4
Td
60411 140
7.6
第十一章卡方检验
处理
中药 西药 合计
有效
无效
合计
64(56.6) 16(23.4) 80 35(42.4) 25(17.6) 60
该医师采用成组t检验进行两个总体均数有无差别的 推断,结果t=-2.848,P=0.05,因此判断差异有统计学意义, 认为中、西药治疗胃炎的效果有差别。
第十一章卡方检验
完全随机设计两样本均数比较的t检验
资料类型:计量资料 设计类型:完全随机化设计 其他条件:独立性、正态性、方差齐性
处理 中药 西药 合计
Z1,Z2,…,Zk,则其平方和(Z12+Z22+…+Zk2)的分布
称为自由度ν=k的2分布,记为: 2 (ν)
第十一章卡方检验
随机变量 X服从自由度为 的卡方分布
记作:
X ~2()
1. 2分布的图形特征:分布的形状依赖于自由度
的大小
随着 的增加曲线逐渐趋于对称,当自由度
趋于无穷时,卡方分布趋于正态分布。
由认为原假设不成立。
第十一章卡方检验
第二节、独立样本2×2资料的2检验
1、四格表(2×2列联表)
处理
中药 西药 合计
有效
64 35 99
无效
16 25 41
合计 80
有效率 %
80.0
60 58.3
140 70.7
第十一章卡方检验
四格表(fourfold table)
➢ 表中间阴影部分的四个数据为基本数据,其余数据均 由此四个数据派生出来,故称此种资料为四格表 资料。
99
41
140
有效率 % 80.0 58.3
70.7
第十一章卡方检验
2(6 4 5.6 6 )2 (1 6 2.4 3 )2 (3 5 4.4 2 )2 (2 5 1.6 7 )2
5.6 6 2.4 3 4.4 2 1.6 7 7 .711
四格表的自由度ν=1
第十一章卡方检验
第四步:确定 P 值,下结论
有效 64 35 99
无效 16 25 41
第十一章卡方检验
合计 80 60 140
有效率% 80.0 58.3 70.7
2分布
2 :卡方 2检验(chi-square test) 是现代统计学的创始人
Karl Pearson( 1857-1936 )于1900年提出的 一种具有广泛用途的统计方法 。