第八章 分类变量的资料的比较卡方检验
第8章 群体间的差异比较——卡方检验

-20
4000.5 32 2 8 χ2=85 P<0.001
卡方检验是以卡方分布为基础的一种常用假设检验方法,主要 用于分类变量,根据样本数据推断总体的分布与期望分布是否 有显著差异,或推断两个分类变量是否相互关联或相互独立。
卡方检验的原假设H0是:观测频数与期望频数没有差别。
卡方检验的一般原则:
只要有数量型的变量出现,就应该采用可以提示其数量性质 的统计工具(如 t 检验、方差分析、秩和检验等)来分析。
卡方检验更适用于定类变量。
统计指标的选择:
当样本量n≥40,且所有单元格的期望频数fe ≥5时,用普通的 Pearson卡方检验;
当样本量n≥40,且只有20%以下的单元格的期望频数1≤ fe < 5时,用校正的卡方检验:如对数似然比(Likelihood Ratio) 计算的卡方,或用于2×2格表的连续性校正的卡方 (Continuity Correction);
当样本量n <40,或有20%以上的单元格期望频数fe <5 ,或 有单元格期望频数fe < 1时,采用确切概率法(Fisher’s Exact Test).
1、数据36选7.sav是体彩36选7连续45期中奖号码出现 频次的统计,试分析中奖号码的出现概率是否随机。
2、在周六晚节目单修订后,分别作了收视率的调查。在 节目修改前,收视率记录为ABC 29%,CBS 28%,NBC 25%,ITV 18%。节目修改后,300个家庭所组成的样本 产生下列电视收视数据:ABC 95户,CBS 70户, NBC 89户,ITV46户,在5%的显著性水平下,检验电视收视 率是否发生了变化。
60岁以上 130 51 46 115
例:在电视收视率调查中,得到性别与收视习惯的列联表如 下。试建立数据文件并分析性别与收视习惯的相关联系。
分类变量的卡方检验方法及其适用条件

分类变量的卡方检验方法及其适用条件分类变量的卡方检验是一种常用的统计方法,主要用于比较两个或多个分类变量之间是否存在关联或独立性。
其基本原理是通过比较观察到的频数与期望频数之间的差异,来判断变量之间的关联性。
适用条件:1. 样本量要求较大,一般每个类别的期望频数都应大于5。
2. 适用于离散型变量,且变量分类数不宜过多。
3. 适用于没有先验概率的假设情况。
4. 分类变量之间应相互独立,即没有混杂因素存在。
5. 适用于二分类或多分类的情况,但多分类时需要考虑分类之间的平衡性。
具体操作步骤如下:1. 提出原假设:H₀:总体X的分布函数为F(x)。
如果总体分布为离散型,则假设具体为 H₀:总体X的分布律为P{X=x}=p。
2. 将总体X的取值范围分成k个互不相交的小区间A1,A2,A3,…,Ak,如可取 A1=(a0,a1],A2=(a1,a2],...,Ak=(ak-1,ak),其中a0可取-∞,ak可取+∞,区间的划分视具体情况而定,但要使每个小区间所含的样本值个数不小于5,而区间个数k不要太大也不要太小。
3. 把落入第i个小区间的Ai的样本值的个数记作fi,成为组频数(真实值),所有组频数之和f1+f2+...+fk等于样本容量n。
4. 当H0为真时,根据所假设的总体理论分布,可算出总体X的值落入第i 个小区间Ai的概率pi,于是,npi就是落入第i个小区间Ai的样本值的理论频数(理论值)。
5. 计算卡方统计量:卡方统计量是根据观察频数与期望频数的差异来计算的,具体计算方法是将每个小区间的观察频数与期望频数的差值的平方除以期望频数,然后求和。
6. 判断显著性:根据卡方统计量的大小和自由度,可以判断变量之间的关联性是否显著。
通常情况下,如果卡方统计量大于临界值(如、等),则可以认为变量之间的关联性是显著的。
以上内容仅供参考,建议查阅统计学相关书籍或咨询统计学专业人士获取更多专业解答。
多组分类变量的卡方检验

多组分类变量的卡方检验一、简介卡方检验是一种常用的统计方法,用于检验两个分类变量是否独立,或者比较两个分类变量的分布是否相同。
它基于观察频数和期望频数的差异来评估变量之间的关系强度。
在本篇文章中,我们将详细介绍多组分类变量的卡方检验的应用,包括以下几个方面:二、检验两个分类变量是否独立卡方检验可以用来检验两个分类变量是否独立。
具体而言,我们可以使用卡方检验来比较观察到的频数与期望的频数是否一致,从而判断两个分类变量是否相互独立。
如果观察频数与期望频数差异较大,则说明两个分类变量不独立,它们之间存在某种关联或依赖关系。
三、比较两个分类变量的分布是否相同通过卡方检验,我们可以比较两个分类变量的分布是否相同。
首先,我们需要将数据分为两组,然后使用卡方检验来比较这两组数据的分布是否一致。
这种方法可以用于比较不同组别之间的差异性,例如比较不同性别、年龄段或地区的人群在某项调查中的分布情况。
四、检验一个分类变量是否与一个有序分类变量相关卡方检验也可以用来检验一个分类变量是否与一个有序分类变量相关。
例如,我们可以使用卡方检验来分析不同教育程度的人群在某项调查中的分布情况,以判断教育程度是否与调查结果相关。
如果两个分类变量之间存在相关性,那么它们的分布可能会表现出一定的趋势或模式。
五、检验一个分类变量的不同水平是否有不同的异常率通过卡方检验,我们可以比较一个分类变量的不同水平是否有不同的异常率。
例如,在医学研究中,我们可以通过卡方检验来分析不同疾病类型的异常率是否有显著差异。
这种方法可以帮助我们了解不同疾病类型的发病机制和临床特征,为后续的研究和治疗提供依据。
六、比较多个分类变量是否相同或不同最后,卡方检验还可以用来比较多个分类变量是否相同或不同。
例如,在市场调研中,我们可以通过卡方检验来比较不同品牌、不同价格区间的产品在消费者中的接受度是否有显著差异。
这种方法可以帮助企业了解市场需求和竞争态势,为产品定位和市场策略提供决策依据。
分类变量资料的统计分析 详细讲解

分类变量资料的统计分析详细讲解资料的统计分析通常包括描述统计和推断统计两个方面。
描述统计主要是对变量的单个特征进行分析,常用的统计指标包括频数、比例、均值、中位数、众数、标准差等;推断统计则是在样本数据的基础上推断总体数据的特征,常用的方法包括假设检验、方差分析、回归分析等。
本文将以分类变量为例,详细介绍分类变量资料的统计分析方法和步骤。
首先,分类变量是一种相互独立、不可顺序比较的变量,常见的示例包括性别、职业、学历等。
对于分类变量资料的统计分析,首先需要进行数据的整理和描述。
数据整理包括去除缺失值、异常值和重复值等处理。
应根据实际情况选择合适的处理方法,常用的方法有均值填充、删除等。
同时,需要将数据进行编码或离散化处理,便于后续的分析。
数据描述主要包括频数及比例的统计,可以用来描述分类变量的分布情况。
通过计算每个类别的频数和比例,可以获得分类变量的基本特征。
同时,可以使用图表来展示分类变量的分布情况,如饼图、柱状图等。
接下来,可以对分类变量与其他变量之间的关系进行分析。
常用的方法有卡方检验和列联表分析。
卡方检验适用于两个分类变量之间的关系检验,可以用来判断两个分类变量是否相关;列联表分析则可以用来描述两个分类变量之间的关系程度。
通过分析发现两个或多个分类变量之间的关联关系,可以更好地理解数据。
此外,对于分类变量的统计分析还可以进行组内和组间的比较。
组内比较主要是对同一分类变量的不同类别进行比较,常用的方法有t检验和方差分析;组间比较则是对不同分类变量之间的差异进行比较,可以使用相关分析和回归分析等方法。
最后,需要进行结果的解释和报告。
对分类变量资料的统计分析得出的结果进行解读,并进行相关性讨论。
通过各种统计方法对变量进行分析,报告结果可以提供决策者一个更全面的了解。
总结起来,分类变量资料的统计分析主要包括数据整理和描述、关联分析、比较分析和结果解释等步骤。
通过这些步骤可以更好地分析分类变量的特征、关系和差异,为实际问题的解决提供有力的支持和参考。
9第八章 卡方检验

也称卡方检验。 检验也称卡方检验 χ2 检验 也称卡方检验 。 是英国统计 学家Pearson于 1900年提出的一种应 于 学家 年提出的一种应 用范围很广的假设检验方法, 用范围很广的假设检验方法,可用于 检验两个率间的差异; 检验两个率间的差异 ; 检验多个率 (或构成比 间的差异;判断两种属性 或构成比)间的差异 或构成比 间的差异; 或现象间是否存在关联性; 或现象间是否存在关联性;了解实际 分布与某种理论分布是否吻合; 分布与某种理论分布是否吻合;判断 两个数列间是否存在差异等。 两个数列间是否存在差异等。
计算公式
(a + b)!(c + d )!(a + c)!(b + d )! P= a!b!c!d!n!
式中a、b、c、d 和n的意义同前 , !为阶乘符号。0!= 1, 为阶乘符号。 1!= 1 ,3!= 3×2×1 = 6。
(三)求P值的步骤
• 1 . 列四格表 。 使四格表周边合计数 列四格表。 不变, 不变 , 依次增减四格表中任一格子 的数据,列出所有可能的四格表。 的数据,列出所有可能的四格表。 • 列四表格的数量 = 最小合计数 + 1 。 列四表格的数量= 最小合计数+ • 如例 8 -3 , 增减 a 格的数据 ,得 9 个 如例8 格的数据, 四格表。 四格表。
χ2分布的特点
• ⑴ χ2 分布的形状依赖于 ν 的大小 : 当 ν≤2 时 , 曲线呈 L 型 ; 随着 ν 的增加 , 曲线呈L 的增加, 曲线逐渐趋于对称; →∞时 曲线逐渐趋于对称 ; 当 ν→∞ 时 , 分布 趋近于正态分布。 趋近于正态分布。 • ⑵χ2分布具有可加性:如果两个独立的 分布具有可加性: 随机变量X1和X2分别服从ν1和ν2的χ2分 那么它们的和( 也服从( 布,那么它们的和(X1+X2)也服从(ν1+ ν2)的χ2分布。 分布。
分类变量资料的统计分析

分类变量资料的统计分析分类变量是一种在研究或分析中常见的类型数据,它描述了被观察个体或对象之间的不同特征,可以将其分为不同的类别或组。
在统计学中,对分类变量的分析可以帮助我们了解不同类别的分布情况、比较不同类别之间的差异、探索不同类别与其他变量之间的关系等。
本文将介绍分类变量资料统计分析的一些常用方法。
首先,我们可以通过计算频数和频率来描述分类变量的分布情况。
频数是指每个类别中观察到的个体或对象的数量,频率则是频数除以总数后的比例。
通过绘制条形图或饼图,可以直观地展示分类变量不同类别的频数或频率分布,帮助我们了解变量的整体情况。
其次,我们可以对不同类别之间的差异进行比较。
其中一种常用的方法是卡方检验,它用于检验两个或多个分类变量之间是否存在显著性差异。
卡方检验的原理是通过比较观察到的频数与期望频数之间的差异来判断差异是否显著。
比如,我们可以用卡方检验来确定两个不同群体之间的分布是否存在显著差异。
此外,分类变量的统计分析还可以探索其与其他变量之间的关系。
当我们有一个分类变量和一个或多个连续变量时,可以使用方差分析(ANOVA)来检验分类变量对连续变量的影响是否显著。
方差分析通过比较不同类别下的连续变量的均值来判断差异是否显著。
另外,我们还可以使用列联表分析来研究两个或多个分类变量之间的关联关系,例如,我们可以通过计算卡方值来确定两个分类变量之间的关联程度。
此外,还有一些其他常用的分类变量分析方法。
比如,在研究中,我们经常遇到多个分类变量之间的关联关系,可以使用多项Logistic回归模型来分析这些多分类变量之间的依赖关系。
另外,如果我们想预测或分类新的个体或对象所属的类别,可以使用分类树或逻辑回归等方法进行建模和预测。
综上所述,分类变量的统计分析是一种有价值的工具,可以帮助我们理解和揭示数据背后的模式和关联关系。
通过对分类变量的分布和差异进行描述分析,我们可以更好地理解数据,并从中提取有用的信息。
卡方检验分类变量事物相互独立临界值_解释说明

卡方检验分类变量事物相互独立临界值解释说明1. 引言1.1 概述本篇论文探讨了卡方检验在分类变量相互独立性判断中的应用,并重点关注了临界值的计算方法及其意义。
卡方检验是一种常用的统计方法,可用于确定两个分类变量之间是否存在相关性。
分类变量是指通过将样本分为不同类别或组别来描述数据的变量。
事物相互独立性是指两个分类变量之间没有任何关联或联系。
1.2 文章结构本文分为五个主要部分:引言、卡方检验与分类变量、事物相互独立的概念和判断方法、卡方检验的临界值计算方法与意义解释、结论。
在引言部分中,我们将简要介绍文章的背景和目标,以及各个章节的内容和结构。
1.3 目的本文旨在解释说明卡方检验在分类变量相互独立性判断中的作用,并深入讨论临界值计算方法与其意义。
通过对相关理论和实际案例进行分析,我们将提供一个具有实践价值和学术参考价值的综合指南,帮助读者更好地理解和应用卡方检验在统计分析中的作用。
同时,我们还将评估卡方检验在分类变量相互独立性判断中的应用价值,并展望未来可能的发展方向。
2. 卡方检验与分类变量2.1 卡方检验概述卡方检验是一种统计方法,用于确定两个或多个分类变量之间的相关性。
它基于观察到的频数与期望频数之间的差异来判断分类变量之间是否存在显著关系。
在实际应用中,卡方检验通常用于验证研究假设和分析数据。
2.2 分类变量的定义和特点分类变量指的是可被分配到有限数目类别中的自变量。
例如,性别、民族和教育程度等都是分类变量。
分类变量具有离散性,它们按照不同类别进行排序,并且各个类别之间没有固定顺序。
2.3 卡方检验在分类变量中的应用卡方检验可用于衡量两个或多个分类变量之间的相关性或独立性。
在进行卡方检验时,我们首先建立一个原假设(H0),即假设两个或多个分类变量是相互独立的。
然后,通过计算观察到的频数与期望频数之间的差异来评估原假设。
如果观察到的频数与期望频数之间没有显著差异,则说明两个或多个分类变量之间是相互独立的。
卡方检验的原理和使用

卡方检验的原理和使用卡方检验(Chi-Square Test)是一种常用的统计方法,用于检验两个或多个分类变量之间是否存在相关性。
它的原理基于统计学中的卡方分布,通过比较实际观测值与期望理论值之间的差异来判断变量之间的关联性。
在实际应用中,卡方检验被广泛用于医学、社会科学、市场调研等领域,帮助研究人员验证假设、分析数据,从而做出科学的决策。
一、卡方检验的原理卡方检验的原理基于卡方分布,其核心思想是通过比较实际观测值与期望理论值之间的差异来判断变量之间是否存在相关性。
在进行卡方检验时,首先需要建立零假设(H0)和备择假设(H1)。
零假设通常是假定两个变量之间不存在相关性,备择假设则是假定两个变量之间存在相关性。
卡方检验的步骤如下:1. 收集数据并建立列联表:将研究对象按照不同的分类变量进行分组,并统计各组的频数,建立列联表。
2. 计算期望频数:根据总体频数和各组的比例计算期望频数,即在零假设成立的情况下,每个组的理论频数。
3. 计算卡方值:通过比较实际观测频数与期望频数的差异,计算得到卡方值。
4. 确定显著性水平:根据卡方分布表确定显著性水平,一般取0.05。
5. 比较卡方值与临界值:如果计算得到的卡方值大于临界值,则拒绝零假设,认为两个变量之间存在相关性;反之,则接受零假设。
二、卡方检验的使用卡方检验在实际应用中具有广泛的用途,主要包括以下几个方面: 1. 分类变量相关性检验:用于检验两个或多个分类变量之间是否存在相关性,例如性别与偏好、教育程度与收入水平等。
2. 拟合优度检验:用于检验观测频数与期望频数之间的拟合程度,例如检验实际抽样数据是否符合某种理论分布。
3. 独立性检验:用于检验两个分类变量之间是否独立,例如检验药物治疗对疾病痊愈的影响是否独立于患者的年龄。
4. 方差分析:在多组分类变量比较中,可以使用卡方检验进行方差分析,判断不同组别之间的差异是否显著。
在使用卡方检验时,需要注意以下几点:1. 样本量要足够大:样本量过小会影响检验结果的可靠性,一般要求每个单元格的期望频数不低于5。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
χ2 检验的基本思想
为了更好地反映在不同抽样情况下AT 差值的分布规律,KarlPearson引入χ2 统计量,以此来反映A-T 差值的分布规 律,见式(8.2)。χ2 分布概率密度函数所 对应的图形具有以下特征:①与u、t、 F 分布一样,χ2 分布是一个连续型的分 布,只有一个参数v 决定它的形状;
)。
多组构成比的比较
多组构成比的比较
多组构成比的比较SPSS实现
同两独立样本率的卡方检验。
数据见08-08.sav
定性资料的关联性检验
四格表资料的相关分析
四格表资料的相关分析
四格表资料的相关分析
四格表资料的相关分析SPSS实现
SPSS数据输入格式:生长、不生长、结 果(1代表生长,2代表不生长)。
2. 对于单向有序两组或多组构成比资料的 比较 一般采用CMH 方法计算行平均分 检验统计量进行分析,也可以进行秩和检验 、Ridit分析等。
注意事项
3. 分类变量资料的关联性检验 比较特殊 ,应根据不同的设计和资料特点选择相应 的统计量。
第八章 分类变量资料的比较 -卡方检验
学习目标
1. 能够阐述卡方检验的原理和应用范围。 2. 掌握四格表资料两独立样本率比较的方法。 3. 掌握配对设计资料样本率比较及关联性检验的
方法。 4. 掌握不同应用条件下R×C 表的卡方检验方法
。
学习内容
第一节 第二节 第三节 第四节 第五节
单向有序两组构成比的比较
单向有序两组构成比的比较
单向有序两组构成比的比较
单向有序两组构成比的比较SPSS实现
不能进行卡方检验。 可以作CMH(SAS软件可实现,SPSS无此功
能)。 也可以作秩和检验( SPSS软件、 SAS软件)
。 也可以作Ridit分析( SAS软件可实现或Excel
第四节 R×C表的卡方检验
四、定性资料的关联性检验 (一) 四格表资料的相关分析 (二) R ×C 列联表资料的关联性分析 1. 双向无序列联表 2. 双向有序且属性不同的列联表 3. 双向有序且属性相同的列联表
R×C表的有关概念
多个样本率的比较
多个样本率的比较
多个样本率的比较SPSS实现
⑵分布具有可加性:如果两个独立的随机变 量X1和X2分别服从ν1和ν2的分布,那么它 们的和(X1+X2)也服从(ν1+ν2)的分布。
χ2检验的基本步骤
χ2检验的基本步骤
χ2检验的基本步骤
χ2检验的基本步骤
四格表资料的专用公式
四格表资料校正χ2
四格表资料校正χ2
四格表资料校正χ2
SPSS软件实现
SPSS软件实现
SPSS软件实现
SPSS软件实现
SPSS软件实现
第二节 两相关样本率的卡方检验
一、假设检验步骤
一、假设检验步骤
SPSS软件实现
可以通过以下菜单方式操作实现 1 描述统计 交叉表
2 非参数统计 相关样本
或非参数统计 旧对话框 样本
2个相关
SPSS软件实现
同两独立样本率的卡方检验。 列联系数(Phi coefficient)可在 Statistics相应的选项中进行选择。
四格表资料的相关分析SPSS实现
四格表资料的相关分析SPSS实现
R ×C 列联表资料的关联性分析 双向无序列联表
双向无序列联表
双向无序列联表SPSS实现
同两独立样本率的卡方检验。
此功能)。 数据见08-11.sav。
双向有序且属性相同的列联表
双向有序且属性相同的列联表
双向有序且属性相同的列联表SPSS实现
双向有序且属性相同的列联表SPSS实现
注意事项
1. 对于行×列表多个样本率/构成比比较的 χ2 检验 不能有1/5以上的格子理论数小于 5,或者不能有一个格子的理论数小于1,否则 易出现偏性。如出现上述情况,可通过软件 计算确切概率。
假设检验步骤
如果π1<π2,将Pr 下方所有概率小于等于Pr 的四格表的概率相加;如果π1>π2,将Pr 上方 所有概率小于等于Pr 的四格表的概率相加 。根 据研究目的,本研究应采用双侧检验,
故P=P1+P2+P7+P8+P9=0.0805>0.05。即
获得当前样本和比它更极端样本的概率是 0.0805。按α=0.05水准,不拒绝H0,两组样本 率的差异无统计学意义,尚不能认为某中药 制剂对HIV 垂直传播的预防能力高于对照组
同两独立样本率的卡方检验。
多个样本率之间的两两比较可采取卡方 分割的方法进行检验。具体方法请参照 有关书籍。
二、两组构成比的比较
(一) 双向无序两组构成比的比较
(一) 双向无序两组构成比的比较
双向无序两组构成比的比较SPSS实现
同两独立样本率的卡方检验。
数据见08-06.sav
越小,χ2
值越大,反之亦然。
2
,
=3.84是
指在H0 成立的条件下,当v=1时,得到的
χ2 值等于3.84及大于3.84的概率为0.05,
相对而言,在此条件下理论上95%的抽样样
本其χ2 值都会落在0~3.84这个区域
χ2分布的面积
据小概率的定义,说明在H0 成立的条件下,χ2 值落在大于3.84及更极端的区域是不大可能 发生的事件。如果实际样本所计算的χ2 值大 于3.84,按α=0.05水平拒绝H0 假设,接受H1。 反之,如果χ2 值小于3.84,不拒绝H0 假设。
SPSS软件实现
同两独立样本率的卡方检验的SPSS实现
直接读取精确概率行的双侧P值
第四节 R×C表的卡方检验
一、多个样本率的比较 二、两组构成比的比较 (一) 双向无序两组构成比的比较 (二) 单向有序两组构成比的比较 三、多组构成比的比较 四、定性资料的关联性检验
SPSS软件实现
SPSS软件实现
SPSS软件实现(非参数法)
SPSS软件实现(非参数法)
SPSS软件实现(非参数法)
第三节 Fisher确切概率检验Leabharlann 例8.4假设检验步骤
假设检验步骤
假设检验步骤
P 值是观察到的情况以及更极端情况的 概率。对于双侧检验,如将现有样本概率 记为Pr,则所有概率小于等于Pr 的四格表 的概率和,即为确切概率法的结果。如果 是单侧检验,则将相应方向上所有概率小 于等于Pr 的四格表的概率相加即可。
数据见08-10.sav
列联系数(Phi coefficient)可在 Statistics相应的选项中进行选择。
双向有序且属性不同的列联表
双向有序且属性不同的列联表SPSS实现
可运用Spearman秩相关(分析 相关 双变量 Spearman ) 可以作CMH(SAS软件可实现,SPSS无
两独立样本率的卡方检验 两相关样本率的卡方检验 Fisher确切概率检验 R×C表的卡方检验 案例讨论(自学)
第一节 两独立样本率的卡方检验
χ2 检验的基本思想
χ2 检验的基本思想是:在H0 成立的条件下,两 独立样本的总体率π1、π2 可以看作来自总体 参数为π 的同一总体。在此条件下,经从同一 总体随机抽样所得的两个样本率在一般情况 下应相差不大,两独立样本所对应的四格表实 际数和理论数(A-T)在一般的情况下相差也不 大。χ2值反映了理论频数和实际频数的吻合 程度。
从本例来看, χ2 =8.812,该卡方值比较大,也从 侧面反映了实际频数与理论频数的不吻合。 其真正原因很有可能是两样本率来自两个不 同的总体,即H0 假设实际上是不成立的。
χ2分布的图形
χ2分布的特点
⑴分布的形状依赖于ν的大小:当ν≤2时, 曲线呈L型;随着ν的增加,曲线逐渐趋于 对称;当ν→∞时,分布趋近于正态分布。
轴上相应的χ2值就记作
2
,, 即χ2界值。
其右侧部分的面积α表示ν时,值大于界值的概率大小。 χ2 值与P值的对应关系见附表6, χ2值愈大,P值愈小;反之 ,χ2值愈小,P值愈大。 χ2检验时,先计算检验统计量χ2值 ,然后按ν查界值表(附表7),确定P值。
χ2分布的面积
从图8.1可知,当v 固定时,尾部面积
χ2 检验的基本思想
②v 越大,曲线趋于对称,v→∞,χ2 分布趋向正
态分布;
③卡方图形的面积分布有规律性,记为
2
,
,表示自由度为v,χ2 分布曲线下右侧尾部面积
为α 时χ2的界值;
χ2分布的面积
χ2分布的曲线在第一象限内,其形状与ν的大小有关。
当ν确定后,如果分布曲线下右侧尾部的面积为α时,则横