第六章卡方检验
《卡方检验正式》课件
卡方检验的结果可以直接解释为实际意义 ,例如,如果卡方值较大,则说明观察频 数与期望频数存在显著差异。
缺点
对数据要求高
卡方检验要求数据量较大,且各分类的期望频数不能太小,否则可能 导致结果不准确。
对离群值敏感
卡方检验对离群值比较敏感,离群值可能会对结果产生较大的影响。
无法处理缺失值
卡方检验无法处理含有缺失值的数据,如果数据中存在缺失值,需要 进行适当的处理。
案例二:市场研究中的卡方检验
总结词
市场研究中,卡方检验用于评估不同市 场细分或产品特征与消费者行为之间的 关联。
VS
详细描述
在市场研究中,卡方检验可以帮助研究者 了解消费者对不同品牌、产品或服务的偏 好。例如,通过比较不同年龄段消费者对 某品牌的选择比例,企业可以更好地制定 市场策略和产品定位。
案例三:社会调查中的卡方检验
小,表示两者之间的差异越小。通常根据卡方值的概率水平来判断差异
是否具有统计学显著性。
02
卡方检验的步骤
建立假设
假设1
观察频数与期望频数无显著差异
假设2
观察频数与期望频数有显著差异
收集数据
从样本数据中获取观察频数 确定期望频数,可以使用理论值或预期频数
制作交叉表
将收集到的数据整理成二维表格形式,行和列分别表示分类变量
卡方检验的基本思想
01
基于假设检验原理
卡方检验基于假设检验的原理,通过构建原假设和备择假设,利用观测
频数与期望频数的差异来评估原假设是否成立。
02
比较实际观测频数与期望频数
卡方检验的核心是比较实际观测频数与期望频数,通过卡方值的大小来
评估两者之间的差异程度。
03
统计学卡方检验
根据分析结果,为患者提供个体化的干预措施,提高生存质量。
06
卡方检验注意事项及局限 性讨论
样本量要求及抽样方法选择
样本量要求
卡方检验对样本量有一定的要求,通常建议每个单元格的期望频数不小于5,以确保检验结果的稳定性和可靠性 。当样本量不足时,可能会导致检验效能降低,增加第二类错误的概率。
抽样方法选择
在进行卡方检验时,应选择合适的抽样方法。简单随机抽样是最常用的方法,但在某些情况下,如分层抽样或整 群抽样可能更适合。选择合适的抽样方法有助于提高检验的准确性和可靠性。
期望频数过低时处理策略
合并类别
当某个单元格的期望频数过低时,可以考虑 合并相邻的类别,以增加期望频数。合并类 别时应注意保持类别的逻辑性和实际意义。
适用范围及条件
适用范围
卡方检验适用于多个分类变量之间的独立性或相关性检验,如医学、社会科学等领域的调查研究。
条件
使用卡方检验需要满足一些前提条件,如样本量足够大、每个单元格的期望频数不宜过小等。此外, 对于有序分类变量或存在空单元格的情况,需要采用相应的处理方法或选择其他适合的统计方法。
02
卡方检验方法
统计学卡方检验
目录
• 卡方检验基本概念 • 卡方检验方法 • 数据准备与预处理 • 卡方检验实施步骤 • 卡方检验在医学领域应用举例 • 卡方检验注意事项及局限性讨论
01
卡方检验基本概念
定义与原理
01
02
定义
原理
卡方检验是一种基于卡方分布的假设检验方法,用于推断两个或多个 分类变量之间是否独立或相关。
确定分组界限
在确定分组界限时,可以采用等距分组、等频分组或 基于数据分布的分组方法。选择合适的分组界限有助 于保持各组之间的均衡性,减少信息损失。
【实用】卡方检验(5)PPT文档
2 0.619 0.363 (0.4) 0.285 0.316 0.118 试判断该小麦的株高表现是否遵从正态分布。
在假设两种随机现象相互独立的情况下,确定各组合的概率,并计算各组合按概率进行分配时的观测值频数
x 2.381 5.637 12.4 19.72 22.68 18.88 并统计各结果观测值的频数
解:H0:x~N(μσ) HA: x 不服从正太分布 由于总体μ、σ未知,故由样本去估计(采用点估计):
样本 x 65.60,样本 S 22.50
x 65.60, S 22.50
首先算出各组的理论频率:
pi
Φ
xi1
Φ
xi
式中:xi+1、xi表示第i组的上下限(i=1,2,…,k)。 本例中:k=9 再算出各组的理论频数:E(fi)=Npi =100×pi
有7=5%1的0置0信水×平认p为i杨麦1号本的株高例遵从中正态各分布组。 的已计算出并列于表6-2中。 继而便可算出x 统计量值: 若两者相互独立,表明三种灌溉方式对叶态2表现的影响相同。
本例中的自由度df=k-1-p=12-1-2=9,查x2 值表可知,
2 2 2 2 2 2 本例中,设灌溉方式与与叶态表现无关联,则深水灌溉与绿叶同时出现的理论频率应为三种灌溉方式中深水灌溉的频率与三种叶态中
且已经算得 样本x 94.8,样本S 5.2。
试判断该小麦的株高表现是否遵从正态分布。
正态分布是连续分布,没有自然的类别,为了利用卡方检
验,可先用第2章介绍的方法将数据进行分组,然后以每组作为 一个类别,再用卡方检验进行正态分布的适合性检验。
组中值 83 86 89 92 95 98 101 104 107 组分点值 84.5 87.5 90.5 93.5 96.5 99.5 102.5 105.5 组频数 3 6 12 20 23 19 10 5 2 理论频数 2.38 5.64 12.4 19.7222.6818.8811.37 4.95 1.98 偏差量 0.62 0.36 -0.4 0.29 0.32 0.12 -1.37 0.05 0.02
卡方检验
Stata第六章卡方检验本节STATA命令摘要[by分层变量名:]tab2变量1变量2[,allchi2exactcellcolumnrow]tabi#11#12[...]\[#21#22[...][\...][,allchi2exactcellcolumnrow]•列联表分析STATA命令:[by分层变量:]tab2变量1变量2[,allchi2lichi2exactcellcolumnrow]上述命令中,变量1为行计数变量;变量2为列计数变量;all表示卡方(c2)检验,似然比(likelihoodratio)检验以及一些统计描述指标和检验,但不包括Fisher精确检验;exact表示Fisher精确检验;chi2表示c2检验;lichi2表示likelihoodratio检验;cell表示输出的列联表中显示每个观察计数值占该列联表总观察计数值的比例;row表示输出的列联表中显示每个观察计数值占该观察计数值所在行的各观察计数值总数的比例;coloumn表示输出的列联表中显示每个观察计数值占该观察计数值所在的列各观察计数值总数的比例。
例:某地调查肝癌病人与健康人饮用“醋冷水”(一种以冷水和醋为主要成分的饮料)的习惯。
用group=1表示肝癌组患者和group=2表示健康人;用custom=1表示经常饮用醋冷水;custom=2表示偶尔饮用醋冷水和custom=3表示从不饮用醋冷水。
具体资料为:(摘自医学统计方法,金丕焕主编,p163)。
组别经常偶尔从不饮用合计肝癌组26442898健康组28491794合计549345192显然这是一个病例对照研究,所以每组人数是人为确定的,因此只需计算各组"经常","偶而"和"从不饮用"占本组的频数以及检验患肝癌是否与饮水习惯有关。
tab2groupcustom,rowchi2->tabulationofgroupbycustom|customgroup|123|Total-----------+--------------------------------------------+----------1|①264428|98|②26.5344.9028.57|100.00-----------+--------------------------------------------+----------2|③284917|94|④29.7952.1318.09|100.00-----------+--------------------------------------------+----------Total|⑤549345|192|⑥28.1248.4423.44|100.00Pearsonchi2(2)=2.9497Pr=0.229①该行表示第一组(肝癌组)的3个观察数;②该行表示第一组的各个观察数的占第一组观察总数的百分比;③该行表示第二组(健康组)的3个观察数;④该行表示第二组的各个观察数的占第二组观察总数的百分比;⑤该行表示关于饮用醋冷水习惯的三个分类:“经常”,“偶尔”和“从不”的合计数;⑥该行表示上述三个合计数分别占总样本数的百分比。
第六章 卡方检验
• R*2 或2* C • 无序 • 在甲、乙两地进行水牛体型调查,将体型按优、良、中、劣 四个等级分类,其结果见P169表7-13。问两地水牛体型构 成比是否相同? • 表7-13 两地水牛体型分类统计 • 优 良 中 劣 • 甲 10 10 60 10 • 乙 10 5 20 10
• • • • • • • • • • • • • • •
2、选择Table Analysis,打开对话框
3、将A放在Row,将B放在Column,将freq放在Cell Counts
4、在Statistics中设置Exact Test检验,单击OK
5、结果如下,大致分为3部分,第一部分是频数和列百分比表;第二部分是四种 检验方法结果,p值都大于0.05水平;第三部分是Fisher精确检验结果,p值 位0.7246,远远大于0.05,可见判决情况与被告种族是没有关系的。
高级生物统计
• 第六章 卡方检验
列联表分析
使用Statistics菜单下的Table Analysis可以进行 列联表分析(即属性频数数据分析) 例1:为了考察法院判决是否与被告种族有关,调查了 326位被告的判决情况如表所示: 黑人 有罪 17 白人 19
无罪
149
141
1、首先建立数据集 Data panjue ; Input A B freq@@;\*其中A取1表有罪,2无罪;B 取1表黑人,2表白人*\ Cards; 1 1 17 1 2 19 2 1 149 2 2 141 ; Run;
•
Statistics for Table of r by c Statistic DF Value Prob Chi-Square 1 9.2774 0.0023 Likelihood Ratio Chi-Square 1 9.4190 0.0021 Continuity Adj. Chi-Square 1 7.9444 0.0048 Mantel-Haenszel Chi-Square 1 9.1615 0.0025 Phi Coefficient -0.3405 Contingency Coefficient 0.3224 Cramer's V -0.3405
卡方检验
第二节
行×列表资料的 检验
2
行×列表资料
① 两个样本率比较时,基本数据有4个,排成2行 2列,称为2 ×2表,即四格表; ② 多个样本率或构成比比较时,基本数据超过2 行2列,有R行C列,称R×C表或行列表。
检验统计量(通用公式)
A n( 1) nR nC
2
2
(行数 1)(列数 1)
【
2
2 χ 基本公式】
2
( AT ) , (行数-1)(列数 1) T
T为理论频数(theoretical frequency)
式中,A为实际频数(actual frequency)
nR nC TRC n
【 χ2检验的基本原理】
若H0:π1=π2=π0成立,
四个格子的实际频数A与理论频数T相差不应该很大,即统计
度函数可给出不同自由度的一簇分布曲线。
2分布的形状依赖于自由度的大小;当自由
度趋向于无穷大时, 2分布趋向正态分布。
χ2分布特点
χ2分布是一组曲线。 χ2分布与自由度有关 自由度一定时, χ2值越大,P值越小;反之亦然。 =1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63
三、配对四格表资料的 检验
2
也称McNemar检验(McNemar's test)
例6.3 某研究室用甲、乙两种血清学方法检查410 例确诊的鼻咽癌患者,得到结果如表6.4 ,问两 种方法检出率有无差别?
表6.4 两种血清学检验结果
甲法 + - 合计 乙法 + 261(a) 8(c) 269 - 110(b) 31(d) 141 合计 371 39 410
表中,a, d 为两法观察结果一致, b, c 为两法观察结果不一致。
《卡方检验》课件
制作交叉表
确定交叉表的行列变量
根据研究目的和内容,选择合适的行列变量,构建交叉表。
制作交叉表
将分组后的数据按照行列变量制作成交叉表,以便于进行卡 方检验。
计算理论频数
确定期望频数
根据交叉表中的数据,结合各组 的概率计算期望频数。
计算理论频数
根据期望频数和实际频数计算理 论频数,为后续的卡方检验提供 依据。
计算卡方值
计算卡方值
使用卡方检验的公式计算卡方值,该 值反映了实际频数与理论频数的差异 程度。
自由度的确定
在计算卡方值时,需要确定自由度, 自由度通常为行数与列数的减一。
显著性水平的确定
选择显著性水平
显著性水平是衡量卡方值是否显著的指标,通常选择0.05或0.01作为显著性水 平。
判断显著性
根据卡方值和自由度,结合显著性水平判断卡方检验的结果是否显著,从而得 出结论。
3.84、6.63等),可以确定观测频数与期望频数之间的差异是否具有统
计学显著性。
02
卡方检验的步骤
收集数据
确定研究目的
制定调查问卷或收集程序
在开始收集数据之前,需要明确研究 的目的和假设,以便有针对性地收集 相关数据。
根据研究目的和内容,制定合适的调 查问卷或建立数据收集程序,确保数 据的完整性和准确性。
详细描述
例如,在市场调研中,我们可以通过卡方检验来分析不同年龄段、性别、职业等 人群对于某产品的态度或购买意愿是否有显著差异,从而为产品定位和营销策略 提供依据。
实际案例二:医学研究中的应用
总结词
在医学研究中,卡方检验常用于病例 对照研究和队列研究中的分类变量关 联性分析。
详细描述
例如,在病例对照研究中,我们可以 通过卡方检验来比较病例组和对照组 在某些基因型、生活方式或暴露因素 上的分布是否有统计学差异,从而探 讨病因或危险因素。
6卡方检验2002
H0:1
,任两对比组的总体有效率相等
2
H1: 1
,任两对比组的总体有效率不等
2
0.05
36
检验水准调整:
' =
k(k 1) / 2+1
三种疗法治疗周围性面神经麻痹的实例中,检验
水准调整为:
' 0.05 0.05 / 4 0.0125
3(3 1) / 2 1
26
144
4.59
合计
282
44
326
P值
<0.0125 <0.00227 >0.0125
38
第六节 有序分组资料的线性趋势检验
年龄与冠状动脉硬化的关系
年龄(岁) (X)
20~ 30~ 40~
≥50 合计
冠状动脉硬化等级(Y)
— + ++ +++
70 22 4
2
27 24 9
3
16 23 13 7
绝H0,接受H1,可以认为两组降低颅内压总体有效率
不等,即可认为异梨醇口服液降低颅内压的有效率 高于氢氯噻嗪+地塞米松的有效率。
21
四格表资料连续性校正公式
(| ad bc | n)2 n
2 c
(a
b)(c
d )(a
2 c)(b
d)
1
22
对于四格表资料,通常规定:
(1)当n≥40且所有的T≥5时,用检验的基本公 式;当P≈α时,改用四格表资料的Fisher确切概率 法。
11
假设检验: H0:π1=π2 H1:π1≠π2 α=0.05
卡方检验的原理和内容公式原理
卡方检验是一种统计检验方法,其原理是比较理论频数和实际频数的吻合度或拟合优度。
基本思想是通过统计样本的实际观测值与理论推断值之间的偏离程度,来判断理论值是否符合。
卡方检验的应用范围包括检验某个连续变量或离散变量是否与某种理论分布接近,即分布拟合检验;以及检验类别变量之间是否存在相关性,即列联分析。
卡方检验的基本公式是卡方值,它是由实际频数和理论频数之间的差的平方与理论频数的比值计算得出的。
卡方值的计算公式如下:
卡方值=∑(实际频数-理论频数)^2 / 理论频数
其中,∑表示求和,实际频数和理论频数分别表示观测频数和期望频数。
如果卡方值越大,说明观测频数和期望频数之间的偏离程度越大;如果卡方值越小,说明观测频数和期望频数之间的偏离程度越小,越趋于符合。
需要注意的是,卡方检验的前提假设是样本数据服从卡方分布,且样本量足够大。
同时,卡方检验对于样本量较小的数据可能不太稳定,此时可以考虑使用其他统计方法如Fisher's exact test等。
11(第六章)卡方检验
25 63
11 71
13 57
4 9
53 200 253
合
计
88
82
70
13
H0:两种病人的血型构成比例相同
H1:两种病人的血型构成比例不同
0.05
2 2 25 11 2 253( 53 88 53 82 6.764
92 1) 200 13
甲 乙 合计
+ a c a+c
合计 b a+b d c+d b+d n=a+b+c+d
H0:两种药物的有效率相等 H1:两种药物的有效率不等
0.05
2 2 2 ( A T ) (36 42.86) (24 17.14) 2 T 42.86 17.14 (16 22.86) 2 6.73 22.86 (2 1) (2 1) 1
2 2 2
镇痛效果 有效 无效
合计 有效率(%) 15 20
18 53
3(7.36) 11(9.18)
12(8.83) 26
12(7.64) 9(10.18)
6(9.17) 27
20.00 55.00
66.67 49.06
H0:三种剂量的镇痛有效率相同
H1:三种剂量的镇痛有效率不同或不全相同
α=0.05
2 2 3 12 2 53( 15 16 15 27 7.584 (3 1)(2 1) 2
2 ( A T ) 2 T
2 A 2 N ( 1) nR nC
(行数 1)(列数-1)
例 某医师研究血型与胃溃疡、十二指肠溃疡间的关 联性,比较胃溃疡病人与十二指肠溃疡病人的血 型分布,结果见下表。 胃溃疡与十二指肠溃疡病人的血型分布 血 型 疾 病 合计 O A B AB
第6章 卡方检验 PPT课件
由 χC 2
(|OE|1/2)2可得: E
χ C 2(|8 2 - .7|.7 1 0 5 -.5 )5 6 2 (|8 .7 7|.2 0 5 - 2 .5 )2 5 0 .31 0 .4 90 4 1 .25 06
查附表,
χ2 0.05,1
3.8。4 现
χC 2 1.256002.0,51故应接受
Section 6.2
Fit Test 适合性检验
[例1] 大豆花色一对等位基因的遗传研究,在F2获得表1 所列分离株数。问这一资料的实际观察比例是否符合于3∶1 的理论比值。
表1 大豆花色一对等位基因遗传的适合性测验
花色
F2代实际株数 (O)
理论株数(E)
O-E
紫色
208
216.75 -8.75
0.5
0.4
纵高
0.3 0.2 0.1 0.0
0
自由度=1 自由度=2 自由度=3 自由度=6 a=0.05的临界值
3 3.84 6 7.81 9
1122.59 15
18
卡方值
单侧临界值
➢ 在自由度为
的
2
分布曲线图下,
2 a ,
右方
的面积为
a
,则称
2 a ,
为自由度为
的 2
分布概率为 a 的单侧临界值。可查表。
取 a=0.05。
根据H0的假定,计算各组格观察次数的相应理论次数: 如与146相应的E=(481×160)/547=140.69,
与183相应的E=(481×205)/547=180.26,……, 所得结果填于表4括号内。
根据 2 (OE)2 可得
iE χ 2 ( 1 4 1.6 6 4 )2 9 0 ( 7 8 .7 )2 8 ( 1 1 6 .9 1 )28 5 .62
“医学统计课件-卡方检验”
卡方检验中的显著性水平和p 值
显著性水平和p值是判断卡方检验结果是否显著的重要指标。我们将解释它们 的概念和计算方法,并讨论常用的显著性水平选择。
卡方检验的优缺点
卡方检验是一种简单有效的统计方法,但也有其局限性。我们将讨论卡方检 验的优点和不足之处,以及与其他统计方法的比较。
单样本卡方检验的原理和步骤
单样本卡方检验用于比较一个分类变量的观察频数与期望频数之间的差异。 我们将介绍其原理、计算方法和实际操作步骤。
独立性卡方检验的原理和步骤
独立性卡方检验用于判断两个分类变量之间是否存在相关性。我们将详细解 释它的原理、计算方法,并提供一个实际案例进行分析。
适合度卡方检验的原理和步骤
卡方检验的实际应用案例
通过实际案例,我们将展示卡方检验在医学和流行病学研究中的应用。这些 案例将帮助您更好地理解卡方检件——卡方 检验”
卡方检验是一种常用的统计方法,用于比较两个或多个分类变量之间的差异。 本课件将详细介绍卡方检验的原理、步骤、应用和优缺点,以及在医学研究 和流行病学中的实际案例。
卡方检验的分类及适用范围
卡方检验可以分为单样本卡方检验、独立性卡方检验和适合度卡方检验。每 种检验方法适用的情况略有不同,我们将详细探讨它们的应用领域和限制。
第六章卡方检验
• 为了度量实际观察次数与理论次数偏离的程度,最简单的 办法是求出实际观察次数与理论次数的差数。
• 当将这两个差值相加,(705-696.75)+(224-232.25)= 0。可以说, 任何类似的问题其结果都是 0。
为了避免正、负抵消,可将两个差数平方后再相加,即计算∑(O-E)2,且 由于平方,使得原来较大的差变得更大了,因而增大了分析问题的灵 敏性
先作无效假设:H 0 : 本例男女婴性别比符合常规比例 v s
H A : 不符常规比例
计算
2 c
值
c 2 4 6 9 1 4 4 5 5 1 1 3 3 ..5 5 0 .5 2 |4 1 5 9 4 4 3 3 3 3 6 6 .. 5 5 | 0 .5 2 1 4 .1 6
适合性检验适用于某一实际资料是否符合一理论值, 因此适合性检验常用于遗传学研究、质量鉴定、 规范化作业、一批数据是否符合某种理论分布等。
我们以例 3 来说明适合性检验的一般步骤
设立无效假设,H 0 : 果蝇的分类观测值与理论值相符 v s
H A : 两者不符
计算 2 值,前面已经得到 2 5.519
如果这一 3:1 的理论比例是正确的,那么这一试验所出现的 红花和白花的理论比例应当是:
红花:696.75
白花:232.25
显然,实际出现的红花、白花的朵数与理论值之间有一定的 差异,即observed frequency和expected frequency (如何用 t-test来完成这一检验?)
除此之外,我们还可以用 2 检验来完成检验工作 特别当有多个样本进行比较时,必须用 2 检验来完
成
第一节 2 检验的意义和原理概念
医学统计学课件卡方检验
队列研究中的卡方检验
总结词
在队列研究中,卡方检验用于比较不同暴露 水平或不同分组在某个分类变量上的分布差 异,以评估暴露因素与疾病发生之间的关系 。
详细描述
队列研究是一种前瞻性研究方法,按照暴露 因素的不同将参与者分为不同的组,追踪各 组的疾病发生情况。通过卡方检验,可以比 较不同暴露水平或不同分组在分类变量上的 分布差异,如分析不同饮食习惯的人群中患
卡方检验与相关性分析的区别
卡方检验主要用于比较实际观测频数与期望频数之间的差异,而相关性分析则用于研究 两个或多个变量之间的关联程度。
卡方检验与相关性分析的联系
在某些情况下,卡方检验的结果可以为相关性分析提供参考,帮助了解变量之间的关联 程度。
05
卡方检验的应用实例
病例对照研究中的卡方检验
总结词
02
公式
卡方检验的公式为 $chi^{2} = sum frac{(O_{ij} - E_{ij})^{2}}{E_{ij}}$,
其中 $O_{ij}$ 表示实际观测频数,$E_{ij}$ 表示期望频数。
03
适用范围
卡方检验适用于两个分类变量的比较,可以用于分析病例对照研究、队
列研究等类型的研究。
卡方检验的用途
如比较不同年龄组、性别组等人群中某种疾病的患病率。
卡方检验的基本假设
每个单元格中的期望 频数应该大于5。
卡方检验对于样本量 较小的情况可能不适 用。
观察频数与期望频数 应该服从相同的概率 分布。
02
卡方检验的步骤
收集数据
01
02
03
确定研究目的
在开始卡方检验之前,需 要明确研究的目的和假设 ,以便有针对性地收集数 据。
卡方检验
假设检验方法
01 基本原理
03 检验方法 05 代码实现
目录
02 步骤 04 资料检验
卡方检验,是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用,包括两个率或两个构成比 比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
基本原理
卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程 度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡 方值就为0,表明理论值完全符合。
卡方检验要求:最好是大样本数据。一般每个个案最好出现一次,四分之一的个案至少出现五次。如果数据 不符合要求,就要应用校正卡方。
谢谢观看
注意:卡方检验针对分类变量。
步骤
(1)提出原假设: H0:总体X的分布函数为F(x). 如果总体分布为离散型,则假设具体为 H0:总体X的分布律为P{X=xi}=pi, i=1,2,... (2)将总体X的取值范围分成k个互不相交的小区间A1,A2,A3,…,Ak,如可取 A1=(a0,a1],A2=(a1,a2],...,Ak=(ak-1,ak), 其中a0可取-∞,ak可取+∞,区间的划分视具体情况而定,但要使每个小区间所含的样本值个数不小于5, 而区间个数k不要太大也不要太小。 (3)把落入第i个小区间的Ai的样本值的个数记作fi,成为组频数(真实值),所有组频数之和 f1+f2+...+fk等于样本容量n。 (4)当H0为真时,根据所假设的总体理论分布,可算出总体X的值落入第i个小区间Ai的概率pi,于是,npi 就是落入第i个小区间Ai的样本值的理论频数(理论值)。
检验方法