第十章 卡方检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

10
第一节 卡方(χ2)及其分布
χ2分布的特点: 第一,χ2分布呈正偏态,右侧无限伸延,但永不与基线相交。 第二,χ2分布随自由度的变化而形成一簇分布形态。 所谓自由度——是指实际频数与理论频数差数中,能够独立 变化的个数。 本例实际频数与理论频数的差数有2个,因为受到∑(f0-ft)=0 因子的限制,其中只有一个可以独立变化,则自由度df=1。
21
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 2、某组理论频数ft<5的情况 当df=1,其中只要有一个组的ft<5,就要用亚茨(Yates) 连续性校正法,即

2
f
0
f t 0.5 ft
2
连续性校正的必要性: ——因为点计数据求得的χ2值是间断数列,当df=1, ft<5时,间断性尤为明显。而χ2值表上的理论值是用 连续量表示的,其χ2分布是一条连续的光滑曲线。
3
第一节 卡方(χ2)及其分布
与测量数据的假设检验不同: 第一,测量数据的假设检验,其数据属于连续变量, 而卡方检验的数据属于点计而来的间断变量。
第二,测量数据所来自的总体要求呈正态分布, 而卡方检验的数据所来自的总体分布是未知的。
第三,测量数据的假设检验是对总体参数或几个总体参数之 差所进行的假设检验; 而卡方检验在多数情况下不是对总体参数的检验,而是对总 体分布的假设检验。卡方检验属于自由分布的非参数检验。
24
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 2、某组理论频数ft<5的情况 检验的步骤: (2)计算χ2值
表10.5 检验某中学共青团员比率是否与全区一样的χ2值计算表
f0
团员 12
ft
16
|f0-ft|
4
|f0-ft|-0.5
3.5 3.5
(|f0-ft|-0.5)2
12.25
19
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 检验的步骤: 2 f f (2)计算χ2值 2 0 t 本例df=1,两组的理论频数均为ft=38>5。 ft
表10.4 喜欢与不喜欢体育人数的χ2值计算表
f0
ft
f0-ft (f0-ft)2
(f0-ft)2/ ft
5
第一节 卡方(χ2)及其分布
二、卡方(χ2)检验的统计量 卡方(χ2)检验统计量的基本形式为:

2
f 0 ft
ft
2
f0——实际频数 ft——理论频数
6
第一节 卡方(χ2)及其分布
二、卡方(χ2)检验的统计量 例如: 从某校随机抽取50个学生,其中男生27人,女生23人,问 该校男女生人数是否相同?
28
第二节 单向表的卡方(χ2)检验
三、频数分布正态性的χ2检验 检验的步骤: (2)计算χ2值 在计算实际频数与理论频数差数之前,两端若有任何一组的 理论频数小于5,就要进行校正。即把ft<5这组的理论频 数与相邻组的理论频数合并,直至大于5 为止。然后将相 应组的实际频数也进行合并。 2 根据 求χ2=5.202
17
第二节 单向表的卡方(χ2)检验
检验的步骤: (3)统计决断
表10.3 χ2检验统计决断规则 χ2值与临界值的比较 χ2<χ2(df)0.05 χ2(df)0.05≤χ2<χ2(df)0.01 χ2≥χ2(df)0.01 P值 P>0.05 0.01< P≤0.05 P≤0.01 检验结果 保留H0而拒绝H1 在0.05显著性水平 上拒绝H0接受H1 在0.01显著性水平 上拒绝H0接受H1 显著性 不显著 显著(﹡) 极其显著 (﹡﹡)
4
第一节 卡方(χ2)及其分布
比率和比率之差的假设检验,是对二项分布数据的假设检验。 ——处理一个因素分成两类, ——或者两个因素,每个因素都分为两类的资料。 ——最多只能同时比较两组比率的差异。 卡方(χ2)检验 ——可同时处理一个因素分为多种类别, ——或多种因素各有多种类别的资料。 ——凡是可以应用比率进行检验的资料,都可以应用卡方 (χ2)检验。
26
第二节 单向表的卡方(χ2)检验
三、频数分布正态性的χ2检验 例如: 120个11岁男生身高的频数分布如表,问其总体是否呈正态 分布?(平均数X=139.9,标准差σX=7.5)
检验的步骤: (1)提出假设 H0:样本所属的总体呈正态分布 H1:样本所属的总体不呈正态分布
27
第二节 单向表的卡方(χ2)检验
16
第二节 单向表的卡方(χ2)检验
检验的步骤: (3)统计决断 首先决定自由度。 单向表χ2的自由度一般等于组数减1,即df=K-1。 然后根据df=K-1=3-1=2,查χ2值表,χ2(2)0.05=5.99, 由于χ2=1.22<5.99=χ2(2)0.05,则P>0.05, 按照表10.3χ2检验统计决断的规则,应保留H0而拒绝H1。 其结论为:该校老年教师的健康状况,好、中、差人数比率 为1:2:1。
自由度越小,χ2分布偏斜度越大;自由度越大,分布形态越 趋于对称。
11
第一节 卡方(χ2)及其分布
χ2分布的特点:
自由度越小,χ2分布偏斜度越大; 自由度越大,分布形态越趋于对称。
12
第二节 单向表的卡方(χ2)检验
单向表 ——把实得的点计数据按一种分类标准制成表就是单向表。 单向表(因素)的χ2检验 ——对于单向表的数据所进行的χ2检验就是单向表(因素) 的χ2检验。
9
第一节 卡方(χ2)及其分布
三、χ2值的抽样分布 用上例说明χ2的抽样分布。 ——如果将上述所抽取的50个学生还回总体之中, ——再从中随机抽取50个学生,又可以计算出一个样本χ2值。 ——这样反复抽下去,就会有一切可能个样本χ2值。 ——这一切可能个样本χ2值的频数分布,就形成一个实验性 的χ2的抽样分布。
18
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 1、各组理论频数ft≥5的情况 例如: 从小学生中随机抽取76人,其中50人喜欢体育,26人不喜 欢体育,问该校学生喜欢和不喜欢体育的人数是否相等? 检验的步骤: (1)提出假设 H0:喜欢与不喜欢体育的人数相等 H1:喜欢与不喜欢体育的人数不相等
8
第一节 卡方(χ2)及其分布
χ2值的特点: 第一,χ2值具有可加性。如,男生+女生=总卡方值。 第二,χ2值永远是正值。 第三,χ2值的大小随实际频数与理论频数差的大小而变化。 两者之差越小,说明样本分布与假设的理论分布越相一致; 两者之差越大,说明样本分布与假设的理论分布越不相一致。 究竟χ2值大到什么程度才能说样本分布与理论分布不一致 呢?——这要看样本的χ2值在其抽样分布上出现的概率如何 而定。
根据男女生人数相同的假设,其理论频数应为50/2=25。于 是

2
f 0 ft
ft
2
27 25
25
2
23 25
25
2
0.32
7
第一节 卡方(χ2)及其分布
可列表计算χ2值
表10.1 男女学生人数的χ2值计算表 实际 频数 f0 男生 女生 总和 27 23 50 理论 频数 ft 25 25 50 差 数 f0-ft 2 -2 差数的 平方 (f0-ft)2 4 4 差的平方与 理论频数之比 (f0-ft)2/ ft 4/25=0.16 4/25=0.16 χ2=0.32

2
f 0 ft
ft
29
第二节 单向表的卡方(χ2)检验
三、频数分布正态性的χ2检验 检验的步骤: (3)统计决断 正态性χ2检验的自由度df=K-3。K是合并后保留下来的组数。 df=7-3=4。 自由度df=K-3的原因: 1单向表的χ2检验受到∑(f0-ft)=0一个因子的限制。 2应用Z=(X-X)/ σX的公式计算理论频数时,运用了X和 σX两 个样本统计量,又受到两重限制,一共失去3个自由度。
23
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 2、某组理论频数ft<5的情况 检验的步骤: (2)计算χ2值 根据零假设,该校共青团员的ft=20×0.8=16,非共青团员 的ft=20×0.2=4。 由于本例df=1,有一个组的ft=4<5,在计算χ2值时需要进行 亚茨连续性校正。
(|f0-ft|-0.5)2/ ft
12.25/16=0.77
非团员
总和
8
20
4
20
4
12.25
12.25/4=3.06
χ2=3.83
25
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 2、某组理论频数ft<5的情况 检验的步骤: (3)统计决断 根据df=1,查χ2值表,χ2(1)0.05=3.84, 由于χ2=3.83<3.84=χ2(1)0.05,则P>0.05, 于是保留H0而拒绝H1。 其结论为:该校共青团员的比率与全区没有显著性差异。
《教育统计学》
职教学院 刘春雷 E-mail:lcl2156@126.com
1
第十章 卡方(χ2)检验
第一节 χ2及其分布 第二节 单向表的χ2检验
第三节 双向表的χ2检验
第四节 四格表的χ2检验
2
第一节 卡方(χ2)及其分布
一、卡方(χ2)检验的特点 卡方(χ2)检验 ——是对样本的频数分布所来自的总体分布是否服从某种理 论分布或某种假设分布所作的假设检验。 ——即根据样本的频数分布来推断总体的分布。
喜欢 50 不喜欢 26
总和 76
38 38
76
12 -12
144 144
3.79 3.79
χ2=7.58
20
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 检验的步骤: (3)统计决断 根据df=K-1=2-1=1,查χ2值表,χ2(1)0.01=6.63, 由于χ2=7.58﹡﹡>6.63=χ2(1)0.01,则P<0.01, 按照表10.3 χ2检验统计决断规则, 应在0.01显著性水平上拒绝H0而接受H1。 其结论为:该校喜欢体育的人数与不喜欢体育的人数不相等, 并有极其显著性差异。
三、频数分布正态性的χ2检验 检验的步骤: (2)计算χ2值 按照样本所属的总体呈正态分布的零假设,运用正态曲 线下面积的有关知识, 首先求各组的理论频数,其步骤为: 将各组的上下限转换为标准分数Z值。 根据各组上下限Z值查表,寻找各组上下限Z值至Z=0之间 的面积。 求各组的面积。 将各组的面积与总频数相乘,求各组的理论频数。
15
第二节 单向表的卡方(χ2)检验
也可列表计算χ2值
表10.2 不同健康人数的χ2值计算表 健康 好 中 差 总和 f0 15 23 16 54 ft 13.5 27 13.5 54 f0-ft 1.5 -4 2.5 (f0-ft)2 2.25 16 6.25 (f0-ft)2/ ft 0.167 0.593 0.465 χ2=1.22
30
第二节 单向表的卡方(χ2)检验
三、频数分布正态性的χ2检验 检验的步骤: (3)统计决断 根据df=4,查χ2值表,χ2(4)0.05=9.49, 由于χ2=5.20<9.49=χ2(4)0.05,则P>0.05, 应保留H0而拒绝H1。 其结论为:11岁男生的身高总体是呈正态分布的。
14
第二节 单向表的卡方(χ2)检验
检验的步骤: (2)计算χ2值 根据零假设,健康状况好、中、差的理论频数ft分别为: 54×(1/4)=13.5 54×(2/4)=27 54×(1/4)=13.5 然后根据公式求解χ2值
Leabharlann Baidu
2
f 0 ft
ft
2
χ2=(15-13.5)2/13.5+(23-27)2/27+(16-13.5)2/13.5=1.22
22
第二节 单向表的卡方(χ2)检验
二、一个自由度的χ2检验 2、某组理论频数ft<5的情况 例如: 某区中学共青团员的比率为0.8,现从该区某中学随机抽取 20人,其中共青团员有12人,问该校共青团员的比率与全区 是否一样? 检验的步骤: (1)提出假设 H0:该校共青团员的比率与全区一样 H1:该校共青团员的比率与全区不一样
13
第二节 单向表的卡方(χ2)检验
一、按一定比率决定理论频数的χ2检验 例如 大学某系54位老年教师中,健康状况属于好的有15人,中等 的有23人,差的有16人,问该校老年教师健康状况好、中、 差的人数比率是否为1:2:1? 检验的步骤: (1)提出假设 H0:健康状况好、中、差的人数比率为1:2:1 H1:健康状况好、中、差的人数比率不是1:2:1
相关文档
最新文档