第六章 卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中等以上 中等以下 合 计
男
女
23(a)
28(c)
17(b)
22(d)
40(a+b)
50(c+d)
合计 51(a+c) 39(b+d) 90(a+b+c+d=N)
11
例3的计算
差异 解:1建立假设: H 0 : 男女生学业水平无显著
2计算 2值 :
H1 : 男女生学业水平显著差 异 f Ri f C j 40 51 22.67, 其他依次类推 90
0.01 p 0.05.在005水平上拒绝零假设, 差异显著. 故学生报考师范院校与家庭经济状况有关系.
16wk.baidu.com
练习
• 根据自己的专业背景及专业知识设计一 调查问卷,并进行模拟调查,将调查结 果输入spss数据库中,并进行检验分析。 (要求进行t检验与卡方检验分析)
17
8
一、独立性检验的一般问题
• 二维列联表的独立性检验的一般步骤: 1. 建立假设:H0:二因素之间是独立的或无关 联;H1:二因素之间是有关联的或者说差异 显著。(一般多用文字表述而很少用统计符 号) f Ri f C j 2. 计算理论次数: f e 12 13 ij N 3. 确定自由度: df R 1C 1 4. 计算统计量:具体方法下面逐一介绍之。 5. 统计决断
3.84 5.4 6.63, 0.01 P 0.05 故对高中文理分科的态 度有差异.
5
例2 大学某系54位老年教师中,健康状况 属于好的有15人,中等的有23人,差的有 16人,问该校老年教师中三种健康状况的 人数是否一样?
解: 1建立假设: H 0 : 健康状况好,中, 差三种人数相同
2
18 20.532 27 19.432
20.53 19.43
11 9.84 2
9.84
10.48
15
例5的计算(续)
③统计决断:df=(R-1)(C-1)=(3-1)(3-1)=4,查表得:
24 .05 9.49, 24 .01 13.28 9.49 10.49 13.28
9
㈠独立样本四格表的 检验:四格表独立样本, 即从总体中随机取样,然后按两个因素对个体 进行分类,将观测结果分别填入四个格内,便 得到独立样本四格表,当各格的理论次数 f e 5 时,可用基本公式(12-11),即:
2
二、2×2列联表(四格表)独立性检验
2
f0 fe
fe
2
家庭经 济状况 对报考师范院校的态度 总和 愿意 不愿意 未定 18(20.53) 27(19.43) 10(15.03) 55 20(22.03) 19(20.85) 20(16.13) 59 18(13.44) 7(12.72) 11(9.84) 36 56 53 41 150
14
上
中 下 总和
21.67
0.02
0.02 3.84, P 0.05, 差异不显著 .故略
9023 22 17 28 2 0.02036 40 50 51 39 3统计决断: df 1, 查表得 : 21.05 3.84
12
三、R C列联表独立性检验
H1 : 健康状况好,中, 差三种人数不相同
2计算 2值 : 根据零假设, 其理论频数为: f e 54 18
3
2 2 2 15 18 23 18 16 18 2
18
18
18
2.11
3统计决断: df 3 1 2, 查表得, 220.05 5.99
2.11 5.99, P 0.05 故该校老教师中 , 健康状况好,中, 差三种人数无显著差异 .
6
第三节 独立性检验
2 • 独立性检验也是 检验的又一重要应用,它
主要用于两个或两个以上因素多项分类的计数 资料分析。如果想研究两个(或两个以上因素) 2 之间是否具有独立性或有无关联,就要用 检验独立性检验。
或可用下面简便公式计 算 : N ad bc 2 12 14 a b c d a c b d
2
10
例3 今随机抽取90人,按男女不同性别和 学生学习水平两个因素进行分类,结果如 下表所示,问男女学生学业水平有无显著 差异?或问性别与学业之间有无关联?
例4的计算
解:①建立假设: H0:学生是否愿意报考师范院校与家庭经济状况没有关系; H1:学生是否愿意报考师范院校与家庭经济状况有关系 ②计算检验统计量:
计算各组的理论次数,由公式 : f eij f e11 f Ri fC j f Ri fC j N , 则有 :
55 56 20.53, 其它各格的理论次 N 150 数可仿此分别计算, 并把结果填入上表的括号内.
根据理论计数公式 f eij
2
f 0 f e 2
fe
N 2 23 22.67 22.67
, f e11
17.33 28.33 12 14,即 : 若用简便公式
2
2 2 2 17 17.33 28 28.33 22 21.67
第六章
检验
2
上一章所讲的总体平均数推断等内容,是针 对连续性数据的。但在教育和心理研究中,有 时需研究的问题是按一定的性质划分为不同的 类别,然后统计各类别中的人数或个数,即需 要用到计数资料。例如,将人按照性别划分为 “男”、“女”;将学生按照学习成绩的优劣 划分为“优”、“良”、“中”、“差”等, 然后对各类别分别有多少,占多大的比例等。 对于这些计数资料的统计分析,需要使用本章 2检验。应用 2检验 分析计 所介绍的 数数据时,对计数数据总体的分布形态不作任 何假设,因此 2检验 被视为是非参数检 1 验方法的一种。
第二节 无差假说的检验
• 无差假说是指各项分类的次数没有差异,即假 设各项分类之间的机会均等,或概率相等。 • 因此,理论次数完全按概率相等的条件计算, 其公式为:
1 f e 总数 分类项数
4
例1: 随机抽取60名学生,问他们高中要 不要文理分科,回答赞成的39人,反对的 21人,问对分科的意见有无显著差异?
2是实计数据与理论数据 偏离程度的指标 .
其基本公式为: 2
f 0 f e 2
fe
2
f 0为实际频数;f e为理论频数
卡方检验的步骤
• • • • • • 第一步:提假设 H0: f0=fe 第二步:实际算 2=Σ(f0-fe)2/fe 第三步:查标准 α=0.05, df=(行数-1)*(列数-1) 查 2 ( df ) α =? 第四步:作判断 若χ2 > χ α 2,则拒绝H0.
• 上述四格表检验是 R C 列联表独立性检验的 一个特例,一般情况下是 R C 列联表的独立 性检验。其目的是判断两种分类特征是否有依 存关系。
13
例4家庭经济状况属于上、中、下的高三毕 业生,对于是否愿意报考师范院校有三种不 同的态度(愿意、不愿意、未定),其人数 分布如下表。问学生是否愿意报考师范院校 与家庭经济状况有无关系?
7
一、独立性检验的一般问题
2 • 检验主要研究两个因素或两个以上因素多项
分类的计数资料的独立性问题。如果两个因素 中的一个因素有R类,另一个因素有C类,这种 表称之为R×C表,即二维列联表。特殊的列联 表是2×2表。因素若是多于两个,这种表称为 多维表,多维列联表的分析较为复杂,本节从 2 略,这里仅介绍二维列联表的 检验。
解:
1建立假设: H 0 : f 0 2计算 2值 : 2
f e 60 0.5 30 f e 30; H1 : f 0 f e
f 0 f e 2 39 302 21 302
fe 30 30
5.4
3统计决断: df 2 1 1; 查表得 : 21.05 3.84, 21.01 6.63
第一节 检验 概述
2
2 一、 和 检验的意义 2
检验 方法能处理一个因素两项或多项分类的实际观
2
察频数与理论频数分布是否相一致问题,或者说有无显著 差异问题。 实际频数简称实计数或实际数,是指在实验或调查中 得到的计数资料,又称为观察频数。 理论频数是指根据概率原理、某种理论、某种理论次 数分布或经验次数分布计算出来的次数,又称为期望次数。
男
女
23(a)
28(c)
17(b)
22(d)
40(a+b)
50(c+d)
合计 51(a+c) 39(b+d) 90(a+b+c+d=N)
11
例3的计算
差异 解:1建立假设: H 0 : 男女生学业水平无显著
2计算 2值 :
H1 : 男女生学业水平显著差 异 f Ri f C j 40 51 22.67, 其他依次类推 90
0.01 p 0.05.在005水平上拒绝零假设, 差异显著. 故学生报考师范院校与家庭经济状况有关系.
16wk.baidu.com
练习
• 根据自己的专业背景及专业知识设计一 调查问卷,并进行模拟调查,将调查结 果输入spss数据库中,并进行检验分析。 (要求进行t检验与卡方检验分析)
17
8
一、独立性检验的一般问题
• 二维列联表的独立性检验的一般步骤: 1. 建立假设:H0:二因素之间是独立的或无关 联;H1:二因素之间是有关联的或者说差异 显著。(一般多用文字表述而很少用统计符 号) f Ri f C j 2. 计算理论次数: f e 12 13 ij N 3. 确定自由度: df R 1C 1 4. 计算统计量:具体方法下面逐一介绍之。 5. 统计决断
3.84 5.4 6.63, 0.01 P 0.05 故对高中文理分科的态 度有差异.
5
例2 大学某系54位老年教师中,健康状况 属于好的有15人,中等的有23人,差的有 16人,问该校老年教师中三种健康状况的 人数是否一样?
解: 1建立假设: H 0 : 健康状况好,中, 差三种人数相同
2
18 20.532 27 19.432
20.53 19.43
11 9.84 2
9.84
10.48
15
例5的计算(续)
③统计决断:df=(R-1)(C-1)=(3-1)(3-1)=4,查表得:
24 .05 9.49, 24 .01 13.28 9.49 10.49 13.28
9
㈠独立样本四格表的 检验:四格表独立样本, 即从总体中随机取样,然后按两个因素对个体 进行分类,将观测结果分别填入四个格内,便 得到独立样本四格表,当各格的理论次数 f e 5 时,可用基本公式(12-11),即:
2
二、2×2列联表(四格表)独立性检验
2
f0 fe
fe
2
家庭经 济状况 对报考师范院校的态度 总和 愿意 不愿意 未定 18(20.53) 27(19.43) 10(15.03) 55 20(22.03) 19(20.85) 20(16.13) 59 18(13.44) 7(12.72) 11(9.84) 36 56 53 41 150
14
上
中 下 总和
21.67
0.02
0.02 3.84, P 0.05, 差异不显著 .故略
9023 22 17 28 2 0.02036 40 50 51 39 3统计决断: df 1, 查表得 : 21.05 3.84
12
三、R C列联表独立性检验
H1 : 健康状况好,中, 差三种人数不相同
2计算 2值 : 根据零假设, 其理论频数为: f e 54 18
3
2 2 2 15 18 23 18 16 18 2
18
18
18
2.11
3统计决断: df 3 1 2, 查表得, 220.05 5.99
2.11 5.99, P 0.05 故该校老教师中 , 健康状况好,中, 差三种人数无显著差异 .
6
第三节 独立性检验
2 • 独立性检验也是 检验的又一重要应用,它
主要用于两个或两个以上因素多项分类的计数 资料分析。如果想研究两个(或两个以上因素) 2 之间是否具有独立性或有无关联,就要用 检验独立性检验。
或可用下面简便公式计 算 : N ad bc 2 12 14 a b c d a c b d
2
10
例3 今随机抽取90人,按男女不同性别和 学生学习水平两个因素进行分类,结果如 下表所示,问男女学生学业水平有无显著 差异?或问性别与学业之间有无关联?
例4的计算
解:①建立假设: H0:学生是否愿意报考师范院校与家庭经济状况没有关系; H1:学生是否愿意报考师范院校与家庭经济状况有关系 ②计算检验统计量:
计算各组的理论次数,由公式 : f eij f e11 f Ri fC j f Ri fC j N , 则有 :
55 56 20.53, 其它各格的理论次 N 150 数可仿此分别计算, 并把结果填入上表的括号内.
根据理论计数公式 f eij
2
f 0 f e 2
fe
N 2 23 22.67 22.67
, f e11
17.33 28.33 12 14,即 : 若用简便公式
2
2 2 2 17 17.33 28 28.33 22 21.67
第六章
检验
2
上一章所讲的总体平均数推断等内容,是针 对连续性数据的。但在教育和心理研究中,有 时需研究的问题是按一定的性质划分为不同的 类别,然后统计各类别中的人数或个数,即需 要用到计数资料。例如,将人按照性别划分为 “男”、“女”;将学生按照学习成绩的优劣 划分为“优”、“良”、“中”、“差”等, 然后对各类别分别有多少,占多大的比例等。 对于这些计数资料的统计分析,需要使用本章 2检验。应用 2检验 分析计 所介绍的 数数据时,对计数数据总体的分布形态不作任 何假设,因此 2检验 被视为是非参数检 1 验方法的一种。
第二节 无差假说的检验
• 无差假说是指各项分类的次数没有差异,即假 设各项分类之间的机会均等,或概率相等。 • 因此,理论次数完全按概率相等的条件计算, 其公式为:
1 f e 总数 分类项数
4
例1: 随机抽取60名学生,问他们高中要 不要文理分科,回答赞成的39人,反对的 21人,问对分科的意见有无显著差异?
2是实计数据与理论数据 偏离程度的指标 .
其基本公式为: 2
f 0 f e 2
fe
2
f 0为实际频数;f e为理论频数
卡方检验的步骤
• • • • • • 第一步:提假设 H0: f0=fe 第二步:实际算 2=Σ(f0-fe)2/fe 第三步:查标准 α=0.05, df=(行数-1)*(列数-1) 查 2 ( df ) α =? 第四步:作判断 若χ2 > χ α 2,则拒绝H0.
• 上述四格表检验是 R C 列联表独立性检验的 一个特例,一般情况下是 R C 列联表的独立 性检验。其目的是判断两种分类特征是否有依 存关系。
13
例4家庭经济状况属于上、中、下的高三毕 业生,对于是否愿意报考师范院校有三种不 同的态度(愿意、不愿意、未定),其人数 分布如下表。问学生是否愿意报考师范院校 与家庭经济状况有无关系?
7
一、独立性检验的一般问题
2 • 检验主要研究两个因素或两个以上因素多项
分类的计数资料的独立性问题。如果两个因素 中的一个因素有R类,另一个因素有C类,这种 表称之为R×C表,即二维列联表。特殊的列联 表是2×2表。因素若是多于两个,这种表称为 多维表,多维列联表的分析较为复杂,本节从 2 略,这里仅介绍二维列联表的 检验。
解:
1建立假设: H 0 : f 0 2计算 2值 : 2
f e 60 0.5 30 f e 30; H1 : f 0 f e
f 0 f e 2 39 302 21 302
fe 30 30
5.4
3统计决断: df 2 1 1; 查表得 : 21.05 3.84, 21.01 6.63
第一节 检验 概述
2
2 一、 和 检验的意义 2
检验 方法能处理一个因素两项或多项分类的实际观
2
察频数与理论频数分布是否相一致问题,或者说有无显著 差异问题。 实际频数简称实计数或实际数,是指在实验或调查中 得到的计数资料,又称为观察频数。 理论频数是指根据概率原理、某种理论、某种理论次 数分布或经验次数分布计算出来的次数,又称为期望次数。