第十章卡方检验描述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

步骤一 ( fo - fe )
步骤二
步骤三
fo (%) fe (%) 60.9 66.7
( f o - f e )² ( f o - f e )² /fe
社会学
— 5.8
33.5
0.5028
经济学
文学 信息学
76.0
61.3 69.2
66.7
66.7 66.7
9.3
— 5.4 2.5
86.5
28.9 6.4
第十章 卡方检验

卡方分布就是对样本的频数分布所来自的总体分布是否服从某种理论 分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断 总体的分布。 不同于回归分析以及 t 检验和方差分析(三者都属于参数统计), 它属于自由分布的非参数检验(非参数统计)。 它可以处理一个因素分为多种类别或多种因素各有多种类别的资料。 凡是可以应用比率进行检验的资料,都可以用卡方检验。 卡方检验是用途很广的一种假设检验方法。例如,它包括两个或多个 样本率及构成比之间的差别有无统计意义的推断,分类变量配对设计 下的卡方检验以及频数分布的拟合优度检验等。 在社会统计学中应用最多的用于分类变量之间拟合优度和独立性检验 的 χ² 检验。 χ² 检验可以判断变量之间是否相关,但,不能判断相关程度为多大。


f e甲 0.58 270 156.6件 f e乙 0.33 270 89.1件 f e丙 0.09 270 24.3件
观察值
期望值
步骤一 ( fo - fe )
步骤二 ( f o - f e )²
步骤三 ( f o - f e )² /fe
fo 150 85 35
1.2967
0.4338 0.0960
步骤四
2
fo fe 2 2.3293
fe

自由度 = (R-1)×(C-1)=(2-1)×(4-1)= 3 α = 0.05,查表得:χ²α (3) = 7.815 由于 χ² < χ²α (3),所以我们不能拒绝虚无假设,即认为四个专业的 学生对宿舍管理改革的赞成是一致的,调查数据中的差异是由于抽样 的随机性造成的。

首先,我们假设四个专业的学生之间不存在差异,即四个专业的学生 赞成改革的比例是一致的,即均为 280 100 % 66 .7% 420
H 0: 1 2 3 4 66.7% H1: 1, 2, 3, 4 不 完 全 相 等
观察值 专业
期望值




举例说明

某车间有甲,乙,丙三个技工进行生产,上周甲,乙,丙三个人产量 分别占总量的 58%,ቤተ መጻሕፍቲ ባይዱ3% 和 9%,丙进行学习,想提高技术。一周后 三人产量共生产了 270 件产品,其中甲,乙,丙三人分别生产 150 件,85 件和 35 件。请判断丙学习后三人产量占的比例是否发生了 变化。 在这个例子中,假定三人产量所占比例没有变化,那么甲,乙,丙三 人产量期望值分别为:







φ 系数,克拉默 V 系数。它们用于判断变量之间相关程度的大小, 但是这两个系数的应用也有其局限性。
卡方统计量


χ² 可以用于变量之间的拟合优度检验和独立性检验,测定两个分类 变量之间的相关程度。 2 f f χ² 统计量表达式为: 2 o e fe
其中,f0 是观察值,fe 是期望值。

α = 0.05
χ² = 5.1783
0
χ²α (2) = 5.99

2
卡方检验的概念
(一)卡方检验:多个总体的比较
从总体的不同类别中抽取元素构成样本,样本包含总体中各个类 别的元素,对不同类别的目标量之间是否存在显著性差异进行的检验 称为拟合优度检验。 拟合优度检验是 χ ² 检验中重要的一部分,可以同时对多个总 体进行比较。
在 χ ² 检验中,如果 χ ² > χ ² α (k-1) ,则拒绝虚无假设。 χ²α (k-1) 为给定值,其中(k-1)是自由度。自由度是可以自由变 动的变量个数,在列联表中,自由度 = (R-1)× (C-1)。

例如,从某学校社会学,经济学,文学,信息学四个专业中随机抽取 420 名学生针对学校宿舍管理改革的态度进行调查。调查结果如下表 所示,以 α = 0.05 的显著性水平检验四个专业的学生对宿舍管理改 革的看法是否存在差异。 社会学 赞成 反对 合计 67 43 110 经济学 76 24 100 文学 65 41 106 信息学 72 32 104 合计 280 140 420


独立性检验

例如,我们分析阅读习惯于学历是否有关。随机抽取 254 人进行调查,调 查结果如下表:
高中以下
高中
大学
研究生
合计
早上看
中午看 晚上看 有空看
6
12 38 21
13
16 40 22
χ² 统计量是平方和的加总,因而,χ² ≥ 0 。 χ ² 值的大小与变量的个数有关,即观察值和期望值配对数越多, χ² 值越大,因而,χ² 统计量的分布与自由度有关。 χ² 统计量描述的是观察值与期望值之间的接近程度,两个越接近, fo fe 越小,χ² 越小。 反之, f o f e 越大,χ² 越大。
fe 156.6 89.1 24.3
步骤四
—6.6 —4.1 10.7
43.56 16.81 114.49
0.278161 0.188664 4.711523
2
fo fe 2
fe
5.1783

通过差卡方分布表得到 χ²0.05 (2) = 5.99 > χ² = 5.1783,所以认为 丙学习后三人产量所占比例没有发生变化。 自由度 = k-1= 3-1 = 2


α = 0.05 χ² = 2.3293
2
0
χ²α (3) = 7.815
(二)适用场合:分类变量之间的关系

χ² 检验用于分类变量之间关系的检验,可以判断不同类别的目标量 之间是否存在显著差异。 χ² 检验主要用来检验频数问题,即检验各类实际观察的频数是否显 著不同于假设的期望频数。 同时,χ² 检验还可用于判断两个分类变量之间是否存在联系;这时 称 χ² 检验为对立性检验。如果连个分类变量之间没有关系,则称 二者相互独立。
相关文档
最新文档