应用统计学 第七章 列联分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

联 分
为 (R 1)(C 1) 。根据表7-2、表7-4和式(7-2),将 2统计量的计算过程列入表7-5。

12
第二节 2 统计量与 2 检验
第 七
章 二、 2 检验

Βιβλιοθήκη Baidu
联 分 析
2 检验即卡方检验,是指运用 2 统计量的计算结果与 2 分布中的临界值进行比较,
作出对原假设的统计决策。卡方检验可以用于拟合优度检验和独立性检验。其中,拟合
总频数n。表7-4是利用Excel计算的储户期望值分布表。
8
第一节 列联表
第 七 章
用Excel计算期望值的操作步骤如下:

(1)将表7-2中的观察值数据输入Excel,选中B10单元格,输入“=ROUND($E3*


B$6/$E$6,0)”,如图7-1所示。

(2)选中B10单元格,将鼠标放在右下角,出现“+”时,向右拉至D10处。



2
CONTENTS PAGE
列联表
2 统计量 与 2 检验
列联表中的 相关测量
第一节
第二节
第三节



3
CONTENTS PAGE
列联表
2 统计量 与 2 检验
列联表中的 相关测量
第一节
第二节
第三节



4
第一节 列联表
第 七 章
一、列联表的构造

联 分
列联表是由两个以上的变量进行交叉分类的频数分布表。例如,要分析收入情
表7-6是一个简化的 2 2 列联表,a、b、c、d均为观察频数。
16
第三节 列联表中的相关测量
第 七 章

由表7-6中的数据,可计算出a、b、c、d对应的期望频数分别为:
联 分 析
接近程度。两者越接近,即 | fij eij | 越小,计算出来的 2 值越小;反之,| fij eij |越大,计
算出来的 2 值越大。
11
第二节 2 统计量与 2 检验



运用 分布进行假设检验,需要确定 2分布的自由度。在RC 的列联表中,若 R 1,
列 则自由度为 C 1 ;若 C 1 ,则自由度为 R 1 ;当 R 2 且 C 2 时,自由度
的有210人,10~20万的有185人,20万以上的有105人,我们把每一行的总数称为行边缘频数;
表中最下边显示了储蓄率情况变量的总数,如10%以下的有172人,10%~30%的有171人,
30%以上的有157人,我们把每一列的总数称为列边缘频数。
列联表所表现的就是变量Y在变量X条件下的分布,或是变量X在变量Y条件下的分布,因此
列联表
2 统计量 与 2 检验
列联表中的 相关测量
第一节
第二节
第三节



15
第三节 列联表中的相关测量
第 七
章 一、 相关系数

联 分
相关系数是描述 2 2 列联表数据相关程度最常用的一种相关系数。对于 2 2 列联表,

相关系数的值在0~1之间,其计算公式为:
2 / n (7-3)
析 若用 fij 表示观察值频数,用 eij 表示期望值频数,则 2 统计量的计算公式为:
r
2
c ( fijeij )2
i1 j 1
eij
(7-2)
2 统计量具有以下特征:① 2 0 ,因为它是对平方值结果的汇总。② 2 值的大小与 观察值和期望值的配对数即 RC 的多少有关。RC 越多,在不改变分布的情况下, 2 值越大,因此, 2 统计量的分布与自由度有关。③ 2 统计量描述了观察值与期望值的

况和储蓄率的关系,随机调查了500个储户,年收入分为10万以下、10~20万、
20万以上,储蓄率分为低于10%、10%~30%、30%以上,得到列联表7-2。
5
第一节 列联表
第 七 章
二、列联表的分布

联 分
(一) 观察值的分布

表7-2就是一个简单的观察值的分布。表中最右边显示了收入情况变量的总数,如10万以下
第七章 列联分析
CONTENTS PAGE
美国税收制度公正吗?
引导案例
根据美国一家网站的调查发现,认为美国税收制度不公正的公民的收入、年龄、教育水平并
不相同。在2006年4月对1 005人进行的调查中,该网站提出,60%的美国人认为税收制度不公
正,而薪资高于5万美元的人群中,有超过60%的人认为税收制度不公正,具体数据如表7-1所示。
(3)选中B10、C10和D10单元格,将鼠标移动到D10的右下角,出现“+”时,向下拉至
D12处。
9
CONTENTS PAGE
列联表
2 统计量 与 2 检验
列联表中的 相关测量
第一节
第二节
第三节



10
第二节 2 统计量与 2 检验
第 七
章 一、 2 统计量



统计量可用于变量间的拟合优度和独立性检验,测定两个分类变量之间的相关程度。
从上述数据可知,收入低于5万美元的美国人中有55.44%认为美国税收制度不公正,而收入
高于5万美元的美国人中有64%认为美国税收制度不公正,那么这两个收入阶层的美国人对美国
税收制度的认同比例是否一致?要解决这个问题,可以使用列联分析方法。经 2检验发现,这两
个收入阶层的美国人对美国税收制度的认同比例显然是不一致的。
又把列联表中的观察值分布称为条件分布,每个具体的观察值就是条件频数。例如,收入在10
万以下的人中,储蓄率在10%以下的有15人,就是一个条件频数。
6
第一节 列联表
第 七
章 (二) 百分比的分布
列 联
条件频数反映了数据的分布,但不适合进行对比。为了能在相同的基数上比较,使列联表中
分 析
的数据提供更多的信息,可以计算相应的百分比。表7-3就是一个列联表的百分比分布。
优度检验是对多个总体比例是否等于其期望概率的检验;独立性检验是判断两组或多组
资料是否相互关联,如果不相互关联,就称为独立。例如,储户的收入水平和储蓄率是
否存在关系,对父母的孝敬程度是否与孩子性别有关等。
13
第二节 2 统计量与 2 检验
第 七 章 列 联 分 析
14
CONTENTS PAGE
7
第一节 列联表
第 七
章 (三) 期望值的分布
列 联
在实际分析中,我们还需要期望值的分布。假定行变量和列变量是独立的,一个观察频数的
分 析
期望频数 eij 是总频数的个数n乘以该观察频数 fij 落入第i行和第j列的概率,即
eij
n ri cj nn
ric j n
(7-1)
根据式(7-1)可知,期望频数等于观察频数 fij 对应的行合计数 ri 乘以列合计数 c j 除以
相关文档
最新文档