贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第九章至第十一章【圣才出品】

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第9章分类数据分析
9.1考点归纳
【知识框架】
【考点提示】
(1)χ2统计量的计算公式及应用(计算题考点);
(2)拟合优度检验(一个分类变量)和独立性检验(两个分类变量)(简答题、计算题考点);
(3)列联表中的相关测量:三个系数的计算公式、特点及应用(选择题、简答题、计算题考点)。

【核心考点】
考点一:χ2统计量
(1)χ2统计量计算公式
22()o e e
f f f χ-=∑f o 表示观察值频数,用f e 表示期望值频数。

(2)χ2统计量的特征
①χ2≥0;
②χ2统计量的分布与自由度有关;
③χ2统计量描述了观察值与期望值的接近程度。

(3)χ2分布与自由度的关系
χ2分布随着自由度的增加而向右倾斜,且逐渐趋近于对称的正态分布。

考点二:列联表中的相关测量
表9-1列联表的测量指标
【真题精选】
当列联表中的两个变量相互独立时,计算的相关系数c()。

[中国海洋大学2018研]
A.等于1
B.大于1
C.等于0
D.小于0
【答案】C
【解析】两个随机变量独立,则这两个随机变量不相关,反之不成立。

9.2课后习题详解
一、思考题
1.简述列联表的构造与列联表的分布。

答:(1)列联表的构造:列联表是将两个以上的变量进行交叉分类的频数分布表。

(2)列联表的分布:列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。

2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。

答:(1)构造列联表:对三个生产厂甲、乙、丙提供的学习机的A、B、C三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。

抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。

表9-2
(2)提出检验问题
根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。

(3)进行检验
建立假设:H0:次品类型与厂家生产是独立的;H1:次品类型与厂家生产不是独立的。

可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。

表9-3各组的期望值计算表
所以χ2=(20-17)2/17+(40-33)2/33+…+(70-58)2/58=9.821。

而自由度等于(R-1)(C-1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得χ0.012(4)=13.277。

由于χ2=9.821<χ20.01(4)=13.277,故接受原假设H 0,即次品类型与厂家生产是独立的。

3.说明计算χ2统计量的步骤。

答:χ2检验是利用随机样本对总体分布与某种特定分布拟合程度的检验,即检验观察值与理论值之间的紧密程度。

χ2统计量可以对分类数据做拟合优度检验和独立性检验,可以用于测定两个分类变量之间的相关程度。

计算χ2统计量的步骤:
(1)用观察值f o 减去期望值f e ;
(2)将(f o -f e )之差平方;
(3)将平方结果(f o -f e )2除以f e ;
(4)将步骤(3)的结果加总,即得:
22()o e e
f f f χ-=∑4.简述φ系数、c 系数、V 系数的各自特点。

答:(1)φ系数的特点
φ相关系数是描述2×2列联表数据相关程度最常用的一种相关系数。

它的计算公式为:
2/n
ϕχ=式中,
22()o e e
f f f χ-=∑n 为列联表中的总频数,即样本量。

φ系数适合2×2列联表,因为对于2×2列联表中的数据,计算出的φ系数可以控制在0~1这个范围。

当列联表R×C 中的行数R 或列数C 大于2时,φ系数将随着R 或C 的变大而增大,且φ值没有上限。

这时用φ系数测定两个变量的相关程度就不够清晰,可以采用列联相关系数。

(2)c 系数的特点
列联相关系数又称列联系数,简称c 系数,主要用于大于2×2列联表的情况。

c 系数的计算公式为:
22c n
χχ=+当列联表中的两个变量相互独立时,系数c=0,但它不可能大于1。

c 系数可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。

c 系数的局限性:两个列联表中行数和列数不一致时,根据不同的行和列计算的列联系数不便于比较。

但c 系数计算简便,且对总体的分布没有要求,因此c 系数是一种适应性较广的测度值。

(3)V 系数的特点
V 系数的计算公式为:。

相关文档
最新文档