贾俊平《统计学》(第7版)考研真题与典型题详解第9章~第10章【圣才出品】

合集下载

贾俊平统计学第7版课后习题答案

贾俊平的《统计学》是一本经典的统计学优秀教材。作为该教材的学习辅导书，本书具有以下几个方面的特点：
1．针对性强，解决难点。精选人大、中央财大等名校统计学院的初试和复试的考研真题，既注重基础知识的掌握，又对一些难题、易错题目给出了详细的解析。本书特别适用于参加研究生入学考试和复试指定考研参考书目为贾俊平主编的《统计学》的考生。
贾俊平《统计学》课后习题答案在线阅读：https:///cUb7v8DC
编著的。该书基本遵循贾俊平的《统计学》（第 7 版）的章目编排，共分 14 章，精选了 40 余所高校近年的考研真题，并提供了详细的参考答案。目录第 1 章导论第 2 章数据的搜集第 3 章数据的图表展示第 4 章数据的概括性度量第 5 章概率与概率分布第 6 章统计量及其抽样分布第 7 章参数估计第 8 章假设检验第 9 章分类数据分析第 10 章方差分析第 11 章一元线性回归第 12 章多元线性回归第 13 章时间序列分析和预测第 14 章指数
贾俊平《统计学》课后习题答案在线阅读：https:///cUb7v8DC
【解析】数据的测量尺度有四种：①分类尺度，即名义尺度。按照事物的某种属性对其进行平行的分类，数据表现为类别，如“性别”。②顺序尺度。对事物类别顺序的测度，数据表现为有序的类别，如“产品登记”“受教育程度”。③差距尺度。对事物类别或次序之间间距的测度，没有绝对零点，数据表现为数字。④比例尺度。对事物类别或次序之间间距的测度，有绝对零点，数据表现为数字。 8 以下关于参数和统计量的说法正确的是（）。[中央财经大学 2011 研] A．总体参数是随机变量 B．样本统计量都是总体参数的无偏估计量 C．对一个总体参数进行估计时，统计量的表达式是唯一的 D．样本统计量是随机变量【答案】D 【解析】参数是用来描述总体特征的概括性数字度量，研究者所关心的参数通常有总体平均数、总体标准差、总体比例等，由于总体数据通常是不知道的，所以参数是一个未知的常数。无偏性是指估计量抽样分布的数学期望等于被估计的总体参数，并非所有的估计量都具有无偏性。对总体参数进行估计时，用不同估计方法得到的估计量可能不同。统计量是根据样本数据计算出来的一个量，由于抽样是随机的，因此统计量是样本的函数，是随机变量。 9 以下哪一种情形涉及定性数据的收集？（）[中山大学 2012 研] A．质量控制工程师测量电灯泡的寿命 B．社会学家通过抽样调查来估计广州市市民的平均年收入 C．运动器材厂家在区分各大俱乐部棒球选手是左撇子还是右撇子时做的调查 D．婚礼策划公司通过抽样调查来估计上海市市民举办婚礼的平均开销【答案】C

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第7章参数估计)【圣才出品】

第7章参数估计7.1 考点归纳【知识框架】【考点提示】（1）置信区间的含义理解（选择题、简答题考点）；（2）估计量的三个评价标准（判断题、填空题、简答题考点）；（3）区间估计的步骤（简答题考点）、总体参数的区间估计选择恰当的统计量（计算题考点）；（4）必要样本容量的影响因素、计算（简答题、计算题考点）。

【核心考点】考点一：参数估计的基本原理1．置信区间（1）置信水平为95%的置信区间的含义：用某种方法构造的所有区间中有95%的区间包含总体参数的真值。

（2）置信度愈高（即估计的可靠性愈高），则置信区间相应也愈宽（即估计准确性愈低）。

（3）置信区间的特点：置信区间受样本影响，具有随机性，总体参数的真值是固定的。

一个特定的置信区间“总是包含”或“绝对不包含”参数的真值，不存在“以多大的概率包含总体参数”的问题。

2．评价估计量的标准（1）无偏性：估计量抽样分布的期望值等于被估计的总体参数，即E（θ∧）＝θ。

（2）有效性：估计量的方差尽可能小。

（3）一致性：随着样本量的增大，估计量的值越来越接近被估计总体的参数。

【提示】本考点常见考查方式：①直接考查置信水平为95%的置信区间的含义；②置信度、估计可靠性、置信区间的关系及应用；③置信区间的特点；④给出估计量的具体含义，判断体现了什么标准；⑤直接回答估计量的三个评价标准及具体含义（简答题）。

考点二：一个总体参数的区间估计表7-1 一个总体参数的区间估计【总结】一个总体参数的估计及所使用的分布见图7-1：图7-1 一个总体参数的估计及所使用的分布【真题精选】设总体X～N（μ，σ2），σ2已知，样本容量和置信水平固定，对不同的样本观测值，μ的置信区间的长度（）。

[对外经济贸易大学2018研]A．变长B ．变短C ．保持不变D ．不能确定【答案】C【解析】在正态总体方差已知的条件下，μ的置信区间为/2x z ±ασ所以置信区间长度为/22Z α，当样本容量和置信水平固定时，置信区间长度保持不变。

贾俊平《统计学》课后习题及详解(方差分析)【圣才出品】

第10章方差分析一、思考题1．什么是方差分析？它研究的是什么？答：方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。

方差分析是检验多个总体均值是否相等的统计方法，但本质上它所研究的是分类型自变量对数值型因变量的影响，例如，变量之间有没有关系、关系的强度如何等。

2．要检验多个总体均值是否相等时，为什么不作两两比较，而用方差分析方法？答：方差分析不仅可以提高检验的效率，同时由于它是将所有的样本信息结合在一起，也增加了分析的可靠性。

检验多个总体均值是否相等时，如果作两两比较，则需要进行多次的t检验。

随着增加个体显著性检验的次数，偶然因素导致差别的可能性也会增加（并非均值真的存在差别）。

而方差分析方法则是同时考虑所有的样本，因此排除了错误累积的概率，从而避免拒绝一个真实的原假设。

3．方差分析包括哪些类型？它们有何区别？答：（1）根据所分析的分类自变量的多少，方差分析可分为单因素方差分析和双因素方差分析。

（2）区别：①单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响；②双因素方差分析研究的是两个分类变量对数值型因变量的影响。

4．方差分析中有哪些基本假定？答：方差分析中有三个基本假定：（1）每个总体都应服从正态分布。

也就是说，对于因素的每一个水平，其观测值是来自正态分布总体的简单随机样本。

（2）各个总体的方差σ2必须相同。

也就是说，对于各组观察数据，是从具有相同方差的正态总体中抽取的。

（3）观测值是独立的。

5．简述方差分析的基本思想。

答：方差分析的基本思想：通过分析研究中不同来源的变异对总变异的贡献大小，从而确定可控因素对研究结果影响力的大小。

6．解释因子和处理的含义。

答：在方差分析中，所要检验的对象称为因素或因子；因素的不同表现称为水平或处理。

例如：要分析行业（零售业、旅游业、航空公司、家电制造业）对投诉次数是否有显著影响，则这里的“行业”是要检验的对象，称其为“因素”或“因子”；零售业、旅游业、航空公司、家电制造业是“行业”这一因素的不同表现，称其为“水平”或“处理”。

贾俊平《统计学》章节题库(假设检验)详解【圣才出品】

A．H0：μ＝100，H1：μ≠100 B．H0：μ≤100，H1：μ＞100 C．H0：μ≥100，H1：μ＜100 D．H0：μ＞100，H1：μ≤100 【答案】B
3 / 58
圣才电子书十万种考研考证电子书、题库视频学习平台

【解析】通常把观察现象原来固有的性质戒没有充分证据丌能轻易否定的命题设为原假设；通常把该观察现象新的性质戒丌能轻易肯定的结论设为备择假设。题中，实际统计的日销售量为 99.32 吨，即无法轻易肯定广告可使每天的销售量达到 100 吨，则原假设和备择
8．超人电池制造商宣称他所制造的电池可使用超过 330 小时，为检验这一说法是否属实，研究人员从中抽叏了 12 个电池迚行测试，建立的原假设和备择假设为 H0：μ≤330， H1：μ＞330。检验结果是没有拒绝原假设，这表明（）。[浙江工商大学 2011 研；安徽财经大学 2012 研]
A．有充分证据证明电池的使用导命小亍 330 小时 B．电池的使用导命小亍等亍 330 小时 C．没有充分证据表明电池的使用导命超过 330 小时
假设应该为： H0 : μ 100 ， H1 : μ 100
7．在假设检验中，两个总体 X～N（μ1，σ12），Y～N（μ2，σ22），其中 μ1，μ2 未知，检验 σ21 是否等亍 σ22 应用（）。[浙江工商大学 2011 研]
A．μ 检验法 B．t 检验法 C．F 检验法 D．χ2 检验法【答案】C 【解析】在两个正态总体条件下，样本方差除以总体方差乊比服从 F 分布，所以检验两个总体方差是否相等，应用 F 检验法。
A．B 公叵交货日期比 A 公叵短 B．B 公叵交货日期比 A 公叵长 C．B 公叵交货日期丌比 A 公叵短 D．B 公叵交货日期丌比 A 公叵长【答案】C 【解析】通常把研究者要证明的结论作为备择假设。由亍海山集团倾向亍向 B 公叵订货，故备择假设应为 B 公叵交货日期比 A 公叵短；而原假设不备择假设互斥，故原假设为 B 公叵交货日期丌比 A 公叵短。

贾俊平《统计学》复习笔记课后习题详解及典型题详解(参数估计)【圣才出品】

2．点估计与区间估计（1）点估计
∧
定义：点估计是用样本统计量θ的某个取值直接作为总体参数 θ 的估计值。局限性：一个点估计值的可靠性是由它的抽样标准误差来衡量的，这表明一个具体的点估计值无法给出估计的可靠性的度量，因此不能完全依赖于一个点估计值，而应围绕点估计值构造总体参数的一个区间。（2）区间估计区间估计的基本思想：在点估计的基础上，给出总体参数估计的一个区间范围，该区间通常由样本统计量加减估计误差得到。进行区间估计时，根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量。置信区间：在区间估计中，由样本统计量所构造的总体参数的估计区间。
著性水平表示区间估计的不可靠概率。置信度愈大（即估计的可靠性愈大），则置信区间相
应也愈大（即估计准确性愈小）。
3．评价估计量的标准
2 / 57
圣才电子书

（1）无偏性
十万种考研考证电子书、题库视频学习平台
指估计量抽样分布的数学期望等于被估计的总体参数。
∧
∧
∧
设总体参数为 θ，所选择的估计量为θ，若有 E（θ）＝θ，则称θ为 θ 的无偏估计量。
1 / 57
圣才电子书十万种考研考证电子书、题库视频学习平台

置信下限：置信区间的最小值。
置信上限：置信区间的最大值。
置信水平（也称为置信度或置信系数）：将构造置信区间的步骤重复多次，置信区间中
包含总体参数真值的次数所占的比例。
∧
∧
区间估计的数学定义：若用两个统计量θ1（x1，x2，…，xn）和θ2（x1，x2，…，xn）
存在“可能包含”或“可能不包含”的问题。
③在实际问题中，进行估计时往往只抽取一个样本，此时所构造的是与该样本相联系的

贾俊平《统计学》配套题库【课后习题】详解第9章~第10章【圣才出品】

第9章分类数据分析一、思考题1．简述列联表的构造与列联表的分布。

答：列联表是由两个以上的变量进行交叉分类的频数分布表。

列联表的分布可以从两个方面看，一个是观察值的分布，又称为条件分布，每个具体的观察值就是条件频数；一个是期望值的分布。

2．用一张报纸、一份杂志或你周围的例子构造一个列联表，说明这个调查中两个分类变量的关系，并提出进行检验的问题。

答：对三个生产厂甲、乙、丙提供的学习机的A、B、C 三种性能进行质量检验，欲了解生产厂家同学习机性能的质量差异是否有关系。

抽查了450部学习机次品，整理成为如表9-2所示的3×3列联表。

表9-2A B C 总计甲乙丙204015459065357070100200150总计75200175450根据抽查检验的数据表明：次品类型与厂家（即哪一个厂）生产是无关的（即是相互独立的）。

建立假设：H 0：次品类型与厂家生产是独立的，H 1：次品类型与厂家生产不是独立的。

次品类型生产厂可以计算各组的期望值，如表9-3所示（表中括号内的数值为期望值）。

表9-3各组的期望值计算表A B C 总计甲乙丙20（17）40（33）15（25）45（44）90（89）65（67）35（39）70（78）70（58）100200150总计75200175450所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。

而自由度等于（R －1）（C －1）=（3－1）×（3－1）=4，若以0.01的显著性水平进行检验，查χ2分布表得20.01(4)13.277χ=。

由于220.019.821(4)13.277χχ=<=，故接受原假设H 0，即次品类型与厂家生产是独立的。

3．说明计算2χ统计量的步骤。

答：计算2χ统计量的步骤：（1）用观察值o f 减去期望值e f ；（2）将（o f －e f ）之差平方；（3）将平方结果2)(e o f f -除以e f ；（4）将步骤（3）的结果加总，即得：22()o e ef f f χ-=∑。

贾俊平的《统计学》(第7版)学习辅导书-章节题库(指数)【圣才出品】

第14章指数一、单项选择题1．某种商品销售额增长了5%，商品零售价格增长2%，则商品销售量增长（）。

[中央财经大学2015研]A．7%B．10%C．2.94%D．3%【答案】C【解析】销售额指数＝销售量指数×销售价格指数，故销售量指数＝（1＋5%）/（1＋2%）＝102.94%，则销售量增长率＝销售量指数－100%＝2.94%。

2．我国的商品零售价格指数是采用（）方法编制的。

[中央财经大学2015研] A．固定权数加权算术平均指数B．固定权数加权调和平均指数C．数量指标综合指数D．质量指标综合指数【答案】A【解析】商品零售价格指数是指反映一定时期内商品零售价格变动趋势和变动程度的相对数。

我国商品零售价格指数采用固定权数的加权算术平均公式计算；又由于权数直接影响指数的可靠性，因此每年要根据居民家庭收支调查的资料调整一次权数。

3．某种产品报告期与基期比较产量增长26%，单位成本下降32%，则生产费用支出总额为基期的（）。

[厦门大学2014研]A．166.32%B．85.68%C．185%D．54%【答案】B【解析】生产费用总额指数＝产量指数×单位成本指数＝（1＋26%）×（1－32%）＝85.68%，即生产费用支出总额为基期的85.68%。

4．Q为销售量，P为价格，当∑Q0P0＝120万元，∑Q1P1＝165万元，∑Q1P0＝135万元，∑Q0P1＝140万元时，按一般原则计算的销售量总指数是（）。

[中央财经大学2012研]A．112.5%B．116.7%C．117.9%D．122.2%【答案】A【解析】销售量总指数通常以基期价格为同度量因素，故销售量总指数＝∑Q1P0/∑Q0P0＝135/120＝112.5%。

5．把数据中的每个数值减去最小值然后除以极差是一种常用的数据预处理方法。

对于经过这一变换之后的数据，以下说法不正确的是（）。

[中央财经大学2011研] A．服从正态分布B．没有计量单位C．取值在0和1之间D．是相对数【答案】A【解析】经题干中的方法处理后，数据保持原分布不变，而原分布不一定是正态分布。

贾俊平《统计学》考研真题(含复试)与典型习题详解(数据的概括性度量)【圣才出品】

2．统计学期中考试非常简单，为了评估简单程度，教师记录了 9 名学生交上考试试卷
的时间如下（分钟）
33 29
45 60 42 19 52 38 36[东北财经大学
2012 研]
（1）这些数据的极差为（）。
A．3.00
B．-3.00
C．41.00
D．-41.00
【答案】C
【解析】数据按从小到大排序结果如下：
A．0.38
B．0.40
C．0.54
D．2.48
【答案】A
【解析】离散系数也称为变异系数，它是一组数据的标准差与其相应的平均数之比。其
计算公式为： vs
s x
。得到 vs
22.85 0.38 。 12.45
9．已知某工厂生产的某零件的平均厚度是 2 厘米，标准差是 0.25 厘米。如果已知该厂生产的零件厚度为正态分布，可以判断厚度在 1.5 厘米到 2.5 厘米之间的零件大约占（）。[浙江工商大学 2011 研]
圣才电子书十万种考研考证电子书、题库视频学习平台

5．随机变量 X 的方差为 2，随机变量 Y=2X，那么 y 的方差是( )。[中央财经大学 2011 研]
A．1 B．2 C．4 D．8 【答案】D
【解析】Var(cX ) c2Var(X ) 22 2 8
7．设 X1，X2，…，X n 为随机样本，则哪个统计量能较好地反映样本值的分散程度（）。
[中山大学 2012 研] A．样本平均 B．样本中位数 C．样子书

【答案】C
十万种考研考证电子书、题库视频学习平台
【解析】集中趋势是指一组数据向某一中心值靠拢的程度，它反映了一组数据中心

贾俊平《统计学》复习笔记课后习题详解及典型题详解第9章~第10章【圣才出品】

第9章分类数据分析9.1复习笔记一、分类数据与χ2统计量1．分类数据按照所采用的计量尺度不同，可以将统计数据分为分类数据、顺序数据和数值型数据。

分类数据和顺序数据都是只能归于某一类别的非数字型数据，它们是对事物进行分类的结果，其结果均表现为类别，用文字来表述，不过顺序数据的类别是有序的；数值型数据是按数字尺度测量的观测值，其结果表现为具体的数值。

分类数据是对事物进行分类的结果，其特征是，调查结果虽然用数值表示，但不同数值描述了调查对象的不同特征。

数值型数据可以转化为分类数据。

分类数据的结果是频数，χ2检验是对分类数据的频数进行分析的统计方法。

2．χ2统计量χ2统计量可以对分类数据做拟合优度检验和独立性检验，可以用于测定两个分类变量之间的相关程度。

若用f o 表示观察值频数，用f e 表示期望值频数，则χ2统计量可以写为：22()o e e f f f χ-=∑χ2检验：χ2检验是利用随机样本对总体分布与某种特定分布拟合程度的检验，也就是检验观察值与理论值之间的紧密程度。

χ2检验主要用于拟合优度检验和独立性检验。

（1）χ2统计量的特征①χ2≥0，因为它是对平方值结果的汇总；②χ2统计量的分布与自由度有关；③χ2统计量描述了观察值与期望值的接近程度。

两者越接近，即f o－f e的绝对值越小，计算出的χ2值越小；反之，f o－f e的绝对值越大，计算出的χ2值也越大。

χ2检验正是通过对χ2的计算结果与χ2分布中的临界值进行比较，做出是否拒绝原假设的统计决策。

（2）χ2分布与自由度的密切关系自由度越小，χ2的分布就越向左边倾斜；随着自由度的增加，χ2分布的偏斜程度趋于缓解，逐渐显露出对称性，随着自由度的继续增大，χ2分布将趋近于对称的正态分布。

（3）应用χ2检验统计量的注意事项①各组的理论频数f e不得小于总频数n；②总频数应较大，至少大于50；③如果某组理论频数小于5，可将相邻的若干组合并，直至理论频数大于5为止；④倘若有两个以上的单元，如果20%的单元期望频数f e小于5，则不能应用χ2检验。

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第11章一元线性回归)【圣才出品】

第11章一元线性回归11.1 考点归纳【知识框架】【考点提示】（1）变量间关系的度量，包括相关系数的计算公式、性质，相关关系的显著性检验（简答题、计算题考点）；（2）一元线性回归，包括回归模型的假定（简答题考点），回归方程、估计的回归方程的建立（选择题、计算题考点）；（3）最小二乘法的含义、性质，回归系数的计算（选择题、简答题、计算题考点）；（4）回归直线的拟合优度及显著性检验（计算题考点）；（5）点估计和区间估计，包括置信区间和预测区间（判断题、计算题考点）。

【核心考点】考点一：变量间关系的度量1．相关系数（线性相关系数，或Pearson 相关系数）总体相关系数ρ，样本相关系数r 。

（1）计算公式n xy x y r ∑-∑∑=（2）性质 ①r 的取值范围为－1≤r≤1。

|r|→1说明两个变量之间的线性关系越强。

②r 具有对称性，即r xy ＝r yx 。

③r 取值大小与x 和y 的原点及尺度无关。

④r 仅用于度量线性关系，不能用于描述非线性关系⑤r 只是度量数量关系，但不意味着因果关系。

⑥r 取值可以解释两个变量之间的相关程度。

但需要先对相关系数的显著性进行检验。

【真题精选】如果变量X 与变量Y 之间的相关系数为0，说明这两个变量之间是（）。

[浙江财经大学2019研]A ．完全相关关系B ．完全不相关C ．没有线性关系D ．低度相关关系【答案】C 【解析】相关系数r 仅仅是变量X 与Y 之间线性关系的一个度量，r ＝0只表示两个变量之间不存在线性相关关系，并不说明变量之间没有任何关系，它们之间可能存在非线性相关关系。

因此当r ＝0或很小时，不能轻易得出两个变量之间不存在相关关系的结论，而应结合散点图作出合理的解释。

2．相关关系的显著性检验——t 检验（小样本或大样本）检验的统计量(2)t r t n =-若|t|＞t α/2，则拒绝原假设H 0，表明总体的两个变量之间存在显著的线性关系。

贾俊平《统计学》章节题库(含考研真题)(数据的图表展示)【圣才出品】

2．下面哪个方图 B．茎叶图 C．条形图 D．箱线图【答案】B
1 / 33
圣才电子书十万种考研考证电子书、题库视频学习平台

【解析】茎叶图是保留并反映原始数据分布的图形，它由茎和叶两部分构成，其图形是由数字组成的。ACD 三项都需要对原始数据进行处理，求得一些测度值之后再作出图形。
8．对于 100 名学生某一门课程的成绩，若想得到四分之一分位数、中位数与四分之三分位数，以下哪种描述统计的办法更有效？（）[中山大学 2012 研]
A．直方图 B．茎叶图 C．饼图 D．点图
4 / 33
圣才电子书

【答案】B
十万种考研考证电子书、题库视频学习平台
12．饼图的主要用途是（）。 A．反映一个样本或总体的结构 B．比较多个总体的构成 C．反映一组数据的分布 D．比较多个样本的相似性【答案】A 【解析】饼图是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个样本（或总体）中各组成部分的数据占全部数据的比例，对于研究结构性问题十分有用。
【解析】直方图、饼图描述的数值型数据是分组数据，而茎叶图描述的是未分组的数值
型数据，点图描述的是两个变量之间的关系。茎叶图保留了原始数据的信息，可以计算其分
位数。
9．某外商投资企业按工资水平分为四组：1000 元以下，1000～1500 元；1500～2000 元；2000 元以上。第一组和第四组的组中值分别为（）。[首经贸 2009 研]
圣才电子书十万种考研考证电子书、题库视频学习平台

第 3 章数据的图表展示
一、单项选择题 1．对于大批量的数据，最适合描述其分布的图形是（）。[中国海洋大学 2018 研] A．条形图 B．茎叶图 C．直方图 D．饼图【答案】C 【解析】在应用方面，直方图通常适用于大批量数据，茎叶图通常适用于小批量数据。条形图是用宽度相同的条形的高度或长短来表示数据多少的图形；饼图是用圆形及圆内扇形的角度来表示数值大小的图形，它主要用于表示一个样本（或总体）中各组成部分的数据占全部数据的比例。

贾俊平的《统计学》(第7版)学习辅导书-章节题库(方差分析)【圣才出品】

9．关亍单因素方差分析中的 F 检验（）。[中央财经大学 2011 研] A．拒绝域在 F 分布曲线的右侧 B．F 统计量的样本观测值可能为负值 C．拒绝域在 F 分布曲线的左侧和右侧 D．以上表述都丌对【答案】A 【解析】在单因素方差分析中，若 F＞Fα，则拒绝原假设；若 F＜Fα，则丌拒绝原假设。

【解析】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。如果分析数据来自相同总体，那么在组间误差中只包含随机误差，而没有系统误差。反之，如果分析数据来自丌同总体，在组间误差中除了包含随机误差外，还会包含系统误差。另外，方差分析要求每个总体都应服从正态分布。
10．关亍方差分析，以下说法哪一项更合理？（）[中山大学 2012 研] A．方差分析的目的是分析各组总体方差是否有显著差异 B．方差分析的目的是分析各组总体标准差是否有显著差异 C．方差分析的目的是分析各组总体均值是否有显著差异 D．方差分析的目的是分析各组总体中位数是否有显著差异【答案】C 【解析】表面上看，方差分析是检验多个总体均值是否相等的统计方法，但本质上它所研究的是分类型自变量对数值型因变量的影响。即方差分析是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
4．在方差分析中总变差可以分解为组内变差和组间变差，其中组间变差表示（）。 [厦门大学 2014 研]
A．一样本观测值不均值差方和 B．全部样本观测值不总均值的差方和 C．各样本观测值不各自均值的差方和 D．各样本均值不总均值的差方和【答案】D
＿
【解析】方差分析中组间平方和记为 SSA，它是各组均值xi（i＝1，2，…，k）不总均值 x 的误差平方和，反映组间误差的大小。
2．下面关亍方差学 2015 研]

贾俊平《统计学》章节题库(分类数据分析)【圣才出品】

观察值
105
78
期望值
102
8l
根据这个列联表计算的 Χ2 统计量为（）。
A．0.6176
B．1.6176
C．0.3088
D．1.3088
【答案】A
【解析】 2 f0 fe 2 45 482 42 392 105 1022 78 812
87
反对
105
78
183
合计
150
120
270
这个列联表的最下边一行称为( )。
A．列边缘频数
B．行边缘频数
3 / 25
圣才电子书

C．条件频数
十万种考研考证电子书、题库视频学习平台
D．总频数
【答案】A
7．一所大学准备采取一项学生在宿舍上网收费的措施，为了解男女学生对这一措施的
2．设 R 为列联表的行数，C 为列联表的列数，则 Χ2 分布的自由度为（）。 A．R B．C C．R×C D．(R-1)×(C-1) 【答案】D
【解析】 2 检验的自由度=（行数－1）（列数－1）=（R－1）（C－1）。
1 / 25
圣才电子书十万种考研考证电子书、题库视频学习平台

看法，分别抽取了 150 名男学生和 120 名女学生进行调查，得到的结果如下：
男学生
女学生
合计
赞成
45
42
87
反对
105
78
183
合计
150
120
270
根据这个列联表计算的赞成上网收费的行百分比分别为( )。
A．51.7％和 48.3％
B．57.4％和 42.6％
C．30％和 70％
D．35％和 65％

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第九章至第十一章【圣才出品】

第9章分类数据分析9.1考点归纳【知识框架】【考点提示】（1）χ2统计量的计算公式及应用（计算题考点）；（2）拟合优度检验（一个分类变量）和独立性检验（两个分类变量）（简答题、计算题考点）；（3）列联表中的相关测量：三个系数的计算公式、特点及应用（选择题、简答题、计算题考点）。

【核心考点】考点一：χ2统计量（1）χ2统计量计算公式22()o e ef f f χ-=∑f o 表示观察值频数，用f e 表示期望值频数。

（2）χ2统计量的特征①χ2≥0；②χ2统计量的分布与自由度有关；③χ2统计量描述了观察值与期望值的接近程度。

（3）χ2分布与自由度的关系χ2分布随着自由度的增加而向右倾斜，且逐渐趋近于对称的正态分布。

考点二：列联表中的相关测量表9-1列联表的测量指标【真题精选】当列联表中的两个变量相互独立时，计算的相关系数c（）。

[中国海洋大学2018研]A．等于1B．大于1C．等于0D．小于0【答案】C【解析】两个随机变量独立，则这两个随机变量不相关，反之不成立。

9.2课后习题详解一、思考题1．简述列联表的构造与列联表的分布。

答：（1）列联表的构造：列联表是将两个以上的变量进行交叉分类的频数分布表。

（2）列联表的分布：列联表的分布可以从两个方面看，一个是观察值的分布，又称为条件分布，每个具体的观察值就是条件频数；一个是期望值的分布。

2．用一张报纸、一份杂志或你周围的例子构造一个列联表，说明这个调查中两个分类变量的关系，并提出进行检验的问题。

答：（1）构造列联表：对三个生产厂甲、乙、丙提供的学习机的A、B、C三种性能进行质量检验，欲了解生产厂家同学习机性能的质量差异是否有关系。

抽查了450部学习机次品，整理成为如表9-2所示的3×3列联表。

表9-2（2）提出检验问题根据抽查检验的数据表明：次品类型与厂家（即哪一个厂）生产是无关的（即是相互独立的）。

（3）进行检验建立假设：H0：次品类型与厂家生产是独立的；H1：次品类型与厂家生产不是独立的。

贾俊平《统计学》章节题库(含考研真题)(参数估计)【圣才出品】

近，样本标准差也与总体标准差逐渐接近，所以 S 是 σ 的一致估计。由于随机变量分布函
数形式未知，所以无法知道 S 是否是 σ 的最大似然估计，B 项错误。
1 / 51
圣才电子书十万种考研考证电子书、题库视频学习平台

2．在参数估计中，要求通过样本的统计量来估计总体参数，评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为（）。[山东大学 2015 研]
（3）欲在缩小估计区间宽度的同时，提高置信度，唯一途径为（）。 A．以样本标准差替代总体标准差 B．减少样本容量 C．以样本中位数替代样本均值
5 / 51
圣才电子书

D．增加样本容量
十万种考研考证电子书、题库视频学习平台
【答案】D
【解析】由（1）题解析中的公式可知，置信度提高，区间宽度随之扩大，要在缩小估
A．无偏性 B．有效性 C．一致性 D．充分性【答案】B 【解析】有效性是指对同一总体参数的无偏估计量，有更小标准差的估计量更有效，即估计量与总体参数的离差越小越好。
3．一项研究表明，大公司的女性管理人员与小公司的女性管理人员颇为相似。该项研究抽取了两个独立的随机样本，小公司抽取 86 名女性经理，大公司抽取 91 名女性经理，根据若干个与工作有关的变量做了比较，其中所提出的一个问题是“如果有机会的话，你是否会改变所从事的工作？”小公司的 86 名经理中有 65 人作了否定回答，大公司的 91 名经理中有 51 人作了否定回答。两组女性经理中有机会改变工作的比例之差的 95%的置信区间为（）。[山东大学 2015 研]
A．0.195±0.017 B．0.195±0.117 C．0.195±0.127 D．0.195±0.137 【答案】D

贾俊平《统计学》章节题库(含考研真题)(多元线性回归)【圣才出品】

t ˆi ~ t(n k 1)
sˆi
s∧
其中 βˆi 是回归系数βi 的抽样分布的标准差，k 为回归方程中自变量的个数。
2 / 34
圣才电子书十万种考研考证电子书、题库视频学习平台

4．多元线性回归分析中，如果 F 检验表明线性关系显著，则意味着（）。[华中农业大学 2015 研；浙江工商大学 2011 研；安徽财经大学 2012 样题]
7．进行多元线性回归时，如果回归模型中存在多重共线性，则（）。[中国海洋大学 2018 研；浙江工商大学 2011 研；安徽财经大学 2012 样题]
A．整个回归模型的线性关系不显著 B．肯定有一个回归系数通不过显著性检验 C．肯定导致某个回归系数的符号与预期的相反 D．可能导致某些回归系数通不过显著性检验【答案】D 【解析】在回归分析中存在多重共线性时将会产生某些问题：首先，变量之间高度相关时，可能会使回归的结果造成混乱，甚至会把分析引入歧途；其次，多重共线性可能对参数估计值的正负号产生影响，特别是正负号有可能同预期的正负号相反。某些重要的解释变量的回归系数 t 检验不显著而同时整个回归模型的线性关系检验显著，则通常预示着解释变量间存在多重共线性。
重判定系数记为 R2a，其计算公式为：
Ra2
1
1
R2
n 1 n k 1
，
其值可能出现负值。
2．在多元线性回归分析中，F 检验时的 F 值越大，则意味着（）。[武汉大学 2015 研]
A．随机误差的影响越大 B．相关系数 R 的值越小
9．关于多元线性回归模型的说法，正确的是（）。 A．如果模型的 R2 很高，可以认为此模型的质量较好 B．如果模型的 R2 很低，可以认为此模型的质量较差 C．如果某一参数不能通过显著性检验，应该剔除该解释变量 D．如果某一参数不能通过显著性检验，不应该随便剔除该解释变量【答案】D 【解析】当模型的解释变量间存在多重共线性时，往往会导致某些重要的解释变量的回归系数 t 检验不显著而同时回归模型却有较高的 R2 值。因此当某一变量的回归系数不能通过显著性检验时，不应该随便剔除该解释变量；同时回归模型有较高的 R2 值也不能说明该

《统计学》(贾俊平第七版)课后题及答案-统计学贾俊平第七版

第一章导论1.什么是统计学？统计学是搜集、处理、分析、解释数据并从中得出结论的科学。

2.解释描述统计与推断统计。

描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。

推断统计研究的是如何利用样本数据来推断总体特征的统计方法。

3.统计数据可分为哪几种类型？不同类型的数据各有什么特点？按照计量尺度可分为分类数据、顺序数据和数值型数据；按照数据的搜集方法，可以分为观测数据和试验数据；按照被描述的现象与实践的关系，可以分为截面数据和时间序列数据。

4.解释分类数据、顺序数据和数值型数据的含义。

分类数据是只能归于某一类别的非数字型数据；顺序数据是只能归于某一有序类别的非数字型数据；数值型数据是按照数字尺度测量的观测值，其结果表现为具体的数值。

5.举例说明总体、样本、参数、统计量、变量这几个概念。

总体是包含所研究的全部个体的集合，样本是从总体中抽取的一部分元素的集合，参数是用来描述总体特征的概括性数字度量，统计量是用来描述样本特征的概括性数字度量，变量是用来说明现象某种特征的概念。

6.变量可分为哪几类？变量可分为分类变量、顺序变量和数值型变量。

分类变量是说明书屋类别的一个名称，其取值为分类数据；顺序变量是说明十五有序类别的一个名称，其取值是顺序数据；数值型变量是说明事物数字特征的一个名称，其取值是数值型数据。

7.举例说明离散型变量和连续型变量。

离散型变量是只能去可数值的变量，它只能取有限个值，而且其取值都以整位数断开，如“产品数量”；连续性变量是可以在一个或多个区间中取任何值的变量，它的取值是连续不断的，不能一一列举，如“温度”等。

第二章数据的搜集1.什么是二手资料？使用二手资料需要注意些什么？与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。

使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。

2.比较概率抽样和非概率抽样的特点。

举例说明什么情况下适合采用概率抽样，什么情况下适合采用非概率抽样。

贾俊平《统计学》考研真题(含复试)与典型习题详解(数据的搜集)【圣才出品】

第2章数据的搜集一、单项选择题1．为了调查某校学生的购书费用支出，从各年级的学生中分别抽取100名学生，组成样本进行调查，这种抽样方法属于（）。

[浙江工商大学2011研]A．简单随机抽样B．分层抽样C．系统抽样D．整群抽样【答案】B【解析】简单随机抽样就是即使从包括N个单位的抽样框中随机地、一个个地抽取n个单位作为样本，每个单位的入样概率是相等的；分层抽样是将抽样单位按某种特征或某种规则划分为不同的层，然后从不同的层中独立、随机地抽取样本，将各层的样本结合起来，对总体的目标量进行估计；系统随机抽样也称为机械随机抽样或等距离随机抽样。

它是先将总体中各单位按一定的顺序排列，然后每隔一定的距离抽取一个单位构成样本；整群抽样又称聚类抽样，是将总体中若干个单位合并为组，这样的组称为群，抽样时直接抽取群，然后对中选群中的所有单位全部实施调查。

2．为调查在中国的省会城市和4个直辖市的居民年收入，需要从这些城市的居民中抽取一个样本，你认为以下四种抽样方式哪一种会得到更有代表性的样本?( )。

[中山大学2011研]A．简单随机抽样B．整群抽样C．系统随机抽样D．分层随机抽样【答案】D【解析】在规模较大的调查中，很少直接采用简单随机抽样，一般是把这种方法和其他抽样方法结合在一起使用；整群抽样又称聚类抽样，是将总体中若干个单位合并为组，这样的组称为群，抽样时直接抽取群，然后对中选群中的所有单位全部实施调查；系统随机抽样也称为机械随机抽样或等距离随机抽样。

它是先将总体中各单位按一定的顺序排列，然后每隔一定的距离抽取一个单位构成样本；分层抽样是将抽样单位按某种特征或某种规则划分为不同的层，然后从不同的层中独立、随机地抽取样本，分层抽样在实践中得到了广泛的应用。

3．某政府机构想尽快了解社会公众对其出台的一项政策的态度，最恰当的数据搜集方式是( )。

[中央财经大学2011研]A．面访B．深度访谈C．计算机辅助电话调查D．邮寄调查【答案】C【解析】面访即调查者直接走访被调查者，当面听取被调查者的意见。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

表 9-1 关于餐厅改革的调查结果
这个表格是（）。 A．4×3 列联表 B．3×2 列联表 C．2×3 列联表 D．3×4 列联表【答案】B 【解析】表中的行是态度变量，这里划分为三类，即赞成、中立和反对；表中的列是单位变量，这里划分为两类，即男同学和女同学，因此这个表格是 3×2 列联表。
2 / 60
圣才电子书

十万种考研考证电子书、题库视频学习平台
第 9 章分类数据分析
一、单项选择题 1．列联分析是利用列联表来研究（）。 A．两个数值型变量的关系 B．两个分类变量的关系 C．两个数值型变量的分布 D．一个分类变量和一个数值型变量的关系【答案】B 【解析】列联表是由两个或以上的变量进行交叉分类的频数分布表，列联分析是利用列联表来研究两个分类变量之间的关系。
10．某大学为了解男女毕业生对开设《职业规划》这门课程的看法，分别抽取了 500 名男学生和 500 名女学生进行调查，得到的结果如表 9-7 所示。
表 9-7 关于开设《职业规划》课子书、题库视频学习平台

如果要检验男女毕业生对开设《职业规划》这门课程的看法是否相同，即检验假设 H0： π1＝π2＝850/1000＝0.85，χ2 检验统计量的自由度是（）。
表 9-5
根据这个列联表计算的χ2 统计量的值为（）。 A．0.6176 B．1.2352 C．2.6176 D．3.2352 【答案】B 【解析】非参数检验中的χ2 拟合优度检验和可以应用于列联表的独立性检验来测定两个分类变量之间的相关程度。用 fo 表示观察值频数，用 fe 表示期望值频数，则χ2 统计量为：
4 / 60
圣才电子书十万种考研考证电子书、题库视频学习平台

【解析】赞成研究生奖学金制度改革的行百分比分别为：（90/174）×100%＝51.7%；（84/174）×100%＝48.3%。
8．某学校准备采取一项新的教师体制改革，为了解男女学生对这一措施的看法，分别抽取了 300 名男学生和 240 名女学生进行调查，得到的结果如表 9-5 所示。
表 9-6 关于教师体制改革的调查结果
如果要检验男女教师对教师体制改革的看法是否相同，提出的原假设为（）。 A．H0：π1＝π2＝35 B．H0：π1＝π2＝50 C．H0：π1＝π2＝65 D．H0：π1＝π2＝0.65 【答案】D 【解析】如果男女教师对教师体制改革的看法不存在差异，则男女教师赞成教师体制改革的比例应该是相同的（均为 65/100＝0.65）。所以提出的原假设和备择假设分别为：H0： π1＝π2＝0.65（赞成比例一致）；H1：π1≠π2（赞成比例不一致）
2．列联表中的每个变量（）。 A．只能有一个类别 B．只能有两个类别 C．对类别没有限制 D．可以有两个或两个以上的类别【答案】D 【解析】列联表是将两个以上的变量进行交叉分类的频数分布表。列联表中的每个变量都可以有两个或两个以上的类别。
3．设列联表的行数为 3，列数为 4，则χ2 检验的自由度为（）。
2 ( fo fe )2
fe
将表 9-5 中的数据代入计算得：χ2＝1.2352。
5 / 60
圣才电子书十万种考研考证电子书、题库视频学习平台

9．某学校准备采取一项新的教师体制改革，为了解男女教师对这一措施的看法，分别抽取了 50 名男教师和 50 名女教师进行调查，得到的结果如表 9-6 所示。
7．某大学为了解学生对研究生奖学金制度改革的看法，分别抽取了 300 名男研究生和 240 名女研究生进行调查，得到的结果如表 9-4 所示。
表 9-4 关于研究生奖学金制度改革的调查结果
根据这个列联表计算的赞成研究生奖学金制度改革的行百分比分别为（）。 A．51.7%；48.3% B．57.4%；42.6% C．30%；70% D．35%；65% 【答案】A
1 / 60
圣才电子书

A．3
十万种考研考证电子书、题库视频学习平台
B．4
C．6
D．12
【答案】C
【解析】列联分析中，χ2 检验的自由度＝（行数－1）（列数－1）＝（R－1）（C－1）
＝（3－1）×（4－1）＝6。
4．一所大学准备采取一项学生对餐厅改革意见的调查，为了解男女学生对这一措施的看法，分别抽取了 300 名男学生和 240 名女学生进行调查，得到的结果如表 9-1 所示。
A．1 B．2 C．3 D．4 【答案】B 【解析】χ2 统计量的自由度是（R－1）（C－1）＝（2－1）×（3－1）＝2。
11．φ相关系数是描述两个分类变量之间相关程度的一个统计量，它主要用于（）。 A．2×2 列联表数据 B．2×3 列联表数据 C．3×3 列联表数据 D．3×4 列联表数据【答案】A 【解析】φ相关系数是描述 2×2 列联表数据相关程度最常用的一种相关系数。它的计算公式为：
圣才电子书十万种考研考证电子书、题库视频学习平台

5．一所大学为了解男女学生对后勤服务质量的评价，分别抽取了 300 名男学生和 240 名女学生进行调查，得到的结果如表 9-2 所示。
表 9-2 关于后勤服务质量评价的调查结果
这个列联表的最下边一行称为（）。 A．总频数 B．条件频数 C．行边缘频数 D．列边缘频数【答案】D 【解析】本题考查列联表的构成，列联表的最下边一行称为列边缘频数；最右边一列称为行边缘频数。
6．某中学为了解教师对新课标改革的看法，分别抽取了 300 名男教师和 240 名女教师进行调查，得到的结果如表 9-3 所示。
表 9-3 关于中学新课标改革的调查结果
3 / 60
圣才电子书十万种考研考证电子书、题库视频学习平台

这个列联表的最右边一列称为（）。 A．总频数 B．条件频数 C．行边缘频数 D．列边缘频数【答案】C 【解析】本题考查列联表的构成，列联表的最下边一行称为列边缘频数；最右边一列称为行边缘频数。