贾俊平《统计学》配套题库 【课后习题】详解 第9章~第10章【圣才出品】

合集下载

贾俊平《统计学》课后习题及详解(方差分析)【圣才出品】

贾俊平《统计学》课后习题及详解(方差分析)【圣才出品】

第10章方差分析一、思考题1.什么是方差分析?它研究的是什么?答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。

方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响,例如,变量之间有没有关系、关系的强度如何等。

2.要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?答:方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。

检验多个总体均值是否相等时,如果作两两比较,则需要进行多次的t检验。

随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会增加(并非均值真的存在差别)。

而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。

3.方差分析包括哪些类型?它们有何区别?答:(1)根据所分析的分类自变量的多少,方差分析可分为单因素方差分析和双因素方差分析。

(2)区别:①单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响;②双因素方差分析研究的是两个分类变量对数值型因变量的影响。

4.方差分析中有哪些基本假定?答:方差分析中有三个基本假定:(1)每个总体都应服从正态分布。

也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本。

(2)各个总体的方差σ2必须相同。

也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的。

(3)观测值是独立的。

5.简述方差分析的基本思想。

答:方差分析的基本思想:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。

6.解释因子和处理的含义。

答:在方差分析中,所要检验的对象称为因素或因子;因素的不同表现称为水平或处理。

例如:要分析行业(零售业、旅游业、航空公司、家电制造业)对投诉次数是否有显著影响,则这里的“行业”是要检验的对象,称其为“因素”或“因子”;零售业、旅游业、航空公司、家电制造业是“行业”这一因素的不同表现,称其为“水平”或“处理”。

贾俊平《统计学》章节题库(含考研真题)(指数)【圣才出品】

贾俊平《统计学》章节题库(含考研真题)(指数)【圣才出品】
8.已知某地区 2002 年农产品收购总额为 120 亿元,2003 年比 2002 年的收购总额 增长 15%,农产品收购价格总指数为 106%。则农产品收购量增加的百分比和农民因此增 加的收入分别是( )。[中南财大 2005 研]
A.21.9%和 10.19 亿元 B.21.9%和 7.81 亿元 C.8.49%和 10.19 亿元 D.8.49%和 7.81 亿元 【答案】C 【解析】由于收购总额指数(∑p1q1/∑p0q0)=收购量指数(∑p0q1/∑p0q0)×收购价 格指数(∑p1q1/∑p0q1),收购总额指数=1+15%=115%,收购价格指数=106%,所以 收购量指数=115%/106%=108.49%。即农产品收购量增加的百分比为 8.49%,因此增加 的收入为∑p0q1-∑p0q0=108.49%×∑p0q0-∑p0q0=120×8.49%=10.19(亿元)。

对数。我国商品零售价格指数采用固定权数的加权算术平均公式计算;又由于权数直接影响 指数的可靠性,因此每年要根据居民家庭收支调查的资料调整一次权数。
3.某种产品报告期与基期比较产量增长 26%,单位成本下降 32%,则生产费用支出 总额为基期的( )。[厦门大学 2014 研]
圣才电子书 十万种考研考证电子书、题库视频学习平台

第 14 章 指 数
一、单项选择题 1.某种商品销售额增长了 5%,商品零售价格增长 2%,则商品销售量增长( )。[中 央财经大学 2015 研] A.7% B.10% C.2.94% D.3% 【答案】C 【解析】销售额指数=销售量指数×销售价格指数,故销售量指数=(1+5%)/(1+ 2%)=102.94%,则销售量增长率=销售量指数-100%=2.94%。
A.服从正态分布 B.没有计量单位 C.取值在 0 和 1 之间 D.是相对数 【答案】A 【解析】经题干中的方法处理后,数据保持原分布不变,而原分布不一定是正态分布。

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1。

1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1。

2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1。

3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据.它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的.实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1。

7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

贾俊平《统计学》(第7版)考研真题与典型题详解 第9章~第10章【圣才出品】

贾俊平《统计学》(第7版)考研真题与典型题详解 第9章~第10章【圣才出品】
表 9-1 关于餐厅改革的调查结果
这个表格是( )。 A.4×3 列联表 B.3×2 列联表 C.2×3 列联表 D.3×4 列联表 【答案】B 【解析】表中的行是态度变量,这里划分为三类,即赞成、中立和反对;表中的列是单 位变量,这里划分为两类,即男同学和女同学,因此这个表格是 3×2 列联表。
2 / 60
圣才电子书

十万种考研考证电子书、题库视频学习平台
第 9 章 分类数据分析
一、单项选择题 1.列联分析是利用列联表来研究( )。 A.两个数值型变量的关系 B.两个分类变量的关系 C.两个数值型变量的分布 D.一个分类变量和一个数值型变量的关系 【答案】B 【解析】列联表是由两个或以上的变量进行交叉分类的频数分布表,列联分析是利用列 联表来研究两个分类变量之间的关系。
10.某大学为了解男女毕业生对开设《职业规划》这门课程的看法,分别抽取了 500 名男学生和 500 名女学生进行调查,得到的结果如表 9-7 所示。
表 9-7 关于开设《职业规划》课子书、题库视频学习平台

如果要检验男女毕业生对开设《职业规划》这门课程的看法是否相同,即检验假设 H0: π1=π2=850/1000=0.85,χ2 检验统计量的自由度是( )。
表 9-5
根据这个列联表计算的χ2 统计量的值为( )。 A.0.6176 B.1.2352 C.2.6176 D.3.2352 【答案】B 【解析】非参数检验中的χ2 拟合优度检验和可以应用于列联表的独立性检验来测定两 个分类变量之间的相关程度。用 fo 表示观察值频数,用 fe 表示期望值频数,则χ2 统计量为:
4 / 60
圣才电子书 十万种考研考证电子书、题库视频学习平台

【解析】赞成研究生奖学金制度改革的行百分比分别为:(90/174)×100%=51.7%; (84/174)×100%=48.3%。

统计学(第五版)贾俊平 课后思考题和练习题答案(最终完整版)

统计学(第五版)贾俊平 课后思考题和练习题答案(最终完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)整理by__kiss-ahuang第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

贾俊平《统计学》(第5版)课后习题-第9章 分类数据分析【圣才出品】

贾俊平《统计学》(第5版)课后习题-第9章 分类数据分析【圣才出品】

第9章 分类数据分析一、思考题1.简述列联表的构造与列联表的分布。

答:列联表是由两个以上的变量进行交叉分类的频数分布表。

列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。

2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。

答:对三个生产厂甲、乙、丙提供的学习机的A、B、C三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。

抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。

表9-2根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。

建立假设:H0:次品类型与厂家生产是独立的,H1:次品类型与厂家生产不是独立的。

可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。

表9-3 各组的期望值计算表所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。

而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得20.01(4)13.277χ=。

由于220.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂家生产是独立的。

3.说明计算2χ统计量的步骤。

答:计算2χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2)(e o f f -除以e f ;(4)将步骤(3)的结果加总,即得:22()o e ef f f χ-=∑。

4.简述ϕ系数、c 系数、V 系数的各自特点。

答:(1)ϕ相关系数是描述2×2列联表数据相关程度最常用的一种相关系数。

它的计算公式为:ϕ,式中,∑-=ee of f f 22)(χ;n 为列联表中的总频数,也即样本量。

统计学教材(贾俊平版)课后习题详细答案

统计学教材(贾俊平版)课后习题详细答案

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

贾俊平《统计学》复习笔记课后习题详解及典型题详解 第9章~第10章【圣才出品】

贾俊平《统计学》复习笔记课后习题详解及典型题详解  第9章~第10章【圣才出品】

第9章分类数据分析9.1复习笔记一、分类数据与χ2统计量1.分类数据按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

分类数据和顺序数据都是只能归于某一类别的非数字型数据,它们是对事物进行分类的结果,其结果均表现为类别,用文字来表述,不过顺序数据的类别是有序的;数值型数据是按数字尺度测量的观测值,其结果表现为具体的数值。

分类数据是对事物进行分类的结果,其特征是,调查结果虽然用数值表示,但不同数值描述了调查对象的不同特征。

数值型数据可以转化为分类数据。

分类数据的结果是频数,χ2检验是对分类数据的频数进行分析的统计方法。

2.χ2统计量χ2统计量可以对分类数据做拟合优度检验和独立性检验,可以用于测定两个分类变量之间的相关程度。

若用f o 表示观察值频数,用f e 表示期望值频数,则χ2统计量可以写为:22()o e e f f f χ-=∑χ2检验:χ2检验是利用随机样本对总体分布与某种特定分布拟合程度的检验,也就是检验观察值与理论值之间的紧密程度。

χ2检验主要用于拟合优度检验和独立性检验。

(1)χ2统计量的特征①χ2≥0,因为它是对平方值结果的汇总;②χ2统计量的分布与自由度有关;③χ2统计量描述了观察值与期望值的接近程度。

两者越接近,即f o-f e的绝对值越小,计算出的χ2值越小;反之,f o-f e的绝对值越大,计算出的χ2值也越大。

χ2检验正是通过对χ2的计算结果与χ2分布中的临界值进行比较,做出是否拒绝原假设的统计决策。

(2)χ2分布与自由度的密切关系自由度越小,χ2的分布就越向左边倾斜;随着自由度的增加,χ2分布的偏斜程度趋于缓解,逐渐显露出对称性,随着自由度的继续增大,χ2分布将趋近于对称的正态分布。

(3)应用χ2检验统计量的注意事项①各组的理论频数f e不得小于总频数n;②总频数应较大,至少大于50;③如果某组理论频数小于5,可将相邻的若干组合并,直至理论频数大于5为止;④倘若有两个以上的单元,如果20%的单元期望频数f e小于5,则不能应用χ2检验。

贾俊平《统计学》章节题库(分类数据分析)详解【圣才出品】

贾俊平《统计学》章节题库(分类数据分析)详解【圣才出品】

第9章分类数据分析一、单项选择题1.列联分析是利用列联表来研究()。

A.两个数值型变量的关系B.两个分类变量的关系C.两个数值型变量的分布D.一个分类变量和一个数值型变量的关系【答案】B【解析】列联表是由两个或以上的变量进行交叉分类的频数分布表,列联分析是利用列联表来研究两个分类变量之间的关系。

2.列联表中的每个变量()。

A.只能有一个类别B.只能有两个类别C.对类别没有限制D.可以有两个或两个以上的类别【答案】D3.设列联表的行数为3,列数为4,则χ2检验的自由度为()。

A.3B.4C.6D.12【答案】C【解析】列联分析中,χ2检验的自由度=(行数-1)(列数-1)=(R-1)(C-1)=(3-)×(4-1)=6。

4.一所大学准备采取一项学生对餐厅改革意见的调查,为了解男女学生对这一措施的看法,分别抽取了300名男学生和240名女学生进行调查,得到的结果如表9-1所示。

这个表格是()。

A.4×3列联表B.3×2列联表C.2×3列联表D.3×4列联表【答案】B【解析】表中的行是态度变量,这里划分为三类,即赞成、中立和反对;表中的列是单位变量,这里划分为两类,即男同学和女同学,因此这个表格是3×2列联表。

5.一所大学为了解男女学生对后勤服务质量的评价,分别抽取了300名男学生和240名女学生进行调查,得到的结果如表9-2所示。

这个列联表的最下边一行称为()。

A.总频数B.条件频数C.行边缘频数D.列边缘频数【答案】D6.某中学为了解教师对新课标改革的看法,分别抽取了300名男教师和240名女教师进行调查,得到的结果如表9-3所示。

这个列联表的最右边一列称为()。

A.总频数B.条件频数C.行边缘频数D.列边缘频数【答案】C7.某大学为了解学生对研究生奖学金制度改革的看法,分别抽取了300名男研究生和240名女研究生进行调查,得到的结果如表9-4所示。

贾俊平的《统计学》(第7版)学习辅导书-章节题库(方差分析)【圣才出品】

贾俊平的《统计学》(第7版)学习辅导书-章节题库(方差分析)【圣才出品】
9.关亍单因素方差分析中的 F 检验( )。[中央财经大学 2011 研] A.拒绝域在 F 分布曲线的右侧 B.F 统计量的样本观测值可能为负值 C.拒绝域在 F 分布曲线的左侧和右侧 D.以上表述都丌对 【答案】A 【解析】在单因素方差分析中,若 F>Fα,则拒绝原假设;若 F<Fα,则丌拒绝原假设。

【解析】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因 变量是否有显著影响。如果分析数据来自相同总体,那么在组间误差中只包含随机误差,而 没有系统误差。反之,如果分析数据来自丌同总体,在组间误差中除了包含随机误差外,还 会包含系统误差。另外,方差分析要求每个总体都应服从正态分布。
10.关亍方差分析,以下说法哪一项更合理?( )[中山大学 2012 研] A.方差分析的目的是分析各组总体方差是否有显著差异 B.方差分析的目的是分析各组总体标准差是否有显著差异 C.方差分析的目的是分析各组总体均值是否有显著差异 D.方差分析的目的是分析各组总体中位数是否有显著差异 【答案】C 【解析】表面上看,方差分析是检验多个总体均值是否相等的统计方法,但本质上它所 研究的是分类型自变量对数值型因变量的影响。即方差分析是通过检验各总体的均值是否相 等来判断分类型自变量对数值型因变量是否有显著影响。
4.在方差分析中总变差可以分解为组内变差和组间变差,其中组间变差表示( )。 [厦门大学 2014 研]
A.一样本观测值不均值差方和 B.全部样本观测值不总均值的差方和 C.各样本观测值不各自均值的差方和 D.各样本均值不总均值的差方和 【答案】D
_
【解析】方差分析中组间平方和记为 SSA,它是各组均值xi(i=1,2,…,k)不总均 值 x 的误差平方和,反映组间误差的大小。
2.下面关亍方差学 2015 研]

贾俊平《统计学》章节题库(分类数据分析)【圣才出品】

贾俊平《统计学》章节题库(分类数据分析)【圣才出品】

观察值
105
78
期望值
102
8l
根据这个列联表计算的 Χ2 统计量为( )。
A.0.6176
B.1.6176
C.0.3088
D.1.3088
【答案】A
【解析】 2 f0 fe 2 45 482 42 392 105 1022 78 812
87
反对
105
78
183
合计
150
120
270
这个列联表的最下边一行称为( )。
A.列边缘频数
B.行边缘频数
3 / 25
圣才电子书

C.条件频数
十万种考研考证电子书、题库视频学习平台
D.总频数
【答案】A
7.一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的
2.设 R 为列联表的行数,C 为列联表的列数,则 Χ2 分布的自由度为( )。 A.R B.C C.R×C D.(R-1)×(C-1) 【答案】D
【解析】 2 检验的自由度=(行数-1)(列数-1)=(R-1)(C-1)。
1 / 25
圣才电子书 十万种考研考证电子书、题库视频学习平台

看法,分别抽取了 150 名男学生和 120 名女学生进行调查,得到的结果如下:
男学生
女学生
合计
赞成
45
42
87
反对
105
78
183
合计
150
120
270
根据这个列联表计算的赞成上网收费的行百分比分别为( )。
A.51.7%和 48.3%
B.57.4%和 42.6%
C.30%和 70%
D.35%和 65%

统计学(第六版)贾俊平-课后习题及答案

统计学(第六版)贾俊平-课后习题及答案

目录第一章P10 (1)第二章P34 (2)第三章P66 (3)第四章P94 (8)第七章P176 (11)第八章P212 (15)第10 章P258 (17)第11 章P291 (21)第13 章P348 (26)第14 章P376 (30)第一章P10一、思考题1.1什么是统计学?1.2解释描述统计和推断统计。

1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.4解释分类数据、顺序数据和数值型数据的含义。

1.5举例说明总体、样本、参数、统计量、变量这几个概念。

1.6变量可分为哪几类?1.7举例说明离散型变量和连续型变量。

1.8请举出统计应用的几个例子。

1.9请举出应用统计的几个领域。

1.1 指出下面变量的类型:(1)年龄(2)性别(3)汽车产量(4)员工对企业某项改革措施的态度(赞成、中立、反对)(5)购买商品时的支付方式(现金、信用卡、支票)(1)数值型变量。

(2)分类变量。

(3)离散型变量。

(4)顺序变量。

(5)分类变量。

1.2 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。

要求:(1)描述总体和样本。

(2)指出参数和统计量。

(1)总体是该市所有职工家庭的集合;样本是抽中的 2000 个职工家庭的集合。

(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的 2000 个职工家庭的年人均收入。

1.3 一家研究机构从 IT 从业者中随机抽取 1000 人作为样本进行调查,其中 60%的人回答他们的月收入在5000 元以上,50%的人回答他们的消费支付方式是用信用卡。

回答下列问题:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?(1)总体是所有 IT 从业者的集合。

(2)数值型变量。

(3)分类变量。

(4)截面数据。

1.4 一项调查表明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主要原因是“价格便宜”。

统计学贾俊平课后习题答案

统计学贾俊平课后习题答案

附录:教材各章习题答案第1 章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。

1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000 个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。

1.3(1)所有IT 从业者;(2)数值型变量;(3)分类变量;(4)观察数据。

1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。

1.5(略)。

1.6(略)。

第2 章数据的图表展示2.1 (1)属于顺序数据。

(2)频数分布表如下服务质量等级评价的频数分布3)条形图(略)4)帕累托图(略)2.2 (1)频数分布表如下402)某管理局下属40 个企分组表2.3 频数分布表如下某百货公司日商品销售额分组表2.4茎叶图如下茎叶数据个数1 8 8 93 2 0 1 1 3 3 6 8 8 8 9 9 912 3 13 5 6 95 4 1 2 36 67 6 50 1 2 74箱线图(略) 2.5 ( 1)排序略(2)频数分布表如下1数分布34)茎叶图如下茎叶65 66 67 68 5 5 6 6 6 7 7 8 8 8 8 9 970 7169720 1 2 2 5 6 7 8 9 973 3 5 674 1 4 72.6(1)频数分布表如下按重量分组频率/包40~42 242~44 344~46 746~48 1648~50 1752~52 1052~54 2054~56 856~58 1058~60 460~62 3合计100 (2)直方图(略)。

(3)食品重量的分布基本上是对称的2.7(1)频数分布表如下按重量误差分组频数/个10~20 020~30 530~40 740~50 850~60 1360~70 970~80 680~90 2合计50 2)直方图(略)2.8 (1)属于数值型数据( 2 )分组结果如下分组天数/天-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60( 3 )直方图(略)。

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第九章至第十一章【圣才出品】

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第九章至第十一章【圣才出品】

第9章分类数据分析9.1考点归纳【知识框架】【考点提示】(1)χ2统计量的计算公式及应用(计算题考点);(2)拟合优度检验(一个分类变量)和独立性检验(两个分类变量)(简答题、计算题考点);(3)列联表中的相关测量:三个系数的计算公式、特点及应用(选择题、简答题、计算题考点)。

【核心考点】考点一:χ2统计量(1)χ2统计量计算公式22()o e ef f f χ-=∑f o 表示观察值频数,用f e 表示期望值频数。

(2)χ2统计量的特征①χ2≥0;②χ2统计量的分布与自由度有关;③χ2统计量描述了观察值与期望值的接近程度。

(3)χ2分布与自由度的关系χ2分布随着自由度的增加而向右倾斜,且逐渐趋近于对称的正态分布。

考点二:列联表中的相关测量表9-1列联表的测量指标【真题精选】当列联表中的两个变量相互独立时,计算的相关系数c()。

[中国海洋大学2018研]A.等于1B.大于1C.等于0D.小于0【答案】C【解析】两个随机变量独立,则这两个随机变量不相关,反之不成立。

9.2课后习题详解一、思考题1.简述列联表的构造与列联表的分布。

答:(1)列联表的构造:列联表是将两个以上的变量进行交叉分类的频数分布表。

(2)列联表的分布:列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。

2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。

答:(1)构造列联表:对三个生产厂甲、乙、丙提供的学习机的A、B、C三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。

抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。

表9-2(2)提出检验问题根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。

(3)进行检验建立假设:H0:次品类型与厂家生产是独立的;H1:次品类型与厂家生产不是独立的。

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1。

2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据.它也是有类别的,但这些类别是有序的.(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值.统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1。

4解释分类数据,顺序数据和数值型数据答案同1。

31。

5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1。

6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量.经验变量和理论变量。

1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数"连续型变量,取之连续不断,不能一一列举,比如“温度”。

贾俊平《统计学》章节题库(含考研真题)(多元线性回归)【圣才出品】

贾俊平《统计学》章节题库(含考研真题)(多元线性回归)【圣才出品】
t ˆi ~ t(n k 1)
sˆi
s∧
其中 βˆi 是回归系数βi 的抽样分布的标准差,k 为回归方程中自变量的个数。
2 / 34
圣才电子书 十万种考研考证电子书、题库视频学习平台

4.多元线性回归分析中,如果 F 检验表明线性关系显著,则意味着( )。[华中农 业大学 2015 研;浙江工商大学 2011 研;安徽财经大学 2012 样题]
7.进行多元线性回归时,如果回归模型中存在多重共线性,则( )。[中国海洋大 学 2018 研;浙江工商大学 2011 研;安徽财经大学 2012 样题]
A.整个回归模型的线性关系不显著 B.肯定有一个回归系数通不过显著性检验 C.肯定导致某个回归系数的符号与预期的相反 D.可能导致某些回归系数通不过显著性检验 【答案】D 【解析】在回归分析中存在多重共线性时将会产生某些问题:首先,变量之间高度相关 时,可能会使回归的结果造成混乱,甚至会把分析引入歧途;其次,多重共线性可能对参数 估计值的正负号产生影响,特别是正负号有可能同预期的正负号相反。某些重要的解释变量 的回归系数 t 检验不显著而同时整个回归模型的线性关系检验显著,则通常预示着解释变量 间存在多重共线性。
重判定系数记为 R2a,其计算公式为:
Ra2
1
1
R2
n 1 n k 1

其值可能出现负值。
2.在多元线性回归分析中,F 检验时的 F 值越大,则意味着( )。[武汉大学 2015 研]
A.随机误差的影响越大 B.相关系数 R 的值越小
9.关于多元线性回归模型的说法,正确的是( )。 A.如果模型的 R2 很高,可以认为此模型的质量较好 B.如果模型的 R2 很低,可以认为此模型的质量较差 C.如果某一参数不能通过显著性检验,应该剔除该解释变量 D.如果某一参数不能通过显著性检验,不应该随便剔除该解释变量 【答案】D 【解析】当模型的解释变量间存在多重共线性时,往往会导致某些重要的解释变量的回 归系数 t 检验不显著而同时回归模型却有较高的 R2 值。因此当某一变量的回归系数不能通 过显著性检验时,不应该随便剔除该解释变量;同时回归模型有较高的 R2 值也不能说明该

统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。

1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。

1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。

1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。

1.5(略)。

1.6(略)。

第2章数据的图表展示2.1(1)属于顺序数据。

(2)频数分布表如下(4)帕累托图(略)。

2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。

(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。

2.72.8(1)属于数值型数据。

2.9(1)直方图(略)。

(2)自学考试人员年龄的分布为右偏。

2.10A 班分散,且平均成绩较A 班低。

2.11 (略)。

2.12 (略)。

2.13 (略)。

2.14 (略)。

2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。

(3)2.4=s 。

(4)左偏分布。

3.2(1)190=M ;23=e M 。

(2)5.5=L Q ;12=U Q 。

(3)24=x ;65.6=s 。

(4)08.1=SK ;77.0=K 。

(5)略。

3.3 (1)略。

(2)7=x ;71.0=s 。

(3)102.01=v ;274.02=v 。

(4)选方法一,因为离散程度小。

3.4 (1)x =(万元);M e= 。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第9章
分类数据分析
一、思考题
1.简述列联表的构造与列联表的分布。

答:列联表是由两个以上的变量进行交叉分类的频数分布表。

列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。

2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。

答:对三个生产厂甲、乙、丙提供的学习机的A、B、C 三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。

抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。

表9-2
A B C 总计甲乙丙204015459065357070100200150总计
75
200
175
450
根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。

建立假设:H 0:次品类型与厂家生产是独立的,H 1:次品类型与厂家生产不是独立的。

次品类型生产厂
可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。

表9-3
各组的期望值计算表
A B C 总计甲乙丙20(17)40(33)15(25)
45(44)90(89)65(67)35(39)70(78)70(58)100200150总计
75
200
175
450
所以222
2
(2017)(4033)(7058)9.821173358
χ---=
+++=…。

而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得
20.01(4)13.277χ=。

由于22
0.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂
家生产是独立的。

3.说明计算2
χ统计量的步骤。

答:计算2
χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2
)(e o f f -除以e f ;
(4)将步骤(3)的结果加总,即得:2
2
()o e e
f f f χ-=∑。

4.简述ϕ系数、c 系数、V 系数的各自特点。

次品类型生产厂
答:(1)ϕ相关系数是描述2×2列联表数据相关程度最常用的一种相关系数。

它的计算公式为:2/n ϕχ=,式中,∑-=e e o f f f 2
2)(χ;n 为列联表中的总频数,也即样本量。

说ϕ
系数适合2×2列联表,是因为对于2×2列联表中的数据,计算出的ϕ系数可以控制在0~1这个范围。

(2)列联相关系数又称列联系数,简称c 系数,主要用于大于2×2列联表的情况。

c 系数的计算公式为:
n
c +=
22
χχ当列联表中的两个变量相互独立时,系数c =0,但它不可能大于1。

c 系数的特点是,其可能的最大值依赖于列联表的行数和列数,且随着R 和C 的增大而增大。

(3)克莱默提出了V 系数。

V 系数的计算公式为:
2
min[(1)(1)]
V n R C χ=
⨯--,当两个变量相互独立时,V =0;当两个变量完全相关时,V =1。

所以V 的取值在0~1之间。

如果列联表中有一维为2,即min[(R -1),(C -1)]=1,则V 值就等于ϕ值。

5.构造下列维数的列联表,并给出2
χ检验的自由度。

a.2行5列
b.4行6列
c.3行4列
答:i 行j 列联表,如表9-4所示。

项目单位1
单位2
…单位j
态度1x 11x 12…x 1j 态度2x 21
x 22
…x 2j





态度i
x i 1
x i 2

ij
x 而2
χ检验的自由度=(行数-1)(列数-1),所以
a.当i =2,j =5时,表9-4即为2行5列的列联表,其2
χ检验的自由度=(2-1)×(5-1)=4;
b.当i =4,j =6时,表9-4即为4行6列的列联表,其2χ检验的自由度=(4-1)×(6-1)=15;
c.当i =3,j =4时,表9-4即为3行4列的列联表,其2χ检验的自由度=(3-1)×(4-1)=6。

二、练习题
1.欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了四个不同收入组的消费者共527人,购买习惯分为:经常购买,不购买,有时购买。

调查结果如表9-4所示。

表9-4
调查结果
项目低收入组偏低收入组
偏高收入组
高收入组经常购买不购买有时购买256936
405126
477419
465737
要求:
(1)提出假设;(2)计算2
χ值;(3)以α=0.1的显著性水平进行检验。

解:(1)提出假设:0H :1234ππππ===(即不同收入群体对某种特定商品的购买习惯相同),1H :1234ππππ,,,不完全相等(即不同收入群体对某种特定商品的购买习惯
不完全相同)。

(2)计算得各组的期望值,如表9-5所示(表中括号内的数值为期望值)。

表9-5
各组的期望值计算表
项目低收入组偏低收入组偏高收入组高收入组总计经常购买不购买有时购买25(39)69(62)36(29)40(35)51(56)26(26)47(42)74(67)19(31)46(42)57(67)37(31)158251118总计
130
117
140
140
527
表中各项的期望值的计算方法为:
1111130158
39527n n E n ⨯⨯=== 2112117158
35527n n E n ⨯⨯=== 3113140158
42527n n E n ⨯⨯=== 4114140158
42527n n E n ⨯⨯=== 1221130251
62527n n E n ⨯⨯=== 2222117251
56527n n E n ⨯⨯=== 3223140251
67527n n E n ⨯⨯=== 4224140251
67527
n n E n ⨯⨯=
==
1331130118
29527n n E n ⨯⨯=== 2332117118
26527n n E n ⨯⨯=== 3333140118
31527n n E n ⨯⨯=== 4334140118
31527
n n E n ⨯⨯=
== 所以222
2
(2539)(6962)(3731)17.67396231
χ---=
+++=…。

(3)调查结果是3行4列的列联表,其自由度=(3-1)×(4-1)=6,当α=0.1
时,20.1(6)10.64χ=,由第(2)问计算出的2
χ值为17.67>10.64=2
0.1(6)χ,故拒绝原假设,
即不同收入群体对某种特定商品的购买习惯不完全相同。

2.从总体中随机抽取了n =200的样本,调查后按不同属性归类,得到如下结果:
1n =28,2n =56,3n =48,4n =36,5n =32
依据经验数据,各类别在总体中的比例分别为:
1π=0.1,2π=0.2,3π=0.3,4π=0.2,5π=0.2
以α=0.1的显著性水平进行检验,说明现在的情况与经验数据相比是否发生了变化(用
P 值)。

解:提出假设:H 0:现在情况与经验数据相比没有发生变化,H 1:现在情况与经验数据相比发生了变化。

由已知条件可得2
χ值为:。

相关文档
最新文档