贾俊平《统计学》(第6版)章节题库-第十一章至第十二章【圣才出品】
贾俊平《统计学》章节题库-第十一章至第十二章(圣才出品)
圣才电子书 十万种考研考证电子书、题库视频学习平台
5.根据下面的散点图,可以判断两个变量之间存在( )。
A.正线性相关关系 B.负线性相关关系 C.非线性关系 D.函数关系 【答案】B 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变 量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,则称为负线性相 关关系。
1 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台
3.下面的假定中,哪个属于相关分析中的假定( )。 A.两个变量之间是非线性关系 B.两个变量都是随机变量 C.自变量是随机变量,因变量不是随机变量 D.一个变量的数值增大,另一个变量的数值也应增大 【答案】B 【解析】在进行相关分析时,对总体主要有以下两个假定:①两个变量之间是线性关系; ②两个变量都是随机变量。
【答案】C 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变
5 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台
量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,即 x 值增大时 y 值随之变小,或 x 值变小时 y 值随之增大,则称为负相关。
12.如果相关系数 r=0,则表明两个变量之间( )。 A.相关程度很低 B.不存在任何关系 C.不存在线性相关关系 D.存在非线性相关关系 【答案】C 【解析】相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。如 果相关系数 r=0,说明两个变量之间不存在线性相关关系。
13.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着 ( )。
2.下面的各问题中,哪个不是相关分析要解决的问题( )。 A.判断变量之间是否存在关系 B.判断一个变量数值的变化对另一个变量的影响 C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系 【答案】B 【解析】相关分析就是对两个变量之间线性关系的描述与度量,它主要解决的问题包括: ①变量之间是否存在关系;②如果存在关系,它们之间是什么样的关系;③变量之间的关系 强度如何;④样本所反映的变量之间的关系能否代表总体变量之间的关系。
贾俊平《统计学》配套题库 【课后习题】详解 第13章~第14章【圣才出品】
二、练习题
1.下表是 1991~2008 年我国小麦产量数据。
年份
小麦产量(万吨) 年份
1991
9595.3
2000
1992
10158.7
2001
1993
10639.0
2002
1994
9929.7
2003
1995
10220.7
2004
1996
11056.9Leabharlann 2005199712328.9
2006
1998
3 / 52
圣才电子书 十万种考研考证电子书、题库视频学习平台
移动平均值,然后再计算出各比值的季度(或月份)平均值。 (3)季节指数调整。由于各季节指数的平均数应等于 1 或 100%,若根据第 2 步计算
的季节比率的平均值不等于 1 时,则需要进行调整。具体方法是:将第(2)步计算的每个 季节比率的平均值除以它们的总平均值。
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 13 章 时间序列分析和预测
一、思考题 1.简述时间序列的构成要素。 答:时间序列的构成要素分为 4 种,即趋势、季节性或季节变动、周期性或循环波动、 随机性或不规则波动。 (1)趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长 期趋势; (2)季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动; (3)周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或 振荡式变动; (4)随机性也称不规则波动,是指偶然性因素对时间序列产生影响,致使时间序列呈 现出某种随机波动。
2 / 52
圣才电子书 十万种考研考证电子书、题库视频学习平台
贾俊平《统计学》配套题库 【课后习题】详解 第9章~第10章【圣才出品】
第9章分类数据分析一、思考题1.简述列联表的构造与列联表的分布。
答:列联表是由两个以上的变量进行交叉分类的频数分布表。
列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。
2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。
答:对三个生产厂甲、乙、丙提供的学习机的A、B、C 三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。
抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。
表9-2A B C 总计甲乙丙204015459065357070100200150总计75200175450根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。
建立假设:H 0:次品类型与厂家生产是独立的,H 1:次品类型与厂家生产不是独立的。
次品类型生产厂可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。
表9-3各组的期望值计算表A B C 总计甲乙丙20(17)40(33)15(25)45(44)90(89)65(67)35(39)70(78)70(58)100200150总计75200175450所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。
而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得20.01(4)13.277χ=。
由于220.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂家生产是独立的。
3.说明计算2χ统计量的步骤。
答:计算2χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2)(e o f f -除以e f ;(4)将步骤(3)的结果加总,即得:22()o e ef f f χ-=∑。
(完整版)统计学贾俊平考研知识点总结
统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。
(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。
内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。
(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。
研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。
其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。
(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
(1)分类数据是只能归于某一类别的非数字型数据。
它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。
(2)顺序数量是只能归于某一有序类别的非数字型数据。
也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。
(3)数值型数据是按数字尺度测量的观察值。
其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。
总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。
三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。
通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。
贾俊平《统计学》(第6版)配套题库-名校考研真题【圣才出品】
数据的绝对离散程度一样,方差相同。
5.两组工人加工零件数的离散系数( )。 A.一组大于二组 B.二组大于一组 C.相同 D.无法比较 【答案】A 【解析】离散系数是一组数据的标准差与其相应的平均数之比,测度数据的相对离散程 度。由于两组数据的标准差相同,而第二组数据均值较大,因此二组的离散系数较小。
15.我国最近完成的经济普查属于( )。 A.抽样调查 B.经常性调查
7 / 178
圣才电子书
C.统计报表制度
十万种考研考证电子书、题库视频学习平台
D.全面调查
【答案】D
【解析】经济普查是国家为掌握国民经济第二产业、第三产业的发展规模、结构、效益
等信息,按照统一的方法、统一标准、统一时间、统一组织对工业、建筑业、第三产业的所
有单位和个体经营户进行的一次性全面调查。
16.为了对总体均值进行估计,从总体中直接抽取一个随机样本,测得样本均值为 100。 则以下说法错误的是( )。
A.样本均值是总体均值的无偏估计 B.样本均值是总体均值的估计量 C.“100”是总体均值的估计值 D.“100”是总体均值的估计量 【答案】D 【解析】在参数估计中,用来估计总体参数的统计量的名称称为估计量,如样本均值、 样本方差等;而根据一个具体的样本计算出来的估计量的数值称为估计值。D 项,根据样本 计算的均值即样本均值是一个估计量,其具体数值 100 即为估计值。
上期营业额=
本期营业额 100% 增长率
。
由题意, 2011年证券成交额= 2012年证券成交额 = 85412.9 100% 增长率 100% 8%
根据以下数据回答 4—5 问题: 两组工人加工同一种零件,第一组 5 人每天加工的零件数分别为:36,25,29,28, 26。巧合的是,第二组 5 人每天加工的零件数分别比第一组的工人多 3 件:39,28,32, 31,29。 4.两组工人加工零件数的方差( )。 A.一组大于二组
贾俊平《统计学》课后习题及详解(统计量及其抽样分布)【圣才出品】
第6章 统计量及其抽样分布一、思考题1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设是从总体中抽取的容量为的一个样本,如果由此样本构造一个函数,不依赖于任何未知参数,则称函数是一个统计量。
(2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。
为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。
(3)统计量是样本的一个函数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。
2.判断下列样本函数哪些是统计量?哪些不是统计量?12n X X X ,,…,X n 12()n T X X X ,,…,12()n T X X X ,,…,1121021210310410()/10min()T X X X T X X X T X T X μμσ=+++==-=-…,,…,()/答:统计量中不能含有未知参数,故、是统计量,、不是统计量。
3.什么是次序统计量?答:设是从总体中抽取的一个样本,称为第个次序统计量,它是样本满足如下条件的函数:每当样本得到一组观测值…,时,其由小到大的排序中,第个值就作为次序统计量的观测值,而称为次序统计量,其中和分别为最小和最大次序统计量。
4.什么是充分统计量?答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。
统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。
5.什么是自由度?答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。
统计学第六版贾俊平第12章
2. 求解各回归参数的标准方程如下
12 - 13
Q
b
0
b0 bˆ0
0
Q
b
i
bi bˆi
0
(i 1,2,, p)
统计学
第六版
参数的最小二乘法
(例题分析)
【例】一家大型商业银行在多个地区设有分行,
为弄清楚不良贷款形成的原因,抽取了该银行 所属的25家分行2002年的有关业务数据。试建 立不良贷款(y)与贷款余额(x1)、累计应收贷款 (x2)、贷款项目个数(x3)和固定资产投资额(x4)的 线性回归方程,并解释各回归系数的含义
4. 作出决策:若F>F ,拒绝H0
统计学
第六版
多元回归模型
(基本假定)
1. 误差项ε是一个期望值为0的随机变量,即
E()=0
2. 对于自变量x1,x2,…,xp的所有值,的
方差2都相同
3. 误差项ε是一个服从正态分布的随机变量, 即ε~N(0,2),且相互独立
12 - 7
统计学
多元回归方程
第六版 (multiple regression equation)
第六版
学习目标
1. 回归模型、回归方程、估计的回归方程 2. 回归方程的拟合优度 3. 回归方程的显著性检验 4. 多重共线性问题及其处理 5. 利用回归方程进行估计和预测 6. 虚拟自变量的回归问题 7. 用 Excel 进行回归分析
12 - 3
统计学
第六版
12.1 多元线性回归模型
一. 多元回归模型与回归方程 二. 估计的多元回归方程 三. 参数的最小二乘估计
如果不显著,因变量与自变量之间不存在线性 关系
(完整版)贾俊平统计学[第六版]思考题答案解析.docx
第一章:1、什么是统计学?统计学是一门收集、分析、表述、解释数据的科学和艺术。
2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。
推断统计:研究的是如何利用样本数据来推断总体特征。
3、统计学据可以分成哪几种类型,个有什么特点?按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。
分类数据:只能归于某一类别的,非数字型数据。
顺序数据:只能归于某一有序类别的,非数字型数据。
数值型数据:按数字尺度测量的观察值,结果表现为数值。
按收集方法不同。
分为:观测数据、和实验数据观测数据:通过调查或观测而收集到的数据;不控制条件;社会经济领域实验数据:在试验中收集到的数据;控制条件;自然科学领域。
按时间不同,分为:截面数据、时间序列数据截面数据:在相同或近似相同的时间点上收集的数据。
时间序列数据:在不同时间收集的数据。
4、举例说明总体、样本、参数、统计量、变量这几个概念。
总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。
参数:用来描述总体特征的概括性数字度量。
(平均数、标准差、比例等)统计量:用来描述样本特征的概括性数字度量。
(平均数、标准差、比例等)变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。
(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
)5、变量可以分为哪几类?分类变量:说明事物类别;取值是分类数据。
顺序变量:说明事物有序类别;取值是顺序数据数值型变量:说明事物数字特征;取值是数值型数据。
变量也可以分为:随机变量和非随机变量;经验变量和理论变量6、举例说明离散型变量和连续型变量。
统计学(第六版)贾俊平-课后习题及答案
目录第一章P10 (1)第二章P34 (2)第三章P66 (3)第四章P94 (8)第七章P176 (11)第八章P212 (15)第10 章P258 (17)第11 章P291 (21)第13 章P348 (26)第14 章P376 (30)第一章P10一、思考题1.1什么是统计学?1.2解释描述统计和推断统计。
1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.4解释分类数据、顺序数据和数值型数据的含义。
1.5举例说明总体、样本、参数、统计量、变量这几个概念。
1.6变量可分为哪几类?1.7举例说明离散型变量和连续型变量。
1.8请举出统计应用的几个例子。
1.9请举出应用统计的几个领域。
1.1 指出下面变量的类型:(1)年龄(2)性别(3)汽车产量(4)员工对企业某项改革措施的态度(赞成、中立、反对)(5)购买商品时的支付方式(现金、信用卡、支票)(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。
要求:(1)描述总体和样本。
(2)指出参数和统计量。
(1)总体是该市所有职工家庭的集合;样本是抽中的 2000 个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的 2000 个职工家庭的年人均收入。
1.3 一家研究机构从 IT 从业者中随机抽取 1000 人作为样本进行调查,其中 60%的人回答他们的月收入在5000 元以上,50%的人回答他们的消费支付方式是用信用卡。
回答下列问题:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?(1)总体是所有 IT 从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4 一项调查表明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主要原因是“价格便宜”。
贾俊平《统计学》(第5版)章节题库-第十一章至第十四章【圣才出品】
2.下面的各问题中,哪个不是相关分析要解决的问题( )。 A.判断变量之间是否存在关系 B.判断一个变量数值的变化对另一个变量的影响 C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系 【答案】B 【解析】相关分析就是对两个变量之间线性关系的描述与度量,它主要解决的问题包括: ①变量之间是否存在关系;②如果存在关系,它们之间是什么样的关系;③变量之间的关系 强度如何;④样本所反映的变量之间的关系能否代表总体变量之间的关系。
9.根据你的判断,下面的相关系数取值哪一个是错误的( )。 A.-0.86 B.0.78 C.1.25 D.0
4 / 166
圣才电子书
【答案】C
十万种考研考证电子书、题库视频学习平台
【解析】相关系数 r 的取值范围是[-1,1]。
10.下面关于相关系数的陈述中哪一个是错误的( )。 A.数值越大说明两个变量之间的关系就越强 B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系 C.只是两个变量之间线性关系的一个度量,不一定意味着两个变量之间一定有因果关 系 D.绝对值不会大于 l 【答案】A 【解析】相关系数的性质有:①r 的取值范围是[-1,1];②r 具有对称性;③r 的数值
6 / 1பைடு நூலகம்6
圣才电子书 十万种考研考证电子书、题库视频学习平台
【答案】C 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变
5 / 166
圣才电子书 十万种考研考证电子书、题库视频学习平台
量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,即 x 值增大时 y 值随之变小,或 x 值变小时 y 值随之增大,则称为负相关。
贾俊平第六版统计学课后思考题答案——张云飞
第一章导论1.什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
2.解释描述统计和推断统计描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计是研究如何利用样本数据来推断总体特征的统计方法。
3.统计数据可以分为哪几种类型?不同类型的数据各有什么特点?分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
顺序数据:是只能归于某一有序类别的非数字型数据。
虽然也有列别,但这些类别是有序的。
数值型数据:是按数字尺度测量的观察值,其结果表现为具体的数值。
4.解释分类数据、顺序数据和数值型数据的含义分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此也可统称为定性数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。
5.举例说明总体、样本、参数、统计量、变量这几个概念总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集合;参数是用来描述总体特征的概括性数字度量;统计量是用来描述样本特征的概括性数字度量;变量是说明现象某种特征的概念。
比如我们欲了解某市的中学教育情况,那么该市的所有中学则构成一个总体,其中的每一所中学都是一个个体,我们若从全市中学中按某种抽样规则抽出了10所中学,则这10所中学就构成了一个样本。
在这项调查中我们可能会对升学率感兴趣,那么升学率就是一个变量。
我们通常关心的是全市的平均升学率,这里这个平均值就是一个参数,而此时我们只有样本的有关升学率的数据,用此样本计算的平均值就是统计量。
6.变量可以分为哪几类分类变量:一个变量由分类数据来记录就称为分类变量。
顺序变量:一个变量由顺序数据来记录就称为顺序变量。
数值型变量:一个变量由数值型数据来记录就称为数值型变量。
离散变量:可以取有限个值,而且其取值都以整位数断开,可以一一例举。
贾俊平《统计学》章节题库(含考研真题)(8-10章)【圣才出品】
销售量为 99.32 吨,即无法轻易肯定广告可使每天的销售量达到 100 吨,则原假设和备择 假设应该为:H0:μ≤100,H1:μ>100。
7.在假设检验中,两个总体 X~N(μ1,σ12),Y~N(μ2,σ22),其中 μ1,μ2 未知, 检验 σ12 是否等于 σ22 应用( )。[浙江工商大学 2011 研]
6.某企业计划投资 2 万元的广告费以提高某种新产品的销售量,企业经理认为做了广 告可使每天销售量达 100 吨。实行此计划 9 天后经统计知,这 9 天的日平均销售量为 99.32 吨。假设每天的销售量服从正态分布 N(μ,σ2),在 α=0.05 的显著性水平下,检验此项 计划是否达到了该企业经理的预计效果,建立的原假设和备择假设为( )。[浙江工商大 学 2011 研]
4.抽取样本容量为 100 的随机样本对总体的均值进行检验,检验的假设为 H0:μ≤μ0, H1:μ>μ0,显著性水平 α=0.05,zc 为检验统计量的样本值,那么 P 值为( )。[对外 经济贸易大学 2015 研]
A.P(z>zc) B.P(z<zc) C.P(z>1.96) D.P(z<-1.96) 【答案】A 【解析】题中,样本量 n=100≥30,σ2 未知,在给定的显著性水平 α 下,对于右单侧 检验而言,P 值为检验统计量的值超过由样本所计算出的检验统计量的数值的概率,即 P 值 =P(z>zc)。
1 / 117
3.在假设检验中,不拒绝原假设意味着( )。[山东大学 2015 研] A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的 【答案】D 【解析】假设检验的目的是寻找足够的证据来拒绝原假设。不拒绝原假设意味着在统计 意义上没有证据证明原假设是错误的。
贾俊平《统计学》章节题库(含考研真题)(多元线性回归)【圣才出品】
sˆi
s∧
其中 βˆi 是回归系数βi 的抽样分布的标准差,k 为回归方程中自变量的个数。
2 / 34
圣才电子书 十万种考研考证电子书、题库视频学习平台
4.多元线性回归分析中,如果 F 检验表明线性关系显著,则意味着( )。[华中农 业大学 2015 研;浙江工商大学 2011 研;安徽财经大学 2012 样题]
7.进行多元线性回归时,如果回归模型中存在多重共线性,则( )。[中国海洋大 学 2018 研;浙江工商大学 2011 研;安徽财经大学 2012 样题]
A.整个回归模型的线性关系不显著 B.肯定有一个回归系数通不过显著性检验 C.肯定导致某个回归系数的符号与预期的相反 D.可能导致某些回归系数通不过显著性检验 【答案】D 【解析】在回归分析中存在多重共线性时将会产生某些问题:首先,变量之间高度相关 时,可能会使回归的结果造成混乱,甚至会把分析引入歧途;其次,多重共线性可能对参数 估计值的正负号产生影响,特别是正负号有可能同预期的正负号相反。某些重要的解释变量 的回归系数 t 检验不显著而同时整个回归模型的线性关系检验显著,则通常预示着解释变量 间存在多重共线性。
重判定系数记为 R2a,其计算公式为:
Ra2
1
1
R2
n 1 n k 1
,
其值可能出现负值。
2.在多元线性回归分析中,F 检验时的 F 值越大,则意味着( )。[武汉大学 2015 研]
A.随机误差的影响越大 B.相关系数 R 的值越小
9.关于多元线性回归模型的说法,正确的是( )。 A.如果模型的 R2 很高,可以认为此模型的质量较好 B.如果模型的 R2 很低,可以认为此模型的质量较差 C.如果某一参数不能通过显著性检验,应该剔除该解释变量 D.如果某一参数不能通过显著性检验,不应该随便剔除该解释变量 【答案】D 【解析】当模型的解释变量间存在多重共线性时,往往会导致某些重要的解释变量的回 归系数 t 检验不显著而同时回归模型却有较高的 R2 值。因此当某一变量的回归系数不能通 过显著性检验时,不应该随便剔除该解释变量;同时回归模型有较高的 R2 值也不能说明该
贾俊平《统计学》配套题库 【课后习题】详解 第11章~第12章【圣才出品】
第11章一元线性回归一、思考题1.解释相关关系的含义,说明相关关系的特点。
答:变量之间存在的不确定的数量关系,称为相关关系。
相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。
对这种关系不确定的变量是不能用函数关系进行描述的。
2.相关分析主要解决哪些问题?答:相关分析就是对两个变量之间线性关系的描述与度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本所反映的变量之间的关系能否代表总体变量之间的关系。
3.相关分析中有哪些基本假定?答:在进行相关分析时,对总体主要有以下两个假定:(1)两个变量之间是线性关系;(2)两个变量都是随机变量。
4.简述相关系数的性质。
答:相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r 。
相关系数的性质:(1)r 的取值范围在-1~+1之间,即-1≤r ≤1。
若0<r ≤1,表明x 与y 之间存在正线性相关关系;若-1≤r <0,表明x 与y 之间存在负线性相关关系;若r =+1,表明x 与y 之间为完全正线性相关关系;若r =-1,表明x 与y 之间为完全负线性相关关系。
可见当|r |=1时,y 的取值完全依赖于x ,二者之间即为函数关系;当r =0时,说明y 的取值与x 无关,即二者之间不存在线性相关关系。
(2)r 具有对称性。
x 与y 之间的相关系数xy r 和y 与x 之间的相关系数yx r 相等,即xy r =yx r 。
(3)r 数值大小与x 和y 的原点及尺度无关。
改变x 和y 的数据原点及计量尺度,并不改变r 数值大小。
(4)r 仅仅是x 与y 之间线性关系的一个度量,它不能用于描述非线性关系。
贾俊平《统计学》(第6版)章节题库-第一章至第四章【圣才出品】
2.指出下面的变量哪一个属于顺序变量?( ) A.年龄 B.工资 C.汽车产量 D.员工对企业某项改革措施的态度(赞成、中立、反对) 【答案】D 【解析】顺序变量又称为有序分类变量,观测结果表现为某种有序类别的变量。C 项员 工对企业某项改革措施的态度按顺序依次表现为:赞成、中立、反对三种,因此属于顺序变
4.某研究部门准备在全市 200 万个家庭中抽取 2000 个家庭,推断该城市所有职工家 庭的年人均收入。这项研究的总体是( )。
A.2000 个家庭 B.200 万个家庭 C.2000 个家庭的人均收入 D.200 万个家庭的总收入 【答案】B 【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体 组成。题中的总体为 200 万个家庭。
何利用样本数据来推断总体特征的统计学方法。由此可知 A 项属于推断统计学方法。
12.某大学的一位研究人员希望估计该大学本科生平均每月的生活费支出,为此,他 调查了 200 名学生,发现他们每月平均生活费支出是 500 元。该研究人员感兴趣的总体是 ( )。
A.该大学的所有学生 B.该校所有大学生的总生活费支出 C.该大学所有的在校本科生 D.所调查的 200 名学生 【答案】C 【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体 组成。因此题中的总体是“该大学所有的在校本科生”。
8.一家研究机构从 IT 从业者中随机抽取 500 人作为样本进行调查,其中 60%回答他们 的月收人在 5000 元以上,50%回答他们的消费支付方式是用信用卡。这里的总体是( )。
A.IT 业的全部从业者 B.500 个 IT 从业者 C.IT 从业者的总收入 D.IT 从业者的消费支付方式 【答案】A 【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体 组成。题中的总体为“所有 IT 从业者”。
贾俊平《统计学》章节题库(含考研真题)(1-4章)【圣才出品】
第1章导论一、单项选择题1.在抽样推断中,总体参数是一个()。
[中央财经大学2018研]A.随机变量B.已知的量C.统计量D.确定的量【答案】D【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
由于总体数据通常是不知道的,所以参数是一个未知的确定的常数。
2.统计年鉴中2016年全国各大城市的人均家庭收入数据属于()。
[中央财经大学2018研]A.定类数据B.定序数据C.截面数据D.时间序列数据【答案】C【解析】按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间获得的,用于描述现象在某一时刻的变化情况。
比如,2010年我国各地区的国内生产总值就是截面数据。
时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
比如2010~2012年我国的国内生产总值就是时间序列数据。
3.在教学评估中,某省三所高校的等级分别是优秀、良好、及格,则“等级”是()。
[浙江工商大学2017研]A.品质标志B.数量标志C.标志值D.数量指标【答案】A【解析】“等级”属于顺序数据,只能用文字来描述,因此是品质标志,其标志值为“优秀”“良好”“及格”。
4.下面不属于描述统计问题的是()。
[山东大学2015研]A.根据样本信息对总体进行的推断B.了解数据分布的特征顺序数据C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据【答案】A【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
BCD三项都是描述统计问题。
A项中根据样本信息对总体进行推断则是推断统计内容。
5.一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。
调查结果表明:45%的年轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题,15%的年轻人愿意与其父母讨论爱情问题。
统计学第六版贾俊平12章多元线性回归
二元回归方程的直观解释
二元线性回归模型
回归面
y
y b0 b1x1 b2x2
(观察到的y)
} b0
i
x2
(x1,x2)
x1
E( y) b0 b1x1 b2x2
估计的多元回归方程
估计的多元回归的方程
(estimated multiple regression equation)
12.1 多元线性回归模型
一 多元回归模型与回归方程 二 估计的多元回归方程 三 参数的最小二乘估计
多元回归模型与回归方程
多元回归模型
(multiple regression model)
1. 一个因变量与两个及两个以上自变量的回归
2. 描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xp 和误差项 的方程,称为多元回归模型
2. 如果出现下列情况,暗示存在多重共线性
模型中各对自变量之间显著相关。 当模型的线性关系检验(F检验)显著时,几乎所有回
归系数的t检验却不显著 回归系数的正负号与其的相反。
Excel 输出结果的分析
多重共线性
(例题分析)
【例】判别各自变量之间是否存在多重共线性
贷款余额、应收贷款、贷款项目、固定资产投资额之间的相关矩阵
1. 用样本统计量 bˆ0 , bˆ1 , bˆ2 , , bˆ p 估计回归方 程中的 参数 b0 , b1 , b2 , , b p 时得到的方程
2. 由最小二乘法求得 3. 一般形式为
yˆ bˆ0 bˆ1x1 bˆ2x2 bˆpxp
▪ bˆ0 , bˆ1 , bˆ2 , , bˆ p是 b0 , b1 , b2 , , b p
贾俊平《统计学》章节题库(统计量及其抽样分布)详解【圣才出品】
第6章统计量及其抽样分布一、单项选择题1.在抽样推断中,样本统计量是()。
[中央财经大学2015研]A.未知但确定的量B.一个已知的量C.随机变量D.惟一的【答案】C【解析】统计量是用来描述样本特征的概括性数字度量。
它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数,是随机变量。
2.在一个饭店门口等待出租车的时间是左偏的,均值为12分钟,标准差为3分钟。
如果从饭店门口随机抽取100名顾客并记录他们等待出租车的时间,则该样本均值的分布服从()。
[山东大学2015研]A.正态分布,均值为12分钟,标准差为0.3分钟B.正态分布,均值为12分钟,标准差为3分钟C.左偏分布,均值为12分钟,标准差为3分钟D.左偏分布,均值为12分钟,标准差为0.3分钟【答案】A【解析】中心极限定理:设从均值为μ、方差为σ2(有限)的任意一个总体中抽取样本量为n 的样本,当n 充分大(通常是大于36)时,样本均值X 的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布。
故即使总体是左偏分布,该样本均值仍服从正态分布,其均值为12,标准差为3/10=0.3。
3.设总体X ~N (2,σ2),X 1,…,X 16是来自总体X 的样本,161116i i X X ==∑,则48X σ-服从的分布是( )。
[对外经济贸易大学2015研]A .t (15)B .t (16)C .χ2(15)D .N (0,1)【答案】D【解析】由题可知样本均值2~(2,)16X N σ则 ()2/4~01X N -,σ即()18~04N X -,σ4.1000名学生参加某课程的考试,平均成绩是82分,标准差是8分,从学生中随机抽取100个同学作为样本,则样本均值的数学期望和抽样分布的标准差分别为()。
[华中农业大学2015研]A.82,8B.82,0.8C.82,64D.86,1【答案】B【解析】由中心极限定理得,在大样本条件下,样本均值X的抽样分布近似服从均值为μ方差为σ2/n的正态分布。
贾俊平《统计学》复习笔记课后习题详解及典型题详解 第11章~第12章【圣才出品】
圣才电子书 十万种考研考证电子书、题库视频学习平台
4 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 11-1 不同形态的散点图
(4)相关系数
通过散点图可以判断两个变量之间有无相关关系,并对变量间的关系形态作出大致的描
有所差异。样本相关系数是总体相关系数的一致估计量。样本相关系数记为 r,其计算公式
为:
r
n xy x y
n x2 ( x)2 n y2 ( y)2
按照上述计算公式计算的相关系数也称为线性相关系数,或 Pearson 相关系数。 ②相关系数的性质 a.r 的取值范围在-1~+1 之间,即-1≤r≤1。若 0<r≤1,表明 x 与 y 之间存在正 线性相关关系;若-1≤r<0,表明 x 与 y 之间存在负线性相关关系;若 r=+1,表明 x 与
5 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台
y 之间为完全正线性相关关系;若 r=-1,表明 x 与 y 之间为完全负线性相关关系。可见当 |r|=1 时,y 的取值完全依赖于 x,二者之间即为函数关系;当 r=0 时,说明 y 的取值与 x 无关,即二者之间不存在线性相关关系。|r|→1 说明两个变量之间的线性关系越强;|r|→0 说明两个变量之间的线性关系越弱。
b.r 具有对称性。x 与 r 之间的相关系数 rxy 和 y 与 x 之间的相关系数 ryx 相等,即 rxy =ryx。
c.r 数值大小与 x 和 y 的原点及尺度无关。改变 x 和 y 的数据原点及计量尺度,并不 改变 r 的数值大小。
述,但不能准确反映变量之间的关系强度。需要计算相关系数来准确度量两个变量之间的关
系强度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台
量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,即 x 值增大时 y 值随之变小,或 x 值变小时 y 值随之增大,则称为负相关。
6 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台
大小与 x 和 y 的原点及尺度无关;④r 仅仅是 x 与 y 之间线性关系的一个度量;⑤r 虽然是 两个变量之间线性关系的一个度量,却不一定意味着 x 与 y 一定有因果关系。 r 1 说明
两个变量之间的线性关系越强。
11.变量 x 与 y 之间的负相关是指( )。 A. x 值增大时 y 值也随之增大 B. x 值减少时 y 值也随之减少 C. x 值增大时 y 值随之减少,或 x 值减少时 y 值随之增大 D. y 的取值几乎不受 x 取值的影响
9.根据你的判断,下面的相关系数取值哪一个是错误的( )。 A.-0.86 B.0.78 C.1.25 D.0
4 / 88
圣才电子书
【答案】C
十万种考研考证电子书、题库视频学习平台
【解析】相关系数 r 的取值范围是[-1,1]。
10.下面关于相关系数的陈述中哪一个是错误的( )。 A.数值越大说明两个变量之间的关系就越强 B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系 C.只是两个变量之间线性关系的一个度量,不一定意味着两个变量之间一定有因果关 系 D.绝对值不会大于 l 【答案】A 【解析】相关系数的性质有:①r 的取值范围是[-1,1];②r 具有对称性;③r 的数值
2 / 88
Hale Waihona Puke 圣才电子书 十万种考研考证电子书、题库视频学习平台
5.根据下面的散点图,可以判断两个变量之间存在( )。
A.正线性相关关系 B.负线性相关关系 C.非线性关系 D.函数关系 【答案】B 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变 量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,则称为负线性相 关关系。
圣才电子书
十万种考研考证电子书、题库视频学习平台
第 11 章 一元线性回归
一、单项选择题 1.具有相关关系的两个变量的特点是( )。 A.一个变量的取值不能由另一个变量唯一确定 B.一个变量的取值由另一个变量唯一确定 C.一个变量的取值增大时,另一个变量的取值也一定增大 D.一个变量的取值增大时,另一个变量的取值肯定变小 【答案】A 【解析】相关关系是指变量之间存在的不确定的数量关系,即一个变量的取值不能由另 一个变量惟一确定。
6.如果变量之间的关系近似地表现为一条直线,则称两个变量之间为( )。 A.正线性相关关系 B.负线性相关关系 C.线性相关关系 D.非线性相关关系 【答案】C 【解析】就两个变量而言,如果变量之间的关系近似的表现为一条直线,则称为线性相 关。
3 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台
A.高度相关 B.中度相关 C.低度相关 D.极弱相关 【答案】A
【解析】当 r 0.8 时,可视为高 度相关; 0.5 r 0.8 时,可视为中 度相关; 0.3 r 0.5 ,视为低度相关;当 r 0.3 时,说明两个变量之间的相关程度极弱,可视为 不相关。题中 r 0.87 0.8 ,表明产品产量与产品单位成本之间存在高度负的线性相关关
4.根据下面的散点图,可以判断两个变量之间存在( )。
A.正线性相关关系 B.负线性相关关系 C.非线性关系 D.函数关系 【答案】A 【解析】在线性相关中,若两个变量的变动方向相同,一个变量的数值增加,另一个变 量的数值也随之增加,或一个变量的数值减少,另一个变量的数值也随之减少,则称为正线 性相关关系。
12.如果相关系数 r=0,则表明两个变量之间( )。 A.相关程度很低 B.不存在任何关系 C.不存在线性相关关系 D.存在非线性相关关系 【答案】C 【解析】相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。如 果相关系数 r=0,说明两个变量之间不存在线性相关关系。
13.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着 ( )。
2.下面的各问题中,哪个不是相关分析要解决的问题( )。 A.判断变量之间是否存在关系 B.判断一个变量数值的变化对另一个变量的影响 C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系 【答案】B 【解析】相关分析就是对两个变量之间线性关系的描述与度量,它主要解决的问题包括: ①变量之间是否存在关系;②如果存在关系,它们之间是什么样的关系;③变量之间的关系 强度如何;④样本所反映的变量之间的关系能否代表总体变量之间的关系。
7.如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,称为两个 变量之间为( )。
A.完全相关关系 B.正线性相关关系 C.非线性相关关系 D.负线性相关关系 【答案】A
8.下面的陈述哪一个是错误的( )。 A.相关系数是度量两个变量之间线性关系强度的统计量 B.相关系数是一个随机变量 C.相关系数的绝对值不会大于 1 D.相关系数不会取负值 【答案】D 【解析】相关系数 r 的取值范围是[-1,1]。
1 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台
3.下面的假定中,哪个属于相关分析中的假定( )。 A.两个变量之间是非线性关系 B.两个变量都是随机变量 C.自变量是随机变量,因变量不是随机变量 D.一个变量的数值增大,另一个变量的数值也应增大 【答案】B 【解析】在进行相关分析时,对总体主要有以下两个假定:①两个变量之间是线性关系; ②两个变量都是随机变量。