贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章 多元线性回归)【圣才出品】

合集下载

贾俊平《统计学》章节题库-第十一章至第十二章(圣才出品)

贾俊平《统计学》章节题库-第十一章至第十二章(圣才出品)
2 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台

5.根据下面的散点图,可以判断两个变量之间存在( )。
A.正线性相关关系 B.负线性相关关系 C.非线性关系 D.函数关系 【答案】B 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变 量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,则称为负线性相 关关系。
1 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台

3.下面的假定中,哪个属于相关分析中的假定( )。 A.两个变量之间是非线性关系 B.两个变量都是随机变量 C.自变量是随机变量,因变量不是随机变量 D.一个变量的数值增大,另一个变量的数值也应增大 【答案】B 【解析】在进行相关分析时,对总体主要有以下两个假定:①两个变量之间是线性关系; ②两个变量都是随机变量。
【答案】C 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变
5 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台

量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,即 x 值增大时 y 值随之变小,或 x 值变小时 y 值随之增大,则称为负相关。
12.如果相关系数 r=0,则表明两个变量之间( )。 A.相关程度很低 B.不存在任何关系 C.不存在线性相关关系 D.存在非线性相关关系 【答案】C 【解析】相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。如 果相关系数 r=0,说明两个变量之间不存在线性相关关系。
13.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着 ( )。
2.下面的各问题中,哪个不是相关分析要解决的问题( )。 A.判断变量之间是否存在关系 B.判断一个变量数值的变化对另一个变量的影响 C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系 【答案】B 【解析】相关分析就是对两个变量之间线性关系的描述与度量,它主要解决的问题包括: ①变量之间是否存在关系;②如果存在关系,它们之间是什么样的关系;③变量之间的关系 强度如何;④样本所反映的变量之间的关系能否代表总体变量之间的关系。

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第13章 时间序列分析和预测)【圣才

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第13章 时间序列分析和预测)【圣才

第13章时间序列分析和预测13.1 考点归纳【知识框架】【考点提示】(1)时间序列构成要素及平稳序列、非平稳序列的含义(简答题考点);(2)时间序列的描述性分析(简答题、计算题考点);(3)平稳序列的预测,重点是移动平均法、一次平滑指数法(选择题、简答题、计算题考点)。

【核心考点】考点一:时间序列1.成分分解表13-1 时间序列的成分2.分解模型表13-2 时间序列构成因素的组合模型【注意】四种因素不一定同时存在于每个时间序列中。

一般情况下,经常存在的是长期趋势,季节变动因素和周期变动因素则不一定存在。

3.平稳序列与非平稳序列(1)平稳序列平稳序列是基本上不存在趋势的序列。

这类序列中的观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律,其波动可以看成是随机的。

(2)非平稳序列非平稳序列是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。

其又可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

考点二:时间序列的描述性分析1.速度分析指标(1)增长率环比增长率:G i =(Y i -Y i -1)/Y i -1=Y i /Y i -1-1(i =1,…,n )定基增长率:G i =(Y i -Y 0)/Y 0=Y i /Y 0-1(i =1,…,n )式中,Y 0表示用于对比的固定基期的观察值。

(2)平均增长率(平均增长速度)111n n Y G Y -=⨯⨯-=- 式中,G _表示平均增长率;n 为环比值的个数。

(3)增长率分析中应注意的问题①当时间序列中的观察值出现0或负数时,不宜计算增长率,此时直接用绝对数进行分析;②增长1%的绝对值表示增长率每增长一个百分点而增加的绝对数量,其计算公式为:增长1%的绝对值=前期水平/100。

2.水平分析指标【考点拓展】表13-3考点三:平稳序列的预测1.简单平均法112111()t t t i i F Y Y Y Y t t +==+++=∑ 12121111()11t t t t i i F Y Y Y Y Y t t +++==++++=++∑2.移动平均法对于t+1期的简单移动平均预测值为:F t+1=Y_t=(Y t-k+1+Y t-k+2+…+Y t-1+Y t)/k【注意】移动平均后的序列项数较原序列减少,当k为奇数时,新序列首尾各减少(k -1)/2项;当k为偶数时,首尾各减少k/2项。

贾俊平《统计学》考研真题(含复试)与典型习题详解(数据的概括性度量)【圣才出品】

贾俊平《统计学》考研真题(含复试)与典型习题详解(数据的概括性度量)【圣才出品】

2.统计学期中考试非常简单,为了评估简单程度,教师记录了 9 名学生交上考试试卷
的时间如下(分钟)
33 29
45 60 42 19 52 38 36[东北财经大学
2012 研]
(1)这些数据的极差为( )。
A.3.00
B.-3.00
C.41.00
D.-41.00
【答案】C
【解析】数据按从小到大排序结果如下:
A.0.38
B.0.40
C.0.54
D.2.48
【答案】A
【解析】离散系数也称为变异系数,它是一组数据的标准差与其相应的平均数之比。其
计算公式为: vs
s x
。得到 vs
22.85 0.38 。 12.45
9.已知某工厂生产的某零件的平均厚度是 2 厘米,标准差是 0.25 厘米。如果已知该 厂生产的零件厚度为正态分布,可以判断厚度在 1.5 厘米到 2.5 厘米之间的零件大约占 ( )。[浙江工商大学 2011 研]
圣才电子书 十万种考研考证电子书、题库视频学习平台

5.随机变量 X 的方差为 2,随机变量 Y=2X,那么 y 的方差是( )。[中央财经大学 2011 研]
A.1 B.2 C.4 D.8 【答案】D
【解析】Var(cX ) c2Var(X ) 22 2 8
7.设 X1,X2,…,X n 为随机样本,则哪个统计量能较好地反映样本值的分散程度( )。
[中山大学 2012 研] A.样本平均 B.样本中位数 C.样子书

【答案】C
十万种考研考证电子书、题库视频学习平台
【解析】集中趋势是指 一 组 数 据 向 某 一 中 心 值 靠 拢 的 程 度 ,它 反 映 了 一 组 数 据 中 心

贾俊平《统计学》复习笔记课后习题详解及典型题详解(数据的搜集)【圣才出品】

贾俊平《统计学》复习笔记课后习题详解及典型题详解(数据的搜集)【圣才出品】

第2章数据的搜集2.1 复习笔记一、数据的来源1.数据的直接来源数据的直接来源是指通过直接调查或实验活动直接获得一手数据,直接来源的数据又分为调查数据和实验数据。

它们的不同之处在于:(1)调查数据为通过调查方法得到的数据,而实验数据为通过实验方法得到的数据。

(2)调查数据通常是针对社会现象而获取的,而实验数据大多是针对自然现象而获取的;(3)调查数据通常取自有限总体,即总体所包含的个体单位是有限的;而实验数据是指在实验中通过控制实验对象所搜集到的变量的数据。

2.数据的间接来源(1)间接来源的数据(二手资料)如果与研究内容有关的原信息已经客观存在,只是对这些原信息重新加工、整理,使之成为进行统计分析可以使用的数据,则称为间接来源的数据。

(2)二手资料的优点搜集方便;数据采集快;采集成本低。

(3)二手资料的作用分析所要研究的问题;提供研究问题的背景,帮助研究者更好地定义问题,检验和回答某些假设和疑问,寻找研究问题的思路和途径。

(4)二手资料的局限性针对性不够;资料的相关性不够;口径可能不一致;数据也许不准确,也许过时等。

(5)对二手资料进行评估的内容①资料是谁搜集的?数据搜集者的实力和社会信誉度会在一定程度上影响数据说服力;②搜集的目的是什么?为了某种特殊的利益而搜集的数据是值得怀疑的;③数据是怎样搜集的?搜集数据的方法有很多,不同方法所采集到的数据,其解释力和说服力都是不同的。

如果不了解搜集数据所用的方法,很难对数据的质量做出客观的评价。

数据的质量来源于数据的产生过程;④什么时候搜集的?过时的数据的说服力会受到质疑。

(6)使用二手数据的注意事项使用二手数据,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。

在引用二手数据时,应注明数据的来源,以尊重他人的劳动成果。

二、调查方法1.概率抽样和非概率抽样(1)概率抽样概率抽样(随机抽样):指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

贾俊平统计学第7版课后习题答案

贾俊平统计学第7版课后习题答案
贾俊平的《统计学》是一本经典的统计学优秀教材。作为该教材的学习辅导书,本书具 有以下几个方面的特点:
1.针对性强,解决难点。精选人大、中央财大等名校统计学院的初试和复试的考研真 题,既注重基础知识的掌握,又对一些难题、易错题目给出了详细的解析。本书特别适用于 参加研究生入学考试和复试指定考研参考书目为贾俊平主编的《统计学》的考生。
要深深牢记:考研不同一般考试,概念题(名词解释)要当作简答题来回答,简答题要 当作论述题来解答,而论述题的答案要像是论文,多答不扣分。有的论述题的答案简直就是 一份优秀的论文(其实很多考研真题就是选自一篇专题论文),完全需要当作论文来回答!
统计类国内外经典教材习题详解系列是一套全面解析统计类国内外经典教材的辅导资 料。贾俊平的《统计学》、袁卫的《统计学》是国内最受欢迎的统计学经典教材。本书是各 个高校基础专业课统计学考研真题(含复试)与典型题详解,是参考统计学权威教材、全国 各大院校统计学考卷的结构和内容、统计硕士考试大纲、同等学力人员申请硕士学位试题来
2.题量充足,来源广泛。主要选自 40 余所高校的历年考研真题、名校题库以及参考 众多教材和相关资料改编而成。可以说本书的试题都经过了精心挑选,博选众书,取长补短。
3.解答详尽,条理清晰。本书所选部分考研真题有相当的难度,对每道题都尽可能给 出详细的参考答案,条理分明,便于理解。
需要特别说明的是:有些考题的时间较早或内容有点过时,但很值得参考,不失为优秀 考题,因此仍然选用。我们深深感谢贾俊平教授和中国人民大学出版社为我们提供了这样一 本优秀的统计学教材。
贾俊平《统计学》课后习题答案在线阅读:https:///cUb7v8DC
A.品质标志 B.数量标志 C.标志值 D.数量指标 【答案】A 【解析】“等级”属于分类型数据,只能用文字来描述,因此是品质标志,其标志值为“优 秀”“良好”“及格”。 4 下面不属于描述统计问题的是( )。[山东大学 2015 研] A.根据样本信息对总体进行的推断 B.了解数据分布的特征顺序数据 C.分析感兴趣的总体特征 D.利用图、表或其他数据汇总工具分析数据 【答案】A 【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。 BCD 三项都是描述统计问题。A 项中根据样本信息对总体进行推断则是推断统计内容。 5 一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。调查结果表明:45%的年 轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题, 15%的年轻人愿意与其父母讨论爱情问题。该调查所收集的数据是( )。[山东大学 2015 研] A.分类数据 B.顺序数据 C.数值型数据

统计学原理贾俊平12

统计学原理贾俊平12

表12-2 加权综合指数计算表
销售量
单价(元)
销售额(元)
商品名称
计量 单位
2019
q0
2019 q1
2019 p0
2019 p1
2019 p0q0
2019 p1q1
p0q1
p1q0
粳米 标准粉 花生油
kg 1200 1500 3.6 kg 1500 2000 2.3 kg 500 600 9.8
4.0 4320 6000 5400 4800 2.4 3450 4800 4600 3600 10.6 4900 6360 5880 5300
2. 指数的性质
相对性:总体变量在不同场合下对比形成的相对数
不同时间上对比形成的指数称为时间性指数 不同空间上对比形成的指数称为区域性指数
综合性:反映一组变量在不同场合下的综合变动 平均性:指数是总体水平的一个代表性数值
12 - 5
经济、管理类 基础课程
统计学
指数的分类
指数的分类
固定时期变量值加权的综合指数
统计学
(实例)
【例12.3】设某企业生产三种产品的有关资料如表12-3。 试以1990年不变价格为权数,计算各年的产品产量指数
商品名称 甲
某企业生产三种产品的有关资料
计量 单位
1994
销售量 2019
2019

1000
960
1100
1990年 不变价格
(元)
50


120
q99 65
p9q 096 564 1 50 .0 0% 6 0 1 p9q 095 532500
q99 64
p9q 096 564 1 50 .0 5% 6 0 1 p9q 094 530000

(完整版)统计学贾俊平考研知识点总结

(完整版)统计学贾俊平考研知识点总结

统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。

(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。

内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。

(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。

研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。

其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。

(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

(1)分类数据是只能归于某一类别的非数字型数据。

它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。

(2)顺序数量是只能归于某一有序类别的非数字型数据。

也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。

(3)数值型数据是按数字尺度测量的观察值。

其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。

总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。

三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。

通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。

贾俊平《统计学》章节题库(含考研真题)(8-10章)【圣才出品】

贾俊平《统计学》章节题库(含考研真题)(8-10章)【圣才出品】
3 / 117

销售量为 99.32 吨,即无法轻易肯定广告可使每天的销售量达到 100 吨,则原假设和备择 假设应该为:H0:μ≤100,H1:μ>100。
7.在假设检验中,两个总体 X~N(μ1,σ12),Y~N(μ2,σ22),其中 μ1,μ2 未知, 检验 σ12 是否等于 σ22 应用( )。[浙江工商大学 2011 研]
6.某企业计划投资 2 万元的广告费以提高某种新产品的销售量,企业经理认为做了广 告可使每天销售量达 100 吨。实行此计划 9 天后经统计知,这 9 天的日平均销售量为 99.32 吨。假设每天的销售量服从正态分布 N(μ,σ2),在 α=0.05 的显著性水平下,检验此项 计划是否达到了该企业经理的预计效果,建立的原假设和备择假设为( )。[浙江工商大 学 2011 研]
4.抽取样本容量为 100 的随机样本对总体的均值进行检验,检验的假设为 H0:μ≤μ0, H1:μ>μ0,显著性水平 α=0.05,zc 为检验统计量的样本值,那么 P 值为( )。[对外 经济贸易大学 2015 研]
A.P(z>zc) B.P(z<zc) C.P(z>1.96) D.P(z<-1.96) 【答案】A 【解析】题中,样本量 n=100≥30,σ2 未知,在给定的显著性水平 α 下,对于右单侧 检验而言,P 值为检验统计量的值超过由样本所计算出的检验统计量的数值的概率,即 P 值 =P(z>zc)。
1 / 117

3.在假设检验中,不拒绝原假设意味着( )。[山东大学 2015 研] A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的 【答案】D 【解析】假设检验的目的是寻找足够的证据来拒绝原假设。不拒绝原假设意味着在统计 意义上没有证据证明原假设是错误的。

贾俊平《统计学》章节题库(含考研真题)(多元线性回归)【圣才出品】

贾俊平《统计学》章节题库(含考研真题)(多元线性回归)【圣才出品】
t ˆi ~ t(n k 1)
sˆi
s∧
其中 βˆi 是回归系数βi 的抽样分布的标准差,k 为回归方程中自变量的个数。
2 / 34
圣才电子书 十万种考研考证电子书、题库视频学习平台

4.多元线性回归分析中,如果 F 检验表明线性关系显著,则意味着( )。[华中农 业大学 2015 研;浙江工商大学 2011 研;安徽财经大学 2012 样题]
7.进行多元线性回归时,如果回归模型中存在多重共线性,则( )。[中国海洋大 学 2018 研;浙江工商大学 2011 研;安徽财经大学 2012 样题]
A.整个回归模型的线性关系不显著 B.肯定有一个回归系数通不过显著性检验 C.肯定导致某个回归系数的符号与预期的相反 D.可能导致某些回归系数通不过显著性检验 【答案】D 【解析】在回归分析中存在多重共线性时将会产生某些问题:首先,变量之间高度相关 时,可能会使回归的结果造成混乱,甚至会把分析引入歧途;其次,多重共线性可能对参数 估计值的正负号产生影响,特别是正负号有可能同预期的正负号相反。某些重要的解释变量 的回归系数 t 检验不显著而同时整个回归模型的线性关系检验显著,则通常预示着解释变量 间存在多重共线性。
重判定系数记为 R2a,其计算公式为:
Ra2
1
1
R2
n 1 n k 1

其值可能出现负值。
2.在多元线性回归分析中,F 检验时的 F 值越大,则意味着( )。[武汉大学 2015 研]
A.随机误差的影响越大 B.相关系数 R 的值越小
9.关于多元线性回归模型的说法,正确的是( )。 A.如果模型的 R2 很高,可以认为此模型的质量较好 B.如果模型的 R2 很低,可以认为此模型的质量较差 C.如果某一参数不能通过显著性检验,应该剔除该解释变量 D.如果某一参数不能通过显著性检验,不应该随便剔除该解释变量 【答案】D 【解析】当模型的解释变量间存在多重共线性时,往往会导致某些重要的解释变量的回 归系数 t 检验不显著而同时回归模型却有较高的 R2 值。因此当某一变量的回归系数不能通 过显著性检验时,不应该随便剔除该解释变量;同时回归模型有较高的 R2 值也不能说明该

贾俊平《统计学》配套题库 【课后习题】详解 第11章~第12章【圣才出品】

贾俊平《统计学》配套题库  【课后习题】详解  第11章~第12章【圣才出品】

第11章一元线性回归一、思考题1.解释相关关系的含义,说明相关关系的特点。

答:变量之间存在的不确定的数量关系,称为相关关系。

相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。

对这种关系不确定的变量是不能用函数关系进行描述的。

2.相关分析主要解决哪些问题?答:相关分析就是对两个变量之间线性关系的描述与度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本所反映的变量之间的关系能否代表总体变量之间的关系。

3.相关分析中有哪些基本假定?答:在进行相关分析时,对总体主要有以下两个假定:(1)两个变量之间是线性关系;(2)两个变量都是随机变量。

4.简述相关系数的性质。

答:相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。

若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r 。

相关系数的性质:(1)r 的取值范围在-1~+1之间,即-1≤r ≤1。

若0<r ≤1,表明x 与y 之间存在正线性相关关系;若-1≤r <0,表明x 与y 之间存在负线性相关关系;若r =+1,表明x 与y 之间为完全正线性相关关系;若r =-1,表明x 与y 之间为完全负线性相关关系。

可见当|r |=1时,y 的取值完全依赖于x ,二者之间即为函数关系;当r =0时,说明y 的取值与x 无关,即二者之间不存在线性相关关系。

(2)r 具有对称性。

x 与y 之间的相关系数xy r 和y 与x 之间的相关系数yx r 相等,即xy r =yx r 。

(3)r 数值大小与x 和y 的原点及尺度无关。

改变x 和y 的数据原点及计量尺度,并不改变r 数值大小。

(4)r 仅仅是x 与y 之间线性关系的一个度量,它不能用于描述非线性关系。

2023统计学第七版贾俊平课后习题答案

2023统计学第七版贾俊平课后习题答案

2023统计学第七版贾俊平课后习题答案第一章1.1 习题答案1.答案:根据题意,我们需要求得这 60 个挑选出来的人中有多少个人来自纽约市,而纽约市占比是 5%,所以答案应为 $60 \\times 0.05 = 3$2.答案:根据题意,我们需要求得这 60 个挑选出来的人中有多少个人来自纽约市并且是女性,而纽约市总体中女性的占比是 53%,所以答案应为 $60 \\times 0.05 \\times 0.53 = 1.59$1.2 习题答案1.答案:根据题意,我们需要求得这家电视公司进入市场的概率。

已知电视公司市场占有率为 10%,而市场占有率的补集为失败率,所以电视公司进入市场的概率为1−0.10=0.902.答案:根据题意,我们需要求得这两家公司都进入市场的概率。

已知电视公司进入市场的概率为 0.90,而两家公司都进入市场的概率为两者概率相乘,所以两家公司都进入市场的概率为 $0.90 \\times 0.90 = 0.81$第二章2.1 习题答案1.答案:根据题意,我们需要求得两次抛掷硬币都为正面向上的概率。

已知硬币正面朝上的概率为 0.5,而两次抛掷硬币都为正面向上的概率为两者概率相乘,所以两次抛掷硬币都为正面向上的概率为 $0.5 \\times 0.5 = 0.25$2.答案:根据题意,我们需要求得至少一次抛掷硬币为正面向上的概率。

已知硬币正面朝上的概率为 0.5,而至少一次抛掷硬币为正面向上的概率为 1 减去两次都为背面向上的概率,所以至少一次抛掷硬币为正面向上的概率为 $1 - (0.5 \\times 0.5) = 0.75$2.2 习题答案1.答案:根据题意,我们需要求得至少一辆汽车需要检测两次才能检查到故障的概率。

已知单次检测不到故障的概率为 0.1,而至少一辆汽车需要检测两次才能检查到故障的概率为 1 减去两次都未检测到故障的概率,所以至少一辆汽车需要检测两次才能检查到故障的概率为 $1 - (0.1 \\times 0.1) = 0.99$2.答案:根据题意,我们需要求得两辆车都不需要检测两次才能检查到故障的概率。

统计学(贾俊平版)重点【精选文档】

统计学(贾俊平版)重点【精选文档】

第一章统计:收集、处理、分析、解释数据并从数据中得出结论的科学。

数据1. 分类数据对事物进行分类的结果数据,表现为类别,用文字来表述。

例如,人口按性别分为男、女两类2。

顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3. 数值型数据对事物的精确测度,结果表现为具体的数值.例如:身高为175cm ,168cm,183cm总体–所研究的全部元素的集合,其中的每一个元素称为个体–分为有限总体和无限总体.有限总体的范围能够明确确定,且元素的数目是有限的。

无限总体所包括的元素是无限的,不可数的样本–从总体中抽取的一部分元素的集合–构成样本的元素数目称为样本容量参数:描述总体特征。

有总体均值( )、标准差(σ)总体比例(π)统计量:描述样本特征。

样本标准差(s),样本比例(p)变量:说明现象某种特征,分类,顺序,数值型:离散型,连续型。

经验,理论变量描述统计研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法.推断统计是研究如何利用样本数据进行推断总体特征第二章间接数据(查询的)与直接数据:调查(通常是对社会现象而言的)普查信息全面完整。

再一个是实验。

概率抽样:也称随机抽样。

按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中–每个单位被抽中的概率是已知的,或是可以计算出来的–当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的分层抽样:优点:保证样本的结构与总体的结构比较相近将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,从而提高估计的精度–组织实施调查方便–既可以对总体参数进行估计,也可以对各层的目标量进行估计整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查优点:抽样时只需群的抽样框,可简化工作量–调查的地点相对集中,节省调查费用,方便调查的实施–缺点是统计的精度较差系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位–先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位操作简便,可提高估计的精度多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查–群是初级抽样单位,第二阶段抽取的是最终抽样单位.将该方法推广,使抽样的段数增多,就称为多阶段抽样非概率抽样:方便抽样(自行确定入抽样本单位),判断抽样(根据经验判断),自愿样本(被调查者自愿参加),滚雪球抽样(对稀少群体的调查),配额抽样(先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位)。

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章多元线性回归)【圣才出品】

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章多元线性回归)【圣才出品】

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章多元线性回归)【圣才出品】第12章多元线性回归12.1 考点归纳【知识框架】【考点提⽰】(1)多元线性回归模型,包括回归模型的基本假定(简答题考点),最⼩⼆乘估计(选择题、计算题考点);(2)回归模型的拟合优度评价(简答题、计算题考点);(3)显著性检验(计算题考点);(4)多重共线性的含义、产⽣的问题、判别及处理⽅式(简答题考点)。

【核⼼考点】考点⼀:多元线性回归模型1.回归模型假定(1)E (ε)=0;(2)D (ε)=σ2;(3)()2cov ,0i j i j i j σεε?==?≠?2.参数的最⼩⼆乘估计使残差平⽅和Q =∑(y i -y ∧i )2=∑(y ∧i =β∧0-β∧1x 1-β∧2x 2-…-β∧k x k )2达到最⼩的β∧0,β∧1,β∧2,…,β∧k 。

由此可以得到求解β∧0,β∧1,β∧2,…,β∧k 的标准⽅程组为:00?0?00,1,2,,i i ββi ββQ βQ i k β==??===???多元线性回归的最⼩⼆乘估计是最优线性⽆偏估计。

考点⼆:回归⽅程的拟合优度表12-1 多元线性回归⽅程的评价【提⽰】实际应⽤中,采⽤调整的判定系数来评价多元回归⽅程的拟合优度。

【真题精选】多元线性回归模型的调整的多重判定系数取值范围在0⾄1之间。

[对外经济贸易⼤学2018研]【答案】√【解析】多重判定系数R2=SSR/SST是多元回归中的回归平⽅和占总平⽅和的⽐例,它是度量多元回归⽅程拟合程度的⼀个统计量,反映了在因变量y的变差中被估计的回归⽅程所解释的⽐例,取值为0~1。

调整的多重判定系数R a2与多重判定系数R2不同之处在于:R a2同时考虑了样本量n和模型中⾃变量的个数k的影响,这就使得R a2的值永远⼩于R2,⽽且R a2的值不会由于模型中⾃变量个数的增加⽽越来越接近1,因此R a2的取值也为0~1。

贾俊平《统计学》考研考点大全

贾俊平《统计学》考研考点大全
图 1-1 统计研究的过程
— 2—
贾俊平《统计学》考点精讲
数据分析方法分类:描述统计方法和推断统计方法,描述是推断统计的前提,推断统计是描述统 计的发展。
描述统计是研究数据收集、处理、汇总、图表描述、概括与分析等的统计方法,通常采用集中量数、 差异量数、地位量数、相关系数等概括性的度量工具;反映研究总体的直观特征、外在联系或横向比较 结果等浅表性信息。
第十一章 一元线性回归 (116) 第一节 变量间关系的度量 (116) 第二节 一元线性回归 (121) 第三节 利用回归方程进行预测 (128) 第四节 残差分析 (129)
第二章 数据的搜集 (6) 第一节 数据的来源 (6) 第二节 调查数据 (7) 第三节 数据的误差 (10)
第七章 参数估计 (62) 第一节 参数估计的基本原理 (62) 第二节 一个总体参数的区间估计 (66) 第三节 两个总体参数的区间估计 (70) 第四节 样本量的确定 (73)
内容体系和章节分配
描述统计:前四章
推断统计:第五章至第十一章
统计应用:第十二章至第十四章
第 1章 导论 第 2章 数据的搜集
第 3章 数据的图表展示
第 4章 数据的概括性度量
第 5章 概率与概率分布
第 6章 统计量及其抽样分布
第 7章 参数估计
第 8章 假设检验
第 9章 列联分析
第十章 方差分析 (99) 第一节 方差分析引论 (99) 第二节 单因素方差分析 (102) 第三节 双因素方差分析 (110)
第 10章 方差分析
第 11章 一元线性回归
第 12章 多元线性回归
第 13章 时间序列分析和预测
第 14章 指数

贾俊平《统计学》考研真题(含复试)与典型习题详解 第13章~第14章【圣才出品】

贾俊平《统计学》考研真题(含复试)与典型习题详解  第13章~第14章【圣才出品】
8.移动平均法是通过计算逐项移动的序时平均数,来形成派生数列,从而达到( ) 对数列的影响。[中央财经大学 2012 研]
A.消除偶然因素引起的不规则变动 B.消除非偶然因素引起的不规则变动 C.消除绝对数变动 D.消除计算误差 【答案】A 【解析】平稳时间序列通常只含有随机成分,其预测方法主要有简单平均法、移动平均 法和指数平滑法等,这些方法主要是通过对时间序列进行平滑以消除其随机波动。
1 / 72
圣才电子书 十万种考研考证电子书、题库视频学习平台

测值逐渐降低,并以 0 为极限。
3.某一时间数列,当取时间变量t=1,2,3,……时,有Y=38+72t,若取t=0, 2,4,……,则趋势方程为( )。[浙江工商大学 2011 研]
A.y=38+144t B.y=110+36t C.y=72+110t D.y=34+36t 【答案】B
【解析】线性趋势方程式 Yˆt b0 b1t 中, Yˆt 代表时间序列 Yt 的预测值;t 代表时间标 号;b0 代表趋势线在 Y 轴上的截距,是当 t=0 时, Yˆt 的数值;b1 是趋势线的斜率,表示
时问 t 变动一个单位,观察值的平均变动数量。
4.如果时间序列不存在季节变动,则各期的季节指数应( )。[安徽财经大学 2012
10.时间序列分析中,计算季节指数通常采用的是( )。[中南财大 2003 研] A.同期平均法 B.最小平方法 C.几何平均法 D.调和平均法 【答案】A 【解析】计算季节指数较常用的是同期平均法和趋势剔除法。
3 / 72
圣才电子书 十万种考研考证电子书、题库视频学习平台

7.如果时间序列的环比增长量大致相等,则应采用的趋势模型为( )。[中央财经大 学 2012 研]

贾俊平《统计学》复习笔记课后习题详解及典型题详解 第11章~第12章【圣才出品】

贾俊平《统计学》复习笔记课后习题详解及典型题详解  第11章~第12章【圣才出品】
3 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台
4 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台

图 11-1 不同形态的散点图
(4)相关系数
通过散点图可以判断两个变量之间有无相关关系,并对变量间的关系形态作出大致的描
有所差异。样本相关系数是总体相关系数的一致估计量。样本相关系数记为 r,其计算公式
为:
r
n xy x y
n x2 ( x)2 n y2 ( y)2
按照上述计算公式计算的相关系数也称为线性相关系数,或 Pearson 相关系数。 ②相关系数的性质 a.r 的取值范围在-1~+1 之间,即-1≤r≤1。若 0<r≤1,表明 x 与 y 之间存在正 线性相关关系;若-1≤r<0,表明 x 与 y 之间存在负线性相关关系;若 r=+1,表明 x 与
5 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台

y 之间为完全正线性相关关系;若 r=-1,表明 x 与 y 之间为完全负线性相关关系。可见当 |r|=1 时,y 的取值完全依赖于 x,二者之间即为函数关系;当 r=0 时,说明 y 的取值与 x 无关,即二者之间不存在线性相关关系。|r|→1 说明两个变量之间的线性关系越强;|r|→0 说明两个变量之间的线性关系越弱。
b.r 具有对称性。x 与 r 之间的相关系数 rxy 和 y 与 x 之间的相关系数 ryx 相等,即 rxy =ryx。
c.r 数值大小与 x 和 y 的原点及尺度无关。改变 x 和 y 的数据原点及计量尺度,并不 改变 r 的数值大小。
述,但不能准确反映变量之间的关系强度。需要计算相关系数来准确度量两个变量之间的关
系强度。

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第一章至第三章【圣才出品】

贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第一章至第三章【圣才出品】

第1章导论1.1考点归纳【知识框架】【考点提示】(1)统计学的目的(选择题考点);(2)描述统计和推断统计的区分、参数估计和假设检验的区分(选择题考点);(3)统计数据类型、分类、各自特点及其具体应用(选择题、简答题考点)(非常重要);(4)统计学中的基本概念(选择题、简答题考点)。

【核心考点】考点一:统计数据的类型(见表1-1)表1-1统计数据的类型【注意】①分类数据和顺序数据说明的是事物的品质特征,其结果均表现为类别,因而也统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,因此也称为定量数据或数量数据。

②对不同类型的数据采用不同的统计方法来处理和分析。

对分类数据可以计算出各类别的频率,而数值型数据则可以进行数学运算。

【真题精选】1.在对数据进行汇总时,往往将男性用“1”来表示,女性用“0”来表示,所以将性别视为数值型变量。

[对外经济贸易大学2018研]【答案】×【解析】数值型变量是说明事物数字特征的一个名称,其取值是数值型数据,数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值;分类变量是说明事物类别的一个名称,其取值是分类数据,分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。

性别是分类变量,为便于统计处理,对于分类变量可以用数字代码来表示各个类别。

2.下列数据不属于时间序列数据的是()。

[四川大学2016研]A.1990~2014年我国每年进出口总额B.2014年某品牌手机在中国各个省市的销售量C.成都市2014年每个月的PM2.5月平均浓度D.某股票在2015年1月的日收盘价【答案】B【解析】时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。

本题中B项是在相同的时间点、不同的空间上获得的数据,属于截面数据。

考点二:统计中的基本概念1.总体和样本(1)总体、个体(2)样本、样本量2.参数和统计量(1)参数:用于描述总体特征,是未知的常数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第12章多元线性回归
12.1 考点归纳
【知识框架】
【考点提示】
(1)多元线性回归模型,包括回归模型的基本假定(简答题考点),最小二乘估计(选择题、计算题考点);
(2)回归模型的拟合优度评价(简答题、计算题考点);
(3)显著性检验(计算题考点);
(4)多重共线性的含义、产生的问题、判别及处理方式(简答题考点)。

【核心考点】
考点一:多元线性回归模型
1.回归模型假定
(1)E (ε)=0;
(2)D (ε)=σ2;
(3)()2
cov ,0
i j i j i j σεε⎧==⎨≠⎩
2.参数的最小二乘估计
使残差平方和
Q =∑(y i -y ∧i )2=∑(y ∧i =β∧0-β∧1x 1-β∧2x 2-…-β∧k x k )2达到最小的β∧0,β∧1,β∧2,…,β∧k 。

由此可以得到求解β∧0,β∧1,β∧2,…,β∧k 的标准方程组为:
00ˆ0ˆ00,1,2,,i i ββi ββQ βQ i k β==⎧∂=⎪∂⎪⎨∂⎪==⎪∂⎩
多元线性回归的最小二乘估计是最优线性无偏估计。

考点二:回归方程的拟合优度
表12-1 多元线性回归方程的评价
【提示】实际应用中,采用调整的判定系数来评价多元回归方程的拟合优度。

【真题精选】
多元线性回归模型的调整的多重判定系数取值范围在0至1之间。

[对外经济贸易大学2018研]
【答案】√
【解析】多重判定系数R2=SSR/SST是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例,取值为0~1。

调整的多重判定系数R a2与多重判定系数R2不同之处在于:R a2同时考虑了样本量n和模型中自变量的个数k的影响,这就使得R a2的值永远小于R2,而且R a2的值不会由于模型中自变量个数的增加而越来越接近1,因此R a2的取值也为0~1。

考点三:显著性检验
1.线性关系检验
检验统计量: ()
(),11SSR k F F k n
k SSE n k =----
2.回归系数检验和推断
检验统计量t 式中,ˆi s s β=
若|t|>t α/2,则拒绝原假设;若|t|<t α/2,则不拒绝原假设。

考点四:多重共线性
1.多重共线性产生的问题
(1)可能会使回归结果产生混乱,方程和参数的显著性检验失效。

(2)可能对参数估计值的正负号产生影响。

(3)模型的预测功能失效。

ˆˆ~(1)i i t t n k s ββ=
--
2.多重共线性的判别
(1)对自变量之间的相关系数进行显著性检验,发现自变量之间显著相关;
(2)模型F检验显著,而几乎所有回归系数βi的检验不显著;
(3)回归系数的正负号与预期的相反;
(4)容忍度(1-R i2)小于0.1或方差扩大因子VIF=1/(1-R i2)大于10;(5)当增加或删减一个自变量,或者改变一个观测值时,回归系数发生较大变化;(6)一些重要自变量的回归系数标准误差较大。

3.多重共线性问题的处理
(1)将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关。

(2)差分法。

对于时间序列数据、线性模型,常将原模型变换为差分模型。

(3)减小参数估计量的方差,如使用岭回归法。

【真题精选】
如果回归模型中存在多重共线性,则()。

[中国海洋大学2018研]
A.整个回归模型的线性关系不显著
B.肯定有一个回归系数通不过显著性检验
C.肯定导致某个回归系数的符号与预期的相反
D.肯定导致某些回归系数通不过显著性检验
【答案】D
【解析】当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重
共线性。

如果出现下列情况,暗示存在多重共线性:①模型中各对自变量之间显著相关;②当模型的线性关系检验(F检验)显著时,几乎所有回归系数βi的t检验却不显著;③回归系数的正负号与预期的相反。

12.2 课后习题详解
一、思考题
1.解释多元回归模型、多元回归方程、估计的多元回归方程的含义。

答:(1)多元回归模型:设因变量为y,k个自变量分别为x1,x2,…,x k,描述因变量y如何依赖于自变量x1,x2,…,x k和误差项ε的方程称为多元回归模型。

其一般形式可表示为:
y=β0+β1x1+β2x2+…+βk x k+ε
式中,β0,β1,β2,…,βk是模型的参数,ε为误差项。

(2)多元回归方程:根据回归模型的假定有E(y)=β0+β1x1+β2x2+…+βk x k,称为多元回归方程,它描述了因变量y的期望值与自变量x1,x2,…,x k之间的关系。

(3)估计的多元回归方程:回归方程中的参数β0,β1,β2,…,βk是未知的,需要利用样本数据去估计它们。

当用样本统计量β∧0,β∧1,β∧2,…,β∧k去估计回归方程中的未知参数β0,β1,β2,…,βk时,就得到了估计的多元回归方程,其一般形式为:
y∧=β∧0+β∧1x1+β∧2x2+…+β∧k x k
式中,β∧0,β∧1,β∧2,…,β∧k是参数β0,β1,β2,…,βk的估计值,y∧是因变量y的估计值。

其中β1,β2,…,βk称为偏回归系数。

相关文档
最新文档