贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第11章 一元线性回归)【圣才出品】
贾俊平《统计学》章节题库-第十一章至第十二章(圣才出品)
![贾俊平《统计学》章节题库-第十一章至第十二章(圣才出品)](https://img.taocdn.com/s3/m/d5db7bc7af1ffc4fff47ac8a.png)
圣才电子书 十万种考研考证电子书、题库视频学习平台
5.根据下面的散点图,可以判断两个变量之间存在( )。
A.正线性相关关系 B.负线性相关关系 C.非线性关系 D.函数关系 【答案】B 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变 量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,则称为负线性相 关关系。
1 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台
3.下面的假定中,哪个属于相关分析中的假定( )。 A.两个变量之间是非线性关系 B.两个变量都是随机变量 C.自变量是随机变量,因变量不是随机变量 D.一个变量的数值增大,另一个变量的数值也应增大 【答案】B 【解析】在进行相关分析时,对总体主要有以下两个假定:①两个变量之间是线性关系; ②两个变量都是随机变量。
【答案】C 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变
5 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台
量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,即 x 值增大时 y 值随之变小,或 x 值变小时 y 值随之增大,则称为负相关。
12.如果相关系数 r=0,则表明两个变量之间( )。 A.相关程度很低 B.不存在任何关系 C.不存在线性相关关系 D.存在非线性相关关系 【答案】C 【解析】相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。如 果相关系数 r=0,说明两个变量之间不存在线性相关关系。
13.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着 ( )。
2.下面的各问题中,哪个不是相关分析要解决的问题( )。 A.判断变量之间是否存在关系 B.判断一个变量数值的变化对另一个变量的影响 C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系 【答案】B 【解析】相关分析就是对两个变量之间线性关系的描述与度量,它主要解决的问题包括: ①变量之间是否存在关系;②如果存在关系,它们之间是什么样的关系;③变量之间的关系 强度如何;④样本所反映的变量之间的关系能否代表总体变量之间的关系。
统计学贾俊平 (11)
![统计学贾俊平 (11)](https://img.taocdn.com/s3/m/14d705d876eeaeaad1f33033.png)
Y
i 1
n
i
n
428885.5 47653.94 (亿元) 9
经济、管理类 基础课程
绝对数序列的序时平均数
(计算方法)
统计学
时点序列— 间隔不相等
Y1 T1 Y2 T2 Y3 Y4 T3 Yn-1 Tn-1 Yn
11 - 13
经济、管理类 基础课程
绝对数序列的序时平均数
(计算方法)
11 - 17
经济、管理类 基础课程
相对数序列的序时平均数
(计算方法)
统计学
1. 先分别求出构成相对数或平均数的分子ai 和分母 bi 的平均数
2. 再进行对比,即得相对数或平均数序列的 序时平均数 3. 基本公式为 a Y b
11 - 18
经济、管理类 基础课程
相对数序列的序时平均数
(计算方法与实例)
(要点)
报告期水平与前一时期水平之比
统计学
1. 环比增长速度基
Yi Yi 1 Yi Gi 1 Yi 1 Yi 1
(i 1,2,, n)
2. 定基增长速度
报告期水平与某一固定时期水平之比
Yi Y0 Yi Gi 1 Y0 Y0
统计学贾俊平考研知识点总结
![统计学贾俊平考研知识点总结](https://img.taocdn.com/s3/m/f591bbe8e87101f69f3195c6.png)
统计学重点笔记第一章导论一、比拟描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。
〔1〕描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。
内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。
〔2〕推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。
研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取局部个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。
其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。
〔3〕两者的关系:描述统计是根底,推断统计是主体二、比拟分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
〔1〕分类数据是只能归于某一类别的非数字型数据。
它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。
〔2〕顺序数量是只能归于某一有序类别的非数字型数据。
也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。
〔3〕数值型数据是按数字尺度测量的观察值。
其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。
总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。
三、比拟总体、样本、参数、统计量和变量:〔1〕总体是包含所研究的全部个体的集合。
通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。
贾俊平统计学第7版课后习题答案
![贾俊平统计学第7版课后习题答案](https://img.taocdn.com/s3/m/4b72de6e2b160b4e767fcf54.png)
1.针对性强,解决难点。精选人大、中央财大等名校统计学院的初试和复试的考研真 题,既注重基础知识的掌握,又对一些难题、易错题目给出了详细的解析。本书特别适用于 参加研究生入学考试和复试指定考研参考书目为贾俊平主编的《统计学》的考生。
要深深牢记:考研不同一般考试,概念题(名词解释)要当作简答题来回答,简答题要 当作论述题来解答,而论述题的答案要像是论文,多答不扣分。有的论述题的答案简直就是 一份优秀的论文(其实很多考研真题就是选自一篇专题论文),完全需要当作论文来回答!
统计类国内外经典教材习题详解系列是一套全面解析统计类国内外经典教材的辅导资 料。贾俊平的《统计学》、袁卫的《统计学》是国内最受欢迎的统计学经典教材。本书是各 个高校基础专业课统计学考研真题(含复试)与典型题详解,是参考统计学权威教材、全国 各大院校统计学考卷的结构和内容、统计硕士考试大纲、同等学力人员申请硕士学位试题来
2.题量充足,来源广泛。主要选自 40 余所高校的历年考研真题、名校题库以及参考 众多教材和相关资料改编而成。可以说本书的试题都经过了精心挑选,博选众书,取长补短。
3.解答详尽,条理清晰。本书所选部分考研真题有相当的难度,对每道题都尽可能给 出详细的参考答案,条理分明,便于理解。
需要特别说明的是:有些考题的时间较早或内容有点过时,但很值得参考,不失为优秀 考题,因此仍然选用。我们深深感谢贾俊平教授和中国人民大学出版社为我们提供了这样一 本优秀的统计学教材。
贾俊平《统计学》课后习题答案在线阅读:https:///cUb7v8DC
A.品质标志 B.数量标志 C.标志值 D.数量指标 【答案】A 【解析】“等级”属于分类型数据,只能用文字来描述,因此是品质标志,其标志值为“优 秀”“良好”“及格”。 4 下面不属于描述统计问题的是( )。[山东大学 2015 研] A.根据样本信息对总体进行的推断 B.了解数据分布的特征顺序数据 C.分析感兴趣的总体特征 D.利用图、表或其他数据汇总工具分析数据 【答案】A 【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。 BCD 三项都是描述统计问题。A 项中根据样本信息对总体进行推断则是推断统计内容。 5 一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。调查结果表明:45%的年 轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题, 15%的年轻人愿意与其父母讨论爱情问题。该调查所收集的数据是( )。[山东大学 2015 研] A.分类数据 B.顺序数据 C.数值型数据
贾俊平的《统计学》(第7版)学习辅导书(11-14章)【圣才出品】
![贾俊平的《统计学》(第7版)学习辅导书(11-14章)【圣才出品】](https://img.taocdn.com/s3/m/6234226a6137ee06eff918e2.png)
2.在线性回归分析中,残差平方和 SSE 相对总平方和 SST 越小意味着( )。[武汉 大学 2015 研]
A.线性关系越不显著 B.随机误差产生的影响相对越小,模型越有效 C.线性关系之外的其它因素的影响相对越大 D.统计软件中的 F 值越小 【答案】B 【解析】在线性回归分析中,残差平方和 SSE 相对总平方和 SST 越小,则回归平方和 SSR 相对总平方和越大,F 检验统计量的值越大;从而线性关系越显著,线性关系之外的其他因
D.等于自变量的平方根
【答案】C
【解析】回归分析中的估计标准误差是度量各实际观测点在直线周围的散布状况的一个
统计量,它是均方残差(MSE)的平方根,用 se 来表示,其计算公式为:
se
yi yˆi 2 SSE MSE
n2
n2
∧
4.产量(X,台)与单位产品成本(Y,元/台)之间的回归方程为Y=248-2.6X,下列 解释合理的是( )。[对外经济贸易大学 2015 研]
3 / 158
圣才电子书 十万种考研考证电子书、题库视频学习平台
7.在回归分析中,残差平方和 SSE 反映了 y 的总变差中( )。[浙江工商大学 2011 研、安徽财经大学 2012 样题]
A.除了 x 对 y 的线性影响之外的其他因素对 y 变差的影响 B.由于 x 与 y 之间的线性关系引起的 y 的变化部分 C.由于 x 与 y 之间的非线性关系引起的 y 的变化部分 D.由于 y 的变化引起的 x 的误差 【答案】A 【解析】残差平方和或误差平方和是除了 x 对 y 的线性影响之外的其他因素对 y 变差的 作用,是不能由回归直线来解释的 yi 变差部分,记为 SSE。
10.欲调查两变量(X 和 Y)的相互关系,收集一份数据作线性相关分析,经计算得到 样本相关系数 r=0.38,可以说( )。[中山大学 2011 研]
统计学 贾俊平 考研 知识点总结
![统计学 贾俊平 考研 知识点总结](https://img.taocdn.com/s3/m/3663148a8bd63186bcebbcf0.png)
统计学重点笔记第一章导论一、比较描述统计与推断统计:数据分析就是通过统计方法研究数据,其所用的方法可分为描述统计与推断统计。
(1)描述性统计:研究一组数据的组织、整理与描述的统计学分支,就是社会科学实证研究中最常用的方法,也就是统计分析中必不可少的一步。
内容包括取得研究所需要的数据、用图表形式对数据进行加工处理与显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。
(2)推断统计学:就是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。
研究者所关心的就是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就就是推断统计所要解决的问题。
其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。
(3)两者的关系:描述统计就是基础,推断统计就是主体二、比较分类数据、顺序数据与数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据与数值型数据。
(1)分类数据就是只能归于某一类别的非数字型数据。
它就是对事物进行分类的结果,数据表现为类别,就是用文字来表达的,它就是由分类尺度计量形成的。
(2)顺序数量就是只能归于某一有序类别的非数字型数据。
也就是对事物进行分类的结果,但这些类别就是有顺序的,它就是由顺序尺度计量形成的。
(3)数值型数据就是按数字尺度测量的观察值。
其结果表现为具体的数值,现实中我们所处理的大多数都就是数值型数据。
总之,分类数据与顺序数据说明的就是事物的本质特征,通常就是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的就是现象的数量特征,通常就是用数值来表现的,因此可称为定量数据或数量数据。
三、比较总体、样本、参数、统计量与变量:(1)总体就是包含所研究的全部个体的集合。
通常就是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第九章至第十一章【圣才出品】
![贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第九章至第十一章【圣才出品】](https://img.taocdn.com/s3/m/349807b7c5da50e2534d7f72.png)
第9章分类数据分析9.1考点归纳【知识框架】【考点提示】(1)χ2统计量的计算公式及应用(计算题考点);(2)拟合优度检验(一个分类变量)和独立性检验(两个分类变量)(简答题、计算题考点);(3)列联表中的相关测量:三个系数的计算公式、特点及应用(选择题、简答题、计算题考点)。
【核心考点】考点一:χ2统计量(1)χ2统计量计算公式22()o e ef f f χ-=∑f o 表示观察值频数,用f e 表示期望值频数。
(2)χ2统计量的特征①χ2≥0;②χ2统计量的分布与自由度有关;③χ2统计量描述了观察值与期望值的接近程度。
(3)χ2分布与自由度的关系χ2分布随着自由度的增加而向右倾斜,且逐渐趋近于对称的正态分布。
考点二:列联表中的相关测量表9-1列联表的测量指标【真题精选】当列联表中的两个变量相互独立时,计算的相关系数c()。
[中国海洋大学2018研]A.等于1B.大于1C.等于0D.小于0【答案】C【解析】两个随机变量独立,则这两个随机变量不相关,反之不成立。
9.2课后习题详解一、思考题1.简述列联表的构造与列联表的分布。
答:(1)列联表的构造:列联表是将两个以上的变量进行交叉分类的频数分布表。
(2)列联表的分布:列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。
2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。
答:(1)构造列联表:对三个生产厂甲、乙、丙提供的学习机的A、B、C三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。
抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。
表9-2(2)提出检验问题根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。
(3)进行检验建立假设:H0:次品类型与厂家生产是独立的;H1:次品类型与厂家生产不是独立的。
贾俊平《统计学》配套题库 【课后习题】详解 第11章~第12章【圣才出品】
![贾俊平《统计学》配套题库 【课后习题】详解 第11章~第12章【圣才出品】](https://img.taocdn.com/s3/m/9fc755726f1aff00bfd51e7b.png)
第11章一元线性回归一、思考题1.解释相关关系的含义,说明相关关系的特点。
答:变量之间存在的不确定的数量关系,称为相关关系。
相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。
对这种关系不确定的变量是不能用函数关系进行描述的。
2.相关分析主要解决哪些问题?答:相关分析就是对两个变量之间线性关系的描述与度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本所反映的变量之间的关系能否代表总体变量之间的关系。
3.相关分析中有哪些基本假定?答:在进行相关分析时,对总体主要有以下两个假定:(1)两个变量之间是线性关系;(2)两个变量都是随机变量。
4.简述相关系数的性质。
答:相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r 。
相关系数的性质:(1)r 的取值范围在-1~+1之间,即-1≤r ≤1。
若0<r ≤1,表明x 与y 之间存在正线性相关关系;若-1≤r <0,表明x 与y 之间存在负线性相关关系;若r =+1,表明x 与y 之间为完全正线性相关关系;若r =-1,表明x 与y 之间为完全负线性相关关系。
可见当|r |=1时,y 的取值完全依赖于x ,二者之间即为函数关系;当r =0时,说明y 的取值与x 无关,即二者之间不存在线性相关关系。
(2)r 具有对称性。
x 与y 之间的相关系数xy r 和y 与x 之间的相关系数yx r 相等,即xy r =yx r 。
(3)r 数值大小与x 和y 的原点及尺度无关。
改变x 和y 的数据原点及计量尺度,并不改变r 数值大小。
(4)r 仅仅是x 与y 之间线性关系的一个度量,它不能用于描述非线性关系。
2023统计学第七版贾俊平课后习题答案
![2023统计学第七版贾俊平课后习题答案](https://img.taocdn.com/s3/m/51c48b705b8102d276a20029bd64783e09127db4.png)
2023统计学第七版贾俊平课后习题答案第一章1.1 习题答案1.答案:根据题意,我们需要求得这 60 个挑选出来的人中有多少个人来自纽约市,而纽约市占比是 5%,所以答案应为 $60 \\times 0.05 = 3$2.答案:根据题意,我们需要求得这 60 个挑选出来的人中有多少个人来自纽约市并且是女性,而纽约市总体中女性的占比是 53%,所以答案应为 $60 \\times 0.05 \\times 0.53 = 1.59$1.2 习题答案1.答案:根据题意,我们需要求得这家电视公司进入市场的概率。
已知电视公司市场占有率为 10%,而市场占有率的补集为失败率,所以电视公司进入市场的概率为1−0.10=0.902.答案:根据题意,我们需要求得这两家公司都进入市场的概率。
已知电视公司进入市场的概率为 0.90,而两家公司都进入市场的概率为两者概率相乘,所以两家公司都进入市场的概率为 $0.90 \\times 0.90 = 0.81$第二章2.1 习题答案1.答案:根据题意,我们需要求得两次抛掷硬币都为正面向上的概率。
已知硬币正面朝上的概率为 0.5,而两次抛掷硬币都为正面向上的概率为两者概率相乘,所以两次抛掷硬币都为正面向上的概率为 $0.5 \\times 0.5 = 0.25$2.答案:根据题意,我们需要求得至少一次抛掷硬币为正面向上的概率。
已知硬币正面朝上的概率为 0.5,而至少一次抛掷硬币为正面向上的概率为 1 减去两次都为背面向上的概率,所以至少一次抛掷硬币为正面向上的概率为 $1 - (0.5 \\times 0.5) = 0.75$2.2 习题答案1.答案:根据题意,我们需要求得至少一辆汽车需要检测两次才能检查到故障的概率。
已知单次检测不到故障的概率为 0.1,而至少一辆汽车需要检测两次才能检查到故障的概率为 1 减去两次都未检测到故障的概率,所以至少一辆汽车需要检测两次才能检查到故障的概率为 $1 - (0.1 \\times 0.1) = 0.99$2.答案:根据题意,我们需要求得两辆车都不需要检测两次才能检查到故障的概率。
统计学(贾俊平版)重点【精选文档】
![统计学(贾俊平版)重点【精选文档】](https://img.taocdn.com/s3/m/a59b30f052ea551811a68786.png)
第一章统计:收集、处理、分析、解释数据并从数据中得出结论的科学。
数据1. 分类数据对事物进行分类的结果数据,表现为类别,用文字来表述。
例如,人口按性别分为男、女两类2。
顺序数据对事物类别顺序的测度,数据表现为类别,用文字来表述例如,产品分为一等品、二等品、三等品、次品等3. 数值型数据对事物的精确测度,结果表现为具体的数值.例如:身高为175cm ,168cm,183cm总体–所研究的全部元素的集合,其中的每一个元素称为个体–分为有限总体和无限总体.有限总体的范围能够明确确定,且元素的数目是有限的。
无限总体所包括的元素是无限的,不可数的样本–从总体中抽取的一部分元素的集合–构成样本的元素数目称为样本容量参数:描述总体特征。
有总体均值( )、标准差(σ)总体比例(π)统计量:描述样本特征。
样本标准差(s),样本比例(p)变量:说明现象某种特征,分类,顺序,数值型:离散型,连续型。
经验,理论变量描述统计研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法.推断统计是研究如何利用样本数据进行推断总体特征第二章间接数据(查询的)与直接数据:调查(通常是对社会现象而言的)普查信息全面完整。
再一个是实验。
概率抽样:也称随机抽样。
按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中–每个单位被抽中的概率是已知的,或是可以计算出来的–当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样:从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的分层抽样:优点:保证样本的结构与总体的结构比较相近将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,从而提高估计的精度–组织实施调查方便–既可以对总体参数进行估计,也可以对各层的目标量进行估计整群抽样:将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查优点:抽样时只需群的抽样框,可简化工作量–调查的地点相对集中,节省调查费用,方便调查的实施–缺点是统计的精度较差系统抽样:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位–先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位操作简便,可提高估计的精度多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查–群是初级抽样单位,第二阶段抽取的是最终抽样单位.将该方法推广,使抽样的段数增多,就称为多阶段抽样非概率抽样:方便抽样(自行确定入抽样本单位),判断抽样(根据经验判断),自愿样本(被调查者自愿参加),滚雪球抽样(对稀少群体的调查),配额抽样(先将体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位)。
贾俊平《统计学》章节题库(含考研真题)(1-4章)【圣才出品】
![贾俊平《统计学》章节题库(含考研真题)(1-4章)【圣才出品】](https://img.taocdn.com/s3/m/e51b0868aef8941ea76e05ab.png)
第1章导论一、单项选择题1.在抽样推断中,总体参数是一个()。
[中央财经大学2018研]A.随机变量B.已知的量C.统计量D.确定的量【答案】D【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
由于总体数据通常是不知道的,所以参数是一个未知的确定的常数。
2.统计年鉴中2016年全国各大城市的人均家庭收入数据属于()。
[中央财经大学2018研]A.定类数据B.定序数据C.截面数据D.时间序列数据【答案】C【解析】按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间获得的,用于描述现象在某一时刻的变化情况。
比如,2010年我国各地区的国内生产总值就是截面数据。
时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
比如2010~2012年我国的国内生产总值就是时间序列数据。
3.在教学评估中,某省三所高校的等级分别是优秀、良好、及格,则“等级”是()。
[浙江工商大学2017研]A.品质标志B.数量标志C.标志值D.数量指标【答案】A【解析】“等级”属于顺序数据,只能用文字来描述,因此是品质标志,其标志值为“优秀”“良好”“及格”。
4.下面不属于描述统计问题的是()。
[山东大学2015研]A.根据样本信息对总体进行的推断B.了解数据分布的特征顺序数据C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据【答案】A【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
BCD三项都是描述统计问题。
A项中根据样本信息对总体进行推断则是推断统计内容。
5.一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。
调查结果表明:45%的年轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题,15%的年轻人愿意与其父母讨论爱情问题。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章多元线性回归)【圣才出品】
![贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章多元线性回归)【圣才出品】](https://img.taocdn.com/s3/m/3f322f611611cc7931b765ce050876323112746d.png)
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章多元线性回归)【圣才出品】第12章多元线性回归12.1 考点归纳【知识框架】【考点提⽰】(1)多元线性回归模型,包括回归模型的基本假定(简答题考点),最⼩⼆乘估计(选择题、计算题考点);(2)回归模型的拟合优度评价(简答题、计算题考点);(3)显著性检验(计算题考点);(4)多重共线性的含义、产⽣的问题、判别及处理⽅式(简答题考点)。
【核⼼考点】考点⼀:多元线性回归模型1.回归模型假定(1)E (ε)=0;(2)D (ε)=σ2;(3)()2cov ,0i j i j i j σεε?==?≠?2.参数的最⼩⼆乘估计使残差平⽅和Q =∑(y i -y ∧i )2=∑(y ∧i =β∧0-β∧1x 1-β∧2x 2-…-β∧k x k )2达到最⼩的β∧0,β∧1,β∧2,…,β∧k 。
由此可以得到求解β∧0,β∧1,β∧2,…,β∧k 的标准⽅程组为:00?0?00,1,2,,i i ββi ββQ βQ i k β==??===???多元线性回归的最⼩⼆乘估计是最优线性⽆偏估计。
考点⼆:回归⽅程的拟合优度表12-1 多元线性回归⽅程的评价【提⽰】实际应⽤中,采⽤调整的判定系数来评价多元回归⽅程的拟合优度。
【真题精选】多元线性回归模型的调整的多重判定系数取值范围在0⾄1之间。
[对外经济贸易⼤学2018研]【答案】√【解析】多重判定系数R2=SSR/SST是多元回归中的回归平⽅和占总平⽅和的⽐例,它是度量多元回归⽅程拟合程度的⼀个统计量,反映了在因变量y的变差中被估计的回归⽅程所解释的⽐例,取值为0~1。
调整的多重判定系数R a2与多重判定系数R2不同之处在于:R a2同时考虑了样本量n和模型中⾃变量的个数k的影响,这就使得R a2的值永远⼩于R2,⽽且R a2的值不会由于模型中⾃变量个数的增加⽽越来越接近1,因此R a2的取值也为0~1。
《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版
![《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版](https://img.taocdn.com/s3/m/c6142a95a8956bec0875e3c0.png)
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
贾俊平《统计学》考研考点大全
![贾俊平《统计学》考研考点大全](https://img.taocdn.com/s3/m/cadf354681c758f5f61f67b3.png)
— 2—
贾俊平《统计学》考点精讲
数据分析方法分类:描述统计方法和推断统计方法,描述是推断统计的前提,推断统计是描述统 计的发展。
描述统计是研究数据收集、处理、汇总、图表描述、概括与分析等的统计方法,通常采用集中量数、 差异量数、地位量数、相关系数等概括性的度量工具;反映研究总体的直观特征、外在联系或横向比较 结果等浅表性信息。
第十一章 一元线性回归 (116) 第一节 变量间关系的度量 (116) 第二节 一元线性回归 (121) 第三节 利用回归方程进行预测 (128) 第四节 残差分析 (129)
第二章 数据的搜集 (6) 第一节 数据的来源 (6) 第二节 调查数据 (7) 第三节 数据的误差 (10)
第七章 参数估计 (62) 第一节 参数估计的基本原理 (62) 第二节 一个总体参数的区间估计 (66) 第三节 两个总体参数的区间估计 (70) 第四节 样本量的确定 (73)
内容体系和章节分配
描述统计:前四章
推断统计:第五章至第十一章
统计应用:第十二章至第十四章
第 1章 导论 第 2章 数据的搜集
第 3章 数据的图表展示
第 4章 数据的概括性度量
第 5章 概率与概率分布
第 6章 统计量及其抽样分布
第 7章 参数估计
第 8章 假设检验
第 9章 列联分析
第十章 方差分析 (99) 第一节 方差分析引论 (99) 第二节 单因素方差分析 (102) 第三节 双因素方差分析 (110)
第 10章 方差分析
第 11章 一元线性回归
第 12章 多元线性回归
第 13章 时间序列分析和预测
第 14章 指数
贾俊平《统计学》复习笔记课后习题详解及典型题详解 第11章~第12章【圣才出品】
![贾俊平《统计学》复习笔记课后习题详解及典型题详解 第11章~第12章【圣才出品】](https://img.taocdn.com/s3/m/e2714874ce2f0066f433221a.png)
圣才电子书 十万种考研考证电子书、题库视频学习平台
4 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 11-1 不同形态的散点图
(4)相关系数
通过散点图可以判断两个变量之间有无相关关系,并对变量间的关系形态作出大致的描
有所差异。样本相关系数是总体相关系数的一致估计量。样本相关系数记为 r,其计算公式
为:
r
n xy x y
n x2 ( x)2 n y2 ( y)2
按照上述计算公式计算的相关系数也称为线性相关系数,或 Pearson 相关系数。 ②相关系数的性质 a.r 的取值范围在-1~+1 之间,即-1≤r≤1。若 0<r≤1,表明 x 与 y 之间存在正 线性相关关系;若-1≤r<0,表明 x 与 y 之间存在负线性相关关系;若 r=+1,表明 x 与
5 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台
y 之间为完全正线性相关关系;若 r=-1,表明 x 与 y 之间为完全负线性相关关系。可见当 |r|=1 时,y 的取值完全依赖于 x,二者之间即为函数关系;当 r=0 时,说明 y 的取值与 x 无关,即二者之间不存在线性相关关系。|r|→1 说明两个变量之间的线性关系越强;|r|→0 说明两个变量之间的线性关系越弱。
b.r 具有对称性。x 与 r 之间的相关系数 rxy 和 y 与 x 之间的相关系数 ryx 相等,即 rxy =ryx。
c.r 数值大小与 x 和 y 的原点及尺度无关。改变 x 和 y 的数据原点及计量尺度,并不 改变 r 的数值大小。
述,但不能准确反映变量之间的关系强度。需要计算相关系数来准确度量两个变量之间的关
系强度。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第一章至第三章【圣才出品】
![贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)-第一章至第三章【圣才出品】](https://img.taocdn.com/s3/m/0715a24d866fb84ae45c8dbf.png)
第1章导论1.1考点归纳【知识框架】【考点提示】(1)统计学的目的(选择题考点);(2)描述统计和推断统计的区分、参数估计和假设检验的区分(选择题考点);(3)统计数据类型、分类、各自特点及其具体应用(选择题、简答题考点)(非常重要);(4)统计学中的基本概念(选择题、简答题考点)。
【核心考点】考点一:统计数据的类型(见表1-1)表1-1统计数据的类型【注意】①分类数据和顺序数据说明的是事物的品质特征,其结果均表现为类别,因而也统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,因此也称为定量数据或数量数据。
②对不同类型的数据采用不同的统计方法来处理和分析。
对分类数据可以计算出各类别的频率,而数值型数据则可以进行数学运算。
【真题精选】1.在对数据进行汇总时,往往将男性用“1”来表示,女性用“0”来表示,所以将性别视为数值型变量。
[对外经济贸易大学2018研]【答案】×【解析】数值型变量是说明事物数字特征的一个名称,其取值是数值型数据,数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值;分类变量是说明事物类别的一个名称,其取值是分类数据,分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
性别是分类变量,为便于统计处理,对于分类变量可以用数字代码来表示各个类别。
2.下列数据不属于时间序列数据的是()。
[四川大学2016研]A.1990~2014年我国每年进出口总额B.2014年某品牌手机在中国各个省市的销售量C.成都市2014年每个月的PM2.5月平均浓度D.某股票在2015年1月的日收盘价【答案】B【解析】时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
本题中B项是在相同的时间点、不同的空间上获得的数据,属于截面数据。
考点二:统计中的基本概念1.总体和样本(1)总体、个体(2)样本、样本量2.参数和统计量(1)参数:用于描述总体特征,是未知的常数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第11章一元线性回归
11.1 考点归纳
【知识框架】
【考点提示】
(1)变量间关系的度量,包括相关系数的计算公式、性质,相关关系的显著性检验(简答题、计算题考点);
(2)一元线性回归,包括回归模型的假定(简答题考点),回归方程、估计的回归方程的建立(选择题、计算题考点);
(3)最小二乘法的含义、性质,回归系数的计算(选择题、简答题、计算题考点);
(4)回归直线的拟合优度及显著性检验(计算题考点);
(5)点估计和区间估计,包括置信区间和预测区间(判断题、计算题考点)。
【核心考点】
考点一:变量间关系的度量
1.相关系数(线性相关系数,或Pearson 相关系数)
总体相关系数ρ,样本相关系数r 。
(1)计算公式
n xy x y r ∑-∑∑=
(2)性质 ①r 的取值范围为-1≤r≤1。
|r|→1说明两个变量之间的线性关系越强。
②r 具有对称性,即r xy =r yx 。
③r 取值大小与x 和y 的原点及尺度无关。
④r 仅用于度量线性关系,不能用于描述非线性关系
⑤r 只是度量数量关系,但不意味着因果关系。
⑥r 取值可以解释两个变量之间的相关程度。
但需要先对相关系数的显著性进行检验。
【真题精选】
如果变量X 与变量Y 之间的相关系数为0,说明这两个变量之间是( )。
[浙江财经大学2019研]
A .完全相关关系
B .完全不相关
C .没有线性关系
D .低度相关关系
【答案】C 【解析】相关系数r 仅仅是变量X 与Y 之间线性关系的一个度量,r =0
只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。
因此当r =0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图作出合理的解释。
2.相关关系的显著性检验——t 检验(小样本或大样本) 检验的统计量
(2)t r t n =-
若|t|>t α/2,则拒绝原假设H 0,表明总体的两个变量之间存在显著的线性关系。
考点二:一元线性回归
1.一元线性回归模型
(1)回归模型假定
①E (ε)=0;
②D (ε)=σ2;
③()2,cov ,0,i j i j i j σεε⎧==⎨≠⎩
;
④自变量x与因变量y之间具有线性关系;
⑤在重复抽样中,自变量x的取值是固定的,即假定x是非随机的。
根据以上假定,E(y)的值随着x发生变化,但ε和y的概率分布都是正态分布,并且具有相同的方差。
(2)回归方程
E(y)=β0+β1x
①β0是直线的截距,表示当解释变量为零时y的平均值;
②β1是直线的斜率,称为回归系数,表示解释变量x每变化1个单位,被解释变量y 将相应地平均变化β1个单位。
(3)估计的回归方程
y∧=β∧0+β∧1x
式中,β∧0是估计的回归直线在y轴上的截距;β∧1是直线的斜率,表示x每变动一个单位时,y的平均变动值。
【真题精选】
在回归直线方程y∧=a+bx中,b表示()。
[浙江财经大学2019研]
A.当x增加一个单位时,y增加a的数量
B.当y增加一个单位时,x增加b的数量
C.当x增加一个单位时,y的平均增加量
D.当y增加一个单位时,x的平均增加量
【答案】C
【解析】一元线性回归方程y∧=a+bx中,a是回归直线在y轴上的截距,表示当x=0
时y 的平均值;b 是直线的斜率,表示当x 每变动一个单位时,y 的平均变动值。
2.参数的最小二乘估计 (1)最小二乘法(最小平方法) 使残差平方和∑(y i -y ∧i )2=∑(y ∧i =β∧0-β∧1x i )2达到最小。
(2)最小二乘法拟合直线的优良性质
①根据最小二乘法得到的回归直线能使离差平方和达到最小;
②由最小二乘法求得的回归直线可知β0和β1的估计量的抽样分布; ③在某些条件下β0和β1的最小二乘估计量同其他估计量相比,其抽样分布具有较小的标准差。
(3)回归系数β∧0、β∧1
根据最小二乘法得:
111122
110
1ˆ=()ˆˆn n n i i i i i i i n n i i i i n x y x y βn x x βy βx =====⎧∑-∑∑⎪⎪⎨∑-∑⎪⎪=-⎩ 【注意】回归直线过点(x _,y _),这是回归直线的重要特征之一。
【知识拓展】回归估计量的特性(简答题、填空题考点):
①线性性:参数估计值β∧0和β∧
1分别是观测值或随机误差项μt 的线性组合,即可用y t 或μt 来表示; ②无偏性:估计值的均值等于真实值,E (β∧0)=β0,E (β∧1)=β1;
③有效性:又称最小方差性,最小二乘法得到的参数估计值在所有线性无偏估计中方差
最小。
3.回归直线的拟合优度
表11-1 回归方程的拟合程度分析。