统计学第六版贾俊平第11章
贾俊平《统计学》章节题库-第十一章至第十二章(圣才出品)

圣才电子书 十万种考研考证电子书、题库视频学习平台
5.根据下面的散点图,可以判断两个变量之间存在( )。
A.正线性相关关系 B.负线性相关关系 C.非线性关系 D.函数关系 【答案】B 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变 量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,则称为负线性相 关关系。
1 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台
3.下面的假定中,哪个属于相关分析中的假定( )。 A.两个变量之间是非线性关系 B.两个变量都是随机变量 C.自变量是随机变量,因变量不是随机变量 D.一个变量的数值增大,另一个变量的数值也应增大 【答案】B 【解析】在进行相关分析时,对总体主要有以下两个假定:①两个变量之间是线性关系; ②两个变量都是随机变量。
【答案】C 【解析】在线性相关中,若两个变量的变动方向相反,一个变量的数值增加,另一个变
5 / 88
圣才电子书 十万种考研考证电子书、题库视频学习平台
量的数值随之减少,或一个变量的数值减少,另一个变量的数值随之增加,即 x 值增大时 y 值随之变小,或 x 值变小时 y 值随之增大,则称为负相关。
12.如果相关系数 r=0,则表明两个变量之间( )。 A.相关程度很低 B.不存在任何关系 C.不存在线性相关关系 D.存在非线性相关关系 【答案】C 【解析】相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。如 果相关系数 r=0,说明两个变量之间不存在线性相关关系。
13.设产品产量与产品单位成本之间的线性相关系数为-0.87,这说明二者之间存在着 ( )。
2.下面的各问题中,哪个不是相关分析要解决的问题( )。 A.判断变量之间是否存在关系 B.判断一个变量数值的变化对另一个变量的影响 C.描述变量之间的关系强度 D.判断样本所反映的变量之间的关系能否代表总体变量之间的关系 【答案】B 【解析】相关分析就是对两个变量之间线性关系的描述与度量,它主要解决的问题包括: ①变量之间是否存在关系;②如果存在关系,它们之间是什么样的关系;③变量之间的关系 强度如何;④样本所反映的变量之间的关系能否代表总体变量之间的关系。
统计学(贾俊平)人大精品PPT课件

现象在不同时间上取值的平均数,又称序时平均数 说明现象在一段时期内所达到的一般水平 不同类型的时间序列有不同的计算方法
11 - 11
经济、管理类 基础课程
统计学
绝对数序列的序时平均数
(计算方法)
时期序列
n
计算公式:
Y Y1 Y2 Yn
Yi
i 1
n
n
【例11.1】 根据表11.1中的国内生产总值 序列,计算各年度的平均国内生产总值
3. 平均数时间序列
一系列平均数按时间顺序排列而成
11 - 9
经济、管理类 基础课程
统计学
时间序列的水平分析
11 - 10
经济、管理类 基础课程
统计学
发展水平与平均发展水平
(概念要点)
1. 发展水平
现象在不同时间上的观察值 说明现象在某一时间上所达到的水平 表示为Y1 ,Y2,… ,Yn 或 Y0 ,Y1 ,Y2 ,… ,Yn
2. 形式上由现象所属的时间和现象在不同时 间上的观察值两部分组成
3. 排列的时间可以是年份、季度、月份或其 他任何时间形式
11 - 6
经济、管理类 基础课程
统计学
时间序列
(一个例子)
年份
1990 1991 1992 1993 1994 1995 1996 1997 1998
11 - 7
表11- 1 国内生产总值等时间序列
经济、管理类 基础课程
统计学
时间序列的分类
1. 绝对数时间序列
一系列绝对数按时间顺序排列而成
时间序列中最基本的表现形式
反映现象在不同时间上所达到的绝对水平
分为时期序列和时点序列 • 时期序总量的排序
《统计学》完整袁卫-贾俊平

总体 N
N1 N2
n1
n2
样本 n
n1 n2 nk
等额
k
n ni
i 1
等比例
n1
Ni N
n
··· ···
N k nk
最优
n1
Ni
2 i
Ni
2 iBiblioteka n整群抽样方法:首先把总体中的N个单位划分成为若干个群, 并要求每个群对整个总体都具有代表性,然后对群进 行简单随机抽样,并对抽中群内的所有单位进行调查 研究。
1. 描述统计
关于搜集、展示一批数据,并反映这 批数据特征的各种方法,其目的是为 了正确地反映总体的数量特点。
2. 推断统计 根据样本统计量估计和推断总体参 数的技术和方法。
描述统计是推断统计的前提, 推断统计是描述统计的发展。
二、数据
(一) 为何需要数据 ?
统计学要研究各种随机变量,通过对这些随机变量的 观察所获取的数据包含了我们所需的信息,这些信息 能有助于我们在许多场合中做出更为正确的决策。
就是把定量数据按从大到小或从小到大的顺序排列, 把定性数据按习惯的文字顺序排列,便于我们研究其 条理。
统计分组
对于定性数据就是依据属性的不同将数据划分成若干 组,对于定量数据就是依据属性数值的不同将数据划 分成若干组。
组内同质性,组间差异性。
频数分布编制
分组的关键 变量的选择,选择与研究的问题有关的 变量 。 组限的确定。应遵循穷尽和互斥原则 。
就是把政府机构、各种组织和公司所公布的数据作为 来源,这种数据往往是次级数据。 2. 设计一次试验以获取必要的数据。
例如,在检验洗衣机洗净程度的研究中,研究人员通 过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最 佳。
统计学贾俊平课后习题答案

附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下服务质量等级评价的频数分布(3)条形图(略)(4)帕累托图(略)。
2.2(1)频数分布表如下40个企业按产品销售收入分组表(2)某管理局下属40个企分组表2.3频数分布表如下某百货公司日商品销售额分组表直方图(略)。
2.4茎叶图如下箱线图(略)。
2.5(1)排序略。
(2)频数分布表如下100只灯泡使用寿命非频数分布(3)直方图(略)。
(4)茎叶图如下2.6(1)频数分布表如下(2)直方图(略)。
(3)食品重量的分布基本上是对称的。
2.7(1)频数分布表如下(2)直方图(略)。
2.8(1)属于数值型数据。
(2)分组结果如下(3)直方图(略)。
2.9(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10(1)茎叶图如下(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。
2.11(略)。
2.12(略)。
2.13(略)。
2.14(略)。
2.15箱线图如下:(特征请读者自己分析)第3章 数据的概括性度量 3.1(1)100=M ;10=e M ;6.9=x 。
(2)5.5=L Q ;12=U Q 。
(3)2.4=s 。
(4)左偏分布。
3.2(1)190=M ;23=e M 。
统计学(第六版)贾俊平-课后习题及答案

目录第一章P10 (1)第二章P34 (2)第三章P66 (3)第四章P94 (8)第七章P176 (11)第八章P212 (15)第10 章P258 (17)第11 章P291 (21)第13 章P348 (26)第14 章P376 (30)第一章P10一、思考题1.1什么是统计学?1.2解释描述统计和推断统计。
1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.4解释分类数据、顺序数据和数值型数据的含义。
1.5举例说明总体、样本、参数、统计量、变量这几个概念。
1.6变量可分为哪几类?1.7举例说明离散型变量和连续型变量。
1.8请举出统计应用的几个例子。
1.9请举出应用统计的几个领域。
1.1 指出下面变量的类型:(1)年龄(2)性别(3)汽车产量(4)员工对企业某项改革措施的态度(赞成、中立、反对)(5)购买商品时的支付方式(现金、信用卡、支票)(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。
要求:(1)描述总体和样本。
(2)指出参数和统计量。
(1)总体是该市所有职工家庭的集合;样本是抽中的 2000 个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的 2000 个职工家庭的年人均收入。
1.3 一家研究机构从 IT 从业者中随机抽取 1000 人作为样本进行调查,其中 60%的人回答他们的月收入在5000 元以上,50%的人回答他们的消费支付方式是用信用卡。
回答下列问题:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?(1)总体是所有 IT 从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4 一项调查表明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主要原因是“价格便宜”。
(完整版)统计学贾俊平考研知识点总结

统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。
(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。
内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。
(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。
研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。
其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。
(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
(1)分类数据是只能归于某一类别的非数字型数据。
它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。
(2)顺序数量是只能归于某一有序类别的非数字型数据。
也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。
(3)数值型数据是按数字尺度测量的观察值。
其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。
总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。
三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。
通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。
贾俊平第六版统计学课后思考题答案——张云飞

第一章导论1.什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
2.解释描述统计和推断统计描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计是研究如何利用样本数据来推断总体特征的统计方法。
3.统计数据可以分为哪几种类型?不同类型的数据各有什么特点?分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
顺序数据:是只能归于某一有序类别的非数字型数据。
虽然也有列别,但这些类别是有序的。
数值型数据:是按数字尺度测量的观察值,其结果表现为具体的数值。
4.解释分类数据、顺序数据和数值型数据的含义分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此也可统称为定性数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。
5.举例说明总体、样本、参数、统计量、变量这几个概念总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集合;参数是用来描述总体特征的概括性数字度量;统计量是用来描述样本特征的概括性数字度量;变量是说明现象某种特征的概念。
比如我们欲了解某市的中学教育情况,那么该市的所有中学则构成一个总体,其中的每一所中学都是一个个体,我们若从全市中学中按某种抽样规则抽出了10所中学,则这10所中学就构成了一个样本。
在这项调查中我们可能会对升学率感兴趣,那么升学率就是一个变量。
我们通常关心的是全市的平均升学率,这里这个平均值就是一个参数,而此时我们只有样本的有关升学率的数据,用此样本计算的平均值就是统计量。
6.变量可以分为哪几类分类变量:一个变量由分类数据来记录就称为分类变量。
顺序变量:一个变量由顺序数据来记录就称为顺序变量。
数值型变量:一个变量由数值型数据来记录就称为数值型变量。
离散变量:可以取有限个值,而且其取值都以整位数断开,可以一一例举。
贾俊平 统计学 第11章 时间序列预测

统计学
STATISTICS (第四版)
日期 2009.07 2009.08 2009.09 2009.10 2009.11 2009.12 2010.01 2010.02 2010.03 2010.04 2010.05 2010.06 2010.07 2010.08 11 - 6
2013-8-15
2. 选择时,还应考虑预测误差
11 - 27
统计学
STATISTICS (第四版)
简单指数平滑预测
(例题分析)
【例11-2续】根据表11-1中的棉花产量数据, 分别取 =0.3和 =0.5进行指数平滑预测, 计算出预测误差,并将原序列和预测后的序 列绘制成图形进行比较
下个月的消费者信心指数是多少?
消费者预期指数 101.1 102.0 102.2 102.6 103.0 104.0 104.6 104.5 108.2 106.8 108.2 108.9 108.6 107.9 消费者满意指数 103.6 103.8 103.7 104.0 103.8 103.8 104.8 103.7 107.5 106.2 107.7 107.8 106.4 106.2 消费者信心指数 102.1 102.7 102.8 103.2 103.3 103.9 104.7 104.2 107.9 106.6 108.0 108.5 107.8 107.3 2013-8-15
1. 适合于平稳序列(没有趋势和季节变动的序列)对 过去的观测值加权平均进行预测的一种方法 2. 观测值时间越远,其权数也跟着呈现指数的下降, 因而称为指数平滑
3. t+1的预测值是t期观测值与t期平滑值St 的线性组 合,其预测模型为
贾俊平《统计学》配套题库 【课后习题】详解 第11章~第12章【圣才出品】

第11章一元线性回归一、思考题1.解释相关关系的含义,说明相关关系的特点。
答:变量之间存在的不确定的数量关系,称为相关关系。
相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。
对这种关系不确定的变量是不能用函数关系进行描述的。
2.相关分析主要解决哪些问题?答:相关分析就是对两个变量之间线性关系的描述与度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本所反映的变量之间的关系能否代表总体变量之间的关系。
3.相关分析中有哪些基本假定?答:在进行相关分析时,对总体主要有以下两个假定:(1)两个变量之间是线性关系;(2)两个变量都是随机变量。
4.简述相关系数的性质。
答:相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r 。
相关系数的性质:(1)r 的取值范围在-1~+1之间,即-1≤r ≤1。
若0<r ≤1,表明x 与y 之间存在正线性相关关系;若-1≤r <0,表明x 与y 之间存在负线性相关关系;若r =+1,表明x 与y 之间为完全正线性相关关系;若r =-1,表明x 与y 之间为完全负线性相关关系。
可见当|r |=1时,y 的取值完全依赖于x ,二者之间即为函数关系;当r =0时,说明y 的取值与x 无关,即二者之间不存在线性相关关系。
(2)r 具有对称性。
x 与y 之间的相关系数xy r 和y 与x 之间的相关系数yx r 相等,即xy r =yx r 。
(3)r 数值大小与x 和y 的原点及尺度无关。
改变x 和y 的数据原点及计量尺度,并不改变r 数值大小。
(4)r 仅仅是x 与y 之间线性关系的一个度量,它不能用于描述非线性关系。
统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下(4)帕累托图(略)。
2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。
(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。
2.72.8(1)属于数值型数据。
2.9(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10A 班分散,且平均成绩较A 班低。
2.11 (略)。
2.12 (略)。
2.13 (略)。
2.14 (略)。
2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。
(2)5.5=L Q ;12=U Q 。
(3)2.4=s 。
(4)左偏分布。
3.2(1)190=M ;23=e M 。
(2)5.5=L Q ;12=U Q 。
(3)24=x ;65.6=s 。
(4)08.1=SK ;77.0=K 。
(5)略。
3.3 (1)略。
(2)7=x ;71.0=s 。
(3)102.01=v ;274.02=v 。
(4)选方法一,因为离散程度小。
3.4 (1)x =(万元);M e= 。
统计学第十一章课后习题答案

11。
1(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。
散点图如下:从上图,可以看出产量与生产费用的关系为正的线性相关关系。
(2)计算产量与生产费用之间的线性相关系数.r=0.920232(3)对相关系数的显著性进行检验(a=0。
05),并说明二者之间的关系系数。
假设:H o :ρ=0,H 1:ρ≠0 计算检验的统计量:t=|r|√n−21−r²=|0。
92—232|√12−21−0.920232²=7.435当a=0。
05时,t 0.052⁄(12-2)=2.228。
由于检验统计量t=7。
435>t a 2⁄=2.228,拒绝原假设。
表明产量与生产费用之间的线性关系显著.11.2(1)散点图如下:(2)r=0.8621,正相关11。
3(1)0ˆβ=10表示当X=0时Y 的期望值为10 (2)1ˆβ=—0.5表示X 每增加1个单位,Y 平均下降0.5个单位。
(3)X=6时,E (Y )=10—0。
5x6=711.4.(1)%90436362=+=+==SSE SSR SSR SST SSR R ,%902=R 表示,在因变量y 取值的变差中,有90%可以由x 与y 之间的线性关系来解释. (2)5.021842n =--=SSE S e 。
5.0=e S 表示,当用x 来预测y 时,平均的预测误差为0.5。
11.5(1)散点图如下:(2)r=0。
9489,因为r>0.8,所以运送时间与运送距离有较强的正线性关系。
(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
得到的回归方程为x 003585.0118129.0y ˆ+=,回归系数003585.0ˆ=β表示运送距离每增加1公里,运送时间平均增加0.003585天.11.6(1)散点图如下:从上图可知,人均gdp 和人均消费水平为正相关关系(2)r=0.998128,具有非常强的正线性关系。
统计学(第六版)贾俊平——_课后习题答案

第一章导论.1(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。
(1)总体是所有IT从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
(1)总体是所有在网上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在网上购物者的月平均花费。
(4)参数(5)推断统计方法。
第二章数据的搜集1.什么是二手资料使用二手资料需要注意些什么与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。
使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手资料时,要注明数据来源。
2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试。
3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法实验式、观察式等。
4. 自填式、面方式、电话式调查个有什么利弊自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。
贾俊平统计学(第六版)思考题答案解析

贾俊平统计学(第六版)思考题答案解析第一章:1、什么就是统计学?统计学就是一门收集、分析、表述、解释数据得科学与艺术。
2、描述统计:研究得就是数据收集、汇总、处理、图表描述、概括与分析等统计方法。
推断统计:研究得就是如何利用样本数据来推断总体特征。
3、统计学据可以分成哪几种类型,个有什么特点?按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。
分类数据:只能归于某一类别得,非数字型数据。
顺序数据:只能归于某一有序类别得,非数字型数据。
数值型数据:按数字尺度测量得观察值,结果表现为数值。
按收集方法不同。
分为:观测数据、与实验数据观测数据:通过调查或观测而收集到得数据;不控制条件;社会经济领域实验数据:在试验中收集到得数据;控制条件;自然科学领域。
按时间不同,分为:截面数据、时间序列数据截面数据:在相同或近似相同得时间点上收集得数据。
时间序列数据:在不同时间收集得数据。
4、举例说明总体、样本、参数、统计量、变量这几个概念。
总体:就是包含全部研究个体得集合,包括有限总体与无限总体(范围、数目判定)样本:从总体中抽取得一部分元素得集合。
参数:用来描述总体特征得概括性数字度量。
(平均数、标准差、比例等)统计量:用来描述样本特征得概括性数字度量。
(平均数、标准差、比例等)变量:就是说明样本某种特征得概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。
(商品销售额、受教育程度、产品质量等级等)(对一千灯泡进行寿命测试,那么这千个灯泡就就是总体,从中抽取一百个进行检测,这一百个灯泡得集合就就是样本,这一千个灯泡得寿命得平均值与标准差还有合格率等描述特征得数值就就是参数,这一百个灯泡得寿命得平均值与标准差还有合格率等描述特征得数值就就是统计量,变量就就是说明现象某种特征得概念,比如说灯泡得寿命。
) 5、变量可以分为哪几类?分类变量:说明事物类别;取值就是分类数据。
顺序变量:说明事物有序类别;取值就是顺序数据数值型变量:说明事物数字特征;取值就是数值型数据。
贾俊平《统计学》复习笔记课后习题详解及典型题详解 第11章~第12章【圣才出品】

圣才电子书 十万种考研考证电子书、题库视频学习平台
4 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 11-1 不同形态的散点图
(4)相关系数
通过散点图可以判断两个变量之间有无相关关系,并对变量间的关系形态作出大致的描
有所差异。样本相关系数是总体相关系数的一致估计量。样本相关系数记为 r,其计算公式
为:
r
n xy x y
n x2 ( x)2 n y2 ( y)2
按照上述计算公式计算的相关系数也称为线性相关系数,或 Pearson 相关系数。 ②相关系数的性质 a.r 的取值范围在-1~+1 之间,即-1≤r≤1。若 0<r≤1,表明 x 与 y 之间存在正 线性相关关系;若-1≤r<0,表明 x 与 y 之间存在负线性相关关系;若 r=+1,表明 x 与
5 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台
y 之间为完全正线性相关关系;若 r=-1,表明 x 与 y 之间为完全负线性相关关系。可见当 |r|=1 时,y 的取值完全依赖于 x,二者之间即为函数关系;当 r=0 时,说明 y 的取值与 x 无关,即二者之间不存在线性相关关系。|r|→1 说明两个变量之间的线性关系越强;|r|→0 说明两个变量之间的线性关系越弱。
b.r 具有对称性。x 与 r 之间的相关系数 rxy 和 y 与 x 之间的相关系数 ryx 相等,即 rxy =ryx。
c.r 数值大小与 x 和 y 的原点及尺度无关。改变 x 和 y 的数据原点及计量尺度,并不 改变 r 的数值大小。
述,但不能准确反映变量之间的关系强度。需要计算相关系数来准确度量两个变量之间的关
系强度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当样本数据来自正态总体时,随着n的增大,r 的 抽样分布趋于正态分布,尤其是在总体相关系数 很小或接近0时,趋于正态分布的趋势非常明显。 而当远离0时,除非n非常大,否则r的抽样分布呈 现一定的偏态。
2. 当为较大的正值时,r 呈现左偏分布;当为 较大的负值时,r 呈现右偏分布。只有当接近 于0,而样本容量n很大时,才能认为r是接近 于正态分布的随机变量
11 - 9
统计学
第六版
相关关系
(类型)
相关关系
线性相关
正相关 负相关
11 - 10
非线性相关
完全相关
正相关 负相关
不相关
统计学
第六版
相关关系的描述与测度
(散点图)
11 - 11
统计学
第六版
散点图
(scatter diagram)
无线性相关
-1.0
-0.5
0
+0.5
正相关程度增加
+1.0
r
负相关程度增加
11 - 20
统计学
第六版
相关系数
(例题分析)
用Excel计算相关系数
11 - 21
统计学
第六版
相关系数的显著性检验
11 - 22
统计学
第六版
相关系数的显著性检验
( r 的抽样分布)
1. r 的抽样分布随总体相关系数和样本容量的大 小而变化
3. 根据显著性水平=0.05,查t分布表得t(n-2)=2.0687 由于t=7.5344>t(25-2)=2.0687,拒绝H0,不良贷 款与贷款余额之间存在着显著的正线性相关关系
11 - 25
统计学
第六版
相关系数的显著性检验
(例题分析)
各相关系数检验的统计量
11 - 26
独立性意味着对于一个特定的 x 值,它所对应的ε与 其他 x 值所对应的ε不相关 对于一个特定的 x 值,它所对应的 y 值与其他 x 所 对应的 y 值也不相关
11 - 35
统计学
第六版
回归方程
(regression equation)
1. 描述 y 的平均值或期望值如何依赖于 x 的方程 称为回归方程 2. 一元线性回归方程的形式如下 E( y ) = 0 + 1 x
11 - 29
统计学
第六版
回归模型的类型
回归模型
一元回归 线性回归
11 - 30
多元回归 线性回归 非线性回归
非线性回归
统计学
第六版
一元线性回归模型
11 - 31
统计学
第六版
一元线性回归
1. 涉及一个自变量的回归 2. 因变量y与自变量x之间为线性关系
被预测或被解释的变量称为因变量 (dependent variable),用y表示 用来预测或用来解释因变量的一个或多个变 量称为自变量 (independent variable) ,用 x 表示
11 - 23
统计学
第六版
相关系数的显著性检验
(检验的步骤)
1. 2. 3. 4.
检验两个变量之间是否存在线性相关关系 等价于对回归系数 1的检验 采用R.A.Fisher提出的 t 检验 检验的步骤为
提出假设:H0: ;H1: 0 n2 t r ~ t ( n 2) 计算检验的统计量: 2 1 r 确定显著性水平,并作出决策
1. 对变量之间关系密切程度的度量 2. 对两个变量之间线性相关程度的度量称为 简单相关系数 3. 若相关系数是根据总体全部数据计算的, 称为总体相关系数,记为 4. 若是根据样本数据计算的,则称为样本相 关系数,记为 r
11 - 17
统计学
第六版
相关系数
(计算公式)
样本相关系数的计算公式
r
11 - 33
统计学
第六版
一元线性回归模型
1. 描述因变量 y 如何依赖于自变量 x 和误差项 的 方程称为回归模型 2. 一元线性回归模型可表示为 y = + x +
y 是 x 的线性函数(部分)加上误差项 线性部分反映了由于 x 的变化而引起的 y 的变化 误差项 是随机变量
11 - 13
统计学
第六版
散点图
(例题分析)
11 - 14
统计学
第六版
14 12 10
散点图
(例题分析)
14 12 10
î û¿ ¼´ »Á ²
8 6 4 2 0
0 50 100 150 200
î û ¿ ¼ ´ » Á ²
8 6 4 2 0
0 100 200 300 400
¸ ¨ Ì ¶ × Ê ² ú Í ¶ × Ê ¶ î » Á ² ¼ ´ û î ¿ Ó ë Ì ¸ ¶ ¨× Ê ² ú Í ¶ Ê ×¶ î µ É Ä ¢ µ ã Í ¼
11 - 7
统计学
第六版
相关关系
(correlation)
1. 变量间关系不能用函数关 y 系精确表达 2. 一个变量的取值不能由另 一个变量唯一确定 3. 当变量 x 取某个值时,变 量 y 的取值可能有几个 4. 各观测点分布在直线周围 x
11 - 8
统计学
• 若t>t,拒绝H0 • 若t<t,不能拒绝H0
11 - 24
统计学
第六版
相关系数的显著性检验
(例题分析)
对不良贷款与贷款余额之间的相关系数进行显著性检 (0.05) 1. 提出假设:H0: ;H1: 0 2. 计算检验的统计量
25 2 t 0.8436 7.5344 2 1 0.8436
11 - 3
统计学
第六版
11.1 变量间关系的度量
一. 变量间的关系 二. 相关关系的描述与测度 三. 相关系数的显著性检验
11 - 4
统计学
第六版
变量间的关系
11 - 5
统计学
第六版
函数关系
1. 是一一对应的确定关系 2. 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完 y 全依赖于 x ,当变量 x 取某 个数值时, y 依确定的关系 取相应的值,则称 y 是 x 的 函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 3. 各观测点落在一条线上 x
11 - 6
统计学
第六版
函数关系
(几个例子)
函数关系的例子
某种商品的销售额(y)与销售量(x)之间的关系可 表示为 y = px (p 为单价) 圆的面积(S)与半径之间的关系可表示为S=R2 企业的原材料消耗额(y)与产量(x1) 、单位产量 消耗(x2) 、原材料价格(x3)之间的关系可表示为 y = x1 x2 x 3
反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的 影响 是不能由 x 和 y 之间的线性关系所解释的变异性
0 和 1 称为模型的参数
11 - 34
统计学
第六版
一元线性回归模型
(基本假定)
1. 误差项ε是一个期望值为 0的随机变量,即E(ε)=0 。对于一个给定的 x 值,y 的期望值为E ( y ) = 0+ 1 x 2. 对于所有的 x 值,ε的方差σ2 都相同 3. 误差项 ε 是一个服从正态分布的随机变量,且相 互独立。即ε~N( 0 ,σ2 )
统计学
第六版
11.2
一元线性回归
一. 二. 三. 四.
一元线性回归模型 参数的最小二乘估计 回归直线的拟合优度 显著性检验
11 - 27
统计学
第六版
什么是回归分析?
(Regression)
1. 从一组样本数据出发,确定变量之间的数学 关系式 2. 对这些关系式的可信程度进行各种统计检验 ,并从影响某一特定变量的诸多变量中找出 哪些变量的影响显著,哪些不显著 3. 利用所求的关系式,根据一个或几个变量的 取值来预测或控制另一个特定变量的取值, 并给出这种预测或控制的精确程度
非线性相关
完全正线性相关
完全负线性相关
11 - 12
负线性相关
不相关
正线性相关
统计学
第六版
散点图
(例题分析)
【例】一家大型商业银行在多个地区设有分行 ,其业务主要是进行基础设施建设、国家重 点项目建设、固定资产投资等项目的贷款。 近年来,该银行的贷款额平稳增长,但不良 贷款额也有较大比例的提高,这给银行业务 的发展带来较大压力。为弄清楚不良贷款形 成的原因,希望利用银行业务的有关数据做 些定量分析,以便找出控制不良贷款的办法 。下面是该银行所属的25家分行2002年的有 关业务数据
11 - 36
方程的图示是一条直线,也称为直线回归方程
0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期
望值
1是直线的斜率,称为回归系数,表示当 x 每变动
一个单位时,y 的平均变动值
统计学
第六版
估计的回归方程
(estimated regression equation)
1. 总体回归参数 0 和 1 是未知的,必需利用样本数 据去估计 ˆ 和 ˆ 代替回归方程中的未知参 2. 用样本统计量 0 1 数 0和 1 ,就得到了估计的回归方程 3. 一元线性回归中估计的回归方程为
( x x )( y y ) (x x) ( y y)