统计学第六版贾俊平12章
(完整版)统计学贾俊平考研知识点总结
统计学重点笔记第一章导论一、比较描述统计和推断统计:数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。
(1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。
内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。
(2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。
研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。
其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。
(3)两者的关系:描述统计是基础,推断统计是主体二、比较分类数据、顺序数据和数值型数据:根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
(1)分类数据是只能归于某一类别的非数字型数据。
它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。
(2)顺序数量是只能归于某一有序类别的非数字型数据。
也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。
(3)数值型数据是按数字尺度测量的观察值。
其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。
总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。
三、比较总体、样本、参数、统计量和变量:(1)总体是包含所研究的全部个体的集合。
通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。
贾俊平第六版统计学课后思考题答案——张云飞
第一章导论1.什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
2.解释描述统计和推断统计描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计是研究如何利用样本数据来推断总体特征的统计方法。
3.统计数据可以分为哪几种类型?不同类型的数据各有什么特点?分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
顺序数据:是只能归于某一有序类别的非数字型数据。
虽然也有列别,但这些类别是有序的。
数值型数据:是按数字尺度测量的观察值,其结果表现为具体的数值。
4.解释分类数据、顺序数据和数值型数据的含义分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此也可统称为定性数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。
5.举例说明总体、样本、参数、统计量、变量这几个概念总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集合;参数是用来描述总体特征的概括性数字度量;统计量是用来描述样本特征的概括性数字度量;变量是说明现象某种特征的概念。
比如我们欲了解某市的中学教育情况,那么该市的所有中学则构成一个总体,其中的每一所中学都是一个个体,我们若从全市中学中按某种抽样规则抽出了10所中学,则这10所中学就构成了一个样本。
在这项调查中我们可能会对升学率感兴趣,那么升学率就是一个变量。
我们通常关心的是全市的平均升学率,这里这个平均值就是一个参数,而此时我们只有样本的有关升学率的数据,用此样本计算的平均值就是统计量。
6.变量可以分为哪几类分类变量:一个变量由分类数据来记录就称为分类变量。
顺序变量:一个变量由顺序数据来记录就称为顺序变量。
数值型变量:一个变量由数值型数据来记录就称为数值型变量。
离散变量:可以取有限个值,而且其取值都以整位数断开,可以一一例举。
贾俊平《统计学》配套题库 【课后习题】详解 第11章~第12章【圣才出品】
第11章一元线性回归一、思考题1.解释相关关系的含义,说明相关关系的特点。
答:变量之间存在的不确定的数量关系,称为相关关系。
相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。
对这种关系不确定的变量是不能用函数关系进行描述的。
2.相关分析主要解决哪些问题?答:相关分析就是对两个变量之间线性关系的描述与度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本所反映的变量之间的关系能否代表总体变量之间的关系。
3.相关分析中有哪些基本假定?答:在进行相关分析时,对总体主要有以下两个假定:(1)两个变量之间是线性关系;(2)两个变量都是随机变量。
4.简述相关系数的性质。
答:相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r 。
相关系数的性质:(1)r 的取值范围在-1~+1之间,即-1≤r ≤1。
若0<r ≤1,表明x 与y 之间存在正线性相关关系;若-1≤r <0,表明x 与y 之间存在负线性相关关系;若r =+1,表明x 与y 之间为完全正线性相关关系;若r =-1,表明x 与y 之间为完全负线性相关关系。
可见当|r |=1时,y 的取值完全依赖于x ,二者之间即为函数关系;当r =0时,说明y 的取值与x 无关,即二者之间不存在线性相关关系。
(2)r 具有对称性。
x 与y 之间的相关系数xy r 和y 与x 之间的相关系数yx r 相等,即xy r =yx r 。
(3)r 数值大小与x 和y 的原点及尺度无关。
改变x 和y 的数据原点及计量尺度,并不改变r 数值大小。
(4)r 仅仅是x 与y 之间线性关系的一个度量,它不能用于描述非线性关系。
统计学贾俊平课后习题答案完整版
统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下(4)帕累托图(略)。
2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。
(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。
2.72.8(1)属于数值型数据。
2.9(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10A 班分散,且平均成绩较A 班低。
2.11 (略)。
2.12 (略)。
2.13 (略)。
2.14 (略)。
2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。
(2)5.5=L Q ;12=U Q 。
(3)2.4=s 。
(4)左偏分布。
3.2(1)190=M ;23=e M 。
(2)5.5=L Q ;12=U Q 。
(3)24=x ;65.6=s 。
(4)08.1=SK ;77.0=K 。
(5)略。
3.3 (1)略。
(2)7=x ;71.0=s 。
(3)102.01=v ;274.02=v 。
(4)选方法一,因为离散程度小。
3.4 (1)x =(万元);M e= 。
统计学第六版贾俊平12章多元线性回归
二元回归方程的直观解释
二元线性回归模型
回归面
y
y b0 b1x1 b2x2
(观察到的y)
} b0
i
x2
(x1,x2)
x1
E( y) b0 b1x1 b2x2
估计的多元回归方程
估计的多元回归的方程
(estimated multiple regression equation)
12.1 多元线性回归模型
一 多元回归模型与回归方程 二 估计的多元回归方程 三 参数的最小二乘估计
多元回归模型与回归方程
多元回归模型
(multiple regression model)
1. 一个因变量与两个及两个以上自变量的回归
2. 描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xp 和误差项 的方程,称为多元回归模型
2. 如果出现下列情况,暗示存在多重共线性
模型中各对自变量之间显著相关。 当模型的线性关系检验(F检验)显著时,几乎所有回
归系数的t检验却不显著 回归系数的正负号与其的相反。
Excel 输出结果的分析
多重共线性
(例题分析)
【例】判别各自变量之间是否存在多重共线性
贷款余额、应收贷款、贷款项目、固定资产投资额之间的相关矩阵
1. 用样本统计量 bˆ0 , bˆ1 , bˆ2 , , bˆ p 估计回归方 程中的 参数 b0 , b1 , b2 , , b p 时得到的方程
2. 由最小二乘法求得 3. 一般形式为
yˆ bˆ0 bˆ1x1 bˆ2x2 bˆpxp
▪ bˆ0 , bˆ1 , bˆ2 , , bˆ p是 b0 , b1 , b2 , , b p
贾俊平《统计学》考研真题(含复试)与典型习题详解(第6版)
目录分析
1.2课后习题详解
1.1复习笔记
1.3典型习题详解
2.2课后习题详解
2.1复习笔记
2.3典型习题详解
3.2课后习题详解
3.1复习笔记
3.3典型习题详解
4.2课后习题详解
4.1复习笔记
4.3典型习题详解
5.2课后习题详解
5.1复习笔记
5.3典型习题详解
6.2课后习题详解
6.1复习笔记
12.1复习笔记
12.3典型习题详解
13.2课后习题详解
13.1复习笔记
13.3典型习题详解
14.2课后习题详解
14.1复习笔记
14.3典型习题详解
作者介绍
谢谢观看
6.3典型习题详解
7.2课后习题详解
7.1复习笔记
7.3典型习题详解
8.2课后习题详解
8.1复习笔记
8.3典型习题详解
9.2课后习题详解
9.1复习笔记
9.3典型习题详解
10.2课后习题详解
10.1复习笔记
10.3典型习题详解
11.2课后习题详解
11.1复习笔记
11.3典型习题详解
12.2课后习题详解
精彩摘录
统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。 参数是用来描述总体特征的概括性数字度量 不论如何偏斜,中位数总是在众数与算术平均数之间。经验表明,在适度偏斜的情况下,众数与中位数的距 离约为中位数与算术平均数距离的2倍。 概率抽样最主要的优点是可以依据调查结果,计算估计量误差,从而得到对总体目标量进行推断的可靠程度。 从另一个方面讲,也可以按照要求的精确度,计算必要的样本单位数目。 统计推断的三个中心内容:抽样分布、参数估计和假设检验。 统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数 样本方差:样本数据个数减1后除离差平方和。其中样本数据个数减1,即n-1称为自由度 几何平均数主要用于计算比率的平均 控制抽样误差的主要方法是改变样本量,要求的抽样误差越小,所需要的样本量就越大。 概率抽样(随机抽样):指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
统计学贾俊平课后习题答案
附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是该城市所有的职工家庭”样本是抽取的2000个职工家庭”(2)城市所有职工家庭的年人均收入,抽取的“ 200个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是所有的网上购物者”(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下服务质量等级评价的频数分布(3)条形图(略)(4)帕累托图(略)。
2.2(1)频数分布表如下40个企业按产品销售收入分组表(2)某管理局下属40个企分组表2.3 频数分布表如下某百货公司日商品销售额分组表直方图(略)。
2.4 茎叶图如下箱线图(略)。
2.5(1)排序略。
(2)频数分布表如下100只灯泡使用寿命非频数分布690~700 700~710 710~720 720~730 730~740 261813103261813103合计100 100(3)直方图(略)(4)茎叶图如下茎叶65 1 866 1 4 5 6 867 1 3 4 6 7 968 1 1 2 3 3 3 4 5 5 5 8 8 9 969 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 970 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 971 0 0 2 2 3 3 5 6 7 7 8 8 972 0 1 2 2 5 6 7 8 9 973 3 5 674 1 4 7(1)频数分布表如下按重量分组频率/包40 〜42 242 〜44 344 〜46 746 〜48 1648 〜50 1752 〜52 1052 〜54 202.62.7 2.854 〜56 856 〜58 1058 〜60 460 〜62 3合计100(2)直方图(略)。
贾俊平《统计学》复习笔记课后习题详解及典型题详解 第11章~第12章【圣才出品】
圣才电子书 十万种考研考证电子书、题库视频学习平台
4 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 11-1 不同形态的散点图
(4)相关系数
通过散点图可以判断两个变量之间有无相关关系,并对变量间的关系形态作出大致的描
有所差异。样本相关系数是总体相关系数的一致估计量。样本相关系数记为 r,其计算公式
为:
r
n xy x y
n x2 ( x)2 n y2 ( y)2
按照上述计算公式计算的相关系数也称为线性相关系数,或 Pearson 相关系数。 ②相关系数的性质 a.r 的取值范围在-1~+1 之间,即-1≤r≤1。若 0<r≤1,表明 x 与 y 之间存在正 线性相关关系;若-1≤r<0,表明 x 与 y 之间存在负线性相关关系;若 r=+1,表明 x 与
5 / 97
圣才电子书 十万种考研考证电子书、题库视频学习平台
y 之间为完全正线性相关关系;若 r=-1,表明 x 与 y 之间为完全负线性相关关系。可见当 |r|=1 时,y 的取值完全依赖于 x,二者之间即为函数关系;当 r=0 时,说明 y 的取值与 x 无关,即二者之间不存在线性相关关系。|r|→1 说明两个变量之间的线性关系越强;|r|→0 说明两个变量之间的线性关系越弱。
b.r 具有对称性。x 与 r 之间的相关系数 rxy 和 y 与 x 之间的相关系数 ryx 相等,即 rxy =ryx。
c.r 数值大小与 x 和 y 的原点及尺度无关。改变 x 和 y 的数据原点及计量尺度,并不 改变 r 的数值大小。
述,但不能准确反映变量之间的关系强度。需要计算相关系数来准确度量两个变量之间的关
系强度。
统计学第六版贾俊平 无水印
? 对事物类别顺序的测度 ? 数据表现为类别,用文字来表述 ? 例如,产品分为一等品、二等品、三等品、次品等
3. 数值型数据(metric data)
? 对事物的精确测度 ? 结果表现为具体的数值 ? 例如:身高为 175cm、168cm、183cm
统计数据的分类
management science (管理科学 )
marketing (市场营销学 )
medical diagnosis (医学诊断 )
meteorology (气象学 )
military science (军事科学 )
nuclear material safeguards (核材料安全管理 )
ophthalmology (眼科学 )
统计中的几个基本概念
总体
?
? ?
?????
样本
?? ?
参数 ? ? ?
平均数 标准差 比例
统计量 ?x s p
几种常用的统计软件
(Software)
?典型的统计软件
? SAS ? SPSS
? MINITAB
? STATISTICA ? Excel
SAS SPSS
STATISTICA MINITAB Excel
? 有限总体的范围能够明确确定,且元素的数目是有限的 ? 无限总体所包括的元素是无限的,不可数的
2. 样本 (sample)
? 从总体中抽取的一部分元素的集合 ? 构成样本的元素的数目称为样本容量
参数和统计量
1. 参数(parameter)
? 研究者想要了解的总体的某种特征值 ? 所关心的参数主要有总体均值(? )、标准差(? )、
统计学原理贾俊平12
表12-2 加权综合指数计算表
销售量
单价(元)
销售额(元)
商品名称
计量 单位
2019
q0
2019 q1
2019 p0
2019 p1
2019 p0q0
2019 p1q1
p0q1
p1q0
粳米 标准粉 花生油
kg 1200 1500 3.6 kg 1500 2000 2.3 kg 500 600 9.8
4.0 4320 6000 5400 4800 2.4 3450 4800 4600 3600 10.6 4900 6360 5880 5300
2. 指数的性质
相对性:总体变量在不同场合下对比形成的相对数
不同时间上对比形成的指数称为时间性指数 不同空间上对比形成的指数称为区域性指数
综合性:反映一组变量在不同场合下的综合变动 平均性:指数是总体水平的一个代表性数值
12 - 5
经济、管理类 基础课程
统计学
指数的分类
指数的分类
固定时期变量值加权的综合指数
统计学
(实例)
【例12.3】设某企业生产三种产品的有关资料如表12-3。 试以1990年不变价格为权数,计算各年的产品产量指数
商品名称 甲
某企业生产三种产品的有关资料
计量 单位
1994
销售量 2019
2019
件
1000
960
1100
1990年 不变价格
(元)
50
乙
台
120
q99 65
p9q 096 564 1 50 .0 0% 6 0 1 p9q 095 532500
q99 64
p9q 096 564 1 50 .0 5% 6 0 1 p9q 094 530000
统计学(第六版)贾俊平——-课后习题答案
第一章导论1。
1.1(1)数值型变量.(2)分类变量.(3)离散型变量.(4)顺序变量。
(5)分类变量.1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合.(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。
1.3(1)总体是所有IT从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4(1)总体是所有在网上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在网上购物者的月平均花费。
(4)参数(5)推断统计方法。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料"。
使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手资料时,要注明数据来源。
2。
比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试.3。
调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。
[医学]卫生统计学 第六版第12章简单回归分析
14名中年健康妇女基础代谢与体重测量值的关系
基础代谢( Kj/d)
min (Yi Yi )2
6000 5500 5000 4500 4000 3500 3000
35 40 45 50 55 60 65 70 75 体重(kg)
14名中年健康妇女的基础代谢与体重测量值的关系
2. 回归参数估计的最小二乘(LSE)原则:
5
47.8
3987.4
2284.84 15899358.76 190597.72
6
62.8
4970.6
3943.84 24706864.36 312153.68
7
67.3
5359.7
4529.29 28726384.09 360707.81
8
48.6
3970.6
2361.96 15765664.36 192971.16
9
44.6
3983.2
10
58.6
5050.1
11
71.0
5355.5
12
59.7
4560.6
13
62.1
4874.4
14
61.5
5029.2
合计
777.2
63232.9
基础代谢 ((Kj/d)
(1) 由样本数据绘制散点图:
6000 5500 5000 4500 4000 3500 3000
35 40 45 50 55 60 65 70 75
60岁的健3康妇女,测得37.1每人的基础代谢34(6k0j.2/d)与体重的
4
51.7
4020.8
Байду номын сангаас
数据,见5表11-1。据此47数.8 据如何判断这3两987项.4 指标间有无
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12 - 37
精品教材
统计学 12.5 利用回归方程进行估计和预测
软件应用
12 - 38
精品教材
置信区间估计
(例题分析)
统计学
variable: VAR1
STATISTICA输出的不良贷款的置信区间
B-Weight Value 0.040039 100 0.148034 10 0.014529 15 -0.02919 60 B-Weight * Value 4.003935 1.480339 0.21794 -1.75157 -1.02164 2.929003 2.049598 3.808407
12 - 8
精品教材
统计学
二元回归方程的直观解释
二元线性回归模型 y
y b 0 b1 x1 b 2 x2
(观察到的y)
b0
回归面
}
i
x2 (x1,x2) x1
12 - 9
E ( y) b 0 b1 x1 b 2 x2
精品教材
统计学
估计的多元回归方程
12 - 10
3. 确定显著性水平,并进行决策
t>t2,拒绝H0; t<t2,不能拒绝H0
12 - 26
精品教材
回归系数的推断
(置信区间)
统计学
回归系数在(1-)%置信水平下的置信区间为
ˆ t (n p 1)s ˆ b i 2 b
回归系数的 抽样标准差
i
Excel 输出结果的分析
精品教材
统计学
第 12 章 多元线性回归
作者:中国人民大学统计学院
12 - 1
贾俊平
精品教材
统计学
12.1 12.2 12.3 12.4 12.5 12.6
12 - 2
第12章 多元线性回归
多元线性回归模型 回归方程的拟合优度 显著性检验 多重共线性 利用回归方程进行估计和预测 虚拟自变量的回归
精品教材
若有一个或多个相关系数显著,就表示模型中所用 的自变量之间相关,存在着多重共线性 模型中各对自变量之间显著相关。 当模型的线性关系检验 (F检验) 显著时,几乎所有回 归系数的t检验却不显著 回归系数的正负号与其的相反。 Excel 输出结果的分析
2. 如果出现下列情况,暗示存在多重共线性
(例题分析)
统计学
1.
t2(25-2)=2.0687 ,所有统计量 t>t2(25-2)=2.0687 ,所以均拒绝原假设,说明这 4 个自变量两两之间 都有显著的相关关系 由表Excel输出的结果可知,回归模型的线性关系显 著(Significance-F=1.03539E-06<=0.05)。而回归 系 数 检 验 时 却 有 3 个 没 有 通 过 t 检 验 (PValue=0.074935 、 0.862853 、 0.067030>=0.05) 。这也暗示了模型中存在多重共线性 固定资产投资额的回归系数为负号(-0.029193) ,与 预期的不一致
12 - 32
精品教材
多重共线性
(例题分析)
统计学
【例】判别各自变量之间是否存在多重共线性
贷款余额、应收贷款、贷款项目、固定资产投资额之间的相关矩阵
12 - 33
精品教材
多重共线性
(例题分析)
统计学
【例】判别各自变量之间是否存在多重共线性
相关矩阵系数的检验统计量
12 - 34
精品教材
多重共线性
VAR2 VAR3 VAR4 VAR5 Intercpt Predictd -95.0%PL +95.0%PL12 - 40100 10 15 60
精品教材
统计学
12.6 虚拟自变量的回归
一. 含有一个虚拟自变量的回归 二. 用虚拟自变量回归解决方差分析问题
12 - 41
精品教材
统计学
含有一个虚拟自变量的回归
4. 对每一个自变量都要单独进行检验
5. 应用 t 检验统计量
12 - 25
精品教材
统计学
1. 提出假设
回归系数的检验
(步骤)
H0: bi = 0 (自变量 xi 与 因变量 y 没有线性关系) H1: bi 0 (自变量 xi 与 因变量 y有线性关系)
2. 计算检验的统计量 t
Excel 输出 结果的分析
VAR2 VAR3 VAR4 VAR5 Intercpt Predictd -95.0%CL +95.0%CL
12 - 39
精品教材
预测区间估计
(例题分析)
统计学
variable: VAR1
STATISTICA输出的不良贷款的预测区间
B-Weight Value 0.040039 0.148034 0.014529 -0.029193 B-Weight * Value 4.003935 1.480339 0.21794 -1.751572 -1.02164 2.929003 -0.884199 6.742205
精品教材
统计学
多元回归模型
(基本假定)
1. 误差项ε 是一个期望值为 0 的随机变量,即 E()=0 2. 对于自变量 x1 , x2 , … , xp 的所有值, 的 方差2都相同 3. 误差项ε是一个服从正态分布的随机变量, 即ε~N(0,2),且相互独立
12 - 7
精品教材
统计学 (multiple regression equation)
2.
3.
12 - 35
精品教材
统计学
多重共线性问题的处理
12 - 36
精品教材
多重共线性
(问题的处理)
统计学
1. 将一个或多个相关的自变量从模型中剔除 ,使保留的自变量尽可能不相关
2. 如果要在模型中保留所有的自变量,则应
避免根据 t 统计量对单个参数进行检验
对因变量值的推断 ( 估计或预测 ) 的限定在自 变量样本值的范围内
可能会使回归的结果造成混乱,甚至会把分 析引入歧途
可能对参数估计值的正负号产生影响,特别 是各回归系数的正负号有可能同我们与其的 正负号相反
Excel 输出结果的分析
12 - 30
精品教材
统计学
多重共线性的识别
12 - 31
精品教材
统计学
多重共线性的识别
1. 检测多重共线性的最简单的一种办法是计算模型 中各对自变量之间的相关系数,并对各相关系数 进行显著性检验
Excel 输出结果的分析
12 - 18
精品教材
统计学
估计标准误差 Sy
1. 对误差项的标准差的一个估计值 2. 衡量多元回归方的程拟合优度 3. 计算公式为
Excel 输出结果的分析
12 - 19
精品教材
统计学
12.3 显著性检验
一. 线性关系检验 二. 回归系数检验和推断
12 - 20
精品教材
多重判定系数
3. 因变量取值的变差中,能被估计的多元回 归方程所解释的比例
12 - 17
精品教材
统计学
修正多重判定系数
(adjusted multiple coefficient of determination)
1. 用样本容量n和自变量的个数p去修正R2得到 2. 计算公式为
3. 避免增加自变量而高估 R2 4. 意义与 R2类似 5. 数值小于R2
12 - 27
精品教材
统计学
12.4 多重共线性
一. 多重共线性及其所产生的问题 二. 多重共线性的判别 三. 多重共线性问题的处理
12 - 28
精品教材
统计学
多重共线性及其产生的问题
12 - 29
精品教材
多重共线性
(multicollinearity)
统计学
1. 回归模型中两个或两个以上的自变量彼此 相关 2. 多重共线性带来的问题有
ˆ b ˆ x b ˆ x b ˆ x ˆb y 0 1 1 2 2 p p
ˆ ,b ˆ ,b ˆ , , b ˆ 是 b 0 1 2 p 估计值 ˆ 是 y 的估计值 y
12 - 11
b 0 , b1 , b 2 ,, b p
精品教材
统计学
参数的最小二乘估计
12 - 12
精品教材
统计学
估计的多元回归的方程
(estimated multiple regression equation)
ˆ ,b ˆ ,b ˆ , , b ˆ 估计回归方 1. 用样本统计量 b 0 1 2 p 程中的 参数 b 0 , b1 , b 2 ,, b p 时得到的方程 2. 由最小二乘法求得 3. 一般形式为
统计学
1. 2. 3. 4. 5. 6. 7.
学习目标
回归模型、回归方程、估计的回归方程 回归方程的拟合优度 回归方程的显著性检验 多重共线性问题及其处理 利用回归方程进行估计和预测 虚拟自变量的回归问题 用 Excel 进行回归分析
12 - 3
精品教材
统计学
12.1 多元线性回归模型
一. 多元回归模型与回归方程 二. 估计的多元回归方程 三. 参数的最小二乘估计
1. 描述因变量 y 的平均值或期望值如何依赖 于自变量 x1, x2 ,…,xp的方程 2. 多元线性回归方程的形式为 E( y ) = b0+ b1 x1 + b2 x2 +…+ bp xp
b1,b2,,bp称为偏回归系数
多元回归方程
bi 表示假定其他变量不变,当 xi 每变 动一个单位时,y 的平均平均变动值