第二章 一元线性回归模型

合集下载

一元线性回归模型

一元线性回归模型

1.高尔顿普遍回归定律。高尔顿的目 的在于发现为什么人口的身高分布有一种
稳定性。在现代,我们并不关心这种解释,
我们关心的是:在给定父辈身高的情形下,
找到儿辈平均身高的变化规律。
就是说,我们如果知道了父辈的身高,
就可预测儿辈的平均身高。假设我们得
到了一组父亲、儿子身高的数据,制成
如下的散点图。图中按统计分组的方法 将父亲身高分为若干组。
在经典物理学中,给定电阻Ω,电流I
和电压V 之间的关系即为函数关系,即
V I Ω
。这种典型的变量关系就是确
定性关系。
在经济系统中, 这种变量之间的函数关
系或确定性关系就很少见 。常见的是变量
之间是一种不确定的关系,既使变量X 是
变量Y 的原因, 给定变量X 的值也不能具
体确定变量Y的值, 而只能确定变量Y 的
(4.2)
其中,1 和 2 为未知而固定的参数, 称为回归系数; 1 为截距系数, 2 为斜 率系数。式(4.2)为线性总体回归函数 。
三、线性的含义
1.对变量为线性 对线性的第一种解释是指Y 的条件期望是 Xi 的线性函数,例如式(4.2)就是线性回归
函数,该回归线是一条直线。
按这种解释 E (Y / X i ) 1 2 X
统计特征,通常称变量X 与Y 之间的这种
关系为统计关系。
例如,企业总产出Y 与企业的资本投入
K 、劳动力投入L 之间的关系就是统计关 系。虽然资本K 和劳动力L 是影响产出Y 的两大核心要素,但是给定K 、L 的值并 不能确定产出Y 的值。因为,总产出Y 除 了受资本投入K、劳动力投入L 的影响外
对于Y 的每一条件分布,我们能计算 出它的条件期望,记为E(Y/X=Xi),即 在X取特定Xi 值时Y 的期望值。例如, X=1000时,Y 的期望值为:

计量经济学第2章 一元线性回归模型

计量经济学第2章 一元线性回归模型

15
~ ~ • 因为 2是β2的线性无偏估计,因此根据线性性, 2 ~ 可以写成下列形式: 2 CiYi
• 其中αi是线性组合的系数,为确定性的数值。则有
E ( 2 ) E[ Ci ( 1 2 X i ui )]
E[ 1 Ci 2 Ci X i Ci ui ]
6
ˆ ˆ X )2 ] ˆ , ˆ ) [ (Yi Q( 1 2 i 1 2 ˆ ˆ X 2 Yi 1 2 i ˆ ˆ 1 1 2 ˆ ˆ ˆ ˆ [ ( Y X ) ] 1 2 i Q( 1 , 2 ) i ˆ ˆ X X 2 Yi 1 2 i i ˆ ˆ 2 2
16
~
i
i
• 因此 ~ 2 CiYi 1 Ci 2 Ci X i Ci ui 2 Ci ui
• 再计算方差Var( ) 2 ,得 ~ ~ ~ 2 ~ Var ( 2 ) E[ 2 E ( 2 )] E ( 2 2 ) 2
C E (ui )
2 i 2 i
i
~
i
i
i
i
E ( 2 Ci ui 2 ) 2 E ( Ci ui ) 2
i
2 u
C
i
2 i
i
~ ˆ)的大小,可以对上述表达式做一 • 为了比较Var( ) 和 Var( 2 2
些处理: ~ 2 2 2 2 Var ( 2 ) u C ( C b b ) i u i i i
8
• 2.几个常用的结果
• (1) • (2) • (3) • (4)

计量经济学 第二章 一元线性回归模型

计量经济学  第二章  一元线性回归模型

第二章 一元线性回归模型2.1 一元线性回归模型的基本假定2.1.1一元线性回归模型有一元线性回归模型(统计模型)如下, y t = β0 + β1 x t + u t上式表示变量y t 和x t 之间的真实关系。

其中y t 称被解释变量(因变量),x t 称解释变量(自变量),u t 称随机误差项,β0称常数项,β1称回归系数(通常未知)。

上模型可以分为两部分。

(1)回归函数部分,E(y t ) = β0 + β1 x t ,(2)随机部分,u t 。

图2.1 真实的回归直线这种模型可以赋予各种实际意义,居民收入与支出的关系;商品价格与供给量的关系;企业产量与库存的关系;身高与体重的关系等。

以收入与支出的关系为例。

假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。

但实际上数据来自各个家庭,来自同一收入水平的家庭,受其他条件的影响,如家庭子女的多少、消费习惯等等,其出也不尽相同。

所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。

“线性”一词在这里有两重含义。

它一方面指被解释变量Y 与解释变量X 之间为线性关系,即1tty x β∂=∂220tt y x β∂=∂另一方面也指被解释变量与参数0β、1β之间的线性关系,即。

1ty x β∂=∂,221ty β∂=∂0 ,1ty β∂=∂,2200ty β∂=∂2.1.2 随机误差项的性质随机误差项u t 中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。

所以在经济问题上“控制其他因素不变”是不可能的。

随机误差项u t 正是计量模型与其它模型的区别所在,也是其优势所在,今后咱们的很多内容,都是围绕随机误差项u t 进行了。

回归模型的随机误差项中一般包括如下几项内容: (1)非重要解释变量的省略, (2)数学模型形式欠妥, (3)测量误差等,(4)随机误差(自然灾害、经济危机、人的偶然行为等)。

第二章:一元线性回归模型理论与方法(第二部分)

第二章:一元线性回归模型理论与方法(第二部分)

最小二乘法的数学原理
• 纵向距离是Y的实际值与拟合值之差,差异 大拟合不好,差异小拟合好,所以又称为 拟合误差或残差。 • 将所有纵向距离平方后相加,即得误差平 方和,“最好”直线就是使误差平方和最 小的直线。 • 于是可以运用求极值的原理,将求最好拟 合直线问题转换为求误差平方和最小。
普通最小二乘法(OLS)
这三个准则也称作估计量的小样本性质。
拥有这类性质的估计量称为最佳线性无偏估计 量(best liner unbiased estimator, BLUE)。
高斯—马尔可夫定理(Gauss-Markov theorem)
在给定经典线性回归的假定下,最小二乘估计 量是具有最小方差的线性无偏估计量。
ˆ , ˆ 的均 2、无偏性,即以X的所有样本值为条件,估计量 0 1 0与1 。 值(期望)等于总体回归参数真值
ˆ X i2 Yi X i Yi X i 0 nX i2 (X i ) 2 ˆ nYi X i Yi X i 1 2 2 n X ( X ) i i
对数似然函 数极大化的 一阶条件
结构参数的 ML估计量
最大似然法与普通最小二乘法讨论

已知一组样本观测值(Yi,Xi)(i=1,2, …,n), 要求样本回归函数尽可能好地拟合这组值,即 样本回归线上的点Y ˆi 与真实观测点Yi的“总体” 误差尽可能地小。在技术处理上我们一般采用 “最小二乘法”。

最小二乘原则:由于估计值和实测值之差可正 可负,简单求和可能将很大的误差抵消掉,因 此,只有平方和才能反映二者在总体上的接近 程度。
n 1
证残差与 Yˆ 的样本协方差为0,即证: i
eiYˆ i
0
ห้องสมุดไป่ตู้

第二章 一元线性回归模型(本科生计量经济学)

第二章 一元线性回归模型(本科生计量经济学)

即:正规方程组揭示的是残差的性质。
26
普通最小二乘估计有关 的其他性质(课后习题)
Y Y

^
e Y e y
i ^ i
^
i
0 0
27
i
2、由普通最小二乘估计系数的性质可证
得普通最小二乘估计与参数的关系如下:
1 1 k i u i
^
0 0 wi ui
( 1) ( 2)
( 1)
0 Y 1 X
^

^

Y

1 n
Y , X X
i 1 i 1 n i 1
n

n
i
18
参数的普通最小二乘估计量
ˆ ˆ X )0 (Yi 0 1 i ˆ ˆ X )X 0 ( Y i 0 1 i i
^
33
三、一元线性回归模型参数的最大似 然法(Maximum Likehood,ML)估计
• 基本原理:似然原理
• 一元线性回归模型ML使用的条件:已知随机扰动 项的分布。
34
Y1 , Y2 ,...,Yn
1 f (Yi ) e 2
1 2
1 2
2
Yi ~ N (0 1 X i , 2 )
w 1
i
22
普通最小二乘估计的例
年份
1991 1992 1993 1994
ED(X)
708 793 958 1278
FI(Y)
3149 3483 4349 5218
ed(x)
-551 -466 -301 19
fi(y)
-2351 -2017 -1151 -282

第二章 一元线性回归

第二章 一元线性回归

n ei 0 i 1 n xe 0 i i i 1
经整理后,得正规方程组
n n ˆ ˆ n ( x ) 0 i 1 yi i 1 i 1 n n n ( x ) ˆ ( x 2 ) ˆ xy i 0 i 1 i i i 1 i 1 i 1
y ˆ i 0 1xi ˆi 之间残差的平方和最小。 使观测值 y i 和拟合值 y
ei y i y ˆi
n
称为yi的残差
ˆ , ˆ ) ˆ ˆ x )2 Q( ( y i 0 1i 0 1
i 1
min ( yi 0 1 xi ) 2
i
xi x
2 ( x x ) i i 1 n
yi
2 .3 最小二乘估计的性质
二、无偏性
ˆ ) E ( 1
i 1 n
n
xi x
2 ( x x ) j j 1 n
其中用到
E ( yi )
( x x) 0 (xi x) xi (xi x)2
二、用统计软件计算
1.例2.1 用Excel软件计算
什么是P 值?(P-value)
• P 值即显著性概率值 ,Significence Probability Value

是当原假设为真时所得到的样本观察结果或更极端情况 出现的概率。
P值与t值: P t t值 P值



它是用此样本拒绝原假设所犯弃真错误的真实概率,被 称为观察到的(或实测的)显著性水平。P值也可以理解为 在零假设正确的情况下,利用观测数据得到与零假设相 一致的结果的概率。
2 .1 一元线性回归模型

第二章经典单方程计量经济学模型:一元线性回归模型

第二章经典单方程计量经济学模型:一元线性回归模型

第二章经典单方程计量经济学模型:一元线性回归模型一、内容提要本章介绍了回归分析的大体思想与大体方式。

第一,本章从整体回归模型与整体回归函数、样本回归模型与样本回归函数这两组概念开始,成立了回归分析的大体思想。

整体回归函数是对整体变量间关系的定量表述,由整体回归模型在假设干大体假设下取得,但它只是成立在理论之上,在现实中只能先从整体中抽取一个样本,取得样本回归函数,并用它对整体回归函数做出统计推断。

本章的一个重点是如何获取线性的样本回归函数,要紧涉及到一般最小二乘法(OLS)的学习与把握。

同时,也介绍了极大似然估量法(ML)和矩估量法(MM)。

本章的另一个重点是对样本回归函数可否代表整体回归函数进行统计推断,即进行所谓的统计查验。

统计查验包括两个方面,一是先查验样本回归函数与样本点的“拟合优度”,第二是查验样本回归函数与整体回归函数的“接近”程度。

后者又包括两个层次:第一,查验说明变量对被说明变量是不是存在着显著的线性阻碍关系,通过变量的t查验完成;第二,查验回归函数与整体回归函数的“接近”程度,通过参数估量值的“区间查验”完成。

本章还有三方面的内容不容轻忽。

其一,假设干大体假设。

样本回归函数参数的估量和对参数估量量的统计性质的分析和所进行的统计推断都是成立在这些大体假设之上的。

其二,参数估量量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性组成了对样本估量量好坏的最要紧的衡量准那么。

Goss-markov定理说明OLS估量量是最正确线性无偏估量量。

其三,运用样本回归函数进行预测,包括被说明变量条件均值与个值的预测,和预测置信区间的计算及其转变特点。

二、典型例题分析例一、令kids表示一名妇女生育小孩的数量,educ表示该妇女同意过教育的年数。

生育率对教育年数的简单回归模型为β+μβkids=educ+1(1)随机扰动项μ包括什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭露教育对生育率在其他条件不变下的阻碍吗?请说明。

21一元线性回归模型.ppt

21一元线性回归模型.ppt

同理,p(Y= ? /X=260)=1/7
条件均值(条件期望 ) :
对Y的每一条件概率分布,我们能算出它 的均值 :
记做E(Y/X=Xi)
[简写为E(Y/Xi) ]
并读为“在X取特定Xi值时的Y的期望值”。
计算方法:
将表2.1中的有关列乘以表2.2中的相应列 的条件概率,然后对这些乘积求和便是。
第二章 一元线性回归模型
§2.1 一元线性回归模型概念基础 回归是计量经济学的主要工具 一、“回归”一词的历史渊源
Francis Galton F.加尔顿
回归一词最先由F.加尔顿 (FrancisC,alton)引入
加尔顿的普遍回归定律还被他的朋友 K.皮尔逊(KartPearson)证实
Karl Pearson K.皮尔逊
综合来看,回归分析一般可以用来:
(1) 通过已知变量的值来估计因变量的均值。
(2)对独立性进行假设检验―――根据经济理 论建立适当的假设。
例如,对于需求函数,你可以检验假设:需求的 价格弹性为-1.0;即需求曲线具有单一的价格 弹性。也就是说,在其他影响需求的因素保持 不变的情况下,如果商品的价格上涨1%,平 均而言,商品的需求量将减少1%。
P (
1/7 1/5 1/5 1/6 1/5 1/7 1/5 1/7 1/5
Y/ 1/7 1/5 1/5 1/6 1/5 1/7 1/5 1/7 1/5
Xi ) 1/7
1/6
1/7
1/7
1/7
1/7
1/7
Y的条 48 46 44 42 40 38 36 34 32 30
件均值
E(Y/X=Xi) Y的条件均值
·
·
·
· ·

第二章 一元线性回归模型 知识点

第二章 一元线性回归模型 知识点

第二章一元线性回归模型一、知识点列表二、关键词1、回归分析基本概念关键词:回归分析在计量经济学中,回归分析方法是研究某一变量关于另一(些)变量间数量依赖关系的一种方法,即通过后者观测值或预设值来估计或预测前者的(总体)均值。

回归的主要作用是用来描述自变量与因变量之间的数量关系,还能够基于自变量的取值变化对因变量的取值变化进行预测,也能够用来揭示自变量与因变量之间的因果关系关键词:解释变量、被解释变量影响被解释变量的因素或因子记为解释变量,结果变量被称为被解释变量。

2、回归模型的设定关键词:随机误差项(随机干扰项)不包含在模型中的解释变量和其他一些随机因素对被解释变量的总影响称为随机误差项。

产生随机误差项的原因主要有:(1)变量选择上的误差;(2)模型设定上的误差;(3)样本数据误差;(4)其他原因造成的误差。

关键词:残差项(residual )通过样本数据对回归模型中参数估计后,得到样本回归模型。

通过样本回归模型计算得到的样本估计值与样本实际值之差,称为残差项。

也可以认为残差项是随机误差项的估计值。

3、一元线性回归模型中对随机干扰项的假设 关键词:线性回归模型经典假设线性回归模型经典假设有5个,分别为:(1)回归模型的正确设立;(2)解释变量是确定性变量,并能够从样本中重复抽样取得;(3)解释变量的抽取随着样本容量的无限增加,其样本方差趋于非零有限常数;(4)给定被解释变量,随机误差项具有零均值,同方差和无序列相关性。

(5)随机误差项服从零均值、同方差的正态分布。

前四个假设也称为高斯马尔科夫假设。

4、最小二乘估计量的统计性质关键词:普通最小二乘法(Ordinary Least Squares ,OLS )普通最小二乘法是通过构造合适的样本回归函数,从而使得样本回归线上的点与真实的样本观测值点的“总体误差”最小,即:被解释变量的估计值与实际观测值之差的平方和最小。

ββ==---∑∑∑nn n222i i 01ii=111ˆˆmin =min ()=min ()i i i i u y y y x关键词:无偏性由于未知参数的估计量是一个随机变量,对于不同的样本有不同的估计量。

计量经济学第二章一元线性回归模型

计量经济学第二章一元线性回归模型
第二章 经典单方程计量经济学模型: 一元线性回归模型
回归分析概述 一元线性回归模型的参数估计 一元线性回归模型的检验 一元线性回归模型的预测 实例
§2.1 回归分析概述
一、变量间的关系及回归分析的基本概念 二、总体回归函数(PRF) 三、随机扰动项 四、样本回归函数(SRF)
2020/3/6
LOU YONG
表 2.1.3 家庭消费支出与可支配收入的一个随机样本 Y 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 X 594 638 1122 1155 1408 1595 1969 2078 2585 2530
2020/3/6
LOU YONG
20
• 该样本的散点图(scatter diagram):
分i。
2020/3/6
LOU YONG
17
上式称为总体回归函数(PRF)的随机 设定形式。表明被解释变量除了受解释 变量的系统性影响外,还受其他因素的 随机性影响。
由于方程中引入了随机项,成为计量经 济学模型,因此也称为总体回归模型。
2020/3/6
LOU YONG
18
随机误差项主要包括下列因素 在解释变量中被忽略的因素的影响; 变量观测值的观测误差的影响; 模型关系的设定误差的影响; 其他随机因素的影响。
回归系数(regression coefficients)。
2020/3/6
LOU YONG
15
三、随机扰动项
总体回归函数说明在给定的收入水平Xi下,该社 区家庭平均的消费支出水平。
但对某一个别的家庭,其消费支出可能与该平 均水平有偏差。
称为观察值围绕它的期望值的离差 (deviation),是一个不可观测的随机变量, 又称为随机干扰项(stochastic disturbance)或 随机误差项(stochastic error)。

第2章一元线性回归模型

第2章一元线性回归模型
第二章
一元线性回归模型
回归分析是计量经济学的基础内容!
本章介绍一元线性回归模型,最小二乘估计方法及 其性质,参数估计的假设检验、预测等。
浙江财经大学 倪伟才
1
本章主要内容
2 .1 一元线性回归模型
2 .2 参数β0、β1的估计
2 .3 最小二乘估计的性质
2 .4 回归方程的显著性检验 2 .5 残差分析 2 .6 回归系数的区间估计
浙江财经大学 倪伟才 10
回归的术语
y的各种名称: 因变量(dependent variable)或被解释变量 (explained variable)或回归子(regressand)或内 生(endogenous); X的各种名称: 自变量(independent variable)或解释变量 (explanatory variable)或回归元(regressor)或外 生(exogenous) U的各种名称: 随机误差项或随机扰动项(stochastic error term, random disturbance term ): 表示其它因素的影响,是不可观测的随机误差!
浙江财经大学 倪伟才
9
2.1一元线性回归模型
由于两个变量y, x具有明显的线性关系,故考虑直 线方程y=0+1x(函数表达的是确定性关系,有缺 陷!) y=0+1x+u, 其中u表示除x外,影响y的其它一切 因素。 将y与x之间的关系用两部分来描述: a. 一部分0+1x ,由x的变化引起y变化; b.另一部分u ,除x外的其它一切因素引起y变化。 参数(parameters) 0 , 1 ; 0 称为回归常数(截距)(intercept, constant), 1称为回归斜率(slope)

第二章一元线性回归模型

第二章一元线性回归模型
2

(c)比较绝对值 t1 与 tα 2 的大小。若 t1 > tα ,则拒绝原假设,判 定 β1 ≠ 0 ,解释变量 x 解释功效显著;若 t1 < tα ,则接受原假设,
2
判定
, x β1 = 0 不是有效的解释变量。
§2.3 显著性检验
(三)一元线性回归模型示例 例2.1 y=JYL,x=DSCYCZZZL,
ˆ β1 = β1 + ∑
xi − x u 2 i ∑(xi − x)
ˆ Eβ0 = β0
ˆ Eβ1 = β1
OLS估计的统计性质 §2.2 OLS估计的统计性质
在一切线性无偏估计中, ˆ ˆ 3. 在一切线性无偏估计中, β0 , β1独具最小方差
1 x2 ˆ var(β0 ) =σ 2 ( + ) 2 n ∑(xi − x)
0 ≤ R2 ≤ 1
2 R2 = rxy
计算公式
ˆ β12 ∑(xi − x)2 2 R = ∑( yi − y)2
OLS估计的统计性质 §2.2 OLS估计的统计性质
(一)线性回归模型的基本假定:
假定1. 解释变量是确定性变量,不具有随机性 假定2. (零均值假定) 假定3. (同方差假定)
Eui = 0 , i = 1 ,2 ,L, n
y = β0 + β1x + u
yi = β0 + β1xi + ui
{yi , xi }
i =1 ,2 ,L, n
i =1 ,2 ,L, n
§2.1 普通最小平方估计
(一)普通最小平方估计(OLS) 普通最小平方估计 待定回归函数 残差 残差平方和 驻点条件
ˆ ˆ ˆ y = β0 + β1x

第2章一元线性回归模型

第2章一元线性回归模型

布图上的点接近于一条曲线时,称为非线性相关。简单相关按
符号又可分为 正相关 (见图2.3.4 )、负相关 (见图2.3.8 )和零 相关 (见图2.3.6 )。两个变量趋于在同一个方向变化时,即同
增或同减,称为变量之间存在正相关;当两个变量趋于在相反
方向变化时,即当一个变量增加,另一个变量减少时,称为变 量之间存在负相关;当两个变量的变化相互没有关系时,称为
4、普通最小二乘法
为什么要使用OLS? (1)OLS的应用相对简便; (2)以最小化残差平方和为目标在理论很合理; (3)OLS估计量有很多有用的性质。 1)估计的回归线通过Y和X的均值。下列等式总是
ˆ ˆX 严格成立的:设下,可以证明,OLS是 “最优”的估计方法。
2.2.2 最小二乘估计量的性质
一个用于考察总体的估计量,可从如下几个方面考察其
优劣性: (1)线性。即它是否是另一个随机变量的线性函数;
(2)无偏性。即它的均值或期望是否等于总体的真实值;
(3)有效性。即它是否在所有的线性无偏估计量中具有 最小方差; (4)渐近无偏性。 即样本容量趋于无穷大时,它的均值 序列趋于总体的真值; (5)一致性。即样本容量趋于无穷大时,它是否依概率 收敛于总体的真值;
1.总变差的分解
ˆ b ˆX ˆ b Yt的估计值位于估计的回归线 Y t 0 1 t 上,Y围绕其均值的变异 (Y Y )可被分解为两部分:
ˆ Y ) (1) (Y t
ˆ) (2) (Yt Y t
样本回归函数:
3.相关系数检验
(1)变量相关的定义和分类
相关:指两个或两个以上变量间相互关系的程度或强度。
2 2 ˆ e ( Y Y ) i i OLS 最小化 i i 1 i 1

第2章 一元线性回归模型

第2章 一元线性回归模型

(regression analysis)来完成的
2020/2/6
中山学院经济与管理系
4
2.1 模型的建立及其假定条件
2 回归分析的概念 回归分析研究一个变量关于另一个(些)变量的
具体依赖关系的计算方法和理论。
其用意:在于通过后者的已知或设定值,去估计 (或)预测前者的(总体)均值。
2020/2/6
中山学院经济与管理系
5
2.1 模型的建立及其假定条件
回归分析的基本思想和方法以及“回归”名称的由来 英国统计学家高尔顿(F.Galton,1822-1911)和他
的学生皮尔逊(K.Pearson,1856-1936)在研究父母身高 与其子女身高的遗传问题时,观察了1078对夫妇,以每对 夫妇的平均身高作为自变量,而取他们的一个成年儿子的 身高作为因变量,将结果在平面直角坐标系上绘成散点图 ,发现趋势近乎一条直线,计算出的回归直线方程为:
二乘法(Ordinary least squares, OLS)给出的
判断标准是:二者之差的平方和最小
n
n
Q (Yi Yˆi )2 (Yi (ˆ0 ˆ1 X i )) 2
1
1
即在给定样本观测值之下,选择出 ˆ0、ˆ1能使 yi
, 之y?i差的平方和最小(即为使残差平方和最小)
(4)被解释变量的样本平均值等于其估计值的平均值
2020/2/6
中山学院经济与管理系
26
2.2 一元线性回归模型的参数估计
4 截距为零的一元线性回归模型的参数估计 截距为零的一元线性回归模型的一般形式为:
yi xi ui
这个模型只有一个参数 需要估计,其最小二乘估
计量的表达式为

第02章-一元线性回归模型

第02章-一元线性回归模型

四、拟合优度的度量
• 基本概念:
拟合优度衡量的是样本回归线对样本观测值的拟合程度。 样本观测值距回归线越近,拟合优度越高,x对y的解释程 度越强。
• 样本观测值、拟合值、样本均值之间的关系
ˆ ˆ ( yt − y ) = ( yt − yt ) + ( yt − y )
?相关分析适用于无明确因果关系的变量之间的关系判断常使用的工具是相关系数相关系数对称的看待两个变量相关系数仅判断变量间是否存在线性相关相关系数判断的是统计依赖关系?如果两个变量之间存在因果关系则需要建立回归模型采用回归分析的方法判断变量之间的因果性效应一元线性回归模型的建立?在回归模型中往往假定解释变量是因被解释变量是果而分析的目标则是确定解释变量对被解释变量的因果性效应的具体数值
5. 一元线性回归模型的假定条件 • 用样本估计总体回归函数,总会存在偏差 (样本不是总体,而且模型存在随机干扰 项),为了保证估计结果具有良好的性质, 通常要对模型中的变量、模型形式以及随 机误差项提出一些假定条件 • 对模型形式和变量的假定
–假定解释变量x是非随机的,或者虽然是随机 的,但与随机误差项u不相关 –假定变量和模型无设定误差
第2章 一元线性回归模型
一、模型的建立及其假定条件 二、普通最小二乘估计(OLS) 三、OLS估计量的统计性质 四、拟合优度的度量 五、回归参数的显著性检验与置信区间 六、一元线性回归模型的预测
一、模型的建立及其假定条件
1. 经济变量之间的关系 • 计量经济分析研究经济变量之间的关系及 其变化规律。 • 两变量之间可能存在的关系:
ˆ ˆ ˆ yt = β 0 + β1 xt
• 样本回归函数(SRF)表示在图形中即为样本回归线 • 需要注意:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2)
250 200 150 100 50 0 0 50 100 150 200 250 300
(3)
250 200 150 100 50 0 0 50 100 150 200 250 300
六、上机题
1. 下表给出了美国30所知名学校的MBA学生1994年基本年薪 (ASP)、GPA分数(从1~4共四个等级)、GMAT分数以及 每年学费的数据。 要求: (1)用双变量回归模型分析GPA是否对ASP有影响? (2)用合适的回归模型分析GMAT分数是否与ASP有关? (3)每年的学费与ASP有关吗?你是如何知道的?如果两变量 之间正相关,是否意味着进到最高费用的商业学校是有利的; (4)你同意高学费的商业学校意味着高质量的MBA成绩吗? 为什么?
1 (X X)2 2 ˆ ) ˆ 0 SE (Y 0 n n xi2 i 1
3、个别值
ˆ ˆ ˆ ˆ Y0 t SE (Y0 ), Y0 t SE (Y0 ) 2 2
Y0
的预测置信区间
1 (X X)2 2 ˆ 1 0 SE (e0 ) n n xi2 i 1
ˆ Y ˆX 0 1
ˆ 1
x y
i 1 n i
n
i
x
i 1
2 i
3、参数的最大似然估计
4、普通最小二乘参数估计量的性质 (1)小样本:线性性、无偏性、有效性(BLUE) (2)大样本:渐近无偏性、一致性、渐近有效性 5、普通最小二乘样本回归函数的性质
(1)Y
(4)
ˆ ˆX 0 1
2 i 1 i 1 n n 2 i
ˆ Y)2 ESS (Y i
i 1
n
RSS ei2
i 1
n
2、决定系数
R2
ESS RSS 1 TSS TSS
3、决定系数与相关系数的关系
r R
2 XY
2
四、一元线性回归模型的参数的统计 2 i 1 ˆ 0 ~ N 0 , n 2 n x i i 1
答:(1)这是一个横截面序列回归。 (2)截距2.6911表示咖啡零售价为每磅0美元时,每天每人平均消费量为 2.6911杯,这个数字没有经济意义;斜率-0.4795表示咖啡零售价与消费量负相 关,价格上升1美元/杯,则平均每天每人消费量减少0.4795杯; (3)不能。
(4)不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出 具体的 值及与之对应的 值。
4. 根据最小二乘原理,所估计的模型已经使得拟合误差 达到最小,为什么还要讨论模型的拟合优度问题?
答:普通最小二乘法所保证的最好拟合是同一个问题内部的比较, 即使用给出的样本数据满足残差的平方和最小;拟合优度检验结果 所表示的优劣可以对不同的问题进行比较,即可以辨别不同的样本 回归结果谁好谁坏。
5. 在满足古典假定条件下,一元线性回归模型的普通最小 二乘估计量有哪些性质?
答:最大似然法的基本思想是使从模型中取得样本观察数据的概率 最大,即把随机抽取得到的样本观察数据看作是重复抽取中最容易 得到的样本观察数据,即概率最大,参数估计结果应该反映这一情 况,使得到的模型能以最大概率产生样本数据。
7. 线性回归模型有哪些基本假设?违背基本假设的计 量经济学模型是否就不可估计?
二、多项选择题
1、ABC 6、ABD 11、ABCD 2、ACD 7、ABC 3、BD 8、ABCD 4、BCD 9、BCD 5、ABCD 10、ABCD
三、判断题
1、× 6、× 11、× 2、× 7、× 12、× 3、√ 8、√ 13、× 4、× 9、√ 14、× 5、× 10、× 15、√
3、参数的假设检验(t检验)
ˆ 0 t0 0 ~ t (n 2) ˆ SE ( 0 )
ˆ 1 t1 1 ~ t (n 2) ˆ SE ( 1 )
五、一元线性回归模型的预测
1、总体均值 E(Y/ X0 ) 的点预测 2、总体均值 E(Y/ X0 ) 的预测置信区间
2 ˆ ~ N , 1 1 n 2 x i i 1
2、参数的区间估计
ˆ ˆ ˆ ˆ 0 t SE ( 0 ), 0 t SE ( 0 ) 2 2
ˆ ˆ ˆ ˆ 1 t SE ( 1 ), 1 t SE ( 1 ) 2 2
答:在满足基本假设情况下,一元线性回归模型的普通最小二乘参 数估计量是最佳线性无偏估计量。1、线性:参数估计量是被解释 变量和随机误差项的线性组合2、无偏性:参数估计量的期望等于 其真实值3、有效性:在所有的线性无偏估计量中,最小二乘估计 量的方差是最小的。
6. 简述最大似然法估计参数的基本思想。
S&P
520 480 440 400 360 320 130 135 140 145 CPI 150 155 160
(2)从上图可见,CPI指数与S&P指数正相关,且呈近似的线性关系。
(3)使用Eviews软件回归结果如表所示。
回归结果显示,CPI指数与S&P指数正相关,斜率表示当CPI指数变化1个点, 会使S&P指数变化11.08个点;截距表示当CPI指数为0时,S&P指数为-1137.826, 此数据没有明显的经济意义。
从计算结果看,每年的学费与ASP显著正相关。学费高,ASP就高;但学费仅解 释了ASP变化的一部分(不到50%),明显还有其他因素影响着ASP。
(4)使用Eviews软件回归结果如表所示。
从回归结果看,尽管高学费的商业学校与高质量的MBA成绩略有正县相关性, 但学费对GPA分数的影响是不显著的,而且也无法得出学费是影响GPA分数的 主要原因的结论。
五、计算分析题
答:(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要 的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因 素可能与受教育水平相关,如收入水平与教育水平往往呈正相关、年龄大小 与教育水平呈负相关等。 (2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时, 上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时 出现解释变量与随机扰动项相关的情形,基本假设3不满足。
(1)使用Eviews软件,ASP对GPA分数的回归结果如表所示。
从回归结果看,GPA分数的系数是统计显著的,对ASP有正的影响。
(2)使用Eviews软件,ASP对GMAT分数的回归结果如表所示。
从回归结果看,GMAT分数与ASP显著正相关。
(3)使用Eviews软件,ASP对学费X的回归结果如表所示。
ˆ ˆ t SE (e ) Y0 t SE (e0 ), Y 0 0 2 2
4、预测置信区间的特征(3点)
四、简答题
1. 为什么计量经济学模型的理论方程中必须包含随机干扰 项?
答:计量经济学模型考察的是具有因果关系的随机变量间的具体联 系方式。由于是随机变量,意味着影响被解释变量的因素是复杂的, 除了解释变量的影响外,还有其他无法在模型中独立列出的各种因 素的影响。这样,理论模型中就必须使用一个称为随机干扰项的变 量来代表所有这些无法在模型中独立表示出来的影响因素,以保证 模型在理论上的科学性。
二、一元线性回归模型的参数估计
1、一元线性回归模型的基本假设 (1)解释变量是确定性变量,不是随机变量 (2)随机误差项零均值、同方差,不同样本点之间独立 (3)随机误差项与解释变量不相关 (4)随机误差项服从正态分布 (5)模型正确设定 2、参数的普通最小二乘估计 基本思想:min e
i 1 n 2 i
2. 总体回归函数和样本回归函数之间有哪些区别与联系?
3. 为什么用可决系数R2评价拟合优度,而不是用残差平 方和作为评价标准?
答:可决系数R2=ESS/TSS=1-RSS/TSS,含义为由解释变量引起的被 解释变量的变化占被解释变量总变化的比重,用来判定回归直线 拟合的优劣,该值越大说明拟合的越好;而残差平方和与样本容 量关系密切,当样本容量比较小时,残差平方和的值也比较小, 尤其是不同样本得到的残差平方和是不能做比较的。此外,作为 检验统计量的一般应是相对量而不能用绝对量,因而不能使用残 差平方和判断模型的拟合优度。
n
(2)
ˆ Y Y
(3)
e
i 1
n
i
0
X i ei 0 (5)
i 1
Yˆ e
i 1
n
i i
0
2 e i i 1 n
6、随机误差项方差的估计 ˆ2
n2
三、一元线性回归模型的拟合优度检验
1、离差分解 TSS=ESS+RSS 其中
TSS (Yi Y) y
2. 下表给出了1990—1996年间的CPI指数与S&P500指数。
年份 1990 1991 1992 CPI 130.7 136.2 140.3 S&P500指数 334.59 376.18 415.74
1993
1994 1995 1996
144.5
148.2 152.4 159.6
451.41
第二章 一元线性回归模型
一、回归模型概述
1、相关分析与回归分析 2、随机误差项(引入随机误差项的原因,5点) 3、总体回归模型 (1)总体回归函数 E(Y/ Xi ) 0 1 X (2)总体回归模型 Yi 0 1 X i i 4、样本回归模型 ˆ ˆX ˆ (1)样本回归函数 Y i 0 1 i ˆ ˆ X e (2)样本回归模型 Yi 0 1 i i
460.33 541.64 670.83
要求:(1)以CPI指数为横轴、S&P指数为纵轴做图; (2)你认为CPI指数与S&P指数之间关系如何? (3)考虑下面的回归模型: ,根据表中的数据运 用OLS估计上述方程,并解释你的结果;你的结果有经济意 义吗?
相关文档
最新文档