计量经济学 第二章
计量经济学课件-第二章
重要提示
• 几乎没有哪个实际问题能够同时满足所有基本假设; • 通过模型理论方法的发展,可以克服违背基本假设 带来的问题; • 违背基本假设问题的处理构成了单方程线性计量经 济学理论方法的主要内容: 异方差问题(违背同方差假设) 序列相关问题(违背序列不相关假设) 共线性问题(违背解释变量不相关假设) 随机解释变量(违背解释变量确定性假设)
Back
第 二 章:一元线性回归模型
§2.2 一元线性回归模型的参数估计
一、古典(基本)假定 二、用普通最小二乘法(OLS)估计模型的参数 三、OLS回归直线的性质(数值性质) 四、最小二乘估计式的统计性质 (前提:满足古典(基本)假定)
一、古典(基本)假定
简单线性回归模型:
(一) 对变量和模型的假定 1)重复抽样中,解释变量 X i 与干扰项 u独立; i 是一组固定的值或虽然是随机的,但
估计总体回归方程(PRF)。
设样本回归方程为:
ˆ ˆ X ˆ Y i 1 2 i
ˆ 实际值与拟合值的离差为: Y Y i i
离差平方和为:
ˆ) Q e (Y Y
2 i i i
2
最小二乘法的基本思想(原则):寻找实际值与拟合值的离 差平方和为最小的回归直线。
ˆ ˆ X) ˆ ) (Y e (Y Y
ˆ x ˆi y 2 i
ˆ ˆ X ˆ Y i 1 2 i
ˆ ˆ X e Yi 1 2 i i
ˆ e Yi Y i i
ˆ ˆ X) ˆ ˆ X) ˆi y ( ( 1 2 i 1 2 ˆ(X X) ˆ x ˆi y 2 i 2 i
i=1,2,„n (2.1.3)
X X , X , 1 2 其中,Y 称被解释变量, „ k 称解释变量,k 为解
斯托克、沃森着《计量经济学》第二章
Chapter 2. Review of Probability2.1 Random Variables and Probability Distributions概率Probability:在大量重复实验下,事件发生的频率趋向的某个稳定值。
例如,记事件“下雨”为A,其发生的概率为P()A。
条件概率Conditional Probability :例:已知明天会出太阳,下雨的概率有多大?记事件“出太阳”为B 。
则在出太阳的前提条件下降雨的“条件概率”(conditional probability )为,P()P()P()A B A B B ∩≡其中,“∩”表示事件的交集(intersection ),故P()A B ∩为“太阳雨”的概率,参见图2.1。
条件概率是计量经济学的重要概念之一。
图2.1、条件概率示意图独立事件Independence :如果条件概率等于无条件概率,即P()P()A B A =,即B 是否发生不影响A 的发生,则称,A B 为相互独立的随机事件。
此时,P()P()P()P()A B A B A B ∩≡=,故P()P()P()A B A B ∩=也可以将此式作为独立事件的定义。
全概公式如果事件组{}12,,,(2)n B B B n ≥ 两两互不相容,()0(1,,)i P B i n >∀= ,且12n B B B ∪∪∪ 为必然事件(即在12,,,n B B B 中必然有某个i B 发生,“∪”表示事件的并集,union ),则对任何事件A 都有(无论A 与{}12,,,n B B B 是否有任何关系),1P()P()P()ni i i A B A B ==∑全概公式把世界分成了n 个可能的情形,再把每种情况下的条件概率“加权平均”而汇总成无条件概率(权重为每种情形发生的概率)。
该公式有助于理解后面的迭代期望定律。
离散型随机变量Discrete Random Variable :假设随机变量X 的可能取值为{}12,,,,k x x x ,其对应的概率为{}12,,,,k p p p ,即(P )k k p X x ≡=,则称X 为离散型随机变量,其分布律可以表示为,1212k k X x x x pp p p其中,0k p ≥,1kkp=∑。
计量经济学第二章
以上假设也称为线性回归模型的经典假设或高斯 (Gauss)假设,满足该假设的线性回归模型,也 称为经典线性回归模型(Classical Linear Regression Model, CLRM)。
注意:
1、如果假设1、2满足,则假设3也满足;
2、如果假设4满足,则假设2也满足;
1 yi 0 1 ui xi
就属于被解释变量y与解释变量x之间不为线性关 系的情形,如果我们令
1 x x
此时非线性模型就变成线性模型了
yi 0 1 xi ui
山东经济学院统计与数学学院计量经济教研室
三、一元线性回归模型中随机项的假定
在给定样本观测值(样本值) ( xi , yi ) ,i=1,2, 3,…,n 后, 为了估计(2. 5)式的参数 0 和 1 , 必须 对随机项 u i 做出某些合理的假定。这些假定通常 称为古典假定。
山东经济学院统计与数学学院计量经济教研室
假定1 E(ui|xi)=0 i=1,2, …,n; 随机误差项u具有零均值. 假定2 Var (ui|xi)=E{[ui-E(ui)]2}=E(ui2)=u2 i=1,2, …,n 随机误差项u具有同方差. 假定3 Cov(ui, uj)= E{[ui-E(ui)] [uj-E(uj)]}= 0 i≠j, i, j= 1,2, …,n 随机误差项u具有不序列相关性. 假定4 Cov(ui, xi)=0 i=1,2, …,n 随机误差项u与解释变量x之间不相关. 假定5 ui~N(0, u2 ) i=1,2, …,n u服从零均值、同方差的正态分布.
山东经济学院统计与数学学院计量经济教研室
回归与回归分析的内容
庞浩 计量经济学2第二章 简单线性回归模型
三、总体回归函数
总体回归函数(population regression function,简称PRF): 将总体被解释变量Y的条件均值表现为解释 变量X的函数。
E (Y | X i ) f ( X i )
当总体回归函数是线性形式时,
总体回归函数的条件 期望表示方式
E (Y | X i ) f ( X i ) 1 2 X i
22
四、随机扰动项u
(一)定义 各个被解释变量的个别值与相应的条件均值的 偏差,被称为随机扰动项,或随机干扰项 (stochastic disturbance),或随机误差项 (stochastic error), 用u表示。它可正可 负,是一个随机变量。
ui Yi E (Y | X i ) Yi E (Y | X i ) ui Yi 1 2 X i ui
消费 支出 Y
932
1259 1448 1651 2298 2289 2365 2488 2856 3150
25
Y
SRF1 SRF2
X
26
样本一
Y vs. X 3500 3000 2500 2000 1500 1000 500 0 1000 2000 3000 4000 5000 6000 X 3500 3000 2500 2000 1500 1000 500 0
4
(二)相关关系的种类
⒈按涉及变量的多少分为 单相关 多重(复)相关
相 关 关 系 的 种 类
⒉按表现形式的不同分为
线性相关
非线性相关 正相关 负相关 完全相关
⒊单相关时,按相关关系的方 向不同分为
4.按相关程度的不同分为
Hale Waihona Puke 不完全相关 不相关5
计量经济学第二章
二、参数的普通最小二乘估计
Q
e
2 i
(Y
i
Yi )
2
[Y
i
( 0 1 X i )]
2
Q 对 0 , 1 求 一 阶 偏 导 令 其 为 0, 得 到 :
0 1
LOGO
LOGO
微积分 求:当x,y为多少时,F=f(x,y)最小或最大? 解:将F分别对x,y求一阶偏导,并令其等于0:
F x F y 0
例 如 : F 1 0 x 8 y 6 xy
2 3
0
如 何 求 F的 极 值 ?
由此便可解出x,y
LOGO
称为总体回归函数(PRF). 总体回归函数表明被解释变量Yi的平均状态 (总体条件期望)随解释变量Xi的变化规律。
LOGO
我们可以把总体回归函数简化为线性的形式:
E (Y X i ) 0 1 * X i
(2.1.4)
其中: 0 , 1 是未知的参数,称为回归系数。 (2.1.4)也称为线性总体回归函数。
LOGO
总体回归函数表明被解释变量Yi的平均状态 E (Y X i )随解释变量Xi的变化规律。 那么,对于某一个具体的家庭来说,它的消费支 出Yi就恰好等于给定收入水平Xi下的消费支出的平均 值(Y (X i )X i ) 吗? E E Y 所以,对于每一个具体的家庭,记
LOGO
在函数关系中,给定一个X,只有一个确定的Y与 之对应,因此X,Y都是确定性变量; 在相关关系中,给定一个X,有多个Y与之相对应, 因此当给定的X为确定性变量时,Y是一个不确定 的变量,称为随机变量。
计量经济学第二章
第二章主要介绍了计量经济学 的基本概念、原理和方法,包 括经济变量、经济模型、数据 收集与处理、参数估计与假设 检验等。
第二章主要介绍了计量经济学 的基本概念、原理和方法,包 括经济变量、经济模型、数据 收集与处理、参数估计与假设 检验等。
第二章主要介绍了计量经济学 的基本概念、原理和方法,包 括经济变量、经济模型、数据 收集与处理、参数估计与假设 检验等。
异方差性概念及产生原因
异方差性概念
异方差性是指误差项的方差随自变量的变化 而变化,即不满足同方差性的假设。
产生原因
异方差性的产生原因可能包括模型设定偏误、 遗漏重要变量、数据测量误差、异常值影响 等。
异方差性检验方法
图形检验法
通过绘制残差图或残差与解释变量的散点图,观察是否存在异方差性。
等级相关系数法
最小二乘法原理及应用
最小二乘法原理
最小二乘法是一种数学优化技术,它通过最小化预测值与实际观测值之间的残差平方和来估计线性回归模型的参 数。这种方法可以使得模型的预测结果更加接近实际观测值。
最小二乘法应用
在实际应用中,最小二乘法被广泛应用于各个领域,如经济学、金融学、社会学等。它可以用于预测未来趋势、 评估政策效果、分析市场需求等。
03
多元线性回归模型
多元线性回归模型构建
02
01
03
模型设定
确定因变量和自变量,建立多元线性回归方程。
数据收集
收集样本数据,包括因变量和自变量的观测值。
参数估计
采用最小二乘法等方法,估计模型参数。
偏回归系数解释与检验
偏回归系数解释
偏回归系数表示在其他自变量不变的情 况下,某一自变量对因变量的影响程度 。
05
计量经济学第二章(第二部分)
其中,有k个解释变量;k+1个回归参数
3
计量经济学 第二章B
同 上
(2)矩阵形式: Y XB N Y1 Y2 Y ... Y n 1 1 X ... 1 0 u1 1 u2 , B , N ... ... u n 1 k (k 1) 1 n n 1 X 11 X 12 ... X 1n X 21 X 22 ... X 2n ... ... ... ... X k1 X k2 ... X kn n (k 1)
2
(2)当 R
2
k n -1
时,
R
2
<0 ,此时, 使
2
用 R 将失去意义。因此, R 只适
2
用于Y与解释变量整体相关程度较的
情况。
34
计量经济学 第二章B
四、回归方程的显著性检验
(1) 提出原假设 (2) 构造统计量 H 0 : 1 2 ... k 0 F ESS/k RSS/n (3) 对于给定的显著性水平 (4)判定方程的显著性, 若 F F , 则拒绝原假设 若 F F ,则接受原假设 H 0,即模型的线性关系 F 检验; - k -1 ~ F(k, n - k - 1) ( 在 H 0 成立时) F
不管其质量的好坏,而所要求的样本容量
的下限。
20
计量经济学 第二章B
同 上
ˆ 由 B ( X X)
-1
ˆ X Y 中看到,要使 B
存在,
必须保证(XˊX)-1存在,因此,必须满
足|XˊX|≠0 ,即XˊX为满秩矩阵,而
计量经济学计量第二章st
∑
x i2
i i
∑ k x = ∑ k x
i i
=1
2. 最小二乘估计量的性质
无偏性证明:
β1 =
∑ k y = ∑ k (β + β x + ) = β ∑k + β ∑k x + ∑k = β + ∑k
i i i 0 1 i i 0 i 1 i i i i 1 i i
E ( β1 ) = E ( β1 + = β1 1
101 65
80
140 220 x 每周收入$
E(i )=0 的说明
E(i )=0 E( yi xi ) = β0 + β1xi
即:凡是模型不显含的、因而归属于i 的因素, 对y的均值都没有系统影响。
如果E(i )=α,即被省略的变量对y的均值 有系统性影响α,则有:
yi=β0+β1xi+i= β0+β1xi+i+α-α =(β0+α)+β1xi+(i-α) * * E * = β 0 +β1xi+ i ——新模型, ( i ) = 0 ——所有系统性影响都包含在截距项(常数项)中, 所以一般不予过多关注。
2. 最小二乘估计量的性质
线性性的证明:
β1 ∑ x y = ∑ x ( y y ) = ∑ x y = ∑ k y = ∑ x ∑ x ∑ x
i i 2 i i i i i 2 i 2 i i i
ki =
xi
∑
xi2
性质:1. ki非随机 2. Σ ki=0 3. 4.
∑
k i2 =
1
yi = yi + ei = β0 + β1xi + ei
计量经济学讲义_2.doc
第二章经典单方程计量经济学模型:一元线性回归模型§2.1 回归分析概述一回归分析的概念无论自然现象之间还是社会经济现象之间,大都存在着不同程度的联系,计量经济学的主要任务之一就是寻找各种经济变量之间的相互联系程度、联系方式以及经济变量之间的运动规律。
一般来说,变量之间的关系可以分为两类:一类是确定性的函数关系。
例如,表示。
圆的半径与圆面积之间的关系,可以用函数关系S=2r另一类是非确定性的统计相关关系。
例如,商品房的价格Y与房屋面积X 的关系,随着X的增加,Y也增加。
但是,在给定X时,Y并不能确定。
原因在于,商品房的价格Y不仅与房屋面积X有关,而且还与所在的区域、楼层和小区的人文环境等等因素有关。
这样,虽然人们无法得到商品房的价格Y与房屋面积X之间的函数关系,但是,人们可以将商品房的价格Y作为随机变量,通过统计计量的方法研究它们之间的统计相关关系。
研究随机变量间统计相关关系的方法主要有两种,一种是相关分析法,另一种是回归分析法。
1 相关分析相关分析主要研究随机变量间的相关形式和相关程度。
(1)相关的定义与分类定义:相关(correlation)指两个或两个以上随机变量间相互关系的程度或强度。
分类:①按强度分完全相关:变量间存在函数关系。
例,圆的周长,L = 2πr高度相关(强相关):变量间近似存在函数关系。
例,我国家庭收入与支出的关系。
弱相关:变量间有关系但不明显。
例,近年来我国耕种面积与产量。
零相关:变量间不存在任何关系。
例,某班学生的学习成绩与年龄。
2004006008001020304050YX121020304050YX0.51.01.52.02.53.02.02.53.03.54.04.5YX完全相关 高度相关、线性相关、正相关 弱相关②按变量个数分按形式分:线性相关, 非线性相关 简单相关:指两个变量间相关按符号分:正相关, 负相关, 零相关 复相关(多重相关):指一个变量与两个或两个以上变量间的相关。
计量经济学 第二章
注意: 这里将样本回归方程看成总体回归方程的近似替代
则
样本回归函数的随机形式/样本回归模型:
同样地,样本回归函数也有如下的随机形式:
Y i Y ˆ i e i ˆ 0 ˆ 1 X i e i
请对比:
式 中 , e i称 为 ( 样 本 ) 残 差 ( 或 剩 余 ) 项 ( r e s i d u a l ) , 代 表
E(Y|X=Xi) 该例中:E(Y | X=800)=605
3500
每 月 消 费 支 出
Y (元)
3000 2500 2000 1500 1000
500 0
500
1000
1500 2000 2500 3000
3500 4000
每月可支配收入X(元)
描出散点图发现:随着收入的增加,消费
“平均地说”也在增加,且Y的条件均值均落 在一根正斜率的直线上。这条直线称为总体 回归线。
E(i)=0
i=1,2, …,n
Var (i)=2 i=1,2, …,n
Cov(i, j)=E(i j)=0 i≠j i,j= 1,2, …,n
假设3、随机误差项与解释变量X之间不相关:
coi, vX (i)E [iE (i)]X i[E (X i)] E (iX i)0
i1 ,2, ,n
假设4、服从零均值、同方差、零协方差的正 态分布。
PRF,实际上,主要是估计参数( ˆi )。
估计方法有多种,其中最广泛使用的是普通 最小二乘法(ordinary least squares, OLS)。
为保证参数估计量具有良好的性质,通常对 模型提出若干基本假设。
计量经济学第二章(第三部分)
计量经济学 第二章C
二、实际经济问题中的异方差性
比如:我们建立一个服装需求函数模型,以 服装需求量Q作为被解释变量,以收入Y,服 装价格 P0 和其他商品价格 P1 为解释变量,于 是有模型 : P Q = f ( Y , 0 ,P1 ;u) 在该模型中,气候因素没包含在解释变量里, 而是放在误差项中。但它对服装需求量Q是有 影响的,若该因素构成误差项的主要部分, 则可能产生异方差。
1 2 f(X i ) 而var( ) varui 2 , 即消除了异方差 f(X i ) f(X i ) f(X i )
29
计量经济学 第二章C
同 上
()对新模型进行 OLS 估计, 3 可得到 0, 1具有 BLUE 性质的估计量。
30
计量经济学 第二章C
2、加权最小二乘法
为WLS估计量。
32
计量经济学 第二章C
(2)利用加权最小二乘法处理异方差 假设已知 varui 2 f(X i ) ,
判断模型可能存在 复杂型异方差
14
计量经济学 第二章C
同 上
(2)以残差平方 e 2 为纵轴,某个解释变 量X为横轴,画出残差序列分布图。
15
计量经济学 第二章C
分布图
e
(1)
2
e2
(2) x x
同 上
判断模型基本不 存在异方差
e2
(3) x (4)
e2
x
(2)—(4)可能存在 异方差
16
计量经济学 第二章C
5451.91
6797.71 7869.16 5483.73 5382.91 5853.72
同 上
海南
重庆 四川
349.44
《计量经济学》第二章知识
第二章 数学基础 (Mathematics)第一节 矩阵(Matrix)及其二次型(Quadratic Forms)第二节 分布函数(Distribution Function),数学期望(Expectation)及方差(Variance) 第三节 数理统计(Mathematical Statistics ) 第一节 矩阵及其二次型(Matrix and its Quadratic Forms)2.1 矩阵的基本概念与运算 一个m ×n 矩阵可表示为:v a a a a a aa a a a A mn m m n n ij ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡== 212222111211][矩阵的加法较为简单,若C=A +B ,c ij =a ij +b ij但矩阵的乘法的定义比较特殊,若A 是一个m ×n 1的矩阵,B 是一个n 1×n 的矩阵,则C =AB 是一个m ×n 的矩阵,而且∑==nk kj ikij b ac 1,一般来讲,AB ≠BA ,但如下运算是成立的:● 结合律(Associative Law ) (AB )C =A (BC ) ● 分配律(Distributive Law ) A (B +C )=AB +AC 问题:(A+B)2=A 2+2AB+B 2是否成立?向量(Vector )是一个有序的数组,既可以按行,也可以按列排列。
行向量(row ve ctor)是只有一行的向量,列向量(column vector)只有一列的向量。
如果α是一个标量,则αA =[αa ij ]。
矩阵A 的转置矩阵(transpose matrix)记为A ',是通过把A 的行向量变成相应的列向量而得到。
显然(A ')′=A ,而且(A +B )′=A '+B ',● 乘积的转置(Transpose of a production ) A B AB ''=')(,A B C ABC '''=')(。
《计量经济学》第二章 简单线性回归模型
Yi 与 E(Yi Xi ) 不应有偏差。若偏
差 u i 存在,说明还有其他影响因素。
Xi
X
u i实际代表了排除在模型以外的所有因素对 Y 的影响。
◆性质 u i 是其期望为 0 有一定分布的随机变量
重要性:随机扰动项的性质决定着计量经济分析结
果的性质和计量经济方法的选择
19
引入随机扰动项 u i 的原因
数 是客观存在的特定数值。
●总体的两个变量 X 和 Y的全部数值通常不可能直接观测,所
以总体相关系数一般是未知的。
7
X和Y的样本线性相关系数:
如果只知道 X 和 Y 的样本观测值,则X和Y的样本线性
__
__
相关系数为: rXY
( Xi X )(Yi Y )
__
__
( Xi X )2 (Yi Y )2
如果能够通过某种方式获得 ˆ1 和 ˆ 2 的数值,显然: ● ˆ1和 ˆ 2 是对总体回归函数参数1 和2 的估计 ● Yˆ i 是对总体条件期望 E(Yi Xi ) 的估计
么,可以计算出总体被解释变量Y的条件期望 E(Y Xi ) ,
并将其表现为解释变量X的某种函数
E(Y Xi ) f (Xi )
这个函数称为总体回归函数(PRF) 本质: 总体回归函数实际上表现的是特定总体中被解释变 量随解释变量的变动而变动的某种规律性。 计量经济学的根本目的是要探寻变量间数量关系的规律,也 就要努力去寻求总体回归函数。
条件均值形式:
样本回归函数如果为线性函数,可表示为
Yˆi ˆ1 ˆ2 Xi
其中:Yˆi 是与 X i 相对应的 Y 的样本条件均值 ˆ1 和 ˆ2 分别是样本回归函数的参数
个别值(实际值)形式:
计量经济学 第二章 经典单方程计量模型简化内容
• 3.拟合优度(拟合度) • ①R2指标是判断回归模型优劣的一个最基 本的指标,但比较笼统,不精细。 • ②在Eviews中就是回归结果中的第一个R2, 判断时要注意,其越接近1,说明模型总体 拟合效果越好。 • ③R2的正式名称是“决定系数”,但通常 称其为拟合度。
• 具体的,拟合优度的计算公式如下:
• 3.计量模型的设定 • (1)基本形式: • y x (2.3) • 这里是一个随机变量,称作随机扰动项, 它的数学期望为0,即 注意:上式中条件数学期望的含义是,在给 定x时,ε的平均值为0。试举现实中的例子 予以说明。 回归直线、回归模型概念说明
• 二.一个完美计量经济模型的假设 • 1.对模型提出一些假设(限制)的原因 • 保证模型设定具有较高的合理性,从而可用其进 行经济分析并有利于统计分析的进行。 • 2.基本假定 • (1)在x给定的条件下,ε的数学期望为0 • (2)在x给定的条件下, x与ε不相关 • (3)在x给定的条件下, ε的方差是一个常数 • (4)在x给定的条件下, ε的样本之间不存在序 列相关 • (5) N (0, 2 )
R
2
2 (Yi Y )
n
(Y Y )
i 1 i
i 1 n
1.它的直观的含义是:估计 出来的被解释变量的每个 值跟平均值的偏差之和与 真实的被解释变量样本值 跟平均值的偏差之和的比 例。 2.现实当中的理解:如果我们在做模型时 希望最有效的解释被解释变量的波动,那 么比较好的一个指标就是让R2最大。 但一定要注意,在实际应用当中,大部分 情况下,我们并不是关注整个模型,而只 是关注一个解释变量对被解释变量的影响。
12 1 L , , exp 2 2 2 2 2 2
计量经济学第二章
第一节 两变量线性回归模型
一、模型的建立 二、模型的假设
3
一、模型的建立
变量和函数式 变量关系的随机性
4
变量和函数式
两变量线性因果关系:Y = + X Y——被解释变量 X——解释变量 、——待定参数
5
1、模型根据:
(1)研究问题的需要; (2)经济理论和观点; (3)利用经验和数据分布情况; (4)非线性函数和线性变换。
X
i
i
20
二、消费函数参数估计
以例3-1建立的消费函数模型为例,具 体说明如何用最小二乘法估计模型中的 参数。
21
例3-3上海经济的消费规律研究
年份
1981 1982 1983 1984 1985 1986
可支配收入 Y
637 659 686 834 1075 1293
消费性支出 CC
585 576 615 726 992 1170
本章主要内容
第一节 第二节 第三节 第四节 第五节 第六节
两变量线性回归模型 参数估计 最小二乘估计量的性质 回归拟合度评价和决定系数 统计推断 预测
1
引言
本章介绍两变量线性回归分析。两变量 线性回归分析的对象是两变量单向因果 关系,模型的核心是两变量线性函数, 分析方法是回归分析。两变量线性回归 分析是经典计量经济分析的基础,掌握 两变量线性回归分析的原理和技术,对 进一步学习多元回归和其他计量经济分 析方法都有帮助。
17
核心:残差平方和
2
2 e i 最小。 i
V ei Yi (a bX i )
i i
2பைடு நூலகம்
V 0 a V 0 b
计量经济学第二章
5500 6000 6500 2924 3515 3521 3338 3721 3954 3650 3865 4108 3802 4026 4345 4087 4165 4812 4298 4380 4312 4580 4413
3853 4036 4148
计量
11 11
消费支出的条件期望与收入关系的图形
i 1
i 1
n
n
xi x yi y ˆ1 xi x 2
i 1
i 1
计量
23
易得:
n
xi x y i y ˆ1 i 1 n x i x 2
i 1
在假设前提
n
x i
x 2
0下
i 1
ˆ0 y ˆ1x
计量
24
2.3 OLS的操作技巧
•拟合值与残差 •OLSE的代数性质 •拟合优度
• 样本回归线只是样本条件均值的轨迹,还不 是总体回归线,它至多只是未知的总体回归 线的近似表现
样本回归函数与总体回归函数的关系
y
PRF
• SRF1
• • *• * SRF2
• *•
• **
••
• •*
x
样本回归函数的函数形式应与设定的总体 回归函数的函数形式一致
对样本回归的理解
对比:
总体回归函数 样本回归函数
ˆ0yˆ1x
•由此估计出的 ˆ 0
(OLSE)
和ˆ1
称为参数的最小二乘估计量
•除了OLS以外,参数估计的方法还有最大似然估计
(ML)方法、矩估计方法(MM)等
基于条件期望为0的普通最小二乘法的推导
• 由E(u)=0 得E(y – 0 – 1x) = 0
计量经济学第二章
Chapter 2: The Simple Linear Regression Model
Page 10
2.1 经济模型
Principles of Econometrics, 4th Edition
Chapter 2: The Simple Linear Regression Model
Page 11
Chapter 2: The Simple Linear Regression Model
Page 19
2.1 An Economic
Model
简单(总体)回归函数可以写作:
Eq. 2.1
E(y|x)μyβ2β2x
知但固其定中的,E 参β(1y 数是|。x截)距,yβ21是斜2 率x。它们都E是q. 2未.1
Page 14
2.1 An Economic
Model
Figure 2.1a 给定收入x=1000美元,食品支出y的概率分布
Principles of Econometrics, 4th Edition
Chapter 2: The Simple Linear Regression Model
Page 15
这一模型被称之为简单回归,不是因为它简单, 仅仅是因为它的右边只包括一个解释变量。
从几何意义上看,总体回归线就是当解释变量取 给定值时被解释变量的条件期望值的轨迹。
更简单地说,对应于解释变量X的每个给定值都有 Y的一个子总体,连接这些子总体的均值就得到总体回 归线。
Principles of Econometrics, 4th Edition
Chapter 2: The Simple Linear Regression Model
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、典型例题分析
例 1、令 kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。生 育率对教育年数的简单回归模型为
kids = β0 + β1educ + μ
1
(1)随机扰动项 μ 包含什么样的因素?它们可能与教育水平相关吗?
(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
关于 βˆ1 求偏导得
∑ ∂RSS = 2
∂βˆ1
(Yt − βˆ1 X t )(− X t ) = 0
即
∑ X t (Yt − βˆ1 X t ) = 0
βˆ1
=
(∑ X iYi )
(∑
) X
2 i
4
可见 βˆ1 是 OLS 估计量。
例 5.假设模型为 Yt = α + βX t + μt 。给定 n 个观察值 ( X1,Y1 ) , ( X 2 ,Y2 ) ,…,
5
例 6.对于人均存款与人均收入之间的关系式 St = α + βYt + μt 使用美国 36 年的年度数
据得如下估计模型,括号内为标准差:
Sˆt = 384.105 + 0.067Yt (151.105) (0.011)
R2 =0.538 σˆ = 199.023 (1) β 的经济解释是什么?
由于模型的错误设定形造成的。如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对 截距项的估计产生影响;另一种可能就是线性设定可能不正确。
(3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中 53.8%的拟合优度, 表明收入的变化可以解释储蓄中 53.8 %的变动。
(4)检验单个参数采用 t 检验,零假设为参数为零,备择假设为参数不为零。双变量 情形下在零假设下 t 分布的自由度为 n-2=36-2=34。由 t 分布表知,双侧 1%下的临界值位于 2.750 与 2.704 之间。斜率项计算的 t 值为 0.067/0.011=6.09,截距项计算的 t 值为 384.105/151.105=2.54。可见斜率项计算的 t 值大于临界值,截距项小于临界值,因此拒绝 斜率项为零的假设,但不拒绝截距项为零的假设。
μt
− μ1 ] = β
Xt − X1
Xt − X1
Xt − X1
这意味着求和中的每一项都有期望值 β ,所以平均值也会有同样的期望值,则表明是无偏
的。
(3)根据高斯-马尔可夫定理,只有 β 的 OLS 估计量是最付佳线性无偏估计量,因此,
这里得到的 βˆ 的有效性不如 β 的 OLS 估计量,所以较差。
(1)α + βN 为接受过 N 年教育的员工的总体平均起始薪金。当 N 为零时,平均薪金
为α ,因此α 表示没有接受过教育员工的平均起始薪金。β 是每单位 N 变化所引起的 E 的
变化,即表示每多接受一年学校教育所对应的薪金增加值。
(2)OLS 估计量αˆ 和仍 βˆ 满足线性性、无偏性及有效性,因为这些性质的的成立无需 随机扰动项 μ 的正态分布假设。
本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS) 的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。
本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所 谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”, 第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次:第一,检 验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的 t 检验完成;第二, 检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。
首先考察被解释变量度量单位变化的情形。以 E*表示以百元为度量单位的薪金,则
2
E = E *×100 = α + βN + μ
由此有如下新模型
E* = (α /100) + (β /100)N + (μ /100)
或
E* = α * +β * N + μ *
这里α* = α /100 , β * = β /100 。所以新的回归系数将为原始模型回归系数的 1/100。
解答: (1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上
述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如 收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。
(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平 educ 相关时,上述回 归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰 动项相关的情形,基本假设 4 不满足。
(2)计算 βˆ 的期望值并对所做假设进行陈述。这个估计值是有偏的还是无偏的?解
释理由。 (3)证明为什么该估计值不如我们以前用 OLS 方法所获得的估计值,并做具体解释。
解答: (1)散点图如下图所示。
(X2,Y2)
(Xn,Yn)
(X1,Y1)
首 先 计 算 每 条 直 线 的 斜 率 并 求 平 均 斜 率 。 连 接 ( X1,Y1 ) 和 ( X t ,Yt ) 的 直 线 斜 率 为
X
2 i
。
(2)在基本假设 E(μi ) = 0 下, β~1 与 βˆ1 均为无偏估计量。
(3)拟合线Yˆ = βˆ1 X 通常不会经过均值点 ( X ,Y ) ,但拟合线Y~ = β~1 X 则相反。
(4)只有 βˆ1 是 β1 的 OLS 估计量。
解答:
∑ (1)由第一个正规方程 et = 0 得
Yi = β1 X i + μi
称之为过原点回归(regrission through the origin)。试证明
(1)如果通过相应的样本回归模型可得到通常的的正规方程组
∑ ei = 0 ∑ ei X i = 0
(∑ ) (∑ ) 则可以得到 β1 的两个不同的估计值: β~1 = Y X , βˆ1 = X iYi
解答:
(1) β 为收入的边际储蓄倾向,表示人均收入每增加 1 美元时人均储蓄的预期平均变
化量。
(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此α 符 号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期 β 的符号为正。
实际的回归式中, β 的符号为正,与预期的一致。但截距项为负,与预期不符。这可能与
X tYt X ,
X
2 t
通常不等于Y 。这就意味着点 ( X ,Y ) 不太可能位于直线Yˆ = βˆ1 X 上。 相反地,由于 β~1 X = Y ,所以直线Yˆ = β~1 X 经过点 ( X ,Y ) 。
(4)OLS 方法要求残差平方和最小
∑ ∑ Min RSS = et2 = (Yt − βˆ1 X t )2
(2)α 和 β 的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,
你可以给出可能的原因吗? (3)对于拟合优度你有什么看法吗? (4)检验是否每一个回归系数都与零显著不同(在 1%水平下)。同时对零假设和备择假
设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么?
(Yt − Y1 ) /( X t − X 1 ) 。由于共有 n -1 条这样的直线,因此
∑ βˆ =
1
Байду номын сангаасt=n
[
Yt
− Y1
]
n −1 t=2 X t − X1
(2)因为 X 非随机且 E(μt ) = 0 ,因此
E[
Yt − Y1
]
=
(α E[
+
βX t
+
μt
)
−
(α
+
βX1
+
μ1 )]
=
β
+
E[
( X n ,Yn ) ,按如下步骤建立 β 的一个估计量:在散点图上把第 1 个点和第 2 个点连接起来
并计算该直线的斜率;同理继续,最终将第 1 个点和最后一个点连接起来并计算该条线的斜
率;最后对这些斜率取平均值,称之为 βˆ ,即 β 的估计值。
(1)画出散点图,给出 βˆ 的几何表示并推出代数表达式。
(3)如果 μt 的分布未知,则所有的假设检验都是无效的。因为 t 检验与 F 检验是建立 在 μ 的正态分布假设之上的。
例 3、在例 2 中,如果被解释变量新员工起始薪金的计量单位由元改为 100 元,估计的 截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距 项与斜率项有无变化? 解答:
第二章 经典单方程计量经济学模型:一元线性回归模型
一、内容提要
本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归 函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回 归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是 建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总 体回归函数做出统计推断。