计量经济学第二章
计量经济学第二章教学课件
ˆ 0
xi2 y i xi y i xi n xi2 ( xi ) 2
Q 0 ˆ β
1
ˆ n y i xi y i xi 1 n xi2 ( xi ) 2
普通最小二乘法(OLS)
随机误差项方差估计值
ˆ2 ei2 n2
i 1,2,, n
y x 其中, 被称为被解释变量, 被称为解释变 量。为随机误差项, 为观测值下标, i n为样本容量, 为待估参数。 方程被称为随机总体方程。
残差项
ˆ ei yi yi yi ( ˆ 0 β 1 xi ) β ˆ ˆ ˆ y β β x e
回归分析
总体与样本 总体回归函数 样本回归函数 回归的主要内容
总体与样本(补充)
总体(Population or Sample Space):随机试验所 有可能结果的集合,又叫样本空间。 样本点(Sample Point):样本空间的每一元素。 事件(Events):随机试验的可能结果组成的集合, 是总体的一个子集。 在理论上,总体是有限的,但在实际中很难收集每 一个信息。实践中我们所能做到的是从总体中抽 取一个“有代表性的”或“随机”的样本。
无偏性
有效性
一致性
参数估计量的性质
高斯-马尔可夫假定: 1、参数线性,总体模型可写成
yi β 0 β 1 xi ... β i xi μ i
2、随机抽样性 我们有一个含n次观测的随机样本,它来自总 体模型。 3、均值为0
E ( xi ) 0
4、不存在完全共线性 在样本(因而在总体中),没有一个自变量 是常数,自变量之间也不存在严格的线性 关系。 5、同方差性 Var ( xi ) 2 高斯-马尔可夫定理 β ˆ β 在上述假定下,ˆ 0 ,β 1 ,... ˆ i分别是β 0 ,β 1 ,... i 的 β 最优线性无偏估计量(BLUE)。
计量经济学 第二章
二、典型例题分析
例 1、令 kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。生 育率对教育年数的简单回归模型为
kids = β0 + β1educ + μ
1
(1)随机扰动项 μ 包含什么样的因素?它们可能与教育水平相关吗?
(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
关于 βˆ1 求偏导得
∑ ∂RSS = 2
∂βˆ1
(Yt − βˆ1 X t )(− X t ) = 0
即
∑ X t (Yt − βˆ1 X t ) = 0
βˆ1
=
(∑ X iYi )
(∑
) X
2 i
4
可见 βˆ1 是 OLS 估计量。
例 5.假设模型为 Yt = α + βX t + μt 。给定 n 个观察值 ( X1,Y1 ) , ( X 2 ,Y2 ) ,…,
5
例 6.对于人均存款与人均收入之间的关系式 St = α + βYt + μt 使用美国 36 年的年度数
据得如下估计模型,括号内为标准差:
Sˆt = 384.105 + 0.067Yt (151.105) (0.011)
计量经济学课件-第二章
重要提示
• 几乎没有哪个实际问题能够同时满足所有基本假设; • 通过模型理论方法的发展,可以克服违背基本假设 带来的问题; • 违背基本假设问题的处理构成了单方程线性计量经 济学理论方法的主要内容: 异方差问题(违背同方差假设) 序列相关问题(违背序列不相关假设) 共线性问题(违背解释变量不相关假设) 随机解释变量(违背解释变量确定性假设)
Back
第 二 章:一元线性回归模型
§2.2 一元线性回归模型的参数估计
一、古典(基本)假定 二、用普通最小二乘法(OLS)估计模型的参数 三、OLS回归直线的性质(数值性质) 四、最小二乘估计式的统计性质 (前提:满足古典(基本)假定)
一、古典(基本)假定
简单线性回归模型:
(一) 对变量和模型的假定 1)重复抽样中,解释变量 X i 与干扰项 u独立; i 是一组固定的值或虽然是随机的,但
估计总体回归方程(PRF)。
设样本回归方程为:
ˆ ˆ X ˆ Y i 1 2 i
ˆ 实际值与拟合值的离差为: Y Y i i
离差平方和为:
ˆ) Q e (Y Y
2 i i i
2
最小二乘法的基本思想(原则):寻找实际值与拟合值的离 差平方和为最小的回归直线。
ˆ ˆ X) ˆ ) (Y e (Y Y
ˆ x ˆi y 2 i
ˆ ˆ X ˆ Y i 1 2 i
ˆ ˆ X e Yi 1 2 i i
ˆ e Yi Y i i
ˆ ˆ X) ˆ ˆ X) ˆi y ( ( 1 2 i 1 2 ˆ(X X) ˆ x ˆi y 2 i 2 i
i=1,2,„n (2.1.3)
X X , X , 1 2 其中,Y 称被解释变量, „ k 称解释变量,k 为解
计量经济学第二章 简单线性回归
Yˆi Y
2
Yi Yˆi 2
计量经济学
ECONOMETRICS
计量经济学
ECONOMETRICS
两种不同的解释
Jeffrey M. Wooldridge等的解释。 SST表示Y的总体变异。它分为两部分,一部分SSE, 这部分可以由模型解释,另一部分SSR,这是模型解 释不了的部分。
另一种解释。 William H. Greene和Robert S. Pindyck等 SSE(Error Sum of Squares)——残差平方和 SSR(Regression Sum of Squares)——回归平方和
ECONOMETRICS
线性
ˆ1
X X Y Y X X 2
X X
X X
2Y
CY
ˆ0
Y
X
X X
X X
2Y
1 n
XC
Y
都是关于Y的线性函数
C 0
CX 1
C
2
1 X
X
2
计量经济学
ECONOMETRICS
ˆ0 , ˆ1
E
ˆ0
E
ˆ0
ˆ1 E ˆ1
Cov
1 n
Y
,
X X
X X
2
Y
XVar
ˆ1
X X 2 n X X 2
X
斯托克、沃森着《计量经济学》第二章
Chapter 2. Review of Probability2.1 Random Variables and Probability Distributions概率Probability:在大量重复实验下,事件发生的频率趋向的某个稳定值。
例如,记事件“下雨”为A,其发生的概率为P()A。
条件概率Conditional Probability :例:已知明天会出太阳,下雨的概率有多大?记事件“出太阳”为B 。
则在出太阳的前提条件下降雨的“条件概率”(conditional probability )为,P()P()P()A B A B B ∩≡其中,“∩”表示事件的交集(intersection ),故P()A B ∩为“太阳雨”的概率,参见图2.1。
条件概率是计量经济学的重要概念之一。
图2.1、条件概率示意图独立事件Independence :如果条件概率等于无条件概率,即P()P()A B A =,即B 是否发生不影响A 的发生,则称,A B 为相互独立的随机事件。
此时,P()P()P()P()A B A B A B ∩≡=,故P()P()P()A B A B ∩=也可以将此式作为独立事件的定义。
全概公式如果事件组{}12,,,(2)n B B B n ≥ 两两互不相容,()0(1,,)i P B i n >∀= ,且12n B B B ∪∪∪ 为必然事件(即在12,,,n B B B 中必然有某个i B 发生,“∪”表示事件的并集,union ),则对任何事件A 都有(无论A 与{}12,,,n B B B 是否有任何关系),1P()P()P()ni i i A B A B ==∑全概公式把世界分成了n 个可能的情形,再把每种情况下的条件概率“加权平均”而汇总成无条件概率(权重为每种情形发生的概率)。
该公式有助于理解后面的迭代期望定律。
离散型随机变量Discrete Random Variable :假设随机变量X 的可能取值为{}12,,,,k x x x ,其对应的概率为{}12,,,,k p p p ,即(P )k k p X x ≡=,则称X 为离散型随机变量,其分布律可以表示为,1212k k X x x x pp p p其中,0k p ≥,1kkp=∑。
计量经济学第二章
以上假设也称为线性回归模型的经典假设或高斯 (Gauss)假设,满足该假设的线性回归模型,也 称为经典线性回归模型(Classical Linear Regression Model, CLRM)。
注意:
1、如果假设1、2满足,则假设3也满足;
2、如果假设4满足,则假设2也满足;
1 yi 0 1 ui xi
就属于被解释变量y与解释变量x之间不为线性关 系的情形,如果我们令
1 x x
此时非线性模型就变成线性模型了
yi 0 1 xi ui
山东经济学院统计与数学学院计量经济教研室
三、一元线性回归模型中随机项的假定
在给定样本观测值(样本值) ( xi , yi ) ,i=1,2, 3,…,n 后, 为了估计(2. 5)式的参数 0 和 1 , 必须 对随机项 u i 做出某些合理的假定。这些假定通常 称为古典假定。
山东经济学院统计与数学学院计量经济教研室
假定1 E(ui|xi)=0 i=1,2, …,n; 随机误差项u具有零均值. 假定2 Var (ui|xi)=E{[ui-E(ui)]2}=E(ui2)=u2 i=1,2, …,n 随机误差项u具有同方差. 假定3 Cov(ui, uj)= E{[ui-E(ui)] [uj-E(uj)]}= 0 i≠j, i, j= 1,2, …,n 随机误差项u具有不序列相关性. 假定4 Cov(ui, xi)=0 i=1,2, …,n 随机误差项u与解释变量x之间不相关. 假定5 ui~N(0, u2 ) i=1,2, …,n u服从零均值、同方差的正态分布.
山东经济学院统计与数学学院计量经济教研室
回归与回归分析的内容
计量经济学第二章
二、参数的普通最小二乘估计
Q
e
2 i
(Y
i
Yi )
2
[Y
i
( 0 1 X i )]
2
Q 对 0 , 1 求 一 阶 偏 导 令 其 为 0, 得 到 :
0 1
LOGO
LOGO
微积分 求:当x,y为多少时,F=f(x,y)最小或最大? 解:将F分别对x,y求一阶偏导,并令其等于0:
F x F y 0
例 如 : F 1 0 x 8 y 6 xy
2 3
0
如 何 求 F的 极 值 ?
由此便可解出x,y
LOGO
称为总体回归函数(PRF). 总体回归函数表明被解释变量Yi的平均状态 (总体条件期望)随解释变量Xi的变化规律。
LOGO
我们可以把总体回归函数简化为线性的形式:
E (Y X i ) 0 1 * X i
(2.1.4)
其中: 0 , 1 是未知的参数,称为回归系数。 (2.1.4)也称为线性总体回归函数。
LOGO
总体回归函数表明被解释变量Yi的平均状态 E (Y X i )随解释变量Xi的变化规律。 那么,对于某一个具体的家庭来说,它的消费支 出Yi就恰好等于给定收入水平Xi下的消费支出的平均 值(Y (X i )X i ) 吗? E E Y 所以,对于每一个具体的家庭,记
LOGO
在函数关系中,给定一个X,只有一个确定的Y与 之对应,因此X,Y都是确定性变量; 在相关关系中,给定一个X,有多个Y与之相对应, 因此当给定的X为确定性变量时,Y是一个不确定 的变量,称为随机变量。
庞浩计量经济学第二章简单线性回归模型
最小二乘法的应用
在统计学和计量经济学中,最 小二乘法广泛应用于估计线性 回归模型,以探索解释变量与 被解释变量之间的关系。
通过最小二乘法,可以估计出 解释变量的系数,从而了解各 解释变量对被解释变量的影响 程度。
最小二乘法还可以用于时间序 列分析、预测和数据拟合等场 景。
最小二乘法的局限性
最小二乘法假设误差项是独立同分布 的,且服从正态分布,这在实际应用 中可能不成立。
最小二乘法无法处理多重共线性问题, 当解释变量之间存在高度相关关系时, 最小二乘法的估计结果可能不准确。
最小二乘法对异常值比较敏感,异常 值的存在可能导致参数估计的不稳定。
04
模型的评估与选择
R-squared
总结词
衡量模型拟合优度的指标
详细描述
R-squared,也称为确定系数,用于衡量模型对数据的拟合程度。它的值在0到1之间,越接近1表示模型拟合越 好。R-squared的计算公式为(SSreg/SStot)=(y-ybar)2 / (y-ybar)2 + (y-ybar)2,其中SSreg是回归平方和, SStot是总平方和,y是因变量,ybar是因变量的均值。
数据来源
本案例的数据来源于某大型电商 平台的销售数据,包括商品的销 售量、价格、评价等。
数据处理
对原始数据进行清洗和预处理, 包括处理缺失值、异常值和重复 值,对分类变量进行编码,对连 续变量进行必要的缩放和转换。
模型建立与评估
模型建立
基于处理后的数据,使用简单线性回 归模型进行建模,以商品销售量作为 因变量,价格和评价作为自变量。
线性回归模型是一种数学模型, 用于描述因变量与一个或多个 自变量之间的线性关系。它通 常表示为:Y = β0 + β1X1 + β2X2 + ... + ε
计量经济学第二章
第二章主要介绍了计量经济学 的基本概念、原理和方法,包 括经济变量、经济模型、数据 收集与处理、参数估计与假设 检验等。
第二章主要介绍了计量经济学 的基本概念、原理和方法,包 括经济变量、经济模型、数据 收集与处理、参数估计与假设 检验等。
第二章主要介绍了计量经济学 的基本概念、原理和方法,包 括经济变量、经济模型、数据 收集与处理、参数估计与假设 检验等。
异方差性概念及产生原因
异方差性概念
异方差性是指误差项的方差随自变量的变化 而变化,即不满足同方差性的假设。
产生原因
异方差性的产生原因可能包括模型设定偏误、 遗漏重要变量、数据测量误差、异常值影响 等。
异方差性检验方法
图形检验法
通过绘制残差图或残差与解释变量的散点图,观察是否存在异方差性。
等级相关系数法
最小二乘法原理及应用
最小二乘法原理
最小二乘法是一种数学优化技术,它通过最小化预测值与实际观测值之间的残差平方和来估计线性回归模型的参 数。这种方法可以使得模型的预测结果更加接近实际观测值。
最小二乘法应用
在实际应用中,最小二乘法被广泛应用于各个领域,如经济学、金融学、社会学等。它可以用于预测未来趋势、 评估政策效果、分析市场需求等。
03
多元线性回归模型
多元线性回归模型构建
02
01
03
模型设定
确定因变量和自变量,建立多元线性回归方程。
数据收集
收集样本数据,包括因变量和自变量的观测值。
参数估计
采用最小二乘法等方法,估计模型参数。
偏回归系数解释与检验
偏回归系数解释
偏回归系数表示在其他自变量不变的情 况下,某一自变量对因变量的影响程度 。
05
计量经济学第二章(第二部分)
其中,有k个解释变量;k+1个回归参数
3
计量经济学 第二章B
同 上
(2)矩阵形式: Y XB N Y1 Y2 Y ... Y n 1 1 X ... 1 0 u1 1 u2 , B , N ... ... u n 1 k (k 1) 1 n n 1 X 11 X 12 ... X 1n X 21 X 22 ... X 2n ... ... ... ... X k1 X k2 ... X kn n (k 1)
2
(2)当 R
2
k n -1
时,
R
2
<0 ,此时, 使
2
用 R 将失去意义。因此, R 只适
2
用于Y与解释变量整体相关程度较的
情况。
34
计量经济学 第二章B
四、回归方程的显著性检验
(1) 提出原假设 (2) 构造统计量 H 0 : 1 2 ... k 0 F ESS/k RSS/n (3) 对于给定的显著性水平 (4)判定方程的显著性, 若 F F , 则拒绝原假设 若 F F ,则接受原假设 H 0,即模型的线性关系 F 检验; - k -1 ~ F(k, n - k - 1) ( 在 H 0 成立时) F
不管其质量的好坏,而所要求的样本容量
的下限。
20
计量经济学 第二章B
同 上
ˆ 由 B ( X X)
-1
ˆ X Y 中看到,要使 B
存在,
必须保证(XˊX)-1存在,因此,必须满
足|XˊX|≠0 ,即XˊX为满秩矩阵,而
计量经济学计量第二章st
∑
x i2
i i
∑ k x = ∑ k x
i i
=1
2. 最小二乘估计量的性质
无偏性证明:
β1 =
∑ k y = ∑ k (β + β x + ) = β ∑k + β ∑k x + ∑k = β + ∑k
i i i 0 1 i i 0 i 1 i i i i 1 i i
E ( β1 ) = E ( β1 + = β1 1
101 65
80
140 220 x 每周收入$
E(i )=0 的说明
E(i )=0 E( yi xi ) = β0 + β1xi
即:凡是模型不显含的、因而归属于i 的因素, 对y的均值都没有系统影响。
如果E(i )=α,即被省略的变量对y的均值 有系统性影响α,则有:
yi=β0+β1xi+i= β0+β1xi+i+α-α =(β0+α)+β1xi+(i-α) * * E * = β 0 +β1xi+ i ——新模型, ( i ) = 0 ——所有系统性影响都包含在截距项(常数项)中, 所以一般不予过多关注。
2. 最小二乘估计量的性质
线性性的证明:
β1 ∑ x y = ∑ x ( y y ) = ∑ x y = ∑ k y = ∑ x ∑ x ∑ x
i i 2 i i i i i 2 i 2 i i i
ki =
xi
∑
xi2
性质:1. ki非随机 2. Σ ki=0 3. 4.
∑
k i2 =
1
yi = yi + ei = β0 + β1xi + ei
计量经济学 第二章
注意: 这里将样本回归方程看成总体回归方程的近似替代
则
样本回归函数的随机形式/样本回归模型:
同样地,样本回归函数也有如下的随机形式:
Y i Y ˆ i e i ˆ 0 ˆ 1 X i e i
请对比:
式 中 , e i称 为 ( 样 本 ) 残 差 ( 或 剩 余 ) 项 ( r e s i d u a l ) , 代 表
E(Y|X=Xi) 该例中:E(Y | X=800)=605
3500
每 月 消 费 支 出
Y (元)
3000 2500 2000 1500 1000
500 0
500
1000
1500 2000 2500 3000
3500 4000
每月可支配收入X(元)
描出散点图发现:随着收入的增加,消费
“平均地说”也在增加,且Y的条件均值均落 在一根正斜率的直线上。这条直线称为总体 回归线。
E(i)=0
i=1,2, …,n
Var (i)=2 i=1,2, …,n
Cov(i, j)=E(i j)=0 i≠j i,j= 1,2, …,n
假设3、随机误差项与解释变量X之间不相关:
coi, vX (i)E [iE (i)]X i[E (X i)] E (iX i)0
i1 ,2, ,n
假设4、服从零均值、同方差、零协方差的正 态分布。
PRF,实际上,主要是估计参数( ˆi )。
估计方法有多种,其中最广泛使用的是普通 最小二乘法(ordinary least squares, OLS)。
为保证参数估计量具有良好的性质,通常对 模型提出若干基本假设。
计量经济学第二章
Chapter 2: The Simple Linear Regression Model
Page 10
2.1 经济模型
Principles of Econometrics, 4th Edition
Chapter 2: The Simple Linear Regression Model
Page 11
Chapter 2: The Simple Linear Regression Model
Page 19
2.1 An Economic
Model
简单(总体)回归函数可以写作:
Eq. 2.1
E(y|x)μyβ2β2x
知但固其定中的,E 参β(1y 数是|。x截)距,yβ21是斜2 率x。它们都E是q. 2未.1
Page 14
2.1 An Economic
Model
Figure 2.1a 给定收入x=1000美元,食品支出y的概率分布
Principles of Econometrics, 4th Edition
Chapter 2: The Simple Linear Regression Model
Page 15
这一模型被称之为简单回归,不是因为它简单, 仅仅是因为它的右边只包括一个解释变量。
从几何意义上看,总体回归线就是当解释变量取 给定值时被解释变量的条件期望值的轨迹。
更简单地说,对应于解释变量X的每个给定值都有 Y的一个子总体,连接这些子总体的均值就得到总体回 归线。
Principles of Econometrics, 4th Edition
Chapter 2: The Simple Linear Regression Model
计量经济学第二章
y ˆ0 ˆ1x
ˆ0 y ˆ1x
由cov(x,u)=E(xu)=0 得E[x(y – 0 – 1x)] = 0
对于给定的数据样本,有
n
n1 xi yi ˆ0ˆ1xi 0
i1
n
xi yi y ˆ1x ˆ1xi 0
i 1
n
n
xi yi y ˆ1 xi xi x
OLS的无偏性 OLS估计量的方差
计量
38
OLS的无偏性
我们首先在一组简单假定的基础上构建 OLS的无偏性。
假定SLR.1 线性于参数 在总体模型中,因变量y与自变量x的误差项u的
关系如下: y 0 1x u
其中, 0 和 1 分别表示总体的截距和斜率参数。
计量
39
OLS的无偏性
假定SLR.2 随机抽样 我们具有一个服从从整体模型方程
E(yxi)01xi
yi 01xi ui
yˆi ˆ 0 ˆ1 xi
yi ˆ0 ˆ1 xi ei
如果能够通过某种方式获得
ˆ
1 和ˆ
的数值,显然:
0
● ˆ 1 和 ˆ 0是对总体回归函数参数 1 和 0 的估计
●
yˆ
是对总体条件期望
i
E ( y x i ) 的估计
● e i 在概念上类似总体回归模型中的u i ,可视
yi y 2 yi yˆi yˆi y 2 uˆi yˆi y 2
uˆi2 2uˆi yˆi y yˆi y 2 SSR 2uˆi yˆi y SSE 又因为uˆi yˆi y 0,所以得证
计量
31
拟合优度
拟合优度(又称判定系数)
我们定义R2 = SSE/SST = 1 – SSR/SST为拟合 优度,又称判定系数,总是介于0到1之间
《计量经济学》第二章知识
第二章 数学基础 (Mathematics)第一节 矩阵(Matrix)及其二次型(Quadratic Forms)第二节 分布函数(Distribution Function),数学期望(Expectation)及方差(Variance) 第三节 数理统计(Mathematical Statistics ) 第一节 矩阵及其二次型(Matrix and its Quadratic Forms)2.1 矩阵的基本概念与运算 一个m ×n 矩阵可表示为:v a a a a a aa a a a A mn m m n n ij ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡== 212222111211][矩阵的加法较为简单,若C=A +B ,c ij =a ij +b ij但矩阵的乘法的定义比较特殊,若A 是一个m ×n 1的矩阵,B 是一个n 1×n 的矩阵,则C =AB 是一个m ×n 的矩阵,而且∑==nk kj ikij b ac 1,一般来讲,AB ≠BA ,但如下运算是成立的:● 结合律(Associative Law ) (AB )C =A (BC ) ● 分配律(Distributive Law ) A (B +C )=AB +AC 问题:(A+B)2=A 2+2AB+B 2是否成立?向量(Vector )是一个有序的数组,既可以按行,也可以按列排列。
行向量(row ve ctor)是只有一行的向量,列向量(column vector)只有一列的向量。
如果α是一个标量,则αA =[αa ij ]。
矩阵A 的转置矩阵(transpose matrix)记为A ',是通过把A 的行向量变成相应的列向量而得到。
显然(A ')′=A ,而且(A +B )′=A '+B ',● 乘积的转置(Transpose of a production ) A B AB ''=')(,A B C ABC '''=')(。
计量经济学 第二章 经典单方程计量模型简化内容
• 3.拟合优度(拟合度) • ①R2指标是判断回归模型优劣的一个最基 本的指标,但比较笼统,不精细。 • ②在Eviews中就是回归结果中的第一个R2, 判断时要注意,其越接近1,说明模型总体 拟合效果越好。 • ③R2的正式名称是“决定系数”,但通常 称其为拟合度。
• 具体的,拟合优度的计算公式如下:
• 3.计量模型的设定 • (1)基本形式: • y x (2.3) • 这里是一个随机变量,称作随机扰动项, 它的数学期望为0,即 注意:上式中条件数学期望的含义是,在给 定x时,ε的平均值为0。试举现实中的例子 予以说明。 回归直线、回归模型概念说明
• 二.一个完美计量经济模型的假设 • 1.对模型提出一些假设(限制)的原因 • 保证模型设定具有较高的合理性,从而可用其进 行经济分析并有利于统计分析的进行。 • 2.基本假定 • (1)在x给定的条件下,ε的数学期望为0 • (2)在x给定的条件下, x与ε不相关 • (3)在x给定的条件下, ε的方差是一个常数 • (4)在x给定的条件下, ε的样本之间不存在序 列相关 • (5) N (0, 2 )
R
2
2 (Yi Y )
n
(Y Y )
i 1 i
i 1 n
1.它的直观的含义是:估计 出来的被解释变量的每个 值跟平均值的偏差之和与 真实的被解释变量样本值 跟平均值的偏差之和的比 例。 2.现实当中的理解:如果我们在做模型时 希望最有效的解释被解释变量的波动,那 么比较好的一个指标就是让R2最大。 但一定要注意,在实际应用当中,大部分 情况下,我们并不是关注整个模型,而只 是关注一个解释变量对被解释变量的影响。
12 1 L , , exp 2 2 2 2 2 2
计量经济学第二章
第一节 两变量线性回归模型
一、模型的建立 二、模型的假设
3
一、模型的建立
变量和函数式 变量关系的随机性
4
变量和函数式
两变量线性因果关系:Y = + X Y——被解释变量 X——解释变量 、——待定参数
5
1、模型根据:
(1)研究问题的需要; (2)经济理论和观点; (3)利用经验和数据分布情况; (4)非线性函数和线性变换。
X
i
i
20
二、消费函数参数估计
以例3-1建立的消费函数模型为例,具 体说明如何用最小二乘法估计模型中的 参数。
21
例3-3上海经济的消费规律研究
年份
1981 1982 1983 1984 1985 1986
可支配收入 Y
637 659 686 834 1075 1293
消费性支出 CC
585 576 615 726 992 1170
本章主要内容
第一节 第二节 第三节 第四节 第五节 第六节
两变量线性回归模型 参数估计 最小二乘估计量的性质 回归拟合度评价和决定系数 统计推断 预测
1
引言
本章介绍两变量线性回归分析。两变量 线性回归分析的对象是两变量单向因果 关系,模型的核心是两变量线性函数, 分析方法是回归分析。两变量线性回归 分析是经典计量经济分析的基础,掌握 两变量线性回归分析的原理和技术,对 进一步学习多元回归和其他计量经济分 析方法都有帮助。
17
核心:残差平方和
2
2 e i 最小。 i
V ei Yi (a bX i )
i i
2பைடு நூலகம்
V 0 a V 0 b
计量经济学第二章:单方程多元线性计量经济模型
由 cu i , o u j 于 ) E v { u i E ( [ ( u i ) u j ] E ( u [ j ) ] E [ u i u } j ]
E(11) Co(U v)E( 21)
E(12) E(22)
E(1n) E(2n)
E(n1) E(n2) E(nn)
11 Co(U v)E 21
nk8
一般认为30个以上样本能够满足要求。
◆估计值的性质包括如下几方面:线性性、无偏性、 最小方差性。
线性性:估计值与被解释变量呈现线性关系 B ˆ(XX)1XYAY
无偏性:估计值的期望等于待估参数
E(Bˆ) B 最小方差性:各种估计方法中方差最小
Co (B ˆ)v 2(XX)1
第四节 统计检验与置信区间
一、拟合优度检验
模型是否能比较好地解释因果关系
总离差平方和: TSS (yiy)2 回归平方和: ESS (yˆiy)2 残差平方和: RSS(yiyˆi)2
◆ TSS RSE S SS
TSS = RSS + ESS ?
TSS(yiy)2 [y (iy ˆi)(y ˆiy)2] TSR SS E SS 2S(yiy ˆi)y ˆ(iy)
若使Q达到最小,分别对参数求偏导数,即:
Q
ˆ0
0;
n
得: 2 (yi (ˆ0 ˆ1xi )) 0 i1
n
2 xi (yi (ˆ0 ˆ1xi )) 0 i1
Q
ˆ 1
0
解得一元线性模型参数估计式为:
ˆ0
xi2 n
yi xi2 (
xi xiyi xi)2
yˆ1x
ˆ1
Bˆ(X'X)1X'Y
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量
13
总体回归线和总体回归函数
E(y|x) = 0 + 1x
y
x
对于实际的经济问题,通常无法掌握所有总体单位的数值, 总体回归函数实际上是理论上存在,又称理论回归方程
计量
14
样本回归方程
• 通过对样本观测获得的信息去估计总体回归函数
• 如果变量x和y之间存在线性相关关系,对于任意
抽取的若干个观测(样本)点(
i 1
n
xi yi y ˆ1x ˆ1xi 0
i 1
n
n
xi yi y ˆ1 xi xi x
i 1
i 1
n
n
xi x yi y ˆ1 xi x 2
i 1
i 1
计量
23
易得:
n
xi x yi y ˆ1 i 1 n xi x 2
• 拟合值的样本均值与 yi 的均值相等
yˆi yi
• 拟合值与残差之间的样本协方差为0
cov(yˆi , uˆi ) 0
计量
29
拟合优度
• 定义
– 总平方和SST
•
yi y 2
– 解释平方和SSE
• yˆi y 2
– 残差平方和SSR
•
uˆi2
计量
30
拟合优度
yi ˆ0 ˆ1xi ei
xi, yi ), 有
称为样本回归模型
• 由两部分组成 :系统分量和随机分量
系统分量 yˆi ˆ0 ˆ1 xi
样本回归函数与总体回归函数的区别
• 总体回归函数虽然未知,但它是确定的 (PRF唯一) ;
• 样本回归线随抽样波动而变化,每次抽样都 能获得一个样本,就可以拟合一条样本回归 线,(SRF不唯一);
•x能否来解释y的变化?x和y存在着怎样的 相关关系 ? •既然两个变量间没有一个确切的依存关 系,应该如何考虑x以外的其他因素对y的 影响? •如何确定是在其他条件不变的情况下描 述x和y的关系形式?
计量
5
简单回归模型的定义——该公 式的不足
计量
6
简单回归模型的定义——该公式 的假设
要使得 1 固定,需要施加一个约束:
2000 1312 1340 1400
每 1548 月 1688 家 1738 庭 1800 消 1902 费 支 出 Y
1591 E(Y Xi )
每月家庭可支配收入X
2500 1530 1619 1713 1750 1814 1985 2041 2186 2200 2312
1915
3000
1631 1726 1786 1835 1885 1943 2037 2078 2179 2298 2316 2387 2498 2689 2092
E( y xi ) 0 1xi
yi 0 1xi ui
样本回归函数 yˆi ˆ 0 ˆ1 xi yi ˆ 0 ˆ1 xi ei
如果能够通过某种方式获得
ˆ
和
1
ˆ
0的数值,显然:
●ˆ1 和 ˆ 0是对总体回归函数参数 1和 0 的估计
● yˆ i 是对总体条件期望 E(y xi ) 的估计
• SST=SSE+SSR的证明
yi y 2 yi yˆi yˆi y 2 uˆi yˆi y 2
uˆi2 2 uˆi yˆi y yˆi y 2 SSR 2 uˆi yˆi y SSE 又因为 uˆi yˆi y 0,所以得证
E(u | xi ) E(u) 0
表明: •u中不包含系统性的影响因素,既没有变 量遗漏问题,解释变量也不存在系统的测 量误差,模型函数形式设定正确。 •u均值独立于解释变量
spring 2012
计量
7
随机变量x和u不相关的三个层次:
• “独立”:意味着对于x 、y和的任意可测函
f (x)数 g(u)和
ˆ0 y ˆ1x
•由此估计出的 (OLSE)
ˆ0
和
ˆ1
称为参数的最小二乘估计量
•除了OLS以外,参数估计的方法还有最大似然估计
(ML)方法、矩估计方法(MM)等
基于条件期望为0的普通最小二乘法的推导
• 由E(u)=0 得E(y – 0 – 1x) = 0
对于给定的数据样本,有
计量
34
在简单回归中加入非线性因素
• 非线性因素的必要性:线性关系并不适合 所有的经济学运用
• 通过对因变量和自变量进行恰当的定义, 我们可以在简单回归分析中非常容易地处 理许多y和x之间的非线性关系
– 例子:工资—教育模型,
计量
35
自然对数形式
计量
36
•变量非线性模型中的斜率:
线性模型
边际贡献
线性---对数模型
半弹性
对数---线性模型
半弹性
• 为正,则回归线低估了 yi ;为负则回归线高 估了 yi ;无数据点是必须在回归线上。
OLS统计量的代数性质
• OLS残差和及其样本均值均为零
n
– 代数表示
uˆi 0
i 1
– 由OLS的一阶条件得出
n
n1 yi ˆ0 ˆ1xi 0
i 1
计量
27
OLSE的代数性质
• 回归元和OLS残差的样本协方差为零– 代数表示 – 由OFra bibliotekS的一阶条件得出
n
xiuˆi 0
i 1
n
n 1 xi y i ˆ0 ˆ1xi 0
i 1
计量
28
OLSE的代数性质
• OLS回归线过样本几何中心 (x ,y )
– 代数表示 y ˆ0 ˆ1x
4500
2277 2388 2526 2681 2887 3050 3189 3353 3534 3710 3834
5000
2469 2889 3090 3156 3300 3321 3654 3842 4074 4165
3039 3396
5500
2924 3338 3650 3802 4087 4298 4312 4413
,c有ov[g(u), f (x)] = 0
• “均值独立”:意味着cov[u, f (x)] = 0
• “线性无关”:意味着cov(u, x) = 0
spring 2012
计量
9
简单回归模型的定义——该公式 的假设
y
f(y)
.
.
E(y|x) = 0 + 1x
x1
x2
计量
10
假如已知由100个家庭构成的总体的数据 (单位:元)
i 1
n
在假设前提 xi
x 2
0下
i 1
ˆ0 y ˆ1x
计量
24
2.3 OLS的操作技巧
•拟合值与残差 •OLSE的代数性质 •拟合优度
计量
25
拟合值和残差
• 拟合值:定义y在x= xi 的拟合值为
yˆi ˆ0 ˆ1xi
• 残差:观察值 yi 与其拟合值的差。 uˆi yi ˆ0 ˆ1xi
3500
1843 1974 2006 2265 2367 2485 2515 2689 2713 2898 2923 3053 3187 3286 2586
4000 2037 2210 2325 2419 2522 2665 2799 2887 2913 3038 3167 3310 3510
2754
• 改变度量单位对OLS统计量的影响 • 在简单回归中加入非线性因素 • “线性”回归的含义
计量
33
改变度量单位对OLS统计量的影响
• 0 、1 的计量单位 0 、 1 的经济含义是什么?
• X单位改变,y不变,影响 1 ,不影响 0 y单位改变,不管X是否变化,影响 0 、 1
• 如果定义roedec = roe/100,那么样本回归线将会从 (estimated salary)=963.191 + 18.501roe改变到 (estimated salary)=963.191 + 1850.1roedec
第二章 简单回归模型
• 简单回归模型的定义 • 普通最小二乘法的推导 • OLS的操作技巧 • 度量单位的函数形式 • OLS估计量的期望值和方差 • 过原点回归
计量
1
2.1 简单回归模型的定义
• 回归模型的基本形式:
y f (x) u
• 简单回归模型的基本形式:
y 0 1x u
可得
n
n1 yi ˆ0 ˆ1xi 0
i 1
y ˆ0 ˆ1x
ˆ0 y ˆ1x
• 由cov(x,u)=E(xu)=0 得E[x(y – 0 – 1x)] = 0
对于给定的数据样本,有
n
n1 xi yi ˆ0 ˆ1xi 0
称为一元线性总体回归模型。
简单回归模型的定义
• 简单回归模型定义的几个讨论
– 公式变量与参数的解释 – 用x解释y时面临的三个问题 – 该公式的不足 – 该公式的假设
计量
3
简单回归模型的定义——公式变 量与参数的解释
• Y:被称为因变量(dependent variable)、被解 释变量、被预测变量、回归子
( yi ˆ0 ˆ1xi ) 0 ( yi ˆ0 ˆ1xi )xi 0
即 ˆ0、 ˆ1应满足下列方程组:
( yi ˆ0 ˆ1xi ) 0