第3章 多元回归分析:估计
introductory econometrics中文版目录

第1篇横截面数据的回归分析
第1章计量经济学的性质与经济数据
1.1 什么是计量经济学?
1.2 经验经济分析的步骤
1.3 经济数据的结构
1.4 计量经济分析中的因果关系和其他条件不变的概念
小结
关键术语
习题
计算机习题
第2章简单回归模型
第3章多元回归分析:估计
第4章多元回归分析:推断
第5章多元回归分析:OLS的渐近性
第6章多元回归分析:深入专题
第7章含有定性信息的多元回归分析:二值(或虚拟)变量第8章异方差性
第9章模型设定和数据问题的深入探讨
第2篇时间序列数据的回归分析
第10章时间序列数据的基本回归分析
第11章OLS用于时间序列数据的其他问题
第12章时间序列回归中的序列相关和异方差
第3篇高深专题讨论
第13章跨时横截面的混合:简单面板数据方法
第14章高深的面板数据方法
第15章工具变量估计与两阶段最小二乘法
第16章联立方程模型
第17章限值因变量模型和样本选择纠正
第18章时间序列高深专题
第19章一个经验项目的实施
附录A 基本数学工具
附录B 概率论基础
附录C 数理统计基础
附录D 矩阵代数概述
附录E 矩阵形式的线性回归模型附录F 各章问题解答
附录G 统计用表。
第三章多元回归分析:估计

ˆ x ˆ y 1 1
ˆ 为其他因素不变情况下, x1对y的边际影响。 1
多元回归中“保持其他因素不变”的含义
尽管不能在其他条件不变的情况下收集数据,但其提 供的系数可以做其他条件不变的解释。 多元回归分析是我们能在非实验环境中进行自然科学 家在受控实验中所能做的事情:保持其他因素不变。
x1k x2 k xnk n( k 1)
u1 u u 2 u n ( n1 )
ˆ1 u ˆ u2 u ˆn ( n1) u
样本回归模型
ˆ y Xβ u
k+1个方程,求解k+1个未知数? 存在唯一解的条件是什么?
对OLS回归方程的解释
ˆ ˆ x ˆ x ˆx ˆ y 0 1 1 2 2 k k ˆ x ˆ x ˆ x ˆ y 1 1 2 2 k k
ˆ 、 ˆ、 ˆ 估计值 1 2 、k 具有偏效应或其他情况不变的解释: 例如,保持x2、x3、…、xk 不变的情况下
1
x21 x22 x2 k
1 y1 xn1 y2 xn 2 X' y yn xnk
ˆ X'y X'Xβ
β的最小二乘(OLS)估计量为:
ˆ (X'X)1 X'y β
对于一元回归模型:
y1 y2 y yn ( n1)
第三章 多元回归分析:估计
多元回归分析可以:
更适合于“其他因素不变情况下”的分析 可用于建立更好的因变量预测模型 可用以引入相当一般化的函数关系
多元回归分析——估计

使用多元回归的动因
先用两个例子来说明,如何用多元回归分析来 解决简单回归所不能解决的问题。 wage =β 0+β 1educ+β 2exper+u ……(3.1) 其中exper是在劳动市场上以年计的工作经 历。 则工资wage由受教育水平和工作经历这两个解 释变量或自变量及那些观测不到的其他因素来 决定。我们首要感兴趣的,是在保持所有其他 影响工资的因素不变情况下,educ对wage的影 响;即我们只对参数β 1感兴趣。
ˆ ˆ x ˆ x )0 ( y i 0 1 i1 k ik
i 1 n
n
ˆ ˆ x ˆ x )0 x ( y i1 i 0 1 i1 k ik
i 1 n
ˆ ˆ x ˆ x )0 x ( y i 2 i 0 1 i1 k ik
第二个例子
问题:解释在高中阶段对每个学生的平均开支 (expend)对平均标准化考试成绩(avgscore)的影响。 假设平均考试成绩取决于学校基金、平均家庭 收入(avginc)及其他不可观测因素:
avgscore=β 0+β 1expend+β 2avginc+u ………… (3.2) 出于政策目的,所关心的系数是expend在其他条件 不变情况下对avgscore的影响β 1。通过在模型中明 确包括avginc,我们就能控制其对avgscore的影响。 由于平均家庭收入与每个学生的开支趋于相关,所 以加入这个变量可能很重要。简单回归中,avginc 被包括在误差项中,而avginc与expend可能相关,从 而导致在两变量模型中对β1的OLS估计有偏误。
机械地看,用普通最小二乘法去估计方 程(3.1)和(3.4) ,应该没有什么差别。每个 方程都可以写成像(3.3)那样的方程。但重 要的差别在于,人们对参数的解释。
应用回归分析,第3章课后习题参考答案

第3章 多元线性回归思考与练习参考答案3.2 讨论样本容量n 与自变量个数p 的关系,它们对模型的参数估计有何影响?答:在多元线性回归模型中,样本容量n 与自变量个数p 的关系是:n>>p 。
如果n<=p 对模型的参数估计会带来很严重的影响。
因为: 1. 在多元线性回归模型中,有p+1个待估参数β,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。
2. 解释变量X 是确定性变量,要求()1rank p n =+<X ,表明设计矩阵X 中的自变量列之间不相关,即矩阵X 是一个满秩矩阵。
若()1rank p <+X ,则解释变量之间线性相关,1()X X -'是奇异阵,则β的估计不稳定。
3.3证明随机误差项ε的方差σ2的无偏估计。
证明:22122222111112221111ˆ(),111()()(1)(1)()(1)1ˆ()()1n i i n n nnnii ii iiii i i i i i ni i SSE e e e n p n p n p E e D e h h n h n p E E e n p σσσσσσσ======='===------∴==-=-=-=--∴==--∑∑∑∑∑∑∑3.4 一个回归方程的复相关系数R=0.99,样本决定系数R 2=0.9801,我们能判断这个回归方程就很理想吗? 答:不能断定这个回归方程理想。
因为:1. 在样本容量较少,变量个数较大时,决定系数的值容易接近1,而此时可能F 检验或者关于回归系数的t 检验,所建立的回归方()1ˆ2--=p n SSE σ程都没能通过。
2. 样本决定系数和复相关系数接近于1只能说明Y 与自变量X1,X2,…,Xp 整体上的线性关系成立,而不能判断回归方程和每个自变量是显著的,还需进行F 检验和t 检验。
3. 在应用过程中发现,在样本容量一定的情况下,如果在模型中增加解释变量必定使得自由度减少,使得 R 2往往增大,因此增加解释变量(尤其是不显著的解释变量)个数引起的R 2的增大与拟合好坏无关。
多元回归分析讲解和分析预测法

2021/3/10
34
消除多重共线性的常用方法:
(一)删除不重要的自变量 自变量之间存在共线性,说明自变量所提供的信息是重叠的,可以 删除不重要的自变量减少重复信息。 (二)追加样本信息 由于资料收集及调查的困难,追加样本信息在实践中并不容易。 (三)利用非样本先验信息 非样本先验信息主要来自经济理论分析和经验认识。 (四)改变解释变量的形式 改变解释变量的形式是解决多重共线性的一种简易方法,例如对于 横截面数据采用相对数变量,对于时间序列数据采用增量型变量。 (五)逐步回归法
2021/3/10
51
参考流程图
Hale Waihona Puke 2021/3/1052
2021/3/10
53
传统机械按键结构层图:
按
PCBA
键
开关 键
传统机械按键设计要点: 1.合理的选择按键的类型, 尽量选择平头类的按键,以 防按键下陷。 2.开关按键和塑胶按键设计 间隙建议留0.05~0.1mm,以 防按键死键。 3.要考虑成型工艺,合理计 算累积公差,以防按键手感 不良。
2021/3/10
28
3.模型检验
2021/3/10
31
2021/3/10
32
t检验的基本步骤: 首先,通过公式计算t统计量
最后,进行判断
2021/3/10
33
4.多重共性分析
在预测分析中,若两个解释变量之间存在者较强的相关,则 认为回归分析中存在多重共线性。
多重共线性可能引起以下后果: (1)参数估计的精度较低; (2)回归参数的估计值对样本容量非常敏感,不稳定; (3)不能正确判断各解释变量对y的影响是否显著。 通过计算自变量之间的相关系数矩阵和经验直觉,来判断分 析自变量之间是否存在多重共线性。
第3章多元回归分析:估计

ˆ ˆ x ˆ x ... ˆ x )2 0 min xi1 ( yi 0 1 i1 2 i2 k ik
i 1
...... ˆ ˆ x ˆ x ... ˆ x )2 0 min xik ( yi 0 1 i1 2 i2 k ik
例3.2:小时工资方程
• 我们在log(wage)的方程中包括educ(教育 水平),exper(工作经历), 和tenure(任现职的任期),估计的方程:
log (wage) 0.284 0.092educ 0.0041exp er 0.022tenure
系数0.092意味着,在保持tenure和exper不 变的情况下,多受一年教育者的log(wage) 提高0.092即9.2%。
ˆ 1 可以表示为:
n n ˆ ˆi1 yi ) / i 1 r ˆi12 1 ( i 1 r
ˆi1 ? • r
对多元回归“排除其他变量 影响”的解释
• 首先, 将第一个自变量x1对第二个自变量x2 ˆ0 ˆ1x ˆ1 ˆ 进行回归,得到样本回归函数 x , 2 ˆi1 xi1 x ˆi1 。 ˆi1 ,得到残差 r • 根据xi和拟合值 x 残差表示剔除了x2的影响之后,x1的其他部 分。它与x2不相关,样本均值为0。
OLS的拟合值和残差
• 直接从单变量模型推广,可得OLS拟合值 和残差的某些重要性质。 1. 残差的样本平均值为零 2. 每个自变量和OLS残差之间的样本协方 差为零,于是OLS拟合值和OLS残差之间 的样本协方差也为零 3. 点 ( x1 , x2 ..., xk , y ) 总位于样本OLS 回归线上。
ˆ 1 。 • 然后,将y对 r1 进行简单回归得到 ˆ • 1 衡量的是,剔除了其他自变量的影响之 后,x1对于y的净影响。
第三章 多元回归分析:估计1

ˆ ˆ ˆ ˆ yi = β 0 + β1 xi1 + ... + β k xik
18 September 2011
13
Interpreting Multiple Regression 对多元回归的解释
ˆ ˆ ˆ ˆ ˆ y = β 0 + β1 x1 + β 2 x2 + ... + β k xk , so ˆ ˆ ˆ ˆ ∆y = β ∆x + β ∆x + ... + β ∆x ,
18 September 2011
3
Motivation: Advantage 动因:优点
The primary drawback of the simple regression analysis for empirical work is that it is very difficult to draw ceteris paribus conclusions about how x affects y.
...
ˆ ˆ ˆ ( y i − β 0 − β 1 x i 1 − β k x ik ) i =1
n n n
=0
ˆ ˆ ˆ x i 1 ( y i − β 0 − β 1 x i 1 − β k x ik ) = 0 i =1 ˆ ˆ ˆ x i 2 ( y i − β 0 − β 1 x i 1 − β k x ik ) = 0 i =1 ˆ ˆ ˆ x ik ( y i − β 0 − β 1 x i 1 − β k x ik ) = 0 i =1
18 SeptemberБайду номын сангаас2011
14
Example: Determinants of College GPA 例子:大学GPA的决定因素
第三讲 多元回归分析:估计

27
例子3.1:大学生GPA的决定因素
计量经济学导论
28
例子3.2:小时工资方程
计量经济学导论
29
在多元回归中保持其他因素不变的含义
多元回归分析的作用是,提供了一个“在其他 因素保持不变”下的解释,尽管我们的数据并 非以这种方式搜集。
计量经济学导论
30
同时改变两种以上因素时参数的含义
计量经济学导论
t 2 (n k ) 2.056, 这说明在显著性水平
0.05下,分
别都应当拒绝 H0 : b j 0 ( j 1, 2,3, 4)
说明当在其它解释变量不变的情况下,解释变量“国内生
产总值” 、“财政支出” 、“商品零售价格指数” 分
别对被解释变量“税收收入”Y都有显著的影响。
3.1多重共线性的检验
● 简单相关系数检验法 ● 方差扩大(膨胀)因子法 ● 直观判断法 ● 逐步回归法
10
简单相关系数检验法
含义:简单相关系数检验法是利用解释变量之间的线 性相关程度去判断是否存在严重多重共线性的一种 简便方法。 判断规则:一般而言,如果每两个解释变量的简单相
关系数(零阶相关系数)比较高,例如大于0.8,则可
249529.9
40422.73
49781.35
101
103.8
序列Y、X2、X3、X4的线性图
可以看出Y、X2、X3都是逐年增
长的,但增长速率有所变动,而
且X4在多数年份呈现出水平波动。 说明变量间不一定是线性关系, 可探索将模型设定为以下对数模 型:
ln Yt b1 b2 ln X 2t b2 ln X 3t b3 X 4t ut
第三章多元线性回归模型

( y x )( x ) ( y x )( x x ) i 2 i 1 i i 1 i 2 i 1 i ˆ 2 2 2 2 ( x x ( x 1 i)( 2 i) 1 ix 2 i) ˆx ˆx ˆ y β β 0 11 2 2
解此联立方程既可求得参数估计值
1
e i2
ˆ 2
0
正规方程
求解正规方程组可得:
( y x )( x ) ( y x )( x x ) i 1 i 2 i i 2 i 1 i 2 i ˆ 1 2 2 2 ( x )( x ) ( x x ) 1 i 2 i 1 i 2 i
OLS估计量的方差和标准误
Var ( ˆ 1 ) Var ( ˆ 2 )
2 12i (1 r1 22 ) x 2 22 i (1 r1 22 ) x
r1 2 (1 r1 2 )
2
Se ( ˆ 1 ) Var ( ˆ 1 ) Se ( ˆ 2 ) Var ( ˆ 2 )
ˆ) ˆ) ( Y X β ( Y X β 0 ˆ β
ˆ X Y X X β 0
得到: 于是最小二乘估计量为:
最小二乘估计量的 方差-协方差阵为:
ˆ ——正规方程 X Y X X β
1 ˆ β ( X X )X Y
⃟随机误差项的方差的无偏估计
自变量相关程度越高, 参数估计量的方差越大。 当x2和x3完全共线时,方 差趋于无穷。
Cov ( ˆ 1 i , ˆ 2 i )
12i x
1i 2i
22 i x
多元回归分析:估计问题

画出散点图:
440 400 360 320 Y 280 240 200 160 0 2 4 6 X 8 10 12
Dependent Variable: Y Method: Least Squares Date: 09/28/10 Time: 07:54 Sample: 1 10 Included observations: 10
第六讲: 多元回归分析:估计问题
主要内容:
使用多元回归的动因 多元回归的参数估计 模型假定的再思考 多元回归的拟合优度 应用:多项式回归模型
6.1 使用多元回归的动因
双变量回归分析的主要缺陷: 它很难得到 X 在其他条件不变情况下对 Y 的影响
假定7: cov ( u i , X i ) = 0 通常不现实
6.5 应用:多项式回归模型
多项式回归模型: 在有关成本和生产函数的计量经济研究 中有广泛的用途。 形如
Yi = β 0 + β1 X + β 2 X 2 + ... + β k X k + ui(6-10)
的模型称为关于 X 的多项式回归模型
例:估计总成本函数 下表给出了在短期内某商品的产出与生产总成本数据
当我们将解释变量的个数增加后,就可以得 到一般的多元回归模型形式(PRF)
Yi = β 0 + β1 X 1i + β 2 X 2i + ... + β k X ki + ui (6-1)
E (Y X 1i , X 2i ,..., X ki ) = β 0 + β1 X 1i + β 2 X 2i + ... + β k X ki
多元回归分析

多元回归分析引言多元回归分析是一种统计方法,用于探究自变量对因变量的影响程度。
它通过建立一个数学模型,分析多个自变量与一个因变量之间的关系,以预测因变量的变化。
本文将介绍多元回归分析的基本原理、应用场景和步骤。
基本原理多元回归分析建立了一个包含多个自变量的线性回归方程,如下所示:Y = β0 + β1X1 + β2X2 + ... + βnXn + ε其中,Y为因变量,X1、X2、…、Xn为自变量,β0、β1、β2、…、βn为回归系数,ε为误差项。
回归系数表示自变量对因变量的影响程度。
多元回归分析可以通过最小二乘法估计回归系数,即找到使误差项平方和最小的系数值。
在得到回归系数后,可以通过对自变量的设定值,预测因变量的值。
应用场景多元回归分析广泛应用于各个领域,例如经济学、社会科学和工程学等。
以下是一些常见的应用场景:1.经济学:多元回归分析可以用于预测经济指标,如国内生产总值(GDP)和通货膨胀率。
通过分析多个自变量,可以了解各个因素对经济发展的影响程度。
2.社会科学:多元回归分析可以用于研究社会现象,如教育水平和收入水平之间的关系。
通过分析多个自变量,可以找出对收入水平影响最大的因素。
3.工程学:多元回归分析可以用于预测产品质量,如汽车的油耗和引擎功率之间的关系。
通过分析多个自变量,可以找到影响产品质量的关键因素。
分析步骤进行多元回归分析时,以下是一般的步骤:1.收集数据:收集自变量和因变量的数据,并确保数据的可靠性和有效性。
2.数据预处理:对数据进行清洗和转换,以消除异常值和缺失值的影响。
3.变量选择:根据实际问题和领域知识,选择合适的自变量。
可以使用相关性分析、变量逐步回归等方法来确定自变量。
4.拟合模型:使用最小二乘法估计回归系数,建立多元回归模型。
5.模型评估:通过检验残差分布、解释变量的显著性和模型的拟合程度等指标,评估多元回归模型的质量。
6.预测分析:使用已建立的多元回归模型,对新的自变量进行预测,得到因变量的预测值。
第3章 多元回归分析:假设检验

7
The t Test (cont)
To perform our test we first need to form " the" t statistic for β : t ≡ β se β
j
βjBiblioteka j( )j
We will then use our t statistic along with a rejection rule to determine whether to accept the null hypothesis, H 0
fail to reject
(
( ) )
(
( ) )
reject
α/2 -c
(1 α)
0 c
reject α/2
15
Summary for H0: βj = 0
Unless otherwise stated, the alternative is assumed to be two-sided If we reject the null, we typically say “xj is statistically significant at the α % level” If we fail to reject the null, we typically say “xj is statistically insignificant at the α % level”
j j
) ( )
j
n k 1
Note this is a t distribution (vs normal) 2 because we have to estimate σ by σ
2
Note the degrees of freedom : n k 1 se β j =
多元线性回归分析(3)

如果样本函数的参数估计值已经得到,则有:
Y ˆ i ˆ 0 ˆ 1 X 1 i ˆ 2 X 2 i ˆ k X i Ki i=1,2…n
根据最小二乘原理,参数估计值应该是以下方程组的解
ˆ 0
Q
0
ˆ 1
Q
0
ˆ 2
Q
0
ˆ k
Q
0
n
n
其中 Q ei2 (Yi Yˆi)2
一般经验认为: 当n 30或者至少n 3<k+1>时,才能说满足模型估
计的基本要求.
模型的良好性质只有在大样本下才能得 到理论上的证明
六、多元线性回归模型的参数估计实例
例3.3,投资函数模型-多元线性模型.
解释变量:时间 x1 1-16 实际GNP x2
被解释变量y:实际投资
Eviews软件估计结果
Dependent Variable: Y
Method: Least Squares Date: 10/15/12 Time: 10:50 Sample: 1968 1983 Included observations: 16
Variable C X1 X2
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
§3.3 多元线性回归模型的统计检验
一、拟合优度检验 二、方程的显著性检验<F检验> 三、变量的显著性检验〔t检验〕 四、参数的置信区间
一、拟合优度检验
1、可决系数与调整的可决系数
总离差平方和的分解
则 TSS(Yi Y)2
第三讲 多元线性回归分析(整理)

或者表示为
(3.2.3)
它是介于0到1之间的一个数。 越大,模型对数据的拟合程度就越好,解释变量对被解释变量的解释能力越强。当 =1时,被解释变量的变化100%由回归直线解释,所有观测点都落在回归直线上。当 =0时,解释变量与被解释变量之间没有任何线性关系。
可以证明: ,因此有
= (3.2.3)*
借助于计量经济软件EViews对表3.1.1中的样本回归方程作F检验。
F统计量的值:F=146.2973,n=18,n-k-1=18-2-1=15,在5%的显著性水平下,查自由度为(2,15)的F分布表,得临界值 ,因为F=146.2973 ,故模型总体是显著的。即家庭收入与户主受教育年限对家庭书刊消费水平的共同影响是相当显著的。
在例3.1.1中,EViews软件的估计结果显示AIC与SC的值分别为11.20和11.35,分别大于只包含一个解释变量比如家庭收入时的相应值13.14和13.24,从这一点看,可以说户主受教育年数可以作为解释变量包括在模型中。
3.2.3 偏相关系数
3.2.4 回归模型的总体显著性检验:F检验
回归模型的总体显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。
9
611.1
1768.8
10
1222.1
1981.2
18
793.2
1998.6
14
660.8
2196.0
10
792.7
2105.4
12
580.8
2147.4
8
612.7
2154.0
10
890.8
2231.4
14
1121.0
2611.8
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 0 1 x1 可以证明: E 1 1 21 , x 遗漏变量偏误:方向见表3.2 向上偏误、向下偏误与向零偏误 在含有多个回归元的模型中,推导遗漏变量偏误是非常困 难的。
湖北大学商学院chen qianli 19
0
1
1
3.4 OLS估计量的方差
假定MLR.5(同方差性): var u x1 , x2 , xk
2
定理(OLS斜率估计量的方差)在假定MLR.1-MLR.5下,
var ˆ
j
SST j
2 2 j
1 R
, j 1, 2, , k
式中,SSTj为xj的总样本变差,R2j为xj对所有其余自变量进 行回归所得到的决定系数。 OLS方差的成分:多重共线性 OLS估计量的方差取决于三个因素: 误差项的方差:给定因变量y,增加更多解释变量可减少误 差项的方差,但同时可能引起多重共线性。 xj的总样本变差SSTj:扩大样本容量可增大此项。
x
i1
, xi 2 ,xik , yi : i 1, 2,, n
假定MLR.3(零条件均值):
E u x1 , x2 , xk 0
湖北大学商学院chen qianli 15
例:扰动项条件均值不为零
湖北大学商学院chen qianli
16
3.3 OLS估计量的期望
ˆ ˆ x ˆ x ˆi y 0 1 i1 k ik ˆi yi y ˆi u
湖北大学商学院chen qianli 7
例:收入与教育
湖北大学商学院chen qianli
8
例:收入与教育(续)
湖北大学商学院chen qianli
9
3.2 OLS的机理和解释
性质:
2
2 R 2 ry ˆ ,y
11
3.2 OLS的机理和解释
R2的一个重要性质是,在回归中多增加一个自变量, 其值不会减小,通常会增加。 使用R2作为决定在模型中增加一个或几个变量的手 段很不适当,决定一个解释变量是否应放入模型 取决于在总体中对y的偏效应是否为0。 过原点的回归: 对过原点回归,采用最小化残差平方和的OLS估计 值往往不具有以前推断的性质, 通常定义的R2可 能为负,尽管有人提出用实际值与拟合值的相关 系数的平方作为R2,但目前没有大家认可的指标。 实证一般尽量少用过原点回归。
sd ˆ
j
ˆ ˆ2
SST j 1 R 2 j
系数估计量的标准误为:
ˆ se j
SST j 1 R 2 j
ˆ
以上公式均是在同方差假设MLR.5下才成立。
湖北大学商学院chen qianli
湖北大学商学院chen qianli 10
3.2 OLS的机理和解释
简单回归பைடு நூலகம்多元回归估计的比较: 什么情况下以下两个回归的斜率估计值是相同的?
x,y ˆ ˆ x ˆx ˆ ˆ y 0 1 1 0 1 1 2 2
1.样本中x2对y的偏效应为0。 2.样本中x1与x2不相关。 拟合优度: SST=SSE+SSR
湖北大学商学院chen qianli 3
3.1 多元回归的动因
K个自变量的模型 多元回归分析允许影响Y的多个可观测的因素以自变量形式 进入模型,以对其进行控制。 y 0 1 x1 2 x2 k xk u 多元线性回归模型的术语:截距、斜率、扰动项 如何解释模型参数:弹性、百分数
当回归模型中包含无关变量时,不会影响OLS估计量的无偏 性,但对OLS估计量的方差具有不利的影响。
E u x1 , x2 , x3 E u x1 , x2 0 1 x1 2 x2
湖北大学商学院chen qianli
18
3.3 OLS估计量的期望
遗漏变量的偏误:第二问题是相关变量未包括或模型设 定不足,此问题一般会导致OLS估计量产生偏误。下面 以简单情形说明。 假定真实模型是: y 0 1 x1 2 x2 u 由于疏忽或数据不足,我们没有包括x2,只将y对x1进行简 单回归: y x
2
ˆ2 df
ˆ u
i 1
n
2 i
n k 1 n k 1
SSR n k 1
定理(扰动项方差的无偏估计):在假设MLR.1-MLR.5下,
ˆ2 E
2
湖北大学商学院chen qianli
23
3.4 OLS估计量的方差
回归的标准误(SER): 系数估计量的标准差为:
R2 SSE SSR 1 SST SST n ˆ yi y yi y i 1 n n 2 2 ˆ y y y y i i chen qianli 1 i 湖北大学商学院 i 1
3.1 多元回归的动因
两自变量的模型:以例子说明多元回归的优点 多元回归分析能更好刻画变量之间的因果关系 考虑以下两个模型的区别:
wage 0 1educ u
* * wage 0* 1 educ 2 exp er u *
多元回归模型可以将影响因变量的其他因素中的可观测部分 以自变量的形式包括在回归模型中,从而控制这些因素的 影响。
ˆ u
i 1 n i
ˆi xij 0( j 1, 2, k ) 0, u
i 1
n
ˆ ˆ x ˆ x y 0 1 1 k k
“排除(partialling out)”的解释:以k=2的多元回归模型为 例 ˆ ˆ x ˆ x ˆ y
第三章 多元回归分析:估计
简单回归分析缺陷:关键假设SLR.3通常不现实 多元回归分析的优点: 可以明确地控制其他影响因变量的因素,更适合 于其他条件不变情况下的分析。 可以用以添加相当一般化的函数关系。 多元回归模型是经济学和其他社会科学进行经 验分析时使用得最广泛的一个工具。
湖北大学商学院chen qianli 1
偏效应(partial effect)或其他情况不变效应的解释: ˆ 在控制了 x2 , xk的影响下,x1对y的影响为: 1 例3.1 3.2
湖北大学商学院chen qianli 6
3.2 OLS的机理和解释
多元回归中“保持其他因素不变”的含义: 多元回归分析的功能在于:尽管不能在其他条件不变的情况 下收集数据,但它提供的系数仍可作为其他条件不变的解 释,它使我们有效地模拟了在不限制自变量的取值下此种 情形。多元回归分析使我们能在非实验环境中去做自然科 学家在受控实验中所做的事情:保持其他因素不变。 OLS的拟合值和残差:
0 1 1 2 2
OLS的估计量可表示为:度量的是在排除了x2,…xk等变量影响 n 之后, x1对y的影响。 ˆ r i1 yi ˆ i 1 ˆ1简单回归后的系数估计 , 可看成y对r 1 n 2 ˆ r i1
i 1
ˆ1是x1 = 0 1 x2 r回归后的残差。 而r
湖北大学商学院chen qianli 20
3.4 OLS估计量的方差
ˆ when R j 1, var 自变量之间的线性关系R2j: j 两个或多个自变量之间高度相关(但不完全相关)被称为多 重共线性(multicollinearity)。 对于一个给定的数据集,可以试着从模型中去掉一些其他自 变量来消除多重共线性,但同时会出现遗漏变量偏误的问 题。需要在两方面进行权衡。 误设模型的方差:是否包括一个变量,可对偏误和方差进 行分析后进行权衡。 真实模型为 y 0 1 x1 2 x2 u ˆ ˆ x ˆ x 估计1: ˆ y 0 1 1 2 2 估计2: x ˆ y 0 1 1
log salary 0 1 log sales 2ceoten 3ceoten2 u
线性性含义:指模型是参数的线性函数(不是自变量) 关键假设: E u x1 , x2 , xk 0
湖北大学商学院chen qianli
4
例:双对数模型
湖北大学商学院chen qianli
湖北大学商学院chen qianli 17
3.3 OLS估计量的期望
定理(无偏性):在假定MLR.1-MLR.4下,总体参数的 OLS估计量是无偏估计。 无关变量的包括:讨论两种模型设定问题对无偏性的影 响。第一个问题是模型包含一个无关变量或过度设定模 型,下例说明。 y 0 1 x1 2 x2 3 x3 u 我们将模型设定为 假定真实情况是30,即一旦控制了x1,x2,x3对y没有影响。
2
湖北大学商学院chen qianli
21
3.4 OLS估计量的方差
比较两种估计的方差:
ˆ var 1
SST1 1 R
2
2 1
, var 1
2
SST1
如果20,两种估计均是无偏的。第一种估计方法下方差大, 说明无关变量的包括的代价是估计量的方差变大。 如果2不为0,传统上,计量经济学家曾建议,比较偏误和 方差来决定是否应该包括x2。 作者倾向于第一种估计,有两个原因,一是样本容量的上升 可降低方差,但对偏误无影响;一是第二种估计的方差公 式可能低估了实际方差(用2不正确)。
湖北大学商学院chen qianli
22
3.4 OLS估计量的方差
估计2:为了进行区间估计和假设检验,需要给出系数 估计量方差的估计,由此先要估计扰动项的方差
n 2 ˆ u i SSR i 1 E E n k 1 n k 1