[教育学]第三章 多元回归分析:估计
第三章多元回归分析:估计

ˆ x ˆ y 1 1
ˆ 为其他因素不变情况下, x1对y的边际影响。 1
多元回归中“保持其他因素不变”的含义
尽管不能在其他条件不变的情况下收集数据,但其提 供的系数可以做其他条件不变的解释。 多元回归分析是我们能在非实验环境中进行自然科学 家在受控实验中所能做的事情:保持其他因素不变。
x1k x2 k xnk n( k 1)
u1 u u 2 u n ( n1 )
ˆ1 u ˆ u2 u ˆn ( n1) u
样本回归模型
ˆ y Xβ u
k+1个方程,求解k+1个未知数? 存在唯一解的条件是什么?
对OLS回归方程的解释
ˆ ˆ x ˆ x ˆx ˆ y 0 1 1 2 2 k k ˆ x ˆ x ˆ x ˆ y 1 1 2 2 k k
ˆ 、 ˆ、 ˆ 估计值 1 2 、k 具有偏效应或其他情况不变的解释: 例如,保持x2、x3、…、xk 不变的情况下
1
x21 x22 x2 k
1 y1 xn1 y2 xn 2 X' y yn xnk
ˆ X'y X'Xβ
β的最小二乘(OLS)估计量为:
ˆ (X'X)1 X'y β
对于一元回归模型:
y1 y2 y yn ( n1)
第三章 多元回归分析:估计
多元回归分析可以:
更适合于“其他因素不变情况下”的分析 可用于建立更好的因变量预测模型 可用以引入相当一般化的函数关系
学习笔记:伍德里奇《计量经济学》第五版-第三章 多元回归分析:估计

y = b 0+ b 1x 1+ b 2x 2+ . . . b k x k + u一、多元线性回归模型1.我们可以研究控制一些变量不变的条件下,其他变量对y的影响,而不是假定他们不相关。
Cons = b 0+ b 1inc+b 2inc 2 +u2.我们还能推广变量之间的函数关系如:通过在模型中包含更多的变量,我们更好的达到了SLR.4所表达的目的E(u|x 1,x 2, …,x k ) = 0 (3.8)HYP.1一般多元回归模型的关键假定(u和所有x都不相关):( )仍然是最小化残差和:对(3.12)求k +1次偏导得一阶条件(交给计算机计算)(此时假定k +1个方程只能得到估计值得唯一解2.1 如何得到OLS 估计值例3.1分析两个系数时,可得出当我们把其中一个因素涵盖在模型中时,另外一个因素的预测就变得不有力了1.系数表示局部效应(控制其他变量不变时,对y的效应)多元回归分析给了我们在收集不到“其他条件不变”时的数据仍有同样效果的能力2.“控制其他变量不变”的含义3.同时改变不止一个自变量(只需要将效应加和)2.2 对OLS 回归方程的解释从单变量情形加以推广,得:1.残差的样本平均值为02.每个自变量和OLS 残差之间的样本协方差为0。
因此OLS 拟合值和OLS 残差之间的样本协方差也为03.点总位于OLS 回归线上(性质1. 2.由一阶条件得,性质3.由1.可得2.3 OLS 的拟合值和残差( )其中 是x1对其他变量回归后的残差(即排除其他变量对x1的影响,类似矢量正交)2.4 对“排除其他变量影响”的解释( )(是 对 简单回归的斜率1.样本中x2对y的偏效应为0,即2.x1和x 2不相关,即(1. 2.可解释、 的差异由(3.23)知,在两种情况下利用矢量正交的理解考虑简单回归和两个自变量的回归:2.5简单回归和多元回归估计值比较可以证明,R2的另一种理解是 的实际值与其拟合值 的相关系数的平方,其中2.6 拟合优度(与简单回归大致相同)二、普通最小二乘法(多元线性回归模型的代数特征和对方程的解释)使用提示:1.该笔记是对伍德里奇《计量经济学》第五版第三章学习过程中的内容梳理2.由于本人水平有限,单独看该笔记估计会很吃力,且很可能出现错误,建议结合书本进行理解3.希望能够对想学习计量经济学的人起到一点点帮助第三章多元回归分析:估计2020年3月19日10:47由于定义下增加解释变量不会降低R2,所以判断一个解释变量是否应该放入模型的依据应该是该解释变量在总体中对y的偏效应是否非02.7 过原点的回归1.之前推导的性质不再成立,特别是OLS残差的样本平均值不再是02.计算R2没有特定的规则3.当截距项b0不等于0,斜率参数OLS估计量将有偏误;当截距项b0=0,估计带截距项方程的代价是,OLS斜率估计量的方差会更大2.8 OLS估计量的期望值MLR.1(线性于参数)MLR.2(随机抽样)MLR.3(不存在完全共线性,允许一定程度的相关)(在定义函数时要小心不要违背了MLR.3MLR.4(条件均值为0)(内生解释变量:解释变量可能与误差项相关定理3.1 OLS的无偏性()2.9 过度设定和设定不足(多了无关变量和少了解释变量)2.9.1过度设定(不影响OLS估计量的无偏性,但影响OLS估计量的方差)2.9.2设定不足1.简单情形:从一个斜率参数到两个斜率参数由(3.23):取均值得偏误为:(因此偏误的方向取决于两个符号,偏误的大小取决于两者之积,在应用中可以通过常识来判断偏误方向2.扩展情形:从两个斜率参数到三个斜率参数当你假设和不相关时,就可以证明和的关系和简单情形一样2.10 OLS估计量的方差MLR.5(同方差性,不仅可以简化公式,还得到了有效性)定理3.2 OLS斜率估计量的抽样方差在MLR.1-5下,以自变量的样本值为条件,有()(是的总样本波动,则是对所有其他自变量(并包含一个截距项)回归所得到的由(3.51)可知,估计量的抽样方差由三个要素决定:1.误差方差(噪声越大,越难估计)2.的总样本波动(越分散,越容易估计)3.自变量之间的线性关系(和其他自变量相关性越高,越不利于估计(很高的并不一定有问题,抽样方差的大小还要取决于剩下两个因素,可以通过收集更多的数据来削减多重共线性(当考虑某一个自变量 的方差时,若 和其他自变量均无关,那么其他自变量间的关系是不造成影响的,某些经济学家为了分离特定变量的因果效应,而在模型中包括许多控制因素,但这并不影响因果效应的证实( )当含有两个解释变量时:( )当含有一个解释变量时:((3.54)和(3.55)表明除非样本中x1和x2不相关,否则 <1.当 =0时,两个都无偏,但 < ,所以前者更好2.当不等于0时,不放x 2进去会导致有偏,放了x 2进去会导致方差增加,但我们喜欢把x2放进去的理由是:不放进去的偏误不会随着样本容量扩大而缩减,而放进去增加的方差却会随着样本容量的扩大逐渐缩小至0所以有两个结论:2.10.1 过度设定的方差(建立在过度设定无偏讨论的基础上)( )2.10.2 OLS 估计量的标准误(与简单回归相同)在假定MLR.1-5下,有(MLR .5若不满足(即异方差),会使标准误失效(第二种表达清楚说明了随着样本容量的扩大,在其他三项( 、 、 )都趋于常数的时候,估计量标准误是如何变小的因此得估计量的标准误:定理3.3 的无偏估计OLS 估计量是最优线性无偏估计量(如(3.22)所示的线性、无偏误、在线性无偏估计量中方差最小在MLR.1-5下,得定理3.4 高斯-马尔科夫定理2.11 对OLS 估计的一个正确认识。
多元回归分析——估计

使用多元回归的动因
先用两个例子来说明,如何用多元回归分析来 解决简单回归所不能解决的问题。 wage =β 0+β 1educ+β 2exper+u ……(3.1) 其中exper是在劳动市场上以年计的工作经 历。 则工资wage由受教育水平和工作经历这两个解 释变量或自变量及那些观测不到的其他因素来 决定。我们首要感兴趣的,是在保持所有其他 影响工资的因素不变情况下,educ对wage的影 响;即我们只对参数β 1感兴趣。
ˆ ˆ x ˆ x )0 ( y i 0 1 i1 k ik
i 1 n
n
ˆ ˆ x ˆ x )0 x ( y i1 i 0 1 i1 k ik
i 1 n
ˆ ˆ x ˆ x )0 x ( y i 2 i 0 1 i1 k ik
第二个例子
问题:解释在高中阶段对每个学生的平均开支 (expend)对平均标准化考试成绩(avgscore)的影响。 假设平均考试成绩取决于学校基金、平均家庭 收入(avginc)及其他不可观测因素:
avgscore=β 0+β 1expend+β 2avginc+u ………… (3.2) 出于政策目的,所关心的系数是expend在其他条件 不变情况下对avgscore的影响β 1。通过在模型中明 确包括avginc,我们就能控制其对avgscore的影响。 由于平均家庭收入与每个学生的开支趋于相关,所 以加入这个变量可能很重要。简单回归中,avginc 被包括在误差项中,而avginc与expend可能相关,从 而导致在两变量模型中对β1的OLS估计有偏误。
机械地看,用普通最小二乘法去估计方 程(3.1)和(3.4) ,应该没有什么差别。每个 方程都可以写成像(3.3)那样的方程。但重 要的差别在于,人们对参数的解释。
第三章多元线性回归模型的参数估计2-PPT精品文档

Y X X X i 0 1 1 i 2 2 i k ki i i=1,2…,n
其中:k为解释变量的数目,j称为回归参数 (regression coefficient)。
习惯上:把常数项看成为一虚变量的系 数,该虚变量的样本观测值始终取1。于是: 模型中解释变量的数目为(k+1)
n1
用来估计总体回归函数的样本回归函数为:
ˆ ˆ ˆ ˆ X X X e 其随机表示式: Y
ˆ ˆ ˆ ˆ ˆ Y X X X i 0 1 1 i 2 2 i ki ki
i 0 1 1 i 2 2 i ki ki i
如果样本函数的参数估计值已经得到,则有:
ˆ ˆ ˆ ˆ ˆ Y X X X i 0 1 1 i 2 2 i ki Ki
表示:各变量X值固定时Y的平均响应。
j也被称为偏回归系数,表示在其他解释变
量保持不变的情况下,X j每变化1个单位时,Y的 均值E(Y)的变化; 或者说j给出了X j的单位变化对Y均值的 “直接”或“净”(不含其他变量)影响。
总体回归模型n个随机方程的矩阵表达式为: 其中
Y X β μ
假设3,E(X’
i E(i ) X1i i X1i E(i ) )=0,即 E 0 X X E( ) Ki i Ki i
假设4,向量 有一多维正态分布,即
1 X11 1 X 12 X 1 X1n
β 1 2 k
0
X21 Xk1 X22 Xk2 X2n Xkn n(k1)
第三章(2)多元线性回归模型的估计

i=1,2…n
其矩阵形式为
ˆ e y xβ
其中 :
y1 y2 y y n
x11 x x 12 x 1n x 21 x k 1 x 22 x k 2 x 2 n x kn
ˆ ) ( Y Xβ ˆ)0 ( Y Xβ ˆ β
ˆ X Y Y Xβ ˆ β ˆ X Xβ ˆ)0 (Y Y β ˆ β
ˆ β ˆ X Xβ ˆ) 0 ( Y Y 2Y Xβ ˆ β
ˆ 0 X Y X Xβ
2、满足基本要求的样本容量
从统计检验的角度: n30 时,Z检验才能应用; n-k8时, t分布较为稳定 一般经验认为: 当n30或者至少n3(k+1)时,才能说满足 模型估计的基本要求。
模型的良好性质只有在大样本下才能 得到理论上的证明
六、多元线性回归模型的参数估计实例 例3.2.2 在例2.5.1中,已建立了中国居 民人均消费一元线性模型。这里我们再考 虑建立多元线性模型。
1 X 12 X k2
1 Y1 X 1n Y2 X kn Yn
即
ˆ X Y (X X) β
由于X’X满秩,故有
ˆ ( X X) 1 X Y β
将上述过程用矩阵表示如下:
即求解方程组:
ˆ X Y (X X) β
并对它进行求解而完成的。 该正规方程组 可以从另外一种思路来导:
Y Xβ μ XY XXβ Xμ X(Y Xβ ) Xμ
求期望 :
E(X(Y Xβ )0
E(X(Y Xβ )0
称为原总体回归方程的一组矩条件,表明了原总 体回归方程所具有的内在特征。
第3章多元回归分析:估计

ˆ ˆ x ˆ x ... ˆ x )2 0 min xi1 ( yi 0 1 i1 2 i2 k ik
i 1
...... ˆ ˆ x ˆ x ... ˆ x )2 0 min xik ( yi 0 1 i1 2 i2 k ik
例3.2:小时工资方程
• 我们在log(wage)的方程中包括educ(教育 水平),exper(工作经历), 和tenure(任现职的任期),估计的方程:
log (wage) 0.284 0.092educ 0.0041exp er 0.022tenure
系数0.092意味着,在保持tenure和exper不 变的情况下,多受一年教育者的log(wage) 提高0.092即9.2%。
ˆ 1 可以表示为:
n n ˆ ˆi1 yi ) / i 1 r ˆi12 1 ( i 1 r
ˆi1 ? • r
对多元回归“排除其他变量 影响”的解释
• 首先, 将第一个自变量x1对第二个自变量x2 ˆ0 ˆ1x ˆ1 ˆ 进行回归,得到样本回归函数 x , 2 ˆi1 xi1 x ˆi1 。 ˆi1 ,得到残差 r • 根据xi和拟合值 x 残差表示剔除了x2的影响之后,x1的其他部 分。它与x2不相关,样本均值为0。
OLS的拟合值和残差
• 直接从单变量模型推广,可得OLS拟合值 和残差的某些重要性质。 1. 残差的样本平均值为零 2. 每个自变量和OLS残差之间的样本协方 差为零,于是OLS拟合值和OLS残差之间 的样本协方差也为零 3. 点 ( x1 , x2 ..., xk , y ) 总位于样本OLS 回归线上。
ˆ 1 。 • 然后,将y对 r1 进行简单回归得到 ˆ • 1 衡量的是,剔除了其他自变量的影响之 后,x1对于y的净影响。
第三章 多元回归分析:估计1

ˆ ˆ ˆ ˆ yi = β 0 + β1 xi1 + ... + β k xik
18 September 2011
13
Interpreting Multiple Regression 对多元回归的解释
ˆ ˆ ˆ ˆ ˆ y = β 0 + β1 x1 + β 2 x2 + ... + β k xk , so ˆ ˆ ˆ ˆ ∆y = β ∆x + β ∆x + ... + β ∆x ,
18 September 2011
3
Motivation: Advantage 动因:优点
The primary drawback of the simple regression analysis for empirical work is that it is very difficult to draw ceteris paribus conclusions about how x affects y.
...
ˆ ˆ ˆ ( y i − β 0 − β 1 x i 1 − β k x ik ) i =1
n n n
=0
ˆ ˆ ˆ x i 1 ( y i − β 0 − β 1 x i 1 − β k x ik ) = 0 i =1 ˆ ˆ ˆ x i 2 ( y i − β 0 − β 1 x i 1 − β k x ik ) = 0 i =1 ˆ ˆ ˆ x ik ( y i − β 0 − β 1 x i 1 − β k x ik ) = 0 i =1
18 SeptemberБайду номын сангаас2011
14
Example: Determinants of College GPA 例子:大学GPA的决定因素
第三讲 多元回归分析:估计

27
例子3.1:大学生GPA的决定因素
计量经济学导论
28
例子3.2:小时工资方程
计量经济学导论
29
在多元回归中保持其他因素不变的含义
多元回归分析的作用是,提供了一个“在其他 因素保持不变”下的解释,尽管我们的数据并 非以这种方式搜集。
计量经济学导论
30
同时改变两种以上因素时参数的含义
计量经济学导论
t 2 (n k ) 2.056, 这说明在显著性水平
0.05下,分
别都应当拒绝 H0 : b j 0 ( j 1, 2,3, 4)
说明当在其它解释变量不变的情况下,解释变量“国内生
产总值” 、“财政支出” 、“商品零售价格指数” 分
别对被解释变量“税收收入”Y都有显著的影响。
3.1多重共线性的检验
● 简单相关系数检验法 ● 方差扩大(膨胀)因子法 ● 直观判断法 ● 逐步回归法
10
简单相关系数检验法
含义:简单相关系数检验法是利用解释变量之间的线 性相关程度去判断是否存在严重多重共线性的一种 简便方法。 判断规则:一般而言,如果每两个解释变量的简单相
关系数(零阶相关系数)比较高,例如大于0.8,则可
249529.9
40422.73
49781.35
101
103.8
序列Y、X2、X3、X4的线性图
可以看出Y、X2、X3都是逐年增
长的,但增长速率有所变动,而
且X4在多数年份呈现出水平波动。 说明变量间不一定是线性关系, 可探索将模型设定为以下对数模 型:
ln Yt b1 b2 ln X 2t b2 ln X 3t b3 X 4t ut
多元回归分析:估计问题

画出散点图:
440 400 360 320 Y 280 240 200 160 0 2 4 6 X 8 10 12
Dependent Variable: Y Method: Least Squares Date: 09/28/10 Time: 07:54 Sample: 1 10 Included observations: 10
第六讲: 多元回归分析:估计问题
主要内容:
使用多元回归的动因 多元回归的参数估计 模型假定的再思考 多元回归的拟合优度 应用:多项式回归模型
6.1 使用多元回归的动因
双变量回归分析的主要缺陷: 它很难得到 X 在其他条件不变情况下对 Y 的影响
假定7: cov ( u i , X i ) = 0 通常不现实
6.5 应用:多项式回归模型
多项式回归模型: 在有关成本和生产函数的计量经济研究 中有广泛的用途。 形如
Yi = β 0 + β1 X + β 2 X 2 + ... + β k X k + ui(6-10)
的模型称为关于 X 的多项式回归模型
例:估计总成本函数 下表给出了在短期内某商品的产出与生产总成本数据
当我们将解释变量的个数增加后,就可以得 到一般的多元回归模型形式(PRF)
Yi = β 0 + β1 X 1i + β 2 X 2i + ... + β k X ki + ui (6-1)
E (Y X 1i , X 2i ,..., X ki ) = β 0 + β1 X 1i + β 2 X 2i + ... + β k X ki
多元回归分析:估计

更多关于R2
考虑从一个解释变量开始,然后加入第二个。 OLS性质:最小化残差平方和。 如果OLS恰好使第二个解释变量系数取零,那
么不管回归是否加入此解释变量,SSR相同。 如果OLS使此解释变量取任何非零系数,那么
加入此变量之后,SSR降低了。 实际操作中,被估计系数精确取零是极其罕见
的,所以,当加入一个新解释变量后,一般来 说,SSR会降低。
那么所有系数的OLS估计量都有偏。
4
更一般的情形
假设总体模型
• 满足假定MLR.1~MLR.4。但我们遗漏了 变量x3,并估计了模型
• 假设X2和X3无关, X1和X3相关。 • 是β1的一个有偏估计量,但 是否有偏
?
更一般的情形
此时,我们通常假设X1和X2无关。
当X1和X2无关时,可以证明:
差项u的条件方差都是一样的。
▪ 如果这个假定不成立,我们说模型存在异方
差性。
OLS估计量的方差(续)
用x表示(x1, x2,…xk)
假定Var(u|x) = s2,也就意味着Var(y| x) = s2
假定MLR.1-5共同被称为高斯-马尔可夫假定 (Gauss-Markov assumptions)
效应) OLS的性质 什么时候简单回归和多元回归的估计值
相同 OLS的无偏性
多元回归分析:估计(2) Multiple Regression Analysis: Estimation
(2)
y = b0 + b1x1 + b2x2 + . . . bkxk + u
1
本章大纲
使用多元回归的动因 普通最小二乘法的操作和解释 OLS估计量的期望值 OLS估计量的方差 OLS的有效性:高斯-马尔科夫定理
3计量经济学(多元回归分析估计)

拟合优度
• 拟合优度:样本方差中被OLS回归线所解释的部分。
n
R2
( yˆ
y)
(y
y)
i 1
n
i 1
n
(y
i 1
i
y)
i
i
2
n
uˆ
2
1
2
i 1
n
(y
i
i 1
n
( yˆ
i 1
i
y)
2
2
i
y )2
n
uˆ
i 1
2
i
• 拟合优度介于0和1之间。
– 无论模型中包含了多少解释变量,总有一些因
素无法被包括进来,所有这些因素就包括在了
误差项中。
– 线性是指回归方程是诸参数的线性函数。
– 参数的解释,例4:
log( salary ) 0 1 log sales 2 ceoten 3ceoten 2 u
•
1
是其他条件不变的情况下薪水对销售量的弹性。
ˆ
0
i 1
i 1
n
n
L
2 xim rˆij 0 xim rˆij 0, m j
ˆ m
i 1
i 1
n
n
x rˆ (ˆ
ij ij
i 1
i 1
0
ˆ1 xi1 ˆ j 1 xi , j 1 ˆ j 1 xi , j 1 ˆ k xik rˆij )rˆij
Ƹ 是样本自变量的函数,因此
rˆ y
rˆ u
i n
ˆ j
n
第三章多元回归估计

• • • • • • • • • 模型 与简单回归的相似点 多元回归的意义 多元回归的最小二乘法 拟合度 多重共线性 多元回归的代数性质 遗漏变量 多元回归的统计性质
多元回归分析模型
• y = β0 + β1x1 + β2x2 + . . . +βkxk + u
yi = β0 + β1xi1 + β2xi2 +L+ βk xik + μi ⎛ y1 ⎞ ⎛1 x11 L x1k ⎞ ⎛ β0 ⎞ ⎛ μ1 ⎞ ⎜ M ⎟, x = ⎜M M ⎟, β = ⎜ M ⎟ , μ = ⎜ M ⎟ y= M ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ y ⎟ ⎜1 x L x ⎟ ⎜β ⎟ ⎜μ ⎟ nk ⎠ ⎝ n ⎠ ⎝ n1 ⎝ k⎠ ⎝ n⎠ y = xβ + μ
多元回归的统计性质
• 定理1证明(继续)
E[ β ] = E[ β + ( x ' x ) −1 x ' μ ] = β + E[( x ' x ) x ' μ ]
−1
= β + ( x ' x ) x ' E[ μ ]
−1
=β
多元回归的统计性质
• 如果x是随机的
β = β + ( x ' x ) −1 x ' μ
∑( x − x )( β + β x + β x + u ) = β ∑( x − x ) + β ∑( x − x )x + ∑( x
i1 1 0 1 i1 2 i2 i 2 1 i1 1 2 i1 1 i2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
wage 0 1educ 2 exp er u • exper: years of labor market experience • exper:在劳动力市场上的经历,用年衡量
In this example experience is explicitly taken out of the error term.
20 November 2018
14
Example: Determinants of College GPA 例子:大学GPA的决定因素
Two-independent-variable regression 两个解释变量的回归 pcolGPA: predicted values of college grade point average pcolGPA:大学绩点预测值 hsGPA : high school GPA hsGPA : 高中绩点 ACT : achievement test score ACT :成绩测验分数
20 November 2018
6
Motivation: An Example 动因:一个例子
Consider a simple version of the wage equation for obtaining the effect of education on hourly wage:考虑一个简单版本的解释教育对小时工资影响的工资方
20 November 2018
3
Motivation: Advantage 动因:优点
The primary drawback of the simple regression analysis for empirical work is that it is very difficult to draw ceteris paribus conclusions about how x affects y.
...
ˆ ˆ x ˆ x ) ( y i 0 1 i1 k ik i 1
n n n
0
ˆ ˆ x ˆ x ) 0 x ( y i 1 i 0 1 i 1 k ik i 1 ˆ ˆ x ˆ x )0 x ( y i 2 i 0 1 i 1 k ik i 1 ˆ ˆ x ˆ x )0 x ( y ik i 0 1 i 1 k ik i 1
20 November 2018
9
Parallels with Simple Regression 类似于简单回归模型
斜率参数 u is still the error term (or disturbance) u仍是误差项 (或干扰项) Still need to make a zero conditional mean assumption, so now assume that 仍需作零条件期望的假设, 所以现在假设 E(u|x1,x2, …,xk) = 0 Still minimizing the sum of squared residuals, so have k+1 first order conditions 仍然最小化残差平方和, 所以得到k+1个一阶条件
pcolGPA = 1.29 + 0.453hsGPA+0.0094ACT
20 November 2018
15
Example: Determinants of College GPA 例子:大学GPA的决定因素
One-independent-variable regression 一个解释变量的回归 pcolGPA = 2.4 +0.0271ACT The coefficients on ACT is three times larger. ACT的系数大三倍。 If these two regressions were both true, they can be considered as the results of two different experiments. 如果这两个回归都是对的,它们可以被认为是两个不同实验的 结果。
20 November 2018
13
Interpreting Multiple Regression 对多元回归的解释
ˆ ˆ x ˆ x ... ˆ x , so ˆ y 0 1 1 2 2 k k ˆ x ˆ x ... ˆ x , ˆ y
在其它条件不变情况假定下我们估计出的x对y的影响值是否可信依赖, 完全取决于条件均值零值假设是否现实。
If other factors that affecting y are not correlated with x, changing x can ensure that u is not changed, and the effect of x on y can be identified.
1 1 பைடு நூலகம் 2 k k
so holding x2 ,..., xk fixed implies that 所以,保持 x2 ,..., xk 不变意味着 ˆ x , that is each has ˆ y
1 1
a ceteris paribus interpretation 即,每一个 都有一个局部效应,或其它情况不变效应的解释
多元回归分析更适合于其它条件不变情况下的分析,因为多元回归分析允 许我们明确地控制许多其它也同时影响因变量的因素。
Multiple regression models can accommodate many explanatory variables that may be correlated.
在这个例子中,“在劳动力市场上的经历”被明确地从误差项中 提出。
20 November 2018
7
Motivation: An Example 动因:一个例子
Consider a model that says family consumption is a quadratic function of family income:
普通最小二乘法选择能最小化残差平方 和的估计值,
ˆ ˆ x ˆ x )2 ( y i 1 i 0 1 i1 k ik
n
20 November 2018
11
Obtaining the OLS Estimates 如何得到OLS估计值
The k+1 first order conditions are k+1 个一阶条件是
It can incorporate more general functional form. 它可以表现更一般的函数形式。
The multiple regression model is the most widely used vehicle for empirical analysis. 多元回归模型是实证分析中最广泛使用的工具。
如果影响y的其它因素与x不相关,则改变x可以保证u不变,从而x对y的影响可 以被识别出来。
20 November 2018 4
Motivation : Advantage 动因:优点
Multiple regression analysis is more amenable to ceteris paribus analysis because it allows us to explicitly control for many other factors that simultaneously affect the dependent variable.
n
20 November 2018
12
Obtaining the OLS Estimates 如何得到OLS估计值
The first order conditions are also the sample counterparts of the related population moments. 一阶条件也是相关的总体矩在样本中的对应。
20 November 2018 2
Lecture Outline 课堂大纲
Motivation for multivariate Analysis 使用多元回归 的动因 The Model 模型 The Estimation 估计 Properties of the OLS estimates OLS估计的性质 The Partialling out Interpretation 对“排除其它变量 影响”的解释 Simple versus multiple regressions 比较简单回归模 型与多元回归模型 Goodness of Fit 拟合优度
8
The Model with k Independent Variables 含有k个自变量的模型
The general multiple linear regression model can be written as
一般的多元线性回归模型可以写为
y 0 1 x1 2 x2 k xk u
考虑一个模型:家庭消费是家庭收入的二次方程。 Cons = 0 + 1 inc+2 inc2 +u
Now the marginal propensity to consume is approximated by MPC= 1 +22 inc
现在,边际消费倾向可以近似为
20 November 2018
中级计量经济学
INTERMEDIATE ECONOMETRICS