多元回归模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Y= b0 + b1x1 + b2x2 + . . . bkxk + µ
假设1、随机误差项与各解释变量X之间不相关(更 强的假设是各个解释变量X都是确定性变量,不是随 机变量,这样假设1自动满足)
Y= b0 + b1x1 + b2x2 + . . . bkxk + µ
假设2、随机误差项具有零均值
X1 =aX2 + bX3 + cX4
3.3 多元回归参数的估计
双变量模型 OLS法:残差平方和最小
OLS估计法的基本原理
对于随机抽取的n组观测值 (Yi , X ji ), i 1,2, , n, j 0,1,2, k
可以得到Y的拟合值:
Yˆi bˆ0 bˆ1 X1i bˆ2 X 2i bˆki X Ki i=1,2…n
E(i)=0
i=1,2, …,n
Y= b0 + b1x1 + b2x2 + . . . bkxk + µ
假设3、随机误差项同方差 Var (i)=2 i=1,2, …,n
Y= b0 + b1x1 + b2x2 + . . . bkxk + µ
假设4、随机误差项无序列相关 Cov(i, j)=0 i≠j i,j= 1,2, …,n
件是:
µ与X不相关,或者说,
E(µ | Xi) = 0(零条件均值假定)
案例分析:工资与教育
被解释变量:工资(1976年每小时美元数) 解释变量:教育(年数) 计量模型:
wage = b0 + b1 educ +
b1的含义?
b1 > 0
E(µ | Xi) = 0不成立的情况
案例:影响工资的其他因素 例如,工作经验exper 初中学历人群的平均工作经验:
1、更准确地估计斜率:无偏估计量 2、更好地说明被解释变量的变化:引入 了更多的解释变量
多元回归模型
Y= b0 + b1x1 + b2x2 + . . . bkxk + µ
1、K个解释变量 2、k+1个待估参数
3、 b0称为截距, b1 到 bk称为斜率
3.2 多元线性回归模型的第6个假设
一元线性回归模型关于随机误差项的五个 假设 新增的关于多个解释变量之间关系的假设
二元回归模型
Y= b0 + b1x1 + b2x2 + µ
1、确定性部分: b0 + b1x1 + b2x2 E(Y| X1 , X2) 2、随机性部分: µ
Var(Y)
被解释变量的期望值
E(Y| X1 , X2)= b0 + b1x1 + b2x2
b1表示给定x2保持不变,x1变化一个单
位,引起的Y的均值的改变量 多元回归分析可以使我们明确控制其他 影响因素
colGPA = b0 + b1hsGPA + b2ACT + b1的含义?
Eviews
运用Eviews,得到如下估计结果: colGPA = 1.29 + 0.45hsGPA + 0.0094ACT
请解释: 1、1.29 2、0.45 3、0.0094
错误的简单回归分析
被解释变量:大学平均成绩colGPA 解释变量: 大学能力测验分数ACT colGPA = 2.40 + 0.027ACT 请比较: 多元回归分析:0.0094 一元回归分析:0.027
第3章 多元回归
7、如何预测被解释变量的期望值? 8、如何预测被解释变量的值?
3.1 三变量线性回归模型
一元回归分析的弱点
Y = b0 + b1X+ µ b1刻划了解释变量X对Y的影响 其他影响Y的因素被放入µ当中
一元回归分析的弱点
Y = b0 + b1X+ µ
要用OLS法得到b1的无偏估计量,必要条
E(exper | 9)
大学学历人群的平均工作经验:
E(exper | 16)
如何处理工作经验的影响
wage = b0 + b1 educ +
即使我们关心的是教育对工资的影响,
如果把exper放在中,就不能得到b1的
无偏估计量 解决的方法: 多元回归分析
多元回归分析
Y= b0 + b1x1 + b2 x2 + µ 请解释b1在上述二元回归模型中的含义 给定保持x2不变……
影响斜率估计量方差的因素
1、总体的方差
Var(Y)
σ²
2、解释变量的变化程度
x ∑ j²
3、和其他解释变量的线性相关程度 Rj ²
Var(bi )
σ²
x Var(bj ) = ∑ j²(1-Rj²)
其中,Rj ²为第j个解释变量对其余解释变 量进行回归得到的拟合优度:反映了第j个解 释变量和其他变量的线性相关关系
多重共线性
1、完全共线性 Rj ² =1 如果存在完全共线性,则不能应用OLS估 计法 2、多重共线性 Rj ²接近于1 后果:估计量的方差较大,导致估计结果 不准确
Y= b0 + b1x1 + b2x2 + . . . bkxk + µ
假设5、服从正态分布 i~N(0, 2 )
i=1,2, …,n
Y= b0 + b1x1 + b2x2 +. . . bkxk + µ
假设6、Xi之间无完全的线性相关关系(完全共 线性)
即任何一个Xi都不能被表示成其他解释变量的线性 函数 例如,
根据最小二乘原理,参数估计值应该是下列方程组的解
bˆ
0
Q
0
bˆ1
Q
0
bˆ
2
Q
0
bˆ k
Q
0
其中
n
n
Q ei2 (Yi Yˆi ) 2
i 1wenku.baidu.com
i 1
n
2
(Yi (bˆ0 bˆ1 X 1i bˆ2 X 2i bˆk X ki ))
i 1
案例分析:大学平均成绩
被解释变量:大学平均成绩colGPA 解释变量: (1)高中平均成绩hsGPA; (2)大学能力测验分数ACT 计量模型:
案例:教育对工资的影响
wage = b0 + b1 educ + b2 exper +
请解释b1的含义
采用一元回归模型和二元回归模型估计出的
b1相等吗?
wage = b0 + b1 educ + wage = b0 + b1 educ + b2 exper +
运行eviews验证
多元回归分析的优势
OLS估计量的性质
1、无偏性 含义?
E(bi )= bi
2、有效性 含义?
斜率估计量的方差.
σ²
x Var(bj ) = ∑ j²(1-Rj²)
x 其中,∑ j²为第j个解释变量的离差平方和
Rj ²为第j个解释变量对其余解释变量进行回 归得到的拟合优度:反映了第j个解释变量和 其他变量的线性相关关系