计量经济学多元线性回归
计量经济学多元线性回归
调整过的R2(The Adjusted R-squared)
因此, R2增加并不意味着加入新的变量一定 会提高模型拟合度。
调整过的R2是R2一个修正版本,当加入新的 解释变量,调整过的R2不一定增加。
R 21(SS /n (R (k 1 ) )1n(k 1 )SSR
SS /n (T 1 )
定义:
y i y 2 to su to a s m flqS ua S总 rT es平
y ˆi y 2exp slu o as m ifq nu e Sd a Sr解 E es释 u ˆi2 ressiu d os m u fq au S l a SrR 残 es 差平
SST= SSE + SSR
3
重新定义变量
为什么我们想这样做? 数据测度单位变换经常被用于减少被估参数小数
点后的零的个数,这样结果更好看一些。 既然这样做主要为了好看,我们希望本质的东西
不改变。
4
重新定义变量:一个例子
以下模型反映了婴儿出生体重与孕妇吸烟量和家 庭收入之间的关系:
(1) b w g h t ˆ 0 ˆ 1 c ig s ˆ 2 fa m in c
explog考虑如果我们想知道时的百分比变化我们不能只报告因为所以22含二次式的模型u的模型我们不能单独将b解释为关于xy变化的度量我们需要将b如果感兴趣的是给定x的初始值和变动预测y的变化那么可以直接使用1
课堂提纲
重新定义变量的影响
估计系数 R 平方 t 统计量
函数形式
对数函数形式 含二次式的模型 含交叉项的模型
24
wage
7.37
3.73
24.4
exper
25
对含二次式模型的进一步讨论
计量经济学课程第4章(多元回归分析)
§4.1 多元线性回归模型的两个例子
一、例题1:CD生产函数
Qt AKt 1 Lt 2 et
这是一个非线性函数,但取对数可以转变为一个 对参数线性的模型
ln Qt 0 1 ln Kt 2 ln Lt t
t ~ iid(0, 2 )
注意:“线性”的含义是指方程对参数而言是线 性的
R 2 1 RSS /(N K 1) TSS /(N 1)
调整思想: 对 R2 进行自由度调整。
Page 20
基本统计量TSS、RSS、ESS的自由度:
1.
TSS的自由度为N-1。基于样本容量N,TSS
N i1
(Yi
Y
)2
因为线性约束 Y 1 N
Y N
i1 i
而损失一个自由度。
分布的多个独立统计量平方加总,所得到的新统计量就服从
2 分布。
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
Page 23
双侧检验
概 率 密 度
概率1-
0
2 1 / 2
2 /2
图4.3.1
2
(N-K-1)的双侧临界值
双侧检验:统计值如果落入两尾中的任何一个则拒绝原假设
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
Page 24
单侧检验
概 率 密 度
概率 概率
0
2 1
2
图4.3.2 (2 N-K-1)的单侧临界值
H0:
2
2,
0
HA :
2
2 0
计量经济学-多元线性回归模型
Y=β0+β1X1+β2X2+...+βkXk+ε,其中Y为因变 量,X1, X2,..., Xk为自变量,β0, β1,..., βk为回归 系数,ε为随机误差项。
多元线性回归模型的假设条件
包括线性关系假设、误差项独立同分布假设、无 多重共线性假设等。
研究目的与意义
研究目的
政策与其他因素的交互作用
多元线性回归模型可以引入交互项,分析政策与其他因素(如技 术进步、国际贸易等)的交互作用,更全面地评估政策效应。
实例分析:基于多元线性回归模型的实证分析
实例一
预测某国GDP增长率:收集该国历史数据,包括GDP、投资、消费、出口等变量,建立 多元线性回归模型进行预测,并根据预测结果提出政策建议。
最小二乘法原理
最小二乘法是一种数学优化技术,用 于找到最佳函数匹配数据。
残差是观测值与预测值之间的差,即 e=y−(β0+β1x1+⋯+βkxk)e = y (beta_0 + beta_1 x_1 + cdots + beta_k x_k)e=y−(β0+β1x1+⋯+βkxk)。
在多元线性回归中,最小二乘法的目 标是使残差平方和最小。
t检验
用于检验单个解释变量对被解释变量的影响 是否显著。
F检验
用于检验所有解释变量对被解释变量的联合 影响是否显著。
拟合优度检验
通过计算可决系数(R-squared)等指标, 评估模型对数据的拟合程度。
残差诊断
检查残差是否满足独立同分布等假设,以验 证模型的合理性。
04
多元线性回归模型的检验与 诊断
计量经济学第3章 多元线性回归模型(1)
BB ( X X ) 1 0
这意味着 BB ( X X ) 1为半正定矩阵。这样的协方差 矩阵之差 ˆ ) BB 2 ( X X ) 1 2 [ BB ( X X ) 1 ] 2 0 Var (b) Var ( 也是半正定矩阵。因此多元线性回归参数的最小二 乘估计是最小方差的线性无偏估计。
i
21
•
但是需注意:多元线性回归模型解释变量的 数目有多有少,而上述可决系数R2又可以证明是 解释变量数目的增函数。这意味着不管增加的解 释变量是否对改善模型、拟合程度有意义,解释 变量个数越多,可决系数一定会越大。因此,以 这种可决系数衡量多元回归模型的拟合优度是有 问题的,而且会导致片面追求解释变量数量的错 误倾向。正是由于存在这种缺陷,可决系数R2在 多元线性回归分析拟合优度评价方面的作用受到 很大的限制。
10
Q ˆ X Y ˆ X X ˆ ) 2 X Y 2 X X ˆ 0 (Y Y 2 ˆ ˆ
• 其中矩阵求导:
f ( B) A f ( B) BA B f ( B ) f ( B) BAB 2 AB B
11
Q ˆ ˆ X ˆ X ˆ X ) (1) 0 2 ( Y i 0 1 1 i 2 2 i k ki ˆ 0 Q ˆ ˆ X ˆ X ˆ X ) ( X ) 0 2 (Yi 0 1 1i 2 2i k ki 1i ˆ 1 Q ˆ ˆ X ˆ X ˆ X ) ( X ) 0 2 (Yi 0 1 1i 2 2i k ki ki ˆ k
• 整理该向量方程,得到下列形式的正规方程组
ˆ X Y X X
• 当X X 可逆,也就是X是满秩矩阵(满足假设5)时,在 上述向量方程两端左乘的 X X 逆矩阵,得到
计量经济学第二章(第二部分)
其中,有k个解释变量;k+1个回归参数
3
计量经济学 第二章B
同 上
(2)矩阵形式: Y XB N Y1 Y2 Y ... Y n 1 1 X ... 1 0 u1 1 u2 , B , N ... ... u n 1 k (k 1) 1 n n 1 X 11 X 12 ... X 1n X 21 X 22 ... X 2n ... ... ... ... X k1 X k2 ... X kn n (k 1)
2
(2)当 R
2
k n -1
时,
R
2
<0 ,此时, 使
2
用 R 将失去意义。因此, R 只适
2
用于Y与解释变量整体相关程度较的
情况。
34
计量经济学 第二章B
四、回归方程的显著性检验
(1) 提出原假设 (2) 构造统计量 H 0 : 1 2 ... k 0 F ESS/k RSS/n (3) 对于给定的显著性水平 (4)判定方程的显著性, 若 F F , 则拒绝原假设 若 F F ,则接受原假设 H 0,即模型的线性关系 F 检验; - k -1 ~ F(k, n - k - 1) ( 在 H 0 成立时) F
不管其质量的好坏,而所要求的样本容量
的下限。
20
计量经济学 第二章B
同 上
ˆ 由 B ( X X)
-1
ˆ X Y 中看到,要使 B
存在,
必须保证(XˊX)-1存在,因此,必须满
足|XˊX|≠0 ,即XˊX为满秩矩阵,而
计量经济学-3多元线性回归模型
2020/12/8
计量经济学-3多元线性回归模型
•第一节 概念和基本假定
•一、基本概念: • 设某经济变量Y 与P个解释变量:X1,X2,…,XP存在线性依
存关系。 • 1.总体回归模型:
•其中0为常数项, 1 ~ P 为解释变量X1 ~ XP 的系数,u为随机扰动项。 • 总体回归函数PRF给出的是给定解释变量X1 ~ XP 的值时,Y的期 望值:E ( Y | X1,X2,…,XP )。 • 假定有n组观测值,则可写成矩阵形式:
计量经济学-3多元线性回归模型
•2.样本回归模型的SRF
计量经济学-3多元线性回归模型
•二、基本假定: • 1、u零均值。所有的ui均值为0,E(ui)=0。 • 2、u同方差。Var(ui)=δ2,i=1,2,…,n
计量经济学-3多元线性回归模型
•
计量经济学-3多元线性回归模型
•
•第二节 参数的最小二乘估 计
•五、预测
•(一)点预测 •点预测的两种解释:
计量经济学-3多元线性回归模型
•(二)区间预测
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
•例5,在例1中,若X01=10,X02=10,求总体均值E(Y0|X0) 和总体个别值Y0的区间预测。
•
Yi=β0+β1Xi1+β2Xi2+ui
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
•三、最小二乘估计的性质
计量经济学-3多元线性回归模型
5、计量经济学【多元线性回归模型】
二、多元线性回归模型的参数估计
2、最小二乘估计量的性质 当 ˆ0, ˆ1, ˆ2, , ˆk 为表达式形式时,为随机变量, 这时最小二乘估计量 ˆ0, ˆ1, ˆ2, , ˆk 经过证明同样也 具有线性性、无偏性和最小方差性(有效性)。 也就是说,在模型满足那几条基本假定的前提 下,OLS估计量具有线性性、无偏性和最小方差性 (有效性)这样优良的性质, 即最小二乘估计量
用残差平方和 ei2 最小的准则: i
二、多元线性回归模型的参数估计
1、参数的普通最小二乘估计法(OLS) 即:
min ei2 min (Yi Yˆi )2 min Yi (ˆ0 ˆ1X1i ˆ2 X 2i ˆk X ki )2
同样的道理,根据微积分知识,要使上式最小,只 需求上式分别对 ˆj ( j 0,1, k) 的一阶偏导数,并令 一阶偏导数为 0,就可得到一个包含 k 1 个方程的正 规方程组,这个正规方程组中有 k 1个未知参数 ˆ0, ˆ1, ˆ2, , ˆk ;解这个正规方程组即可得到这 k 1 个参数 ˆ0, ˆ1, ˆ2, , ˆk 的表达式,即得到了参数的最小 二乘估计量;将样本数据代入到这些表达式中,即可 计算出参数的最小二乘估计值。
该样本回归模型与总体回归模型相对应,其中残差 ei Yi Yˆi 可看成是总体回归模型中随机误差项 i 的 估计值。
2、多元线性回归模型的几种形式: 上述几种形式的矩阵表达式: 将多元线性总体回归模型 (3.1) 式表示的 n 个随机方 程写成方程组的形式,有:
Y1 0 1 X11 2 X 21 .Y.2.........0.......1.X...1.2........2.X...2.2. Yn 0 1 X1n 2 X 2n
ˆ0, ˆ1, ˆ2, , ˆk 是总体参数真值的最佳线性无偏估计 量( BLUE );即高斯—马尔可夫定理 (GaussMarkov theorem)。
第四章 多元线性回归模型(计量经济学,潘省初)
Y1 β 0 β 1 X 11 β 2 X 21 β 3 X 31 ... β K X K 1 u1 Y2 β 0 β 1 X 12 β 2 X 22 β 3 X 32 ... β K X K 2 u2 ...... Yn β 0 β 1 X 1n β 2 X 2 n β 3 X 3n ... β K X Kn un
ˆ 116.7 0.112 X 0.739 P Y (9.6) (0.003) (0.114)
R 2 0.99
Y和X的计量单位为10亿美元 (按1972不变价格计算).
食品价格平减指数 P 100,( 1972 100) 总消费支出价格平减指数
3
多元线性回归模型中斜率系数的含义
上述假设条件可用矩阵表示为以下四个条件:
9
(1) E(u)=0 (2)
由于
E (uu) 2 I n
u1 u2 uu u1 u2 ... u n
2
u12 u1u2 ...... u1un 2 u2u1 u2 ...... u2un ... un ................................. 2 unu1 unu2 ...... un
一.假设条件 (1)E(ut)=0, t=1,2,…,n (2)E(ui uj)=0, i≠j (3)E(ut2)=σ2, t=1,2,…,n (4)Xjt是非随机量, j=1,2, … k
t=1,2, … n
8
除上面4条外,在多个解释变量的情况下,还有 两个条件需要满足: (5)(K+1)< n; 即观测值的数目要大于待估计的参数的个数 (要有足够数量的数据来拟合回归线)。 (6)各解释变量之间不存在严格的线性关系。
《计量经济学》第三章 多元线性回归模型
Yi 1 2 X 2i 3 X 3i ... k X ki ui
7
多元样本回归函数
Y 的样本条件均值表示为多个解释变量的函数
ˆ ˆ ˆ ˆ ˆ Yi 1 2 X 2i 3 X3i ... k X ki
或
ˆ ˆ ˆ ˆ Yi 1 2 X 2i 3 X3i ... k X ki ei
22
ˆ ˆ 因 2 是未知的,可用 2代替 2 去估计参数 β 的标
准误差:
ˆ ● 当为大样本时,用估计的参数标准误差对 β 作标 准化变换,所得Z统计量仍可视为服从正态分布 ˆ ●当为小样本时,用估计的参数标准误差对 β 作标
准化变换,所得的t统计量服从t分布: ˆ βk - βk t ~ t (n - k ) ^ ˆ SE( βk )
i i
i
e e 0 4.残差 ei 与 X 和
3.
i
e X
i
3i
ei X 2i 0
2i
X 3i 都不相关,即
ˆ 5.残差 ei 与 Yi 不相关,即
e Yˆ 0
i i
18
二、OLS估计式的性质-统计性质
OLS估计式(用矩阵表式) 1.线性特征:
ˆ = (X X)-1 X Y β
2 i
ˆ ei2 (Yi - Yi )2
ˆ X X ... X )]2 ˆ min e [Yi -(1 ˆ2 2i ˆ3 3i k ki
求偏导,令其为0:
( ei2 ) 0 ˆ
j
13
即 ˆ ˆ ˆ ˆ -2 Yi - (1 2 X 2i 3 X 3i ... ki X ki ) 0
计量经济学实验报告(多元线性回归 自相关 )
计量经济学实验报告(多元线性回归自相关 )1. 背景计量经济学是一门关于经济现象的定量分析方法研究的学科。
它的发展使得我们可以对经济现象进行更加准确的分析和预测,并对社会发展提供有利的政策建议。
本文通过对多元线性回归模型和自相关模型的实验研究,来讨论模型的建立与评价。
2. 多元线性回归模型在多元线性回归模型中,我们可以通过各个自变量对因变量进行预测和解释。
例如,我们可以通过考虑家庭收入、年龄和教育程度等自变量,来预测某个家庭的消费水平。
多元线性回归模型的一般形式为:$y_i=\beta_0+\beta_1 x_{i1}+\beta_2 x_{i2}+...+\beta_k x_{ik}+\epsilon_i$在建立模型之前,我们需要对因变量和自变量进行观测和测算。
例如,我们可以通过调查一定数量的家庭,获得他们的收入、年龄、教育程度和消费水平等数据。
接下来,我们可以通过多元线性回归模型,对家庭消费水平进行预测和解释。
在实际的研究中,我们需要对多元线性回归模型进行评价。
其中一个重要的评价指标是 $R^2$ 值,它表示自变量对因变量的解释程度。
$R^2$ 值越高,说明多元线性回归模型的拟合程度越好。
3. 自相关模型在多元线性回归模型中,我们假设各个误差项之间相互独立,即不存在自相关性。
但实际上,各个误差项之间可能会互相影响,产生自相关性。
例如,在一个气温预测模型中,过去的温度对当前的温度有所影响,说明当前的误差项和过去的误差项之间存在相关性。
我们可以通过自相关函数来研究误差项之间的相关性。
自相关函数表示当前误差项和过去 $l$ 期的误差项之间的相关性。
其中,$l$ 称为阶数。
自相关函数的一般形式为:$\rho_l={\frac{\sum_{t=l+1}^{T}(y_t-\bar{y})(y_{t-l}-\bar{y})}{\sum_{t=1}^{T}(y_t-\bar{y})^2}}$在自相关模型中,我们通过对误差项进行差分或滞后变量,来消除误差项之间的自相关性。
计量经济学多元线性回归共57页文档
Beta系数
上例揭示了什么问题? 被估计系数的大小是不可比较的。 一个相关的问题是,当变量大小差别过大时,在
回归中因运算近似而导致的误差会比较大。
10
Beta系数
有时,我们会看见“标准化系数”或“Beta系 数”,这些名称有着特殊的意义
使用Beta系数是因为有时我们把y和各个x替换 为标准化版本——也就是,减去均值后除以标准 离差。
-0.0289 (0.0057) --
0.0058 (0.0018) 7.3109 (0.0656) 1388 0.0298 2177.5778 1.2539
(3) bwght
--
-9.268 (1.832) 0.0927 (0.0292) 116.974 (1.049) 1388 0.0298 557.485.51 20.063
本章大纲
数据的测度单位换算对OLS统计量的影响 对函数形式的进一步讨论 拟合优度和回归元选择的进一步探讨 预测和残差分析
1
课堂提纲
重新定义变量的影响
估计系数 R 平方 t 统计量
函数形式
对数函数形式 含二次式的模型 含交叉项的模型
2
重新定义变量
为什么我们想这样做? 数据测度单位变换经常被用于减少被估参数小数
5
改变被解释变量测度单位的影响
因为1磅=16盎司,被解释变量被除以16。
b · w g h t / 1 6 ˆ 0 / 1 6 ( ˆ 1 / 1 6 ) c i g s ( ˆ 2 / 1 6 ) f a m i n c
比较第1列与第2列。 (1)中被估参数/16= (2)中被估参数 (1)中被估参数的标准差/16= (2)中被估参数的标准差 (1)和(2)中 t 统计量相同 R平方相同 (1)中SSR/(16*16)= (2)中SSR (1)中SER(标准差)/16= (2)中SER
计量经济学多元线性回归
Yˆi ˆ0 ˆ1 X1i ˆ2 X 2i ˆki X Ki
i=1,2…n
• 根据最 小二乘原 理,参数 估计值应
该是右列
方程组的 解
ˆ
0
Q
0
ˆ1
Q
0
ˆ
2
Q
0
ˆ k
Q
0
n
n
其
Q ei2 (Yi Yˆi )2
i 1
i 1
中n
2
(Yi (ˆ0 ˆ1 X1i ˆ2 X 2i ˆk X ki ))
可以证明,随机误差项u的方差的无偏估 计量为:
ˆ 2
e
2 i
e e
n k 1 n k 1
2、极大似然估计
• 对于多元线性回归模型
易知 Yi ~ N (Xiβ , 2 )
• Y的随机抽取的n组样本观测值的联合概率
L(βˆ , 2 ) Y1,Y2 ,,Yn )
1
e
1 2
2
(Yi
(
ˆ0
ˆ1
i1
• 于是得到关于待估参数估计值的正规方程组:
((ˆˆ00(ˆ0ˆˆ11XX1ˆ1i1i X1ˆiˆ22i XXˆ222ii
X 2i ˆk ˆk X ki ˆk X ki
X ki) ) X 1i )X 2i
Yi Yi Yi
X 1i X 2i
(ˆ0 ˆ1 X 1i ˆ2 X 2i ˆk X ki ) X ki Yi X ki
ei称为残差或剩余项(residuals),可看成是 总体回归函数中随机扰动项ui的近似替代。
样本回归函数的矩阵表达:
Yˆ Xβˆ
其中:
ˆ0
βˆ
ˆ1
ˆ k
多元线性回归模型计量经济学
多重共线性诊断
通过计算自变量之间的相关系 数、条件指数等方法诊断是否
存在多重共线性问题。
异方差性检验
通过计算异方差性统计量、图 形化方法等检验误差项是否存
在异方差性。
03
多元线性回归模型的应用
经济数据的收集与整理
原始数据收集
通过调查、统计、实验等方式获取原始数据,确保数据的真实性 和准确性。
数据清洗和整理
在实际应用中,多元线性回归模型可能无法处理 非线性关系和复杂的数据结构,需要进一步探索 其他模型和方法。
随着大数据和人工智能技术的发展,多元线性回 归模型的应用场景将更加广泛和复杂,需要进一 步探索如何利用新技术提高模型的预测能力和解 释能力。
07
参考文献
参考文献
期刊论文
学术期刊是学术研究的重要载体, 提供了大量关于多元线性回归模 型计量经济学的最新研究成果。
学位论文
学位论文是学术研究的重要组成 部分,特别是硕士和博士论文, 对多元线性回归模型计量经济学 进行了深入的研究和探讨会议论文集中反映了多元线性回 归模型计量经济学领域的最新进 展和研究成果。
THANKS
感谢观看
模型定义
多元线性回归模型是一种用于描 述因变量与一个或多个自变量之 间线性关系的统计模型。
假设条件
假设误差项独立同分布,且误差项 的均值为0,方差恒定;自变量与 误差项不相关;自变量之间不存在 完全的多重共线性。
模型参数估计
最小二乘法
01
通过最小化残差平方和来估计模型参数,是一种常用的参数估
计方法。
05
案例分析
案例选择与数据来源
案例选择
选择房地产市场作为案例,研究房价 与影响房价的因素之间的关系。
计量经济学(2012B)(第二章多元线性回归)详解
2 2i
n
n
2 i
i ( yi ˆ1x1i ˆ2 x2i )
i 1
i 1
n
i yi
n
(
y
ˆ x
ˆ x
) y
i1
i
1 1i
2 2i
i
i 1
n
y 2
(ˆ
n
x
y
ˆ
n
x
y )
i1
i
1 i1 1i i
2 i1 2 i i
TSS ESS
2.5 单个回归参数的置信区间 与显著性检验
一、置信区间
H (4)
的拒绝域为:
0
F F (2, n 3)
(5) 推断:若
F F (2, n 3)
,则拒绝 H , 0
认为回归参数整体显著;
H 若 F F (2, n 3)
,则接受
,
0
认为回归参数整体上不显著。
回归结果的综合表示
yˆi 0.0905 0.426x1i 0.0084x2i
Sˆj : 或 t:
模型的估计效果. (5) 拟合优度与F 检验中的 F 统计量的关系是什么?这两个
量在评价二元线性回归模型的估计效果上有何区别? (6) 试比较一元线性回归与二元线性回归的回归误差,哪
个拟合的效果更好?
应用:
(1)预测当累计饲料投入为 20磅时,鸡的平均
重量是多少? yˆ 5.2415 f
(磅)
(2)对于二元线性回归方程,求饲料投入的边际生产率?
(0.1527) (0.0439)
(0.5928) (9.6989)
(0.0027) (3.1550)
R2 0.9855, R2 0.9831 , F 408.9551
计量经济学第三章第3节多元线性回归模型的显著性检验
当增加一个对被解释变量有较大影响的解释变量时, 残差平方和减小的比n-k-1 减小的更显著,拟合优度 就增大,这时就可以考虑将该变量放进模型。 如果增加一个对被解释变量没有多大影响的解释变量, 残差平方和减小没有n-k-1减小的显著,拟合优度会减 小,其说明模型中不应该引入这个不重要的解释变量, 可以将其剔除。
在对话框中输入:
y c x y(-1)
y c x y(-1) y(-2)
字母之间用空格分隔。 注:滞后变量不需重新形成新的时间序列,软件 自动运算实现,k期滞后变量,用y(-k)表示。
• 使用k期滞后变量,数据将损失k个样本观察值, 例如:
序号 2000 2001 2002 2003 2004 2005 2006 2007 2008 y 3 4 5 6 7 8 9 10 11 Y(-1) Y(-2) Y(-3)
2
2
2
*赤池信息准则和施瓦茨准则
• 为了比较所含解释变量个数不同的多元回归模型的 拟合优度,常用的标准还有: 赤池信息准则(Akaike information criterion, AIC) e e 2( k 1) AIC ln n n 施瓦茨准则(Schwarz criterion,SC)
一元、二元模型的系数均大于0,符合经济意义,三元模型 系数的符号与经济意义不符。 用一元回归模型的预测值是1758.7,二元回归模型的预测值 是1767.4,2001年的实际值是1782.2。一元、二元模型预测 的绝对误差分别是23.5、14.8。
3) 三个模型的拟合优度与残差
二元:R2 =0.9954,E2 ei2 13405 三元:R2 =0.9957,E3 ei2 9707
746.5 788.3
计量经济学复习笔记(四):多元线性回归
计量经济学复习笔记(四):多元线性回归⼀元线性回归的解释变量只有⼀个,但是实际的模型往往没有这么简单,影响⼀个变量的因素可能有成百上千个。
我们会希望线性回归模型中能够考虑到这些所有的因素,⾃然就不能再⽤⼀元线性回归,⽽应该将其升级为多元线性回归。
但是,有了⼀元线性回归的基础,讨论多元线性回归可以说是轻⽽易举。
另外我们没必要分别讨论⼆元、三元等具体个数变量的回归问题,因为在线性代数的帮助下,我们能够统⼀讨论对任何解释变量个数的回归问题。
1、多元线性回归模型的系数求解多元线性回归模型是⽤k 个解释变量X 1,⋯,X k 对被解释变量Y 进⾏线性拟合的模型,每⼀个解释变量X i 之前有⼀个回归系数βi ,同时还应具有常数项β0,可以视为与常数X 0=1相乘,所以多元线性回归模型为Y =β0X 0+β1X 1+β2X 2+⋯+βk X k +µ,这⾥的µ依然是随机误差项。
从线性回归模型中抽取n 个样本构成n 个观测,排列起来就是Y 1=β0X 10+β1X 11+β2X 12+⋯+βk X 1k +µ1,Y 2=β0X 20+β1X 21+β2X 22+⋯+βk X 2k +µ2,⋮Y n =β0X n 0+β1X n 1+β2X n 2+⋯+βk X nk +µn .其中X 10=X 20=⋯=X n 0=1。
⼤型⽅程组我们会使⽤矩阵表⽰,所以引⼊如下的矩阵记号。
Y =Y 1Y 2⋮Y n,β=β0β1β2⋮βk,µ=µ1µ2⋮µn.X =X 10X 11X 12⋯X 1k X 20X 21X 22⋯X 2k ⋮⋮⋮⋮X n 0X n 1X n 2⋯X nk.在这些矩阵表⽰中注意⼏点:⾸先,Y 和µ在矩阵表⽰式中都是n 维列向量,与样本容量等长,在线性回归模型中Y ,µ是随机变量,⽽在矩阵表⽰中它们是随机向量,尽管我们不在表⽰形式上加以区分,但我们应该根据上下⽂明确它们到底是什么意义;β是k +1维列向量,其长度与Y ,µ没有关系,这是因为β是依赖于变量个数的,并且加上了对应于常数项的系数(截距项)β0;最后,X 是数据矩阵,且第⼀列都是1。
计量经济学多元线性回归模型及参数估计
-973 1314090 1822500 947508
-929 975870 1102500 863784
-445 334050 562500 198381
-412 185580 202500 170074
-159 23910 22500 25408
28 4140 22500
762
402 180720 202500 161283
2.多元线性回归模型的基本假定(矩阵形式)
V
ar
Cov( N
)
E
N
E(N
)N
E(
N
)
E(
NN
)
1
E
n2 1
2
12
n
E
2 1
n1
12 22
n2
1n
2n
n2
2
0
0
0
2
0
2
I
0
0
2
2.多元线性回归模型的基本假定(矩阵形式)
E(X
N )
E
1 X 11
ei 0 X i1ei 0 X i2ei 0
X ik ei 0
(*) (*)或(**)是多 元线性回归模型正
(**) 规方程组的另一种 写法。
离差形式的样本回归方程
由于
Yˆi ˆ0 ˆ1Xi1 ˆ2 Xi2 ˆk Xik
[Yi (ˆ0 ˆ1Xi1 ˆ2 Xi2 ˆk Xik )] 0
????eemm??所以有???eem??mnnee???ee?????????????????????????????????????????????nnnnnnnnmmmmmmmmme??????????????2121222211121121????????????????????????????????????????nnnnnnnnnnmmmmmmmmme?????????????????21221122221121221111因为xxxxim?????1为对称等幂矩阵即mm??mmmm???2????????nnnnnnnnnnmmmmmmmmme?????????????????????????????22112222211211221111??nnnnnmmmememem??????????22112222222111?????1212122??????????????kntrtrtrmtr????????xxxxixxxxi其中符号tr表示矩阵的迹其定义为矩阵主对角线元素的和
计量经济学 实验3 多元回归模型
目录目录 (1)一、建立多元线性回归模型 (3)(一) 建立包括时间变量的三元线性回归模型; (3)1. 建立工作文件:CREATE A 78 94 (3)2. 输入统计资料:DATA Y L K (3)3. 生成时间变量t:GENR T=@TREND(77) (3)4. 建立回归模型:LS Y C T L K (3)(二) 建立剔除时间变量的二元线性回归模型; (4)(三) 建立非线性回归模型——C-D生产函数。
(5)二、比较、选择最佳模型 (8)(一) 回归系数的符号及数值是否合理; (8)(二) 模型的更改是否提高了拟合优度; (8)(三) 模型中各个解释变量是否显著; (8)(四) 残差分布情况 (8)实验三多元回归模型【实验目的】掌握建立多元回归模型和比较、筛选模型的方法。
【实验内容】建立我国国有独立核算工业企业生产函数。
根据生产函数理论,生产函数的基本形式为:()ε,tY=。
其中,L、K分别为生产过程中投入的劳动与资金,fL,K,时间变量t反映技术进步的影响。
表3-1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料;其中产出Y为工业总产值(可比价),L、K分别为年末职工人数和固定资产净值(可比价)。
资料来源:根据《中国统计年鉴-1995》和《中国工业经济年鉴-1995》计算整理【实验步骤】一、 建立多元线性回归模型(一) 建立包括时间变量的三元线性回归模型;在命令窗口依次键入以下命令即可:1. 建立工作文件: CREATE A 78 942. 输入统计资料: DATA Y L K3. 生成时间变量t : GENR T=@TREND(77)4. 建立回归模型: LS Y C T L K则生产函数的估计结果及有关信息如图3-1所示。
图3-1 我国国有独立核算工业企业生产函数的估计结果 因此,我国国有独立工业企业的生产函数为:K L t y 7764.06667.06789.7732.675ˆ+++-= (模型1)t =(-0.252) (0.672) (0.781) (7.433)9958.02=R 9948.02=R 551.1018=F 模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为0.6667,资金的边际产出为0.7764,技术进步的影响使工业总产值平均每年递增77.68亿元。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
β ( X X ) 1 E ( X XU μ)) β
这里利用了假设: E(X’u)=0
(3)有效性(最小方差性)
UU UU UU
其中利用了
ˆ ( X X) 1 X Y β
U) ( X X ) 1 X ( Xβ μ
β ( X X ) 1 X μ U
i 1 2 i i 1
n
ˆ ˆ X ˆ X ˆ X )) (Yi ( 0 1 1i 2 2i k ki
i 1
n
2
• 于是得到关于待估参数估计值的正规方程组:
ˆ ˆ X ˆ X ˆ X ) Y ( 0 1 1i 2 2i k ki i ˆ ˆ ˆ X ˆ X ) X Y X ( X 0 1 1i 2 2i k ki 1i i 1i ˆ ˆ ˆ X ˆ X ) X Y X ( 0 1 X 1i 2i 2i k ki 2i i 2i ˆ ˆ ˆ ˆ ( 0 1 X 1i 2 X 2 i k X ki ) X ki Yi X ki
ˆ ˆ X Y ˆ X X ˆ) (Y Y Y X ˆ
ˆ (Y X ) X Y [( X X ) X X ] ˆ 0 2 X Y 2 X X
得到: 于是:
ˆ XY XXβ
ˆ ( X X) 1 X Y β
i=1,2…n
ˆ e 其矩阵形式为: y xβ
其中 :
y1 y2 y y n
x11 x 21 x12 x 22 x x x 1n 2 n x k1 xk 2 x kn
即
ˆ ˆ X Y ˆ X X ˆ) 0 (Y Y Y X ˆ
补充: 设A为n阶 方 阵 , t和a均 为n维 向 量 , 则 有 ( 1 ) ( t At ) ( A A)t t (2 ) (a t ) ( t a ) a t t
解该(k+1) 个方程组成的线性代数方程组,即
$ , j 012 , , ,, k 。 可得到(k+1) 个待估参数的估计值 j
正规方程组的矩阵形式
n X 1i X ki
X X
1i 2 1i
X X X
ki
X
ki
X 1i
ˆ 1 1 0 ˆ X 11 X 12 1i ki 1 2 ˆ X X ki k k1 X k 2
第四章
经典单方程计量经济学模型: 多元线性回归模型
一、多元线性回归模型的概念 二、多元线性回归模型的估计 三、拟合优度 四、非线性关系的处理 五、假设检验 六、预测 七、参数的稳定性检验 八、虚拟变量
一、 多元线性回归模型的概念
1、多元线性回归模型
2、多元线性回归模型的基本假定
1、多元线性回归模型
总体回归模型n个随机方程的矩阵表达式为:
Y X U
其中
1 1 X 1
X 11 X 12 X 1n
X 21 X 22 X 2n
X k1 Y1 Y X k2 2 Y Yn n1 X kn n ( k 1 )
E(Yi | X1i , X 2i , , X ki ) 0 1 X1i 2 X 2i k X ki
表示:各变量X值固定时Y的平均响应。
j也被称为偏回归系数,表示在其他解释变
量保持不变的情况下,X j每变化1个单位时,Y的 均值E(Y)的变化; 或者说j给出了X j的单位变化对Y均值的 “直接”或“净”(不含其他变量)影响。
1 Y1 X 1n Y2 Y X kn n
即
ˆ X Y (X X) β
由于X’X满秩,故有 1 ˆ β ( X X) X Y
• 将上述过程用矩阵表示如下:
即求解方程组:
ˆ )(Y Xβ ˆ)0 (Y Xβ ˆ β
–
–
在经典模型中多应用OLS
在非经典模型中多应用ML
–
在本节中, ML为选学内容
1、普通最小二乘估计
• 对于随机抽取的n组观测值 (Yi , X ji ), i 1,2,, n, j 0,1,2, k 如果样本函数的参数估计值已经得到,则有:
ˆ ˆ X ˆ X ˆ X ˆ Y i 0 1 1i 2 2i ki Ki
ˆ e Y Xβ
其中:
ˆ 0 ˆ ˆ β 1 ˆ k
基本形式小结
总体回归函数 : E (Yi | X 1 X 1i ,..., X k X ki ) 0 1 X 1i ... k X ki 总体回归模型: Yi 0 1 X 1i ... k X ki ui ˆ ˆ X ... ˆ X ˆ 样本回归函数 : Y i 0 1 1i k ki ˆ ˆ X ... ˆ X e 样本回归模型: Yi 0 1 1i k ki i
ˆ ˆ X ˆ X ˆ X e 其随机表示式: Yi 0 1 1i 2 2i ki ki i
ei称为残差或剩余项(residuals),可看成是 总体回归函数中随机扰动项ui的近似替代。
样本回归函数的矩阵表达:
ˆ Xβ ˆ Y
或
e1 e2 e e n
n 2 n 2
1 2
e
ˆ ˆ X ˆ X ˆ X )) 2 ( Y ( i 0 1 1 i 2 2 i k ki 2
1 2
2
ˆ )( Y Xβ ˆ) ( Y Xβ
e
即为变量Y的似然函数 • 对数似然函数 为 *
L ln(L) n ln( 2 ) 1 2 ˆ )(Y X ˆ) ( Y X 2
同时,随着样本容量增加,参数估计量具有: 一致性。
(1)线性性
ˆ ( X X) 1 X Y CY β
其中,C=(X’X)-1 X’ 为一仅与固定的X有关的行 向量。
(2)无偏性
ˆ ) E (( X X ) 1 X Y ) E (β
U)) )) E (( X X ) 1 X ( Xβ μ
i=1,2…n
n
• 根据最 小二乘原 理,参数 估计值应 该是右列 方程组的 解
ˆ 0 ˆ 1 ˆ 2 ˆ k
Q 0 Q 0 Q 0 Q 0
其 中
ˆ )2 Q e (Yi Y i
对对数似然函数求极大值,也就是对
ˆ ) ( Y Xβ ˆ) (Y Xβ
求极小值。
• 因此,参数的极大似然估计为
ˆ ( X X) 1 X Y β
结果与参数的普通最小二乘估计相同。
3、参数估计量的性质
在满足基本假设的情况下,其结构参数的 普通最小二乘估计及最大或然估计仍具有: 线性性、无偏性、有效性。
正规方程组 的另一种写法
对于正规方程组
ˆ XY XXβ
ˆ X e X Xβ ˆ X Xβ
于是
Xe 0
(*)
或
e
i
i
0
ji i
X
e 0
(**)
(*)或(**)是多元线性回归模型正规方程组 的另一种写法。
样本回归函数的离差形式
ˆ x ˆ x ˆ x e yi 1 1i 2 2i k ki i
如果这些活动所用时间的总和为一周的总小时数168小 时。问:保持其它变量不变,而改变其中一个变量的说 法是否有意义?该模型是否有违背基本假定的情况?如 何修改此模型使其更合理?
二、多元线性回归模型的估计
1、普通最小二乘估计
2、极大似然估计
3、参数估计量的性质 4、样本容量问题
说 明
估计方法: 两大类方法:OLS、ML
e e ˆ n k 1 n k 1
2
2 e i
2、极大似然估计
• 对于多元线性回归模型 易知
Yi ~ N ( X i β , 2 )
• Y的随机抽取的n组样本观测值的联合概率
ˆ , 2 ) P (Y1 , Y2 , , Yn ) L (β 1 ( 2 ) n 1 ( 2 ) n
和
E(UU ) 2 I n
0 1 β 2 k
( k 1 )1
u1 u 2 U un n1
用来估计总体回归函数的样本回归函数为:
ˆ ˆ X ˆ X ˆ X ˆ Y i 0 1 1i 2 2i ki ki
多元线性回归模型:表现在线性回归模型中的 解释变量有多个。 一般表现形式:
i=1,2…,n
其中:k为解释变量的数目,j称为回归参数 (regression coefficient)。
习惯上:把常数项看成为一虚变量的系 数,该虚变量的样本观测值始终取1。于是: 模型中解释变量的数目为(k+1)
也被称为总体回归函数的随机表达形式。它 的 非随机表达式为:
例:利用下表数据,计算
ˆ 0
和
ˆ 1
售价X
销售量Q
2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0
41 38 34 32 29 28 25 22 20
9 36 269 X X 36 159 | X X | 135 X Y 999 1 159 36 ( X X ) 1 | X X | 36 9 ˆ 50.42222 0 ˆ X ) 1 X Y ( X 5.13333 ˆ 1