《计量经济学》第三章 多元线性回归模型
《计量经济学》第3章数据
《计量经济学》各章数据第3章 多元线性回归模型例3.1.1 经过研究,发现家庭书刊消费水平受家庭收入及户主受教育年数的影响。
现对某地区的家庭进行抽样调查,得到样本数据如表3.1.1所示,其中y 表示家庭书刊消费水平(元/年),x 表示家庭收入(元/月),T 表示户主受教育年数。
下面我们估计家庭书刊消费水平同家庭收入、户主受教育年数之间的线性关系。
回归模型设定如下: t t t t u T b x b b y +++=210(t =1,2, …)表3.1.1 某地区家庭书刊消费水平及影响因素的调查数据表例3.4.1根据表3.4.1给出的中国1980-2003年间总产出(用国内生产总值GDP度量,单位:亿元),劳动投入L(用从业人员度量,单位为万人),以及资本投入K(用全社会固定投资度量,单位:亿元),试建立我国的柯布——道格拉斯生产函数。
表3.4.1 1980-2003年中国GDP、劳动投入与资本投入数据例3.4.2 某硫酸厂生产的硫酸透明度一直达不到优质要求,经分析透明度低与硫酸中金属杂质的含量太高有关。
影响透明度的主要金属杂质是铁、钙、铅、镁等。
通过正交试验的方法发现铁是影响硫酸透明度的最主要原因。
测量了47组样本值,数据见表3.4.3。
试建立硫酸透明度(y)与铁杂质含量(x)的回归模型。
表3.4.3 硫酸透明度(y)与铁杂质含量(x)数据例3.4.3假设某企业在15年中每年的产量Y(件)和总成本X(元)的统计资料表3.4.7所示,试估计该企业的总成本函数模型。
表3.4.7 某企业15年中每年总产量与总成本统计资料3.6.1 案例1——中国经济增长影响因素分析根据表3.6.1给出的1980-2003年间总产出(用国内生产总值GDP度量,单位:亿元),最终消费CS(单位:亿元),投资总额I(用固定资产投资总额度量,单位:亿元),出口总额(单位:亿元)统计数据,试对中国经济增长影响因素进行回归分析。
计量经济学 多元线性回归模型及参数估计 ppt课件
i
)
i 1 n
E(X
ik i )
0 0 0
i1
i 1
i1
0
计量经济学 多元线性回归模型及参 数估计
二、多元线性回归模型的参数估计
1.普通最小二乘估计
随机抽取被解释变量和解释变量的n组样本观测值
X i 1 ,X i 2 , ,X i, Y k i i 1 , 2 , , n
则有
YX ˆe
其中
Y 1
Y
Y2
Y n
1 X 1
X11
X21
X12
X22
X1k X2k
1 Xn1
Xn2
Xnk
n(k1) 1
e
e2
e n
计量经济学 多元线性回归模型及参 数估计
2.多元线性回归模型的基本假定(见教材P64-65)
习惯上,把常数项看成为一个虚变量(记作Xio) 的系数,在参数估计过程中该虚变量的样本观测值 始终取1(即Xi0 ≡1)。
这样: 模型中解释变量的数目为(k+1)。
计量经济学 多元线性回归模型及参 数估计
• 多元线性回归模型的矩阵表达式为: 注意这里的符号
YX
和教材P63的对 应关系。
其中
Y
Y Y
一、多元线性回归模型及其基本假定 二、多元线性回归模型的参数估计 三、OLS参数估计量的统计性质 四、样本容量问题 五、多元线性回归模型实例
计量经济学 多元线性回归模型及参 数估计
一、多元线性回归模型及其基本假定
• 由于:
– 在实际经济问题中,一个变量往往受到多个原 因变量的影响;
– “从一般到简单”的建模思路。
秩(X)=k+1,即Xn×(k+1)为列满秩矩阵。
计量经济学-3章:多元线性回归模型PPT课件
YXβ ˆe
Y ˆ Xβ ˆ
4/5/2021
.
17
2 模型的假定
(1) 零均值假设。随机误差项的条件期望为零,即 E(ui)=0 ( i=1,2,…,n)
其矩阵表达形式为:E(U)=0 (2)同方差假设。随机误差项有相同的方差,即
Var(ui)E(ui2) 2 (i=1,2,…,n)
(3)无自相关假设。随机误差项彼此之间不相关,即
(i=1,2,…,n)
上式为多元样本线性回归函数(方程),简称样本回归函 数(方程)(SRF, Sample Regression Function).
ˆ j (j=0,1,…,k)为根据样本数据所估计得到的参数估计量。
4/5/2021
.
13
(4)多元样本线性回归模型
对应于其样本回归函数(方程)的样本回归模型:
4/5/2021
.
3
教学内容
一、模型的建立及其假定条件 二、多元线性回归模型的参数估计:OLS 三、最小二乘估计量的统计性质 四、拟合优度检验 五、显著性检验与置信区间 六、预测 七、案例分析
4/5/2021
.
4
回顾: 一元线性回归模型
总体回归函数 E (Y i|X i)01X i
总体回归模型 Y i 01Xiui
0 0
2 0 0 2
0
0
0 0 0 2
2I n
4/5/2021
.
u1un
u2un
un2
20
(4)解释变量X1,X2,…,Xk是确定性变量,不是随机 变量,与随机误差项彼此之间不相关,即
Cov(Xji,ui)0 j=1,2…k , i=1,2,….,n
计量经济学(第三章多元线性回归)
X
1i
X
2i
...
k
X
ki
( 2 ) 估 计 值 Y i 的 均 值 等 于 实 际 观 测 值 Y i的 均 值 ( 3 ) 剩 余 项 ( 残 差 ) e i的 均 值 为 0
( 4) 应 变 量 估 计 值 Y i 与 残 差 e i 不 相 关 ; ( 5) 解 释 变 量 X i 与 残 差 e i 不 相 关
第一节 第二节 第三节 第四节 第五节
多元线性回归模型及古典假定 多元线性回归模型的估计 多元线性回归模型的检验 多元线性回归模型的预测 实例
第一节 多元线性回归模型及 古典假定
主要介绍 1.1 多元线性回归模型及其矩阵表示 1.2 模型的古典假定
1.1.1 多元线性回归模型形式
一般形式(随机扰动形式,注意X的下 标):
j
( u i 正态 , Y 是 u i的线性函数
Y 正态,又
j
是 Y 的线性函数
j
正态)
2.4 随机扰动项方差的估计
扰动项的方差 估计:
2 2
ei
2
n k 1
其中n为样本容量,k为待估参数个数。 (比较:一元情形:
2
ei
2
n2
,待估参数有2个)
第三节 多元线性回归模型的 检验
Yi 0 1 X 1i 2 X 2 i ...... k X ki u i 模型中, ( j 1, 2, ..., k) 是 偏 回 归 系 数 : j 控制其他解释变量不变的条件下, 第 j个 解 释 变 量 的 单 位 变 动 对 应 变 量 平 均 值的影响。
计量经济学-3多元线性回归模型
2020/12/8
计量经济学-3多元线性回归模型
•第一节 概念和基本假定
•一、基本概念: • 设某经济变量Y 与P个解释变量:X1,X2,…,XP存在线性依
存关系。 • 1.总体回归模型:
•其中0为常数项, 1 ~ P 为解释变量X1 ~ XP 的系数,u为随机扰动项。 • 总体回归函数PRF给出的是给定解释变量X1 ~ XP 的值时,Y的期 望值:E ( Y | X1,X2,…,XP )。 • 假定有n组观测值,则可写成矩阵形式:
计量经济学-3多元线性回归模型
•2.样本回归模型的SRF
计量经济学-3多元线性回归模型
•二、基本假定: • 1、u零均值。所有的ui均值为0,E(ui)=0。 • 2、u同方差。Var(ui)=δ2,i=1,2,…,n
计量经济学-3多元线性回归模型
•
计量经济学-3多元线性回归模型
•
•第二节 参数的最小二乘估 计
•五、预测
•(一)点预测 •点预测的两种解释:
计量经济学-3多元线性回归模型
•(二)区间预测
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
•例5,在例1中,若X01=10,X02=10,求总体均值E(Y0|X0) 和总体个别值Y0的区间预测。
•
Yi=β0+β1Xi1+β2Xi2+ui
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
•三、最小二乘估计的性质
计量经济学-3多元线性回归模型
庞皓计量经济学第三章多元线性回归模型学习辅导
第三章 多元线性回归模型学习辅导一、本章的基本内容(一)基本内容图3.1 第三章基本内容(二)本章的教学目标在现实的计量经济分析中,事实上影响被解释变量的因素不止一个,通常会有多个影响因素;另外,即使我们的分析目的是仅考察某一个因素对被解释变量的影响,但为了得到该因素对被解释变量的“净”影响,也需要将其他影响因素作为“控制变量”,使其以显性形式出现在模型中,以提高模型估计精度。
因此,在对现实经济问题进行计量经济分析时,通常需要建立包含两个及两个以上解释变量的计量模型,此类模型称为多元回归模型。
多元回归模型是在简单回归模型理论基础上的扩展,其建模的理论基础、基本思路、模型估计等与一元回归模型基本一致,只是因解释变量增多,从而带来一些新的内容,比如模型整体显著性检验(F 检验)、修正的可决系数(2R )以及解释变量之间多重共线性等问题。
本章的教学目标是:深刻理解建立多元回归模型的目的;掌握多元线性回归模型估计、检验的理论与方法;熟练掌握多元线性回归EViews 输出结果的解释。
二、重点与难点分析1.对多元线性回归模型参数意义的理解多元线性回归模型的参数与简单线性回归模型的参数有重要区别。
在多元线性回归模型中,解释变量对应的参数是偏回归系数,表达的是控制其他解释变量不变的条件下,该解释变量的单位变动对被解释变量平均值的“净”影响。
为了更深刻理解偏回归系数,可以两个解释变量的多元线性回归模型为例加以说明1。
例如,被解释变量Y 与解释变量2X 和3X 都有关,如果分别建立模型:多元线性回归: 12233i i i i Y X X u b b b =+++简单线性回归 : 1221i i i Y a a X u =++由于Y 与3X 有关,可以作回归:1332i i i Y b b X u =++,若用OLS 估计其参数,并计算残差213333ˆˆˆi i i i i e Y b b X y b x =--=-,这里的2i e 表示除去3i X 影响后的i Y 。
计量经济学第三章多元线性回归模型习题
第三章练习题及参考解答3.1为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y ,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下:ii i X X Y 215452.11179.00263.151ˆ++-= t=(-3.066806) (6.652983) (3.378064)R 2=0.934331 92964.02=R F=191.1894 n=311)从经济意义上考察估计模型的合理性。
2)在5%显著性水平上,分别检验参数21,ββ的显著性。
3)在5%显著性水平上,检验模型的整体显著性。
练习题3.1参考解答:(1)由模型估计结果可看出:从经济意义上说明,旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。
平均说来,旅行社职工人数增加1人,旅游外汇收入将增加0.1179百万美元;国际旅游人数增加1万人次,旅游外汇收入增加1.5452百万美元。
这与经济理论及经验符合,是合理的。
(2)取05.0=α,查表得048.2)331(025.0=-t 因为3个参数t 统计量的绝对值均大于048.2)331(025.0=-t ,说明经t 检验3个参数均显著不为0,即旅行社职工人数和国际旅游人数分别对旅游外汇收入都有显著影响。
(3)取05.0=α,查表得34.3)28,2(05.0=F ,由于34.3)28,2(1894.19905.0=>=F F ,说明旅行社职工人数和国际旅游人数联合起来对旅游外汇收入有显著影响,线性回归方程显著成立。
3.2 表3.6给出了有两个解释变量2X 和.3X 的回归模型方差分析的部分结果:表3.6 方差分析表RSS 的自由度各为多少?2)此模型的可决系数和调整的可决系数为多少?3)利用此结果能对模型的检验得出什么结论?能否确定两个解释变量2X 和.3X 各自对Y 都有显著影响?练习题3.2参考解答:(1) 因为总变差的自由度为14=n-1,所以样本容量:n=14+1=15因为 TSS=RSS+ESS 残差平方和RSS=TSS-ESS=66042-65965=77回归平方和的自由度为:k-1=3-1=2残差平方和RSS 的自由度为:n-k=15-3=12(2)可决系数为:2659650.99883466042ES R TSS S === 修正的可决系数:222115177110.998615366042i ie n R n ky--=-=-=ᄡ--¥¥(3)这说明两个解释变量2X 和.3X 联合起来对被解释变量有很显著的影响,但是还不能确定两个解释变量2X 和.3X 各自对Y 都有显著影响。
计量经济学 第三章、经典单方程计量经济学模型:多元线性回归模型
第三章、经典单方程计量经济学模型:多元线性回归模型一、内容提要本章将一元回归模型拓展到了多元回归模型,其基本的建模思想与建模方法与一元的情形相同。
主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。
只不过为了多元建模的需要,在基本假设方面以及检验方面有所扩充。
本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。
与一元回归分析相比,多元回归分析的基本假设中引入了多个解释变量间不存在(完全)多重共线性这一假设;在检验部分,一方面引入了修正的可决系数,另一方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性F检验,并讨论了F检验与拟合优度检验的内在联系。
本章的另一个重点是将线性回归模型拓展到非线性回归模型,主要学习非线性模型如何转化为线性回归模型的常见类型与方法。
这里需要注意各回归参数的具体经济含义。
本章第三个学习重点是关于模型的约束性检验问题,包括参数的线性约束与非线性约束检验。
参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容,其中参数稳定性检验又包括邹氏参数稳定性检验与邹氏预测检验两种类型的检验。
检验都是以F检验为主要检验工具,以受约束模型与无约束模型是否有显著差异为检验基点。
参数的非线性约束检验主要包括最大似然比检验、沃尔德检验与拉格朗日乘数检验。
它们仍以估计无约束模型与受约束模型为基础,但以最大似然原χ分布为检验统计量理进行估计,且都适用于大样本情形,都以约束条件个数为自由度的2的分布特征。
非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。
二、典型例题分析例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为36.0.+=-10+094medufedu.0sibsedu210131.0R2=0.214式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分别为母亲与父亲受到教育的年数。
计量经济学第三章第3节多元线性回归模型的显著性检验
ˆ b ˆ X b ˆY ˆ b Y t 0 1 t 2 t 1 ˆ b ˆ X b ˆ Y b ˆY ˆ b Y
t 0 1 t 2 t 1
3 t 2
其中t为当前期变量,t-k称为k期滞后变量。
1) 使用软件估计模型
将之前已经建立的Workfile文件打开 点击菜单中的“Quick”→“Estimate Equations”
2
2
2
*赤池信息准则和施瓦茨准则
• 为了比较所含解释变量个数不同的多元回归模型的 拟合优度,常用的标准还有: 赤池信息准则(Akaike information criterion, AIC) e e 2( k 1) AIC ln n n 施瓦茨准则(Schwarz criterion,SC)
Yi b0 b1 X1i b2 X 2i bk X ki ui
样本回归方程为:
ˆ b ˆ X b ˆ X b ˆ X ˆ b Y i 0 1 1i 2 2i k ki
我们将Yi与其平均值Y之间的离差分解如下 ˆ ) (Y ˆ Y ) Y Y (Y Y
B)调整后的拟合优度(样本决定系数)
RSS n k 1 n 1 RSS R 1 1 TSS n 1 n k 1 TSS n 1 2 2 即,R 1 ( 1 R ) n k 1
2
说明:
n 1 “ ”与“1-R 2? 一增一减,此消彼长 n k 1 从而保证R 2不会随解释变量个数的变化产生大的波动。
在对话框中输入:
y c x y(-1)
y c x y(-1) y(-2)
字母之间用空格分隔。 注:滞后变量不需重新形成新的时间序列,软件 自动运算实现,k期滞后变量,用y(-k)表示。
计量经济学 詹姆斯斯托克 第3章 多元线性回归模型
i 2 i
10 21500 21500 53650000
1 X Y X1
1 X2
Y1 1 Y2 Yi 15674 X n X iYi 39468400 Yn
i i
638 1122 1155 1408 1595 1969 2078 2585 2530
ˆ 1
x y x
2 i
5769300 0.777 7425000
ˆ Y ˆ X 1567 0.777 2150 103 .172 0 0
因此,由该样本估计的回归方程(样本回归函数) 为:
i 1
n
2
ˆ ˆ X ˆ X ˆ X ))2 Q (Yi ( 0 1 1i 2 2i k ki
i 1
n
于是得到关于待估参数估计值的正规方程组:
ˆ ˆ X ˆ X ˆ X ) Y ( 0 1 1i 2 2i k ki i ˆ ˆ X ˆ X ˆ X ) X Y X ( 0 1 1i 2 2i k ki 1i i 1i ˆ ˆ X ˆ X ˆ X ) X Y X ( 0 1 1i 2i 2i k ki 2i i 2i ˆ ˆ ˆ ˆ ( 0 1 X 1i 2 X 2 i k X ki ) X ki Yi X ki
习惯上:把常数项看成为一个虚变量的系 数,该虚变量的样本观测值始终取1。这样: 模型中解释变量的数目为(k +1)。
Yi 0 1 X 1i 2 X 2 i k X ki i
也被称为 总体回归函数 的 随机表达形式 。它的 非随机表达式为:
计量经济学-多元线性回归分析
yi ˆ1 x1i ˆ2 x2i ˆk xki ei 其矩阵形式为
i=1,2…n
y xβˆ e
其中 :
y1
y
y2
yn
x11
x
x12
x 21
x 22
xk1 xk2
x1n x2n xkn
ˆ1
βˆ
ˆ 2
ˆk
在离差形式下,参数旳最小二乘估计成果为
模型中解释变量旳数目为(k)
模型:Yt 1 2t X 2t k X kt ut
也被称为总体回归函数旳随机体现形式。它 旳 非随机体现式为:
E(Yi | X 2i , X 3i , X ki ) 1 2 X 2i 3 X 3i k X ki
方程表达:各变量X值固定时Y旳平均响应。
0.17033
2.652155 0.0157
R-squared
0.9954 Mean dependent var
928.4909
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
βˆ (xx)1 xY
ˆ0 Y ˆ1 X 1 ˆk X k
⃟随机误差项旳方差旳无偏估计
能够证明,随机误差项旳方差旳无偏估计量为
ˆ 2 ei2 ee
nk nk
四、参数估计量旳性质
在满足基本假设旳情况下,其构造参数旳一般
最小二乘估计、最大或然估计及矩估计仍具有: 线性性、无偏性、有效性。
ˆ1
Байду номын сангаас
Q0
ˆ2
Q
计量经济学多元线性回归模型及参数估计
-973 1314090 1822500 947508
-929 975870 1102500 863784
-445 334050 562500 198381
-412 185580 202500 170074
-159 23910 22500 25408
28 4140 22500
762
402 180720 202500 161283
2.多元线性回归模型的基本假定(矩阵形式)
V
ar
Cov( N
)
E
N
E(N
)N
E(
N
)
E(
NN
)
1
E
n2 1
2
12
n
E
2 1
n1
12 22
n2
1n
2n
n2
2
0
0
0
2
0
2
I
0
0
2
2.多元线性回归模型的基本假定(矩阵形式)
E(X
N )
E
1 X 11
ei 0 X i1ei 0 X i2ei 0
X ik ei 0
(*) (*)或(**)是多 元线性回归模型正
(**) 规方程组的另一种 写法。
离差形式的样本回归方程
由于
Yˆi ˆ0 ˆ1Xi1 ˆ2 Xi2 ˆk Xik
[Yi (ˆ0 ˆ1Xi1 ˆ2 Xi2 ˆk Xik )] 0
????eemm??所以有???eem??mnnee???ee?????????????????????????????????????????????nnnnnnnnmmmmmmmmme??????????????2121222211121121????????????????????????????????????????nnnnnnnnnnmmmmmmmmme?????????????????21221122221121221111因为xxxxim?????1为对称等幂矩阵即mm??mmmm???2????????nnnnnnnnnnmmmmmmmmme?????????????????????????????22112222211211221111??nnnnnmmmememem??????????22112222222111?????1212122??????????????kntrtrtrmtr????????xxxxixxxxi其中符号tr表示矩阵的迹其定义为矩阵主对角线元素的和
计量经济学课件:第三章 多元线性回归模型
第三章 多元线性回归模型第一节 多元线性回归模型及基本假定问题:只有一个解释变量的线性回归模型能否满足分析经济问题的需要?简单线性回归模型的主要缺陷是:把被解释变量Y 看成是解释变量X 的函数是前提是,在其它条件不变的情况下,并且,所有其它影响Y 的因素都应与X 不相关,但这在实际情况中很难满足。
怎样在一元线性回归的基础上引入多元变量的回归? 看教科书第72—73页关于汽车销售量的影响因素的讨论。
一、多元线性回归模型的意义1、建立多元线性回归模型的意义,即一元线性回归模型的缺陷,多个主要影响因素的缺失对模型的不利影响。
在一元线性回归模型中,如果总体回归函数的设定是正确的,那么,根据样本数据得到的样本回归模型就应该有较好的拟合效果,这时,可决系数就应该较大。
相反,如果在模型设定时忽略了影响被解释变量的某些重要因素,拟合效果可能就会较差,此时可决系数会偏低,并且由于忽略了一些重要变量而对误差项的影响会加大,这时误差项会表现出一些违背假定的情况。
2、从一个解释变量到多个解释变量的演变。
一个生产函数的例子,一个商品需求函数的例子,(教材第74页)。
二、多元线性回归模型及其矩阵表示1、一般线性回归模型的数学表达式。
设 12233i ii k k ii Y XXXu ββββ=+++++i=1,2,3,…,n在模型表达式里,1β仍是截距项,它反映的是当所有解释变量取值为零时,被解释变量Y 的取值;j β(j=2,3,…,k )为斜率系数,它的经济含义:在其它变量不变的情况下,第j 个解释变量每变动一个单位,Y 平均增加(或减少)j β个单位,这就是所谓的运用边际分析法对多元变量意义下回归参数的解释。
因此,称j β为偏回归系数,它反映了第j 个解释变量对Y 的边际影响程度。
4、2、总体回归函数,即12233(|)i i i k ki E Y X X X X ββββ=++++3、样本回归函数,即12233ˆˆˆˆˆi i k k iY X X Xββββ=++++ 4、将n 个样本观测值代入上述表达式,可得到从形式上看,像似方程组的形式。
计量经济学-3多元线性回归模型
计量经济学
Y1 1 X11 X12 X1P 0 u1
Y2 Yn
1 1
X 21
X n1
X 22
X n2
X 2P
2
0
0 0
2
2I
计量经济学
3、u无自相关,Cov(ui,u j) E{[ui Eui ][u j Euj ]}
E(uiu j) 0 i j
4、解释变量X(j j 1,2,,p)与随机扰动项ui不相关,即Cov(X j,ui) 0
5、u服从正态分布,ui ~ N(0, 2)
E
(ˆ1
1 )(ˆ0
0
)
(ˆ1 1 )2
(ˆ1
1 )(ˆ P
P
)
(ˆP P )(ˆ0 0 ) (ˆP P )(ˆ1 1)
(ˆP P )2
计量经济学
Var(ˆ0 ) Cov(ˆ0 , ˆ1 ) Cov(ˆ0 , ˆP )
6、无多重共线。设(X i1,X i2,,X iP)为(X1,X 2,,X P)的第i个观测值,
1 X11 X12 X1P
记:
X
1 1
X 21
X n1
X 22
X n2
X2P
X nP
则:X为n (p 1)矩阵,且Rank(X) p 1
计量经济学
容易证明:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Yi 1 2 X 2i 3 X 3i ... k X ki ui
7
多元样本回归函数
Y 的样本条件均值表示为多个解释变量的函数
ˆ ˆ ˆ ˆ ˆ Yi 1 2 X 2i 3 X3i ... k X ki
或
ˆ ˆ ˆ ˆ Yi 1 2 X 2i 3 X3i ... k X ki ei
22
ˆ ˆ 因 2 是未知的,可用 2代替 2 去估计参数 β 的标
准误差:
ˆ ● 当为大样本时,用估计的参数标准误差对 β 作标 准化变换,所得Z统计量仍可视为服从正态分布 ˆ ●当为小样本时,用估计的参数标准误差对 β 作标
准化变换,所得的t统计量服从t分布: ˆ βk - βk t ~ t (n - k ) ^ ˆ SE( βk )
i i
i
e e 0 4.残差 ei 与 X 和
3.
i
e X
i
3i
ei X 2i 0
2i
X 3i 都不相关,即
ˆ 5.残差 ei 与 Yi 不相关,即
e Yˆ 0
i i
18
二、OLS估计式的性质-统计性质
OLS估计式(用矩阵表式) 1.线性特征:
ˆ = (X X)-1 X Y β
2 i
ˆ ei2 (Yi - Yi )2
ˆ X X ... X )]2 ˆ min e [Yi -(1 ˆ2 2i ˆ3 3i k ki
求偏导,令其为0:
( ei2 ) 0 ˆ
j
13
即 ˆ ˆ ˆ ˆ -2 Yi - (1 2 X 2i 3 X 3i ... ki X ki ) 0
var( 2 ) var( 3 ) x 2 2i x 23i ( x2i x3i )2 x 2 2i x 23i ( x2i x3i )2 x 2 2i x 2 3i 2 2
16
OLS估计量的方差和标准差
建立标准误的两个目的:区间估计和假设检验
自由度
统计量的自由度指可自由变化的样本观测值个数, 它等于所用样本观测值的个数减去对观测值的约 束个数。
29
可决系数的修正方法
总变差 TSS
(Yi Y )2 Yi 2
i 1 i 1
n
n
自由度为 n - 1
ˆ (Y i - Y )2= yi2 自由度为 k - 1 2 ˆ 2 剩余平方和 RSS (Yi - Y i ) ei 自由度为 n - k
三变量SRF:
ˆ ˆ ˆ 个值: Yi 1 2 X 2 3 X3 ei
ˆ ˆ ˆ ˆ 条件均值:Yi 1 2 X 2i 3 X 3i 模型中参数的意义是什么呢?
5
多元线性回归模型的一般形式
一般形式:对于有 k 个解释变量的线性回归模型
Yi 1 2 X 2i 3 X 3i ... k X ki ui
ˆ ˆ ˆ ˆ -2 X 2i Yi -(1 2 X 2i 3 X 3i ... ki X ki ) 0
e 0 X e 0
i 2i i
ˆ ˆ ˆ ˆ -2 X ki Yi -(1 2 X 2i 3 X 3i ... ki X ki ) 0
假定6:正态性假定
ui ~ N (0, σ )
2
11
第二节
多元线性回归模型的估计
本节基本内容:
● 普通最小二乘法(OLS) ● OLS估计式的性质 ● OLS估计的分布性质 ● 随机扰动项方差 2的估计 ● 回归系数的区间估计
12
一、普通最小二乘法(OLS)
最小二乘原则
剩余平方和最小: min
假定4:随机扰动项与解释变量不相关
i= j
2
0 (i j )
cov(i , X 2i ) cov(i , X 3i ) 0
10
假定5:无多重共线性假定
(多元中)
假定各解释变量之间不存在精确的线性关系
即不存在一组不全为零的 2 和 3 使得:
2 X 2i 3 X 3i 0
2 2
27
三变量的可决系数
可以证明:R
2
ˆ ˆ ˆ β 2 x2i yi β 3 x3i yi ... β k xki yi
y
2 i
特点:
多重可决系数是模型中解释变量个数的不减函数, 这给对比不同模型的多重可决系数带来缺陷,所以 需要修正。
28
修正的可决系数
思想
可决系数只涉及变差,没有考虑自由度。如果用 自由度去校正所计算的变差,可纠正解释变量个 数不同引起的对比困难。
2 ( yi x3i )( x2i ) - ( yi x2i )( x2i x3i ) 2 2 ( x2i )( x3i ) - ( x2i x3i )2
注意:
x
和 y 为 X,Y 的离差
15
OLS估计量的方差和标准差
建立标准误的两个目的:区间估计和假设检验
se( i ) var( i ) 1 X 2 2 x 23i X 32 x 2 2i 2 X 2 X 3 x2i x3i 2 var( 1 ) 2 2 2 n x 2i x 3i ( x2i x3i )
注意到 ˆ ˆ ˆ ˆ Yi -(1 2 X 2i 3 X 3i ... ki X ) ei
X e 0
ki i
14
OLS估计式
由上述正规方程,可得 二元回归中
ˆ ˆ ˆ 1 Y - β2 X 2 - β3 X3
ˆ 2
ˆ 3
2 ( yi x2i )( x3i ) - ( yi x3i )( x2i x3i ) 2 2 ( x2i )( x3i ) - ( x2i x3i )2
i 1,2,, n
其中
回归剩余(残差):
ˆ ei Yi - Yi
8
偏回归系数的理解
偏回归系数 j:控制其它解释量不变的条件下,第 j 个 解释变量的单位变动对应变量平均值的影响。 举例:儿童死亡率(CM)对人均GNP(PGNP)和妇 女识字率(FLR)回归,2 的含义
CMi 1 2 PGNP 3 FLRi i i
3
第一节 多元线性回归模型及古典假定
本节基本内容:
一、三变量回归模型 二、多元线性回归中的基本假定 三、偏回归系数的含义
4
三变量回归模型
三变量PRF: 个值:
Yi 1 2 X 2 3 X 3 ui
条件均值: E(Yi | X 2i , X 3i ) 1 2 X 2i 3 X 3i
计量经济学
第三章 多元线性回归模型
1
第三章 多元线性回归模型
本章主要讨论:
●多元线性回归模型及古典假定 ●多元线性回归模型的估计 ●多元线性回归模型的检验 ●多元线性回归模型的预测
2
简单与多元线性回归分析的异同:
●相同点: PRF与SRF的关系; 经典线性回归假定(CLRM); i 的假定 OLS估计思想及其估计值的性质 区间估计及其单个参数的显著性检验; 预测 ●不同点(或新增的内容): 多元偏回归系数的理解; 可决系数与修正的可决系数; 回归模型的显著性检验; 受约束的检验; 模型设定的初探
考虑三变量的PRF 假定1:零均值假定
Yi 1 2 X 2i 3 X 3i i
E(i | X 2i , X 3i ) 0
假定2和假定3:同方差和无自相关假定
Cov(ui , u j ) E[(ui - Eui )(u j - Eu j )] E(uiu j )
ˆ ˆ ˆ ˆ ˆ Y i = β1+ β2 X 2i + β 3 X 3i +...+ β k X ki
多重可决系数也可表示为
ESS TSS- RSS R 12 TSS (Yi - Y ) TSS yi2
2
26
ˆ (Yi - Y )2
ei2
三变量的可决系数
ei yi 2 yi x2i 3 yi x3i 2 2 2 yi yi ei 2 2 2 yi yi yi 2 yi x2i 3 yi x3i 2 ESS yi 2 yi x2i 3 yi x3i ESS 2 yi x2i 3 yi x3i 2 R 2 TSS yi
^
tα 2 (n - k )] 1- α
( j 1,..., k )
或:
2
2
ˆ ˆ ˆ ˆ P[ β j - tα σ c jj β j β j tα σ c jj ] 1- α
2 2
ˆ ˆ ˆ ˆ 或表示为: β j ( β j - t 2( n-k ) σ c jj , β j t 2( n-k ) σ c jj )
24
第三节
多元回归的拟合优度
本节基本内容:
● 多元可决系数R2与复相关系数R ● R2及修正的R2 ● R2的比较
25
一、多元回归的拟合优度
多重可决系数:在多元回归模型中,由各个解释变量联合 解释了的 Y 的变差,在 Y 的总变差中占的比重,用 R 2 表 示 ˆ 与简单线性回归中可决系数 R 2 的区别只是 Yi 不同,多元 回归中
2.无偏特性:
ˆ E( βk ) βk
19
3. 最小方差特性
ˆ 在 βk 所有的线性无偏估计中,OLS估计 βk 具有
最小方差 结论:在古典假定下,多元线性回归的 OLS估计 式是最佳线性无偏估计式(BLUE)