第三章多变量回归分析(计量经济学南开大学)
南开大学计量经济学课件回归方程的变量和形式
检验判断1994年之前和之后两段时期消费函数是否产生显著的
差异。
7.2 模型的稳定性检验
2、Chow预测检验
Chow预测检验是先对包含前T1个观察值的子样本 建立模型,然后用这个模型对后T2个观察值的自变量 进行预测,如果实际值与预测值有很大变动,就可以 怀疑模型中存在结构性变化。T1 和T2的相对大小,没 有确定的规则,可能根据如战争、石油危机、经济改 革等明显的转折点来确定,如果不存在这样明显的转 折点,常用的方法是用85%-90%的数据进行估计,剩 余的数据进行检验。
7.2 模型的稳定性检验
1、Chow断点(Breakpoint)检验
实例一:估计C-D函数 log(Y ) 0 1 log(L) 2 log(K )
(1)1929-1967年数据估计如下 log(Y ) 3.938 1.451log(L) 0.384log(K )
R 2 0.9946 , R 2 0.9943 , RSS 0.0434 (2)分1929-1948和1949-1967两段数据估计如下 log(Y ) 4.058 1.617log(L) 0.220log(K )
3、冗余(Redundant)变量检验
检验一部分变量的统计显著性,通过判断方程中一
部分变量系数是否与0没有显著差异,决定是否从方程 中剔除这些变量,检验方法可以通过F检验和似然比 (LR)检验。 冗余变量检验是遗漏变量检验逆过程。
Eviews实现过程:
View-Coefficient Tests-Redundant Variables-
7.2 模型的稳定性检验
1、Chow断点(Breakpoint)检验(邹至庄断点检验) 思想:对每个子样本单独拟合方程,并与对于全部样本 拟合方程进行比较,来观察每个子样本的估计方程是否 有显著差异,判断是否存在结构变化。 零假设:两个子样本拟合的方程无显著差异。即结 构没有发生变化。 如果拒绝零假设,则代表有显著差异,意味着模型 中存在结构变化。
南开计量经济学课件 (3)
下面介绍几种典型的可以做线性化处理的非线性模型。
(1)多项式函数模型(1)
多项式方程
(第3版教材第90页)
案例4 :钉螺存活率曲线(file:nonli3)(生长曲线模型)
100
Y 80
60
40
20
T
0
0
2
4
6
8
10
12
案例4:钉螺存活率曲线(file:nonli3)(生长曲线模型)
钉螺存活率样本值与拟合值。
100 Y YF
80
60
40
20
T
0
2
4
6
8
10
12
点预测:当t = 6.5月时
yˆt
101 1 e4.310.76536.5
还原,Lny = Ln(7.33) + 104.5 (1/x) 104.5( 1 )
y 7.33e x
(6) 幂函数模型(全对数模型)
(b > 1)
(b = -1) (b < -1)
(0<b <1)
(0 > b > -1)
yt axt b eut
b取不同值的图形分别见上图。对上式等号两侧同取对数,得
(4) 生长曲线 (logistic) 模型(与教材中的模型稍异,称S曲线)
Y k
Y k
k/2
0
0
(lnb)/a
t
t
第三章多变量回归分析(计量经济学南开大学)
根据残差的平方和最小化的原理,解出参数的估计量。 ˆ ˆ X ˆ X )2 ˆ i2 (Yi 残差平方和RSS u 1 2 2i k ki
ˆ 'u u ˆ u ˆ Y Xβ ˆ ˆ Y Xβ u ˆ )' ( Y Xβ ˆ) ˆ i2 u ˆ ' u ( Y Xβ RSS u ˆ ' X' Y β ˆ ' X' Xβ ˆ Y' Y β ˆ ' X' Y Y ' Y 2β
ˆ 2代替 2,则 如果 2未知,以 2 1 ˆ )的估计量为: ˆ( Var Cov(β X' X)
2 1 1 ˆ 的标准差Se(β ˆ )为 ˆ( ˆ β X' X) (X' X)
ˆ 的性质: 四、OLS估计量 β
1 、线性 1 ˆ ( β [ X' X) X' ]Y 2、无偏性 ˆ] β E[β 3、最小方差性 ˆ 具有Var (β ˆ )最小。 OLS估计量β
X X X X
2i 2 2i 3i
2i
X X X X
3i 2i 2
3i
3i
X X X X X
ki
X ki X 2i 1 X 22 X 32 X k2 1 X 23 X 33 X 3k
X ki X 3i
ˆ 1 ˆ 2i ki ˆ2 3i ki 3 2 ˆ X ki k
二、 的估计量
2 ˆ u i
ˆ ' X' Y β ˆ ' X' Xβ ˆ ˆ Y' Y 2β u ˆ u ˆ 0 2 X' Y 2 X' Xβ
第二章 双变量回归分析(计量经济学,南开大学)
ˆ 和 ˆ 1 2
i
为Yi的线性函数
i 2 i
ˆ
2
xY x
(
xi )Yi 2 x i
k Y
i
i
其中k i
xi xi2 1 xi2
ki k i2
x
2
i
0
2 xi
1 xi2 1 xi2
i
1 xi2
6、样本回归函数(SRF) 由于在大多数情况下,我们只知道变量值得一个样本,要用样本信息的基础 上估计PRF。(表) 样本1
X(收入) Y(支出) 80 55 100 65 120 79 140 80 160 102 180 110 200 120 220 135 240 137 260 150
样本2
ˆ ) VAR( 2
x
2 i
2
2 i
x
ˆ: 对于 1
ˆ Y ˆ X 1 ˆ X Yi 1 2 2 n 1 ˆ X ( 1 2 X i ui ) 2 n u 1 i X k i ui n ˆ ) E[( ui X 方差:VAR( k i ui ) 2 ] 1 n
ˆ ) E( ki E (ui ) 2 2 2 ˆ Y ˆ X 1 2 ( 1 2 X i ui ) ( 1 k i u i ) X 1 u i X k i u i ˆ ) E( 1 1
1 1 2 21
估计量(Estimator):一个估计量又称统计量(statistic),是指一个规则、公式 或方法,以用来根据已知的样本所提供的信息去估计总体参数。在应用中,由估 计量算出的数值称为估计(值)(estimate)。 样本回归函数SRF的随机形式为:
南开大学计量经济学练习题(含答案)
第1章绪论习题一、单项选择题1.把反映某一总体特征的同一指标的数据,按一定的时间顺序和时间间隔排列起来,这样的数据称为()A. 横截面数据B. 时间序列数据C。
面板数据 D. 原始数据2.同一时间、不同单位按同一统计指标排列的观测数据称为()A.原始数据 B.截面数据C.时间序列数据 D.面板数据3.用计量经济学研究问题可分为以下四个阶段( )A.确定科学的理论依据、建立模型、模型修定、模型应用B.建立模型、估计参数、检验模型、经济预测C.搜集数据、建立模型、估计参数、预测检验D.建立模型、模型修定、结构分析、模型应用4.下列哪一个模型是计量经济模型( )A。
投入产出模型 B.数学规划模型C.包含随机变量的经济数学模型D.模糊数学模型二、问答题1.计量经济学的定义2.计量经济学的研究目的3.计量经济学的研究内容习题答案一、单项选择题1.B 2.B 3.B 4.C二、问答题1.答:计量经济学是统计学、经济学、数学相结合的一门综合性学科,是一门从数量上研究物质资料生产、交换、分配、消费等经济关系和经济活动规律及其应用的科学2.答:计量经济学的研究目的主要有三个:(1) 结构分析。
指应用计量经济模型对经济变量之间的关系作出定量的度量。
(2) 预测未来。
指应用已建立的计量经济模型求因变量未来一段时期的预测值。
(3) 政策评价。
指通过计量经济模型仿真各种政策的执行效果,对不同的政策进行比较和选择。
3.答:计量经济学在长期的发展过程中逐步形成了两个分支:理论计量经济学和应用计量经济学。
理论计量经济学主要研究计量经济学的理论和方法.应用计量经济学将计量经济学方法应用于经济理论的特殊分支,即应用理论计量经济学的方法分析经济现象和预测经济变量。
2一元线性回归模型习 题一、单项选择题1.最小二乘法是指( ) A 。
使()∑=-nt ttYY 1ˆ达到最小值 B 。
使ˆmin i iY Y -达到最小值 C. 使tt Y Y ˆmax -达到最小值 D. 使()21ˆ∑=-nt t t Y Y 达到最小值2. 在一元线性回归模型中,样本回归方程可表示为( ) A. 01i i i Y X u ββ=++ B.01ˆˆˆi i i Y X e ββ=++ C . 01ˆˆˆi i Y X ββ=+ D. ()01i iE Y X ββ=+3.线设OLS 法得到的样本回归直线为01ˆˆi i i Y X e ββ=++,以下说法不正确的是( )A .0=∑i e B .0),(≠i i e X COVC .Y Y =ˆD .),(Y X 在回归直线上4.对样本的相关系数γ,以下结论错误的是( )A. γ越接近0, X 与Y 之间线性相关程度高B.γ越接近1,X 与Y 之间线性相关程度高C. 11γ-≤≤D 、0γ=,则X 与Y 相互独立二、多项选择题1.最小二乘估计量的统计性质有( )A. 无偏性B. 线性性 C 。
第3章_双变量回归模型: 计量经济学-古扎拉蒂 教学课件_834
vauir|(Xi)E[ui E(ui)|Xi]2
E(ui2|Xi)2
f(u)
0
Y
X1
X2
X3
X4
X 同方差性:Var(ui|Xi)= Var(uj|Xj),i≠j
3.2经典线性回归模型
• 最小二乘法的基本假定
– 假定5:各个干扰之间无自相关
E (Yi X i ) 0 1 X i Var (Yi | X i ) 2
Cov (Yi , Y j ) 0 (i j )
Yi ~ N ( 0 1 X i , 2 )
3.3最小二乘估计的精度或标准 误差
方差:
var(ˆ2)
2
xi2
var( ˆ1 ) n
X
2 i
x
2 i
2
标准误:
3.2经典线性回归模型
• 最小二乘法的基本假定
– 假定7:观测次数n必须大于待估计的参数个 数.即观测次数n必须大于解释变量的个数
– 假定8:X值要有变异性 – 假定9:正确地设定了回归模型. – 假定10:没有完全的多重共线性.
3.2经典线性回归模型
• 由于被解释变量 Yi分布的性质决 定于ui ,因而对 ui的各项假定也 适用于 Yi,从而 有:
se(ˆ2)
xi2
se ( ˆ1 )
n
X
2 i
x
2 i
3.4最小二乘法回归线性质
• 回归线的性质
1. 它是通过Y和X的样本均值的一条直线. 2. 估计的Y(即 Yˆi )的期望值等于实测的Y的期望值. 3. 残差的期望值为零. 4. 残差和预测的Yi值不相关. 5. 残差和Xi不相关.
南开大学计量经济学期末复习重点
ˆ 1
( xt x )( y t y ) , ( xt x ) 2
ˆ y ˆ x 0 1
第2章 一元线性回归模型
2.3 OLS 回归函数的性质
ˆt = 0 (1) 残差和等于零, u
ˆ + ˆ xt 过( x , y )点。 ˆt = (2) 估计的回归直线 y 0 1 ˆt = y 。 (3) yt 的拟合值的平均数等于其样本观测值的平均数, y ˆ 和 ˆ 的特性 2.4 最小二乘估计量 0 1
(1)线性特性, (2)无偏性, (3)最小方差性, (4)一致性。 Gauss-Marcov 定理:若 ut 满足 E(ut) = 0,D(ut) = 2,那么用 OLS 法得到的估计量就具有最佳线性无偏性。估计量称最佳线 性无偏估计量。
第2章 一元线性回归模型
分清 4 个式子的关系。 (1) 真实的统计模型,yt = 0 + 1 xt + ut
第2章 一元线性回归模型
2.1 一元线性回归模型 yt = 0 + 1 xt + ut 模型分为两部分。 (1)回归函数部分,E(yt) = 0 + 1 xt,(2)随机部分 ut 。 对模型解释变量和误差项 ut 做出如下假定。 (14) ut N (0,
)。(5) ui 非自相关。(6) xi 是非随机的。
1 T 1 T
T
=
Cov( x t , y t ) D( x t ) D( y t )
。
=
t 1 ( xt x )( y t y )
T
t 1 ( xt x ) 2
1 n -1
1 T
n
四计量经济学多变量回归分析模型
n
2
Min[Yi ( 0 1 X 1i ... p X pi )]
i 1
n
^
^
^
2
• 根据最 小二乘原 理,参数 估计值应 该是右列 方程组的 解
ˆ 0 ˆ 1 ˆ 2 ˆ k
ˆ ˆ X ˆ X ˆ X ˆ Y i 0 1 1i 2 2i ki Ki
2 ˆ Q e (Yi Yi ) i 1 2 i i 1 n n
i=1,2…n
其 中
ˆ ˆ X ˆ X ˆ X )) (Yi ( 0 1 1i 2 2i k ki
1 Y1 X 1n Y2 Y X kn n
0 1 β 2 k
X 11 X 12 X 1n
X 21 X X kn n ( k 1 )
( k 1 )1
1 μ 2 n n 1
用来估计总体回归函数的样本回归函数为:
ˆ ˆ X ˆ X ˆ X ˆ Y i 0 1 1i 2 2i ki ki
ˆ ˆ X ˆ X ˆ X e 其随机表示式: Yi 0 1 1i 2 2i ki ki i
ei称为残差或剩余项(residuals),可看成 是总体回归函数中随机扰动项i的近似替代。
表示:各变量X值固定时Y的平均响应。
j也被称为偏回归系数,表示在其他解释变
量保持不变的情况下,X j每变化1个单位时,Y的 均值E(Y)的变化; 或者说j给出了X j的单位变化对Y均值的 “直接”或“净”(不含其他变量)影响。
最新南开大学《计量经济学》案例分析
南开大学《计量经济学》案例分析南开大学《计量经济学》案例分析案例一:用回归模型预测木材剩余物(file:b1c3)伊春林区位于黑龙江省东北部。
全区有森林面积218.9732万公顷,木材蓄积量为2.324602亿m3。
森林覆盖率为62.5%,是我国主要的木材工业基地之一。
1999年伊春林区木材采伐量为532万m3。
按此速度44年之后,1999年的蓄积量将被采伐一空。
所以目前亟待调整木材采伐规划与方式,保护森林生态环境。
为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。
因此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。
下面,利用一元线性回归模型预测林区每年的木材剩余物。
显然引起木材剩余物变化的关键因素是年木材采伐量。
给出伊春林区16个林业局1999年木材剩余物和年木材采伐量数据如表1.1。
散点图见图1.1。
观测点近似服从线性关系。
建立一元线性回归模型如下:y t = β0 + β1 x t + u t表1.1 年剩余物y t和年木材采伐量x t数据林业局名年木材剩余物y t(万m3)年木材采伐量x t(万m3)乌伊岭26.13 61.4 东风23.49 48.3 新青21.97 51.8 红星11.53 35.9 五营7.18 17.8 上甘岭 6.80 17.0 友好18.43 55.0 翠峦11.69 32.7 乌马河 6.80 17.0 美溪9.69 27.3 大丰7.99 21.5 南岔12.15 35.5 带岭 6.80 17.0 朗乡17.20 50.0 桃山9.50 30.0 双丰 5.52 13.8 合计202.87 532.00图1.1 年剩余物y t和年木材采伐量x t散点图图1.2 EViews输出结果EViews估计结果见图1.2。
在已建立Eviews数据文件的基础上,进行OLS估计的操作步骤如下:打开工作文件,从主菜单上点击Quick键,选Estimate Equation 功能。
南开大学经济学院历年本科计量经济学期末试卷及答案解析汇编
3
答案勘误表
2002 年第一学期计量经济学期末开卷试题答案
第一大题,第 1 小题: 第二空答案是 118.634 应改为 118.6377; 第三空答案是 0.0384 应改为 0.04034 第五大题,第 1 小题: 因为是对 Dyt 建模,所以答案应从 ARIMA 模型改为 ARMA 模型 第五大题,第 3 小题: ˆ1996 带入有 误,原答 案代入的 是 1997 年的-0.00127,应该代入 1996 年 的 u 0.00179, 并且题目要求是求 Dyt 值,答案求的是 yt 值,由于题目没有给出 y1997 , 所以 y1998 是求不出来的
Prob. 0.0044 0.0000 7.430699 1.021834 -6.336402 -6.237663 14074.12 0.00000
1.在空白处填上相应的数字(共 4 处) (计算过程中保留 4 位小数) (8 分) 2.根据输出结果,写出回归模型的表达式。 (5 分)
3.给定检验水平α=0.05, 检验上述回归模型的临界值 t0.025=_______, F0.05=_______; 说明估计参数与回归模型是否显著?(6 分)
四、给出结构模型(共 20 分)
Ct=α0 +α1Yt+α2Ct-1+ u1t It=β0+β1Yt+β2Yt-1+β3rt+ u2t Yt=Ct+It+Gt
其中 C—总消费,I—总投资,Y—总收入,r—利率,G—政府支出 1.写出模型中的内生变量、外生变量、预定变量。 (5 分)
2.讨论联立方程模型的识别问题。 (10 分)
ˆ =e 0 3. A 4.因为使用的样本为横截面数据,随机误差项可能存在异方差;变量 L 和 K 之间可能存在 较严重的多重共线性。
南开大学《计量经济学》复习资料
回答如下问题。 (1)对模型残差进行 DW 检验。 (检验水平 0.05,临界值:DL=1.26,DU =1.44) = 。 (2)如果存在一阶自相关,写出广义差分变量计算公式。 (3)根据如下 Dgdp 对 Dinvest 回归结果,写出模型估计式,并表示成 Dgdp 的自回归分布滞 后形式。
【答】 (1)DW = 0.9 < DL = 1.26,所以模型残差存在一阶正自相关。 (4 分) (2)GYt = Dgdpt - 0.55 Dgdpt-1, GXt = Dinvestt - 0.55 Dinvestt-1 (4 分) (3)模型的回归结果为: (8 分)
43.9376 41.9222 35.4311 41.9222/ 737
(3 分) (3 分)
5
(5) 、0.0318 - 0.0973 = -0.0655
2.根据计算机输出结果,写出一元回归模型表达式。 【答】 NER = 0.0972 + 0.0035 RATE
(4 分) 。
(9.2) (6.0) R2 = 0.046, T = 739 3.你认为上述回归式用考虑自相关问题吗? 不必考虑自相关 (2 分) 4.异方差的 White 检验式估计结果如下,
(2003) (1998)
【答】 (1) 1997 年的东南亚金融危机和 2003 年的非典分别导致外国入境旅游人数出现下降。 4 分) ( (2)设定的模型是: Lnyt 0 1t 2 D1 3 D2 ut 其中: D2 1 0
2003年 其他年份
, D1 1
本科《计量经济学》课程期末复习
1.闭卷考试. 2.熟知EViews输出结果和所要求掌握的内容要 点,不考计算机操作。 3.重点考试内容已经发给同学们了(复习大纲) 4. 数学推导会考一些, 所以同学们在复习第二和 第三章的时候一定要花一些时间 5. 考试的重点和往年类似,所以同学们一定要对 往年的试卷作出熟练的理解 6. 大家复习辛苦了!
计量经济学笔记(1-9章)
引言计量经济学建模方法:1)理论或假设的陈述;2)理论的数学模型的设定;3)理论的计量经济模型的设定;4)获取资料;5)计量经济模型的参数估计;6)假设检验;7)预报或预测;8)利用模型进行控制或制定政策。
第一章回归分析的性质1、回归分析:研究一个叫应变量的变量对另一个或多个叫做解释变量的变量的依赖关系,其用意在于通过后者的已知或设定值,去估计和预测前者的均值。
2、虚拟变数:定性变量或范畴变量。
3、时间序列数据:一个变量在不同时间取值的一组观测结果。
4、横截面数据:一个或多个变量在同一时间点上收集的数据。
5、实验资料:在保持一些因素不变的情况下收集数据。
、6、非实验资料:收集的资料不受研究者控制。
、7、回归分析的主要用意,是分析一个叫做应变量的变量,对另一个或多个叫做解释变量的变量的统计依赖性,这种分析的目的,是要在解释变量已知或固定值的基础上,估计和预测应变量的均值,实际上,回归分析的成功有赖于适用资料的获得。
、、第二章 双变量回归分析:一些基本概念1、总回归函数(PRF ):)()(i i X f X Y E =它仅仅表明在给定i X 下Y 分布的均值与i X 有函数关系,换句话说,他说出应变量的均值或平均值是怎样随解释变量变化的。
在几何意义上,总体回归曲线就是解释变量给定值时应变量的条件均值或期望值的轨迹。
、i i X X Y E 21)/(ββ+=:称为线性总体回归函数或简称线性总体回归。
2、PRF 的随机设定)/(i i i X Y E Y u -= 或 i i i u X Y E Y +=)/(i u 称为随机干扰项或随机误差。
是从模型中省略下来的而又集体地影响这应变量的全部变量的替代物。
)/(i X Y E 这一个成分被称为系统性或确定性成份;i u 为随机或非系统性成分。
若i i X X Y E 21)/(ββ+=ii i u X Y ++=21ββ3、随机干扰项的意义 1)理论的模糊性。
回归分析(计量经济学南开大学)
⑦预报和预测 如果计量模型可以接受,就可用来对因变量进行预测。假定1994年,美国的GDP
预计为6万亿美元,则该年的消费支出预计为
Y 231.80.71946000 4085
三、计量经济学的内容
01
控制或政策制定
55
X
80 100 120 140 160
二、统计关系与确定关系 在回归分析中,得到因变量与自变量之间的依赖关系是统计依赖关系,而不是确
定关系或函数关系。
三、回归与因果关系 回归分析得到的变量间的统计依赖关系,统计关系式自身不代表任何确定的因果
关系。
四、计量经济分析使用的数据 有三类。
(1)时间序列数据。一个时间序列是对一个变量在不同时间取的一组观测结果。这些 数据可以按固定的时间间隔收集。
加拿大
0.9
智 利
12.3
墨西哥
3.6
秘 鲁
-1.7
美国
2.7
中 国
14.2
(3)混合数据。
香港
6.3
日本
1
国家和地区
实际GDP增长率
1992年
1993年
1994年
1995年
1996 年
1997 年
1998年
加拿大 智利
墨西哥 秘鲁 美国 中国 香港 日本
0.9 12.3 3.6 -1.7 2.7 14.2 6.3 1.0
二、计量经济学的方法
基本过程:
经济理论
理论的数学模 型
理论的计量经 济学模型
数据的收集整 理
计量经济模型 的参数估计
假设检验
南开大学计量多元线性回归异方差问题
和为
2
wi2
2
i
wi2
yi b0b1xi
获得的估计量就是加权最小二乘估计量。对于多元线性回
归模型y=Xβ+u,令权数序列wi =1/i ,W为N×N对角矩 阵,对角线上为wi ,其他元素为0。则变换后的模型为
Wy WX Wu
(一)加权最小二乘法
方差未知的情形 (1)误差方差与xi成比例
(3)其他的与自变量xi的加权形式f(xi)
f xi r0 r1xi
(一)加权最小二乘法
方差未知的情形
Var
(
)
i
2 i
2
r
0
r
1x
i
y i
b0
b1xi
r0 r1xi r0 r1xi r0 r1xi
i
r0 r1xi
Var
i
1 Var
r 0 r1xi r 0 r1xi
下这个回归的R平方Ru22 。
4、检验零假设是
H0 :1 2 k 0
对方程(2)进行F检验,或计算LM统计量进行检验。
LM
n
•
R2 u2
~
2 k
(三)戈里瑟检验
1、通常拟合
e
和
X
之间的回归模型:
j
e
X
l j
根据图形中的分布选择
l 1,1或 1 2
2、再检验零假设 =0(不存在异方差)。如果零假设
纠正异方差性的一个可行程序
(1)将y对x1, x2,…xk做回归并得到残差u; (2)将残差进行平方,然后再取自然对数而得到log(u2); (3)做log(u2)对x1, x2,…xk的回归并得到拟合值g; (4)求拟合值的指数:h=exp(g) (5)以1/h为权数用WLS来估计方程。
南开大学计量课件多元线性回归异方差问题共43页文档
45、自己的饭量自己知道。——苏联
41、学问是异常珍贵的东西,从任何源泉吸 收都不可耻。——阿卜·日·法拉兹
42、只有在人群中间,才能认识自 己。——德国
43、重复别人所说的话,只需要教育; 而要挑战别人所说的话,则需要头脑。—— 玛丽·佩蒂博恩·普尔
南开大学计量课件多元线性回归异方 问题
11、用道德的示范来造就一个人,显然比用法律来约束他更有价值。—— 希腊
12、法律是无私的,对谁都一视同仁。在每件事上,她都不徇私情。—— 托马斯
13、公正的法律限制不了好的自由,因为好人不会去做法律不允许的事 情。——弗劳德
14、法律是为了保护无辜而制定的。——爱略特 15、像房子一样,法律和法律都是相互依存的。——伯克
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可得到如下正规方程组:
nˆ1 ˆ2 X 2i ˆk X ki Yi
ˆ1
X 2i ˆ2
X
2 2i
ˆk
X 2i X 3i ˆk
X 2i X ki
X 2iYi
ˆ1
X 3i ˆ2
X 3i X 2i ˆ2
X2 3i
ˆk
X 3i X ki
X 3iYi
ˆ1
如果根据理论,因变量Y与k-1个变量X2,X2,…,Xk 有因果关系,我 们要建立的回归模型要在这些变量中选择正确的解释变量,要根据变量的 边际贡献大小,把贡献大的变量纳入回归模型。分析边际贡献并选择变量 的过程,实际上是一个逐步回归的过程。
首先,分别建立Y与k-1个变量X2,X2,…,Xk 的回归模型:
X ki ˆ2
X ki X 2i ˆk
X ki X 3i ˆk
X2 ki
X kiYi
写成矩阵形式:
n
X 2i
X 3i
X 2i
X 3i
X2 2i
X 3i X 2i
X 2i X 3i X2
3i
X ki
X ki X 2i
X ki X 3i
1
1
1
X 21 X 22 X 23
(2)计算统计量:
t
ˆi Se(ˆi )
(3)查t分布表,找出t (n k)。 2
(4)判断:
t 若
t
t 2 (n k ),则接受H0 , 参数i显著异于0
t
2
(n
k
),则拒绝H
0
,
接受H1
,
参数
不
i
显著异于0
如果根据理论或常识,i 非负,则可做单侧检验,比较 t 与tα。
若 t t (n k),则接受H0,参数i不显著异于0 t t (n k),则拒绝H0 , 接受H1,参数i显著异于0
选择其中ESS最大并通过F检验的变量作为首选解释变量,假定是X2 。
m n-(k+m)
U1/(k-1) U2/(k+m-1) (U2-U1)/m Q/( n-k-m)
TSS
n-1
定义统计量: F (ESS'ESS) / m RSS' /(n k m)
并检验其显著性。
在新引入变量的系数为0的原假设下,
统计量 F (ESS'ESS) / m ~ F (m, n k m) RSS' /(n k m)
βˆ ' X' y nY 2 Y' Y nY 2
1 RSS 1 TSS
uˆi2 yi2
yi2与解释变量X的个数无关,而 uˆi2则可能随着解释变量的增加
而减少(至少不会下降),因而,不同的SRF,得到的R2 就可能不同。
必须消除这种因素,使R2 即能说明被解释的离差与总离差之间的关系, 又能说明自由度的数目。定义校正的样本决定系数 R 2 :
二、回归的总显著性检验: 检验回归系数全部为零的可能性。
原假设H0 : 1 2 k 0 备择假设H1 : i (i 1,2, , k)不同时为零
方差分析表( ANOVA)
平方和
df
ESS
(Yˆi Yˆ)2 Y' Y βˆ ' X' Y
k-1
RSS
uˆ2 βˆ ' X' Y nY 2 i
X
31
X 32
X 33
X
k1
Xk2
X 3k
1 Y1
X 2n Y2
X 3n
Y3
X kn Yn
即: (X'X)βˆ X'Y
βˆ (X'X)1 X'Y
X ki ˆ1
X X
2i 3i
X X
ki ki
ˆ2 ˆ3
X2 ki
ˆk
如果直接用矩阵微分,则
uˆ 2 Y' Y 2βˆ ' X' Y βˆ ' X' Xβˆ i
成立。
5、u ~ N (0, 2I)
随机干扰项服从正态分布。
三、多 变量线性回归模型的SRF
SRF :
Yi ˆ1 ˆ2 X 2i ˆ3 X 3i ˆk X ki uˆi
或 Y Xβˆ uˆ
其中βˆ 和uˆ分别为回归系数的OLS估计量的列向量和残差列向量。
第二节 多变量回归模型的OLS估计
n-k
TSS
(Yi Y )2 Y'Y nY2
n-1
均方差
(Y' Y βˆ ' X' Y) /(k 1) (βˆ ' X' Y nY 2 ) /(n k )
如果假定:1 2 k 0,则统计量
ESS /(k 1) (βˆ ' X' Y nY 2 ) /(k 1) F RSS /(n k ) (Y' Y βˆ ' X' Y) /(n k ) ~ F (k 1, n k )
2
n
u2
un
或: Y Xβ u
Y为因变量观测值列向量
在
Y Xβ u 中,X为数据矩阵。
β 为待估计参数列向量
u为随机扰动项列向量
二、多 变量线性回归模型的基本假定
1、 Eu 0
随机干扰项的期望值为0。
u1
2、
E
u
u
'
u2 un
u1
u2
2 0 0 0
0 0
ESS TSS ESS Y'Y nY 2 Y' Y βˆ ' X' y βˆ ' X' Y nY 2
方差分析表( ANOVA)
平方和
df
ESS
(Yˆi Yˆ)2 Y' Y βˆ ' X' Y
k-1
RSS
uˆ2 βˆ ' X' Y nY 2
i
n-k
TSS
(Yi Y )2 Y'Y nY2
R 2 1 ESS /(n k ) 1 (1 R2 ) n 1
TSS /(n 1)
nk
1
ˆ 2
Se(Yˆ )
三、R2 与 R 2的性质
0 R2 1,
0 R2 1
R 2 R2 , 当k 时,R 2 R2
第四节 显著性检验
一、单参数的显著性检验:
根据假定,u ~ N (0, 2I),因此ˆ ~ N ( , 2 (X' X)1)
标准差为
(X' X)1
如果 2未知,以 ˆ 2代替 2,则 Var Cov(βˆ )的估计量为:ˆ( 2 X' X)1
βˆ 的标准差Se(βˆ )为 ˆ( 2 X' X)1 (X' X)1ˆ
四、OLS估计量 βˆ 的性质:
1、线性 βˆ ( [ X' X)1X' ]Y
2、无偏性 E[βˆ ] β
第三章 多变量回归分析
第一节 多变量线性回归模型
一、多变量线性回归模型的PRF
如果假定对因变量Y 有k-1个解释变量:X2,X3,…,Xk,k 变量总 体回归函数为:
其中PR1为F 常: 数项Y,i 2 ~1 2为2 X解2i释变3量XX3i 2~Xk的系k X数ki , uui为, i随 1机,2干,扰,项k 。
uˆ 2 i
βˆ
2X' Y 2X' Xβˆ
0
βˆ (X' X)1 X' Y
二、 的估计量
ˆ
uˆ 2 uˆ 'uˆ i
nk nk
ˆ为的无偏估计量:E[ˆ ] 。
三、βˆ 的方差-协方差矩阵
βˆ (X' X)1 X' y (X' X)1 X' (Xβ u) (X' X)1 X' Xβ (X' X)1 X'u β (X' X)1 X'u
Yi a 2 X 2i ui Yi 1 2 X 3i ui
Yi 1 2 X ki ui
回归后, TSS( X 2 ) ESS( X 2 ) RSS( X 2 )
得到各 回归方
TSS( X 3) ESS( X 3) RSS( X 3)
程的平
方和
TSS( X k ) ESS( X k ) RSS( X k )
n-1
均方差
(Y' Y βˆ ' X' Y) /(k 1) (βˆ ' X' Y nY 2 ) /(n k )
判定系数:
二、校正的R2 :
R2
ESS TSS
βˆ ' X' y nY 2 Y' Y nY 2
由R2的计算式可看出, R2 随解释变量的增加而可能提高(不可能降
低):
R2
ESS TSS
根据R2 ESS ,F ESS /(k 1) ,TSS ESS RSS
TSS
RSS /(n k)
可得到F
R2 /(k 1) (1 R2 ) /(n
k)
显然,R2 越大,F越大,当R2 =1时,F 无限大。
选择显著水平α ,计算F统计量的值,与F分布表中的临界值进行比
较:
若 F F (k 1, n k),则接受H0 ,不显著 F F (k 1, n k),则拒绝H0 , 接受H1,显著
决定一个变量是否引入回归模型,就要先研究它的边际贡献,以正确 地建立模型。如果变量的边际贡献较小,说明改变量没有必要加入模型。
分析变量的编辑贡献,可以使用方差分析表为工具,根据变量引入前、 后的RSS的变化量及其显著性检验(扣除原来引入模型的解释变量的贡 献),确定该变量的边际贡献是否显著。