2019年南开大学《计量经济学》案例分析.doc
第五章 多重共线性(计量经济学,南开大学)
例如,为了估计汽车需求的价格弹性和收入弹性,得到销售量、平均价格、消 费者收入的时间序列数据。设定回归式:
ln(Yt ) 1 2 ln P t 3 ln I t ut
由于在时间序列数据中价格Pt、收入It 一般都具有高度共线的趋势。因此,直接 估计上面的回归式将存在问题。由于在同一式点上,价格与收入的相关程度不高, 可以先利用截面数据估计出收入弹性 ,再利用这一估计结果修改原回归式,变 ˆ 为: 3
R 2 /(k 1) F ~ F (k 1, n k ) 2 (1 R ) /(n k )
可以采用类似的方法检验:
F
R2 ) j /( k 1 (1 R j ) /(n k 1)
2
~ F (k 1, n k )
选择显著水平α ,计算F 统计量的值,与F分布表中的临界值进行比较,若F检验值 小于临界值,则多重共线性不显著,反之,则多重共线性显著。
第三节 多重共线性的探查和解决
一、多重共线性的探查 由于多重共线性使一种普遍现象,而多重共线性的程度影响了参数估计结果, 因此我们关心的是共线性的程度,而不是共线性是否存在。
在双边量回归模型中,可以直接对解释变量的相关系数进行显著性检验,以确 定线性相关的程度(此时相关系数的平方等于样本决定系数)。而对于多于两个结 束变量的回归模型,则不能利用俩俩相关系数来检验。 对于有多个变量的回归模型,可以采用辅助回归的方法,分别以k-1个解释变量 中的第i个对其他变量进行回归,可得到k-2个回归方程的判定系数: R22,R32,…,Rk2。假定这些判定系数中Rj2最大且接近1,则变量Xj 与其他解释变量 中的一个或多个有较高相关程度,因此回归方程出现高度多重共线性。 可以进行F 检验确定其显著性: 根据第三章的结果,检验R2显著性的F检验值为:
南开大学计量经济学期末复习
( xt x ) 2 1
ˆ )。 0 N (0,
T ( xt x ) 2
xt 2
)
第2章 一元线性回归模型
2.6
ˆ 的估计。 2
2
ˆ ut 2
T 2
2.7 拟合优度的测量。 R =
ˆ ( yt y) 2 ( yt y) 2
2.8 回归参数的显著性检验 模型:yt = 0 + 1 xt + ut。 H0:1 = 0; H1: 1 0 在 H0 成立条件下, t =
ˆ 1 1 s( ) ˆ
1
=
ˆ 1 s( ) ˆ 1
t (T-2)
若 t < t (T-2) ,或者 p 值 > 0.05,则 1 = 0。 若 t > t (T-2) ,或者 p 值 < 0.05,则 1 0;
ˆ ˆ ˆ 残差的方差。 s2 = 2 = u ' u / (T – k-1)
3.4 可决系数(R2) 多重确定系数(多重可决系数) 2 = ,R
SSR SST
有 0 R 2 1。R 2 1,拟合优度越好。 调整的多重确定系数 R 2 = 1-
T 1 SSE /(T k 1) = 1(1 R 2 ) SST /(T 1) T k 1
Y=X +u
第3章 多元线性回归模型
0 假定(1) :E(u) = 0 1 0 0 2 0 0 假定(2) :误差项同方差、非自相关 Var (u) = 0 0 1
假定(3) :解释变量与误差项相互独立。E(X 'u) = 0 假定(4) :解释变量之间线性无关。rk(X 'X) = rk(X) = k+1(非多重共线性) 假定 (5) 解释变量是非随机的, : 且当 T → ∞ 时, – 1X 'X → Q T (非退化矩阵) 。
南开大学计量经济学课件回归方程的变量和形式
检验判断1994年之前和之后两段时期消费函数是否产生显著的
差异。
7.2 模型的稳定性检验
2、Chow预测检验
Chow预测检验是先对包含前T1个观察值的子样本 建立模型,然后用这个模型对后T2个观察值的自变量 进行预测,如果实际值与预测值有很大变动,就可以 怀疑模型中存在结构性变化。T1 和T2的相对大小,没 有确定的规则,可能根据如战争、石油危机、经济改 革等明显的转折点来确定,如果不存在这样明显的转 折点,常用的方法是用85%-90%的数据进行估计,剩 余的数据进行检验。
7.2 模型的稳定性检验
1、Chow断点(Breakpoint)检验
实例一:估计C-D函数 log(Y ) 0 1 log(L) 2 log(K )
(1)1929-1967年数据估计如下 log(Y ) 3.938 1.451log(L) 0.384log(K )
R 2 0.9946 , R 2 0.9943 , RSS 0.0434 (2)分1929-1948和1949-1967两段数据估计如下 log(Y ) 4.058 1.617log(L) 0.220log(K )
3、冗余(Redundant)变量检验
检验一部分变量的统计显著性,通过判断方程中一
部分变量系数是否与0没有显著差异,决定是否从方程 中剔除这些变量,检验方法可以通过F检验和似然比 (LR)检验。 冗余变量检验是遗漏变量检验逆过程。
Eviews实现过程:
View-Coefficient Tests-Redundant Variables-
7.2 模型的稳定性检验
1、Chow断点(Breakpoint)检验(邹至庄断点检验) 思想:对每个子样本单独拟合方程,并与对于全部样本 拟合方程进行比较,来观察每个子样本的估计方程是否 有显著差异,判断是否存在结构变化。 零假设:两个子样本拟合的方程无显著差异。即结 构没有发生变化。 如果拒绝零假设,则代表有显著差异,意味着模型 中存在结构变化。
第六章 异方差(计量经济学,南开大学)
i i
* * Yi* 1 * X vi,此时 2 i 2 Var(u * ) E ( v ) E[( i i
i
新模型满足CLRM的同方差性假定。
令wi
1
2
i
, 新模型的残差平方和最小:
min
v
2
i
ˆ* ˆ * X * )2 (Y *i 1 2 i ˆ ˆ X )2 wi (Yi 2 i ( wi )( wi X iYi ) ( wi X i )( wiYi ) ˆ 2 ( wi )( wi X i2 ) ( wi X i ) 2 wx y w x
ˆ 2
i i i i 2
i
Yi 1 2 X i ui
i
i
2
i
i
2
i
2
i
2
2
2 2
i
2
2
i
)
可以证明该估计量是线性、无偏的(第二章的证明),但是否为最优估计量 (具有最小方差性)性,则不一定。可以在考虑异方差性的前提下,采用适当的 OLS估计方法来分析。 2、存在异方差性的OLS估计——广义最小二乘法(GLS) 估计 对于
如果同方差,则 F ≈1 ;如果存在以方差性,根据正相关的假设,F>1。F越大(超 过临界值),说明存在以方差性的可能性就越大。
RSS2
第三节 异方差模型的处理
一、随机项的方差已知的情况
如果随机项的方差 i2已知,可以直接使用WLS 估计。
原模型 Yi 1 2 X 2i k X ki ui 两边同除以 i : Yi 1 1 2 Xi ui , 模型可变为
第十章时间序列分析(计量经济学,南开大学)
我们对经济量进行分析的最终目的,是为了预测某些经济变量的未来 值。进行预测的方法有两种。一种是根据一定的经济理论,建立各种相互 影响的经济变量之间的关系模型,根据观测到的经济数据估计出模型参数, 利用模型来预测有关变量的未来值。这种方法的优点在于精确地考虑到了 各经济变量之间的相互影响,有理论依据,但是由于抽样信息不完备,经 济模型和经济计量模型不可能真正准确地反映了经济现实,因而得到的结 果不可能是相当准确。 另一种方法是利用要预测的经济变量的过去值来预测其未来值,而不 考虑变量值产生的经济背景。这种方法假定数据是由随机过程产生的,根 据单一变量的观测值建立时间序列模型进行预测。这种方法在短期预测方 面是很成功的。
第四节 AR、MA、ARMA模型
一、滞后算子 定义滞后算子(lag operator)L:
LYt = Yt-1
其中Yt 和 Yt-1为随机过程中的元素,而 L2Yt = L[L(Yt)]= LYt-1= Yt-2
一般地,对任意正整数n,有LnYt = Yt-n, L0Yt = Yt
例如, Y Y e : t t 1 t利用滞后算子可改写为 Y LY e t t t 或 ( 1 ) Y e t t 使用滞后算子表示的多 项式:
形式: Yt (1 )Yt 1 et Yt 1 et 进行估计,
的 t 统计量不遵从 t 分布,将之称为 统计量。 通过查找 统计量表,根据与临界 值的比较来决定是否拒 绝 k 1的假设。
该检验称为迪基 富勒( DF ) 检验。 如果计算的 统计量的绝对值超过 DF 临界 的绝对值,则不拒绝所 时间序列是平稳的假设 是非平稳的。 常用以下形式的回归作 Yt Yt 1 et Yt 1 Yt 1 et Yt 1 2 t Yt 1 et 其中 t 为时间或趋势变量。在 后面的两个式子式为了 以上形式中,原假设均 为 0,即存在单位根。 消除截距项和趋势项的 影响。 DF 检验: ,反之,如果小于临界 值的绝对值,则时间序 给 列
南开大学计量经济学
et ?
§2.2参数的最小二乘估计
§2.1 模型的假定
Yt Xt ut t 1, 2 n
Yt 被解释变量 Xt 解释变量 ut 随机扰动项
§2.1 模型的假定
(1)E ut 0 (2)Var ut 2 (3)E utus 0 t s 即不相关 (4)Xt是确定性量,即Xt不是随机变量,有E Xtut 0
a,b具有最小方差的含义 :
设 *为的任一线性无偏估计有
var( *) ≥ var b
设 *为的任一线性无偏估计有
var( *) ≥ var a
§2.3最小二乘估计量的性质
3. 有效性(efficiency)
假设:
* dtYt dt Xt ut dt dt Xt dtut ()
var e0
(n 2)S 2
2
n2}
t n 2,即
Yˆ0 Y0
S 1 1 X0 X 2
n
S XX
tn 2
§2.5 预测误差和预测区间
给定显著水平
Yˆ0 Y0
由 S
1 1
X0 X
2
≤t n 2 2
n
S XX
Y0得置信区间为
2
Yˆ0 t n 2 S 2
1 1 n
X0 X S XX
(5)ut N 0, 2
上述假设下:
E Yt Xt Xt
var Yt var ut
无论收入变化多少,消费变动的幅度保持不变。
南开大学计量经济学第6章自相关
经济模型中最常见的是一阶自回归形式。
T
ut ut1
依据 OLS 公式,模型 ut = 1 ut -1 + vt 中1 的估计公式是
aˆ1
=
t=2 T
。
ut12
t=2
若把 ut, u t-1 看作两个变量,则它们的相关系数是 ˆ =
T
ut ut1
t=2
。
T
T
ut 2
u t 1 2
(2)样本容量T
21 1.22 1.42 1.13 1.54 1.03 1.67 0.93 1.81 0.83 1.96
22 1.24 1.43 1.15 1.54 1.05 1.66 0.96 1.80 0.86 1.94 (3)原回归模型中解 23 1.26 1.44 1.17 1.54 1.08 1.66 0.99 1.79 0.90 1.92 释变量个数k(不包括
《Econometrics》 《计量经济学》
攸频
nkeconometrics126 南开大学经济学院数量经济研究所
第六章 自相关
Autocorrelation
§6.1 基本概念、类型及来源 §6.2 自相关的后果 §6.3 自相关的检验(DW检验、LM检验) §6.4 自相关的修正(GLS) §6.5 案例
同理,Cov(ut, ut - s) = s Var(ut)
自相关的表现形式
§6.1.3 自相关的来源
(1)惯性 大多数经济时间数据都有一个明显的特点,即
具有惯性。 如:经济周期
棘轮效应
(2)设定偏误:模型中遗漏了显著的变量
例如:如果对羊肉需求的正确模型应为
Yt=b0+b1X1t+b2X2t+b3X3t+ut
第二章 双变量回归分析(计量经济学,南开大学)
ˆ 和 ˆ 1 2
i
为Yi的线性函数
i 2 i
ˆ
2
xY x
(
xi )Yi 2 x i
k Y
i
i
其中k i
xi xi2 1 xi2
ki k i2
x
2
i
0
2 xi
1 xi2 1 xi2
i
1 xi2
6、样本回归函数(SRF) 由于在大多数情况下,我们只知道变量值得一个样本,要用样本信息的基础 上估计PRF。(表) 样本1
X(收入) Y(支出) 80 55 100 65 120 79 140 80 160 102 180 110 200 120 220 135 240 137 260 150
样本2
ˆ ) VAR( 2
x
2 i
2
2 i
x
ˆ: 对于 1
ˆ Y ˆ X 1 ˆ X Yi 1 2 2 n 1 ˆ X ( 1 2 X i ui ) 2 n u 1 i X k i ui n ˆ ) E[( ui X 方差:VAR( k i ui ) 2 ] 1 n
ˆ ) E( ki E (ui ) 2 2 2 ˆ Y ˆ X 1 2 ( 1 2 X i ui ) ( 1 k i u i ) X 1 u i X k i u i ˆ ) E( 1 1
1 1 2 21
估计量(Estimator):一个估计量又称统计量(statistic),是指一个规则、公式 或方法,以用来根据已知的样本所提供的信息去估计总体参数。在应用中,由估 计量算出的数值称为估计(值)(estimate)。 样本回归函数SRF的随机形式为:
南开大学计量经济学第12章 时间序列模型
其中:i , i = 1, … p 是自回归参数,ut 是白噪声过程。
xt是由它的p个滞后变量的加权和以及ut相加而成。
上式用滞后算子表示为:(1-1L-2L2-…-pLp)xt =L)xt=ut
L)=1-1L-2L2-…-pLp 称为特征多项式或自回归算子
平稳性: 若特征方程 z)=1-1z-2z2-…-pzp=(1–G1z)(1–G2z)...(1–Gpz)=0
对于随机过程,如果必须经过d次差分之后才能变换成为一 个平稳的过程,而当进行d-1次差分后仍是一个非平稳过程,
则称此随机过程具有d 阶单整性,记为
yt ~ I (d )
检验时间序列的平稳性是建模的基础!
四、补充:差分算子与滞后算子
• 差分指时间序列变量的本期值与其滞后值相减的运算。 一阶差分可表示为: xt - xt -1 = xt = (1- L) xt = xt - L xt
的所有根的绝对值都大于1,则AR(p)是一个平稳的随机过程。 之所以称之为特征方程,是因为它的根决定了过程 xt的特征。
12.2 时间序列模型的分类
对于自回归过程 AR(p), 如果特征方程L) = 0 ቤተ መጻሕፍቲ ባይዱ所有根的绝对值都大于 1, 则该过程是一个平稳的过程。 为什么?AR(p) 过程的特征多项式可以分解为
3. AR(2)过程分析
xt=1xt-1+2xt-2+ut • 平稳性的条件是特征方程1-1L-2L2=0的两个根在单位圆外:
1 12 42 22 1
解得:
2+1<1 2-1<1
| 2 |<1
xt =
1 0.6L
ut = (1 + 0.6 L + 0.36 L + 0.216 L + … ) ut
南开大学经济学综合(微、宏观及计量经济学)考研大纲2018年与2019年对比一览表
南开大学经济学综合(微、宏观及计量经济学)考研大纲2018年与2019
年对比一览表
南开大学经济学综合(微、宏观及计量经济学)2019年考研大纲已经公布,但是考研的同学都清楚何如利用吗?考研大纲是目标院校唯一官方指定的硕士研究生入学考试命题的唯一依据,是规定研究生入学考试相应科目的考试范围、考试要求、考试形式、试卷结构等权威指导性文件。
考研大纲作为唯一官方的政策指导性文件在专业课备考中的作用是不言而喻的。
然而,各大高校的考试大纲均在9月中旬左右才公布,对参照前一年的考研大纲已经复习大半年的莘莘学子来说可谓姗姗来迟。
借此,我们天津考研网特别推出考研大纲的对比、变化情况的系列专题,及时反映相关的考研动态,以此来消除学子们的复习误区;使学子们尽早捕捉到官方的细微变化。
为考研之路保驾护航!
以上是南开大学经济学综合(微、宏观及计量经济学)2018年与2019年考研大纲的对比情况,从对比文件可以看出,南开大学经济学综合(微、宏观及计量经济学)的考研大纲没有发生变化。
所以,报考目标院校目标专业的研友们可以安心的按照已定计划去复习备考。
南开大学经济学综合(微、宏观及计量经济学)考研资料请到天津考研网官网咨询查看。
第九章 联立方程模型(计量经济学,南开大学)
D a0 a1P a2Y u1 S a0 a1P a2W u2 DS Q
这里讨论的局部均衡模型,需要多个单一方程和在一起的联立方程组 来描述。这个方程组就是描述这以经济系统的联立方程模型。 二、联立方程模型中的变量分类 联立方程模型中的变量,可分为内生变量、外生变量和预定变量。
0 1 1 It u 1 1 1 1 1 1
t
E (Yt )
0 1 ut I Yt E (Yt ) 1 1 1 1 1 1
u2 t
2 cov(Yt , u D ) E{[Yt E (Yt )][ut E (ut )]} E ( ) 1 1 1 1
(截距项视为观测值为1的预定变量) Y X U
Ct 0 1Yt u 1t
2、简化式模型 根据结构式模型推导得到,把内生变量表示为预定变量和随机项的函数 形式的方程组,这种模型称为简化式模型,其中的每个方程称为简化式方程: Y X U Y B1X B1U X V
1、内生变量
指由模型系统内决定的变量,取值在系统内决定,如D、S、P。 2、外生变量 指不由模型系统范围内决定的变量。如Y、W。政策变量属于外生变量。 3、预定变量 指变量的滞后值。内生变量的滞后值称预定内生变量,外生变量的滞 后值称预定外内生变量。 三、联立方程模型中方程式的分类 1、行为方程式 描述经济系统中个体经济行为的方程。如消费需求方程。 2、技术方程式 指基于生产技术关系而建立的函数关系。如生产函数。 3、制度方程式 与法律、制度有直接关系的经济数量关系式,如税收方程。 4、衡等式 有两种。一种是定义方程式,有经济变量的定义所构成的方程;另一种 是平衡方程,表示经济变量之间的平衡关系。
南开大学经济学院历年本科计量经济学期末试卷及答案解析汇编
3
答案勘误表
2002 年第一学期计量经济学期末开卷试题答案
第一大题,第 1 小题: 第二空答案是 118.634 应改为 118.6377; 第三空答案是 0.0384 应改为 0.04034 第五大题,第 1 小题: 因为是对 Dyt 建模,所以答案应从 ARIMA 模型改为 ARMA 模型 第五大题,第 3 小题: ˆ1996 带入有 误,原答 案代入的 是 1997 年的-0.00127,应该代入 1996 年 的 u 0.00179, 并且题目要求是求 Dyt 值,答案求的是 yt 值,由于题目没有给出 y1997 , 所以 y1998 是求不出来的
Prob. 0.0044 0.0000 7.430699 1.021834 -6.336402 -6.237663 14074.12 0.00000
1.在空白处填上相应的数字(共 4 处) (计算过程中保留 4 位小数) (8 分) 2.根据输出结果,写出回归模型的表达式。 (5 分)
3.给定检验水平α=0.05, 检验上述回归模型的临界值 t0.025=_______, F0.05=_______; 说明估计参数与回归模型是否显著?(6 分)
四、给出结构模型(共 20 分)
Ct=α0 +α1Yt+α2Ct-1+ u1t It=β0+β1Yt+β2Yt-1+β3rt+ u2t Yt=Ct+It+Gt
其中 C—总消费,I—总投资,Y—总收入,r—利率,G—政府支出 1.写出模型中的内生变量、外生变量、预定变量。 (5 分)
2.讨论联立方程模型的识别问题。 (10 分)
ˆ =e 0 3. A 4.因为使用的样本为横截面数据,随机误差项可能存在异方差;变量 L 和 K 之间可能存在 较严重的多重共线性。
校园网-南开大学《计量经济学》历年期考试题和各章习题(含答案)
Yˆt = 857.8375 + 0.100036Xˆ t
(12.78) (46.05),
r 2 = 0.9916
斜率系数的经济意义:GDP 增加 1 亿元,平均说来财政收入
将增加 0.1 亿元。
(2) r2
=
RSS TSS
=
0.991593,说明总离差平方和的
99%被样本回
归直线解释,仅有不到 1%未被解释,因此,样本回归直线
释变量个数的影响
二、多项选择题
1.调整后的判定系数 R 2 与判定系数 R2之间的关系叙述正确的 有( )
A. R 2与 R2均非负 B. R 2有可能大于 R2
C.判断多元回归模型拟合优度时,使用 R 2 D.模型中包含的解释变量个数越多, R 2 与 R2 就相差越 大 E.只要模型中包括截距项在内的参数的个数大于 1, 则 R 2 < R2 2.对多元线性回归方程(有 k 个参数)的显著性检验,所
2
D.
∑ Yt − Yˆt 使 t=1
达到最小值
2. 在一元线性回归模型中,样本回归方程可表示为( )
A. Yi = β0 + β1 Xi + ui
B.
Yˆi = βˆ0 + βˆ1Xi + ei
C. Yˆi = βˆ0 + βˆ1 Xi
D. E (Yi ) = β0 + β1Xi
3.线设 OLS 法得到的样本回归直线为Yi = βˆ0 + βˆ1Xi + ei ,以下说法
应用计量经济学将计量经济学方法应用于经济理论的 特殊分支,即应用理论计量经济学的方法分析经济现象和预 测经济变量。
习题
2 一元线性回归模型
回归分析(计量经济学南开大学)
⑦预报和预测 如果计量模型可以接受,就可用来对因变量进行预测。假定1994年,美国的GDP
预计为6万亿美元,则该年的消费支出预计为
Y 231.80.71946000 4085
三、计量经济学的内容
01
控制或政策制定
55
X
80 100 120 140 160
二、统计关系与确定关系 在回归分析中,得到因变量与自变量之间的依赖关系是统计依赖关系,而不是确
定关系或函数关系。
三、回归与因果关系 回归分析得到的变量间的统计依赖关系,统计关系式自身不代表任何确定的因果
关系。
四、计量经济分析使用的数据 有三类。
(1)时间序列数据。一个时间序列是对一个变量在不同时间取的一组观测结果。这些 数据可以按固定的时间间隔收集。
加拿大
0.9
智 利
12.3
墨西哥
3.6
秘 鲁
-1.7
美国
2.7
中 国
14.2
(3)混合数据。
香港
6.3
日本
1
国家和地区
实际GDP增长率
1992年
1993年
1994年
1995年
1996 年
1997 年
1998年
加拿大 智利
墨西哥 秘鲁 美国 中国 香港 日本
0.9 12.3 3.6 -1.7 2.7 14.2 6.3 1.0
二、计量经济学的方法
基本过程:
经济理论
理论的数学模 型
理论的计量经 济学模型
数据的收集整 理
计量经济模型 的参数估计
假设检验
2019年案例分析_计量经济学.doc
案例分析1一、研究的目的要求居民消费在社会经济的持续发展中有着重要的作用。
居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。
改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。
但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。
例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。
为了研究全国居民消费水平及其变动的原因,需要作具体的分析。
影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。
为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。
二、模型设定我们研究的对象是各地区居民消费的差异。
居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。
而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。
所以模型的被解释变量Y 选定为“城市居民每人每年的平均消费支出”。
因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。
因此建立的是2002年截面数据模型。
影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
南开大学《计量经济学》案例分析案例一:用回归模型预测木材剩余物(file:b1c3)伊春林区位于黑龙江省东北部。
全区有森林面积218.9732万公顷,木材蓄积量为2.324602亿m3。
森林覆盖率为62.5%,是我国主要的木材工业基地之一。
1999年伊春林区木材采伐量为532万m3。
按此速度44年之后,1999年的蓄积量将被采伐一空。
所以目前亟待调整木材采伐规划与方式,保护森林生态环境。
为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。
因此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。
下面,利用一元线性回归模型预测林区每年的木材剩余物。
显然引起木材剩余物变化的关键因素是年木材采伐量。
给出伊春林区16个林业局1999年木材剩余物和年木材采伐量数据如表1.1。
散点图见图1.1。
观测点近似服从线性关系。
建立一元线性回归模型如下:y t = β0 + β1 x t + u t表1.1 年剩余物y t和年木材采伐量x t数据林业局名年木材剩余物y t(万m3)年木材采伐量x t(万m3)乌伊岭26.13 61.4 东风23.49 48.3 新青21.97 51.8 红星11.53 35.9 五营7.18 17.8 上甘岭 6.80 17.0 友好18.43 55.0 翠峦11.69 32.7 乌马河 6.80 17.0 美溪9.69 27.3 大丰7.99 21.5 南岔12.15 35.5 带岭 6.80 17.0 朗乡17.20 50.0 桃山9.50 30.0 双丰 5.52 13.8合计202.87 532.00图1.1 年剩余物y t和年木材采伐量x t散点图图1.2 EViews输出结果EViews估计结果见图1.2。
在已建立Eviews数据文件的基础上,进行OLS估计的操作步骤如下:打开工作文件,从主菜单上点击Quick键,选Estimate Equation 功能。
在出现的对话框中输入y c x。
点击Ok键。
立即会得到如图1.2所示的结果。
下面分析EViews输出结果。
先看图1.2的最上部分。
被解释变量是y t。
估计方法是最小二乘法。
本次估计用了16对样本观测值。
输出格式的中间部分给出5列。
第1列给出截距项(C)和解释变量x t。
第2列给出第1列相应项的回归参数估计值(0ˆβ和1ˆβ)。
第3列给出相应回归参数估计值的样本标准差(s(0ˆβ), s(1ˆβ))。
第4列给出相应t值。
第5列给出t统计量取值大于用样本计算的t值(绝对值)的概率值。
以t = 12.11266为例,相应概率0.0000表示统计量t取值(绝对值)大于12.1的概率是一个比万分之一还小的数。
换句话说,若给定检验水平为0.05,则临界值为t0.05(14) = 2.15。
t = 12.1>2.15落在了H0的拒绝域,所以结论是β1不为零。
输出格式的最下部分给出了评价估计的回归函数的若干个统计量的值。
依纵向顺序,这些统计量依次是可决系数R2、调整的可决系数2R(第3章介绍)、回归函数的标准差(s.e.,即均方误差的算术根σˆ)、残差平方和、对数极大似然函数值(第2章介绍)、DW 统计量的值、被解释变量的平均数(y )、被解释变量的标准差()(t y s )、赤池(Akaike )信息准则(是一个选择变量最优滞后期的统计量)、施瓦茨(Schwatz )准则(是一个选择变量最优滞后期的统计量)、F 统计量(第3章介绍)的值以及F 统计量取值大于该值的概率。
注意:S.D.和s.e.的区别。
s.e.和SSE 的关系。
根据EViews 输出结果(图1.2),写出OLS 估计式如下:t yˆ= -0.7629 + 0.4043 x t(1.1)(-0.6) (12.1) R 2 = 0.91, s. e . = 2.04其中括号内数字是相应t 统计量的值。
s.e .是回归函数的标准误差,即σˆ=)216(ˆ2-∑t u 。
R 2是可决系数。
R 2 = 0.91说明上式的拟合情况较好。
y t 变差的91%由变量x t 解释。
检验回归系数显著性的原假设和备择假设是(给定α = 0.05)H 0:β1 = 0; H 1:β1 ≠ 0图1.3 残差图因为t = 12.1 > t 0.05 (14) = 2.15,所以检验结果是拒绝β1 = 0,即认为年木材剩余物和年木材采伐量之间存在回归关系。
上述模型的经济解释是,对于伊春林区每采伐1 m 3木材,将平均产生0.4 m 3的剩余物。
图1.3给出相应的残差图。
Actual 表示y t 的实际观测值,Fitted表示y t 的拟合值t yˆ,Residual 表示残差t u ˆ。
残差图中的两条虚线与中心线的距离表示残差的一个标准差,即s.e .。
通过残差图可以看到,大部分残差值都落在了正、负一个标准差之内。
估计β1的置信区间。
由t = P {)ˆ(111ˆβββs -≤ t 0.05 (14) } = 0.95得11ˆββ-≤ t 0.05 (14))ˆ(1βsβ1的置信区间是[1ˆβ- t 0.05 (14) )ˆ(1βs , 1ˆβ+ t 0.05 (14) )ˆ(1βs ] [0.4043 - 2.15 ⨯ 0.0334, 0.4043 + 2.15 ⨯ 0.0334][0.3325, 0.4761]以95%的置信度认为,β1的真值范围应在[0.3325, 0.4761 ]范围中。
下面求y t 的点预测和平均木材剩余物产出量的置信区间预测。
假设乌伊岭林业局2000年计划采伐木材20万m 3,求木材剩余物的点预测值。
yˆ2000 = - 0.7629 + 0.4043 x 2000= -0.7629 + 0.4043 ⨯ 20 = 7.3231万m 3s2(E (y ˆ2000)) =2ˆσ(T 1+ ∑--22)()(x x x x F )= 4.1453 (161+2606.3722)25.3320(2-) = 0.4546s (E (y ˆ2000)) =4546.0= 0.6742因为E (y ˆ2000) = E(0ˆβ+1ˆβx 2000 ) = β0 + β1 x 2000 = E(y 2000)t = )ˆ()(ˆ200020002000y s y E y-~ t(T -2)则置信度为0.95的2000年平均木材剩余物E(y 2000)的置信区间是yˆ2000 ± t 0.05 (14) s (E (yˆ2000)) = 7.3231 ± 2.15 ⨯ 0.6742= 5.8736, 8.7726从而得出预测结果,2000年若采伐木材20万m 3,产生木材剩余物的点估计值是7.3231万m 3。
平均木材剩余物产出量的置信区间估计是在 [5.8736, 8.7726] 万m 3之间。
从而为恰当安排2000年木材剩余物的加工生产提供依据。
木材剩余物产出量单点的置信区间的计算。
s 2(yˆ2000) =2ˆσ(1+T 1+ ∑--22)()(x x x x F )= 4.1453 (1+161+2606.3722)25.3320(2-) = 4.5999s (y ˆ2000)EViews 通过预测程序计算的结果是,木材剩余物产出量单点的置信区间的估计结果是yˆ2000 ± t 0.05 (14) s (yˆ2000) = 7.3231 ± 2.15 ⨯ 2.145 = [2.71,11.93]问题:估计结果中0ˆβ没有显著性,去掉截距项 β0可以吗? 答:依据实际意义可知,没有木材采伐量就没有木材剩余物,所以理论上β0是可以取零的。
而有些问题就不可以。
例如家庭消费和收入的关系。
即使家庭收入为零,消费仍然非零。
一般来说,截距项的估计量没有显著性时,也不做剔出处理。
本案例剔出截距项后的估计结果是t yˆ= 0.3853 x t(28.3) R 2 = 0.91, s. e . = 2.0点预测值是yˆ2000 = 0.3853 x 2000 = 0.3853 ⨯ 20 = 7.7060万m 3案例二:中国国债发行额模型(多元回归,file:b1c4)首先分析中国国债发行额序列的特征。
1980年国债发行额是43.01亿元(占GDP 的1%),2001年国债发行额是4604亿元(占GDP 的4.8%)。
以当年价格计算,21年间(1980-2001)增长了106倍。
平均年增长率是24.9%。
100020003000400050008082848688909294969800DEBT中国当前正处在社会主义市场经济逐步完善,宏观经济平稳运行的阶段。
国债发行总量(DEBT t ,亿元)应该与经济总规模,财政赤字的多少,每年的还本付息能力有关系。
选择3个解释变量,国内生产总值(百亿元),财政赤字额(亿元),年还本付息额(亿元),根据散点图建立中国国债发行额(DEBT t ,亿元)模型如下(数据见表2.1):DEBT t = β0 +β1 GDP t +β2 DEF t +β3 REP AY t + u t 其中GDP t 表示年国内生产总值(百亿元),DEF t 表示年财政赤字额(亿元),REP AY t 表示年还本付息额(亿元)。
用1980-2000年数据得输出结果如下;变量的相关系数阵:DEBT t = 4.38 +0.34 GDP t +1.00 DEF t +0.88 REP AY t(0.2) (2.1) (26.6) (17.2)R 2 = 0.9986, DW=2.12, T =21, (1980-2000)预测2001年的国债发行额(DEBT t ,亿元)。
DEBT 2001 = 4608.71 预测误差是 η =4604460471.4608-= 0.001表2.1obs DEBT DEF GDP REPAY 1980 43.01 68.9 45.178 28.58 1981 121.74 -37.38 48.624 62.89 1982 83.86 17.65 52.947 55.52 1983 79.41 42.57 59.345 42.47 1984 77.34 58.16 71.71 28.9 1985 89.85 -0.57 89.644 39.56 1986 138.25 82.9 102.022 50.17 1987 223.55 62.83 119.625 79.83 1988 270.78 133.97 149.283 76.76 1989 407.97 158.88 169.092 72.37 1990 375.45 146.49 185.479 190.07 1991 461.4 237.14 216.178 246.8 1992 669.68 258.83 266.381 438.571993 739.22 293.35 346.344 336.22 1994 1175.25 574.52 467.594 499.36 1995 1549.76 581.52 584.781 882.96 1996 1967.28 529.56 678.846 1355.03 1997 2476.82 582.42 744.626 1918.37 1998 3310.93 922.23 783.452 2352.92 1999 3715.03 1743.59 820.6746 1910.53 2000 4180.1 2491.27 894.422 1579.82 2001 4604 2516.54 959.333 2007.73案例三:中国铅笔需求预测模型(非线性模型案例,file:nonli6)中国从上个世纪30年代开始生产铅笔。