时间序列数据的基本回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10.3 经典假设下OLS的有限样本性质
假定 TS.1(线性于参数) 假定 TS.2(无完全共线性):在样本中,没有任何自变量是恒
定不变的,或者是其他自变量的一个完全线性组合。
假定 TS.3(零条件均值): E(ut X ) 0,t 1,2, , n
假定 TS.4(同方差性): Var(ut X ) Var(ut ) 2,t 1,2, , n
基于上式,可通过将gfrt对pet,(pet-1-pe),(pet-2pet),ww2t和pillt进行回归而得到 ˆ及0 其标准差。
命令: gen dif1=pe_1-pe
gen dif2=pe_2-pe
reg gfr pe dif1 dif2 ww2 pill
Source
Model Residual
t
3.38 -0.04
0.27 -2.06 -7.86 29.21
P>|t|
0.001 0.970 0.790 0.043 0.000 0.000
[95% Conf. Interval]
.0411814 -.316752 -.2184013 -43.56608 -39.25907 89.31403
.1602568 .3051929
10.4 函数形式、虚拟变量和指数
在应用研究中经常出现具有恒定百分比效应的时间序 列回归(自然对数形式)
将对数函数形式用于分布滞后模型:
方程中的冲击倾向 0也被称为短期弹性(short-run
elasticity):它度量了GDP增长1%时货币供给的即期 百分比变化;
长期倾向0 1 有4时也被称为长期弹性(long-
少?
定义的3个虚拟变量: befile6:在开始调查前的六个月为1; affile6:表示开始调查后的六个月; afdec6:代表调查结束并确认构成倾销行为后的六个月; 因变量chnimp:从中国进口的数量(取对数形式); 解释变量包括:(1)化工产量指标chempi;(2)石油
文件:PRMINWGE.RAW 命令: reg lprepop lmincov lusgnp 结果:
prepop对mincov的估计弹性是-0.154,而根据t=-2.37, 它在统计上是显著的。因此,更高的最低工资降低了 就业率,这与古典经济学的预言一样。
例10.4 个人税收豁免对生育率的影响
例10.2 通货膨胀和赤字对利率的影响 1948-2003年数据。
i3:三月期国债利率; inf:据消费者价格指数得出的年通货膨胀率 def:联邦赤字占GDP 的百分比 文件:INTDEF.RAW 命令:reg i3 inf def 结果:
Inf与def对于i3的影响在统计上十分显著,即通货膨 胀上升或赤字相对规模的扩大都会提高短期利率。 (但前提是CLM假定成立)
(注意:1, 2 , ,分j别表示这一暂时变化发生后,下一时期、
两个时期、…j个时期后y的变化—如图10.1)
(2)当z从t期开始永久性提高,一期后y提高了 0 ,1 两期 后y提高了 0 1 。2 这表明,z的当期和滞后系数之和 0 1 ,2 等于z的永久 性提高导致y的长期变化,它被称为长期倾向(long-run propensity, LRP)或长期乘数(long-run multiplier)。
yt 0 1zt ut , t 1,2, , n
• “静态模型”的名称来源于我们正在模型化y和z的同 期关系的事实。
• 在一个静态回归模型中也可以有几个解释变量。 2、有限分布滞后模型 在有限分布滞后模型(finite distributed lag model,
FDL)中,我们容许一个或多个变量对y的影响有一定 时滞。
总生育率(gfr)是每个1000个育龄妇女生育孩子的个数。 对1913-1984年这段时间,方程
pe:个人税收减免的实际美元金额;
ww2:在1941-1945年间为1(第二次世界大战);
pill:从避孕药开始用于控制生育的1963年后一直为1
文件:FERTIL3.RAW
命令:sum pe
• 考察一个二阶FDL:
yt 0 0 zt 1zt1 2 zt2 ut
(1)当z发生一个暂时性的提高时, 0则表示z在t时期提高一
个单位所引起y的即期变化。
0通常被称作冲击倾向(impact propensity)或冲击乘数
(impact multiplier)。
1、pet,pet-1和pet-2是联合显著的,F统计量的p值为 0.012。 命令:test pe pe_1 pe_2
因此,pe的确对gfr有影响,但我们并没有足够好的 估计值判断这种影响是即期的,还是存在一期或者两 期的滞后(或都有一些)。
2、实际上, pet-1和pet-2不是联合显著的,因而我们使 用静态模型还算合理。
• 规范地,一个标有时间脚标的随机变量序列被称为一 个随机过程(stochastic process)或时间序列过程 (time series process)。
10.2 时间序列回归模型的例子
• 1、静态模型 • 我们将有两个变量(例如y和z)的时间序列数据标注
相同的时期,将这样的y和z联系起来即为一个静态模 型(static model):
该假定意味着,Var(ut X不) 能依赖于X(只要 u和t X相互独立就足够
了—满足TS.3即可),且在所有时期都保持不变。
假定 TS.5(无序列相关): Corr(ut ,us X ) 0,t s
【提问:我们为什么不假定不同横截面观测的误差是无关的呢? 答:前述有随机抽样的假定,则以样本中所有解释变量为条件, 不同观测的误差是独立的。因此,就我们当前目的而言,序列 相关只是时间序列和回归中的一个潜在问题。】
70 12.73 0.0000 0.4986 0.4594 14.27
gfr
pe dif1 dif2
ww2 pill _cons
Coef.
.1007191 -.0057796
.0338268 -22.1265 -31.30499
95.8705
Std. Err.
.0298027 .1556629 .1262574 10.73197 3.981559 3.281957
在时间序列高斯-马尔可夫假定TS.1-TS.5下,以X为 条件, 的条ˆj 件方差为:
Var(ˆj X ) 2 [SSTj (1 R2j )], j 1, , k
其中, SST是j 的xtj 总平方和, 为R2j 由 对x j所有其他 自变量回归得到的 R2
定理10.3( 2的无偏估计)
例10.1 静态菲利普斯曲线 研究失业和通货膨胀之间是否存在替代关系。
H0: 1 0 H1: 1 0 文件:PHILLIPS.RAW 命令:reg inf unem 结果:
上述方程并没有表明unem和inf之间存在替代关系 (因为 ˆ1 0) 分析中可能存在的问题: (1)CLM假定不成立(12章);(2)静态菲利普斯曲 线不是最佳模型(附加预期的菲利普斯曲线)
run elasticity):它度量了GDP持久地增长1%,4个月 后货币供给的百分比变化。
二值或虚拟自变量在时间序列应用中也相当有用。 既然观测单位是时间,所以虚拟变量代表某特定事件 在每个时期是否发生。
在事件研究(event study)中,二值变量是关键成分。 事件研究的目标是为了确定某个特定的事件是否会影 响到某项结果。
在假定TS.1-TS.5下,估计量 ˆ 2 SS是R / df的一 个2 无 偏估计量,其中df=n-k-1
定理10.4百度文库高斯-马尔可夫定理)
在假定TS.1-TS.5下,以X为条件,OLS估计量是最 优线性无偏估计量。
定理10.5(正态抽样分布)
在时间序列的CLM假定TS.1-TS.6下,以X为条件, OLS估计量遵循正态分布。而且,在虚拟假设下,每 个t统计量服从t分布,F统计量服从F分布,通常构造 的置信区间也是确当的。
LRP,并将 0 0 代1 入2模型
gfrt 0 0 pet 1 pet1 2 pet2
便得到
gfrt 0 (0 1 2 ) pet 1 pet1 2 pet2
0 0 pet 1( pet1 pet ) 2 ( pet2 pet )
一个q阶有限分布滞后模型可写成:
yt 0 0 zt 1zt1 q ztq ut
静态模型是上式的一种特例,当1, 2 , ,都q 为0即可。
冲击倾向总是同期z的系数 。
长期倾向便是所有变量 的0系数之和。
zt j
LRP 0 1 q
reg gfr pe ww2 pill
结果:
考虑生育率对pe变化的反应滞后,估计一个包含两 期滞后的分布滞后模型
命令:reg gfr pe ww2 pill pe_1 pe_2
在这个回归中,我们只有70次观测,这是因为pe滞 后两次减少了2次观测。
pe变量的系数估计得很不准确,每一个变量都不是 个别显著的。事实上,pet,pet-1和pet-2明显相关,这 种多重共线性使得估计每个滞后的影响非常困难。
假定 TS.6(正态性):误差 u独t 立于X,且具有独立同分布 Normal (0, 2 )
定理 10.1(OLS的无偏性)
在假定TS.1、TS.2和TS.3下,以X为条件,OLS估计 量是无偏的,并因此下式也无条件地成立:
E(ˆj ) j , j 0,1, k
定理10.2(OLS的样本方差)
Total
SS
12959.7886 13032.6443
25992.4329
df
MS
5 2591.95772 64 203.635067
69 376.701926
Number of obs =
F( 5, 64) =
Prob > F
=
R-squared
=
Adj R-squared =
Root MSE
=
命令:test pe_1 pe_2
式(10.19)中估计的 (命令:display _b[pe]+_b[pe_1]+_b[pe_2])
LRP=0.073-0.0058+0.034=0.101 但我们从式(10.19)中无法得到这个估计值的标准误。 为得到LRP估计值标准误的技巧:令 0 0 1表 示2
讨论指数(index number)的概念: (1)基期、基值; (2)标准的经济产出都是用真实价值表示的;
例10.3 波多黎各的就业和最低工资 研究美国的最低工资对波多黎各就业的影响。
prepopt:波多黎各第t年的就业率(就业人口占总人 口的比例); usgnpt:美国的真实国民生产总值(以10亿美元计) mincov:度量最低工资相对于平均最低工资的重要性。 mincov=(avgmin/avgwage)*avgcov,其中,avgmin是 平均最低工资,avgwage是总体平均工资,avgcov是 平均工资覆盖率。
.286055 -.6869196 -23.35091
102.427
说明 ˆ0 在较小的显著性水平上异于0。
本例说明:即使ˆj 都不是个别显著的,但LRP非常显 著。
例10.5 反倾销调查和化学产品进口
在美国开展反倾销调查,而后制定反倾销生产条例的过 程中,一些有意思的问题:
(1)在反倾销调查前的一段时期进口量异常吗? (2)反倾销调查后进口有明显的变化吗? (3)有利于美国产业的决策执行后,进口究竟减少了多
第十章 时间序列数据的基本回归分析
10.1 时间序列数据的性质
• 我们应该怎样认识时间序列数据的随机性?
• 回答:很明显,经济时间序列满足作为随机变量结果 所要求的直观条件,这些变量的结果都无法事先预料 到。(例如,我们今天不知道道琼斯工业指数在下一 个交易日收盘时会是多少,我们也不知道加拿大下一 年的年产出增长会是多少。)