stata操作介绍之时间序列分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
102.6
0.628
3.31
1957
683.8
97
0.649
3.82
1958
680.9
87.5
0.66
2.47
1959
721.7
108
0.676
3.96
Page 14
STATA从入门到精通
2、 时间序列稳定性检验的stata实现
检验序列的平稳性,可以用phillips-perron检验,dickey-fuller检验, 以及应用GLS扩展的dickey-fuller检验。其基本命令格式如下:
Page 2
STATA从入门到精通
1、 定义时间序列在stata中的实现
在进行时间序列的分析之前,首先要定义变量为时间序列 数据。只有定义之后,才能对变量使用时间序列运算符号, 也才能使用时间序列分析的相关命令。定义时间序列用 tsset命令,其基本命令格式为:
tsset timevar [, options] 其中, timevar为时间变量。Options分为两类,或者定
注:(1)units表示时间单位,对于%tc,允许的时间单位包括:second、seconds、secs、secs、
minutes、minute、mine、min、hours、hour、days、weeks、week。对于其他%t的格式,Stata自动
获得其时间单位,delta选项经常与%tc格式一起使用。
【例2】继续使用上例的数据来对tssmooth命令的应用进 行说明。在本例中对该组数据进行修匀,以便消除不规则 变动的影响,得到时间序列长期趋势,本例修匀的方法是 利用之前的1个月和之后的2个月及本月进行平均。
Page 9
STATA从入门到精通
二、 ARIMA模型的估计、单位根与协整
时间序列模型一般分为四类,分别是自回归过程、移动平均过程、自 回归移动平均过程、单整自回归移动平均过程。
Page 12
STATA从入门到精通
以上三个命令格式的选项的相关描述分别如表4、5、6所示:
表4 corrgram_options的相关描述
表5 ac_options的相关描述
主要选项 lags(#)* noplot yw
描述
滞后阶数
不进行作图 通过Yule-Walker方程组,计算偏 自相关PAC
若随机过程yt 经过d 次差分之后可变换为一个以 (L)为p阶自回归算子, (L)为q阶移动平均算子的平稳、可逆的随机过程,则称yt 为(p, d, q)阶单 整(单积)自回归移动平均过程,记为ARIMA (p, d, q)。
Page 11
STATA从入门到精通
1、 时间序列相关性检验的stata实现
timevar的格式为%tc, 0=1jan1960 00:00:00.000,1=1jan1960 00:00:00.001 即0代表1960年1月1日的第一秒,1为1960年1月1日的第二秒,依次后推。 timevar的格式为%td,0=1jan1960,1=2jan1960;即0为1960年第一天,1 为1960年第二天,依次后推。 timevar的格式为%tw,0=1960w1,1=1960w2;即0为1960年第一周,1 为1960年第二周,依次后推。 timevar的格式为%tm,0=1,1=;即0为1960年第一月,1为1960年第二 月,依次后推。 timevar的格式为%tq,0=1960q1,1=1960q2;即0为1960年第一季,1为 1960年第二季,依次后推。 timevar的格式为%th,0=1960h1,1=1960h2;即0为从1960起的第一个半 年,1为从1960年起第二个半年,依次后推。 timevar的格式为%ty,1960=1960,1961=1960 timevar的格式为%tg
义时间单位,或者定义时间周期(即timevar两个观测值 之间的周期数)。Options的相关描述如表1所示。
Page 3
STATA从入门到精通
时间单位
格式说明
Clocktime
daily weekly monthly quarterly harfyearly yearly generic format(%fmt) 时间周期
【例1】使用文件“cpi.dta”的数据来对tsset命令的应用 进行说明。该例子是我国1983年1月年至2007年8月的居 民消费价格指数CPI。部分数据如表2所示:
表2 我国居民消费价格指数CPI
Year
1983 1983 1983 1983 1983 1983 1983
month
1 2 3 4 5 6 7
命令格式1(dickey-fuller检验): dfuller varname [if] [in] [,option] 命令格式2(GLS扩展的dickey-fuller检验): dfgls varname [if] [in] [, options] 命令格式3(phillips-perron检验): pperron varname [if] [in] [, options] 以上三个命令格式的选项的相关描述分别如表8、9、10所示:
在进行arima分析前,对序列的特征应该有相应的了解。包括自相关 图,偏自相关图和Q统计量。
自相关刻画它序列 的邻近数据之间存在多大程度的相关性。 偏自相关度量的是k期间距的相关而不考虑k -1期的相关。 p阶滞后的Q-统计量的原假设是:序列不存在p阶自相关;备选假设为百度文库序列
存在p阶自相关。
STATA从入门到精通
自回归移动平均过程
由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程, 记为ARMA(p, q), 其中p, q分别表示自回归和移动平均部分的最大阶数。 ARMA(p, q) 的一般表达式是
xt = 1xt-1 + 2xt-2 +…+ p xt-p + ut + 1ut-1 + 2 ut-2 + ...+ q ut-q
STATA 从入门到精通
时间序列分析
一、 基本时间序列模型的估计
在许多情况下,人们用时间序列的观测时期代表的时间作 为模型的解释变量,用来表示被解释变量随时间的自发变 化趋势。这种变量称为时间变量,也叫做趋势变量。
时间变量通常用t表示,其在用时间序列构建的计量经济 模型中得到广泛的应用,它可以单独作为一元线性回归模 型中的解释变量,也可以作多元线性回归模型中的一个解 释变量,其对应的回归系数表示被解释变量随时间变化的 变化趋势,时间变量也经常用在预测模型中。
Page 15
STATA从入门到精通
表8 dickey-fuller检验options的相关描述
主要选项
描述
noconstant
没有截据项
trend
包括时间趋势
drift
包括漂移项
regress
显示回归结果
lags(#)
滞后阶数
表9GLS扩展的dickey-fuller检验options的相关描述
从而得到GNP时间序列的类型。部分数据说明如表7所示。
年份
中国GNP
私人国内总 投资
GNP的隐性 价格折算因 子(1972=1)
半年期商业 票据利率
1953
623.6
85.3
0.588
2.52
1954
616.1
83.1
0.596
1.59
1955
657.5
103.8
0.608
2.19
1956
671.6
在Stata中实现相关性检验的基本命令格式如下所示:
命令格式1(做出自相关和偏自相关图): corrgram varname [if] [in] [, corrgram_options] 命令格式2(做出自相关图): ac varname [if] [in] [, ac_options] 命令格式3(做出自相关和偏自相关图): pac varname [if] [in] [, pac_options]
cpi
100.6 100.9 100.9 100.4 101.2 101.9 100.9
Page 6
STATA从入门到精通
2、 对时间序列进行修匀
时间序列的形成是各种不同的因素对事物的发展变化共同起 作用的结果。这些因素概括起来可以归纳为四类:长期趋势 因素、季节变动因素、循环变动因素和不规则变动因素。
主要选项
lags(#)* generate(ne wvar) level(#) fft
描述 滞后阶数 生成新变量,默认不做图 置信度,默认95% 通过傅里叶转化计算AC
表6 ac_options的相关描述
主要选项
描述
lags(#)*
generate(newvar) level(#) yw
滞后阶数
生成新变量,默认不做图 置信度,默认95% 通过Yule-Walker方程组,计算偏自相关PAC
用户定义的其他
例子
delta(#) delta((exp)) delta(#units)
delta((exp)units)
例如delta(1)或delta(2)
例如delta((7*24))
例如delta(7 days)或delta(15 minutes)或 delta(7 days 15 minutes)。见注(1) 例如delta((2+3) weeks)
单整自回归移动平均过程
对于ARMA过程(包括AR过程),如果特征方程(L) = 0 的全部根取值在单 位圆之外,则该过程是平稳的;如果若干个或全部根取值在单位圆之内,则 该过程是强非平稳的。除此之外还有第三种情形,即特征方程的若干根取值 恰好在单位圆上。这种根称为单位根,这种过程也是非平稳的。
Page 7
STATA从入门到精通
数据=修匀部分+粗糙部分,运用Stata进行修匀使用tssmooth命令, 其基本命令格式如下所示:
tssmooth smoother[type] newvar = exp [if] [in] [, ...]
其中smoother[type]有一系列目录,如下表3所示:
自回归过程
如果一个剔出均值和确定性成分的线性过程可表达为
xt = 1xt-1 + 2 xt-2 + … + p xt-p + ut
其中i, i = 1, … p 是自回归参数,ut 是白噪声过程,则称xt为p阶自 回归过程,用AR(p)表示。xt是由它的p个滞后变量的加权和以及ut相 加而成。
Page 13
STATA从入门到精通
【例3】使用文件“gnp.dta”的数据来对Stata中自相关与偏自相关的应用
进行说明。该数据给出了中国1953-1984年的国民生产总值GNP、私人国内
总投资I、GNP的隐性价格折算因子P(以1972为基期)、半年期商业票据利
率R。在本例中我们对GNP时间序列进行分析,观察期相关图和自相关图,
时间序列构成分析就是要观察现象在一个相当长的时期内, 由于各个影响因素的影响,使事物发展变化中出现的长期趋 势、季节变动、循环变动和不规则变动。
通过测定和分析过去一段时间之内现象的发展趋势,可以认 识和掌握现象发展变化的规律性,为统计预测提供必要的条 件,同时也可以消除原有时间序列中长期趋势的影响,更好 地研究季节变动和循环变动等问题。测定和分析长期趋势的 主要方法是对时间序列进行修匀。
平滑的种类
smoother[type]
移动平均
不加权
ma
加权
ma
递归
单指数过滤器 双指数过滤器 非季节性Holt-Winters修匀 季节性Holt-Winters修匀 非线性过滤器
exponential dexponential hwinters shwinters nl
Page 8
STATA从入门到精通
Page 4
STATA从入门到精通
可以通过以下三种方式来定义时间序列。例如,想要生成 格式为%td的时间序列,并定义该时间序列为t,则可以用 以下三种方法:
方法1
方法2
方法3
format t %td tsset t
tsset t,daily formtsaste(%t tt,d)
Page 5
STATA从入门到精通
移动平均过程
如果一个剔出均值和确定性成分的线性随机过程可用下式表达
xt = ut + 1 ut –1 + 2 ut -2 + … + q ut – q
其中 1, 2, …, q是回归参数,ut为白噪声过程,则上式称为q阶移
动平均过程,记为MA(q) 。
Page 10