Lecture 1 Stationary Time Series(计量经济学,英文版)
计量经济学(英文PPT)Chapter 21 Time Series Econometrics ⅠStationarity Unit roots and Cointegration
k
k
0
covariance at lag k variance
obviously when k 0, 1 0
1 1 k
plot against k, the graph we obtain is known as the population correlogram k
• Returning to the example given in figure 21.8,the value of the Q statistic up to lag 25 is about 793,the LB statistic is about 891,both are highly significant, the probability of obtaining such a high
• We can rewrite the functions above as,
Yt ( 1)Yt1 ut
(21.9.1)
• or,
• Yt Yt 1 ut
(-1.96*0.1066,1.96*0.1066) or (0.2089,0.2089)
10
• In figure 21.8,the left two lines of dots represent the 95% confidence interval.
the joint hypothesis test of k H0 : all the k are simultaneo usly equal to zero.
• This can be done by using the Q statistic developed by Box and Pierce,
计量经济学第六章-PPT课件
若模型有三个未知数,将数据三等分,分别求出 每部分的和,代入方程,得到三个方程,解方程 组可获得三个参数的估计值 10
模型的参数估计(续1)
参数的非线性最小二乘估计(第五章)
非线性模型可利用NLS进行参数的精确估计
首先,用param命令对参数赋初值 其次,输入方程,对模型进行估计
11
考虑选择指数曲线模型
2000000
1500000
1000000
500000
0 72 74 76 78 80 Y 82 84 YF 86 88 90 92
9
模型的参数估计
参数的最小二乘估计
常用的各类趋势模型参数估计仍常用OLS 其中,自变量为时间t
参数的三和值法(第五章)
若选用有增长上限的曲线趋势模型,当增长 上限事先不能确定时,可采用三和值法 基本思想
1961-1981年我国搪瓷面盆销售量数据如下 根据其变化,试以Gompertz曲线作为预测模型
由于增长上限L事先无法得知,参数估计可用NLS 在精确估计前,选择三和值法获得参数的初值 模型取对数转换成修正指数曲线 t ˆ y log L b log a log t
计算各段和值 根据参数计算公式计算参数值
产品市场生命周期
进入期 成长期 成熟期 衰退期
20
产品生命周期分析(续1)
f(t)
饱和点
进 成长期 入 期
成熟期 后 期 前 期
衰退期
t
21
产品生命周期分析(续2)
产品市场生命周期的各个阶段与某些趋势 模型存在大致的对应关系
计量经济学中的“条件”与“无条件”
计量经济学中的“条件”与“⽆条件”初学者难免困惑于计量经济学中诸多的 “条件” 与 “⽆条件”,⽐如条件概率与⽆条件概率,条件分布与⽆条件分布,条件期望与⽆条件期望,条件⽅差与⽆条件⽅差,条件中位数与⽆条件中位数,条件分位数与⽆条件分位数。
这些 “条件” 与 “⽆条件” 的概念,究竟有什么区别与联系,在实践中⼜该如何应⽤呢?本⽂将为你逐⼀辨析。
条件概率 vs ⽆条件概率什么是概率?简单说,概率(probability)就是在⼤量重复试验下,随机事件发⽣的频率趋向的某个稳定值。
⽐如,记随机事件 “下⾬” 为,则其发⽣的概率⼀般记为。
“⽆条件概率”(unconditional probability)其实就是我们⼀般所说的概率,只是为了与 “条件概率” 相区别,有时才强调它是 “⽆条件的”。
事实上,计量经济学更关⼼条件概率。
⽐如,记事件 “出太阳” 为,则在出太阳的前提条件下降⾬的 “条件概率” (conditional probability) 可定义为其中,为与同时发⽣的概率,参见下⾯的维恩图(Venn diagram)。
在此图中,矩形的⽅框表⽰整个世界(包括所有可能的随机试验结果,即样本空间),不妨将其⾯积标准化为 1。
圆形的⾯积即为事件发⽣的(⽆条件)概率,⽽圆形的⾯积则为事件发⽣的(⽆条件)概率。
考虑在给定发⽣情况下,发⽣的条件概率。
此时,世界所处的状态只能是,⽽之外的状态均为不可能。
进⼀步,在发⽣的情况下,如果也发⽣,则表明与同时发⽣,故为集合与集合的交集,即。
因此,将此交集的概率除以 “全集” 的发⽣概率,即为在给定发⽣情况下,发⽣的条件概率。
在实践中,究竟应该使⽤(⽆条件)概率还是条件概率呢?看⼀个简单例⼦就能明⽩。
⽐如,假设股市崩盘的(⽆条件)概率为万分之⼀;⽽在经济陷⼊严重萧条的情况下,股市崩盘的条件概率为百分之⼀。
此时,如果已知经济已陷⼊严重萧条,你会使⽤哪种概率来预测股市崩盘的可能性呢?如果仍使⽤万分之⼀的⽆条件概率,就显得过于僵化,因为既然经济已经严重萧条,⾃然应将此条件考虑在内,⽽使⽤百分之⼀的条件概率。
计量经济学时间序列
计量经济学中的时间序列是指按照时间顺序排列的一系列数据,这些数据可以是同一指标在不同时间点的观测值,也可以是多个指标在不同时间点的观测值组合。
时间序列数据的分析主要涉及两个方面:一是数据平稳性检验,二是数据建模与分析。
数据平稳性检验是时间序列分析中非常重要的一个步骤。
平稳性是指时间序列数据的统计特性不随时间推移而发生变化。
如果数据不满足平稳性条件,那么传统的回归分析方法可能会出现问题。
因此,在利用回归分析方法讨论经济变量有意义的经济关系之前,必须对经济变量时间序列的平稳性与非平稳性进行判断。
如果数据是非平稳的,可能需要采用适当的处理方法,如差分、对数转换等,使其满足平稳性条件。
在数据平稳性检验通过后,接下来需要进行数据建模与分析。
在计量经济学中,自回归模型(AR模型)是一种常用的时间序列模型。
自回归模型是统计上一种处理时间序列的方法,它用同一变数例如x 的之前各期,亦即x 1至x t-1来预测本期x t的表现,并假设它们为一线性关系。
除了自回归模型外,还有其他的模型可用于时间序列分析,如移动平均模型(MA模型)、自回归移动平均模型(ARMA模型)等。
这些模型的参数估计与假设检验方法也是计量经济学中研究的重点内容之一。
总之,计量经济学中的时间序列分析是一个相对独立且完整的领域,它为经济学、金融学等领域的研究提供了重要的方法论支持和实践指导。
计量经济学-第21章 时间序列计量经济学基础Ⅰ--平稳性、单位跟与协整
其中a是常数,ut 是平稳的,比如 E(ut ) 0,var(ut ) 2 ,
则这样的 Yt 过程叫做DSP
可见一个平稳时间序列可以用一个TS过程作为它的 模型,而一个非平稳时间序列则代表一个DS过程
对于存在随机趋势的时间序列的关系的分析需要做 协整以及非平稳性检验
在做PCE对PDI的回归时可以加进趋势变量t,消去PCE和PDI的时间趋 势。
当时我们曾经强调,只有当趋势变量是确定性的(deterministic),而不 是随机(stochastic)时,才可以这样做。
如果一个时间序列有一个单位根,则不能使用加进趋势变量t的方法来去 除趋势。
趋势平稳过程(trend-stationary process,简记为TSP),在下面的回归 中:
考虑一下模型
(21.3.4)
其中 ut 是均值为零,恒定方差且序列不相关的随 机误差项,即 ut 是white noise。
这是一个一阶自回归模型,Yt-1的系数为1,{Yt} 序列存在一个单位根。也就是说,{Yt}是一个非 平稳序列。
有一个单位根的时间序列叫做随机游走(时间序 列)。随机游走(random walk)是非平稳时间 序列的一个例子。
其中,n—样本容量,m—滞后长度 Q近似地(即在大样本中)服从m个自由度的
分布。
则拒绝全部 同时为零的虚拟 假设。也就是说,至少有一个(或一些) 是非零的。
设。
则不拒绝全部 为零的虚拟假
杨—博克斯(Ljung Box)构造的统计量是对博克 斯—皮尔斯(Box-Pierce)Q统计量的一种改进。
LB统计量比Q统计量具有更好的小样本性质。 图21.8中的例子,基于25期滞后的Q统计量为793, LB统计量为891,两者都是高度显著的,得到 值的P值几乎为零。
计量经济学模型讲义—— 时间序列模型
12.6 随机游走时间序列(random walk time series )
考虑下列简单模型: Yt = Yt-1 + ut (12.10) 随机误差ut的均值为零,方差为σ2。方程又可以写为: Yt-1 =Yt-2 + ut-1 最后 Yt = Y0 + Σut E(Yt) = Y0 var(Yt)=var(u1 + u2 + … + uT) = Tσ2 (12.10)可以写成 ΔYt = (Yt – Yt-1) = ut ∆Yt 是平稳的,因为E(∆Yt)=E(ut)=0,var(ut)=σ2。 (12.12) (12.13) (12.14) (12.15) (12.11)
(12.3) (12.4)
12.3 伪回归现象:非平稳时间序列
例12.2 美国1970.1Q-1991.4Q个人可支配收入(PDI)对个人消费 支出(PCE)的影响。 ^ PCE =-171.4412+0.9672*PDI (12.3)
t t
t = (-7.4809) (119.8711) p =(0.00000) (0.00000),R2=0.9940, d=0.5316 回归结果:R2很高,PDI回归系数的t检验值也很大,消费对PDI 的边际倾向(MPC)为正。缺陷是d较小。但是回归结果虽好, 却不是真实的,因为这一回归是伪回归(spurious regression)。 所谓的伪回归就是回归结果貌似很好,但却不表示经济变量之间 真正的相关关系。
12.1 动态模型的概念
为什么要研究分布滞后模型?三大因素的作用: 1. 心理上的原因 2. 技术上的原因 3. 制度上的原因 这些因素造成了因变量对解释变量的反应有一定的时滞 性。
Байду номын сангаас
计量经济学时间序列计量经济模型
计量经济学引子:是真回归还是伪回归?问题:•如果直接将非平稳时间序列当作平稳时间序列来进行分析,会造成什么不良后果;•如何判断一个时间序列是否为平稳序列;•当我们在计量经济分析中涉及到非平稳时间序列时,应作如何处理?第一节时间序列基本概念本节基本内容: •伪回归问题•随机过程的概念•时间序列的平稳性一、伪回归问题传统计量经济学模型的假定条件:序列的平稳性、正态性。
所谓“伪回归”,是指变量间本来不存在相依关系,但回归结果却得出存在相依关系的错误结论。
20 世纪70 年代,Grange、Newbold 研究发现,造成“伪回归”的根本原因在于时序序列变量的非平稳性三、时间序列的平稳性所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。
直观上,一个平稳的时间序列可以看作一条围绕其均值上下波动的曲线。
从理论上,有两种意义的平稳性,一是严格平稳,另一种是弱平稳。
时间序列的非平稳性是指时间序列的统计规律随着时间的位移而发生变化,即生成变量时间序列数据的随机过程的特征随时间而变化。
在实际中遇到的时间序列数据很可能是非平稳序列,而平稳性在计量经济建模中又具有重要地位,因此有必要对观测值的时间序列数据进行平稳性检验。
第二节时间序列平稳性的单位根检验本节基本内容: •单位根检验• Dickey -Fuller 检验• Augmented Dickey -Fuller 检验一、单位根过程单位根过程结论: 随机游动过程是非平稳的。
因此,检验序列的非平稳性就变为检验特征方程是否有单位根,这就是单位根检验方法的由来。
二、Dickey-Fuller 检验(DF检验)大多数经济变量呈现出强烈的趋势特征。
这些具有趋势特征的经济变量,当发生经济振荡或冲击后,一般会出现两种情形: • 受到振荡或冲击后,经济变量逐渐又回它们的长期趋势轨迹;•这些经济变量没有回到原有轨迹,而呈现出随机游走的状态。
若我们研究的经济变量遵从一个非平稳过程,一个变量对其他变量的回归可能会导致伪回归结果。
计量经济学(英文)重点知识点考试必备
计量经济学(英文)重点知识点考试必备第一章1.Econometrics(计量经济学):the social science in which the tools of economic theory, mathematics, and statistical inference are applied to the analysis of economic phenomena.the result of a certain outlook on the role of economics, consists of the application of mathematical statistics to economic data to lend empirical support to the models constructed by mathematical economics and to obtain numerical results.2.Econometric analysis proceeds along the following lines计量经济学分析步骤1)Creating a statement of theory or hypothesis.建立一个理论假说2)Collecting data.收集数据3)Specifying the mathematical model of theory.设定数学模型4)Specifying the statistical, or econometric, model of theory.设立统计或经济计量模型5)Estimating the parameters of the chosen econometric model.估计经济计量模型参数6)Checking for model adequacy : Model specification testing.核查模型的适用性:模型设定检验7)Testing the hypothesis derived from the model.检验自模型的假设8)Using the model for prediction or forecasting.利用模型进行预测●Step2:收集数据T hree types of data三类可用于分析的数据1)Time series(时间序列数据):Collected over a period of time,are collected at regular intervals.按时间跨度收集得到2)Cross-sectional截面数据:Collected over a period of time, are collected at regular intervals.按时间跨度收集得到3)Pooled data合并数据(上两种的结合)●Step3:设定数学模型1.plot scatter diagram or scattergram2.write the mathematical model●Step4:设立统计或经济计量模型C LFPR is dependent variable应变量C UNR is independent or explanatory variable独立或解释变量(自变量)W e give a catchall variable U to stand for all these neglected factorsI n linear regression analysis our primary objective is to explain the behavior of the dependent variable in relation to the behavior of one or more other variables, allowing for the data that the relationship between them is inexact.线性回归分析的主要目标就是解释一个变量(应变量)与其他一个或多个变量(自变量)只见的行为关系,当然这种关系并非完全正确●Step5:估计经济计量模型参数I n short, the estimated regression line gives the relationship between average CLFPR and CUNR 简言之,估计的回归直线给出了平均应变量和自变量之间的关系T hat is, on average, how the dependent variable responds to a unit change in theindependent variable.单位因变量的变化引起的自变量平均变化量的多少。
3.1 时间序列平稳性和单位根检验解析
• 则称该随机时间序列是平稳的(stationary), 而该随机过程是一平稳随机过程(stationary stochastic process)。
宽平稳、广义平稳
• 白噪声(white noise)过程是平稳的: Xt=t , t~N(0,2)
• 随机游走(random walk)过程是非平稳的: Xt=Xt-1+t , t~N(0,2) Var(Xt)=t2 • 随机游走的一阶差分(first difference)是平 稳的: Xt=Xt-Xt-1=t ,t~N(0,2)
• 数据非平稳,大样本下的统计推断基础——“一致 性”要求——被破怀。
• 数据非平稳,往往导致出现“虚假回归” (Spurious Regression)问题。
–表现为两个本来没有任何因果关系的变量,却有很高的 相关性。
–例如:如果有两列时间序列数据表现出一致的变化趋势 (非平稳的),即使它们没有任何有意义的关系,但进 行回归也可表现出较高的可决系数。
– 如果 时间 序列含有明显的随时间变化的某种趋势 (如上升或下降),也容易导致DF检验中的自相关 随机误差项问题。
• ADF检验模型
X t X t 1 i X t i t
⒈问题的提出
• 经典计量经济模型常用到的数据有:
– 时间序列数据(time-series data); – 截面数据(cross-sectional data)
– 平行/面板数据(panel data/time-series cross-section data)
• 时间序列数据是最常见,也是最常用到的数据。 • 经典回归分析暗含着一个重要假设:数据是平稳的。
如果t<临界值,则拒绝零假设H0: =0,认为时 间序列不存在单位根,是平稳的。
计量经济学第一章PPT课件
02 回归分析基础
回归分析的定义
回归分析
是一种统计学方法,用于研究变 量之间的关系,特别是当一个变 量受到其他变量的影响时。
线性回归
在回归分析中,当自变量和因变 量之间的关系为线性时,即可以 用一条直线来描述它们之间的关 系。
非线性回归
在回归分析中,当自变量和因变 量之间的关系为非线性时,即不 能用一条直线来描述它们之间的 关系。
最小二乘法
01
最小二乘法是一种数学优化技 术,用于找到最佳拟合数据点 的函数。
02
在回归分析中,最小二乘法的 目标是找到最佳拟合数据的直 线,使得实际观测值与预测值 之间的平方和最小。
03
最小二乘法通过求解线性方程 组来找到最佳拟合直线的参数 。
模型的检验与诊断
R方值
用于衡量模型拟合优度的统计量,其值越接近于1,说明模型拟合 效果越好。
计量经济学的研究范围涵盖了微观经济学、宏观 经济学、国际经济学、金融学等多个领域。
计量经济学的发展历程
19世纪末期
统计学和经济学的结合,产生了经济计量学。
20世纪30年代
经济大萧条,人们开始利用计量经济学方法 分析经济问题。
20世纪50年代
线性代数和计算机技术的发展,推动了计量 经济学的发展。
21世纪
模型的参数估计
总结词
参数估计是根据样本数据估计线性回归模型中未知参数的过 程。
详细描述
最小二乘法是最常用的参数估计方法,它通过最小化残差平 方和来估计参数。即,对于给定的样本数据,找到一组参数 值,使得实际观测值与模型预测值之间的残差平方和最小。
模型的假设检验
总结词
假设检验是用于评估线性回归模型是否满足某些假设的过程。
时间序列计量经济模型
程处于过渡阶段总是非平稳的。例如,飞机控制在
高度为 h 的水平向上飞行,由于受到大气湍流的影 响,实际飞行高度H(t)应在 h 水平面上下随机波动, H(t) 看作是平稳过程,但在升降阶段由于飞行的主 要条件随时间发生变化,因而H(t) 的主要特征也随 时间而变化,这时H(t) 是非平稳的。
二、随机过程的概念
有些随机现象,要认识它必须研究其发展变化 过程,这类随机现象已不能用一维或多维随机变量 来表达。
例1 在测量飞机的距离时存在随机误差,若以
e(t) 表示时刻t的测量误差,则它是一个随机变量,
飞机随时间t运动,测量误差也随时间t而变化,即
e(t) 是依赖于时间t的一族随机变量。则{e(t)}是一随
我们把
rt-s= Cov(Yt , Ys) 称为时间序列 {Yt} 的自相关函数。
自相关函数法就是看自相关函数是否为不随 时间变化的常数,若是则为平稳的。否则是非平 稳的。
一、单位根检验
在Yt = m + g Yt-1 + et 中,若m = 0,则有 Yt = g Yt-1 + et
称时间序列为1阶自回归过程,记为AR(1)。可以证
根据这一分布所作的检验称为DF检验。
步骤如下:
(1)用OLS估计一阶自回归模型
Yt = g Yt-1 + et
得到 g 的估计量 gˆ ;
(2)提出假设 H0: g = 1,计算常规 t 统计量:
t
gˆ g SEˆ (gˆ)
(3)查DF检验临界值表得临界值,检验:若t统计
量值大于或等于DF检验临界值,则拒绝原假设 ,
明当︱g ︱< 1时,是平稳的,其他情况是非平稳的。
时间序列计量经济学模型计量经济学
2 平稳性的定义
• 假定某个时间序列是由某一随机过程stochastic
process生成的;即假定时间序列Xtt=1; 2; …的 每一个数值都是从一个概率分布中随机得到;
如果满足下列条件:
– 均值EXt=是与时间t 无关的常数;
– 方差VarXt=2是与时间t 无关的常数;
– 协方差CovXt;Xt+k=k 是只与时期间隔k有关;与时间 t 无关的常数;
• 由于t统计量的向下偏倚性;它呈现围绕小于零均 值的偏态分布
显著性水平
0.01 0.05 0.10
样本容量 25 50 100 500
-3.75 -3.58 -3.51 -3.44 -3.00 -2.93 -2.89 -2.87 -2.63 -2.60 -2.58 -2.57
∝ t分布临界值 (n=∝)
•从GDPP1 的参数值看; 其t统计量的 值大于临界 值;不能拒绝 存在单位根 的零假设 至 此;可断定 GDPP时间 序列是非平 稳的
ADF检验在Eviews中的实现—检验△GDPP
•从△GDPP1的参 数值看;其t统计量 的值大于临界值;
不能拒绝存在单位 根的零假设 同时; 由于时间项项T的t
统计量也小于 AFD分布表中的 临界值;因此不能
拒绝不存在趋势项 的零假设 需进一
步检验模型2 在 1%置信度下
从△GDPP1的参 数值看;其统计量 的值大于临界值; 不能拒绝存在单 位根的零假设 同
时;由于常数项的 t统计量也小于 AFD分布表中的 临界值;因此不能 拒绝不存在趋势 项的零假设 需进
• 一个简单的检验过程:
– 同时估计出上述三个模型的适当形式;然后通过 ADF临界值表检验零假设H0:=0
中级计量经济学lecture1计量经济学初步PPT课件
第一讲:计量经济学初步
2011年2月
课程要求
中级计量经济学
▲掌握计量经济学的基本理论和方法 ▲能应用计量经济方法进行初步的经济、金融分 析与预测 ▲能运用SAS软件作一般性经济、金融计量分析
2Hale Waihona Puke 应具备的预备知识中级计量经济学
●《概率论与数理统计》基础
如随机变量、概率分布、期望、方差、协方差、点估计、 区间估计、假设检验、方差分析、正态分布、t 分布、F分 布等概念和性质
模型 ● 时间序列分析 ARIMA模型、ARCH&GARCH模型、VAR模型、单位根与协
整 ● 面板数据模型 ● SAS统计软件与实证计量经济学分析
4
课程讲授与考查
中级计量经济学
● 课程讲授
老师主讲+课堂讨论
● 课程考查
平时成绩 到课情况 课堂讨论 课外作业
期末考试
5
20%-30% 70%-80%
12
二、估计参数
中级计量经济学
为什么要对参数作估计?
一般来说参数是未知的,又是不可直接观测的。由于随 机项的存在,参数也不能通过变量值去精确计算。只能 通过变量样本观测值选择适当方法去估计。
准则:
参数估计值应符合“尽可能地接近总体参数真实值” 的准则。 (如何通过样本观测值去科学地估计总体模型的参数是 计量经济学的核心内容)
11
中级计量经济学
构成计量经济模型的基本要素
▪ 变量
不同时间、不同空间的表现不同,取值不同,是可以 观测的因素。
– 被解释变量与解释变量 – 定量变量与定性变量 – 当期变量与滞后变量
▪经济参数
表现经济变量相互依存程度的、决定经济结构和特征 的、相对稳定的因素,通常不能直接观测,由计量经 济学依据样本数据,利用估计方法给出估计值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
+ 0.5 t )] = 0.5,
3
Stationarity and Strict Stationarity
With autocovariance functions, we can define the covariance stationarity, or weak stationarity. In the literature, usually stationarity means weak stationarity, unless otherwise specified. Definition 2 (Stationarity or weak stationarity) The time series {Xt , t ∈ Z} (where Z is the integer set) is said to be stationary if
1500
Monthly S&P 500 Index Returns
0.2
0.1
1000
0
500
−0.1
0 1990 1992 1994 1996 1998 2000 2002 Time
−0.2 1990 1992 1994 1996 1998 2000 2002 Time
Figure 1: Plots of some economic variables
Lecture 1: Stationary Time Series
1
Introduction
If a random variable X is indexed to time, usually denoted by t, the observations {Xt , t ∈ T} is called a time series, where T is a time index set (for example, T = Z, the integer set). Time series data are very common in empirical economic studies. Figure 1 plots some frequently used variables. The upper left figure plots the quarterly GDP from 1947 to 2001; the upper right figure plots the the residuals after linear-detrending the logarithm of GDP; the lower left figure plots the monthly S&P 500 index data from 1990 to 2001; and the lower right figure plots the log difference of the monthly S&P. As you could see, these four series display quite different patterns over time. Investigating and modeling these different patterns is an important part of this course.
In this course, you will find that many of the techniques (estimation methods, inference procedures, etc) you have learned in your general econometrics course are still applicable in time series analysis. However, there are something special of time series data compared to cross sectional data. 1
2 ) < ∞ ∀ t ∈ Z. (I) E (Xt
(II) EXt = µ ∀ t ∈ Z. (III) γX (s, t) = γX (s + h, t + h) ∀ s, t, h ∈ Z. In other words, a stationary time series {Xt } must have three features: finite variation, constant first moment, and that the second moment γX (s, t) only depends on (t − s) and not depends on s or t. In light of the last point, we can rewrite the autocovariance function of a stationary process as γX (h) = Cov (Xt , Xt+h ) for t, h ∈ Z. 2
Also, when Xt is stationary, we must have γX (h) = γX (−h). When h = 0, γX (0) = Cov (Xt , Xt ) is the variance of Xt , so the autocorrelation function for a stationary time series {Xt } is defined to be ρX (h) = γX (h) . γX (0)
t
∼ iid(0, σ 2 ) and
Xt = δt + t . Then E (Xt ) = δt, which depends on t, therefore a process with linear trend is not stationary. Among stationary processes, there is simple type of process that is widely used in constructing more complicated processes. Example 4 (White noise): The time series t is said to be a white noise with mean zero and variance σ 2 , written as ∼ W N (0, σ 2 ) if and only if
t
has zero mean and covariance function as γ (h) = σ 2 if 0 if h=0 h=0
2
Autocovariance Functions
In modeling finite number of random variables, a covariance matrix is usually computed to summarize the dependence between these variables. For a time series {Xt }∞ t=−∞ , we need to model the dependence over infinite number of random variables. The autocovariance and autocorrelation functions provide us a tool for this purpose. Definition 1 (Autocovariance function). The autocovariance function of a time series {Xt } with V ar(Xt ) < ∞ is defined by γX (s, t) = Cov (Xs , Xt ) = E [(Xs − EXs )(Xt − EXt )]. Example 1 (Moving average process) Let
For example, when working with cross-sectional data, it usually makes sense to assume that the observations are independent from each other, however, time series data are very likely to display some degree of dependence over time. More importantly, for time series data, we could observe only one history of the realizations of this variable. For example, suppose you obtain a series of US weekly stock index data for the last 50 years. This sample can be said to be large in terms of sample size, however, it is still one data point, as it is only one of the many possible realizations.
12000
Detrended Log(GDP
0.1
6000 4000 2000 0 1950 1960 1970 1980 1990 2000 Time
0
−0.1
−0.2
1950 1960 1970 1980 1990 2000 Time
Monthly S&P 500 Index
2 ) = 1.25, and the autocoExample 1 (continued): In example 1, we see that E (Xt ) = 0, E (Xt variance functions does not depend on s or t. Actually we have γX (0) = 1.25, γX (1) = 0.5, and γx (h) = 0 for h > 1. Therefore, {Xt } is a stationary process. t Example 2 (Random walk) Let St be a random walk St = s=0 Xs with S0 = 0 and Xt is independent and identically distributed with mean zero and variance σ 2 . Then for h > 0,