谱分析方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章 谱分析方法
§1 绪论
一. 时间序列模型:
通过分析自相关就获得描述与预测时间序列可能够用模型的第一印象。
如1t t t y y a f --=这里t y 与1t y -相关性较大,而与2t y -相关较弱,为什么?
二.分析时间序列的两种方法
频谱法, 时间序列法-Box Jenkins 方法
三. 时间序列模型的五个特征(最重要的)描述趋势有多种方法 1. 趋势
t t y t a d m =++ 1,2,....,t n = 确定性趋势 11t t t t y y d m m ---=+- 随机趋势
2. 季节性: 111,22,,...t t t t s s t t y y D D D a a a m --=++++ 1,2,....,t n =
,s t D 是季节哑变量,定义为
,1s t D =, ()1t T S s =-+, 1,2,...,S S = 1,2,....,T N = ,0s t D = 其它
3. 异常观测值
异常观测值:在时间序列中,可能有一个或几个点,会对时间序列的建模与预测起到重要的作用。
这样的数据点称为奇异观测值。
4. 条件异方差
异常观测值倾向于成群出现,这个现象称为波动性集聚(vilatility clustering )条件异方差
()()2
2
112t t t t t y y y y a r m ----=+-+ 3,4,...
,t n = 5. 非线性: 状态依赖——机制转换特征
§2 谱分析
一. 时间序列分析的方法
1 时序分析方法:也就是时序建模方法,ARMA 等,也就是原序列的时间顺序不变。
2 频谱建模方法:单变量频谱建模技术
就是时间序列看作是有不同频率的正弦和余弦波组成。
其基本思想是:把时间序列看作是互不相关的周期(频率)分量的叠加,通过研究和比较各分量的周期变化,以充分揭示时间序列的频域结构,掌握其主要波动特征。
做法:对某个时间序列剔除趋势和季节因素后的循环项(平稳)进行
谱估计,根据估计出的普密度函数,找出序列中的主要频率分量,从而把握该序列的周期波动特征。
优点:当频率分量的行为或内在机制互不相同时,谱分析可以避免时域方法带来的混淆(因为时域方法所衡量的只是各频率分量共同叠加后的结果)更精细的研究各种行为及因素。
二. 基本原理
1. 对于确定性函数()X t ,周期为2T ,如果()X t 在[],T T -可积,并在t 点连续,则有如下的傅立叶级数展开:
()()()0
1
cos 2sin 22k k k k k X t a f t b f t a p p ¥
=轾=++臌å 其中()()1cos 2T
k k T a X t f t dt T p -=ò 0,1,2,..
k = ()()1sin 2T
k k T a X t f t dt T p -=ò 0,1,2,..
k = 2k k
f T
= 0,1,2,..k = 意义:周期函数通常可以分解为常数项02
a
与频率k f 的正弦和余弦函数之和。
为了方便,令00,,,1,2, (222)
k k k k
k k k a ib a ib A A A A k a --+=====
从而得到复数形式的傅氏级数展开
()2k i f t k k X t A e p ¥
=-?
=
å
()212k T
i f t k T
A X t e dt T p --=ò 0,1,2,.
k =北 其中k A 为振幅,k f 为频率
因此,周期函数()X t 可以表示成不同频率k f 及其对应的振幅k A 的正弦和余弦函数之和,这就是()X t 的谱表示。
在周期[],T T -内()X t 消耗的能量等于每一个不同频率的三角函数分量所消耗的能量之和:
()22
2
201222T
k k T
k k X T dt T A A T A ∞∞
-==-∞⎛⎫=+= ⎪⎝⎭
∑∑⎰ 单位时间上的能量消耗()X t 的功率为 ()2
2
12T
X k T
k P X
t dt A T
∞
-=-∞
=
=∑
⎰
即()X t 的总功率等于各频率分量的功率之和。
功率谱:功率依不同频率的分布,表示为
()2
,,0,1,...,
0,k k k
A f f k h f f f ⎧==±⎪=⎨
≠⎪⎩ 称此函数为功率谱密度函数。
三.一般确定性非周期函数()X t 的谱表示
构造以2T 为周期的函数()T X t ,满足
()()
()()
21,2,....
T T T X t X t T t T
X t nT X t n =-≤≤+==
则当()T X t 在[],T T -内可积,并在t 点连续的情况下,()T X t 进行傅立叶级数展开,在[],T T -内:
()()2k i f t
T k
k X t X t A e
dt π∞
-=-∞
==
∑
()()()
222212k k k k T
i f t i f t
T
k T
i f t i f t k
T
k X t e dt e T
X t e dt e f ππππ∞
--=-∞∞
--=-∞
⎛⎫
= ⎪⎝⎭
=
∆∑⎰
∑⎰
这里111
222k k k k k f f f T T T
--∆=-=
-=
,当,0k T f →∞∆→。
如果积分存在,则对任何t ,有
()()()
2i ft i ft X t X t e dt e df ππ+∞
+∞
--∞
-∞
=⎰
⎰
()X t 的功率为
()()()()222
=i ft X t dt X t G f e df dt
G f df
π+∞
+∞
+∞
-∞
-∞
-∞+∞
-∞
⎡⎤=⎢⎥⎣⎦⎰
⎰
⎰⎰
这里()()2i ft G f X t e dt π+∞--∞
=-⎰
,()()2i ft X t G f e dt π+∞
-∞=⎰
则()2
G f 是在频率f 处的能量密度,或称为连续能量谱密度。
而且非周期函
数()X t 的功率为()()
21
lim
02T
T
T X t dt T
-→∞=⎰。
§3 平稳过程的频域分析
一.
因为无法保证实现()X t 的周期性和可积性,因而需采取相应的手段。
对平稳过程的实现()X t 加以截取,构造新函数
()() 0 other
T X t T t T
X t -≤≤⎧⎪=⎨
⎪⎩ 其傅立叶展开为 ()()2i ft T T X t G f e df π+∞
-∞=⎰
这里()()()22T
i ft i ft T T T
G f X t e dt X t e dt ππ+∞
---∞
-==⎰
⎰
()2
T G f 是()T X t 的能量谱密度函数。
()T X t 的总能量无限,但功率()2
lim 2T G f T
→∞
却可能有限。
()2
lim
2T G f T
→∞
称为功率功率谱密度函数。
如果功率谱密度函数的期望()()2lim 2T
T G f h f E T →∞⎡⎤
⎢
⎥=⎢⎥
⎣⎦存在,则称为平稳过程()X t 的功率谱密度函数,简称功率谱或谱密度。
称()()f
H f h d θθ-∞=⎰称为
谱分布函数。
二.自协方差函数和谱密度()h f 的关系
定理1:平稳过程(){}X t 的谱密度()h f 存在,则过程()X t 的自协方差函数
()R τ有如下的傅立叶变换
()()()()2i ft h f R e dt F R πττ∞
--∞==⎰
()()()21[i f R h f e df F h f πττ∞
--∞
==⎰
即如果()X t 的自协方差函数()R τ绝对可积,()R d ττ∞
-∞
<∞⎰,则(){}X t 的谱
密度必定存在。
方差:()()20X
R h f df σ∞
-∞
==⎰,因为自相关函数()()
2X
R r ττσ=
,即方差代表平
稳过程的总平均功率。
标准化功率谱密度函数()()
2x
h f p f σ
=,他代表频率范围在(),f f df +内的分
量对总功率的贡献率。
()()
()22i f x
h f p f r e d πτττσ∞--∞
==⎰
即标准化谱密度()p f 是自相关函数()r τ的傅立叶变换。
谱密度()p f 的性质: 1)()1p f df ∞
-∞=⎰
2)对任何f ,()0p f ≥。
3)对实值过程,对于任何f ,满足()()p f p f =-。
积分谱()P f 具有下列性质: 1) ()01P f ≤≤。
2) ()0P -∞=,()1P ∞=。
3) ()P f 是f 的单调非减函数,即当12f f ≥时,()()12P f P f ≥。
定理2(维纳-辛钦定理):
自相关函数()r τ是某个平稳(连续)随机过程(){}X t 的自相关函数的充分必要条件是:存在一个函数()P f ,在(),-∞∞上具有分布函数的性质(即()()0,1P P -∞=+∞=,且()P f 是单调非减),使得对一切τ,()r τ可以表示成:
()()
()()
22i f i f r e dP f R e
dH f πτπτ
ττ∞
-∞
∞
-∞
==⎰⎰
()()()0,0H H R -∞=∞=分别称为自相关函数和自协方差函数的谱表示。
如果()P f 是绝对连续的分布函数,则对任何f 都存在谱密度函数
()()
dP f p f df
=
称随机过程(){}X t 具有纯连续谱。
如(),ARMA p q 过程。
三. 平稳时间序列的频域分析
1.平稳时间序列是平稳随机过程的特殊情况。
具有两种特殊性质: 1)t 只取整数值,因此自协方差和自相关函数只在整数点有定义。
2)谱密度只在[]11
22,f ∈-范围内有定义。
2.Wold 定理:序列(){},0,1,....r k k =±作为某个时间序列(){}X t 的自相关函
数的充分必要条件是:存在一个[]11
22,f ∈-上的单调非减函数()P f ,()()11
220,1
P P -==,使得 自相关函数()()12
12
2, k=0,1,....i fk r k e dP f π-=±⎰
自协方差()()12
12
2, 0,1,....i fk R k e dH f k π-==±⎰
()H f 称为非标准化积分谱。
()P f 为标准化积分谱。
当序列为实值,自相关函数为偶函数时,标准化谱密度函数:
()()()2
11
2212cos 2 x
k h f R k fk f σπ∞
==+-≤≤∑
()()()()()1
cos 212cos 2k k p f r k fk r k fk ππ∞∞
=-∞
==
=+∑∑1122 f -
≤≤
例:求白噪声的谱密度
其自协方差函数()2 0
0 k=1,2,....
k R k εσ⎧==⎨±±⎩
则()()()211
22211
22
1 h f f p f h f f εεσσ=-≤≤==-≤≤ 表明纯随机序列具有常值谱密度函数,意味着总功率或方差在[]
11
22,f ∈-上是均匀分布的,即每个频率成分对总功率或方差的贡献是一样的。
一般情况下,纯连续谱的时间序列的谱密度可划分为三种类型:
1)谱密度从频率0到频率1/2递减,高谱密度值集中在相对低频处,表明序列异常周期波动为主。
2)在高频处显示高谱密度,说明序列以短周期波动为主,比白噪声还不规则的随机过程。
3)谱密度主要集中在某个特定频率附近,意味着序列的变动主要是由这个频率所确定的周期波动。
f f
§4 功率谱密度函数的估计方法
一.几种常用指标
设(){}X t 为具有纯连续谱的平稳时间序列,其谱密度为()h f ,记()ˆN h f 为根据样本12,,...,n x x x 所得到的()h f 的估计量。
1.偏差()()()12ˆ N N b f E h f h f f ⎡⎤=-≤⎣⎦
当()0N b f =,则称此估计为无偏估计。
当N →∞,()0N b f →,()ˆN h f 为渐进无偏估计。
2.方差()()()2
var -N N N h f E h f Eh f ⎡⎤⎡⎤=⎣⎦⎣⎦ , 12 f ≤
它描述了()ˆN
h f 偏离均值的程度,方差越小,估计量越好。
3.均方误差:()()()()2
2
var N N N E h f h f h f b f ⎡⎤⎡⎤-=+⎣⎦⎣⎦ N →∞时, ()()2
0N E h f h f ⎡⎤-→⎣⎦,则()ˆN
h f 是()h f 在均方意义下的一致估计。
二.估计方法:非参数方法和参数方法 (一)非参数方法:周期图和窗谱估计
1.周期图估计:研究观测数据中可能隐藏的周期性
模型为()1
cos 2sin 2k
t i i i i t i X A f t B f t ππε==++∑
其中cos ; sin i i i i i i A C B C ψψ==-
从而()i i i i C arctg B A ψ==
估计的基本思想(寻找隐含周期的基本思路):
用一组足够密的备选频率12,,....f f 作选择,得到参数估计值 ()()()1
1
2
2
3
3
,,,,,.....A B A B A B ,
做出振幅的平方2
22i
i i C A B =+关于频率,1,2,...
i f i =的图形,根据平方振幅足够大处(即图形中较明显的峰值)作对应的备选频率,
便可识别出隐含周期频率,并同时得到相应的振幅2ˆi C 。
根据2ˆi
C 是否显著不同于零,可以判别其对应频率是否是隐含周期的频率。
定义周期图:()()()2
2
N I f A f B f =+⎡⎤⎡⎤⎣⎦⎣⎦ 1
2 f ≤
其中(
)1cos 2N t A f x ft π==;(
)1
sin 2N t B f x ft π==。
因此在备选频率
1
,1,2,....,
2
i i N f i N -==处,周期图为 ()()()222
ˆ4
i N i i N I I f A f B f C ==+=⎡⎤⎡⎤⎣⎦⎣⎦。
而且等价 ()()1
21
ˆN i fk
N k N I f R
k e π--=-+=
∑ 12
f ≤ 周期图恰好是从样本数据出发通过样本协方差函数的谱密度进行直接估计的统计量。
它有以下特点:
1)()0,h f N ≠→∞时,周期图方差趋向于谱密度的平方,即在均方误差意义下,不是一致估计;
2)对于不同的频率f ,()N I f 是渐进不相关的,当N 增大时,()N I f 特别不稳定,不平滑。
3.窗谱估计:对周期图进行截断,即对()()1
21
ˆN i fk
N k N I f R
k e π--=-+=
∑ 12
f ≤的两头的若干求和项去掉,从而得到谱密度的新估计量:
()()20
ˆˆM
i fk
k M
h f R
k e π-=-=∑,其中M 为小于N-1的正整数,称这个M 为截断点,
而上面的估计式称为截断周期图。
()()20ˆ1M
i fk k M
k E h f R k e N π-=-⎛⎫⎡⎤=- ⎪⎣⎦⎝⎭
∑
更一般的形式为()()()1
21
ˆˆN i fk
N
k N h f w k R
k e π--=-+=∑
其中()w k 为()ˆR k 的权函数,称为时窗函数或时窗。
()ˆN
h f 为窗谱估计。
(二)参数方法:ARMA 和极大熵谱估计
1.AR 和ARMA 谱估计
基于ARMA 模型的谱估计方法是近代谱分析中比较感兴趣的一种方法。
1)AR 谱估计
假设一个时间序列{}t X 是由()AR p 过程生成的,即
11,,,t t p t p t X a X a X ε-----=
()20,t
WN εεσ
其理论谱密度为
()2
2
2211....i f
i pf p h f a e
a e
εππσ--=
---
其估计量为
()2
2
2211....i f
i pf p h f a e
a e
εππσ--=
---
这种方法就是所谓的自回归谱估计或AR 谱估计。
2)ARMA 谱估计
1111,,,...t t p t p t t q t q X a X a X b b εεε-------=---
()20,t
WN εεσ
其理论谱密度为
()2
22122
2211....1....i f i qf q i f i pf p b e b e h f a e a e
ππεππσ-------=
---
其估计量为
()222122
2211....1....i f i qf q i f i pf
p b e b e h f a e a e ππεππσ-------=
--- 这种方法就是所谓的自回归谱估计或AR 谱估计。
3)极大熵估计(现代谱分析)
熵是一种不规则性的度量,现在用于表示不确定性的度量。
可用来度量随机变量或随机过程的不确定程度。
(1) 熵:()()1/21/2
ln S h h f df -=⎰
称为谱熵。
谱熵越大,则(){}X t 的随机性越
强,所受人为干预越少,包含信息越多。
(2) 极大熵准则,对于满足约束条件
()()1/2
21/2
, 0,1,...,i fk h f e df R k k p π-==±±⎰
使谱熵()S h 达到最大的()h f ,记为()ˆh f (极大熵谱估计)。
§4 谱分析在经济中的应用
须注意的问题
1)序列长度要大:至少100-200个数据。
2)数据需要预先处理:要求平稳序列、去掉长期趋势以及可能的季节性变化。
3)谱估计方法的选择。
4)窗函数的确定。
5)频率点的选取。
6)谱估计的计算。
参考教材:
1) 《经济计量学手册》17章 格兰杰著
2) 《经济周期波动的分析与预测》高铁梅等著 吉林大学出版社
3) 《时间序列分析:预测与控制》Box 和Jenkins 著 中国统计出版社 4)。