第2章平稳时间序列模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 平稳时间序列模型
本章将介绍Box-Jenkins 方法,主要包括一元平稳时间序列的识别、估计、诊断和预测方法。
2.1 平稳性
时间序列t y 的均值和协方差 ()t t E y μ=
,cov(,)[()()]t s t t s s t s y y E y y μμγ=--=
一个随机过程的线性性质可由均值和协方差来描述。
如果这个过程是正态过程, ,,t t s μγ可以完全刻画这个随机过程的分布性质。
如果没有正态性质,但生成过程是线性的,则在它的均值和方差中可获得关于这个过程的更多的重要特征。
下面的问题是如何来估计t μ,对于一些过程我们可以得到大量的实现(反复做观测),1,2,,.1,2,,.jt y t n j k ==那么,t μ的估计是
1
1ˆk
t jt j y k μ
==∑
但对大多数过程来说,得不到更多的实现。
如,不可能把经济停下来,然后重新开始观测。
对一个实现,不可能估计出t μ。
为了克服这个困难,时间序列分析要做如下的假设:均值和方差不随时间而改变。
如果对任何t, t-s, 都有
μ==-)()(s t t y E y E
2
22)()(y s t t y E y E σμμ=-=--
s s j t j t s t t y y y y γ==----),cov(),cov(
这里 2,y μσ都是常量,与时间无关,s γ是依赖于s 的常量。
这样的随机过程称为协方差平稳。
可以简单地说,如果一个时间序列的均值和协方差不受时间变化影响,则称这个时间序列是协方差平稳。
在一些文献中,协方差平稳的过程也称为弱平稳,二阶矩平稳或宽平稳过程。
(注意一个强平稳过程不一定有有限的均值和方差)。
一个更进一步的假设是遍历性(ergodic )。
这是一个较难理解的一个概念。
遍历性是指,按时间平均
1
1n
n t t y y n ==∑
是总体均值μ的无偏、一致估计。
即(),()0,()n n E y Var y n μ=↓→∞。
同理,s γ的估计也是一致的。
因此,如果有平稳性和遍历性的假设,利用关于时间的平均,就可以得到较好的估计。
遍历性的一个必要条件(但不充分)是
0()s s γ→→∞。
对于一个协方差平稳的序列,t y 和s t y -之间的自相关系数可定义为
0/γγρs s =
因此, 1-t t y y 和之间的自相关系数与1---s t s t y y 和之间的自相关系数相同,显然10=ρ。
序列,0,1,2,,s s ρ=描述了这个过程的一个值与先
前的值的相关程度,所以自相关系数可用来测量过程本身的记忆性的长度和强度,即在时刻t 的值与时刻t-s 的值的相关程度。
,0,1,2,,s s ρ=的图形被称为相关图。
用来刻画这个过程生成机制
的线性性质。
2.2 自回归模型
如果一个时间序列t y 可表示成
1,
t t t t y y αεε-=+是零均值白噪声
则称t y 为一阶自回归过程。
记为t y ~(1)AR 。
由Yule (1927) 引入,起源于实践。
如,每月的失业人数可认为是上月失业人数的一个固定比例,加上寻求职业的工人数。
如果这些人数形成一个白噪声序列,那么,失业序列就是一阶自回归。
更一般的形式
01p
t j t j t
j y y ααε-==++∑
称为p 阶自回归过程。
记为t
y ()AR p 。
如果0
()1p
j j j z z αα==-∑=0的根在单位园1z =外,则过程t y 是平稳
的。
用滞后算子表示为 ()t t L y αε=,它的一般解为 1
()
t t y L εα=。
如果平稳性条件成立,则,00
1t j t j j y b b ε∞
-===∑。
这里,0
()1()j j j b L b L L α∞
===∑。
特别地,如果t y ~(1)AR 那么,()1z z αα=-,所以,
0j t t j j y αε∞
-==∑ (2.2.1)
如果()0t E ε=,则2
222
()1j
t j Var y εεσσα
α
∞
===-∑,由此可看出,如果1α≥,t y 的解具有发散性质。
2.3 运动平均模型 一般的运动平均的模型是 ∑--=q
i i t i t x 0εβ
按这样方式构成的序列被称为阶为q 的运动平均,记为t x ~MA(q)。
运动平均过程由Yule (1926)引出,Wold (1938)进行了详细地研究。
如果一个经济变量处在均衡中, 如果受到来自经济系统内部(或外部)不可预期事件的冲击而偏离原来状态。
如果本系统并不能立刻吸收这些冲击效应,那么,将出现一个运动平均模型。
如,一个小型商品市场得到了一系列关于农产品状况的信息, 一条特别新闻对价格有即时影响,也有不同程度的滞后影响,令
t y 表示价格在
t 处的变化,假设这种冲击影响价格变化,直到q
天,这种冲击影响消失。
这时,较适当的模型是MA(q)
11t t t q t q y εβεβε--=++
+
如果影响是逐渐消失,(01j j βαα=<<),1,2,j =
,即j 天前的影
响是j
α,则 0
j t t j j y αε∞
-==∑, 由(2.2.1),t y 可表示成
1t t t y y αε-=+
这时,()MA ∞过程等价于(1)AR 过程。
由2.2节知道,平稳的()AR p 过程可以写成()MA ∞,那么,如
果0
()1q
j j j z z ββ==-∑的根在单位园外(可逆性性条件成立),则()
MA q 过程∑=-=q
j j t j t y 0
εβ可以写成()AR ∞过程。
2.4 ARMA 模型
将自回归模型和运动平均模型结合起来,
01
p
q
t i t i i t i i i y y ααβε--===++∑∑ (2.4.1)
总可以将0β标准化成1,如果自回归部分和运动平均部分的滞后阶数分别为p,q ,模型被称为ARMA(p,q)。
如果q=0,这过程被称为自回归过程AR(p), 如果p=0, 这过程是运动平均过程MA(q)。
在ARMA 模型中,允许p,q 是无限的。
用滞后算子表示为 ()()t t L y L αβε=
这里1
()1,()1p
q
j
j j j j j L L L L ααββ===-=-∑∑。
这时容易知道:
(1) 如果()0z α=的根在单位园外,则过程是平稳的。
(2) 如果过程是平稳的,则有一个等价的()MA ∞过程
00,1t j t j j y c c ε∞
-===∑。
(3) 如果()0z β=的根在单位园1z =外(通常称为可逆性条
件),则有一个等价的()AR ∞过程1t j t j t j y d y ε∞
-==+∑。
这说明,一个平稳的ARMA 过程}{t y 可以逼近高阶MA 过程。
如果过程}{t y 满足可逆性条件, 这过程可以逼近高阶AR 过程。
2.5 自相关函数
Box-Jenkins(1976)在识别和估计时间序列时,给出了非常有用的工具是自协方差和自相关。
如AR(1)模型t t t y a a y ε++=-110 )1/(2120a -=σγ )1/(2112a a s s -=σγ
每个0γγ用s 除,得到自相关s s a a a 1212110,,,,1====ρρρρ 。
对于AR(1)过程,平稳的必要条件是11<a 。
s ρ相对 s 的图形称为自相关函数(ACF)。
因此,如果这个序列是平稳的,这个自相关函数是几何收敛到零。
如果1a 是正的,则这个自相关函数直接收敛到零。
如果1a 是负的,这个自相关函数按振荡的方式收敛到零。
AR(2)过程的自相关函数
t t t t y a y a y ε++=--2211 (2.5.1)
这里省略了截距项0a ,这是因为截距不影响ACF 。
下面利用Yule-Walker 方程的方法:用s t y -分别乘方程(2.5.1)两边,并取期望,可得
,2,1,02211=++=------s y E y Ey a y Ey a y Ey s
t t s t t s t t s t t ε
由于 2,0t t t t s E y E y εσε-==,可得
222110σγγγ++=a a (2.5.2) 12011γγγa a += (2.5.3) 2211--+=s s s a a γγγ (2.5.4)
用0γ除方程(2.5.3),(2.5.4)得
12011ρρρa a += (2.5.5) 2211--+=s s s a a ρρρ (2.5.6) 由10=ρ,有)1/(211a a -=ρ,因此,利用方程(2.5.6)可求出所有
2,≥s s ρ。
对于二阶过程的平稳性限制条件是21210a z a z --=的根在单位圆外,如果根是实的,自相关按指数衰减;如果根是复的,自相关按震荡式衰减。
MA(1)过程的自相关函数
下面考虑MA(1)过程1-+=t t t y βεε。
用s t y -乘方程两边,并取期望,可得Yule-Walker 方程
22110)1()])([()(σββεεβεεγ+=++===--t t t t t t t E y Ey y Var 221111)])([(βσβεεβεεγ=++==----t t t t t t E y Ey
并
1,0)])([(11>=++==-----s E y Ey s t s t t t s t t s βεεβεεγ,
用0γ除s γ可得ACF :1,0),1/(,1210>=+==s s ρββρρ。
下面求MA(q) 过程∑=-=q
j j t j t y 0εβ,01β=的自相关函数。
111111t t t s t s s t s s t s q t q y εβεβεβεβεβε---+-+---=++++++
+ 11t s t s t s q s t q y εβεβε------=
++
+q t q s βε--+
+
所以,21122()[],s t t s s s s q s q E y y s q εγσβββββββ-++-==++++≤ 0,
s s q γ=>。
因此,对充分大的,0s s γ→。
下面求ARMA(1,1)过程的自相关函数
考虑ARMA(1,1)过程1111--++=t t t t y a y εβε,可同样求出Yule-Walker 方程:
211121101111)(σββσγγεβε+++=⇒++=--a a y E y E y Ey a y Ey t t t t t t t t
2101111111111σβγγεβε+=⇒++=------a y E y E y Ey a y Ey t t t t t t t t 11221122112γγεβεa y E y E y Ey a y Ey t t t t t t t t =⇒++=------
111111-------=⇒++=s s s t t s t t s t t s t t a y E y E y Ey a y Ey γγεβε
因此, 2
2111210)
1(21σββγa a -++=
2
2
111111)1())(1(σββγa a a -++=
2
11211111)
21())(1(σββββρa a a ++++=
2,11≥=-s a s s ρρ。
因此,ARMA(1,1)的ACF 类似于AR(1)的ACF 。
如果,101<<a 收敛
是直接的,如果011<<-a ,收敛是振荡的。
2.6 偏自相关函数
为了说明偏自相关函数的作用,考虑自回归过程AR(p)
1(1)p
i i t t i L y αε=-=∑
则有1
,0p
s j s j j s γαγ-==>∑,两端同除0γ得
1
,0p
s j s j j s ραρ-==>∑
对任何随机过程,偏自相关kk φ被定义为下面方程的解: 1,0,1,2,,k
s kj s j j s k ρφρ-===∑
因而,对任何阶为p 的自回归过程,偏自相关pp p φα=,阶数大于p 的偏自相关为零。
s t t y y -和 之间的偏自相关不依赖于s t t y y -和 之间的11,,t t s y y --+们的相关性。
求偏自相关函数的直接方法是:首先从序列中减去序列的平均值,获得一个新序列μ-=*t t y y ,然后构造一阶自回归
t t t e y y +=*-*111φ,
这里t e 是误差项,可以不是白噪声。
这时,11φ既是1-t t y y 和之间的 自相关也是偏自相关。
构造二阶自回归
t t t t e y y y ++=*-*-*222121φφ
22φ是2-t t y y 和之间的偏自相关函数。
即22φ是2-t t y y 和之间除去1t y -的影响后的相关系数。
重复这个过程得到偏自相关函数(PACF)。
大多数统计计算软
件包都有相应的计算程序。
下面给出了各种ARMA 过程的ACF 和PACF 的性质。
表2.6.1 ACF 和PACF 的性质
过程 ACF
PACF 白噪声
所有)0(,0≠=s s ρ
所有0=ss φ
AR(1):01>a , 指数衰减:s s a 1=ρ 2,0,111≥==s ss φρφ AR(1):01<a , 振荡衰减:s s a 1=ρ 2,0,111≥==s ss φρφ
AR(p)
衰减(可以振荡)到零
在p 期前有峰值,但在p 期之后p s ss ≥=,0φ
MA(1):0>β
在滞后1期处有正峰值,但2,0≥=s s ρ
振荡衰减,011>φ MA(1):0<β
在滞后1期处有负峰值,但2,0≥=s s ρ
几何衰减,011<φ ARMA(1,1) 01>a
在滞后1期处开始按几何衰减
)(11βρ+=a Sign Sign
在滞后1期处振荡衰减 111ρφ=
ARMA(1,1) 01<a
在滞后1期处开始振荡衰减
)(11βρ+=a Sign Sign
在滞后1期处按指数衰减
11111,ss Sign Sign φρφφ==
ARMA(p,q) 在滞后q 期开始衰减 (或直接或振荡)
在滞后p 期开始衰减 (或直接或振荡)
2.7 平稳序列的样本自相关
在实际中,一个序列的理论均值、方差、自相关通常是未知的。
如果这序列是平稳的,我们可以用样本均值,样本方差,样本自相
关来估计它们。
假设有T 个观测值T y y ,,1 ,令2ˆ,,y σ
ˆs r 是s ρσμ,,2的估计量: ∑==T
t t
y T y 1
1
∑=-=T
t t y y T 1
22
)(1ˆσ
对每个 ,2,1=s
12
1
()()
ˆ()T
t
t s t s s T
t
t y
y y y r
y
y -=+=--=-∑∑
可用样本自相关函数ACF 和样本偏相关函数PACF 与理论值做比较来识别数据生成过程的性质。
Box-Jenkins(1976)在t y 是平稳具有正态误差假设下,讨论
了样本值s r 的分布和i p i p ++,ˆφ的分布。
在零假设0:H 0s r =下,ˆs r
渐近服从均值为零的正态分布,其中方差为
1
(),1s Var r s T
=
= 1
21
1
ˆ(12),1s j j r
s T -==+>∑ (2.7.1)
在零假设0,:0p i p i H φ++=下,i p i p ++,ˆφ渐近服从均值为零的正态分布,其中,i p i p ++,ˆφ的方差渐近于
T
1。
在实际检验中,我们可以使用这些样本值来构造样本自相关
s r 和偏相关函数kk φ,利用(2.7.1)进行显著性检验。
例如,如果我们使用95%置信区间(即,2个标准差),且计算出的1r 值大于T /2,则拒绝零假设-一阶自相关在统计意义上不是显著异于零。
拒绝零假设意味着接受备择假设1>s 。
下面检验是否20;r = 这时,221()(12)/Var r r T =+,如果10.5,100,r T == 则2()Var r =0.015,标准差为0.123。
如果 2r 超过123.02⨯,则拒绝假设02=r 。
因此,拒绝零假设意味着接受备择假设2>s 。
重复上述过
程,我们可确定这个过程的阶数。
Q-统计量可用来检验自相关是否显著不为零,Box-Pierce (1970) 利用样本自相关构造了统计量
∑==s
k k r T Q 12
在0:0=k r H 下,Q 是渐近2x -分布,自由度为s ,较高的样本自相关可导致较大Q 的值。
显然,白噪声过程(所有的自相关都为零)的Q 值为零。
如果Q 的值超过2χ表中的临界值,我们可以拒绝零假设( 各阶自相关都为零),意味着接受备择假设:至少有一个自相关不为零。
然而,即使在大样本情况下,Box-Pierce 的Q 统计量有偏差,Ljung 和Box(1978)给出了修正的Q-统计量
∑=-+=s
k k k T r T T Q 12)/()2(
如果这个Q 值超过)(2s χ表中的临界值,那么至少有一个k r 在给定的显著水平上显著不为零。
Box-Pierce 和Ljung-Box 的Q 统计
量也可用来检验来自于ARMA(p,q)模型的残差是否为白噪声。
但是,如果对ARMA(p,q) 模型的残差计算s个自相关,则Q统计量的自由度就会由待估计的系数个数增加而减少。
因此,如果检验ARMA(p,q)模型的残差时,Q统计量有自由度为s-p-q的2χ分布,(如果包含常数的话,自由度就是s-p-q-1)。
2.8 选择模型准则
一个自然的问题是:所选择的模型拟合数据效果如何?增加滞后阶数一定能减少残差平方和。
但是增加滞后阶数需要估计更多的参数,使自由度减少。
而且,系数个数的增加降低预测的精度。
因而产生了各种选择模型的准则(能降低残差平方的更节俭的模型)。
有两个通常使用的准则是Akaike信息准则(AIC)和Schwartz Bayesian准则(SBC).
AIC=T ln(残差平方和)+2n
SBC=T ln(残差平方和)+n ln(T)
这里n=估计的参数的个数(p+q+常数项个数),T=观测值个数。
当使用滞后变量估计模型时,一些观测值被损失。
为了比较选择的模型,T应当是固定的。
当然希望AIC和SBC尽可能小(也可能是负的),随着模型拟合的改进,AIC和SBC将趋于∞
-。
我们能利用这些准则,选择最适合的模型。
如果模型A的AIC(或SBC)小于模型B的AIC (或SBC),我们就说模型A拟合的比B好。
在使用这些准则对不同的模型进行比较时,必须在相同的样本期间内进行估计,以
使它们可进行比较。
回归变量个数n 的增加,可以降低残差平方和。
因此,如果一个回归变量没有解释能力,把它添加到模型中会引起AIC 和SBC 增加。
由于ln(T)大于2,所以,SBC 总是比AIC 选择更节俭的模型。
两个准则中,SBC 有更好的大样本性质。
令数据生成过程的真正阶为),(**q p ,假设我们利用AIC 和SBC 估计阶为(p,q)的ARMA 模型,这里*≥p p *≥q q ,当样本个数趋于无穷时,AIC 和SBC 都将选择阶数大于等于),(**q p 的模型。
然而,AIC 倾向于选择参数过多的模型,而SBC 却是渐进一致的。
但在小样本中,AIC 优于 SBC 。
如果AIC 和SBC 选择了同一模型,对这个模型就应当有较大的信心。
如果两个准则选择了不同的模型,这时就需要再进一步的分析。
由于SBC 倾向于选择更节俭的模型,所以一旦选择了这个节俭模型,还需要检验残差是否为白噪声。
因为AIC 能选择参数过多的模型,所有系数的t-统计量都应是显著的(在适当的显著水平下)。
以后我们还会介绍更多的诊断检验来检验模型的充足性。
2.9 AR(1)模型的估计
让我们用一个例子说明利用样本自相关、偏相关函数来识别ARMA 模型。
利用计算机生成100个正态分布的随机数(方差为1),这些随机变量称为100,,2,1,⋅⋅⋅=t t ε.t y 由t 1t t 7y .0y ε+=-和初始条件
0y 0=生成
上图给出了样本自相关和偏自相关函数的图形。
在实际中,我们不知道真实的数据生成过程。
假设我们利用这100个数据(样本值)来找出真正过程。
第一步,比较ACF 和PACF 。
ACF 的衰减和PACF 在滞后一阶处的截尾说明了AR(1)模型。
前三个自相关123r 0.74,r 0.58,
r 0.47===(有时大于理论值
21r 0.7,0.49(0.7),0.343==)。
在PACF 中,滞后1阶处有一个显著的
高峰值0.74,所有其它偏自相关(除在滞后12阶处)都非常小。
在零假设01H :=0,r 下, 1r 的标准差是1.0T
2
1
=-,因为1r =0.74
的样本值大于7个标准差。
我们可以拒绝1r =0的零假设。
再计算
2r 方差
021.0100/))74.0(21()r (Var 22=+=
因为2r 的标准差1449.0)021.0(2
1
=,2r 的样本值大于3倍(0.58/0.15)的标准差;在通常的显著水平下,我们可以拒绝2r =0的零假设。
我们可同样检验其它自相关值的显著性。
除11φ外,所有偏自相关函数(除滞后12阶外),都小于2.02T 2
/1=-。
ACF
的衰减和PACF
的一个高峰值建议了一阶自回归模型。
然而,如果我们不知道真正过程,而且使用了月度数据,这时需要关注偏自相关函数在滞
后12阶处的显著性,需要关注t y 和12t y -的直接关系。
尽管我们这里知道这过程是由AR(1) 生成的,下面我们将两个不同的模型作一比较。
假设我们估计AR(1)模型,并试图用MA 系数捕捉的在滞后12阶处峰值。
因此,考虑两个模型
模型1:t 1t 1t y y a ε-=+ 模型2:t 1t 1t 12t 12y y a εβε--=++
下表报告了两个估计结果,模型1的系数满足稳定性条件11a <且标准差较低(零假设的t-统计量值大于12)。
作为诊断检验,也可以做出拟合模型的残差的相关图。
这些残差的Q-统计量说明:每个自相关都小于2倍标准差。
这些残差的Ljung-Box 的Q –统计量说明:Q(8)、Q(12)、Q(24)都显著为零(接受原假设)。
这强烈说明AR(1)模型拟合数据拟合的较好。
如果残差的自相关是显著的,说明AR(1)模型没能利用所有t y 信息。
考察模型2,注意两个模型产生类似的一阶自回归系数和标
准差。
然而,系数12β的估计是不显著的,应该被去掉。
通过比较两个模型的AIC 和SBC ,降低残差平方和的益处会被估计更多参数带来的不利影响所抵消。
这些都说明应该选择模型1。
2.10 ARMA(1.1) 模型的估计
构造第二个序列}{t y ,来说明ARMA(1.1)模型的估计。
给定100个正态分布的序列}{},{t t y ε按如下生成 117.07.0---+-=t t t t y y εε 这里00,εy 都为零。
样本ACF 和PACF 的图
如果数据生成过程是未知的,还要关注一些相近的情形。
AR(2)模型也许能产生类似上图的ACF 和PACF 。
考虑三个模型
模型1:t t t y a y ε+=-11
模型2:1111--++=t t t t y a y εβε 模型3: t t t t y a y a y ε++=--2211
下表给出估计结果:
ARMA(1.1) 模型的估计
有上表可看出:所有
a的估计值都是高度显著的。
每个估计值至
1
少是8倍的标准差。
显然AR(1)模型是不适合的。
模型1的Q统计量说明:在残差中有显著的自相关性。
而ARMA(1.1)并不存在这样问题。
而且,AIC和SBC都建议选择模型2。
同样的理由也说明选择模型2比选择模型3较为适合。
我们还可注意到:对每个模型,估计的系数都是高度显著的。
虽然在滞后24阶处,Q-统计量没有说明这两个模型的残差中有自相关,在滞后8阶处,Q-统计量指出了模型3的残差中有序列相关。
因此,AR(2)模型也没能像ARMA(1.1)模型捕捉到短期动态。
AIC和SBC都选择了模型2。
消费价格指数
序列存在自相关:
关于ARMA 模型的预测
考虑一个平稳的ARMA(p,q)模型
t t L y L εβα)()(=
q t q t t p t p t t y y y ----+++++++=εβεβεααα 11110
在T 时刻的最小均方误差(MMSE )预测h T h T f y ++=由条件期望给出h T f +=E [ ,,11110--+-++-+++++++++T T q h T q h T h T p h T p h T y y y y εβεβεααα], 现在有
⎩⎨⎧>≤=++-+0
,
0),(,
,1j f j y
y y y E h T j T T T j T ,
⎩
⎨⎧>≤=+-+0,00),(,
,1j j y y E j T T T j T ε
ε , (1) 当0≤j 时,用已知值j T y +,j T +ε代替过去的期望值; (2) 当0>j 时,用预测值j T f +,0代替将来的期望值; 例子, 考虑一个AR(2)模型 t t t t y y y εααα+++=--22110
h T h T h T h T y y y +-+-+++++=εααα22110
当1=h 时,12101-+++=T T T y y f ααα 当2=h 时,T T T y f f 21102ααα++=++ 当2>h 时,22110-+-++++=h T h T h T f f f ααα
也可写成 )()(2121210-+-+-++-+++=h T h T h T h T f f f f αααα 反复迭代,有
)()()()(211
212211
210j h T j h T h j j T h
h j j
h T f f y f --+--+-=-=+-+++++=∑∑αααααααα
对于平稳过程(1,1221<<+ααα),有 当∞→h 时,
)(12
10
t h T y E f =--=
+ααα
因此,对于平稳过程长期最好预测是该过程的均值。
方差的平稳性
设有 t t t y εμ+=, t μ是常数序列
假设t ε方差与t μ有下面关系
22)()()(σμεt t t h V y V == )(⋅h 是某个已知函数。
找一个函数变换)(⋅g 使)(t y g 的方差是常数:
)()()()(t t t t t g y g y g μμμ'-+≈
)()())((2t t t y V g y g V μ'≈=222)()(σμμt t h g '
为使方差平稳,必须有 )
(1
)(t t h g μμ=
' 如果t y 的标准差与t μ成正比例,即t t h μμ=)(,所以, t t g μμlog )(=, (可用自然对数来稳定方差) 如果t y 的方差与t μ成正比例,即1)(t t h μμ=,所以, 12)(t t g μμ=, (可用平方根来稳定方差) 还有更广泛的变换函数
λ
μμλ1
)(-=t t g , (0,log )(→→λμμt t g )
尽管人们常用对数变换稳定方差,但只用这种方法不可能完全消除异方差。
需要一系列适当的模型来刻画异方差。