金融时间序列分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章金融时间序列及其特征
金融时间序列分析考虑的是资产价值随时间演变的理论与实践.它是一个带有高度经验性的学科,但也像其他科学领域一样,理论是形成分析推断的基础.然而,金融时间序列分析有一个区别于其他时间序列分析的主要特点:金融理论及其经验的时间序列都包含不确定因素.例如,资产波动率有各种不同的定义,对一个股票收益率序列,波动率是不能直接观察到的.正因为带有不确定性,统计的理论和方法在金融时间序列分析中起重要作用.
本书的目的是提供一些金融时间序列的知识,介绍一些对分析金融时间序列有用的统计工具,从而使读者获得各种经济计量方法在金融中应用的经验 .第1章引入资产收益率的基本概念,并简要介绍本书所讨论的一些过程 .第2章回顾了一些线性时间序列分析中的基本概念,如平稳性、自相关函数,引入了一些简单的线性模型来处理序列的序列相关性,并讨论了带时间序列误差、季节性、单位根非平稳性和长记忆过程的回归模型.当存在条件异方差性和序列相关时,该章给出了协方差阵相合估计的方法 .第3章着重讨论了条件异方差性(资产收益率的条件方差)的建模,讨论了新近发展起来的用来描述资产收益率的波动率随时间演变的各种经济计量模型.该章还讨论了波动率建模的其他方法,包括使用高频交易数据和一项资产的日最高价格和日最低价格进行建模 .第4章讨论了金融时间序列中的非线性性,引入了能区别非线性序列与线性序列的检验统计量,并讨论了几个非线性模型.该章还介绍了非参数估计方法和神经网络,并且展示了非线性模型在金融中的各种应用 .第5章考虑的是高频金融数据的分析,市场微观结构的影响及高频金融的应用,阐明了不同步(或不同时)的交易和买卖价格间的跳跃可能带来股票收益的序列相关性.该章还研究了不同交易之间持续时间的动态规律和一些分析交易数据的计量经济模型 .第6章引入了连续时间扩散模型和伊滕(Ito)引理,导出了Black-Scholes期权定价公式,并应用一个简单的跳跃扩散模型来刻画期权市场常见的一些特征 .第7章讨论了极值理论、厚尾分布及其在金融风险管理中的应用.该章还特别讨论了计算金融头寸风险值(VaR)及金融头寸的预期赤字的各种方法 .第8章着重讨论多元时间序列分析和简单的多元模型,重点在于分析时间序列之间的交叉延迟关系.该章还介绍了协整、一些协整检验以及门限协整,并用协整的概念来研究金融市场中的套利机会,包括配对交易 .第9章讨论了简化多元时间序列动态结构的方法和降低维数的方法,并介绍和演示了3种因子模型来分析多个资产的收益率 .第10章介绍了多元波动率模型,其中包括带时变相关系数的模型,同时还讨论了怎样对一个条件协方差阵进行重新参数化,使之满足正定性的限制,并降低波动率建模的复杂性 .第11章介绍了状态空间模型和卡尔曼滤波,还讨论了状态空间模型和本书中所讨论的其他计量经济模型之间的关系.该章还给出了在金融方面应用的几个例子.最后 ,第12章介绍了统计文献中一些新近发展起来的马尔可夫链蒙特卡罗方法,并把这些方法应用于各种金融研究的问题,如随机波动率模型和马尔可夫转换模型的估计.
本书着重强调应用和实证分析.每章都有实际例子,很多时候经济计量模型的发展是由金融时间序列的实证特征来推动的.必要时,本书还提供了用来分析数据的计算机程序和命令.在某些案例中,程序已在附录中给出.书中各章的练习题也要用到很多实际数据.
1.1资产收益率
多数金融研究针对的是资产收益率而不是资产价格. Campbell, Lo和MacKin
lay (1997)给出了使用收益率的两个主要理由:第一,对普通的投资者来说,资产收
益率完全体现了该资产的投资机会 ,且与其投资规模无关 ;第二 ,收益率序列比价格序列更容易处理,因为前者有更好的统计性质.然而,资产收益率有多种定义.
设 P t 是资产在 t 时刻的价格 .下面给出全书中要用到的一些收益率的定义 .暂时假定资产不支付分红. 单期简单收益率
若从第 t − 1天到第 t 天 (一个周期)持有某种资产,则简单毛收益率为
1+ R t = P t
或 P t = P t −1 (1 + R t ) . (1.1)P t −
1
对应的单期简单净收益率或称简单收益率为
P t Pt − P t −1
R t = − 1= . (1.2)P t −1 P t −1
多期简单收益率
若从第 t − k 天到第 t 天这 k 个周期内持有某种资产 ,则 k-期简单毛收益率为
P t Pt P t −1 P t −k+1
1+ R t [k]= = × ×· ··×
P t −k P t −1 P t −2 P t −k
=(1 + R t )(1 + R t −1) ··· (1 + R t −k+1)
k −1
= � (1 + R t −j ) .
j=0
这样, k-期简单毛收益率就是其所包含的这 k 个单期简单毛收益率的乘积 ,称为复合收益率 . k-期简单净收益率是 R t [k]=(P t − P t −k ) /P t −k .
1.1资产收益率
在实际中 ,确切的时间区间对讨论和比较收益率是非常重要的 (例如是月收益率还是年收益率 ).若时间区间没有给出 ,那么就隐含地假定时间区间为 1年.如果持有资产的期限为 k 年,则 (平均的)年化收益率定义为
1/k
k −1
年化的{R t [k]} = (1+ R t −j ) − 1.
j=0
⎤⎦
⎡⎣
这是由它所包含的这 k 个单期简单毛收益率的几何平均得到的 ,可以用下式计算:
⎤⎦
年化的{R t [k]} = exp k
1 k −1ln(1 + R t −j ) − 1,
j=0
⎡⎣
其中 exp(x)表示指数函数, ln(x)是正数 x 的自然对数.因为计算算术平均值比计算几何平均值容易 ,并且单期收益率一般很小 ,我们可以用一阶泰勒 (Taylor)展开来近似年度化的收益率,得到
k −1
年化的{R t [k]}≈
k
1 R t −j . (1.3)
j=0
然而,在有些应用中, (1.3)式近似的精度可能不够.
连续复合
在引进连续复合收益率之前 ,我们讨论一下复合的效果 .假定银行存款的年利率为 10%,最初存款为 1美元 .如果该银行每年支付一次利息 ,那么 1年之后存款的净值变为 1美元 ×(1 + 0.1) = 1.1美元 .如果该银行半年付息一次 ,6个月的利息率是 10%/2 = 5%,第 1年之后净值是 1美元 × (1 + 0.1/2)2
=1.102 5美元 .一般地,如果银行 1年付息 m 次,那么每次支付的利息率为 10%/m,1年后存款的净值变成 1 × (1 + 0.1/m)m
美元 .表 1-1给出了年利率为 10%时一些常用的时间间隔下存款 1美元的结果 .特别地 ,净值趋于 1.1052美元 ≈ exp
(0.1)美元 ,这个值就是连续复合的结果.于是,我们可以清楚地看到复合的效果.
一般地,连续复合的资产净值 A 为
A = C exp (r × n) , (1.4)
其中 r 是年利率, C 是初始资本, n 是年数①
.由 (1.4)式,我们有
C = A exp (−r × n) , (1.5)
叫作 n 年后价值为 A 的资产的现值 ,这里我们假定连续复合的年利率为 r.
1-1复合效果的演示:期限为 1年,年利率为 10%
类型支付次数每期的利率净值
一年 1 0.1 $1.100 00半年 2 0.05 $1.102 50季度 4 0.025 $1.103 81月 12 0.008 3 $1.104 71周 52 0.1/52 $1.105 06天 365 0.1/365 $1.105 16连续地 ∞ $1.105 17
连续复合收益率
资产的简单毛收益率的自然对数称为连续复合收益率或对数收益率 (log-return)
P
t
�
r t = ln(1+ R t )=ln = p t − p t −1, (1.6)P t −
1
其中 p t = ln P t .与简单净收益率 R t 相比 ,连续复合收益率 r t 有一些优点 .首先 ,对多期收益率,我们有
r t [k]= ln(1+ R t [k]) = ln[(1+ R t)(1 + R t−1) ···(1 + R t−k+1)] = ln(1+ R t) + ln(1 + R t−1)+ ···+
ln(1 + R t−k+1) = r t + r t−1 + ···+ r t−k+1.
这样,连续复合多期收益率就是它所包含的连续复合单期收益率之和.其次,对数收益率具有更容易处理的统计性质.
资产组合收益率
若一个资产组合由N个资产组成,则该资产组合的简单净收益率是它所包含的各个资产的简单净收益率的加权平均,其中每个资产所占的权重是该资产的价值占资产组合总价值的百分比.设p是一个资产组合,它在资产i上的权重为w i,那
N么p在t时刻的简单收益率R p,t = w i R it,其中R it是资产i的简单收益率.i=1 然而,资产组合的连续复合收益率没有上述方便的性质.如果简单收益率R itN的绝对值都很小,则我们有r p,t ≈w i r it,其中r p,t是该组合在t时刻的连续复合i=1
收益率.这种近似经常被用来研究资产组合的收益率.
分红支付
如果一个资产周期性地支付分红,我们必须修改资产收益率的定义.设D t是一个资产在第t −1天和第t天之间的分红, P t是该资产在第t个周期末的价格.这样,分红并没有包含在P t中.因此, t时刻简单净收益率和连续复合收益率分别
1.1资产收益率变为
P t + D t
R t = −1,r t = ln(P t + D t) −ln(P t−1).P t−1
超额收益率
一个资产在t时刻的超额收益率是该资产的收益率与某个参考资产的收益率之差.这个参考资产通常是无风险的,如美国短期国债的收益率.简单超额收益率和对数超额收益
率分别定义为
Z t = R t −R0t,z t = r t −r0t, (1.7)
其中R0t和r0t分别是该参考资产的简单收益率和对数收益率.在金融文献中,超
额收益率被认为是某个套利投资组合的赢利.在这个投资组合中,对某资产持多头头寸而
对参考资产持空头头寸,且初始投资净值为0.
注释多头金融头寸意味着持有某资产.空头头寸则指卖出不属于自己的资产.这需通过从已购买该资产的投资者那里借入资产来完成.在之后的某天,卖空者有义务买进和借入
完全相同数量的股份偿还给借出者.因为偿还时要求的是相等数量股份,而不是相等数量
的美元,卖空者会由于该资产价格的下跌而获利.如果在空头持续期间该资产有现金分红,
则支付给做空买卖的买者.卖空者也必须从自己的资源里配备相应的现金分红来补偿借出
者.换句话说,卖空者有义务支出所借资产的现金分红给借出者. �
关系小结
简单收益率R t与连续复合收益率r t的关系是
r t = ln(1+ R t) ,R t =e r t − 1.
如果收益率R t与r t是百分比,则
�R t �
r t = 100ln 1 + ,R t = 100(e r t/100 −1).
100
收益率的时间累加使得
1+ R t [k] = (1+ R t)(1 + R t−1) ···(1 + R t−k+1) ,
r t [k]= r t + r t−1 + ···+ r t−k+1.
如果连续复合年利率为r,则资产的现值与资产的未来价值之间的关系为
A = C exp (r ×n) ,C = A exp (−r ×n) .
例 1.1若某项资产的月对数收益率为 4.46%,则相应的月简单收益率为100[exp
(4.46/100)−1]=4.56%.同样,若某项资产在一个季度内的月对数收益率分别为 4.46%, −7.34%, 10.77%,则该资产的季度对数收益率为(4.46−7.34+10.77)%=7.89%.
1.2收益率的分布性质
要研究资产收益率,最好从它们的分布性质开始.目的是要理解不同资产、不同时间收益率的表现.考虑N个资产,持有这N个资产T个时间周期,如t = 1, ···,T .对每个资产i, r it表示它在t时刻的对数收益率.所要研究的对数收益率为{r it; i =1, ···,N; t =1, ···,T }.也可以考虑简单收益率{R it; i =1, ···,N; t = 1, ···,T }和对数超额收益率{ z it; i =1, ···,N; t =1, ···,T }.
1.2.1统计分布及其矩的回顾
我们简要地回顾一下统计分布的一些基本性质和随机变量的矩.设R k表示k维欧几里得空间, x∈R k表示x是R k中的点,考虑两个随机向量X =(X1, ···,X k)�和Y =(Y1, ···,Y q)�.令P (X ∈A, Y ∈B)表示X在子空间 A ⊂R k中且Y在子空间 B ⊂R q中的概率.本书的大部分场合,都假定这两个随机向量是连续的.
联合分布
函数
F X,Y (x, y; θ)= P (X � x, Y � y; θ) ,
是参数为θ的X与Y的联合分布,其中不等号“�”是分量对分量的运算. X和Y的规律由F X,Y (x, y; θ)刻画.如果X和Y的联合概率密度函数f x,y (x, y; θ)存在,则
�x
�
y F X,Y (x, y; θ)= f x,y (w, z; θ)dzdw.
−∞−∞
这时, X和Y是连续型随机向量.
边际分布
X的边际分布是
F X (x; θ)= F X,Y (x, ∞, ···, ∞; θ) .
这样, X的边际分布可通过对Y求积分得到.同理, Y的边际分布也可类似得到.如果k = 1, X是一个一元随机变量,其分布函数为
F X (x)= P (X � x; θ) ,
称为X的累积分布函数(Cumulative Distribution Function, CDF).一个随机变量的CDF是非降的[即对x1 � x2有F X (x1) � F X (x2)],且有F X (−∞) = 0,
1.2收益率的分布性质
F X (∞) = 1.对给定的概率p,使p �F X (x p)成立的最小实数x p称为随机变量X的100 p-分位点,更具体地,
x p = inf {x |p � F X (x) } .
x
本书中我们用CDF来计算检验统计量的p值.
条件分布
给定Y � y的条件下X的条件分布为
P (X � x, Y � y; θ)
F X|Y �y (x; θ)= .
P (Y � y; θ)
若所对应的概率密度函数存在,则给定Y = y的条件下, X的条件密度为
f x,y (x, y; θ)
f x|y (x; θ)= , (1.8)
f y (y; θ)
其中边际密度函数f y (y; θ)由下式得到
∞
�
f y (y; θ)= f x,y (x, y; θ)dx.
−∞
由(1.8)式知,联合分布、边际分布和条件分布之间的关系为
f x,y (x, y; θ)= f x|y (x; θ) ×f y (y; θ) . (1.9)
上述等式关系在时间序列分析中经常用到(如在进行最大似然估计时).最后, X与Y 是相互独立的随机向量当且仅当f x|y (x; θ)= f x (x; θ),这时f x,y (x, y; θ)= f x (x; θ) f y (y; θ).
随机变量的矩
一个连续型随机变量X的l阶矩定义为
∞
�
m =E �X l
� = x l
f (x)dx,
l
−∞
其中 “E ”表示期望 (expectation), f (x)是 X 的概率密度函数 .一阶矩称为 X 的均值 (mean)或期望 ,它度量的是分布的中心位置 ,记为 µx . X 的 l 阶中心矩定义为
�
∞
m l =E �
(X − µx )l �
=(x − µx )l
f (x)dx,
−∞
假定上式中积分存在 .二阶中心矩可度量 X 取值的变化程度 ,称为 X 的方差 (variance),记为 σ
x
2 .方差的正平方根 σx 称为 X 的标准差 .一个正态分布由它的前两阶矩决定.对其他分
布,可能要了解其更高阶矩.
三阶中心矩度量 X 关于其均值的对称性 ,而四阶中心矩度量 X 的尾部 .在统计学中 ,标准化的三阶矩叫偏度 (skewness),标准化的四阶矩叫峰度 (kurtosis),它们分别用来描述随机变量的对称程度和尾部厚度 .具体地 , X 的偏度和峰度分别定义 为
�(X − µx )3
��(X − µx )4
� S (x)=E ,K (x)=E .
σ
3 σ 4
xx
量 K (x) − 3叫作超额峰度 (excess kurtosis),因为正态分布的峰度 K (x) = 3.这样,一个正态随机变量的超额峰度为 0.若一个分布有正的超额峰度 ,则称此分布具有厚尾性 ,厚尾的含义是指该分布在其支撑 (support)的尾部有比正态分布更多的 “质量 ”.在实际中 ,这就意味着来自于这样一个分布的随机样本会有更多的极端值,故称这样的分布为尖峰的
(leptokurtic).另外 ,一个具有负的超额峰度的分布是轻尾的 (例如,有限区间上的均匀分布),
这样的分布称为低峰的.
在应用中 ,我们可以用相应的样本偏度和样本峰度来估计偏度和峰度 .设 {x 1, ··· ,x T }是 X 的 T 个观察值,样本均值为
1 T
µˆ
x = �x t , (1.10)
T
t=1
样本方差为
t=1 在正态分布的假定下 , S
ˆ
(x)和 K ˆ
(x)−3均
渐近地服从均值为零、而方差分别为 6/T 和 24/T 的正态分布 [参见 Snedecor 和 Cochran
(1980),第 78页].我们可以用这些渐近性质来检验资产收益率是否具有正态性 .给定一个资
产收益率序列 {r 1, ··· ,r T },要检验其偏度 ,即要考虑零假设 H 0 : S(r)=0对备择假设 H a : S(r)
= 0.�由 (1.12)式所定义的样本偏度的 t-比统计量为 ˆ S(r) t = . �6/T
决策规则如下:在显著性水平 α下,若 |t| >Z α/2,则拒绝零假设 ,其中 Z α/2是标准正态分布的
100(α/2)上分位点 .另外一个方法是计算检验统计量 t 的 p 值,当且仅当 p 值小于 α时拒绝 H 0.
1.2收益率的分布性质
类似
地 ,我们可以用假设检验 H 0 : K(r)
− 3=0与 H a : K(r) − 3 = 0,�来
检验收益率
序列的超额峰度.检验
统计量为 ˆ
K(r) − 3 t = , �24/T
并且该统计量渐近标准正态分布 .决策规则为当且仅当检验统计量的 p 值小于显著性水平
α时拒绝 H 0. Jarque 和 Bera(1987)结合了这两个先验检验 ,并利用了下述统计量
S ˆ2
(r)[K ˆ(r)
− 3]
2
JB= + ,
6/T 24/T 其中 ,该统计量的渐近分布是自由度为 2的 χ
2
分布 .如果 JB 统计量的 p 值小于显著性水平 α,则拒绝正态性的 H 0假设.例 1.2考虑表 1-2中所用的 IBM 股票的日简单收益率 .作为描述性统计量的一部分 ,收益率的样本偏度和
峰度可以用各种统计软件包很容易地得到 .我们给出了实例中用到的 SCA 和 S-Plus 命令 ,其中 d-ibm3dx7008.txt 是数据文件名 .需要注意的是 ,在 SCA 中峰度指的是超额峰度 .输出
ˆσ
2 x
=
1 T − 1
T � (x t − ˆµx )2 ,
(1.11)
t=1
样本偏度为
ˆS (x) =
1 (T −
1) ˆσ
3 x
T � t=1 (x t −
ˆµx )3 ,
(1.12)
样本峰度为
1 (T −
�(x − ˆµ).
结果中超额峰度很高,表明IBM股票的日简单收益率具有厚尾性.为了检验收益率分布的对称性,我们用检验统计量
0.0614 0.061 4
t = ==2.49,
�6/9845 0.024 7
该检验统计量的p值大约为0.013,表明在5%的显著性水平下, IBM股票的日简单收益率显著地右偏.
表1-2几种股指和股票日或月简单收益率和对数收益率的描述性统计量a
ˆσ 2 x =
1 T
−
1
T� (x t −ˆµx)2 ,
(1.11)
t=1 样本偏度为
ˆS (x) = 1 (T −
1) ˆσ
3 x
T�t=1 (x t −ˆµx)3 ,
(1.12)
样本峰度为
ˆK (x) = 1 (T −
1) ˆσ
4 x
T�(x t −ˆµx)4 .
(1.13)
证券起始日期样本量均值标准差偏度超额峰度最小值最大
值
日简单收益率(%)
SP 70/01/02 9845 0.029 1.056 −0.73 22.81 −20.47
11.5。