第5章 高频数据分析与市场微观结构
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
22
估计结果:
23
结论:
• 边界的划分并不是等间隔的,但是几乎是关于0对 称的(α) • 交易的持续期 ti 不仅影响 yi 的条件均值,而且 影响 yi 的条件方差 (1、 1 )
• 滞后价格变化的系数为负并且是高度显著的,显 示了价格的逆转性质 (2、3、4) ( 2) • ti 1 时刻的买卖报价价差显著地影响条件方差
回忆GARCH模型形式:
43
与GARCH模型类似,过程 期望也为0 ACD模型变形为
是一个鞅差序列,即
,无条件
此处 由上式可以得到ACD模型弱平稳性的基本条件:
期望持续期是正数,则需要
举例:EACD(1,1)模型 Page217-218
其中 服从标准指数分布。假定 是弱平稳,计算其不随时间变化的头两阶矩,并 得到参数需要满足的条件。
29
结论:
• 价格变化依赖于上一次的价格变化:
• 价格变化的方式由下式控制:
• 只有很弱的证据表明大的价格变化有更大的可能 性跟随另外一个大的价格变化:
30
R软件进行logistic回归
31
5.5 持续期模型
1、持续期定义 持续期是指交易之间的时间间隔。持续期与交易强度呈反比。持 续期越长,交易强度越低,即交易活动较少。一般使用指数分布、 韦布尔分布以及广义伽马分布来刻画时间间隔的随机分布。
(5.46)
对第i次价格变化的交易数据包括{ti, Ni ,D , } i Si )的联合分析
注: 1、集中于与价格变化相联系的交易可降低样本大小 2、价格变化的时间持续期中没有日内模式
58
IBM股票在1990年11月21日的日内交易价格时间图
59
给定 Fi 1的条件下,PCD模型将( 联合分布分解为:
1、指数分布 X ~ exp(β) 概率密度函数——
累积分布函数——
E(X)= β
Var(X)=
2
33
此处
=
1
34
2、伽马函数
3、伽马分布
称随机变量X服从参数为 果其pdf为
(形状参数)和
(尺度参数)的伽马分布,如
35
此处,k是形状参数,θ是尺度参数 k=1时,伽马分布就是指数分布;K越大,伽马分布近似于正态分布。
i在给定xi 和i 的条件下服从
正态分布
* i
g (i )
2 i
20
观测值: yi , yi =s ,若
* ,j=1,2,…,k y j 1 i j j 0 1 ... k 1 k
xi
i (i )
21
例5.1,以IBM为例,得到 xi 与 i (i ) 与的解释变 量,将其带入式5.18,可通过最大似然估计或 MCMC方法得到β、α、γ的估计值
46
ACD模型模拟以及估计验证
1、模拟一 WACD(1,1)
假定 服从参数α=1.5的标准化韦布尔分布。从模型中产生500个观测值, 下图是观测值序列时间图
47
模拟序列直方图:
48
模拟序列的ACF以及标准化序列的ACF(
为标准化序列)
49
把WACD(1,1)模型中模拟出的500个观测值作为样本,利用条件似然方法估计模型, 估计结果如下:
ti ti ti 1 价格变化的时间持续期
Ni
时间间隔
(ti 1 , t中无价格变化时的交易数量 i)
Di 第i次价格变化的方向(+1上升;-1下降)
Si
以最小价位变动单位测量的第i次变化的大小
57
新的定义下,股票价格随时间的变化为
P ti P ti1 Di Si
PCD模型关心的是对(
8
买卖报价差:
在某些股票交易所,采取的仍然是做市 商交易制度,通过做市商来给市场提供足够 的流动性。而做市商的利润来源,则是买价 与卖价之间的价差。买卖价差虽然数量较小, 但其存在使资产收益率序列有了一步延迟 负序列相关关系。
9
买卖报价差:
基本假设: 1. 2. 服从1,-1的二项分布,概率各为0.5 3. 表示t时刻资产基本价值,保持不变 则有:
估计看上去很合理。从ACF可以看出,原始序列有明显的序列相关性,而估计得到 的 序列没有显著的序列相关,从而说明拟合的模型是正确的,符合 是独立 同分布随机变量的假定。
50
2、模拟二 GACD(1,1 )
假定 服从参数κ=1.5,α=0.5的标准化广义伽马分布。从模型中产生500个观测值, 下图是观测值序列时间图
)的
f (ti , N i , Di , Si Fi 1 )
f (S i Di , N i , t i , Fi 1 ) f ( Di N i , t i , Fi 1 ) f ( N i t i , Fi 1 ) f (t Fi 1 )
(5.47)
60
① 对价格变化之间的时间持续期 t i
10
相关推论
11
5.3 交易数据的经验特征
12
• • • •
(1)不等间隔的时间区间 (2)离散取值的价格 (3)日周期或者日模式的存在 (4)一秒钟的多种交易
13
每五分钟间隔内的交易次数
14
序列样本的ACF
15
解释可能为:开盘大家对于价格的竞争非常激烈,临近中午收盘 交易强度下降,下午开盘交易强度逐渐回升,在收盘前又会迎来 多空双方相互竞争价格的高峰
51
模拟序列直方图:
52
模拟序列的ACF以及标准化序列的ACF(
为标准化序列)
53
把WACD(1,1)模型中模拟出的500个观测值作为样本,利用条件似然方法估计模型, 估计结果如下:
估计看上去很合理。从ACF可以看出,原始序列有明显的序列相关性,而估计得到 的 序列没有显著的序列相关,从而说明拟合的模型是正确的,符合 是独立 同分布随机变量的假定。
54
5.6 非线性持续期模型
(threshold duration model 门限持续期模型)
表5-8 对IBM从1990年11月1日至1990年11月7日交易持续期的非线性检验
只利用了日内持续期.TAR-F检验括号内的数表示时间延迟.
55
•对IBM的日内持续期考虑一个两体制的门限持续期模型
门限变量为
36
4、韦布尔分布(Weibull) 称一个随机变量X服从参数 如果其 pdf为
(形状参数)和 (尺度参数)(
)
X的cdf为
当α=1时,韦布尔分布简化为指数分布。
37
此处,λ是尺度参数,k是形状参数。
38
标准化韦布尔分布: 定义 则E(Y)=1,而且Y的pdf为
Y的cdf为
对韦布尔分布进行标准化,尺度参数消失,期望变为1,方差变为
3
非同步交易:
针对股票日收益率,非同步交易会导致股 票收益率出现一些相关的关系。
例: 股票A、B相互独立,且股票A交易更为频繁。当某 天接近收盘时刻出现一个特定的消息,股票A由于交易 更频繁,所以比股票B更可能在同一天显示出这个消息 的效应,而该消息对股票B的效应则可能延迟到下一个 交易日。
4
非同步交易导致收益率序列负相关
44
4、带有广义伽马分布的ACD模型 指数分布、韦布尔分布以及广义伽马分布分别都有相应的危险率函数,也即是强度 函数,通俗的理解是事件发生率(联想泊松分布的参数λ(t)) 危险率函数的定义 具体计算为: X的危险率函数 其中 f ( x ) 和 s( x) 是X的pdf和生存函数。 生存函数 指数分布的危险率函数是常数,韦布尔分布的危险率函数是单调的。对于广义伽马 分布,危险率函数可以有各种不同的形状,包括U型和倒U型。在现实生活中,股票 交易的强度函数不是固定的,对 采用标准化的广义伽马分布,为股票交易的持续 期建模提供了一个灵活的方法。
高频数据分析与市场微观结构
1
高频数据:
指在细小的时间间隔上抽取的观测值。
在金融市场中,高频数据与市场微观结构紧密 联系,常用于比较不同交易系统价格发现的有效 性以及特定股票买卖报价的动态性。
2
非同步交易:
▲ 股票交易发生是非同步的; ▲ 不同股票交易频率不同; ▲ 相同股票不同时间交易频率也不同;
基本假设: ▲每个时间段,证券不交易的概率为π ▲rt表示证券在t时刻的复合收益率 ▲{rt }独立同分布,满足均值为µ,标准差为δ ▲ 表示观测到的收益率
5
与rt的数学关系
6
相关推论:
,利用独立性可得 ,利用方差公式以及独 立性可得
, 利用协方差公式可得
7
的计算:
可得:
结论:非同步交易会导致收益 率序列负相关
39
5、广义伽马分布 称随机变量X服从参数 和κ ,尺度参数是β)它的pdf由下式:
的广义伽马分布(形状参数α
当κ=1时,广义伽马分布简化为韦布尔分布。当α=1时为伽马分布。当κ=1, α=1时为 指数分布 其期望为 标准化广义伽马分布:定义Y=X/ [ ]. 则E(Y)=1. Y的pdf为
40
铺垫二:调整时间持续期
24
5.4.2 分解模型
yi Pti Pti1 Ai Di Si
Si
S i表示价格变动了多少个最小单位
25
Ai , Di都是二元变量,所以都可以logit模型进行估计:
• 对于
• 对于
26
• 对
S i 的解释变量的估计:
– 其中:
g(λ)是参数λ的几何分布 参数 j ,i 随时间的变化为:
实证发现,时间持续期呈现出日内模式。需要剔除其循环成分,使得模型针对的 对象为调整后的时间持续期
其中
是一个确定的函数。
实际应用中,有很多估计 f (t i ) 的方法。光滑插值是一个通常的方法。一下运用简 单的二次插值函数和示性变量来处理日交易活动中确定的组成部分。
我们假定
其中
f5 (t i )
f6 (t i ) f7 (t i ) 是示性变量
27
估计方法: • 第i次交易有三种情况: – 价格无变化:Ai 0
– 价格上升:Ai 0, Di 1 Ai 0, Di 1 – 价格下降:
• 对于第i次交易,方程(5.24)的对数似然函数为
• 由此,全部的对数似然函数为:
28
例5.2 IBM股票交易数据
• 模型简介:
• 估计结果:
16
第i次交易
第 次 交 易 i-1
17
18
5.4价格变化模型
•5.4.1顺序概率模型
•5.4.2分解模型
19
5.4.1顺序概率模型
y xi i
* i
• y 表示所研究的资产不能观测到的价格变 * * * y P P 化( i ti ti1) • xi 表示 ti 1 时刻可以得到的解释变量的p维 行向量 2 Var ( i | xi ) i • E ( i | xi ) 0 ,
41
通过线性回归的最小二乘法估计
拟合的模型为
42
建模:ACD模型
1、思想:自回归条件持续期(ACD)模型利用GARCH模型的思想来研究调整的时 间持续期 的动态结构。 2、记号说明: (1)调整的时间持续期 (2)第i-1次交易至第i次交易的调整的时间持续期的条件期望 (3) 是独立同分布的非负随机变量序列,并满足 根据 服从的分布,标准指数分布、标准韦布尔分布、标准广义伽马分布,ACD 模型可依次分为EACD、WACD、GACD。 3、模型形式
h(x)= lim P ( r x <X<x+ x|T>x)/ x
x 0
45
ACD模型估计
ACD模型估计使用极大似然估计 令 , 持续期 的似然函数为
其中θ表示模型的参数向量,T表示样本大小。边缘概率密度函数 精确形式 相当复杂,而且随着样本容量增大,它对似然函数的影响递减的,去掉该项后,导 致了条件似然方法的运用。 举例:求WACD模型的条件对数似然函数 Page220-221
采用模型:
ln(ti ) 0 1 ln(ti 1 ) 2 Si 1 i
,门限值的估计为3.79
拟合的门限WACD(1,1百度文库模型是
(5.45)
表示参数为 的标准化韦布尔分布
上述门限WACD(1,1)模型的标准化新息没有检验出非线性
56
5.7 价格变化和持续期的二元模型
(price change and duration,PCD 模型)
ti
Pti
资产在第i次价格变化的日历时间 第i次价格发生变化时的交易价格
2、持续期日模式特征 交易之间的时间持续期呈现日循环模式。举例说,在NYSE中,开 盘和收盘时刻的交易比较频繁,而中午交易比较少,交易强度呈 U型,对应持续期呈倒转U型。这种日模式是由于标的资产以及市 场的系统行为造成的。在建模中,需要剔除日模式对持续期的确 定性影响,着重研究它的随机成分。
32
铺垫一:概率分布知识