第1章金融时间序列模型分析报告
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)单个样本均值的t检验 调用方式:
[h,p,ci,stats]=ttest(X,m,alpha,tail) 输入参数: X:样本 m:理论值 alpha:显著性水平 tail:检验方式,tail=0表示双尾检验,tail=1表示右尾检
验(h0:ux<=m),tail=-1表示左尾检验(h0:ux>=m) ci:1-alpha的置信区间 stats:结构型变量,给出了t统计量,t统计量的自由度,
approach:计算模型参数的方法 ‘fb’:Forward-Backward方法 ’ls’:最小二乘 ’yw’:Yule-Walker方法 ’burg’:Burg’s Lattic-Based方法 ’gl’:Geomatic Lattic方法
window:处理y中缺失值的方法 ‘now’:表示观察值中没有缺失值 ‘yw’:表示Yule-Walker方法处理缺失值
2、将有限阶的ARMA模型转换为无限阶的自回 归AR模型
理论上ARMA模型可以转化为AR模型,ARMA 模型的形式如下:
实际上ARMA模型可以写成如下形式:
上式右边虽然有无穷项,但实际上可以根据需 要选取一个上限。
调用方式:
InfiniteAR=garchar(AR,MA,NumLags)
输入参数:
调用方式: R=corrcoef(x,y) 输入参数: x %观察变量 y %观察变量 输出参数: R %观察变量的相关系数矩阵
例如:
偏相关系数 一般地,在多个变量之间 y, x1, x2,..., xk ,如 果只考虑 y 与 xi(i 1,2,3,...,k) 之间的相关性而消除 其他变量的影响,这种相关叫偏相关。 调用方式: [a,b]=parcorr(Series)
AR
%AR部分的阶数
MA
%MA部分的阶数
NumLags %截取的阶数
输出阶数:
InfiniteAR %与ARMA模型等价的AR模型
例1-5 我们给出模拟的ARMA模型如下:
要求将上述ARMA模型转换为AR( )模型,来自百度文库 求取到20阶近似。 在Command窗口中执行如下命令:
1.2.3 ARX与ARMAX模型的估计
5、评价时间序列模型的FPE准则、AIC准则、 BIC准则
最终预报误差的定阶准则简称为FPE准则(Final Prediction Error),是1971年由Akaike提出的, 主要用于AR模型的定阶。 FPE准则是以AR模型 的一步误差达到最小的相应的阶作为AR模型的 阶,用其预报效果的优劣来确定AR模型的阶数。
[PartialACF,Lags,Bounds]=parcorr(Series,nLags, R,nSTDs)
输入参数:
输出参数:
自相关系数
1.1.2 金融时间序列的统计分析
1.2.1 平稳性检验
(1)ADF检验 原假设h0:时间序列为单位根过程
[h,pValue,stat,cValue,reg]=adftest(y,'Para_Name',Para_Value,...) 输入参数:
第一步:计算时间序列的自相关系数ACF,确定 MA模型的滞后阶数,代码如下:
>>autocorr(y)
显示的自相关系数如图3.14所示。
结论:可以看出5阶偏相关系数落在置信区间外, 所以考虑用5阶的MA模型。
第二步:给出阶数为5的MA模型的形式。 注意到ARMAX的模型形式如下:
得到MA(5)的形式如下:
y:时间序列变量; Para_Name:参数名字,包括:'alpha','lags','model','test'
model包括AR,ARD,TS,test包括t1,t2,F h=0不能拒绝时间序列为单位根过程的假设,h=1拒绝 pValue:p值,若pValue<alpha,拒绝时间序列为单位根过程
1、ARMAX模型的估计 调用方式: m= armax(data,orders) m= armax(data,’na’,na,’ nb’, nb ,’nc’,nc,’nk’,nk) %m= armax(data,[na nb nc nk]) m=
armax(data,orders,’Property1’,Value1,…, ’PropertyN’,Value N)
样本的标准差;
(2)两个样本均值的t检验 [h,p,ci,stats]=ttest2(X,Y,alpha,tail,vartpye)
输入参数: vartpye:equal表示两个样本的方差相等, unequal表示方差不等。
(3)单个样本卡方检验 [h,p,ci,stats]=vartest(X,V,alpha,tail)
%m= armax(data,[na nb nc nk],Name,Value) 输入参数: data:数据 [na nb nc nk]:滞后阶数
ARMAX模型的格式: 参数na、nb、nc的不同之处在于:
其中,
如果只取na,nc,则模型变为ARMA模型 如果只取na,则模型变为AR模型 如果只取nc,则模型变为MA模型 如果只取na,nb,nk,则模型变为ARX模型 即:
输出参数: m %AR模型的文字形式 ref1 %AR模型的系数
例1-2
给出深发展2005年10月21日至2006年9月29日 的交易日收盘价收益率,收益率保存在变量y中, 用2阶的AR模型进行估计。代码如下:
从上面的结果可以知道,2阶的AR模型可以写 成如下形式:
模型中参数的估计采用了默认的“ForwardBackward”方法,上述模型的损失函数为 0.000576822,FPE准则的值为0.000587809。
(000001)与上证指数收益率,选用的时间段为
2005年10月21日到2006年9月29日的日收盘价
收益率,深发展的收益率保存在变量y中,上
证指数的收益率保存在变量u中,收益率为算
术收益率( t时刻收益率= Pt 1 )。采用ARMAX
模型进行估计,
Pt 1
代码如下:
从上面的结果可以看出,模型的形式如下:
接下来我们估计ARMA模型,在MATLAB中执行 如下命令:
上述模型等价于 整理得到ARMA模型形式如下:
损失函数值为0.000611174,FPE准则的值为 0.00064143。
作业:
利用青岛啤酒和沪深300指数2015年5月2日至 2016年5月21日的日收盘价收益率,分别用MA 模型和ARMAX模型进行估计。
的原假设
cValue:统计量拒绝原假设的临界值 reg:结构型变量,包括有效样本容量,回归系数等
(2)Phillips-Perron检验 调用方式:
[h,pValue,stat,cValue,reg]=pptest(y,'Para_Name', Para_Value,...)
输入参数同上
1.1.3 假设检验
引入滞后算子Q,模型可以表示为:
MATLAB中时间序列的模型如下:
其中:A(Q),B(Q),C(Q),D(Q),F(Q)都是含有延迟 算子的多项式。
4、多变量的时间序列模型
MATLAB中的时间序列模型非常多,在ARMA模 型、AR模型基础之上又扩展了很多新的模型, 如多变量的ARMAX和ARX。 ARMAX模型与AR、 MA、ARMA模型的区别在于引入了自变量,使 得可以处理自变量与因变量之间的关系。 MATLAB中的时间序列模型如下:
输入参数: V:方差的理论值
(4)两个样本的F检验 [h,p,ci,stats]=vartest2(X,Y,alpha,tail)
1.2 时间序列模型的估计
时间序列分析的研究对象是一系列随时间变化 而又相互关联的动态数据。George Box和 Gwilym Jenkins对时间序列的研究有独特贡献, 1970年他们合著的《时间序列分析:预测与控制》 是这方面的权威著作。
第1章 金融时间序列分析
1.1 金融时间序列的统计特征 1.2 时间序列模型 1.3 GARCH模型参数估计
1.1 金融时间序列的统计特征
函数
名称
格式
corrcoef 相关系数 r=corrcoef(x,y)
parcorr 偏相关系数 [a,b]=parcorr(series)
autocorr 自相关系数 [a,b]=autocorr(x)
输入参数: data %观察样本值 orders %确定ARX的滞后多项式的阶数 na % ARX模型中滞后多项式A(Q)的阶数 nb % ARX模型中滞后多项式B(Q)的阶数 nk % ARX模型中自变量的滞后阶数
输出参数: m %ARX模型的特征参数
例1-7 研究深发展收益率(000001)与上证指数收益率 之间的关系,选用的时间段为2005年10月21日 到2006年9月29日的日收盘价收益率,深发展 的收益率保存在变量y中,上证指数的收益率 保存在变量u中,收益率为算术收益率 ( t时刻收益率= Pt 1 )。采用ARX模型进行估计,
AR模型:armax(data,’na’,na) ARX模型:armax(data,’na’,na,’nb’,nb,’nk’,nk) MA模型:armax(data,’nc’,nc) ARMA模型:armax(data,’na’,na,’nc’,nc)
例1-6
估计ARMAX模型,数据是深发展收益率
2、ARX模型的估计 ARX模型具有如下形式:
其中,A(Q)、B(Q)都是滞后算子多项式。 MATLAB中的arx函数可以对ARX模型进行估计。
调用方式: m= arx(data,orders)
m= arx(data,’na’,na,’ nb’, nb ,’nk’,nk)
m= arx(data,orders,’Property1’,Value1,…, ’PropertyN’,V alueN)
对于时间序列模型,AIC与BIC也是判别时间序 列模型优劣的标准,MATLAB中AIC与BIC的计算 方法如下:
其中LLF为极大似然比,NumParams为待估参 数的个数,NumObs为样本数。一般而言, AIC 与BIC的值越小说明模型越好。
1.2.2 时间序列模型估计
1、AR模型的调用 调用方式: m = ar(y,n) [m,ref1]= ar(y,n,approach,window) 输入参数: y %观察值 n %AR模型的阶数
例1-4 估计ARMA模型,我们仍用上一个例子的数据。
ARMAX模型形式如下:
假设ARMA模型的阶数为 p 2,q 2 ,在 Command窗口中执行如下命令:
从上面的结构可以看出,滞后多项式A(Q)、 B(Q)的形式如下:
ARMA的模型如下:
ARMA模型的损失函数值为0.00015252,FPE准 则的值为0.000158501。
如果时间序列是它前期值与随机项的线性函数, 即
引入滞后算子Q,并记为AR(Q)。
模型可以写为:
2、移动平均(MA)模型 如果时间序列是随机项的线性组合,即
引入滞后算子Q,并记MA(Q)为:
模型可以表示为:
3、自回归移动平均模型(ARMA) 如果时间序列是随机项的线性组合和前期的线
性函数,即
1.1.1 相关系数和偏相关系数
相关性:描述两个或两个以上变量之间的非确 定关系。
简单相关:两个变量之间的相关性。 多重相关:三个或三个以上变量之间的相关性。 衡量相关性的指标:相关系数与偏相关系数。
相关系数
相关系数:衡量两个变量之间(假设分别
为 xi , yi)线性关系程度的数量指标。
时间序列模型有3种基本类型: (1)自回归(AR,Auto-Regressive)模型 (2)移动平均(MA,Moving-Average)模型 (3)自回归移动平均(ARMA, Auto-Regressive
Moving-Average)模型
1.2.1 时间序列模型介绍 1、自回归(AR)模型
下面确定AR模型的滞后阶数,我们采用偏相关 系数进行判断,首先我们计算样本的偏相关系 数。代码如下:
>>parcorr(y)
显示的偏相关系数如图3.13所示。
• 结论:偏相关系数都落在置信区间内, AR 模型不适合描述其收益率。
例1-3
给出上证指数2005年10月21日至2006年9月 29日的交易日收盘价收益率(收益率保存在变量y 中),考虑用MA时间序列模型进行拟合。
[h,p,ci,stats]=ttest(X,m,alpha,tail) 输入参数: X:样本 m:理论值 alpha:显著性水平 tail:检验方式,tail=0表示双尾检验,tail=1表示右尾检
验(h0:ux<=m),tail=-1表示左尾检验(h0:ux>=m) ci:1-alpha的置信区间 stats:结构型变量,给出了t统计量,t统计量的自由度,
approach:计算模型参数的方法 ‘fb’:Forward-Backward方法 ’ls’:最小二乘 ’yw’:Yule-Walker方法 ’burg’:Burg’s Lattic-Based方法 ’gl’:Geomatic Lattic方法
window:处理y中缺失值的方法 ‘now’:表示观察值中没有缺失值 ‘yw’:表示Yule-Walker方法处理缺失值
2、将有限阶的ARMA模型转换为无限阶的自回 归AR模型
理论上ARMA模型可以转化为AR模型,ARMA 模型的形式如下:
实际上ARMA模型可以写成如下形式:
上式右边虽然有无穷项,但实际上可以根据需 要选取一个上限。
调用方式:
InfiniteAR=garchar(AR,MA,NumLags)
输入参数:
调用方式: R=corrcoef(x,y) 输入参数: x %观察变量 y %观察变量 输出参数: R %观察变量的相关系数矩阵
例如:
偏相关系数 一般地,在多个变量之间 y, x1, x2,..., xk ,如 果只考虑 y 与 xi(i 1,2,3,...,k) 之间的相关性而消除 其他变量的影响,这种相关叫偏相关。 调用方式: [a,b]=parcorr(Series)
AR
%AR部分的阶数
MA
%MA部分的阶数
NumLags %截取的阶数
输出阶数:
InfiniteAR %与ARMA模型等价的AR模型
例1-5 我们给出模拟的ARMA模型如下:
要求将上述ARMA模型转换为AR( )模型,来自百度文库 求取到20阶近似。 在Command窗口中执行如下命令:
1.2.3 ARX与ARMAX模型的估计
5、评价时间序列模型的FPE准则、AIC准则、 BIC准则
最终预报误差的定阶准则简称为FPE准则(Final Prediction Error),是1971年由Akaike提出的, 主要用于AR模型的定阶。 FPE准则是以AR模型 的一步误差达到最小的相应的阶作为AR模型的 阶,用其预报效果的优劣来确定AR模型的阶数。
[PartialACF,Lags,Bounds]=parcorr(Series,nLags, R,nSTDs)
输入参数:
输出参数:
自相关系数
1.1.2 金融时间序列的统计分析
1.2.1 平稳性检验
(1)ADF检验 原假设h0:时间序列为单位根过程
[h,pValue,stat,cValue,reg]=adftest(y,'Para_Name',Para_Value,...) 输入参数:
第一步:计算时间序列的自相关系数ACF,确定 MA模型的滞后阶数,代码如下:
>>autocorr(y)
显示的自相关系数如图3.14所示。
结论:可以看出5阶偏相关系数落在置信区间外, 所以考虑用5阶的MA模型。
第二步:给出阶数为5的MA模型的形式。 注意到ARMAX的模型形式如下:
得到MA(5)的形式如下:
y:时间序列变量; Para_Name:参数名字,包括:'alpha','lags','model','test'
model包括AR,ARD,TS,test包括t1,t2,F h=0不能拒绝时间序列为单位根过程的假设,h=1拒绝 pValue:p值,若pValue<alpha,拒绝时间序列为单位根过程
1、ARMAX模型的估计 调用方式: m= armax(data,orders) m= armax(data,’na’,na,’ nb’, nb ,’nc’,nc,’nk’,nk) %m= armax(data,[na nb nc nk]) m=
armax(data,orders,’Property1’,Value1,…, ’PropertyN’,Value N)
样本的标准差;
(2)两个样本均值的t检验 [h,p,ci,stats]=ttest2(X,Y,alpha,tail,vartpye)
输入参数: vartpye:equal表示两个样本的方差相等, unequal表示方差不等。
(3)单个样本卡方检验 [h,p,ci,stats]=vartest(X,V,alpha,tail)
%m= armax(data,[na nb nc nk],Name,Value) 输入参数: data:数据 [na nb nc nk]:滞后阶数
ARMAX模型的格式: 参数na、nb、nc的不同之处在于:
其中,
如果只取na,nc,则模型变为ARMA模型 如果只取na,则模型变为AR模型 如果只取nc,则模型变为MA模型 如果只取na,nb,nk,则模型变为ARX模型 即:
输出参数: m %AR模型的文字形式 ref1 %AR模型的系数
例1-2
给出深发展2005年10月21日至2006年9月29日 的交易日收盘价收益率,收益率保存在变量y中, 用2阶的AR模型进行估计。代码如下:
从上面的结果可以知道,2阶的AR模型可以写 成如下形式:
模型中参数的估计采用了默认的“ForwardBackward”方法,上述模型的损失函数为 0.000576822,FPE准则的值为0.000587809。
(000001)与上证指数收益率,选用的时间段为
2005年10月21日到2006年9月29日的日收盘价
收益率,深发展的收益率保存在变量y中,上
证指数的收益率保存在变量u中,收益率为算
术收益率( t时刻收益率= Pt 1 )。采用ARMAX
模型进行估计,
Pt 1
代码如下:
从上面的结果可以看出,模型的形式如下:
接下来我们估计ARMA模型,在MATLAB中执行 如下命令:
上述模型等价于 整理得到ARMA模型形式如下:
损失函数值为0.000611174,FPE准则的值为 0.00064143。
作业:
利用青岛啤酒和沪深300指数2015年5月2日至 2016年5月21日的日收盘价收益率,分别用MA 模型和ARMAX模型进行估计。
的原假设
cValue:统计量拒绝原假设的临界值 reg:结构型变量,包括有效样本容量,回归系数等
(2)Phillips-Perron检验 调用方式:
[h,pValue,stat,cValue,reg]=pptest(y,'Para_Name', Para_Value,...)
输入参数同上
1.1.3 假设检验
引入滞后算子Q,模型可以表示为:
MATLAB中时间序列的模型如下:
其中:A(Q),B(Q),C(Q),D(Q),F(Q)都是含有延迟 算子的多项式。
4、多变量的时间序列模型
MATLAB中的时间序列模型非常多,在ARMA模 型、AR模型基础之上又扩展了很多新的模型, 如多变量的ARMAX和ARX。 ARMAX模型与AR、 MA、ARMA模型的区别在于引入了自变量,使 得可以处理自变量与因变量之间的关系。 MATLAB中的时间序列模型如下:
输入参数: V:方差的理论值
(4)两个样本的F检验 [h,p,ci,stats]=vartest2(X,Y,alpha,tail)
1.2 时间序列模型的估计
时间序列分析的研究对象是一系列随时间变化 而又相互关联的动态数据。George Box和 Gwilym Jenkins对时间序列的研究有独特贡献, 1970年他们合著的《时间序列分析:预测与控制》 是这方面的权威著作。
第1章 金融时间序列分析
1.1 金融时间序列的统计特征 1.2 时间序列模型 1.3 GARCH模型参数估计
1.1 金融时间序列的统计特征
函数
名称
格式
corrcoef 相关系数 r=corrcoef(x,y)
parcorr 偏相关系数 [a,b]=parcorr(series)
autocorr 自相关系数 [a,b]=autocorr(x)
输入参数: data %观察样本值 orders %确定ARX的滞后多项式的阶数 na % ARX模型中滞后多项式A(Q)的阶数 nb % ARX模型中滞后多项式B(Q)的阶数 nk % ARX模型中自变量的滞后阶数
输出参数: m %ARX模型的特征参数
例1-7 研究深发展收益率(000001)与上证指数收益率 之间的关系,选用的时间段为2005年10月21日 到2006年9月29日的日收盘价收益率,深发展 的收益率保存在变量y中,上证指数的收益率 保存在变量u中,收益率为算术收益率 ( t时刻收益率= Pt 1 )。采用ARX模型进行估计,
AR模型:armax(data,’na’,na) ARX模型:armax(data,’na’,na,’nb’,nb,’nk’,nk) MA模型:armax(data,’nc’,nc) ARMA模型:armax(data,’na’,na,’nc’,nc)
例1-6
估计ARMAX模型,数据是深发展收益率
2、ARX模型的估计 ARX模型具有如下形式:
其中,A(Q)、B(Q)都是滞后算子多项式。 MATLAB中的arx函数可以对ARX模型进行估计。
调用方式: m= arx(data,orders)
m= arx(data,’na’,na,’ nb’, nb ,’nk’,nk)
m= arx(data,orders,’Property1’,Value1,…, ’PropertyN’,V alueN)
对于时间序列模型,AIC与BIC也是判别时间序 列模型优劣的标准,MATLAB中AIC与BIC的计算 方法如下:
其中LLF为极大似然比,NumParams为待估参 数的个数,NumObs为样本数。一般而言, AIC 与BIC的值越小说明模型越好。
1.2.2 时间序列模型估计
1、AR模型的调用 调用方式: m = ar(y,n) [m,ref1]= ar(y,n,approach,window) 输入参数: y %观察值 n %AR模型的阶数
例1-4 估计ARMA模型,我们仍用上一个例子的数据。
ARMAX模型形式如下:
假设ARMA模型的阶数为 p 2,q 2 ,在 Command窗口中执行如下命令:
从上面的结构可以看出,滞后多项式A(Q)、 B(Q)的形式如下:
ARMA的模型如下:
ARMA模型的损失函数值为0.00015252,FPE准 则的值为0.000158501。
如果时间序列是它前期值与随机项的线性函数, 即
引入滞后算子Q,并记为AR(Q)。
模型可以写为:
2、移动平均(MA)模型 如果时间序列是随机项的线性组合,即
引入滞后算子Q,并记MA(Q)为:
模型可以表示为:
3、自回归移动平均模型(ARMA) 如果时间序列是随机项的线性组合和前期的线
性函数,即
1.1.1 相关系数和偏相关系数
相关性:描述两个或两个以上变量之间的非确 定关系。
简单相关:两个变量之间的相关性。 多重相关:三个或三个以上变量之间的相关性。 衡量相关性的指标:相关系数与偏相关系数。
相关系数
相关系数:衡量两个变量之间(假设分别
为 xi , yi)线性关系程度的数量指标。
时间序列模型有3种基本类型: (1)自回归(AR,Auto-Regressive)模型 (2)移动平均(MA,Moving-Average)模型 (3)自回归移动平均(ARMA, Auto-Regressive
Moving-Average)模型
1.2.1 时间序列模型介绍 1、自回归(AR)模型
下面确定AR模型的滞后阶数,我们采用偏相关 系数进行判断,首先我们计算样本的偏相关系 数。代码如下:
>>parcorr(y)
显示的偏相关系数如图3.13所示。
• 结论:偏相关系数都落在置信区间内, AR 模型不适合描述其收益率。
例1-3
给出上证指数2005年10月21日至2006年9月 29日的交易日收盘价收益率(收益率保存在变量y 中),考虑用MA时间序列模型进行拟合。