2008-2016年我国上证股票综合指数序列分析及预测

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

再根据时间序列模型判断条件(表 2)进行模型估计。
表 2 样本 ACF 及 PACF 识别模型参考表 模型系数 AR(p) MA(q) ARMA(p,q) ACF 拖尾 q 步截尾 拖尾 PACF p 步截尾 拖尾 拖尾
在图 3 中,close(2)自相关系数随着延迟步数的增加而不断减小,并于第一 步后位于两倍标准误之内,呈一阶截尾,而偏相关系数序列呈明显的拖尾现象。 白噪声检验结果如图 4 所示,读出收盘价在滞后 6、12、18、24 期的显著性 检验均小于 0.01,即拒绝“原序列为白噪声序列”原假设。 综上判断,建议以 MA(1)模型来拟合 close 的二阶差分序列。
图 6 close(2)模型的参数估计
分别选择 CLS(条件最小二乘估计)和 ML(最大似然)方法对模型进行参数估 计,在默认显著性水平为 0.01 下,二者估计的参数 MA(1,1)均显著不为 0,通过 假设,而常数项 MU 均未通过假设,不显著。 进一步比较各自的 AIC、SBC 值,结果如图 7 所示:条件最小二乘法下, AIC 与 SBC 值均大于最大似然法下的值,根据“偏小者更优”原则,最后确定 选择 ML 法对模型进行参数估计, 得到结果如图 6 中所示, 即 MA(1,1)=-0.99840。
X t 0.99840 X t 1 t 其中: X t (close t close t 1 0.028673 )
这是因为收盘价 close 是在二阶差分后又中心化消除了均值的序列, t 即为 零均值白噪声序列。
图 8 close(2)的残差相关诊断
五、模型预测 对应用上述模型 AEMA(0,2,1)下,预测上证综指收盘价 close 在未来一周内 的走势,也为投资者提供方向与预测,输出结果保存至 forecast_week.sas7bdat 数 据集。具体程序如下: 在结果数据集中, 包括未来一周上证综指收盘价的预测值、标准误以及默认 95%置信度下的置信区间上下限。结果整理如表 3 所示:
标签 指标 日期 date 开盘价 open
表 1 指标体系 最高价 最低价 收盘价 high low close
专业:大数据经济学
成交额 money
成交量 num
极差 range
单位:价格(元) ,成交额(百万) ,成交量(股)
其中, 收盘价是当日该证券最后一笔交易前一分钟所有交易的成交量加权平 均价,反映平均交易价格水平。极差纸币是最高价与最低价的差值,用于计算每 天的股价变动幅度,反映每天市场出价的波动情况,间接是对市场行情的反衬。 股票市场是市场经济的产物,对于个人投资者来说,股价是这种状态变动下 的直接反映,因此,研究分析股价序列随时间发展变化的规律,建立动态模型, 并以此对股票市场的变化趋势做出准确的分析和预测, 探索股票市场背后运行的 规律是至关重要的。 二、问题分析 在大数据时代,SAS 具有重要意义,在统计学的基础上做出开发,指出数据 内在的规律, 反映真实信息。 因此本报告选择在 SAS 开发环境中进行分析处理。 首先进行 SAS 环境设置, 分配 SAS 逻辑库路径, 并设定永久性逻辑库 “Jancy” 及选项,具体代码如下:
其次在该逻辑库下,将 wind 下载的元数据 ssci.xls 导入至 SAS 数据集 sas_miner.sas7bdat 中,同时对变量进行标签设定,并根据公式:
极差 最高价 - 最低价
计算并添加变量“极差” :range。代码如下:
根据问题,选择目标指标“收盘价” 、 “极差”用于判断基本的股票市场发展 趋势,并由 gplot 过程步做出时间序列图,代码如下:
图 2 极差时间序列图
三、模型识别 调用 ARIMA 过程步,对两个指标分别进行模型阶数识别。其中,close 指标 进行二阶差分处理,选择中心化估计,程序如下:
本报告中选择 close 指标进行各项输出结果解读。输出收盘价 close 二阶差 分后的趋势与相关分析图,结果如下所示:
图 3 close(2)的趋势与相关分析图
得到两个指标在该段时间下的时间序列图,具体如图 1,图 2 所示:
图 1 收盘价时间序列图
从图 1 中可以读出,收盘价 close 序列存在明显的趋势特征,初步判断是非 平稳的,因此需要进行差分处理后进行模型设定。 对于图 2 极差时间序列图中,该序列没有明显的长期趋势,并且基本围绕均 值上下波动,初步判断序列是平稳的,可以进行下一步操作,适用于 ARIMA 模 型进行识别并估计。
close t 0.0016 close t 1 0.99840 close t 2 0.0573 t
在未来一周中,收盘价仍在一定范围内 ,且存在下降趋势,这与现今的经 济形势与行情发展有关,需进一步分析。同时,这与经典的股市说法“sell in May and go away”相适应。
最后对 close 序列的原始值和预测值统一做出序列图,在一张图中显示,以 此初步判断并分析其趋势变化。程序如下:
得到的这些分布图如下:
图 9 close 预测时间序列图
六、问题总结 在股票市场中, 应用数据挖掘预测方法,以求探索出股市运行背后蕴含的潜 在规律性,从而可以选择更有投资价值的股票,提高投资者在股市上的收益。 在整个对上证指数的时间序列分析过程中,完成了初步的模型识别,模型参 数估计以及最后的模型预测。每一步中,为了保证分析有效性,参考了假设检验 结果,最终建立了 ARMA(0,2,1)模型,具体方程为:
图 7 close(2)模型的 AIC、SBC 估计(左:CLS;右:ML)
在此基础上,进一步分析模型的残差序列,若通过白噪声检验与正态诊断, 便可确定最终模型方程,结果如图 8 所示。 从 ACF、PACF 等各项相关序列得知,该模型下残差序列均无明显的趋势特 征,可判断在中心化后,其为平稳的零均值白噪声序列,因此原模型参数有效。 综上所述, 判断 ML 下的参数估计值是最终有效的估计值, 得到模型方程为:
图 4 close(2)白噪声检验结果图
同理,对极差 range 指标的识别结果如图 5 所示,自相关系数序列为拖尾状 态,且偏相关系数序列随着延迟步数的增加,在第八步后有截尾现象,并且白噪 声检验不通过,因此建议以 AR(8)模型进行拟合。
图 5 range 的趋势与相关分析图
四、模型估计 对原序列数据进行拟合,报告中继续选择对收盘价 close 进行分析,在确定 了二阶差分后,拟合 MA(1)模型,得到不同估计方法的结果如下:
wk.baidu.com
表 3 收盘价 close 在未来一周 week 预测值 日期 2016/6/04 2016/6/05 2016/6/06 2016/6/07 2016/6/08 2016/6/09 2016/6/10 预测值 2936.354 2936.399 2934.073 2934.117 2931.791 2931.836 2929.51 95%置信上限 2827.377 2782.405 2745.419 2716.337 2688.267 2665.11 2641.381 95%置信下限 3045.332 3090.393 3122.726 3151.898 3175.316 3198.561 3217.639
2008-2016 年我国上证股票综合指数序列分析及预测
姓名:江彩云 学号:2015210171 一、问题提出 股票市场作为市场经济的产物,一直被作为市场经济的“晴雨表” 。它反映 着我国经济的总体状况, 在我国经济发展中起着重要的作用。 随着经济快速发展, 股票市场也随之发展,也越来越多的人选择投资股票。为了可以准确地选择优秀 的上市公司进行投资, 从中获取可观的收益,这就需要对股票市场上不同的上市 公司的综合经营绩效进行准确的分析预测。面对庞大的股票市场数据量,非常复 杂的系统,利用传统的方法很难对它做出准确的预测。然而在大数据时代,数据 挖掘技术又是新的方向, 从海量的杂乱无章的数据中提取出隐含和潜在的对决策, 发现规律,并进行合理决策。 本报告于 wind 搜索并下载从 2008 年 01 月 01 日至 2016 年 06 月 03 日的上 证指数日线时间序列数据,包括日期,开盘价,收盘价,最高价,最低价,极差 等 8 个指标,共 2019 条记录,存于 ssci.xls 中,指标体系如下表:
相关文档
最新文档