浅谈时间序列分析——以ARIMA为例
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
yt = c + φ1 yt−1 + φ2 yt−2 + ...... + φp yt− p + εt + θ1εt−1 + θ2εt−2 + ...... + θqεt− p
其中p代表自回归成分的阶数,q代表移动平均成分的阶 数,记做 ARIMA(p,q),即时间序列 yt 是由它的前 p 期值及当
2.2 平稳性检验 在实际情况中我们处理时间序列的时候,时常会有随机性 的和非平稳性的存在。特别是在普遍的经济时间序列都会显示 出一定程度的趋势性,就是指时间序列数值随时间的变化表现 出增大或缩小的趋势,还有季节性和方差的不稳定性。时间序 列的非平稳特性广泛存在,它从客观角度表达出经济活动实际 情况的同时,也使我们使用数学模型估量存在于时间序列中的 规律遇到困难。所以,对时间序列进行平稳性判断,观察一个 序列是否存在某种趋势,以及各时间间隔内折线是否存在是非 常有必要的。平稳性检验在本文运用的方法是通过观察 ACF 图 和 PACF 图的各项特征值后做出判断的检验方法[3]。 2.3 AIC准则、BIC准则 AIC是为了衡量统计模型拟合是否良好,而被创造出的判 断准则,它的存在意义是为了提供一种判断模型混乱程度以及 数据拟合情况是否良好的标准。 通常情况下,AIC定义为:
AIC=2k-2ln(L) 在上述公式中,k代表了模型的参数数量,L代表了似然函 数。在实际情况中需要从一组模型选择最佳模型的时候,一般 选择其中AIC值最小的模型。 BIC贝叶斯信息准则与AIC准则相似,可以看作AIC准则的 改进版,BIC的惩罚权重比AIC的大,从样本数量出发,当出现 样本数量过多的情况时,可以有效避免由于模型精度过高而造
TECHNOLOGY AND INFORMATION
博宇3 1. 格乐大学工商管理学院 泰国 10220 2. 澳门城市大学数据科学学院 澳门 999078 3. 澳门城市大学 商学院 澳门 999078
摘 要 时间序列又被称为称动态数列,是指将具有同样性质的数值按所处的时间先后进行排序而成的数列。时间 序列分析的主要方法是时间序列预测,时间序列预测是以统计方面的知识以及相关技术,从已经存在的历史数据中 找到存在于其中的规律,并根据其变化的规律建立与其相符的模型,对历史数据在未来时期的变化走向做预估。其 分析步骤检查数据平稳性(不平稳要变平稳),然后模型识别与定阶,然后模型检验,预测。时间序列分析的基本 模型有:AR 模型、MA模型、ARMA 模型和ARIMA 模型。本文主要讲述ARIMA模型。 关键词 多元回归分析;时间序列分析;ARIMA模型
1 时间序列分析的国内外研究现状 时间序列的相关方法最开始被应用于20世纪20年代,数学
家尤勒最先以自回归模型分析市场规律的变化趋势。接下来, 20世纪30年代初,另一位数学家瓦尔格从前人发明的自回归模 型中得到灵感,从而发明了滑动平均模型和自回归滑动平均混 合模型,并获得广泛的应用。越来越多的学者开始使用时间序 列分析方法来研究在日常实际情况中出现的带有时间属性变量 的相关问题,而且做出了大量值得肯定的成绩。潘欢弘[1]等选 取了江西省2008-2015年手足病逐月发病数量的时间序列,建 立Arima模型对2017年手足口手足口病的发病率进行预测,分 析预测的结果发现2017年的手足口病发病率与往年发病趋势相 似,没有太大的出入。张艳选取了2016.1.4-2016.6.24的人民币 对美元日汇率的时间序列,建立Arima对2016.5.12-2016.6.24的 汇率进行预测,将预测结果与实际值对比发现,模型预测精度 较高,可以用此方法对汇率进行预测。徐兰芹以2016年济南市 日空气质量指数的时间序列为基础,结合ARIMA模型和条件异 方差模型进行分析,发现此方法用于预测相似时间序列具有可 行性。赵小盼利用了2018.1到2015.12的CPI月度数据,建立模型 对通货膨胀指数进行预测,与实际值进行对比发现,对于此类 有复杂影响因素的时间序列,组合预测模型相对ARIMA的预测 精度更高。并指出当前几家权威调查机构调查结果的可信性。 纪伟伟采用2005.1-2015.12的肿瘤专科医院月门诊量的时间序列 进行分析,运用ARIMA模型对2016及2017的月门诊数量进行预 测,根据结果发现门诊数量依然会增加,其增长率逐渐稳定, 各个科室的门诊数量具有季节性趋势,肯定了ARIMA在实际 情况中处理问题的能力,并对医院相关部门提出建设性意见。 何永敢等利用ARMA模型对安徽省城乡居民消费水平差距做时 间序列分析,经过预测后发现未来几年安徽省城乡居民消费差 距仍无法得到根本性缩小,需要政府以宏观手段,加大对农村 居民的福利政策,从消费思想,消费环境,消费潜力多方面切 入,提高农村居民的消费水平。谢雨婷用ARMA模型对江苏省 城乡居民收入差异做了预测,发现江苏省城乡居民收入差异有 扩大的趋势,并指出当前的城乡居民收入差距情况是多方面因 素共同造成的,不同地区之间具有差异性,对待不同地区应该 实行不同的政策。
前和前q期的随机误差项的线性函数,φ1 ,φ2 ,......φp 是自回归 系数,描述了 yt-j ( j = 1,2,…,p) 对yt的影响程度,θ1 ,θ2,θ3 ....θ p 是
移动平均系数,εt 是随机干扰误差项。 运用模型有其特定的前提条件,是必须通过由一个平稳随
机过程产生一个依赖于时间的序列。即其过程的随机性质应具 有不变的时点,在图表上呈现为所有的样本点在水平线上下随 机地波动[2]。
2 ARIMA模型及时间序列分析的基本理论 2.1 ARIMA模型介绍 ARIMA模型是由两种模型组成的,一个是AR(自回归模
型)模型,另一个是MA(移动平均模型,这两个模型也可以
看作ARIMA模型的特殊形式,ARIMA模型是以时间序列本身 具有的趋势特征为依据,来寻找变量当期值与其滞后期值及误 差项之间的关系,最后对数据下一步变动进行预测。 ARMA模 型是以两个模型为基础组合而成,具有两个模型的两种特点, 因此它的阶是二维的,ARIMA模型表达式如下:
其中p代表自回归成分的阶数,q代表移动平均成分的阶 数,记做 ARIMA(p,q),即时间序列 yt 是由它的前 p 期值及当
2.2 平稳性检验 在实际情况中我们处理时间序列的时候,时常会有随机性 的和非平稳性的存在。特别是在普遍的经济时间序列都会显示 出一定程度的趋势性,就是指时间序列数值随时间的变化表现 出增大或缩小的趋势,还有季节性和方差的不稳定性。时间序 列的非平稳特性广泛存在,它从客观角度表达出经济活动实际 情况的同时,也使我们使用数学模型估量存在于时间序列中的 规律遇到困难。所以,对时间序列进行平稳性判断,观察一个 序列是否存在某种趋势,以及各时间间隔内折线是否存在是非 常有必要的。平稳性检验在本文运用的方法是通过观察 ACF 图 和 PACF 图的各项特征值后做出判断的检验方法[3]。 2.3 AIC准则、BIC准则 AIC是为了衡量统计模型拟合是否良好,而被创造出的判 断准则,它的存在意义是为了提供一种判断模型混乱程度以及 数据拟合情况是否良好的标准。 通常情况下,AIC定义为:
AIC=2k-2ln(L) 在上述公式中,k代表了模型的参数数量,L代表了似然函 数。在实际情况中需要从一组模型选择最佳模型的时候,一般 选择其中AIC值最小的模型。 BIC贝叶斯信息准则与AIC准则相似,可以看作AIC准则的 改进版,BIC的惩罚权重比AIC的大,从样本数量出发,当出现 样本数量过多的情况时,可以有效避免由于模型精度过高而造
TECHNOLOGY AND INFORMATION
博宇3 1. 格乐大学工商管理学院 泰国 10220 2. 澳门城市大学数据科学学院 澳门 999078 3. 澳门城市大学 商学院 澳门 999078
摘 要 时间序列又被称为称动态数列,是指将具有同样性质的数值按所处的时间先后进行排序而成的数列。时间 序列分析的主要方法是时间序列预测,时间序列预测是以统计方面的知识以及相关技术,从已经存在的历史数据中 找到存在于其中的规律,并根据其变化的规律建立与其相符的模型,对历史数据在未来时期的变化走向做预估。其 分析步骤检查数据平稳性(不平稳要变平稳),然后模型识别与定阶,然后模型检验,预测。时间序列分析的基本 模型有:AR 模型、MA模型、ARMA 模型和ARIMA 模型。本文主要讲述ARIMA模型。 关键词 多元回归分析;时间序列分析;ARIMA模型
1 时间序列分析的国内外研究现状 时间序列的相关方法最开始被应用于20世纪20年代,数学
家尤勒最先以自回归模型分析市场规律的变化趋势。接下来, 20世纪30年代初,另一位数学家瓦尔格从前人发明的自回归模 型中得到灵感,从而发明了滑动平均模型和自回归滑动平均混 合模型,并获得广泛的应用。越来越多的学者开始使用时间序 列分析方法来研究在日常实际情况中出现的带有时间属性变量 的相关问题,而且做出了大量值得肯定的成绩。潘欢弘[1]等选 取了江西省2008-2015年手足病逐月发病数量的时间序列,建 立Arima模型对2017年手足口手足口病的发病率进行预测,分 析预测的结果发现2017年的手足口病发病率与往年发病趋势相 似,没有太大的出入。张艳选取了2016.1.4-2016.6.24的人民币 对美元日汇率的时间序列,建立Arima对2016.5.12-2016.6.24的 汇率进行预测,将预测结果与实际值对比发现,模型预测精度 较高,可以用此方法对汇率进行预测。徐兰芹以2016年济南市 日空气质量指数的时间序列为基础,结合ARIMA模型和条件异 方差模型进行分析,发现此方法用于预测相似时间序列具有可 行性。赵小盼利用了2018.1到2015.12的CPI月度数据,建立模型 对通货膨胀指数进行预测,与实际值进行对比发现,对于此类 有复杂影响因素的时间序列,组合预测模型相对ARIMA的预测 精度更高。并指出当前几家权威调查机构调查结果的可信性。 纪伟伟采用2005.1-2015.12的肿瘤专科医院月门诊量的时间序列 进行分析,运用ARIMA模型对2016及2017的月门诊数量进行预 测,根据结果发现门诊数量依然会增加,其增长率逐渐稳定, 各个科室的门诊数量具有季节性趋势,肯定了ARIMA在实际 情况中处理问题的能力,并对医院相关部门提出建设性意见。 何永敢等利用ARMA模型对安徽省城乡居民消费水平差距做时 间序列分析,经过预测后发现未来几年安徽省城乡居民消费差 距仍无法得到根本性缩小,需要政府以宏观手段,加大对农村 居民的福利政策,从消费思想,消费环境,消费潜力多方面切 入,提高农村居民的消费水平。谢雨婷用ARMA模型对江苏省 城乡居民收入差异做了预测,发现江苏省城乡居民收入差异有 扩大的趋势,并指出当前的城乡居民收入差距情况是多方面因 素共同造成的,不同地区之间具有差异性,对待不同地区应该 实行不同的政策。
前和前q期的随机误差项的线性函数,φ1 ,φ2 ,......φp 是自回归 系数,描述了 yt-j ( j = 1,2,…,p) 对yt的影响程度,θ1 ,θ2,θ3 ....θ p 是
移动平均系数,εt 是随机干扰误差项。 运用模型有其特定的前提条件,是必须通过由一个平稳随
机过程产生一个依赖于时间的序列。即其过程的随机性质应具 有不变的时点,在图表上呈现为所有的样本点在水平线上下随 机地波动[2]。
2 ARIMA模型及时间序列分析的基本理论 2.1 ARIMA模型介绍 ARIMA模型是由两种模型组成的,一个是AR(自回归模
型)模型,另一个是MA(移动平均模型,这两个模型也可以
看作ARIMA模型的特殊形式,ARIMA模型是以时间序列本身 具有的趋势特征为依据,来寻找变量当期值与其滞后期值及误 差项之间的关系,最后对数据下一步变动进行预测。 ARMA模 型是以两个模型为基础组合而成,具有两个模型的两种特点, 因此它的阶是二维的,ARIMA模型表达式如下: