居民消费价格指数的预测及其结构分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
居民消费价格指数的预测及其结构分析
——以贵州省为例
贵州民族学院李洪飞、杨小欢、陈蛟
目录
摘要 (2)
一、问题的提出 (3)
二、国内研究现状 (3)
三、模型构建前的准备 (4)
3.1 模型若干假设 (4)
3.2 数据来源说明 (4)
四、CPI预测模型构建前得基本分析与处理 (4)
4.1 数据的观察分析 (5)
4.2模型的识别、建立、优化 (6)
五、模型的检验 (8)
六、CPI的预测 (8)
七、CPI的聚类分析 (9)
7.1 对13类具有代表性的商品CPI进行聚类 (9)
7.2 对13类具有代表性的商品CPI进行结构分析 (11)
八、模型结论及意义 (13)
九、模型的不足和改进 (14)
十、参考文献 (15)
十一、附录 (15)
摘要
CPI是居民消费价格指数(consumer price index)的简称。
居民消费价格指数,是一个反映居民家庭一般所购买的消费商品和服务价格水平变动情况的宏观经济指标。
对于CPI的研究,是一个热点。
首先,本文基于时间序列,以2002年1月至2011年3月的数据为基础,对数据进行Box-Cox变换,建立SARIMA模型[1],对贵州省2011年4月至10月的CPI做出预测,达到了87.1258%的拟合优度。
模型结果显示,贵州省2011年4月至10月的CPI有上升的趋势,在10月份同比增长率达到了6.4421%。
因此,要实现贵州省2011年4%的调控目标有较大压力。
然后选取13类具有代表性的商品,对它们的CPI做聚类分析[2]。
在分析前,为了直观,本文对CPI进行了等级划分,划分标准为:Ⅰ级(90≤CPI≤100),Ⅱ级(100≤CPI≤110),Ⅲ级(110≤CPI≤120),Ⅳ(120≤CPI≤130),Ⅴ级(130≤CPI≤140)。
结果显示,在13类商品中,粮食和鲜果总是保持在较高等级。
所以对CPI的影响中,粮食和鲜果是导致上涨的主要因素。
其次,肉禽及制品、蛋、水产品三类得CPI相对来说也比较高,是导致上涨的次要因素。
而13类商品中剩下的商品CPI都比较稳定,价格没有发生多大变化。
最后,分阶段(4个月为一阶段)对13类商品的CPI进行聚类分析。
发现13类商品中,粮食基本维持在Ⅳ级,变化不大;鲜果CPI变化很大,并保持持续上涨,上涨的速度非常快。
肉禽及制品、蛋、水产品的变化相对来说也是比较大的。
通过分阶段聚类分析,结果显示:影响CPI的众多商品构成中,构成结构会随着时间的推移有所改变,即13类商品中,影响CPI增长的权重会有所改变。
对CPI的预测,其意义在于有利于加强宏观、微观预警机制,针对市场可能
出现的情况,相关部门可以依据一定的预测,采取措施进行调控,以实现既定目标。
对CPI的聚类分析,表明分析CPI可以从宏观的分析角度转向微观的分析角度。
通过这种方法对CPI进行细分,针对不协调点,采取相应措施进行调节。
关键词: CPI(居民消费价格指数) SARIMA模型预测
等级 K值聚类CPI细分
■一、问题的提出
消费者物价指数(Consumer Price Index),即居民消费价格指数,英文缩写为CPI,是反映与居民生活有关的商品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。
它既是监测国民经济运行状况的重要指标,又是市场经济活动与政府制定货币政策的重要参考指标。
如果消费者物价指数升幅过大,表明通胀已经成为经济不稳定因素,央行会有紧缩货币政策和财政政策的风险,从而造成经济前景不明朗。
(CPI)是一个滞后性的数据,但它往往是市场经济活动与政府货币政策的一个重要参考指标。
CPI稳定、就业充分及GDP增长往往是最重要的社会经济目标,同时它与老百姓的生活息息相关,研究CPI变化的特性、规律以及影响因素,具有十分重要的理论和现实意义。
因此,正是基于其重要意义,提出如下问题:
⑴利用能够收集到的现有数据,对未来一定范围的CPI做出预测,并根据CPI 的实际意义,对预测值做相应的分析。
⑵CPI是市场的一个综合指标,分析讨论其内部结构,并分析对CPI增长影响较大的是哪些商品。
■二、国内研究现状
居民消费价格指数(CPI)一直是国内经济专家、学者研究的热点,具有研究历史长、研究方法成熟、研究成果丰富等特点。
预测的方法可以分为定性方法和定量方法。
定性分析的方法很多,比如赵蔚将商品价格指数和居民消费价格指数作为主要分析对象,在对其1978年以来走势分析的基础上,预测“十一五”时期的变化趋势[3]。
冯学敏、黄文慧从阐述海南省居民消费价格指数的变化入手,分
析了2005年海南物价的基本走势和物价回落的原因。
定量分析的方法又包括时间序列法和神经网络法,其中时间序列法得到了众多研究者的认可,如谢佳丽,杨善朝,梁鑫运用时间序列的几个不同模型,对我国居民消费价格指数的变化规律进行了比较研究。
查文中利用ARIMA模型,对中国CPI指数进行了预测,得到很好的预测效果。
黄德春、张长征、汤云超则研究CPI与月份之间是否有显著的关系,最后指出,CPI与月份无显著关系[4]。
国海证券构建出很好拟合我国CPI定基指数的含有春节因素回归变量的季节时间模型,拟合优度达到75.45%,对样本外数据的预测误差不超过0.51%,具有较好的预测效果。
肖宏伟则运用了X—12—ARIMA与TRAMO/SEATS季节调整原理,解决了季节和中国春节因素等问题,对CPI 进行预测,也得到了好的效果。
而神经网络是最近几年兴起的一种流行的预测方法,郑艳伟,钱乐祥,张红光,彭军等人建立基于BP神经网络的居民消费价格指数进行预测,结果表明模型的预测值与实测值的误差仅为0.91%[5]。
而对于分析讨论CPI内部结构及哪些商品对CPI增长有较大影响的这一话题,目前本文作者未发现有人进行研究。
■三、模型构建前的准备
3.1 模型若干假设
本文从研究的背景出发,我们提出下列假设:
(1)模型建立中,数据的变换是必要的,并且对数据的Box-Cox变换,根据经验直接取对数是合适的。
(2)在使用模型对CPI进行预测时,我们假定预测时间内不会发生重大的政策变化以及一些影响经济的突发性事件。
(3)我们选择的13类商品具有代表性,它们的变化大体上能够反应整个市场CPI的变化。
(4)对4个阶段的研究,以4个月为一阶段的划分是合理的,对研究没有多大影响。
(5)为了便于直观,人为的对CPI平均值进行等级划分是合理的。
3.2 数据的来源说明
ⅰ、由于本文是对贵州省2011年3月后的居民消费价格指数[6](CPI)进行预测,因此,本文在建立CPI预测模型时,CPI月度数据选取了贵州省2002年1
月至2011年3月的数据,数据来自于贵州省统计外网(/)(统计资料——西部快讯)和中华人民共和国国家统计局数据库(/)。
ⅱ、对CPI进行聚类分析时,收集的是贵州省2010年1月至2011年4月具有代表性的13类商品的月度居民价格指数(CPI),其数据来源:中华人民共和国国家统计局数据库(h ttp:///)。
■四、CPI预测模型构建前的基本分析及处理
4.1数据的观察与分析
4.1.1 建立时间序列分析模型;本文采用Box-Jenkins法[7]和计量经济学软件Eviews
5.0进行模型识别和拟合。
4.1.2 Box-Jenkins法是一种精度较高的时间序列短期预测方法,其主要思想是:某些时间序列是依赖于时间T的一族随机变量,构成该时间序列的单个序列值虽然具有不确定性,但整个序列的变化却有一定的规律性,可以用相应的数学模型进行描述。
其步骤一般分为四步:
Ⅰ检验序列是否属于(弱)平稳时间序列,
Ⅱ识别模型的ARMA的阶数p、q的值,建立ARMA(P,q)模型,
Ⅲ检验模型,
Ⅳ利用模型进行预测。
4.1.3 本模型样本数据(数据附附录),对数据的初步分析,数据在2008
年出现高峰区,我们分析是由于2008年1月贵州凝冻引起的,在2008年凝冻灾害中贵州直接损失348亿元,在凝冻期间,由于受交通的影响,雪灾造成了物价疯长,因此在2008初,CPI有一个高峰。
从总体的数据来看,CPI有向上增长的趋势,如果直观地对其差分,则可能给预测带来较大大的误差,为了减少增长趋势,我们下面将引入Box-Cox变换(1964年由Box和Cox提出)。
4.1.4 在一般的时间序列分析中,非平稳时间序列可以通过有限阶差分化为平稳时间序列进行建模,但是有些不能够通过有限阶差分使其平稳。
有许多序列虽然均值平稳但方差非平稳,此时需要考虑利用适当的变换使得方差平稳。
为了有效的提高预测精度,可以使用一种常用的数据变换工具——Box-Cox变换。
实践证明,Box-Cox变换对许多数据是行之有效的,对因变量的变换可以明显的改善数
据的正态性、方差齐次性和对称性。
现在假设因变量Y=(n y y y y ,,,,321 )是一组取值为正的变量,对于Y 考虑做如下变换: ()1,0ln ,0Y W Y
Y λλλλλ⎧-≠⎪==⎨⎪=⎩
称为因变量Y 的Box-Cox 变换。
它包含了许多常见变换,诸如对数变换(0=λ),倒数变换(1-=λ)和平方根变化(2/1=λ)。
在这里根据经验,选择对数变换(即0=λ),变换后的数据记为(X 1=log(x))。
4.1.5 对X 1做序列图,我们发现虽然序列的增长趋势有所减缓,但是序列仍然是不平稳的,为了使序列平稳,对其做一阶差分,记差分序列为2X ,对2X 做ADF 检验,检验结果如下:
表
上表显示,在1%﹑5%﹑10%的显著性水平下拒绝原假设,接受不存在单位根的结论。
再结合2X 的自相关图和偏自相关图,可以接受2X 平稳的结论。
但是由于CPI 序列的一阶差分的平稳性明显不如二阶差分的平稳性好,所以我们在以下的建模过程中使用二阶差分记为3X 。
做出3X 的自相关图和偏自相关图,我们发现
该序列在滞后期为12的整数倍时出现峰值,即存在明显的季节现象,从经济的常识来看,我们也可以看出,居民消费价格指数存在季节现象。
因此为了更好的建立模型,我们对序列做季节差分,建立乘积季节模型。
记季节差分后的序列为t X ,对t X 做检验,我们发现t X 是平稳的。
4.2模型的识别与建立、优化
4.2.1做出序列
t
X的自相关图和偏自相关图(附附录),从自相关图和偏自相关分析可知,序列自相关系数在K=1时明显不为零,偏自相关系数在K=1,2,3,明显不为零,之后基本趋于零,从其中可以看出,数据明显存在季节因素,其周期为12。
由于上述判断比较粗糙,有很大的主观性。
为精确起见,我们同时建立多个模型,所以可能拟合的模型是:
SARIMA(1,2,0)(1,1,1)
12,SARIMA(3,2,0)(1,1,1)
12
,SARIMA(4,2,0)(1,1,1)
12
,
SARIMA(5,2,0)(1,1,1)
12,SARIMA(6,2,0)(1,1,1)
12
,SARIMA(3,2,,1)(1,1,1)
12
,
SARIMA(,6,2,1)(1,1,1)
12,SARIMA(3,2,0)(1,1,1)
12
, SARIMA(0,2,1)(2,1,1)
12
,
SARIMA(3,2,0)(2,1,1)
12SARIMA(4,2,0)(2,1,1)
12
等
4.2.2.模型的优化
在软件中输入d(log(x),1,0) c ar(1),我们发现均值 C=-0.000244,伴随概率p=0.8535,远远大于0.05,不显著,即C的取值可以取0。
C没通过检验,这项表明CPI是一个零均值的平稳序列,所以在以后的建模中均值这项不用再考虑,对所有模型系数及残差进行检验,能够通过检验的模型有:
SARIMA(3,2,0)(1,1,1)
12,SARIMA(4,2,0)(1,1,1)
12
,SARIMA(5,2,0)(1,1,1)
12
SARIMA(6,2,0)(1,1,1)
12,SARIMA(3,2,,1)(1,1,1)
12
,SARIMA(,6,2,1)(1,1,1)
12
SARIMA(0,2,1)(2,1,1)
12,SARIMA(3,2,0)(2,1,1)
12
,SARIMA(4,2,0)(2,1,1)
12
4.2.3 模型方程的建立
根据AIC(Akaika information criterion)准则及SC准则[8],可以选择出比较好的模型为:SARIMA(0,2,1)(2,1,1)
12
,即对X建立
SARIMA(0,2,1)(2,1,1)
12
模型:
表
模型的估计为:
SARIMA(0,2,1)(2,1,1)
12
由上表可以看出,所有系数都是非常显著的,拟合优度达到87.1258%,拟合的效果很好。
■五、模型的检验
从上表可以看出,模型的滞后多项式根落在单位圆内,满足过程平稳的基本要求,可以认为模型是合适的。
对残差的检验,残差的自相关系数和偏自相关系数95%落在随机区间内,证明残差序列是白噪声,表明该模型的拟合值与原始值无明显差异[9]。
对残差的ADF检验也显示,在1%﹑5%﹑10%显著水平下拒绝存在单位根的原假设,即残差序列是平稳的白噪声序列。
表残差序列的ADF检验
■六、CPI的预测
利用以上的模型对贵州省的CPI做出预测。
预测结果显示:误差控制在0.443%至1.376%内,预测的精度很高。
预测值与真实值如下:
表
■七、CPI的聚类分析
7.1 对13类具有代表性的商品居民消费价格指数进行聚类分析
7.1.1 CPI是一个市场综合指标,它反映的是整个市场的情况,这里选取了13类具有代表性的商品,它们分别是粮食、肉禽及制品、蛋、水产品、鲜菜、烟酒及用品、衣着、家庭设备用品及服务、交通及通信、娱乐教育用品及服、居住。
对其进行聚类分析,分析看哪些商品具有较高的CPI,对整个市场CPI的影响较大。
7.1.2 为了比较直观,我们对CPI分级,Ⅰ级,Ⅱ级,Ⅲ级,Ⅳ级,Ⅴ级,其分等级的标准如下:
Ⅰ级:90≤CPI≤100
Ⅱ级:100≤CPI≤110
Ⅲ级:110≤CPI≤120
Ⅳ级: 120≤CPI≤130
Ⅴ级: 130≤CPI≤140
7.1.3对13种具有代表性的商品进行K值聚类分析,其中分别取K=3和K=5,
有聚类分析如下(K=5时聚类表格附附录):
表
7.1.4从聚类分析可以看出:
⑴当K=3时,粮食和鲜果属于一类,其平均值为122.57,按预先规定的级别来说属于Ⅳ级;肉禽及制品、水产品、鲜菜属于一类,平均值为111.07
,属于Ⅲ级;剩下的烟酒及用品、衣着、家庭设备用品及服务、医疗保健及个人用品、交通及通信、娱乐教育用品及服务、居住属于同一类,平均值为100.53,归属于Ⅱ级。
⑵当K=5时(附附录),粮食单独的作为一类,其平均值为120.8,归属于Ⅳ级;肉禽及制品、蛋、水产品为一类,平均值为109.575,归属于Ⅱ级;鲜果单独为一类,平均值为124.36,归属于Ⅳ级;烟酒及用品、衣着、家庭设
备用品及服务、医疗保健及个人用品、交通及通信、娱乐教育用品及服务、居住,平均值100.53,归属于Ⅱ级:鲜菜作为一类,平均值为115.54,归属于Ⅲ级。
7.2 对13类具有代表性的商品CPI 进行结构分析
7.2.1这里选择了2010年1月至2011年4月的数据,以每隔4个月的数据来进行聚类分析,即对其分阶段进行分析。
其中K 取5,并对其分类进行评级,分析13类具有代表性的商品CPI 的结构是否发生在各阶段会发生变化,进一步分析各种商品的价格变化。
7.2.2 具有代表性的13类商品分阶段聚类分析
表 2010年1月---4月 表 2010年5月---8月
表 2010年9月---12 月 表 2011年1 ---4月
7.2.3 从分阶段聚类分析可以看出:
⑴粮食在4个阶段,基本是属于单独
的一类,只有在2011年1月至4月才有所改
变。
除2010年1月至4月归属于Ⅲ级外,其
他都归属于Ⅳ级,其平均值分别为:
115.35,121.05,124.6,120.115,相对比较稳
定,维持在较高水平。
⑵鲜果在4个阶段分别归属于:Ⅲ级,Ⅲ级,Ⅴ级,Ⅴ级,波动较大。
⑶鲜菜也是属于单独的一类,4个阶段的CPI平均值分别为:
110.95,121.05,103.85,112.9相对来说还是有变化的。
⑷烟酒及用品、衣着、家庭设备用品及服务、医疗保健及个人用品、交通及通信、娱乐教育用品及服务、居住共7项商品,它们的CPI在4个阶段都基本稳定,波动范围不大,并且都在100的周围微小变动。
⑸肉禽及制品在4个阶段的波动比较大,CPI平均值分别为:
99.695,102.81,114.55,120.115,在4个阶段分别归属于:Ⅰ级,Ⅱ级,Ⅲ级,Ⅳ级。
可以看出肉禽及制品变化极大。
⑹蛋在4个阶段分别归属于:Ⅱ级、Ⅱ级、Ⅲ级、Ⅳ级;水产品分别归属于; Ⅱ级、Ⅲ级、Ⅲ级、Ⅳ级。
蛋、水产品在4个阶段的变化也挺大的,并且波动大,都呈现升高趋势。
■八、模型结论及意义
8.1 对贵州省2011年4—10月的CPI做出预测,其预测值分别为:
104.7467,105.263,105.9173,106.4956,107.5722,108.7715,110.1676。
同比增长率分别为2.45%,2.7959%,2.733%,2.795%,3.6341%,4.9918%,6.4421%,因此预计接下来几个月贵州省的居民消费价格指数会保持向上的增长,存在很大的通胀压力。
尤其是10月份,同比增长达到了6.4421%,要实现全年4%的同比增长还是有压力的。
对CPI的预测,可以加强对宏观经济、微观经济的调控,为政府、企业等相关部门提供政策依据。
8.2 对13类具有代表性的商品聚类分析发现,CPI保持较高的分别是粮食和鲜果,CPI的平均值达到了122.57,可以看出CPI增幅中,粮食和鲜果做了非常大的贡献;其次是肉禽及制品、蛋、水产品、鲜菜,CPI平均值达到了111.07,对CPI 增幅的影响也不小;剩下的烟酒及用品、衣着、家庭设备用品及服务、医疗保健及个人用品、交通和通信、娱乐教育用品及服务、居住7类商品,基本保持在100.53左右,没有较大波动,没有出现价格持续上涨的现象。
分析13类商品中各项对CPI 涨幅的影响,在一定范围内可以从微观角度(相对而言)对CPI进行调控。
根据供给—需求的价格决定理论,价格是由市场供求所决定的。
当价格保持较高持续的增长时,我们可以从两个方面来进行调控:
8.2.1 增加供给。
比如,企业应该提高自主创新能力,扩大单位产量;政府可以采取措施,增加生产者的积极性等。
8.2.2 降低需求。
比如当商品为非必需品时,我们可以采取措施让消费者购买替代品,减少对某一类或少数几类商品的购买。
总之,对CPI的持续上涨,短期内我们可以从微观角度(相对而言)出发,采取措施,调控市场供求。
但是根据市场的特点,长时期内不适应通过供求调控。
8.2.3 对13类商品分阶段聚类分析发现,4个阶段CPI的结构有所改变。
虽然保持较高持续增长的还是粮食和鲜果,粮食的增长基本平稳,波动不是很大,但是鲜果有较大的波动,并保持持续增长的态势。
下图为鲜果CPI的时序图:
从图可以看出,鲜果CPI波动较大,并有上涨的趋势。
另外肉禽及制品、蛋、水产品的波动也挺大的。
可见,4个阶段13类具有代表性的商品CPI变化幅度并不相同,构成CPI的结构有所改变。
对13类CPI结构的分析,有利于掌握CPI的内部变化规律,采取措施,从内部变化入手,对通胀进行调控。
■九、模型的不足与改进
9.1 不足:
9.1.1 本文的模型在预测上存在一定的误差,主要究其原因应该是2008年贵州遭受凝冻天气,由于物资短缺,CPI存在一个明显的高峰期,对于这种极其明显的增长,没有给予修正,导致模型在预测时有较大的影响。
9.1.2 进行聚类分析时选取的具有代表性的13类商品具有较大的主观性,对模型可能有一定的影响。
9.1.3 在分阶段聚类分析考察CPI结构变化时,选取的样本太少。
9.2 改进:
9.2.1 对CPI建立预测模型时,应该对出现的极端的数据进行修正。
9.2.2 为了提高模型的准确性和实用性,在条件允许的情况下应该增加样本容量。
■十、参考文献
[1] 王黎明,王连,杨楠,《应用时间序列分析》,复旦大学出版社,2010年
12月
[2] 朱建平,《应用多元统计分析》,科学出版社,2006年8月
[3] 赵蔚,“十一五”时期我国价格变动预测,《价格月刊》,2006年01期
[4] 黄德春、张长征、汤云超,《基于方差分析的中国CPI与月份关系研究》,《经济研究导刊》,2009年03期
[5] 郑艳伟,钱乐祥,张红光,彭军,《利用神经网络对居民消费价格指数预测的研究——以广州为例》,《云南地理环境研究》,2006年06期
[6] 中华人民共和国国家统计局数据库,网站:(/)
[7] 王黎明,王连,杨楠,《应用时间序列分析》,复旦大学出版社,2010年
12月
[8] 王黎明,王连,杨楠,《应用时间序列分析》,复旦大学出版社,2010年
12月
[9] 易丹辉,《数据分析与EVIEWS应用》,中国统计出版社,2002年
■十一、附录
图1 CPI月度数据时序图
图2 LOG(CPI)时序图
图3 CPI的自相关和偏自相关图
图4 CPI取对数后二阶差分、季节差分相关图
图5 残差检验图
图6 预测值与真实值
2010年1月至4月
2010年5月---8月
2011年1月---4月
贵州省2002年1月—2011年3月CPI
2010年1月至2011年4月13类商品的CPI
其中X1,X2,X3,…………,X13,分别代表粮食、肉禽及制品、蛋、水产品、鲜菜、烟酒及用品、衣着、家庭设备用品及服务、交通及通信、娱乐教育用品及服、居住13类商品的居民消费价格指数。