基于并联灰色_线性回归组合模型的客运量预测
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
根据该模型对客流量进行预测,并做1 次残差修 正,得:C =0.316<0.35,P =1.000>0.95,评价结果 均为“好”,精度等级为一级,该模型预测数据可靠。
(2) 对q(0() t)建立GM(1,1)模型,其时间相应系
由加权系数的求解可知:GM(1,1 )模型的有效度
93
第 30 卷 第 8 期
学学报(自然科学版),2004, (4):541-544.
程度,保证预测值在限定的误差区间内浮动,则能避 免单一预测模型在预测过程中可能出现的局部较大偏 差,与实际运用的吻合度较单一预测模型要高。
3 预测结果
[3] 张飞涟、史 峰.铁路客货运量预测的随机灰色系统模型[J]. 中南大学学报(自然科学版),2005,36(1):158-162.
B=
- 12 ( x(1() 2)+x(1() 3)) 1
(1-ea′) (q(0() 1)-u′/a′)e-a′t
…
- 12(x(1() N-1)+x(1() N)) 1 , YN=[x1(0() 2),x1(0() 3),…,x1(0() N)]T (3) 运用最小二乘法求解灰参数a^:a^=[a,u]T =
(BT B )- 1B T Y N (4) 将灰参数带入时间函数,计算x(0() t)与x(0^() t)
之差q(0() t)及相对误差( e t):x(^1() t+1)=x(0() 1)-u/a)
e-at+u/a,x^(0() t+1)=-a(x(0() 1)-u/a)e-at
{ 其中:(δ t-i)= 10 tt ≥ < ii 。
拟合曲线,最终达到对整个系统进行预测。回归分析 (N)},对原始数列进行做一次累加生成,可以得到:x(1)=
t
是研究因变量和自变量之间变动比例关系的一种常用 {x(1() 1),x(1() 2),…,x(1() N)},其中,x(1() t)= x(0() k)。
k =1
92
第 30 卷 第 8 期
C=s1/s2,p={|q(0() t)-q(0)|<0.674 5s1} (3) 预测结果的诊断标准如表1 所示。
表 1 GM(1,1)模型精度诊断标准
指标进行选取,发现区域G D P 及区域人口与客运量的 变化有较高关联性,相关数据如表2 所示。
因此把客运量看成因变量,区域G D P(设为变量 x1)、区域总人口(设为变量 x 2 )看成两个自变量,形成 二元线性回归关系,回归显著性检验的α 值取0.01。以 x1、x2 为自变量,以客流量Y 为因变量,把2000—2005 年数据代入前述相关公式进行预测分析,回归方程的
[4] 陈华友.组合预测方法有效性理论及其应用[M].北京:科技出 版社,2008.
基于对3 种预测模型的比较与分析,依据组合模 型,将表3 中相关预测值带入组合模型公式y t 对今后5
收稿日期:2008-07-09 责任编辑:王学智
94
第 30 卷 第 8 期
随着经济社会的发展,铁路客运工作不再局限于追 求旅客流量,还要根据旅客流量的统计分析,改
1.1 线性回归模型 回归分析预测法是根据事物内部因素变化的因果
关系来预测事物未来的发展趋势。 多元线性回归模型
进车站硬件设施和提高旅客服务质量。 因此,未来客 运量的预测对铁路部门决策和判断具有重要作用。 本 文将采用灰色 GM(1 ,1 )模型与线性回归模型并联成组
摘 要:对铁路客运量准确的预测与分析是铁 路部门进行相关决策和判断的依据,为此运用灰 色模型—线性回归组合预测方法,对武昌站2008 — 2012 年的客运量进行预测。预测结果和单一
方法,注重分析预测对象的各因素对结果所造成的影 响。 实际上,一种现象常常与多个因素相联系,由多个 自变量的最优组合共同来预测或估计因变量,相比只用 一个自变量进行预测或估计更有效,更符合实际[2]。
的定量预测方法。灰色GM(1 ,1 )模型是一种单序列 考察回归效果的显著性。
的一阶线性动态模型,其建模的实质是对原始数据进 1.2 灰色GM(1,1)模型[3]
行累加,使生成的数据呈现一定的规律,从而弱化原 1.2.1 模型的建立
始数据列的随机性,并通过建立微分方程模型,求得
(1) 构造原始数列:x(0)={x(0() 1),x(0() 2),…,x(0)
在运用灰色G M(1 ,1 )模型进行预测的基础上,
设两模型的有效度为s1,s2,二模型的加权系数为:
对预测结果的精度进行诊断和评判。 (1) 运用后验差诊断模型的可靠度,计算观察数
2
fi=si/j = 1 sj i=1,2
据离差s1 及离差的残差s2:
m
s21= t =( 1 x(0() t)-x(0() t))2,
研究与建议
铁道运输与经济 RAILWAY TRANSPORT AND ECONOMY
文章编号:1003-1421(2008)08-0092-03 中图分类号:O29:U293.1+3 文献标识码:B
基于并联灰色—线性回归组合 模型的客运量预测
谢孝如 1,蒋惠园 1,申耀伟 2
(1.武汉理工大学 交通学院, 湖北 武汉 430063;2.中铁第四勘察设计院集团有限公司 地质与路基设计研究处, 湖北 武汉 430063)
的一般形式为:
n
Y=a+ i = 1 bi xi,i=1,2,…,n。
其中Y 代表多元线性回归的估计值;a 为待定的常
合预测方法。 组合预测是将两种及以上不同的预测模 数;bi 表示Y 对xi 的回归系数;xi 代表影响事物发展的 型的预测结果按照一定的方式组合起来,形成新的预 第i个因素。根据最小二乘法原理,带入已知数据确定
1.3 加权系数的确定[4] 设待预测数据总数为N,而y1^t,y^2t,A1t,A2t 分别为
使用灰色G M(1 ,1 )模型、线性回归模型的预测值和
精度序列,f1,f2 为这两种模型的加权系数,yt 为组合 模型预测值。
A i t = 1 - y t - y t y ^ i t , i =1,2;t=1,2,…,N
(3 ) 两种模型的组合方式有多种,例如串联、并 联、嵌入等。 加权系数的确定方法也有多种,预测中 采用的并联组合模型线性加权的方法,其他几种组合
表4 3种模型预测值精度比较
%
方式和加权方法读者可自行计算比较。
(4 ) 鉴于该组合模型对内外因素进行了综合考
虑,预测精度较高且离散程度较低,该方法不失为客
测方法。组合预测方法改善了单一预测方法的局限性, 参数a和b( i i=1,2,…,n),从而得到多元线性回归方程。
从而能提高预测精度,降低预测误差[1]。
在这个回归预测模型中,根据自变量的取值,即
灰色G M(1 ,1 )模型和线性回归模型是两类不同 可求出相应的预测值,然后对预测值进行置信度检验,
模型相比,组合预测模型考虑的影响因素较多, 1 组合思想
可操作性强,预测数据综合了内外因素影响,预 测结果较为可靠,可作为决策判断的依据。 关键词: 铁路;客运量预测;灰色模型 ;线性 回归
首先,分别采用灰色G M(1 ,1 )模型和线性回归 模型进行预测,再对预测结果进行加权分析,并对预 测结果按有效度所确定的加权系数进行线性加权累 加,将计算结果作为并联组合模型的最终预测值。
则残差数列为:Q(0() t)={q(0() 1),q(0() 2),…,q(0() n)}
=17.285,P =0.006,回归方程有效,回归方程为: Y=0.193x1-0.800x2+1 203.96 根据表2 相关数据建立灰色 G M(1 ,1 )模型,计
算得预测模型:x(1() t+1)=(x(0() 1)-u/a)e-at+u/a= -232.978e-0.464 72t+271.0417
运量预测的有效方法之一。
参考文献:
[1] 刘思峰,党耀国.预测方法与技术[M].北京:高等教育出版社,
可见,组合模型为非劣模型,在有效综合了多种
2005.
影响因素的基础上,对预测结果进行了线性组合优化, [2] 陈淑燕,王 炜.交通量的灰色神经网络预测方法[J].东南大
并且在保证预测精度的同时,降低了预测结果的离散
为0.999,二元线性回归模型的有效度为0.972。因此, 万人、1 482.38万人、1 505.74万人。
两种模型的加权系数分别为f1=0.507,f2=0.493。则 用3 种模型对2006 年、2007 年客流量分别预测,见表3。
4 结论
表3 2006-2007年客流量预测值与实际值比较 万人
m-1
s22= t= (1 q(0() t)-q(0() t))2/(m-1),
组合模型为:yt=f1y1t+f2y2t ( t=1,2,…,K)
2 模型比较
结合武昌站和武汉市近年来相关统计数据(中国
(2) 计算后验比和小误差概率为:
统计年鉴),运用统计软件SPSS 对2000—2007年各个
(1) 并联型灰色—线性回归模型能对灰色模型、
线性回归模型进行合理的加权,综合多种信息,从而
引入最大误差绝对值、最小误差绝对值、误差算 术平均值和标准误差,对精度进行对比,结果见表4 。
有利于较为全面的预测。 (2) 样本数据的丰富程度直接制约着预测结果的
精度,足够量的样本数据是将预测值和实际值进行充 分比对分析的前提,可最大限度的接近理想预测值。
基于并联灰色—线性回归组合模型的客运量预测 谢孝如 等
研阵B 与常数项向量YN:
数为:q(0() t+1)=(1-ea′) (q(0() 1)-u′/a′)-a′t
- 12 ( x(1() 1)+x(1() 2)) 1
代入残差q (0) 式,可得残差GM(1 ,1 )模型为: x(0() t+1)=(1-ea′) (x(0() 1)-u/a)e-a′+δ(t-i)
x^(0() t+1)=x^(1() t+1)-x(^1() t) q(1() t)=x(0() t)-x^(0() t),(e t)=q(0() t)/x(0() t)
Ei= N1 t = N1 Ait
σi= N1 t= N1 ( Ait-Ei)2
1.2.2 精度诊断
则有效度:si =E( i 1-σi)
复相关系数为0.935,决定系数为0.874,经方差分析,F
1.2.3 残差模型的建立 在G M(1 ,1 )模型的预测数据不能满足精度要求
时,需对预测结果进行残差修正,具体步骤如下: (1) 设模型预测值为:X(0)={x^(0() 1),x^(0() 2),…,
x^(0() n)} 残差为:q(0)=x(0() i)-^x(0() i),i=1,2,…,n
研究与建议
铁道运输与经济
表2 相关数据总表
基于并联灰色—线性回归组合模型的客运量预测 谢孝如 等
年武昌站客运量进行预测,预测结果见表 5 。
表5 2008—2012年3种模型预测结果
万人
用并联灰色—线性回归模型预测2008 —2012 年
的客运量依次为1 346.78万人、1 402.90万人、1 448.10
(2) 对q(0() t)建立GM(1,1)模型,其时间相应系
由加权系数的求解可知:GM(1,1 )模型的有效度
93
第 30 卷 第 8 期
学学报(自然科学版),2004, (4):541-544.
程度,保证预测值在限定的误差区间内浮动,则能避 免单一预测模型在预测过程中可能出现的局部较大偏 差,与实际运用的吻合度较单一预测模型要高。
3 预测结果
[3] 张飞涟、史 峰.铁路客货运量预测的随机灰色系统模型[J]. 中南大学学报(自然科学版),2005,36(1):158-162.
B=
- 12 ( x(1() 2)+x(1() 3)) 1
(1-ea′) (q(0() 1)-u′/a′)e-a′t
…
- 12(x(1() N-1)+x(1() N)) 1 , YN=[x1(0() 2),x1(0() 3),…,x1(0() N)]T (3) 运用最小二乘法求解灰参数a^:a^=[a,u]T =
(BT B )- 1B T Y N (4) 将灰参数带入时间函数,计算x(0() t)与x(0^() t)
之差q(0() t)及相对误差( e t):x(^1() t+1)=x(0() 1)-u/a)
e-at+u/a,x^(0() t+1)=-a(x(0() 1)-u/a)e-at
{ 其中:(δ t-i)= 10 tt ≥ < ii 。
拟合曲线,最终达到对整个系统进行预测。回归分析 (N)},对原始数列进行做一次累加生成,可以得到:x(1)=
t
是研究因变量和自变量之间变动比例关系的一种常用 {x(1() 1),x(1() 2),…,x(1() N)},其中,x(1() t)= x(0() k)。
k =1
92
第 30 卷 第 8 期
C=s1/s2,p={|q(0() t)-q(0)|<0.674 5s1} (3) 预测结果的诊断标准如表1 所示。
表 1 GM(1,1)模型精度诊断标准
指标进行选取,发现区域G D P 及区域人口与客运量的 变化有较高关联性,相关数据如表2 所示。
因此把客运量看成因变量,区域G D P(设为变量 x1)、区域总人口(设为变量 x 2 )看成两个自变量,形成 二元线性回归关系,回归显著性检验的α 值取0.01。以 x1、x2 为自变量,以客流量Y 为因变量,把2000—2005 年数据代入前述相关公式进行预测分析,回归方程的
[4] 陈华友.组合预测方法有效性理论及其应用[M].北京:科技出 版社,2008.
基于对3 种预测模型的比较与分析,依据组合模 型,将表3 中相关预测值带入组合模型公式y t 对今后5
收稿日期:2008-07-09 责任编辑:王学智
94
第 30 卷 第 8 期
随着经济社会的发展,铁路客运工作不再局限于追 求旅客流量,还要根据旅客流量的统计分析,改
1.1 线性回归模型 回归分析预测法是根据事物内部因素变化的因果
关系来预测事物未来的发展趋势。 多元线性回归模型
进车站硬件设施和提高旅客服务质量。 因此,未来客 运量的预测对铁路部门决策和判断具有重要作用。 本 文将采用灰色 GM(1 ,1 )模型与线性回归模型并联成组
摘 要:对铁路客运量准确的预测与分析是铁 路部门进行相关决策和判断的依据,为此运用灰 色模型—线性回归组合预测方法,对武昌站2008 — 2012 年的客运量进行预测。预测结果和单一
方法,注重分析预测对象的各因素对结果所造成的影 响。 实际上,一种现象常常与多个因素相联系,由多个 自变量的最优组合共同来预测或估计因变量,相比只用 一个自变量进行预测或估计更有效,更符合实际[2]。
的定量预测方法。灰色GM(1 ,1 )模型是一种单序列 考察回归效果的显著性。
的一阶线性动态模型,其建模的实质是对原始数据进 1.2 灰色GM(1,1)模型[3]
行累加,使生成的数据呈现一定的规律,从而弱化原 1.2.1 模型的建立
始数据列的随机性,并通过建立微分方程模型,求得
(1) 构造原始数列:x(0)={x(0() 1),x(0() 2),…,x(0)
在运用灰色G M(1 ,1 )模型进行预测的基础上,
设两模型的有效度为s1,s2,二模型的加权系数为:
对预测结果的精度进行诊断和评判。 (1) 运用后验差诊断模型的可靠度,计算观察数
2
fi=si/j = 1 sj i=1,2
据离差s1 及离差的残差s2:
m
s21= t =( 1 x(0() t)-x(0() t))2,
研究与建议
铁道运输与经济 RAILWAY TRANSPORT AND ECONOMY
文章编号:1003-1421(2008)08-0092-03 中图分类号:O29:U293.1+3 文献标识码:B
基于并联灰色—线性回归组合 模型的客运量预测
谢孝如 1,蒋惠园 1,申耀伟 2
(1.武汉理工大学 交通学院, 湖北 武汉 430063;2.中铁第四勘察设计院集团有限公司 地质与路基设计研究处, 湖北 武汉 430063)
的一般形式为:
n
Y=a+ i = 1 bi xi,i=1,2,…,n。
其中Y 代表多元线性回归的估计值;a 为待定的常
合预测方法。 组合预测是将两种及以上不同的预测模 数;bi 表示Y 对xi 的回归系数;xi 代表影响事物发展的 型的预测结果按照一定的方式组合起来,形成新的预 第i个因素。根据最小二乘法原理,带入已知数据确定
1.3 加权系数的确定[4] 设待预测数据总数为N,而y1^t,y^2t,A1t,A2t 分别为
使用灰色G M(1 ,1 )模型、线性回归模型的预测值和
精度序列,f1,f2 为这两种模型的加权系数,yt 为组合 模型预测值。
A i t = 1 - y t - y t y ^ i t , i =1,2;t=1,2,…,N
(3 ) 两种模型的组合方式有多种,例如串联、并 联、嵌入等。 加权系数的确定方法也有多种,预测中 采用的并联组合模型线性加权的方法,其他几种组合
表4 3种模型预测值精度比较
%
方式和加权方法读者可自行计算比较。
(4 ) 鉴于该组合模型对内外因素进行了综合考
虑,预测精度较高且离散程度较低,该方法不失为客
测方法。组合预测方法改善了单一预测方法的局限性, 参数a和b( i i=1,2,…,n),从而得到多元线性回归方程。
从而能提高预测精度,降低预测误差[1]。
在这个回归预测模型中,根据自变量的取值,即
灰色G M(1 ,1 )模型和线性回归模型是两类不同 可求出相应的预测值,然后对预测值进行置信度检验,
模型相比,组合预测模型考虑的影响因素较多, 1 组合思想
可操作性强,预测数据综合了内外因素影响,预 测结果较为可靠,可作为决策判断的依据。 关键词: 铁路;客运量预测;灰色模型 ;线性 回归
首先,分别采用灰色G M(1 ,1 )模型和线性回归 模型进行预测,再对预测结果进行加权分析,并对预 测结果按有效度所确定的加权系数进行线性加权累 加,将计算结果作为并联组合模型的最终预测值。
则残差数列为:Q(0() t)={q(0() 1),q(0() 2),…,q(0() n)}
=17.285,P =0.006,回归方程有效,回归方程为: Y=0.193x1-0.800x2+1 203.96 根据表2 相关数据建立灰色 G M(1 ,1 )模型,计
算得预测模型:x(1() t+1)=(x(0() 1)-u/a)e-at+u/a= -232.978e-0.464 72t+271.0417
运量预测的有效方法之一。
参考文献:
[1] 刘思峰,党耀国.预测方法与技术[M].北京:高等教育出版社,
可见,组合模型为非劣模型,在有效综合了多种
2005.
影响因素的基础上,对预测结果进行了线性组合优化, [2] 陈淑燕,王 炜.交通量的灰色神经网络预测方法[J].东南大
并且在保证预测精度的同时,降低了预测结果的离散
为0.999,二元线性回归模型的有效度为0.972。因此, 万人、1 482.38万人、1 505.74万人。
两种模型的加权系数分别为f1=0.507,f2=0.493。则 用3 种模型对2006 年、2007 年客流量分别预测,见表3。
4 结论
表3 2006-2007年客流量预测值与实际值比较 万人
m-1
s22= t= (1 q(0() t)-q(0() t))2/(m-1),
组合模型为:yt=f1y1t+f2y2t ( t=1,2,…,K)
2 模型比较
结合武昌站和武汉市近年来相关统计数据(中国
(2) 计算后验比和小误差概率为:
统计年鉴),运用统计软件SPSS 对2000—2007年各个
(1) 并联型灰色—线性回归模型能对灰色模型、
线性回归模型进行合理的加权,综合多种信息,从而
引入最大误差绝对值、最小误差绝对值、误差算 术平均值和标准误差,对精度进行对比,结果见表4 。
有利于较为全面的预测。 (2) 样本数据的丰富程度直接制约着预测结果的
精度,足够量的样本数据是将预测值和实际值进行充 分比对分析的前提,可最大限度的接近理想预测值。
基于并联灰色—线性回归组合模型的客运量预测 谢孝如 等
研阵B 与常数项向量YN:
数为:q(0() t+1)=(1-ea′) (q(0() 1)-u′/a′)-a′t
- 12 ( x(1() 1)+x(1() 2)) 1
代入残差q (0) 式,可得残差GM(1 ,1 )模型为: x(0() t+1)=(1-ea′) (x(0() 1)-u/a)e-a′+δ(t-i)
x^(0() t+1)=x^(1() t+1)-x(^1() t) q(1() t)=x(0() t)-x^(0() t),(e t)=q(0() t)/x(0() t)
Ei= N1 t = N1 Ait
σi= N1 t= N1 ( Ait-Ei)2
1.2.2 精度诊断
则有效度:si =E( i 1-σi)
复相关系数为0.935,决定系数为0.874,经方差分析,F
1.2.3 残差模型的建立 在G M(1 ,1 )模型的预测数据不能满足精度要求
时,需对预测结果进行残差修正,具体步骤如下: (1) 设模型预测值为:X(0)={x^(0() 1),x^(0() 2),…,
x^(0() n)} 残差为:q(0)=x(0() i)-^x(0() i),i=1,2,…,n
研究与建议
铁道运输与经济
表2 相关数据总表
基于并联灰色—线性回归组合模型的客运量预测 谢孝如 等
年武昌站客运量进行预测,预测结果见表 5 。
表5 2008—2012年3种模型预测结果
万人
用并联灰色—线性回归模型预测2008 —2012 年
的客运量依次为1 346.78万人、1 402.90万人、1 448.10