杭州市未来旅游需求的预测(数学建模)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
杭州市旅游需求的预测预报
摘要
本文研究了杭州市入境旅游人数的预测问题。
作为国际风景旅游型城市之一,在下一个五年计划到来之际,对杭州未来旅游人数进行预测是很有意义的。
本文从环境、经济状况,交通、人口等因素出发,以时间序列模型,多元线性回归模型,灰色系统等三类模型入手,建立旅游需求的预测数学模型,并对其进行了预测的检验和模型的比较。
根据相关数据,我们首先以最简单的时间序列模型分别用一次、二次、三次、四次指数对往年数据进行拟合,发现二、三、四次指数拟合效果较好,并且拟合效果接近,为了表达式的简洁,我们选择二次指数作为预测模型对未来两年的旅游人数进行预测。
在模型二中,为了改进时间模型的滞后性,得到更精确的结果,将影响旅游人数的各个因素(包括经济实力,人口,环境以及交通状况)进行了多元线性回归,对实际值和预测值比较得出只有3.19%的较精准的相对误差率,并得出影响杭州旅游人数的主要因素在于人口、经济实力以及交通的结论。
进一步,考虑到时间模型在时间趋于无穷大时人数也趋与无穷大,显然不符合实际。
所以基于杭州市旅游人数不会发生巨大变化的假设,利用逐年的历史数据,用灰色模型理论预测其发展情况,根据灰色模型中对参数a的要求,得到的结果满足中长期预测。
另外,根据预测模型利用后验差法进行了检验,误差只有4.42%,综上,我们用灰色模型对未来十年进行预测预报。
但在检验中我们发现,2010
年出现了7.84%的较大误差,这应该是和2010年在上海举办的世博会有关。
考虑到2011年杭州将举行全国第八届残疾人运动会,以及杭州市政府在“十二五”规划下对旅游业的高度重视,我们认为2010年将是杭州旅游业的一个转折点,未来杭州市旅游人数将持续强劲增长,所以我们没有剔除2010的数据。
最后,我们对模型对比分析了优缺点,同时进行了简单的推广。
并根据预测结果对提升杭州旅游收益提供了相关意见。
关键字:旅游需求预测、时间序列模型、多元回归模型、灰色模型,政策
建议。
一.问题重述与分析
1.1 问题重述
本文以杭州市为例根据能够查到的关于旅游需求的预测预报资料,并结合了解到的相关数据,分析旅游资源、环境、交通和经济状况等因素对旅游需求的影响,建立关于旅游需求的预测预报的数学模型。
利用了国内外已有的与旅游需求预测预报相关的数学建模资料和方法,做出合理、正确的预测预报。
为了能够用数学建模的方法对旅游需求进行预测预报,必须做好相关准备工作(包括有关
数据的采集和整理),由此向有关旅游部门提出具体的建议。
杭州的旅游资源极其丰富,是一个国际旅游城市。
合理规划、正确地预测预报旅游需求,对于促进杭州市经济发展和文化交流有着重要意义。
1.2 问题分析
本题要求对杭州市未来十年旅游人数进行量化预测预报。
影响旅游人数的因素很关包括旅游资源,环境,人口等方方面面,我们主要考虑了GDP,环境,交通,人口等因素。
在具体预测时,我们主要采用旅游预测的较为广泛的三个模型,即时间序列模型,多元回归模型以及灰色模型。
时间序列模型对短期内的人数预测较精准,我们选取了杭州1999到2010年的旅游人数数据进行拟合,得到了较精准的图像。
为了改进时间模型只考虑了时间这一单一变量的不足,我们又用多元回归模型将GDP,环境,交通,人口等因素纳入考虑,进行综合评价。
为了得到更合理长远的预测,我们利用灰色模型对未来十年的人数进行预测。
二.基本假设
1. 旅游需求发展没有跳跃式发展,即需求的发展是渐进的,旅游业发展平稳。
2. 社会相对稳定,国家的旅游政策短时间内没有重大变化。
3. 旅游需求主要受资源,环境,交通,季节,费用和服务质量等因素的影响。
4. 景点本身不发生大的变化。
5、检索得到的数据可靠性高。
三.符号说明
x:1999-2010年的年份值;
y:1999-2010年的杭州市旅游人数;
i
x:对旅游人数产生影响的各类因素
ij
b:各个影响因素对旅游人数影响的权值;
i
四.模型建立与求解
(一)时间序列模型
传统预测理论中把旅游需求当做是时间的函数,假定预测期内影响旅游需求的各种因素变化相对不大,将时间序列按照既定的函数关系进行延伸,即可以得到某个时间内的旅游需求量,下面根据1999-2010年杭州每年旅游人数的数据具体论述这种思想在旅游预测中的应用。
1999-2010 年的杭州市旅游人数情况表
根据过去每年的旅游需求,描绘散点图,拟合趋势曲线,然后根据这个模型来预测未来几年的旅游需求情况。
(1)1999-2010 年旅游需求散点图如图1
(2)计算一阶差比率
表2.历年人数的一阶差比率统计
(3)由散点图可以发现,一阶差比率大致相等,符合指数曲线的数字特征。
可以在Matlab 环境下选用指数模型进行模拟(实现的语句见附录1),比较指数模型以及指数二次模型的之后发现,指数二次模型的模拟效果更加精确。
(在拟合之前为了防止在Matlab下数据差距过大而出现警告信息,已经将数据进行了标准化,具体代码参加附录)
比较一下前后得到的残差,绘制残差图:
指数一次模拟残差图指数二次模拟残差图
可见二次指数模型进行拟合的残差点的分布更加具有随机性,并且拟合的结果非常好。
由Matlab计算得出指数二次模型的函数表达式为:
2
0.027770.1450533.7
x x
y e-+
=+
根据该函数,将标准化之后的x的值带入,据此预测未来两年即2011和2012年的旅游人数:
从预测数据可以看出,未来两年旅游人数增长非常快,如摘要结尾解释的那样,我们认为未来两年,这个数据是有参考意义的。
(二)因果模型--多元线性回归模型
1. 问题分析
在时间序列的模型中,考虑的因素只有时间这一个自变量,但是这种模型有一种滞后性的缺点,考虑其他影响因素来进行相关性分析则会更为本质化。
旅游人数是一个随机变量,影响一个随机变量的因素(自变量)不止一个,其多元回归方程是
0112233...
y b b x b x b x
=++++
利用本模型可以做到:
(1)在所有的影响因子中找到和因变量的相关联的因素,建立起它们之间的定量表达式,作为预测方程。
(2)在共同影响因变量的多个因子中,判定哪个因素是主要的,那些是次要的。
本题中,分析的重点是杭州的资源、环境、交通、人口等因素对旅游需求的影响,因此在具体实施中我们以这些因素因素作为自变量:
杭州市市国民生产总值(GDP)——可以间接反映杭州市的基础设施等发展状况;杭州市人口数量——反映自然环境的破坏度以及承载力的大小;
杭州市的绿化面积——反映旅游资源变化以及城市环境状况;
杭州市公路里程——景区当地的交通设施以及和外界的联系密切程度;
2. 杭州市入境人数和各个因素多元线性模型
根据统计数据,选取1999-2010 年的12年的数据作为回归数据,并进行误差分析。
在Matlab (参看附录)环境下求出标准化样本数据的经验回归方程,得到以下的回归系数:
0b =1126.5 1b =1.2031 2b =1.6297 3b =-0.16384 4b =-0.06106
其中1b ,2b ,3b ,4b 分别为GDP ,人口,环境,交通等变量的回归系数。
由此可看出人口,GDP 和交通是影响旅游人数的关键因素。
多元回归方程为:
y=1126.5+1.20311x +1.62972x -0.163843x -0.061064x
得到相对平均误差=3.19%,精度较高,所以预测结果对相关部门有很好的参考价值。
(三)新兴人工智能模型
1. 灰色系统理论模型GM (1,1)
灰色系统建模方法采用以区间及区间运算为代表的灰数处理,是一种简便实用的方法,主要用于灰色预测和决策。
灰色预测方法较多,其中灰色数列预测模型是对时间序列变量的预测。
模型是最常用的一种灰色模型,由一个单变量的一阶微分方程构成。
其建模步骤如下:
设0y =( 0y (1), 0y (2),…,0y (n)) 为原始数列。
1. 对原始数列做一次累加生成和均值生成 由一次累加生成,得:1y =(1y (1),1y (2),…1y (3))
由一次均值生成,得:1z =(1z (1), 1z (2),…,1z (n)) 其中,1
y (k)=01()n
i y i =∑ ;1()z k =(11()(1)y k y k +-)/2, k=2,3,…,n
则01()()y k az k b += a,b 为参数。
上式灰化方程即为GM (1,1)模型。
2. 构造矩阵
构造矩阵Y=B .θ Y 和B 为已知量,θ 为待定参数。
3. 确定参数a 、b ,由于变量只有a 、b 两个,方程有n-1 个,且n-1>2,故方程组无解,故用最小二乘法(OLS ) 得到最小二乘解。
当
'
0B B ≠时,此时1
1dy ay b dx
+=,上式为灰色微分方程式的白化方程。
4. 解白化方程:白化方程的解也称周期响应函数,为:
11()(0)at b b y t y e a a -⎡⎤=-+⎢⎥⎣⎦,11_(1)(0)ak b b y k y e a a ⎡
⎤+=-+⎢⎥⎣
⎦,k =1,2,…,n-1
5.还原,得模型计算值011y (k +1) = y (k +1) - y (k) k=1,2...n
6.对模型进行检验
根据灰色系统理论,一般使用三种检验方式来对灰色模型进行精度检验:残差大小检验、后验检验和关联度检验。
残差大小检验式直观的将模型计算值与原始值逐一进行相对误差检验;后验差检验按照残差的概率分布进行检验;关联度检验则属几何检验,它检验的式模型曲线与行为曲线的几何相似程度。
最常用的是相对误差检验指标。
7.利用模型进行预测
模型通过检验之后,根据a 的值决定预测长度,当− a ≤ 0.3时,GM (1,1)的预测精度较高,可用于中长期预测,当0.3 < − a ≤ 0.5时,可用于短期预测。
现取北京1999-2010年入境旅游人次的数据进行灰色分析。
Y=[2375.7 2592.1 2758 2862.4 3139.4 3417.3 3864.2 4320.5 4773 5324.1
6580.6]
Z=[-3453.9 -5937.8 -8612.8 -11423 -14424 -17702 -21343 -25435 -29982 -35031 -40983]
'10.10563()'1760.8
a B B B Y
b θ--⎛⎫
⎛⎫
=== ⎪
⎪⎝⎭⎝⎭
得预测模型:
10.10563(1)18935.5516669.5(1,2,3...)y k e k n +=-= 按上述模型算出:
1y =(1y (2),1y (3),…1y (12))=(2109.6
2344.6 2605.8 2896.1 3218.8 3577.3 3975.9 4418.8 4911.1 5458.3 6066.4)
再对2011到2020年进行预测,将k=13,14,15......22带入得: (1y (13),1y (14),…1y (22))=(6742.2 7493.3 8328.2 9256
10287 11433
12707 14123 15696 17445)
从以上数据可看出参数-a=0.10563<0.3,所以预测精度较高,可用于中长期预测。
表六:灰色模型误差分析结果图
由上表可得相对误差率=4.42%,精度较高。
利用灰色模型对杭州市2011到2020的旅游人数进行预测得如下图所示表格。
表七:灰色模型对未来十年杭州旅游人数的预测结果
从预测结果来看,前两年数据和指数二次模型预测的数据比较有很大出入,我们认为灰色模型预测的数据是比较理性合理的,同样有一定参考意义。
从长期的预测数据可以看出,增长相对平稳,对未来十年杭州市的旅游人数的估计应该是合理的。
五、模型的纵向比较分析以及优缺点评价
经验上进行预测最传统的方法就是构造时间序模型,这种模型可以认为人数是时间的函数,默认这种函数关系在一段可以预测的时间内不会发生太大的变化,本题中数据具有的特点是一阶差比率大致相等,因此可以考虑指数模型,模拟发现指数二次模型往往具有更高的准确度,模拟之后的残差分布图也确证实了这种观点。
二次指数模型可以很好的拟合数据,而且简单方便,仅需要年份这一输入量即可。
缺点是,结果会趋于无穷大,不符合旅游景点饱和这一实际情况,而且忽略了除年份之外的其他影响因素。
多元线性回归模型很好的考虑了众多的影响因素,并且能为每个因素得出一个权值,从而表明每个因素的重要程度,这为旅游部门的决策提供了很好的依据,但除此之外由于数据有限,没有对季节,费用以及旅游景点数等因素纳入考虑,如果考虑这些因素,结果会更好。
灰色系统模型可以在已知量较少的情况下做出预测,适合于中短期预测,效果较好。
六、模型推广
在本文中,通过有限的资料和数据,我们建立了时间模型,多元回归模型,灰色模型,并且得出的相对误差较小。
时间序列模型是一种常用的数学模型,用于解决时间序列问题,随时间序列进行滑动平均与自回归,对未来相关数据进行预测,可用于消费行为模式变迁研究,还有可用于变动特征的销售量、市场规模的预测等等。
灰色预测在工业、农业、商业等经济领域,以及环境、社会和军事等领域中都有广
泛的应用。
特别是依据目前已有的数据对未来的发展趋势做出预测分析。
七、给杭州市相关部门的具体建议
历史数据的统计表明,杭州市的旅游呈现不断上升的趋势,为了适应旅游需求的不断增长,提高服务质量,旅游部门应相应加大在交通,环境改善等方面的投资力度及相互协作能力。
同时要加快经济建设及人口的优化控制。
在积极发展所以改善杭州市的环境旅游业的同时,要加大对旅游资源的保护力度,防止旅游饱和和超载对环境设施的消极影响。
八、参考文献
[1]《杭州统计年鉴1999》到《杭州统计年鉴2010》;
[2]中国国家统计局
[3]国家统计局.中国统计年鉴
[4]全国大学生数学建模竞赛组委会.数学建模的实践 :2006年全国大学生数学建模夏令营论文集. 北京 : 高等教育出版社, 2007.
九、附录
程序:
附录一:x=1999:1:2010;
y=[2266.05 2375.7 2592.08 2757.98 2862.42 3139.41 3417.32 3864.16 4320.49 4773 5324.12 6580.6];
plot(x,y,'*');
xlabel('年份');
ylabel('旅游人数');
title('杭州 1999 - 2010 年旅游人数');
sdate=(x-mean(x))./std(x);%数据标准化
logp1=polyfit(sdate,log10(y),1);%开始进行指数模拟
logpred1=10.^polyval(logp1,sdate);
semilogy(x,logpred1,'-',x,y,'+');
xlabel('年份');
ylabel('旅游人数');
title('指数一次模型');
grid on
logp2=polyfit(sdate,log10(y),2);%这是指数二次模拟
logpred2=10.^polyval(logp2,sdate);
semilogy(x,logpred2,'-',x,y,'+');
xlabel('年份');
ylabel('旅游人数');
title('指数二次模型');
grid on
附录二:
y0=[2266.05 2375.7 2592.08 2757.98 2862.42 3139.41 3417.32 3864.16 4320.49 4773 5324.12 6580.6];
%由数列y0形成数y1
s=0;
for i=1:12
s=s+y0(i);
y1(i)=s
end
%由数列y1形成矩阵G
for j=1:11
G(j,1)=-(y1(j+1)+y1(j))/2
G(j,2)=1
end
%有数列y0形成矩阵Y
for k=1:11
Y(k,1)=y0(k+1)
end
%计算出估计值a1,a和b
a1=inv(G'*G)*G'*Y
a=a1(1)
b=a1(2)
%求出原始数列y1的预测值数列y2
for k=0:11
y2(k+1)=(y0(1)-b/a)*exp(-a*k)+b/a
end
%求出原时数列y0的预测值数列y3(1999-2020)
y3(1)=y0(1)
for k=1:21
y3(k+1)=(1-exp(a))*(y0(1)-b/a)*exp(-a*k) end。