国内旅游总花费影响因素分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国国内旅游总花费影响因素分析
一、问题提出
1、研究问题
旅游可以促进人力、物力、资源的优化利用,促进当地的相关产业的发展,
解决就业问题,提高经济收益等都是大有裨益的。

更重要是随着旅游业的发展,当地人的观念将会发生根本改变,即按照市场需求,组织生产,搞活流通,以信息化取代封闭的传统的生产模式。

旅游可以使单一资源产生规模效应,扩大单一资源的产品转化和升级,将市场建在家门口,对外提高当地的影响力。

旅游业是现代服务业的重要组成部分,带动作用大。

加快旅游业改革发展,是适应人民群众消费升级和产业结构调整的必然要求,对于扩就业、增收入,推动中西部发展和贫困地区脱贫致富,促进经济平稳增长和生态环境改善意义重大,对于提高人民生活质量、培育和践行社会主义核心价值观也具有重要作用。

中国旅游业的发展是与改革开放同步进行的。

改革开放之前,由于受传统计划体制观念的影响,注重生产轻视消费,旅游被当做一种奢侈品而遭到排斥,同时,国内生活水平普遍较低,对外乂釆取闭关锁国政策,因此,旅游产业的发展缺乏必要的物质基础和政治条件。

改革开放以后,随着中国经济的发展,一方面, 国民经济建设需要大量的资金;另一方面,由于对外开放的大门打开,境外游客和资本急于进入中国,从而为中国的旅游业形成创造了良好的内外
wd
条件和环境。

本文通过对国内旅游总花费的影响因素展开研究,运用建立多元线性回归模型的方法,探讨影响国内旅游总花费的主要因素,并对这些因素进行分析。

2、数据来源(1994-2013,国家统计局)
丫国内旅游总花费(亿元)X1国内生产总值(亿元)X2平均工资(元)X3 客运量(万人)x4国内游客(百万人次)x5居民消费价格指数(上年=100)
为了研究国内旅游总花费的影响因素,把国内旅游总花费(亿元)作为被解释变量y,将国内生产总值(亿元)、平均工资(元)、客运量(万人)、国内游客(白万人次)、居民消费价格指数(上年=100)作为解释变量,分别设为x1, x2、x3、x4、x5,假定其多元线性回归模型表示为:
y = P o + P ix1 + B 2x2 + B 3x3 + 0 4x4 + P sx5
二、相关分析
1>数据基本描述
2
利用散点图、简单相关系数检验被解释变量y和解释变量X2, X3, X4, X5之间的关系。

根据散点图可以看出,国内旅游总花费y与国内生产总值灯、平均工资x2、客运量x3、国内游客x4、居民消费价格指数x5成正相关。

从相关系数表中可以看出国内旅游总花费y与国内生产总值x1.平均工资x2、国内游客x4的相关系数都在0.9以上,高度相关;国内旅游总花费y与居民消费价格指数x5的相关系数在0.8以上,相关性也很强,国内旅游总花费y 与客运量x3的相关系数在0.7以上,具有一定的相关性。

所以,国内旅游总花费y与这五个自变量做回归分析是合适的。

三. 模型建立
根据之前建立的模型 y = P 0 + P 1X1 + 0 2X2 + B 3X3 + B 4X4 + 0 5X5 + G 利
用SPSS,采用强行进入的方法进行多元线性回归,得到结果如下: 1、拟合优度检验
6a. Predictors: (Constant ),居民消费价格指数(上年=100),客运量(万人),国内游客
(百万人次),平均工资(元),国内生产总值(亿元)
b. D
e
p e
n
d
e
n
t V
a
r i a
b
l e :国
内旅





亿


从上表可以看出,方程的复相关系数R=0.993,样本决定系数R 2=0.987,调 整后的样本决定系数为0.982,说明方程拟合优度很好。

a. Predictors: (Constant ),居民消费价格指数(上年=100),客运量(万 人),国内游客(百万人次),平均工资
(元),国内生产总值(亿元)
b. Dependent Variable:国内旅游总花费(亿元)
由ANOVA 表可知,在0.05的显著性水平下,F 值=207.735, P 值为0.000, 说明回归方程高度显著,X1, X2, X3,X4,X5整体上对y 有高度显著的线性
影响。

回归系数的检验
a. Dependent Variable:国内旅游总花费(亿元)
通过表格,我们看到平均工资x2.国内游客x4的回归检验系数P值小于0.05, 通过检验。

而常数项、国内生产总值刘、客运量x3、居民消费价格指数x5系数检验P值均大于0.05,未通过检验。

4、残差分析一一正态性检验
根据直方图和正态概率分布图可以看到,残差基本上符合正态性假设。

Histogram
Normal P-P Plot ofRegression Standardized Residual
Dependent Variable;国内旅游总花费(亿元)
Mean =-1.09E-1S
Std. Dev. =0.858
N=2D
1
5 4 3
A o u a n
b
al li: Dependent Variable;国内旅游总花费(亿元)
5. 残差分析一一异方差检验
Scatterplot
Dependent Variable:国内旅游池花费(亿元〉
5000.00 10000.00 15000.00 20000.00 国内旅游总花费(亿元)
25000.00 30000.00
-E s p -s o o:P a>z -P 」(s
p u e 4s u o _s s a>」6a>—
,00 O
山残差图可知,残差图上的点的散布是随机的,不太有规律;III Correlations 表可知,残差绝对值与X1,X2,X3,X4, X5的相关系数分别为0・15& 0.158, 0.229, 0.156, O0&相应的P 值均大于0.05,说明残差绝对值与自变量xi, X2, X3,X4, X5之间显著不相关。

故综上所述,不存在异方差。

6、自相关性检验
Model Summary6
Model R
R
Square
Adjust
ed R
Square
Std. Error of
the Estimate
Change Statistics
Durbi n・
Watso n
R Square
Change
F
Change df1 df2
Sig. F
Cha n
ge
1 .993
a
.987 .982 987.66685 .987 207.735 5 14 .000 .584
a.Predictors: (Constant),居民消费价格指数(上年=100),客运量(万人),国内游客(百万人次),平均工资(元),国内生产总值(亿元)
b.D e p e n d e n t V a r i a b l e:国内旅游总花费(亿元)
2000.00000-
1000.00000-
0.00000-
-1000.00000-
-2000.00000-
-2000.00 -1000.00 0.00 1000.00 2000.00
滞肩残差
O
从模型汇总表中可知,D.W 值为0.584,查D.W 表,当n=20, k=5时,
dL=0.90,d u =1.83, D.W=0.584<dL,且滞后残差图呈正相关关系,所以模型
存在正自相关性。

7、共线性诊断
3
a. D
即endent Variable:国内旅游总花费(亿 元)
Collinearity Diagnostics 3
Model
Varianee Proportions
(亿元)
111 Coefficients表可以看出"X2,X4的VIF值都大于10,所以存在严重的多重共线性。

山Collinearity
Diagnostics表可知,自变量X2,X3,X4, X5的条件数均大于10,进一步说明自变量之间存在严重的多重共
线性。

8
2013 0.967995 7.687625980.930002 从上表可知,所有数据的删除学生化残差绝对值都小于3,除2013年库克距离都小于
0.5,该模型存在异常值。

四、模型修改
1 •全模型存在的问题
(1)常数项、国内生产总值灯、旅客运输平均距离x3、居民消费价格指数x5系数检验P 值均大于0.05,未通过检验;
(2)存在自相关性;
(3)自变量之间存在严重的多重共线性;
(4)2013年存在异常值。

2.修改
利用SPSS软件采用逐步回归的方式,得到以下结果并加以分析。

(1)拟合优度检验
a
a.Predictors: (Constant),国内游客(疔万人
次)
b.Predictors: (Constant),国内游客(口万人次),
平均工资(元)
c.Dependent Variable:国内旅游总花费(亿元)
III Model Summary表可知,方程的复相关系数R=0.986,样本决定系数为R2为0.972,调整后的样本决定系数为0.970,说明方程拟合程度很好。

(2)回归方程显著性检验
C
a.
b.Predictors: (Constant),国内游客x4,平均工资x2
c.Dependent Variable:国内旅游总花费
y
lIlANOVA表可知,在0.05的显著性水平下,F值为532.053, P值为0.000,远
小于0.005,所以回归方程高度显著,说明X2、X4整体上对y有高度显著的线性影响。

(3)回归系数检验
3
a. Dependent Variable:国内旅游总花费y
由Coefficients表可知,常数项、平均工资X2和国内游客心的回归系数检验的P值均小于
0.05,所以通过检验。

故综上述,该问题的最小二乘回归模型为:
y = -6150.148-0.52X2+17.822X4
(4)残差分析一一正态性检验
根据直方图和正态概率分布可以看岀,残差基本上符合正态性假设。

Histogram
Dependent Variable:国内旅游总花费y
Mean =-1.61E-15
Std Dev =0 946
N=20 Aoualnballt

2
Normal P-P Plot of Regression Standardized Residual
Dependent Variable:国内旅游总花费y
1.0-
0.8-
0.6-
0.4-
0.2-
0 0" IIII
0.0
0.2 0.4 0.6 0.8 1.0
Observed Cum Prob
(5)残差分析一一异方差性检验
qo 」
d E30
Scatterplot
山残差图可知,残差图上的点的散布是随机的,无任何规律;III Correlations 表可知,残差绝对值与X2,X4的相关系数分别为0.195, 0.191,相应的P 值均 大于0.05,说明残差绝对值与各自变量之间显著不相关。

故综上所述,认为不 存在异方差。

(6) 残差分析——自相关性检验
Dependent Variable: H 内旅游总花费 y
33003.0-*
25003 0-
23003"
15003.0-
10003.0-
5003.0-
□.o -
-2 -1 0 1 2
Regression Standardized Residual
a.
b.Predictors: (Constant),国内游客x4,平均工资x2
c.Dependent Variable:国内旅游总花费y
D.W值为0-711,查D.W表,n=20, k=2, d(=1.20, d u=1.41, D.W=0.711< d L,模型存在正自相关性,
用迭代法解决。

通过进一步考察自相关系数,PQ 1-1/2D.W=1-0.5*0.711=0.6445o求出相关系数P后,做变量变换:
yi* = y? p Yi-i ;xi* = xi- P x M
如果方程通过D.W检验,迭代结束,否则,继续重复上述过程, 直到通过D.W检验。

(7)多重线性检验
a. Dependent Variable:国内旅游总花费y
3
由Coefficients表可知,各个自变量的VIF均大于10 ;由Collinearity Diagnostics表可知,共线性诊断中条件数有一个在40附近。

综上述,说明自变量间存在多重共线性。

为了消除共线性,接下来我们剔除解释变量x2。

(8)异常值检验
山上表可知,所有数据的删除学生化残差的绝对值均小于3,库克距离也均小于0.5,故数据不存在异常值。

五. 模型修改
1.模型存在的问题
(1)自变量之间仍存在多重共线性;
2.修改
剔除解释变量x2,利用SPSS软件采用逐步回归的方式,得到以下结果并加以分析。

(1)拟合优度检验
a
次)x4
b.Predictors: (Constant),国内游客(百万人次)x4,客运
量(万人)x3
c.D即endent Variable:国内旅游总花费(亿元)y
III Model Summary表可知,方程的复相关系数R=0.986,样本决定系数为R2为0.972,调整后的样本决定系数为0.970,说明方程拟合程度很好。

(2)回归方程显著性检验
ANOVA C
a.Predictors: (Constant),国内游客(百万人次)x4
b.Predictors: (Constant),国内游客(tf万人次)x4,客运量(万人)x3
c.Dependent Variable:国内旅游总花费(亿元)y
I1IAN0VA表可知,在0.05的显著性水平下,F值为619.067, P值为0.000,远小于0.005,所以回归方程高度显著,说明X2、X4整体上对y有高度显著的线性影响。

(3)回归系数检验
Coefficients3
a. Dependent Variable:国内旅游总花费(亿元)y
由Coefficients表可知,常数项、平均工资X2和国内游客&的回归系数检验的P值均小于0.05,所以通过检验。

故综上述,该问题的最小二乘回归模型为:
y = -2916.426-0.002 X3+9.997X4
(4)残差分析一一正态性检验
根据直方图和正态概率分布可以看出,残差基本上符合正态性假设。

Histogram
Dependent Variable:国内游总花费(亿兀)y
Normal P-P Plot of Regression Standardized Residual
Dependent Variable:国内旅游总花费(亿元)
y
o
4 3 2 Aoua>nbo>」u -
Mean =-4.70E-16 Std. Dev. =0346
N =20
(5)残差分析一一异方差性检验
Scatterplot
Dependent Variable: M 内旅游总花费(亿元)y
2-
-E5p 5a># pd>z-p 」cspu5s u2ssa>

1"
o-
-1-
O
cP
O 。

O
O
O
O
O
O O
O
O
O
-2-
0.00
5000.00
10000.00
15000.00
20000.00
25000.00
30000.00
国内旅游总花费(亿元)y
*. Correlate on is sign ifica nt at the 0.05 level (2-tailed).
山残差图可知,残差图上的点的散布是随机的,无任何规律;111 Correlations 表可知,残差绝对值与X3, X4的相关系数分别为0.589, 0.471,相应的P值均大于0・05,说明残差绝对值与各
自变量之间显著不相关。

故综上所述,认为不存在异方差。

(6)残差分析一一自相关性检验
次)x4
b.Predictors: (Constant),国内游客(百万人次)x4,客运
量(万人)x3
c.Dep endent Variable:国内旅游总花费(亿元)y
D・W值为0.601,査D.W表,n=20, k=2, di=1.20, d u=1.41, D.W=0.601<
dL,模型存在正自相关性,用迭代法解决。

通过进一步考察自相关系数,
1-1/2D.W=1-0.5*0.601=0.6995o求出相关系数P后,做变量变换:
yi = yi- P yi-i ;xj = x,- P XM
如果方程通过D.W检验,迭代结束,否则,继续重复上述过程, 直到通过D.W检验。

第一次迭代:
5a. Predictors: (Constant)x4 x3' b. Dependent Variable: Y'
D.W 值为0.822,查D ・W 表,n=19, k=2, d (=1.18, d u =1.40, D.W=0.822< d L ,模型存在正自相关性,用迭代法解决。

通过进一步考察自相关系数,PQ 1-1/2D.W=1-0.5*0.822=0.0.589o 求出相关系数P 后,做变量变换:
yi = yi- p Yi-1 ; Xi = Xi- P Xj-1
第二次迭代:
6a.
Predictors: (Constant)x4\ x3M b. Dependent Variable: y
D.W 值为1.765,查D.W 表,n=18, k=2, di=1.16, d u =1.39, du <D.W=1.765<
牛du,模型不存在正自相关性。

将方程还原之后得到的回归模型为:y = -1693.900-0.002 x3+9.997x4
(7) 多重线性检验
a. Dependent Variable:国内旅游总花费(亿元)y
3
由Coefficients表可知,各个自变量的VIF均小于10 ;由Collinearity Diagnostics表可知,共线性诊断中条件数均在10附近。

综上述,说明自变量间不存在多重共线性。

(8)异常值检验
山上表可知,所有数据的删除学生化残差的绝对值均小于3,库克距离也均
小于0.5,故数据不存在异常值。

综上所述,该问题的回归模型是:
y = -1693.9-0.002 x3+9.997x4
四、回归方程的经济意义分析
从所得到的回归方程可以看出,影响国内旅游总花费的因素主要有国内游客人数和客运量。

山回归系数表可以看出,对国内旅游总花费影响最明显的是国内游客人数,客运量的影响相对较小。

在其他因素不变的情况下,国内游客每增加一口万人,国内旅游总花费增加9.997亿元。

建立模型过程中删除了国内生产总值、居民消费价格指数和人均收入三个因素,说明这三个因素对国内旅游总花费的影响不如前两者明显,这也很符合现实意义。

相关文档
最新文档