线性回归模型在货运量预测中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线性回归模型在湖北省货运量预测中的应用
09城规2班 N3090810220 黄霞
摘要:物流产业作为综合性很强的经济产业,无论是宏观决策,还是物流企业的规划和经营决策,都需要以正确的预测为前提。

本文针对物流需求的特点,运用一元线性回归模型对物流需求进行预测,并以湖北省为例进行了实证。

关键词:物流需求,预测,相关系数,一元线性回归模型,货运量
正文:
预测是普遍存在的客观现象,在政府、经济、商业、金融以及其他许多领域,预测有着广泛的应用。

系统预测是重要的,系统预测的正确与否,直接影响系统规划的指向和目标是否出现偏差以及偏离的程度,系统预测是系统管理与控制的基础,是系统优化的前提条件,是为系统决策服务的。

由于预测目标与影响因素之间关系的难以确定性,直接采用某种特定的预测方法就显得不够客观。

考虑到这一点,结合一元线性回归模型简单易处理的特征,并将之运用于湖北省货运总量的预测中,得到了很好的应用效果。

物流需求的一元线性回归模型预测——以湖北省为例
第一步,选择变量。

分别将湖北省GDP 和货运量作为区域经济和区域物流发展水平的衡量指标来进行分析。

获得基础统计数据如下表所示。

湖北省GDP与货运量之间的数据表
(注:本数据来源于湖北省2005 年年鉴)
一元线性回归方程在某种程度上揭示了两个变量间的线性相关关系。

但在应用线性回归的计算公式时会发现,并不需要预先假设两个变量之间一定具有线性相关关系,也就是说,对任意给定的N 组数据都可根据公式确定一条直线而得出预测方程。

这样一来,需解决这条直线能否反映出所研究系统的变化规律问题,精确地说,需研究这条直线是否有实际使用价值。

我们曾指出,只有当两个变量之间有大致的线性关系时,用该方法所得到的预测模型才是适用的。

能否用一个数量指标来评价两变量大致呈线性关系的程度,以决定用回归分析所得到的数学模型与研究系统的规律相符呢?又怎样确定预测模型的预测精度呢?这就是线性回归检验和精度分析需解决的问题。

所以我们要对其进行相关系数的分析,计算和检验。

相关性分析方法是采用概率论与数理统计中的相关性理论,分析影响因素(自变量)与目标函数(因变量)之间的相关程度,按照相关程度大小进行排序。

相关系数是反应两个变量问是否存在相关关系,以及这种相关关系密切程度的一个统计量。

相关系数r 的计算公式为:
∑∑∑===----=
n
i i
n i i
i
n
i i
y y x x y y x x r 1
2
2
1
1
)
()()
)((
()()
∑∑∑===--==
==
n i i
i
n
i i
n
i i
y y x x n
y
y n
x
x 1
1
1
56
.123189857
.5658
∑=--n
i i
i
y y x x 1
))((=(-1382.57857)⨯(-446.26)+(-996.61857)⨯(-418.91)
+(-683.26857)⨯(-249.99)+(-262.98857)⨯(10.34)+ 661.58143⨯172.04 + 825.60143⨯437.74 + 1838.27143 ⨯ 495.04= 2587808.63867
∑=-n
i i
x x 12
)
(=2817.68355
∑=-n
i i
y y 1
2
)
(=950.53362
∑∑∑===----=
n
i i
n i i
i
n
i i
y y x x y y x x r 1
2
2
1
1
)
()()
)((96621.068355
.281753362.95063867.2587808=⨯= 相关系数r 的特征有:相关系数取值范围为:-1≤r ≤1。

当r>0,称正线性相关,X 上升,Y 呈线性增加。

当r<0,称负线性相关,X 上升,Y 呈线性减少。

|r|=0,X 与Y 无线性相关关系;|r|=1,完全确定的线性相关关系;0<|r|<1,X 与Y 存在一定的线性相关关系;|r|>0.7,为高度线性相关;0.3<|r|≤0.7,为中度线性相关;|r|≤0.3,为低度线性相关。

指标r 可衡量两变量的线性相关程度,但只提供了相对比较的评价依据,若进行绝对评价,则显得依据不足。

因此要进行相关系数的显著性检验。

而显著性检验,实际上相当于规定一个合理的、认为能满足使用要求的指标界限,并用该指标界限对系统预测模型的适用性进行绝对评价。

r 值的大小取决于X i 、Y i 和数
据数量n 。

因此,为任何系统都规定一个统一的标准值是不能反映不同情况的差异的,也是不合理的。

显著性检验就是依据所占有的数据量及其分布情况、变量个数等条件,确定一个合理的标准作为评价指标。

检验相关系数0=ρ的临界值(a r )表
{}∂=>a r r ρ
在表中, f 称为自由度 ,其数值为f=n-2,n 为样本数;所以f=5,上方的
∂代表不同的置信水平;表内的数值代表不同的置信水平下相关系数0=ρ的临界值,即a r ;公式{}∂=>a r r ρ的意思是当所计算的相关系数r 的绝对值大于在∂水平下的临界值a r 时,两要素不相关(即0=ρ)的可能性只有∂。

对湖北省货运量与GDP 之间的相关系数,f=7-2=5,在显著性水平10.0=∂上,查表,得知:6694.010.0=r 。

因为6694.096621.0=>=a r r ,所以,湖北省货运量与GDP 之间的相关性显著。

所以可以运用一元线性回归来进行预测。

从货运量和GDP 的数据分析可得到散点图,从图中可看出这些点呈线状分布。

一元线性回归预测法是分析一个因变量与一个自变量之间的线性关系的预测方法,常用统计指标:平均数、增减量、平均增减量。

一元回归预测的基本思想是确定回归直线,得出回归直线方程,并依此得出预测值。

确定直线的方法是最小二乘法,其基本思想是:最有代表性的直线应该是直线到各店距离最近,然后用这条直线进行预测。

一元线性回归预测模型的建立步骤:选取一元线性回归模型的变量;绘制计算表和模拟合散点图;计算变量间的回归系数及其相关的显著性;回归分析结果的应用。

下面比较详细地描述一元回归直线的求法。

在取得两个变量的实验数据之后,若在普通直角坐标系上标出各个数据点,若果各点的分布近似乎一条直线,则可考虑采用线性回归法求其表达式。

一元线性回归分析法的预测模型为:
bx a Y +=
∑∑==---=
n
i i
n
i i
i
x x y y
x x b 1
2
1
)
()
)((,
n x
x n
i ∑==
1

n y
y n
i ∑==
1
,x b y a -=
式中:
y .一预测目标;
X —— 影响因素; a ,b ——回归系数
()()∑∑∑===--==
==
n
i i
i
n
i i
n
i i
y y x x
n
y
y n
x
x 1
1
1
56
.123189857
.5658
∑∑==---=
n
i i
n i i
i
x x y y x x b 1
2
1
)
()
)((32595.056308
.793934063867
.2587808==
x b y a -==1231.56-1844.51799=-612.95799
bx a Y +==-612.95799+0.32595x
模型预测效果检验。

为检验上述模型的预测效果,首先利用2000年至2006年的历史GDP 数据预测这7年的货运量,得出以下表:
将预测值和实际值进行比较,结果如下图所示:
结论:
通过对湖北省2000到2006年的数据进行一元线性回归预测可以得出如下结论:
(一)湖北省的货运量呈上升趋势
通过对货运量的主要影响因素分析,可知货运量与生产总值紧密联系。

从上图曲线比较图可以明显看出,湖北省的货运量呈上升趋势,由此可知货运量与生产总值呈正相关关系。

(二)一元线性回归模型对货运量的预测效果较好、精度较高,适宜对物流需求进行预测。

在湖北省7年历史数据的预测结果中,参数具有较高的显著性。

一元线性回归分析法在预测中有着广泛的用途,文中应用其原理建立一元线性回归预测模型类,并在安阳市货运总量的预测中得到了很好的应用,一元线性回归预测模型类具有一定的理论价值和现实意义。

本文中只分析了生产总值对货运量的影响,而在实际运行中还有许多因素会影响货物周转量,如气候条件、宏观经济政策、微观因素中的运输距离与货运量
等。

另一方面货物周转量并不能完全代表物流需求,所以应定期、适时地根据实际情况对其加以补充修正。

参考文献:
1.刘刚,周静,邹飞燕《湖北城乡区域物流与区域经济协调性研究》《物流论坛》 2008年
2.王雪瑞王昭君《基于双变量线性回归模型的物流需求预测——以内蒙古为例》。

相关文档
最新文档