线性回归模型在货运量预测中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归模型在湖北省货运量预测中的应用
09城规2班 N3090810220 黄霞
摘要:物流产业作为综合性很强的经济产业,无论是宏观决策,还是物流企业的规划和经营决策,都需要以正确的预测为前提。本文针对物流需求的特点,运用一元线性回归模型对物流需求进行预测,并以湖北省为例进行了实证。
关键词:物流需求,预测,相关系数,一元线性回归模型,货运量
正文:
预测是普遍存在的客观现象,在政府、经济、商业、金融以及其他许多领域,预测有着广泛的应用。系统预测是重要的,系统预测的正确与否,直接影响系统规划的指向和目标是否出现偏差以及偏离的程度,系统预测是系统管理与控制的基础,是系统优化的前提条件,是为系统决策服务的。
由于预测目标与影响因素之间关系的难以确定性,直接采用某种特定的预测方法就显得不够客观。考虑到这一点,结合一元线性回归模型简单易处理的特征,并将之运用于湖北省货运总量的预测中,得到了很好的应用效果。
物流需求的一元线性回归模型预测——以湖北省为例
第一步,选择变量。分别将湖北省GDP 和货运量作为区域经济和区域物流发展水平的衡量指标来进行分析。获得基础统计数据如下表所示。
湖北省GDP与货运量之间的数据表
(注:本数据来源于湖北省2005 年年鉴)
一元线性回归方程在某种程度上揭示了两个变量间的线性相关关系。但在应用线性回归的计算公式时会发现,并不需要预先假设两个变量之间一定具有线性相关关系,也就是说,对任意给定的N 组数据都可根据公式确定一条直线而得出预测方程。这样一来,需解决这条直线能否反映出所研究系统的变化规律问题,精确地说,需研究这条直线是否有实际使用价值。
我们曾指出,只有当两个变量之间有大致的线性关系时,用该方法所得到的预测模型才是适用的。能否用一个数量指标来评价两变量大致呈线性关系的程度,以决定用回归分析所得到的数学模型与研究系统的规律相符呢?又怎样确定预测模型的预测精度呢?这就是线性回归检验和精度分析需解决的问题。
所以我们要对其进行相关系数的分析,计算和检验。
相关性分析方法是采用概率论与数理统计中的相关性理论,分析影响因素(自变量)与目标函数(因变量)之间的相关程度,按照相关程度大小进行排序。相关系数是反应两个变量问是否存在相关关系,以及这种相关关系密切程度的一个统计量。相关系数r 的计算公式为:
∑∑∑===----=
n
i i
n i i
i
n
i i
y y x x y y x x r 1
2
2
1
1
)
()()
)((
()()
∑∑∑===--==
==
n i i
i
n
i i
n
i i
y y x x n
y
y n
x
x 1
1
1
56
.123189857
.5658
∑=--n
i i
i
y y x x 1
))((=(-1382.57857)⨯(-446.26)+(-996.61857)⨯(-418.91)
+(-683.26857)⨯(-249.99)+(-262.98857)⨯(10.34)+ 661.58143⨯172.04 + 825.60143⨯437.74 + 1838.27143 ⨯ 495.04= 2587808.63867
∑=-n
i i
x x 12
)
(=2817.68355
∑=-n
i i
y y 1
2
)
(=950.53362
∑∑∑===----=
n
i i
n i i
i
n
i i
y y x x y y x x r 1
2
2
1
1
)
()()
)((96621.068355
.281753362.95063867.2587808=⨯= 相关系数r 的特征有:相关系数取值范围为:-1≤r ≤1。当r>0,称正线性相关,X 上升,Y 呈线性增加。当r<0,称负线性相关,X 上升,Y 呈线性减少。|r|=0,X 与Y 无线性相关关系;|r|=1,完全确定的线性相关关系;0<|r|<1,X 与Y 存在一定的线性相关关系;|r|>0.7,为高度线性相关;0.3<|r|≤0.7,为中度线性相关;|r|≤0.3,为低度线性相关。
指标r 可衡量两变量的线性相关程度,但只提供了相对比较的评价依据,若进行绝对评价,则显得依据不足。因此要进行相关系数的显著性检验。而显著性检验,实际上相当于规定一个合理的、认为能满足使用要求的指标界限,并用该指标界限对系统预测模型的适用性进行绝对评价。r 值的大小取决于X i 、Y i 和数
据数量n 。因此,为任何系统都规定一个统一的标准值是不能反映不同情况的差异的,也是不合理的。显著性检验就是依据所占有的数据量及其分布情况、变量个数等条件,确定一个合理的标准作为评价指标。
检验相关系数0=ρ的临界值(a r )表
{}∂=>a r r ρ
在表中, f 称为自由度 ,其数值为f=n-2,n 为样本数;所以f=5,上方的
∂代表不同的置信水平;表内的数值代表不同的置信水平下相关系数0=ρ的临界值,即a r ;公式{}∂=>a r r ρ的意思是当所计算的相关系数r 的绝对值大于在∂水平下的临界值a r 时,两要素不相关(即0=ρ)的可能性只有∂。
对湖北省货运量与GDP 之间的相关系数,f=7-2=5,在显著性水平10.0=∂上,查表,得知:6694.010.0=r 。因为6694.096621.0=>=a r r ,所以,湖北省货运量与GDP 之间的相关性显著。所以可以运用一元线性回归来进行预测。
从货运量和GDP 的数据分析可得到散点图,从图中可看出这些点呈线状分布。