最小二乘法在经济预测中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

最小二乘法在经济预测中的应用 王 超
(绍兴文理学院 数学系,浙江 绍兴 312000)
摘要:作为经济预测中的一种方法,本文介绍了最小二乘法的基本原理, 利用最小二乘法建立了线性回归预测模型,同时对相关系数和标准偏差进行检验.最后给出了利用最小二乘法进行经济预测的实例. 关键词: 最小二乘法 ; 线性回归 ; 产品生产预测
一 引言
绍兴的经济较为发达,它和宁波、温州三地区的经济位与浙江省前几位,乃致在全国,在长三角开发区中所占的经济地位都很重要. 以绍兴县为例,该县是全国经济百强县之一,全县大都以染料、纺织和布匹等生产加工为主. 笔者了解到支撑绍兴县经济支柱的大部分是以生产加工上述产品的中小企业甚至家庭型企业. 由于他们规模不是很大,因此相应的各技术部门没有很好的配备,所以进行生产管理的方式没有像大型企业那样规范,他们产品的年产量往往根据企业主近几年摸爬滚打中积累起来对市场的判断来制订的,而没有进行科学的经济预测,这常常导致大量产品销售不够或大量产品积压在家,给企业带来严重影响.
经济预测是进行经济决策活动的一个重要组成部分. 在实际经济活动中,预测的结果可以揭示经济现象在未来时期发展变化的情况和发现经济发展过程中存在的问题,从而为进行决策、制订计划、提高经济管理水平以及获取较好的经济效益提供了科学依据. 运用定量预测模型进行预测的方法有很多,依据笔者对许多家庭型企业的了解及对企业主知识层次的分析,本文介绍的最小二乘法在经济预测中的应用方法简单明了,比较适合这些企业在进行预测产品产量时参考, 从而能够避免盲目的生产和经营,尽可能地为企业获得最大利润.
二 最小二乘法
最小二乘法是由实验或调查的数据,建立线性型公式的一种常用方法. 在建立线性型公式中,虽然有很多种不同的方法来求样本回归函数(即,真实总体回归函数的估计值),但是,在回归分析中最广泛应用的方法是最小二乘法.
如果变量y x 和有精确的线性关系比如说b ax y +=,那么∧
=i i y y 即观测值与回归值 是相等的. 事实上现实世界中的诸多变量的关系未必都是如此,由于受诸多随机因数的干扰 使得物与物之间没有那种很明确的对应关系. 比如说人的身高和体重就是一个对应,我们都知道长的高的人不一定就重,同理长的矮的人也不一定就轻,但身高和体重的确存在着一定的关系, 而这种关系并非是b ax y +=所能确定的. 那么我们要寻求身高和体重之间的关系就需要通过数学的方法. 首先调查统计得出数据;其次把数据描绘出来;然后拟合一
条跟已有的图象最接近的曲线 ,这样就可以相对地将身高和体重之间的关系表示出来. 在处理类似的事情中常常用到最小二乘法.
所谓最小二乘法就是:选择参数10,b b ,使得全部观测的残差平方和最小. 用数学公式表示为:
21022
)()(min i i i i i x b b Y Y Y e --=-=∑∑∑∧
为了说明这个方法,先解释一下最小二乘原理.
i i i x B B Y μ++=10 (一元线性回归方程)
由于总体回归方程不能进行参数估计,我们只能对样本回归函数来估计即: i i i e x b b Y ++=10 )...2,1(n i = (1.1) 从(1.1)公式可以看出:残差i e 是i Y 的真实值与估计值之差,估计总体回归函数最优方法是,选择10,B B 的估计量10,b b ,使得残差i e 尽可能的小.
总之,最小二乘原理就是选择样本回归函数使得所有Y 的估计值与真实值差的平方和为最小,这种确定10,b b 的方法叫做最小二乘法.
在经济关系中,往往某一指标与多个因素有关,如果这种关系具备一定的线性相关性,就可以用多元回归分析来处理,假设由观测得到一组数据:
),...,,(),...,,...,,(),,...,,(212222111211nm n n m m x x x x x x x x x
1y 2y ,… , n y
令向量分别为:
)
,...,(),...,,()
,...,,(),...,(2,121222122121,111n nm m m m n n y y y Y x x x X x x x X x x x X
====
如果向量组m X X X ,...,,21与Y 存在线性关系,得到n 元线性预测公式
m m X a X a X a a Y ++++=∧
...22110 (1.2)
其矩阵形式为:
=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡n y y y 21⎥

⎥⎥⎦

⎢⎢⎢⎢⎣⎡⎥⎥⎥⎥⎦⎤⎢
⎢⎢
⎢⎣⎡m nm n n m m a a a x x x x x x x x x 102
1
22221
11211111 (1.3)
其中m a a a ,...,,10为待定常数,亦称回归系数.
如何来确定m a a a ,...,,10的值呢?将每组观测值代入(1.3)就得到:
im m i i i x a x a x a a Y ++++=∧
...22110 )...2,1(n i =
特别地1=n 时 x a a Y 10+=∧
(1.4)
∧i Y 与i y 间存在差异.记i e ∧
-=i i Y y
我们选择这样的m a a a ,...,,10使每个偏差i e )...2,1(n i =都尽量小,因为偏差(∧
-i i Y y )有正有负,所以偏差的代数和
)(∧
-∑i i
Y y
并不能反映总体偏差的大小,而
∑∧
-i i Y y 数学上处理起来也比较繁杂,所以通常采用使偏差平方和2
∑i e 为 最小.
即 ∑==
n
i S 1[]2
22110)...(im m i i i x a x a x a a y ++++-最小 (1.5) 显然,偏差平方和随m a a a ,...,,10的变化而取不同的值,可把S 视为m a a a ,...,,10的多元函数,并求极值得:
∑==∂∂n
i a S
1
0[]0)1()...(222110=-++++-im m i i i x a x a x a a y ∑==∂∂n
i a S
1
1[]0)()...(2122110=-++++-i im m i i i x x a x a x a a y
∑==∂∂n
i m a S
1
[]0)()...(222110=-++++-im im m i i i x x a x a x a a y 整理得:
⎝⎛
=++++=++++=++++∑∑∑∑∑∑∑∑∑∑∑∑∑∑==============n i n i n i n i n
i i
im m i m i im i im im n i n i n i n i i
i im i m i i i n
i i n i n i n i n
i i im m i i y x x a x x a x x a x a y x x x a x x a x a x a y x a x a x a n a 1
11112
221101111
112122
11110111122110.........
(1.6)
将上述m+1个方程式联立起来就m a a a ,...,,10求解,则得到公式(1.5)的待定系数值,从 而确定了多元线性预测公式.
特别地当1=n 时,10,a a 的估计公式为:


--=-=∑∑∑∑∑∑∑=======n i n
i i i n i n i n
i i
i i i n i n
i i i x x n y x y x n a n x a y a 112
211111
110)( (1.7) 三 相关系数与标准偏差
<1> 相关系数R
以两个变量的情况为例,因为只要任意给定两个变量y x ,的一组数据,都可以经过计算给出一个经验公式,这个公式在多大程度上反映了y x ,的关系呢? 因为只要通过最小二乘法采取强拟合我们同样可以把一组毫无线性关系的数据表成线性关系 ,但这条直线并不能很好地反映了变量y x 和的实际关系,缺乏应用价值,例如:
123456789101112131415
1
3
5
7
9
11
13
15
为此我们一方面要建立从经验上认为有意义的方程,另一方面我们必须用数学方法进行拟合效果和显著性相关检验. 其公式如下: 我们称R=
yy
xx xy L L L 为y x 和的相关系数,其中:
))((1
y y x x y x n
xy L i i xy --=-
=∑∑∑∑
222)()(1
x x x n
x L i xx -=-=∑∑∑ 222)()(1
y y y n
y L i yy -=-=∑∑∑ ∑=
i x n x 1 ∑=i y n
y 1
由上可推算: yy L R S )1(2-=
由0≥S ,0≥yy L 有 012
≥-R ,所以10≤≤R , R 越接近1,S 越接近
0,y x ,的线性关系越好.
(1) 当
0,1==S R 时, 即i e =0,称y x ,完全线性关系.
(2) 当 0,0==xy L R 时。

说明y x ,无关,即不存在线性关系.
(3) 当 10≤≤R 时,可选定相关系数的显著性水平α,按2-=Φn 的值查相
关系数显著性检验表求出临界值αγ.
(4) 当 αγ≥R 时,说明i x 的值的变化对i y 的值的变化影响很大,y x ,存在强相
关关系.
(5) 当 αγ〈R 时,所求相关关系是无效的,即经验公式是无意义的. <2> 标准偏差
2)(1
∧-=∑i i xy
Y y n
S 其中: xy S -------标准偏差 i y --------实例值 ∧
i Y --------预测值 n --------数据点个数
四 预测实例
经验公式x a a Y 10+=∧
是平面上统计点的分布呈线性时的表示形式,同时它也是最小 二乘理论的“形之根本”,即无论是线性的还是非线性的最后都是要化为这种形式.下面我 们就散点图呈曲线的情况进行预测.
例:对⨯⨯纺织品销售额的拟合.我们选取销售额为因变量,单位为万元,拟合销售额关于时间x 的趋势曲线. 以1991年为基准年,取值 x =1,2001年x =11,1991—2001年的数据如表一.
表一
销售额趋势图
50
100
150
200
250
300
350
400
450
1
9
9
1
1
9
9
3
1
9
9
5
1
9
9
7
1
9
9
9
2
1
年份



由散布图可以看出统计点是非线性的,它大致呈指数形分布. 我们就取经验公式
x
e

α
=(1.8)
来拟合这条曲线.
这个经验公式所反映的点的排列是非线性的,我们可以通过取对数将其转化为线性函数
从而运用最小二乘法确定这个线性函数. 即:B
Ax
z+
=其中
α
βln
,
,
ln=
=
=B
A
y
z,x

α+
=ln
ln,进而计算β
α,的值.
取)
11
...
2,1(
=
i
x;
i
y为各年的销售额;
i
i
y
z ln
=,根据具体数据代入得到如下的表格 .
表二
得出 :
02=-+=-+∑∑∑∑∑i i i i
i i z x x B x A z nB x A
即 :
⎝⎛=+=+941
.481166085
.32566506B A B A
α
βln 734327.21210536.3308285809.01210
829
.345======
B A
查对数表得3994.15=α,将αβ,代入(1.8)式中,因此得到了所求的经验公式为: x e y 285809.03994.15⨯= (1.9) 下面计算相应系数进行显著性检查:
924024
.15)(1
110
)(1
439.311
2222=-==-==-
=∑∑∑∑∑∑∑z n z L x n x L z x n xz L zz xx xz 751.0853
.41439
.31.==
=
zz
xx xz L L L R ,那么751.0=R
查看关系表(按)92112,01
.0=-=-=n α得到回归临界值735.0=αγ,因为751.0=R >735.0=αγ,说明y x ,间存在强相关关系,可以按公式:
x e y 285809.03994.15⨯=
进行外推预测,预测该企业2002和2003年的销售额为:
(万元)
万元)9044.629(3277.4731312==y y
以上是根据散点分布趋势选取曲线来拟合得出的结果,那么如果我们强行用线性关系即
B Ax Y +=∧
来拟合曲线,会得出怎样的结果呢?
同样根据数据表
得出:

⎛=+=+1193711664.1396
66506B A B A 得出: 1599.67,650909
.32-==B A 因而: 1599.67350909.32-=∧
x Y (2.0) 相关系数 879.08
.1488491106.3558.=⨯=
=
zz
xx xz L L L R
查看关系表(按)92112,01
.0=-=-=n α得到回归临界值735.0=αγ. 735.0>∴R ,说明我们可以按公式1599.67350909.32-=∧
x Y 来进行趋势预测,得
出:
万元)
万元)(4019.353(0510.3211312==∧

Y Y
我们把两组数据比较一下:
⎝⎛(万元)万元)9044.629(3277.4731312==y y ⎝⎛万元)万元)(4019.353(0510
.32113
12==∧

Y Y 显然第二种方法的结果误差太大,这是由于没有考虑散点图分布发展的趋势,强行采用线性拟合的结果.
由此可见. 某产品在一个时期内产量比较稳定,就可用最小二乘法进行趋势预测,但选用曲线来拟合散点时必须依据散点的趋势正确选择曲线,否则有可能出现类似本文的情况即,两条曲线的显著性系数都符合要求都可以用来预测,但其中的一条由于没有分析散点的发展趋势以致于产生的误差太大. 所以企业在日常生产管理中预测方法的科学性,将很大程度上决定企业的利润,从而给经营者制定或调整计划提供了理论依据.
Application in Economic Forecasting of Least Square Method
Wang Chao
Abstract : As a method in economic prediction ,the least square method has been introduced in this paper. We set up the linear regression model with the least square method under usual and special conditions.we also test the coefficient of correlation and standard deviation at the same time .Finally ,we give two examples on economic prediction with the least square method . Key Words : least square method ; linear regression ; production predicting
致谢
本文写作过程是在丁春梅老师的指导下完成.丁老师不仅提供了参考资料和数据
资料,而且还提出了宝贵的修改意见,在此致以衷心的感谢.同时感谢大学四年里所有给予传道授业和帮助的老师们.
参考文献
1 韩於羹 , 应用数理统计 , 北京航空航天出版社,157-191
2 徐天群、董亚娟等,应用数理统计学习指导,武汉大学出版社,156-170
3 方开泰、全辉等,实用回归分析,科学出版社,20-94,141-160
4 岳苓水、赵宝贵,最小二乘法在商品销售预测中的应用,地质技术经济管理,1997.1 57-60
5 杜国毅,最小二乘法在经济预测中的应用,内蒙古统计,2001.
6 53-54。

相关文档
最新文档