数学建模——商品需求量的预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验十三 商品需求量的预测

【实验目的】

1.了解回归分析的基本原理和方法。

2.学习用回归分析的方法解决问题,初步掌握对变量进行预测和控制。 3.学习掌握用MATLAB 命令求解回归分析问题。

【实验内容】

现有某种商品的需求量、消费者的平均收入、商品价格的统计数据如表1所示,试用所提供的数据预测消费者平均收入为1000、商品价格为6时的商品需求量。

【实验准备】

现实生活中,一切事物都是相互关联、相互制约的。我们将变化的事物看作变量,那么变量之间的相互关系,可以分为两大类:一类是确定性关系,也叫作函数关系,其特征是一个变量随着其它变量的确定而确定,如矩形的面积由长宽确定;另一类关系叫相关关系,其特征是变量之间很难用一种精确的方法表示出来,如商品销量与售价之间有一定的关联,但由售价我们不能精确地计算出销量。不过,确定性关系与相关关系之间没有一道不可逾越的鸿沟,由于存在实际误差等原因,确定性关系在实际问题中往往通过相关关系来体现;另一方面,当对事物内部规律了解得更加深刻时,相关关系也可能转化为确定性关系。 1.回归分析的基本概念

回归分析就是处理变量之间的相关关系的一种数学方法,它是最常用的数理统计方法,能解决预测、控制、生产工艺化等问题。由相关关系函数确定形式的不同,回归分析一般分为线性回归、非线性回归和逐步回归,在这里我们着重介绍线性回归,它是比较简单的一类回归分析,在实际问题的处理中也是应用得较多的一类。 回归分析中最简单的形式是

y =0β+1βx +ε (x 、y 为标量) (1)

固定的未知参数0β,1β称为回归系数,自变量x 称为回归变量,ε是均值为零的随机变量,它是其他随机因素对

y 的影响,是不可观察的,我们称(1)为一元线性回归。它的一个自然推

广是x 是多元变量,形如

y =0β+1β1x +…+m βm x +ε (2)

m ≥2,我们称为多元线性回归,或者更有一般地

y =0β+1β)(1x f +…+m β)(x f m +ε (3)

其中x =(1x ,…,m x ),)(x f j (

j =1,…,m )是已知函数,称为非线性回归(也叫曲

线或曲面回归)。不难看出,对自变量x 作变量替换,一般能够将非线性回归(3)转化为线性回归(2)的形式进行求解分析,所以我们着重讨论线性回归的内容。 对(2)式两边同时取数学期望得 Y =X β+ε (E ε=0,εD =2σ) (4)

其中

1 11x … m x 1

1y

X = … … … Y = …

1 1n x … nm x n y

β

=(0β,1β,…,m β)T ,ε=(1ε,2ε,…,n ε)T

(4)式称为线性回归方程。线性回归分析所要考虑的主要任务是:用试验值(样本值)对未知参数β和2

σ作点估计,同时对估计值作假设检验,从而确立y 与1x ,…,m x 之间的数量关系;

在0x =(01x ,…,m x 0)处对

y 值作预测与控制,即对y 作区间估计。这里我们均假设样本

容量大于变量个数,即n >m +1。 2.模型的参数估计和假设检验

用最小二乘法估计模型(4)中的参数,作离差平方和 Q =

∑=n

i i

1

2

ε

21

110).....(im m n

i i i

x x y

βββ----∑= (5)

求β使得Q 达到最小。根据微积分学中求极值的方法,只需求Q 关于0β,1β,…,m β一阶导数为0的方程组的解,此解不是0β,1β,…,m β的真值,而是β的最小二乘估计值,我们用0β),1β),…,m β)

表示

β)=Y X X X T

T 1)(- (6) 将β的估计值0β)

,1β),…,m β)代入回归方程(4)得到y 的估计值

y )

=0β)+1β)1x +…+m β)

m x (7) 拟合误差e =

y -y )

称为残差,可作为随机误差ε的估计,而

Q =

∑=n

i i

e

1

2=

∑=-n

i i y 1

2i

)(y

)

(8)

为残差平方和(或剩余平方和),即)(β)

Q 。

在实际问题中,事先我们并不知道或者不能断定随机变量y 与一组变量1x ,…,m x 之间有线性关系,如(2)式

y =0β+1β1x +…+m βm x +ε往往只是一种假设,因此在求出线性回归

方程后,还须对求出的线性回归方程同实际观测数据拟合效果进行检验,可提出以下原假设: 0H :0β=1β=…=m β=0 (9) 采用F 检验法或R 检验法(详细内容在数理统计类书籍中均可查到,此处不再赘述),拒绝0H ,则认为

y 与1x ,…,m x 之间显著地有线性关系;否则就接受0H ,认为y 与1x ,…,m x 之间

线性关系不显著。 3.变量的预测与控制

当回归模型和系数通过了假设检验后,可由给定的0x =(01x ,…,m x 0)预测出0y ,0y 是随机的,显然由回归方程(7)知道,其预测值(点估计)为

0y )

=0β)+1β)01x +…+m β)

m x 0 (10) 对于给定的显著水平a ,可以算出0y 的预测区间(区间估计),结果较复杂,但当n 较大且i x 0接近平均值i x ,0y 的预测区间可简化为 [0y )

-s u

a

2

1-

,0y )

+s u a

2

1-

] (11)

其中2

1a u

-

是标准正态分布的1-2

a

分位数。 对于0y 的区间估计方法可用于给出已知随机数据的残差e =y -y )

的置信区间,e 服从均值为零的正态分布,所以若某个i e 的置信区间不包括零点,则认为这个数据是异常的,可予以剔除。

4.MATLAB 统计工具箱中的回归分析命令

多元线性回归模型(4)可采用命令regress ,此命令也可用于求解一元线性回归,其格式如下所示:

相关文档
最新文档