数学建模案例分析5化妆品销售量的预测--概率统计方法建模
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数学建模案例分析5化妆品销售量的预测--概率统计方法建模
§5 化妆品销售量的预测
某公司在各地销售一种化妆品,观测15个城市在某月内对该化妆品的销售量Y及适合使用该化妆品的人数
x和人均收入2x。数据见下表:
1
要求通过以上数据建立预测模型,当已知任一个城市的适用人数和人均收入),(2
1
x x 时,能够预测在这个
城市的销售量。
这个问题本质上就是多元线性回归模型,如果随机变量Y 与固定变量m
x x x ,,,2
1
之间有显著的线性相
关关系,即
)
,0(~,222110σεεN x b x b x b b Y m m +++++=
称为m 元线性回归模型。 一、 模型中的参数估计
设通过实验或历史资料得到观测数据
)
,,2,1(),,,,,(21n i x x x y im i i i =。令
⎪⎪⎪⎪
⎪
⎭
⎫
⎝⎛=⎪⎪⎪⎪⎪⎭⎫
⎝
⎛=⎪⎪⎪⎪⎪⎭⎫
⎝⎛=m nm n n m m n b b b B x x x
x x x x x x X y y y Y 102
1222
21
1121121,111,
由最小二乘估计,得
Y X X X B
T T 1)(ˆ-=
称m
m x b x b x b b y
ˆˆˆˆˆ22110
++++= 为变量Y 关于变量m
x x x ,,,2
1
的线
性回归方程。
同样还可以得到2
σ的估计量为
∑=---=n
i i i y y m n 122
)ˆ(11
ˆσ
这里),,2,1(ˆˆˆˆˆ22110n i x b x b x b b y
im
m i i i
=++++=。
二、回归模型的显著性检验
1、检验回归模型的显著性 即检验假设
不全为零
i m b H b b b H :,0:1210==== 令 ∑∑==-=-=n
i i i e n i i R y y S y y
S 1
21
2
)ˆ(,)ˆ( 检验统计量
)
1,(~)
1/(/----=
m n m F m n S m
S F e R
对一个小概率α,若)1,(-->m n m F F α
,则认为所建的回归方程有意义。
2、各自变量的显著性检验,剔除变量计算 即检验假设
)
,,2,1(0:,0:10m j b H b H j j j j =≠=
检验统计量 )
,,2,1()1(~)
1/(ˆm j m n t m n S c b t e jj j
j =----=
这里jj
c 是矩阵1
)(-=X X
C T
中相应位置的元素。对一个小概率α,若)
1(2
-->m n t t
j
α,则应保留变量j
x ,否则应剔
除变量j
x 。剔除变量时,从j
t 最小的开始,直到不显
著的变量全部剔除为止。设j
k
t t min =,则剔除k
x ,重
新建立回归方程如下:
m
m k k k k x b x b x b x b b y *1*11*11*1*0ˆˆˆˆˆˆ++++++=++--
其中 ),,,2,1(,ˆˆˆ*k j m j b c c b b k
kk
kj j j ≠=-=
j k
j j x b y b ∑≠-=**0
ˆˆ
三、 利用回归方程进行预报 当)
,,,(),,,(002012
1
m m
x x x x
x x =时,对Y 进行预测。
1、点预测
m
m x b x b x b b y 002201100ˆˆˆˆˆ++++=
2、区间预测 Y 的置信度为α-1的置信区间
))(ˆ),(ˆ(0000x y x y
δδ+-,其中
∑∑==--++--=m i m
j ij j j i i c x x x x n m n t x 11
002
0))((11ˆ)1()(σ
δα
现在用上面的回归模型来解决前面提出的问题:
⎪⎪⎪⎪⎪⎭
⎫
⎝⎛=⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛=260537013254180124502741,
212120162 X Y
得到
T B
)0092.0,4960.0,4526.3(ˆ=,所求回归方程是
210092.0496.04526.3ˆx x y
++=。
又求得88
.56,72.53844==e R
S S
,从而
89
.3)12,2(5680)
1/(/05.0=>=--=
F m n S m
S F e R
故认为所建的回归方程有意义。
⎪⎪⎪⎭
⎫
⎝
⎛⨯⨯-⨯⨯-⨯==------77
6
441
109772.1100303.7107329.7101567.4101297.22463.1)(X X C T
又可求出
179
.2)12(93.8110
7329.774.44960.0025.06
1=>=⨯⨯=
-t t
179
.2)12(50.910
9772.174.40092.0025.072=>=⨯⨯=-t t
说明2
1
,x x 对Y 均有显著的线性影响,均不能剔除。
下面给出预测方法:例如当某城市的数据