数学建模:统计模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归实例选讲--牙膏的销售量
1. 问题 建立牙膏销售量与价格、广告投入之间的模型;
预测在不同价格和广告费用下的牙膏销售量. 收集了30个销售周期本公司牙膏销售量、价格、 广告费用,及同期其他厂家同类牙膏的平均售价 .
销售 周期 1 2 29 30 本公司价 格 (元 ) 3.85 3.75 3.80 3.70 其他厂家 价格(元) 3.80 4.00 3.85 4.25 广告费用 (百万元) 5.50 6.75 5.80 6.80 价格差 (元) -0.05 0.25 0.05 0.55 销售量 (百万支) 7.38 8.51 7.93 9.26
4
4. 结果分析
参数
2 y 0 1 x1 2 x2 3 x2
0 1 2 3
R2=0.9054 即:
参数估计值 17.3244 1.3070 -3.6956 0.3486 F=82.9409
置信区间 [5.7282 28.9206] [0.6829 1.9311 ] [-7.4989 0.1077 ] [0.0379 0.6594 ] p<0.0001 s2=0.0490
销售量预测区间为 [7.8230,8.7636](置信度95%) 上限用作库存管理的目标值 下限用来把握公司的现金流
若估计 x3=3.9,设定 x4=3.7 则可以 95%的把握知道销售额在 7.83203.7 29(百万 6 元)以上
5. 模型改进
x1和x2对y 的影响独立 x1和x2对y 的影响有 交互作用
置信区间 [13.7013 44.5252] [1.9778 20.2906 ] [-12.6932 -2.5228 ] [0.2538 1.0887 ] [-2.8518 -0.1037 ] 7 p<0.0001 s2=0.0490
比较: 两模型销售量预测
控制价格差 x1=0.2 元,投入广告费 x2=6.5 百万元
1
明确问题一 牙膏的销售量
• 确定关系: – 牙膏销售量——价格、广告投入 • 内部规律复杂数据统计分析 – 常用模型回归模型×数学原理软件 • 30个销售周期数据: – 销售量、价格、广告费用、同类产品均价
销售周期 公司价 (元) 它厂价 (元) 广告(百万元) 1 2 3.85 3.75 3.80 4.00 5.50 6.75 价差(元) -0.05 0.25 销售量(百万支) 7.38 8.51
检验统计量:R ,F,p
• rcoplot(r,rint) 残差及其置信区间作图 • MATLAB7.0版本 s增加一个统计量: 剩余方差s2 x=[ones(size(x1)),x1,x2,x2.^2]; 程序 [b,bint,r,rint,stats]=regress(y,x)
显著性水平:0.05
5
销售量预测
ˆ ˆ x ˆ x ˆ x2 ˆ y 0 1 1 2 2 3 2
控制x1
价差x1=它厂价x3-公司价x4
估计x3,调整x4
wk.baidu.com
预测y
控制价格差 x1=0.2元,投入广告费 x2=6.5 百万元
ˆ ˆ x ˆ x ˆ x2 8.2933(百万支) ˆ 得 y 0 1 1 2 2 3 2
9.5 9 8.5 8 7.5 7
y 0 1 x1
多元回归模型
x1
5
5.5
6
6.5
7
7.5
2 y 0 1 x2 2 x2
x2
2 y 0 1 x1 2 x2 3 x2
3
3. 模型求解
回归系数
Matlab 统计分析
由数据 y,x1,x2估计
比较: 置信区间, R2
y 0 1 x1 2 x2 3 x
2 2
参数
0 1 2 3
R2=0.9054 参数
2 y 0 1 x1 2 x2 3 x2 4 x1 x2
参数估计值 17.3244 1.3070 -3.6956 0.3486 F=82.9409
statistics toolbox
y 0 1x1 2 x2
随机误差:正态分布均值为零
2 x= [ 1 x x x 1 2 2] 被解释变量:列
n xn
系数估计值 置信区间
残差向量y-xb 置信区间
解释变量:矩阵
[b , bint , r , rint , stats] = regress( y , X , alpha ) 2
…
29 30
…
3.80 3.70
…
3.85 4.25
…
5.80 6.80
…
0.05 0.55
…
7.93 9.26
2
2. 基本模型
y ~公司牙膏销售量 x1~其它厂家与本公司价格差 x2~公司广告费用 y 10
9.5 9 8.5 8 7.5 7 -0.2 0 0.2 0.4 0.6
被解释变量(因变量) 解释变量 (回归变量, 自变量) y 10
2 y 17.32 1.31x1 3.70 x2 0.35x2
显著性 :整体显著 y的90.54%可由模型确定、 F远超过F检验的临界 值、 p远小于=0.05 x2 :2 置信区间包含零点, 但右端点距零点很近 ——x2 对因变量 y 的影响不太显著; 3 显著 , 故x22项显著 但可将x2保留在模型中
置信区间 [5.7282 28.9206] [0.6829 1.9311 ] [-7.4989 0.1077 ] [0.0379 0.6594 ] p<0.0001 s2=0.0426
参数估计值 0 29.1133 1 11.1342 2 -7.6080 3 0.6712 4 -1.4777 R2=0.9209 F=72.7771
2 ˆ ˆ ˆ ˆ ˆ y 0 1x1 2 x2 3 x2
ˆ 8.2933 (百万支) y
区间 [7.8230,8.7636]
2 ˆ ˆ ˆ ˆ xx ˆ y 0 1x1 2 x2 3 x2 4 1 2
1. 问题 建立牙膏销售量与价格、广告投入之间的模型;
预测在不同价格和广告费用下的牙膏销售量. 收集了30个销售周期本公司牙膏销售量、价格、 广告费用,及同期其他厂家同类牙膏的平均售价 .
销售 周期 1 2 29 30 本公司价 格 (元 ) 3.85 3.75 3.80 3.70 其他厂家 价格(元) 3.80 4.00 3.85 4.25 广告费用 (百万元) 5.50 6.75 5.80 6.80 价格差 (元) -0.05 0.25 0.05 0.55 销售量 (百万支) 7.38 8.51 7.93 9.26
4
4. 结果分析
参数
2 y 0 1 x1 2 x2 3 x2
0 1 2 3
R2=0.9054 即:
参数估计值 17.3244 1.3070 -3.6956 0.3486 F=82.9409
置信区间 [5.7282 28.9206] [0.6829 1.9311 ] [-7.4989 0.1077 ] [0.0379 0.6594 ] p<0.0001 s2=0.0490
销售量预测区间为 [7.8230,8.7636](置信度95%) 上限用作库存管理的目标值 下限用来把握公司的现金流
若估计 x3=3.9,设定 x4=3.7 则可以 95%的把握知道销售额在 7.83203.7 29(百万 6 元)以上
5. 模型改进
x1和x2对y 的影响独立 x1和x2对y 的影响有 交互作用
置信区间 [13.7013 44.5252] [1.9778 20.2906 ] [-12.6932 -2.5228 ] [0.2538 1.0887 ] [-2.8518 -0.1037 ] 7 p<0.0001 s2=0.0490
比较: 两模型销售量预测
控制价格差 x1=0.2 元,投入广告费 x2=6.5 百万元
1
明确问题一 牙膏的销售量
• 确定关系: – 牙膏销售量——价格、广告投入 • 内部规律复杂数据统计分析 – 常用模型回归模型×数学原理软件 • 30个销售周期数据: – 销售量、价格、广告费用、同类产品均价
销售周期 公司价 (元) 它厂价 (元) 广告(百万元) 1 2 3.85 3.75 3.80 4.00 5.50 6.75 价差(元) -0.05 0.25 销售量(百万支) 7.38 8.51
检验统计量:R ,F,p
• rcoplot(r,rint) 残差及其置信区间作图 • MATLAB7.0版本 s增加一个统计量: 剩余方差s2 x=[ones(size(x1)),x1,x2,x2.^2]; 程序 [b,bint,r,rint,stats]=regress(y,x)
显著性水平:0.05
5
销售量预测
ˆ ˆ x ˆ x ˆ x2 ˆ y 0 1 1 2 2 3 2
控制x1
价差x1=它厂价x3-公司价x4
估计x3,调整x4
wk.baidu.com
预测y
控制价格差 x1=0.2元,投入广告费 x2=6.5 百万元
ˆ ˆ x ˆ x ˆ x2 8.2933(百万支) ˆ 得 y 0 1 1 2 2 3 2
9.5 9 8.5 8 7.5 7
y 0 1 x1
多元回归模型
x1
5
5.5
6
6.5
7
7.5
2 y 0 1 x2 2 x2
x2
2 y 0 1 x1 2 x2 3 x2
3
3. 模型求解
回归系数
Matlab 统计分析
由数据 y,x1,x2估计
比较: 置信区间, R2
y 0 1 x1 2 x2 3 x
2 2
参数
0 1 2 3
R2=0.9054 参数
2 y 0 1 x1 2 x2 3 x2 4 x1 x2
参数估计值 17.3244 1.3070 -3.6956 0.3486 F=82.9409
statistics toolbox
y 0 1x1 2 x2
随机误差:正态分布均值为零
2 x= [ 1 x x x 1 2 2] 被解释变量:列
n xn
系数估计值 置信区间
残差向量y-xb 置信区间
解释变量:矩阵
[b , bint , r , rint , stats] = regress( y , X , alpha ) 2
…
29 30
…
3.80 3.70
…
3.85 4.25
…
5.80 6.80
…
0.05 0.55
…
7.93 9.26
2
2. 基本模型
y ~公司牙膏销售量 x1~其它厂家与本公司价格差 x2~公司广告费用 y 10
9.5 9 8.5 8 7.5 7 -0.2 0 0.2 0.4 0.6
被解释变量(因变量) 解释变量 (回归变量, 自变量) y 10
2 y 17.32 1.31x1 3.70 x2 0.35x2
显著性 :整体显著 y的90.54%可由模型确定、 F远超过F检验的临界 值、 p远小于=0.05 x2 :2 置信区间包含零点, 但右端点距零点很近 ——x2 对因变量 y 的影响不太显著; 3 显著 , 故x22项显著 但可将x2保留在模型中
置信区间 [5.7282 28.9206] [0.6829 1.9311 ] [-7.4989 0.1077 ] [0.0379 0.6594 ] p<0.0001 s2=0.0426
参数估计值 0 29.1133 1 11.1342 2 -7.6080 3 0.6712 4 -1.4777 R2=0.9209 F=72.7771
2 ˆ ˆ ˆ ˆ ˆ y 0 1x1 2 x2 3 x2
ˆ 8.2933 (百万支) y
区间 [7.8230,8.7636]
2 ˆ ˆ ˆ ˆ xx ˆ y 0 1x1 2 x2 3 x2 4 1 2