统计回归模型举例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-0.15 0.15 0.2 0.1 0.4 0.45 0.35 0.3 0.5 0.5 0.4 -0.05 -0.05 -0.1 0.2 0.1 0.5 0.6 -0.05 0 0.05 0.55]; ▪ x2=[5.5 6.75 7.25 5.5 7 6.5 6.75 5.25 5.25 6 6.5 6.25 7 6.9 6.8 6.8 7.1 7 6.8 6.5 6.25 6 6.5 7 6.8 6.8 6.5 5.75 5.8 6.8]; ▪ >> y=[7.38 8.51 9.52 7.5 9.33 8.28 8.75 7.87 7.1 8 7.89 8.15 9.1 8.86 8.9 8.87 9.26 9 8.75 7.95 7.65 7.27 8 8.5 8.75 9.21 8.27 7.67 7.93 9.26];
▪ 运行结果:
▪ b = 17.3244,1.3070,-3.6956,0.3486
▪ bint = 5.7282 28.9206
▪
0.6829 1.9311
▪ -7.4989 0.1077
▪
0.0379 0.6594
▪ stats = 0.9054,82.9409,0.0000,0.0490
y 17.3244 1.3.7x1 3.6956 x2 0.3486 x22
模型比较
x1和x2对y 的影响独立
x1和x2对y 的影响有 交互作用
y 0 1x1 2 x2 3 x22
参数 参数估计值
置信区间
0
17.3244
y 0 1x1 2 x2 3x22 4 x1x2 (**)
▪ >> x=[ones(30,1) x1',x2' (x2.^2)' (x1.*x2)']; ▪ >> [b,bint,r,rint,stats]=regress(y',x) ▪ b = 29.1133 ▪ 11.1342 ▪ -7.6080 ▪ 0.6712 ▪ -1.4777 ▪ bint =3.7013 44.5252 ▪ 1.9778 20.2906 ▪ -12.6932 -2.5228 ▪ 0.2538 1.0887 ▪ -2.8518 -0.1037 ▪ stats =0.9209,72.7771,0.0000,0.0426
估计x3 调整x4 控制x1
通过x1, x2预测y
控制价格差x1=0.2元,投入广告费x2=650万元
x1=0.2;x2=6.5; Y=b(1)+b(2)*x1+b(3)*x2+b(4)*(x2.^2) 运行结果:Y =8.2933
即预测牙膏销售量为8.2933百万支。
模型改进
上述模型中的回归变量x1,x2对因变量y的影响是 相互独立的。即牙膏销售量y的均值与广告费x2 的二次关系由回归系数β2和β3确定,而不必依赖 于差价x1,同样y的均值与x1的线性关系仅由回归 系数β1确定,不依赖于x2.根据直觉和经验可以 猜想,x1和x2之间的交互作用也会对y有影响, 不妨简单地用x1,x2的乘积来表示他们的相互作 用,于是上述模型中增加一项,得到:
例1 牙膏的销售量
问 建立牙膏销售量与价格、广告投入之间的模型 题 预测在不同价格和广告费用下的牙膏销售量
收集了30个销售周期本公司牙膏销售量、价格、
广告费用,及同期其它厂家同类牙膏的平均售价
销售 本公司价 其它厂家 广告费用 价格差 销售量 周期 格(元) 价格(元) (百万元) (元) (百万支)
1
3.85
3.80
5.50
-0.05
7.38
2
3.75
4.00
6.75
0.25
8.51
29
3.80
3.85
5.80
0.05
7.93
30
3.70
4.25
6.80
0.55
9.26
源自文库
▪ 令y表示公司牙膏的销售量, ▪ x1表示其它厂家与本公司价格差,
x2 表示公司广告费用,则数据如下: ▪ >> x1=[-0.05 0.25 0.6 0 0.25 0.2 0.15 0.05
结果分析 y 0 1x1 2 x2 3 x22
参数
参数估计值
置信区间
0
17.3244
[5.7282 28.9206]
1
1.3070
[0.6829 1.9311 ]
2
-3.6956
[-7.4989 0.1077 ]
3
0.3486
[0.0379 0.6594 ]
R2=0.9054 F=82.9409 p=0.0000
几个常见回归命令
▪ 1、多元线性回归命令: ▪ [b,bint,r,rint,stats]=regress(y,x,alpha) ▪ 2、一元多项式回归命令: ▪ [p,s]=polyfit(x,y,m) ▪ 3、多元二项式回归命令:
rstool(x,y,’model’,alpha) ▪ 线性(linear),完全二次(quadratic), ▪ 纯二次(purequadratic),交叉(interaction) ▪ 4、非线性回归命令: ▪ [beta,r,j]=nlinfit(x,y,’model’,beta0)
y的90.54%可由模型确定 F远超过F检验的临界值
P<<=0.05
2的置信区间包含零点 (右端点距零点很近)
模型从整体上看成立
x2对因变量y 的 影响不太显著
由于x22项显著
可将x2保留在模型中
销售量预测 yˆ ˆ0 ˆ1x1 ˆ2x2 ˆ3x22
价格差x1=其它厂家价格x3-本公司价格x4
▪ 下面探讨y与x1、x2的关
y 10
9.5
系:
9
8.5
▪ 用matlab软件作图:
8
▪ plot(x1,y,’*’); ▪ plot(x2,y,’*’)
7.5
7
-0.2
0
0.2
0.4
0.6
y 0 1x1 x1
▪ 运行得如下图形:
y 10
9.5
从右图看出,y与x1成 线性关系,y与x2成二 次曲线关系。
9
8.5
8
7.5
7
5
5.5
6
6.5
x 7
7.5
2
y 0 1x1 2 x2 3 x22
y
0
1x2
2
x
2 2
模型求解 MATLAB 统计工具箱
▪ >> x3=x2.^2;
▪ >> x=[ones(30,1) x1' x2' x3'];
▪ >> [b,bint,r,rint,stats]=regress(y',x)
▪ 运行结果:
▪ b = 17.3244,1.3070,-3.6956,0.3486
▪ bint = 5.7282 28.9206
▪
0.6829 1.9311
▪ -7.4989 0.1077
▪
0.0379 0.6594
▪ stats = 0.9054,82.9409,0.0000,0.0490
y 17.3244 1.3.7x1 3.6956 x2 0.3486 x22
模型比较
x1和x2对y 的影响独立
x1和x2对y 的影响有 交互作用
y 0 1x1 2 x2 3 x22
参数 参数估计值
置信区间
0
17.3244
y 0 1x1 2 x2 3x22 4 x1x2 (**)
▪ >> x=[ones(30,1) x1',x2' (x2.^2)' (x1.*x2)']; ▪ >> [b,bint,r,rint,stats]=regress(y',x) ▪ b = 29.1133 ▪ 11.1342 ▪ -7.6080 ▪ 0.6712 ▪ -1.4777 ▪ bint =3.7013 44.5252 ▪ 1.9778 20.2906 ▪ -12.6932 -2.5228 ▪ 0.2538 1.0887 ▪ -2.8518 -0.1037 ▪ stats =0.9209,72.7771,0.0000,0.0426
估计x3 调整x4 控制x1
通过x1, x2预测y
控制价格差x1=0.2元,投入广告费x2=650万元
x1=0.2;x2=6.5; Y=b(1)+b(2)*x1+b(3)*x2+b(4)*(x2.^2) 运行结果:Y =8.2933
即预测牙膏销售量为8.2933百万支。
模型改进
上述模型中的回归变量x1,x2对因变量y的影响是 相互独立的。即牙膏销售量y的均值与广告费x2 的二次关系由回归系数β2和β3确定,而不必依赖 于差价x1,同样y的均值与x1的线性关系仅由回归 系数β1确定,不依赖于x2.根据直觉和经验可以 猜想,x1和x2之间的交互作用也会对y有影响, 不妨简单地用x1,x2的乘积来表示他们的相互作 用,于是上述模型中增加一项,得到:
例1 牙膏的销售量
问 建立牙膏销售量与价格、广告投入之间的模型 题 预测在不同价格和广告费用下的牙膏销售量
收集了30个销售周期本公司牙膏销售量、价格、
广告费用,及同期其它厂家同类牙膏的平均售价
销售 本公司价 其它厂家 广告费用 价格差 销售量 周期 格(元) 价格(元) (百万元) (元) (百万支)
1
3.85
3.80
5.50
-0.05
7.38
2
3.75
4.00
6.75
0.25
8.51
29
3.80
3.85
5.80
0.05
7.93
30
3.70
4.25
6.80
0.55
9.26
源自文库
▪ 令y表示公司牙膏的销售量, ▪ x1表示其它厂家与本公司价格差,
x2 表示公司广告费用,则数据如下: ▪ >> x1=[-0.05 0.25 0.6 0 0.25 0.2 0.15 0.05
结果分析 y 0 1x1 2 x2 3 x22
参数
参数估计值
置信区间
0
17.3244
[5.7282 28.9206]
1
1.3070
[0.6829 1.9311 ]
2
-3.6956
[-7.4989 0.1077 ]
3
0.3486
[0.0379 0.6594 ]
R2=0.9054 F=82.9409 p=0.0000
几个常见回归命令
▪ 1、多元线性回归命令: ▪ [b,bint,r,rint,stats]=regress(y,x,alpha) ▪ 2、一元多项式回归命令: ▪ [p,s]=polyfit(x,y,m) ▪ 3、多元二项式回归命令:
rstool(x,y,’model’,alpha) ▪ 线性(linear),完全二次(quadratic), ▪ 纯二次(purequadratic),交叉(interaction) ▪ 4、非线性回归命令: ▪ [beta,r,j]=nlinfit(x,y,’model’,beta0)
y的90.54%可由模型确定 F远超过F检验的临界值
P<<=0.05
2的置信区间包含零点 (右端点距零点很近)
模型从整体上看成立
x2对因变量y 的 影响不太显著
由于x22项显著
可将x2保留在模型中
销售量预测 yˆ ˆ0 ˆ1x1 ˆ2x2 ˆ3x22
价格差x1=其它厂家价格x3-本公司价格x4
▪ 下面探讨y与x1、x2的关
y 10
9.5
系:
9
8.5
▪ 用matlab软件作图:
8
▪ plot(x1,y,’*’); ▪ plot(x2,y,’*’)
7.5
7
-0.2
0
0.2
0.4
0.6
y 0 1x1 x1
▪ 运行得如下图形:
y 10
9.5
从右图看出,y与x1成 线性关系,y与x2成二 次曲线关系。
9
8.5
8
7.5
7
5
5.5
6
6.5
x 7
7.5
2
y 0 1x1 2 x2 3 x22
y
0
1x2
2
x
2 2
模型求解 MATLAB 统计工具箱
▪ >> x3=x2.^2;
▪ >> x=[ones(30,1) x1' x2' x3'];
▪ >> [b,bint,r,rint,stats]=regress(y',x)