多元线性回归实验报告模板

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

和广告费之间的关系可用(3)近似表示出.
实验过程:(含解决方法和基本步骤,主要程序清单及异常情况记录等)a=[1 -0.05
5.5 30.25
1 0.25 6.75 45.5625
1 0.6 7.25 52.5625
1 0 5.5 30.25
1 0.25 7 49
1 0.2 6.5 42.25
1 0.15 6.75 45.5625
实验目的: 1. 学习和掌握 Excel 及 MATLAB 的有关命令. 2. 自已收集数据(可以利用统计年鉴或其它公开的数据),利用你的数据建立模型. 3. 说明模型的意义
数学模型:
y = β0 + β1x1 + β2x2 + β3x22 + ε
实验所用软件及版本: Microsoft Word 2003 Excel MATLAB 6.5.1
三.模型评价: 从表 2 显示, r2 = 0.9194 指因变量 y 的 91.94%可由模型确定, F 的值远远超过 F 检验的临界值, p
也小于α ,因此模型(3)从整体上看是可用的。 表 ( 2 ) 的 回 归 系 数 给 出 了 模 型 三 中 的 β0, β1, β2, β3 的 估 计 值 , 即
Stats 是用于检验回归模型的统计量,有三个数值,第一个是相关系数 r2 , r2 越接近 1,说明
回归模型越显著;第二个是 F 值,F > F1−α (k, n − k −1) 时拒绝 H0 ,F 越大,说明回归方程越显著;第三
个是对应的概率 p , p < α 时拒绝 H0 ,回归模型成立。
求解步骤为:
收入
x1 电视广告费用 x2 报纸广告费用
从图 1 中发现,随着 x1 的增加, y 值有较明显的线形增长趋势,图中的直线是用线形模型
y = β0 + β1x1 + ε
(1)
拟和的(其中 ε 是随机误差).而在图 2 中,当 x2 增大时, y 有上凸呈增加的趋势,图 2 的曲线可用二
次函数的模型表示,其模型为:
β0 = 78.7775, β1 = 1.3853, β2 = 4.9886, β3 = −0.3862 。 从残差分析图中可以看出,除了第八个数据外,其余数据的残差离零点均较近,且残差的置信区间
均包含原点,这也说明回归模型能较好的符合原始数据而第八个数据视为异常点。 因此得到的数学模型为:
y = 78.7775 +1.3853x1 + 4.9886x2 − 0.3862x2
进一步讨论或展望:
在模型(3)中回归变量 x1 和 x2 对因变量 y 的影响是相互独立的,即每周的收入均值与电视广告费用
x1 的线形关系由回归系数 β1 确定,不依赖 x2 ;而收入与报纸广告费用 x2 的二次关系由回归系数 β2 , β3 确
定而不依赖于 x1 。根据直觉和经验,可以猜想 x1 和 x2 的交互作用对 y 有影响,不妨设 x1 , x2 的乘积表示 它们的交互关系,于是将模型(3)增加一项得到
数学实验报告
实验序号:8
日期:2005 年 9 月 21 日
班级 03 级 C 班 姓名 匡伟 学号
034080163
实验名称 多元线性回归模型
问题的背景:
多元线性回归模型是数学建模中最常用的一种模型,只有通过作大量练习,才能 掌握此种方法。
实验目的:
1. 学习和掌握 Excel 的有关命令. 2. 自已收集数据(可以利用统计年鉴或其它公开的数据),利用你的数据建立模型. 3. 说明模型的意义
3.75
6.75
0.15
3.85
5.25
0.05
3.65
5.25
-0.15
4
6
0.15
销售量 (百万瓶)
7.38 8.51 9.52 7.5 9.33 8.28 8.75 7.87 7.1
8
11
3.9
4.1
6.5
0.2
7.89
12
3.9
4
6.25
0.1
8.15
13
3.7
4.1
7
0.4
9.1
14
3.75
y = β0 + β1x2 + β2 x22 + ε
来拟合的(其中ε 是随机误差).
综合上面的分析:结合模型(1)和模型(2)建立如下的回归模型
y = β0 + β1x1 + β2x2 + β3x22 + ε
(2) (3)
(3)式右端的 x1 和 x2 称为回归变量(自变量),参数 β1, β2 , β3 称为回归系数, ε 是包含影响 y 的因素。
β1 0.7349
[-0.3829,1.8528] β1 17.4174
[8.1372,26.6976]
β2 -4.5738
[-9.2533,-0.1058] β2 -13.5449 [-19.5943,-7.4955]
β3 0.4333
[0.0429,0.8238] β3 1.1790
[0.6756,1.6824]
78.7775 1.3853 4.9886 -0.3862 bint = 68.5638 88.9913 -0.2165 2.9872 -1.7291 11.7063 -1.3809 0.6085 stats =
0.9194 15.2103 0.0118
3.得到模型(3)的回归系数估计值及其置信区间(置信区间为α = 0.05 )检验统计量 r2, F, p 的结果见
(2)
在用[b,bint,r,rint,stats]=regress(y,x,alpha)求得表二数据。显然表二的数据比表一好得
多。得到各因素与销售量的关系为:
y = 46.3424 +174174x1 −13.5449x2 +1.1790x22 − 2.5516x1x2
(3)
把 20 组数据带入加以检验:得 y0 = 8.0717。模型得到很好的拟合。得到销量与价格差
0
1
1
那么不管 χ 如何变化 Ε ( y) 不随 χ 的变化作线形变化,那么这时求得的一元线形回归方程就没有意
β 义,称为不显著。如果 ≠ 0 ,那么当 χ 变化时, Ε ( y) 随 χ 的变化作线形变化,那么这时求得的 1
回归方程就有意义,称为是显著的。 进一步讨论或展望:
展望:一元或多元线性回归是个很普遍的问题,特别在现实生活当中我们能找到很多和线性问题 相关的例子,如果把线性问题用到实际当中,我们就能从中得到利益。
实验原理与数学模型:确定事物性质的变量之间的关系很难用一种精确的方法表示
出来。回归分析就是处理变量之间关系的一种数学方法,能够解决、预测、控制事物的
发展。根据所给数据构造回归模型,回归系数用最小二乘法进行估计。
实验所用软件及版本:MATLAB 6.5 Excel2003
主要内容(要点):下面以一家洗涤剂制造商的统计数据为例,来为出售价格提供数据
表所示:表 2
参数 回归系数的估计值
β0
78.7775
回归系数的置信区间
[−0.2165 2.9872]
β1
1.3853
[−0.2165 2.9872]
β2
4.9886
[−1.7291 11.7063]
β3
-0.3862
[−1.3809 0.6085]
检验统计量
r2 = 0.9194 F = 15.2103 p = 0.0118
如果模型选择合适,ε 应大致服从均值为零的正态分布。
二.模型的求解: 利用 MATLAB 的统计箱工具中的命令 regress 求解,使用格式为:
[b,bint,r,rint,stats]=regress(Y,X,alpha)
其中:b
是回归系数的点估计值
bint 为回归系数的区间估计
alpha 为显著性水平(缺省时为 0.05) r 与 rint 分别为残差和置信区间
主要内容(要点): 一. 作散点图确定收入与电视广告费用的关系以及收入与报纸广告费用的关系。 二.通过分析散点图确定收入与电视广告费用报纸广告费用的数学模型。 三.检验得到的数学模型。 四.对数学模型的评价。
实验过程:(含解决方法和基本步骤,主要程序清单及异常情况记录等)
符号表示: y 一.模型的建立:
y = β0 + β1x1 + β2 x2 + β3x22 + β4 x1x2 + ε
然后再用所给的数据估计模型(4)的回归系数,并用 MATLAB 统计箱中的工具计算 r2 ,再跟模型(3)
中计算得到的 r2 相比较。如果模型(4)中的比模型(3)中的大,则说明模型(4)比模型(3)好,否 则模型(3)比模型(4)好。
表2参数回归系数的估计值回归系数的置信区间021652987202165298724988603862检验统计量0919415210300118172911170631380906085显示指因变量的9194可由模型确定的值远远超过检验的临界值也小于787775138534988603862从残差分析图中可以看出除了第八个数据外其余数据的残差离零点均较近且残差的置信区间均包含原点这也说明回归模型能较好的符合原始数据而第八个数据视为异常点
1.输入数据:
X=[1 1.5 5
25;
12 2
4;
1 1.5 4
16;
1 2.5 2.5 6.25;
1 3.3 3
9;
1 2.3 3.5 12.25;
1 3.2 2.5 6.25;
1 2.8 3
9;];
>> Y=[96;90;95;92;95;95;94;93;];
2.回归分析 [b,bint,r,rint,stats]=regress(Y,X); b,bint,stats b=
型为 y = β0 + β1x1 + β2 x2 + β3x22 + ε (1)
用 MATLAB 统计工具中的命令 regress 求解得表一数据:
表一:
表二:
参数 参数估计值 参数置信期间
参数 参数估计值 参数置信期间
β0 19.5662 [5.5893,33.5430] β0 46.3424 [28.2825,64.4023]
β4 -2.5516
[-3.9554,-1.1378]
R=0.9204 F=61.6816 p=0.0000
R= 0.9599 F=89.854 p= 0.000
由(1)解得的数据如表一所示,β1 、β2 的置信期间包含零点,不显著。分析模型可知 x1
与 x2 有交互作用,可把模型表示为;
y = β0 + β1x1 + β2 x2 + β3 x22 + β4 x1x2 + ε
1 0.05 5.25 27.5625
1 -0.15 5.25 27.5625 1 0.15 6 36 1 0.2 6.5 42.25 1 0.1 6.25 39.0625 1 0.4 7 49 1 0.45 6.9 47.61 1 0.35 6.8 46.24 1 0.3 6.8 46.24 1 0.5 7.1 50.41 1 0.5 7 49 1 0.4 6.8 46.24 1 -0.05 6.5 42.25 ]; y=[7.38 8.51 9.52 7.5 9.33 8.28 8.75 7.87 7.1
8
7.89
8.15
9.1
8.86
8.9
8.87
9.26
9
8.75
7.95];
alpha=0.05;
[b,bint,r,rint,stats]=regress(y,x,alpha)
实验结果与心得体会:
通过上述例子分析,可以看出销售量与价格、同行产品的竞争等等有着密切关系,尤其是销售量
β β β 与价格体现出了他们的线形相关性。由此我们可以建立回归方程 Ε ( y) = + χ 。如果 =0,
4.2
6.9
0.45
8.86
15
3.75
4.1
6.8
0.35
8.9
16
3.8
4.1
6.8
0.3
8.87
17
3.7
4.2
7.1
0.5
9.26
18
3.8
4.3
7
ห้องสมุดไป่ตู้
0.5
9
19
3.7
4.1
6.8
0.4
8.75
20
3.8
3.75
6.5
-0.05
7.95
实验过程:(含解决方法和基本步骤,主要程序清单及异常情况记录等)
记洗涤剂销售量为 y ,价格差 x1 , 广告费用 x2 , 其他公司的平均价格为 x3 , 公司价格
为 x4 , x1 = x3 − x4 。
首先利用表中的数据分别作出 y 对 x1 和 x2 的散点图。
观察散点图可知 y 与 x1 的关系是线性的,而 y 与 x2 的关系是二次函数形式。得到回归模
数学实验报告
实验序号:4
班级: 实验名称
数学学院 03 级 C 班
多元线性回归模型
姓名
日期:2005 年 9 月 27 日
李昆林
学 号 034080127
问题的背景:
不确定性关系的变量间的关系很难用一种精确的方法表示出来,处理变量间不确定性关系可以用 回归分析。
现取电影院收入与广告费用数据如下: 每周收入 96 90 95 92 95 95 94 94 电视广告费用 1.5 2.0 1.5 2.5 3.3 2.3 3.2 2.8 报纸广告费用 5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0
依据。
销售 公司销售 其他公司的 广告费用 价格差 周期 价格(元) 销售价格(元) (百万) (元)
1
3.85
2
3.75
3
3.7
4
3.7
5
3.6
6
3.6
7
3.6
8
3.8
9
3.8
10
3.85
3.8
5.5
-0.05
4
6.75
0.25
4.3
7.25
0.6
3.7
5.5
0
3.85
7
0.25
3.8
6.5
0.2
相关文档
最新文档