数学实验第10次作业回归分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数学实验第10次作业回归分析
回归分析
一实验目的
1了解回归分析的基本原理,掌握MATLAB实现的方法;
2练习用回归分析解决实际问题。
二实验内容
1电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表),建立回归模型并进行检验,诊断异常点的存在并进行处理。
每周收入
报纸广告费用
初步解决:
首先对于题目作初步分析,题目中电视广告费用和报纸广告费用都会对与每周收入产生影响,但是两者对于每周收入的影响都是独立的。
首先画出散点图如下:
观察散点图之后,假设自变量与因变量满足多元线性关系。设电视广告费用为,报纸
广告费用为,每周收入为,那么每周收入与电视广告费用以及报纸广告费用的关系模型表示如下:
;
下面在MATLAB中输入以下命令:
输出结果如下所示:
结果列表如下:
回归系数回归系数估计值回归系数置信区间,
,
,
,,,
于是由它得到的预测模型为。
做出残差和置信区间的图像如下:
由图像可以看出,只有第一组数据的置信区间不包括零,改组数据可能有误,去掉之后再进行计算。
在命令栏中输入以下命令:
输出结果如下所示:
将结果列表如下:
回归系数回归系数估计值回归系数置信区间
,
,
,
,,,
由它得到的回归模型为。
对于实验结果的分析:
回归模型:。对比剔除异常点后的分析结果可知,第一次分析的过程中,第一组数据的置信区间不包括零点,所以该点为异常点,需要剔除再进行一次计算。剔除之后,发现所有点的置信区间都包括了零点。
剔除数据之后计算结果与剔除之前的比较
剔除后,,,
纵向比较可以看出,剔除了异常数据之后,置信区间明显的有了缩小,所以说,剔除异常数据可以有利于更加精确地建立模型。2汽车销售商认为汽车销售量与汽油价格、贷款利率有关,两种类型汽车(普通型和豪华型)个月的调查资料见下表,其中是普通型汽车售量(千辆),是豪华型汽车售辆(千辆),是汽油价格(元/),是贷款利率()。
序号
(1)对普通型和豪华型汽车分别建立如下模型:
;
给出的估计值和置信区间,决定系数,值及剩余方差等;
(2)用,表示汽车类型,建立统一模型:,给出估计
值和置信区间,决定系数,值及剩余方差等。以,代入统一模型,将结果与
(1)的两个模型比较,解释二者的区别;
(3)对统一模型就每种类型汽车分别作和与残差的散点图,有什么现象,说明模型有何
缺陷?
(4)对统一模型增加二次项和交互项,考察结果有什么改进。
初步解决:
(1)首先研究,在命令栏中输入以下命令:
输出结果如下:
结果列表如下:
回归系数回归系数估计值回归系数置信区间
,
,
,
,,,
由它得到的回归模型为:。、的置信区间不包含零点,且,且计算可得,,所以该模型有效。
下面研究,在命令栏中输入以下内容:
输出结果如下:
结果列表如下:
回归系数回归系数估计值回归系数置信区间
,
,
,
,,,
由它得到的回归模型为:。的置信区间包含了零点,所以该模型无效。
(2)对于统一模型,用来表示车的类型,表示普通型,表示豪华型。
在命令栏中输入以下内容:
输出结果如下所示:
结果列表如下:
回归系数回归系数估计值回归系数置信区间,
,
,
,
,,,
由它得到的统一回归模型为:。的置信区间包含了零点,所以该模型无效。
下面对这个统一模型进行研究:
首先将代入统一模型,得到回归模型为,然后将代入统一模型,得到回归模型为。与第一问的结果相比相差较大,说明该模型并不合适。
(3)对于第二问中求出的的统一模型,分别画出、与残差的散点图。
首先是与残差的散点图:
然后是与残差的散点图:
对于两幅图,纵轴均为残差,横轴分别为和。两种类型的汽车残差分布不同,这说明(即汽车类型)与、有交互作用,模型中应添加交互项。
(4)在MATLAB中尝试使用逐步回归来建立包括二次项和交互项的模型。
在命令栏中输入以下命令:
然后经过不断的调试,找到使最小的情况,如下图所示:
于是,由它得到的模型为另外:
,,,