spss软件分析异常值检验实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验五:残差分析
【实验目的】
(1)通过残差检验,掌握残差分析的方法
(2)异常值检验
【仪器设备】
计算机、spss软件、何晓群《实用回归分析》表和表的数据
【实验内容、步骤和结果】
对何晓群《实用回归分析》表的数据进行残差分析
原始数据如表1,其中y表示货运总量(亿吨)x1表示工业总产值(亿元)x2表示农业总产值(亿元)x3表示居民非商业支出(亿元)
表1.
对表1数据用spss软件进行分析得以下各表
由上表可知复相关系数R=,决定系数R方=,由决定系数看出回归方程的显著性不高,接下来看方差分析表3
由表3知F值为较小,说明x1、x2、x3整体上对y的影响不太显著。
表4系数
模型非标准化系数标准系数
t Sig. B标准误差试用版
1(常量).096 x1.385.100
x2.535.049
x3.277.284
表4系数
模型 非标准化系数
标准系数 t
Sig.
B
标准 误差
试用版
1
(常量)
.096 x1 .385 .100 x2 .535 .049 x3
.277
.284
回归方程为 123348.280 3.7547.10112.447y x x x =-+++
图1.学生化残差
差
残差:
对数据用spss进行分析得
表6异常值的诊断分析
数据不存在异常值.绝对值最大的删除学生化残差为SDR=,因而根据学生化删除残差诊断认为第6个数据为异常值.其中中心化杠杆值,cook距离为位于第一大.因此第6个数据为异常值.
对何晓群《实用回归分析》表的数据进行残差分析
原始数据为 :
表个啤酒品牌的广告费用和销售量
对上表数据进行回归分析得
回归方程为回归方程通过了F 检验、t 检验,只是表明变量x 和y之间的线性关系是显著的,但不能保证数据拟合得很好。残差分析可知存在有影响的观测值并且为异值。
对表7进行异常值诊断分析得表9:
表9.异常值的诊断分析
数据不存在异常值. 绝对值最大的删除学生化残差为SDR=,因而根据学生化删除残差诊断
认为第1个数据为异常值.其中中心化杠杆值,cook距离为位于第一大.因此第1个数据为异常值.从回归标准化残差图4看,y的观测值的方差不相同,而是随着x的增加而增加的。异常值的原因并不是数据的随机误差,而是由于本数据存在异方差,应采用加权最小二乘法进行回归,回归结果会较精确。
图4.回归标准化残差图
通过这次实验,我进一步了解并掌握了运用SPSS软件对数据进行分析和处理,通过残差检验,掌握残差分析的方法和异常值检验,还有EXCEL的表格应用。在老师和同学们的帮助下顺利的解决了处理数据中遇到的问题,希望在以后的学习实践中能熟练运用spss软件进行数据处理与分析。