《统计分析和SPSS的应用(第五版)》课后练习答案与解析(第9章)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《统计分析与SPSS的应用〔第五版〕》〔薛薇〕
课后练习答案
第9章SPSS的线性回归分析
1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS 提供的绘制散点图功能进行一元线性回归分析。
请绘制全部样本以与不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。
选择fore和phy两门成绩体系散点图
步骤:图形→旧对话框→散点图→简单散点图→定义→将fore导入Y轴,将phy导入X轴,将sex 导入设置标记→确定。
接下来在SPSS输出查看器中,双击上图,打开图表编辑
在图表编辑器中,选择"元素"菜单→选择总计拟合线→选择线性→应用→再选择元素菜单→点击子组拟合线→选择线性→应用。
分析:如上图所示,通过散点图,被解释变量y<即:fore>与解释变量phy有一定的线性关系。
但回归直线的拟合效果都不是很好。
2、请说明线性回归分析与相关分析的关系是怎样的?
相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。
相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。
只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。
如果在没有对变量之间是否相关以与相关方向和程度做出正确判断之前,就进行回归分析,很容易造成"虚假回归"。
与此同时,相关分析只研究变量之间相关的方向
和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。
线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。
3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?
检验其可信程度并找出哪些变量的影响显著、哪些不显著。
主要包括回归方程的拟合优度检验、显著性检验、回归系数的显著性检验、残差分析等。
线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释变量和解释变量之间确实存在显著的线性关系。
回归方程的显著性检验正是要检验被解释变量和解释变量之间的线性关系是否显著,用线性模型来描述他们之间的关系是否恰当。
一般包括回归系数的检验,残差分析等。
4、请说明SPSS多元线性回归分析中提供了哪几种解释变量筛选策略?
向前、向后、逐步。
5、先收集到若干年粮食总产量以与播种面积、使用化肥量、农业劳动人数等数据,请利用建立多元线性回归方程,分析影响粮食总产量的主要因素。
数据文件名为"粮食总产量.sav"。
方法:采用"前进"回归策略。
步骤:分析→回归→线性→将粮食总产量导入因变量、其余变量导入自变量→方法项选"前进"→确定。
如下图:〔也可向后、或逐步〕
结论:如上4个表所示,影响程度中大到小依次是:施用化肥量<kg/公顷>, 风灾面积比例<%>, 年份, 总播种面积<万公顷>。
〔排除农业劳动者人数<百万人>和粮食播种面积<万公顷>对粮食总产量的影响〕
剔除农业劳动者人数<百万人>和粮食播种面积<万公顷>后:
步骤:分析→回归→线性→将粮食总产量导入因变量、其余4个变量〔施用化肥量<kg/公顷>, 风灾面积比例<%>, 年份, 总播种面积<万公顷>〕导入自变量→方法项选"输入"→确定。
如下图:
系数a
模型
非标准化系数标准系数
t 显著性B 标准错误贝塔
1 〔常量〕
-512023.307 68673.579 -7.456 .000 年份253.115 34.827 .334 7.268 .000 总播种面积<万公顷> 2.451 .344 .141 7.126 .000 施用化肥量<kg/公顷> 139.944 8.925 .749 15.680 .000 风灾面积比例<%> -302.324 38.305 -.171 -7.893 .000
a. 因变量:粮食总产量<y万吨>
6、一家产品销售公司在30个地区设有销售分公司。
为研究产品销售量<y>与该公司的销售价格〔x1〕、各地区的年人均收入<x2>、广告费用<x3>之间的关系,搜集到30个地区的有关数据。
进行多元线性回归分析所得的部分分析结果如下:
1〕将第一X表中的所缺数值补齐。
2〕写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。
3〕检验回归方程的线性关系是否显著?
4〕检验各回归系数是否显著?
5〕计算判定系数,并解释它的实际意义。
6〕计算回归方程的估计标准误差,并解释它的实际意义。
〔1〕
〔2〕Y=7589.1-117.886X1+80.6X2+0.5X3
〔3〕回归方程显著性检验:整体线性关系显著
〔4〕回归系数显著性检验:各个回归系数检验均显著
〔5〕略
〔6〕略
7、对参加SAT 考试的同学成绩进行随机调查,获得他们阅读考试和数学考试的成绩以与性别数据。
通常阅读能力和数学能力具有一定的线性相关性,请在排除性别差异的条件下,分析阅读成绩对数学成绩的线性影响是否显著。
方法:采用进入回归策略。
步骤:分析→回归→线性→将MathSAT导入因变量、其余变量导入自变量→确定。
结果如下:
因概率P值小于显著性水平〔0.05〕,所以表明在控制了性别之后,阅读成绩对数学成绩有显著的线性影响。
8、试根据"粮食总产量.sav"数据,利用SPSS曲线估计方法选择恰当模型,对样本期外的粮食总产量进行外推预测,并对平均预测误差进行估计。
采用二次曲线
步骤:图形→旧对话框→拆线图→简单→个案值→定义→将粮食总产量导入线的表征→确定
结果如下:
再双击上图→"元素"菜单→添加标记→应用
接下来:分析→回归→曲线估计→粮食总产量导入因变量、年份导入变量,点击年份→在模型中选择二次项、立方、幂→点击"保存"按钮→选择保存"预测值"→继续→确定。
曲线拟合
附注
已创建输出03-MAY-2018 09:28:44
注释
输入数据F:\SPSS\薛薇《统计分析与spss的应用
〔第五版〕》\PPT--jwd\第9章SPSS回
归分析\习题\粮食总产量.sav
活动数据集数据集1
过滤器<无>
宽度<W> <无>
拆分文件<无>
工作数据文件中的行数35
缺失值处理对缺失的定义用户定义的缺失值被视作缺失。
已使用的个案任何变量中带有缺失值的个案不用于分
析。
语法CURVEFIT
/VARIABLES=lscl WITH nf
/CONSTANT
/MODEL=LINEAR QUADRATIC CUBIC
POWER
/PRINT ANOVA
/PLOT FIT
/SAVE=PRED .
资源处理器时间00:00:00.19
用时00:00:00.25
使用从第一个观测值
到最后一个观测值
预测从使用周期后的第一观察
到最后一个观测值
变量已创建或已修改FIT_1 CURVEFIT 和MOD_1 LINEAR 中具有
nf 的lscl 的拟合
FIT_2 CURVEFIT 和MOD_1 QUADRATIC 中
具有nf 的lscl 的拟合
FIT_3 CURVEFIT 和MOD_1 CUBIC 中具有
nf 的lscl 的拟合
FIT_4 CURVEFIT 和MOD_1 POWER 中具有
nf 的lscl 的拟合
时间序列设置<TSET> 输出量PRINT = DEFAULT
保存新变量NEWVAR = CURRENT
自相关或偏自相关图中的最大
MXAUTO = 16
滞后数
每个交叉相关图的最大延迟数MXCROSS = 7
每个过程生成的最大新变量数MXNEWVAR = 4
每个过程的最大新个案数MXPREDICT = 1000
用户缺失值处理MISSING = EXCLUDE
置信区间百分比值CIN = 95
在回归方程中输入变量的容差TOLER = .0001
最大迭代参数变化CNVERGE = .001
计算标准的方法自相关的错误ACFSE = IND
季节周期长度未指定
值在绘图中标记观测值的变量未指定
包括方程CONSTANT
警告
由于模型项之间存在接近共线性,该二次模型无法拟合。
由于模型项之间存在接近共线性,该立方模型无法拟合。
模型描述
模型名称MOD_1
因变量 1 粮食总产量<y万吨>
方程式 1 线性<L>
2 二次项<Q>
3 立方<U>
4 幂a
自变量年份
常量已包括
值在绘图中标记观测值的变量未指定
对在方程式中输入项的容许.0001
a. 此模型需要所有非缺失值为正。
个案处理摘要
数字
个案总计35
排除的个案a0
预测的个案0
新创建的个案0
a. 任何变量中带有缺失值的
个案无需分析。
变量处理摘要
变量
从属自变量
粮食总产量<y万
吨> 年份
正值的数目35 35 零的数目0 0 负值的数目0 0 缺失值的数目用户缺失0 0
系统缺失0 0 粮食总产量<y万吨>
线性<L>
模型摘要
R R 平方调整后的R
平方
标准估算的
错误
.935 .874 .870 2795.862
自变量为年份。
ANOVA
平方和自由度均方 F 显著性
回归<R> 179010724
9.412
1
179010724
9.412
229.00
6
.000
残差257955809
.274 33
7816842.70
5
总计204806305
8.686
34 自变量为年份。
系数
非标准化系数标准系
数
t 显著性
B 标准错误贝塔
年份708.118 46.793 .935 15.133 .000
〔常量〕-1369647.9
04 92136.7
75
-14.865 .000
二次项<Q>
模型摘要
R R 平方调整后的R
平方
标准估算的
错误
.936 .875 .872 2782.149
立方<U>
模型摘要
R R 平方调整后的R 平
方标准估算的错误
.936 .877 .873 2768.471
自变量为年份。
ANOVA
平方和自由度均方 F 显著性回归<R> 1795136897.27
4
1 1795136897.274 234.217 .000
残差
252926161.411 33 7664429.134
总计2048063058.68
6 34
幂
分析:如上表所示,粮食总产量总体呈现上升趋势,在对回归进行检验时,sig值为0<0.05,故拒绝原假设,即认为回归方程中解释变量与被解释变量间显著。
预测值:。