SPSS实验报告二
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS实验报告二
实验目的:掌握方差分析、相关分析和回归分析的基本操作;掌握其中相关的问题检验;读懂输出结果并进行合理分析。
第一题:利用外来工数据,完成下列问题:
(1)使用t检验,比较(目前从事行业中)制造业和服务业的总体平均年龄是否有显著差异;
分析——比较均值——独立样本t检验——检验变量(年龄)——分组变量(所从事的行业)——定义组(制造业和服务业)——确定
P<0.05 拒绝原假设,认为(目前从事行业中)制造业和服务业的总体平均年龄有显著差异。
(2)使用多因素方差分析研究教育程度和月收入对家庭花费(V2_2c),说明两个因素的影响是否显著,有没有显著的交互作用;
分析——一般线性模型——单变量——因变量(选择家庭花费V2-2c)——固定因子(选择教育程度月收入)——确定
(3)如果因素影响显著而交互作用不显著,建立非饱和模型,并利用多重比较比较(snk)各因素水平的高低;
分析——一般线性模型——单变量——因变量(选择家庭花费V2-2c)——固定因子(选择教育程度月收入)
——模型(设定选择V1-3 V2-1到模型M框)——继续
——绘制——水平轴(V2-1)——单图(V1-3)——添加——继续
——两两比较(将V1-3 V2-1指向两两比较检验框P)——勾选s-n-k
——保存——勾选预测值(未标准化)——残差(标准化)——诊断(Cook距离)——继续
——选项——勾选(描述统计方差齐性检验)——继续——确定
从家庭花费和教育程度来看,大学及以上学历的群体比初高中及中专学历的群体家庭花费要多出很多。因此,可得出教育程度越高,家庭花费越多。而从家庭花费和月收入来看,800元以下及801到2000元收入的群体家庭花费并不会随着收入的增加而有很大的增幅;但2001到3000元及3000元以上的收入群体的家庭花费会随之增幅很大。因此,大体可得出收入越高的群体家庭花费越多。
第二题:应用waste.sav数据,研究固体垃圾排放量与宾馆、餐饮业用地、零售业用地、运输、批发企业用地、金属制造业用地、工业企业用地的关系。(1)、通过散点图观察变量间的相关关系,使用Enter建立模型,判断各自变量间是否存在多重共线性,写出回归方程,说明T检验和F检验的结果
图形——旧对话框——矩阵分布——选择简单点——定义
——X轴变量(固体垃圾排放)——行(宾馆、餐饮业用地、零售业用地、运输、批发企业用地、金属制造业用地、工业企业用地)
分析——回归——线性——因变量(固体垃圾~)——自变量(宾馆、餐饮业用地、零售业用地、运输、批发企业用地、金属制造业用地、工业企业用地)——方法(进入)——确定
通过F检验,其P值小于显著性水平0.05,所以认为它们之间有显著的线性关系,
可以构建回归模型。
通过T 检验,我们可以得知,除了金属制造业用地的P值大于显著性水平0.05外,即接受原假设,金属制造业用地和固体垃圾排放量没有显著的关系外,其他的四个的P值都小于显著性水平0.05和固体垃圾排放量有显著的关系,工业企业用地和零售业用地和固体垃圾排放量有负相关的关系;而运输、批发企业用地和宾馆、餐饮业用地与固体垃圾排放量有正相关的关系。运输、批发企业用地和宾馆、餐饮业用地、工业企业用地和零售业用地、金属制造业用地的VTF都没有大于10,故它们之间没有多重共线性关系。
其回归方程为:
y=-0.122-5.249E-005*x1+4.345E-005*x2+0.00025*x3-0.001*x4+0
.013*x5
(2)、利用Stepwise建立模型,通过计算D-W统计量和作出残差分布图、pp图等方法初步判断是否存在序列相关、异方差和正态性,保存模型的预测值。
选做:以库克距离大于1去除异常点后再做第二个问,对比回归结果。
分析——回归——线性——因变量(固体垃圾~)——自变量(宾馆、餐饮业用地、零售业用地、运输、批发企业用地、金属制造业用地、工业企业用地)——方法(进入)
——勾选统计量(D-W)——继续
——绘制——Y(ZRESID)——X2(ZPRED)——勾选(直方图正态概念图)—继续
——保存——勾选(为标准化预测未标准化残差Cook距离)——继续
——选项——默认(不需作任何修改)——确定
D-W统计量为1.694,在1.5~2.5之间,认为无明显的序列相关。
通过P-P图可以看到数据点围绕基准线还存在一定的规律,表明标准化残差与标准正态分布不存在显著差异。
通过散点图可分析,随着标准化预测值的变化,残差点在0线周围随机分布,但残差随着标准化预测值变化的趋势并不明显,因此异方差现象并不明显。
第三题:完成P283,例题9-3,画出外出就餐和年份的散点图,利用复合函数,指数函数和三次函数行拟合,选择最好的拟合模型,写出曲线方程,并对之后两年年的数据进行预测。
图形——旧对话框——散点点状——简单分布——定义——Y轴(在外就餐)——X轴(年份)
在数据视图添加年份(输入2003 2004)
分析——回归——曲线估计——因变量(在外就餐)——变量(年份)
—勾选(在等式包含常量根据模型绘图线性复合立方指数分布)—确定
指数函数和复合函数的拟合效果最好。
复合函数的曲线方程为:y=1.031E-131*1.166**X
指数函数的曲线方程:y=1.031E-131*e**(0.154X)
而预测后两年的数据分别为683.49853和797.16461