数据分析spss作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据分析方法及软件应用
(作业)
题目:4、8、13、16题
指导教师:
学院:交通运输学院
姓名:
学号:
4、在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。在同一浓度与温度组合下各做两次试验,其收率数据如下面计算表所列。试在α=0.05显著性水平下分析
(1)给出SPSS数据集的格式(列举前3个样本即可);
(2)分析浓度对收率有无显著影响;
(3)分析浓度、温度以及它们间的交互作用对收率有无显著影响。
解答:(1)分别定义分组变量浓度、温度、收率,在变量视图与数据视图中输入表格数据,具体如下图。
(2)思路:本问是研究一个控制变量即浓度的不同水平是否对观测变量收率产生了显著影响,因而应用单因素方差分析。假设:浓度对收率无显著影响。
步骤:【分析-比较均值-单因素】,将收率选入到因变量列表中,将浓度选入到因子框中,确定。
输出:
變異數分析
收率
平方和df 平均值平方 F 顯著性
群組之間39.083 2 19.542 5.074 .016
在群組內80.875 21 3.851
總計119.958 23
显著性水平α为0.05,由于概率p值小于显著性水平α,则应拒绝原假设,认为浓度对收率有显著影响。
(3)思路:本问首先是研究两个控制变量浓度及温度的不同水平对观测变量收率的独立影响,然后分析两个这控制变量的交互作用能否对收率产生显著影响,因而应该采用多因素方差分析。假设,H01:浓度对收率无显著影响;H02:温度对收率无显著影响;H03:浓度与温度的交互作用对收率无显著影响。
步骤:【分析-一般线性模型-单变量】,把收率制定到因变量中,把浓度与温度制定到固定因子框中,确定。
输出:
主旨間效果檢定
因變數: 收率
來源第 III 類平方
和df 平均值平方 F 顯著性
修正的模型70.458a11 6.405 1.553 .230
截距2667.042 1 2667.042 646.556 .000
浓度39.083 2 19.542 4.737 .030
温度13.792 3 4.597 1.114 .382
浓度 * 温度17.583 6 2.931 .710 .648
錯誤49.500 12 4.125
總計2787.000 24
校正後總數119.958 23
a. R 平方 = .587(調整的 R 平方 = .209)
第一列是对观测变量总变差分解的说明;第二列是观测变量变差分解的结果;第三列是自由度;第四列是均方;第五列是F检验统计量的观测值;第六列是检验统计量的概率p值。可以看到观测变量收率的总变差为119.958,由浓度不同引起的变差是39.083,由温度不同引起的变差为13.792,由浓度和温度的交互作用引起的变差为17.583,由随机因素引起的变差为49.500。浓度,温度和浓度*温度的概率p值分别为0.030,0.382和0.648。
浓度:显著性<0.05说明拒绝原假设(浓度对收率无显著影响),证明浓度对收率有显著影响;温度:显著性>0.05说明不拒绝原假设(温度对收率无显著影响),证明温度对收率无显著影响;浓度与温度: 显著性>0.05说明不拒绝原假设(浓度与温度的交互作用对收率无显著影响),证明温浓度与温度的交互作用对收率无显著影响。
8、以高校科研研究数据为例:以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、专著数X6、获奖数X8;建立多元线性回归模型,
分析它们之间的关系。解释变量采用逐步筛选策略,并做多重共线性、方差齐性和残差的自相关性检验。
解答:
思路:根据要求采用逐步筛选的解释变量筛选策略,利用回归分析方法建立多元线性回归模型,分析它们之间的关系,并且要求做多重共线性、方差齐性和残差的自相关性检验。
(1)步骤:【分析-回归-线性】,X5选入因变量,X2、X4、X6、X8选入自变量,方法选择【逐步】。【统计量】勾选【估计】、【模型拟合度】、【共线性诊断】与【Durbin-Waston(U)】。【绘制(T)按钮】,将*ZRESID添加到Y(Y)框中,将*ZPRED 添加到X2(X)框中,勾选【正态概率图】,【保存(S)】按钮。在预测值与残差中勾选【标准化】选项。选择菜单【分析→相关→双变量】将标准化预测值和标准化残差选入【变量】框,在相关系数中选择Spearman,各项完成后点击【确定】。
输出:
變數已輸入/已移除a
模型變數已輸入變數已移除方法
1
投入人年数. 逐步(準則:
F-to-enter 的
機率 <= .050,F-to-remove 的機率 >= .100)。
a. 應變數: 课题总数
模型摘要b
模型R R 平方調整後 R 平方標準偏斜度錯誤Durbin-Watson
1 .959a.919 .917 241.958
2 1.747
a. 預測值:(常數),投入人年数
b. 應變數: 课题总数
表中变量为投入人年数,参考调整的判定系数,由于调整的判定系数(0.917)较接近于1,因此认为拟合优度较高,被解释变量可以被模型解释的部分较多,未能被解释的部分较少。方程DW检验值为1.747,残差存在一定的正自相关。
變異數分析a
模型平方和df 平均值平方 F 顯著性
1 迴歸19379040.047 1 19379040.047 331.018 .000b
殘差1697769.953 29 58543.791