SPSS作业-拉丁方区组设计的方差分析-线性回归分析-研究生课程作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究生考试专用封面
所修课程名称:地学模型方法与运用
修课程时间:2020 年9 月至2020 年12 月考试日期:2020 年12 月16 日
任课教师打分:
任课教师评阅意见:
任课教师签名:年月日
分析一拉丁方区组设计的方差分析
专业:自然地理学研究生:张三学号:123456789
变量:variety(牧草种系)、rep(地块行)、col(地块列)、harvest(收获次数)、yield(产量)。
要求分析6种牧草在相同土壤条件下的产量是否有显著性差异。
为了得出这一结论,同时检验块地是否对平均产量有影响,即地块的行与行、列与列之间的平均产量是否有显著性差异,将6种牧草种子播种在6行6列的地块上,记录两次收获的产量。
假设不同地块(行、列)对产量的均值无影
表1所示的方差分析表,只对rep、col、variety变量的主效应做方差析。
方差分析解决3个因素变量的各水平,产量平均值之间差异是否具有统计意义。
显著性值的结果表明,只有variety的值为0.015,即小于0.05。
可以得出论:6
表2到4为每个因素的各水平均值的成对比较表。
每个表给出各变量两两水平之间的均值之差、均值差的标准误、针对两均值相等的假设检验的显著性概率值、差值的95%的置信区间。
从表中可以看出,只有第5种种子比其他5种种子
表5到7为各因素变量方差分析表。
表中给出F值及大于等于该值的概率。
可以看出,只有种类的方差分析显著性值为0.015,小于0.05。
综上所述,产量主要受种子的影响,而第5种种子的产量明显高于其他种
表8是综合统计表,给出产量的总均值、均值标准误差和95%的置信区间。
分析二线性回归分析
建立一个probegin(起始产量)、K(施肥量K)、N(施肥量N)、P(施肥量P)为自变量、production(当前产量)为因变量的回归模型。
1)做散点图
观察自变量与因变量之间关系是否具有线性特点。
图1 起始产量与当前产量之间的线性关系
图2 当前产量与N施肥量之间的线性关系
图3 当前产量与K施肥量的线性关系
图4 当前产量与P施肥量的线性关系
从图1到4中可以看出,初始产量与当前产量之间存在明显线性关系,以起始产量为自变量建立线性回归方程是可能的。
表1由左至右各列的含义分别是:拟合步骤编号、每步引入回归方程的自变量、从回归方程中剔除的自变量、自变量引入和剔除的标准。
可以看出,4个被
表2由左至右各列的含义分别是:回归方程模型编号、回归方程的复相关系数R、R2、修正的R2、估计的标准误差。
一般随着模型中变量个数的增加,R2的值也在不断增加,而修正R2值与变量的数目无关。
本例中这个特点不明显。
R2值的增加并不意味着模型更好,也未必会减少估计的标准误。
修正R2值能较确切地反映拟合优度,因此,一般从修正R2值看拟合优度。
除非需要,自变量数量不应太多,多余的自变量会给解释回归方程造成困难。
由表2可知建立回归方程比较好。
表3为方差分析表,显示了回归拟合过程中每一步的方差分析结果。
显著性为F值大于F临界值的概率。
方差分析结果表明,当回归方程包含不同的自变量时,其显著性概率值均小于0.001,即拒绝回归系数为0的假设。
因此,最终的回归方程应包括这4个自变量,且方程拟合效果很好。
160 -3.194 66000 89843.83 -23843.827
205 -3.965 66750 96350.44 -29600.439
218 6.108 80000 34405.27 45594.728
274 5.113 83750 45581.96 38168.038
449 3.590 70000 43200.04 26799.959
454 3.831 90625 62027.14 28597.858
a. 因变量:当前产量
表5为异常值诊断表。
自左到右各列的含义是:奇异值观测编号、标准化残差、因变量当前产量、当前产量的预测值、残差。
表中给出了被怀疑为异常值的观测编号,这些观测之所以被怀疑为异常值,是因为它们的标准化残差绝对值都大于设置值3。
图5 散点图
图5所示的当前产量的标准化预测值与其学生化残差散点图,可以看出绝大部分观测随机落在垂直围绕±2的范围内,预测值与学生或残差之间没有明显关系,所以回归效果较好。