实验报告6——SAS方差分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验报告
实验项目名称方差分析
所属课程名称现代统计软件实验类型验证性实验实验日期2014-10-11
班级
学号
姓名
成绩
结果中显示了不同生产设备的盒形图。可以看出,B和D标准差的差异不显著(菱形的高度差异不大),A和C标准差的差异显著,四者的均值间有一定的差异,但此差异是否显著则需进一步的方差分析。
拟合模型的一般信息
列名型变量信息,即type为列名型的,有4个水平,
提供参数信息,并且约定,P_2、P_3、P_4、P_5分别为A、B、C、D的标识变量(也称哑变量)。
给出响应变量均值关于自变量不同水平的模型方程,
其中,标识变量取值:
,
其他,,⎩⎨⎧==01P_2A
type ,
其他,,⎩⎨⎧==01P_3B
type ,
其他,,⎩
⎨⎧==01P_4C
type 根据标识变量的取值,容易求出各农田的平均产量:
⎪
⎪⎩⎪
⎪⎨⎧
===-=-=D
type C type B type A type V 58.1667
6.5000-58.16673333
.31667.581667.01667.58的均值
给出模型拟合的汇总信息,其中:
(1) 响应变量type 的均值 = 55.6667; (2) 根均方误差= 10.3755;
(3) 判定系数R 2 = 0.0733,较小。其值越大,说明自变量的信息对说明因变量信息的贡献越大,即分类变量取不同的值对因变量的影响越显著。
方差分析表
从方差分析表可以看出,p 值大于0.05(显著水平),所以不能拒绝原假设,即不同设备的产量无显著差异,也即四种新型设备的产量无显著差异。
II 型检验,它是方差分析表的细化,因为本例是单因素的,所以这一行与上图的“Model ”一行相同。
参数估计表,其中有关于不同设备产量差异的估计和检验:
(1) 根据标识变量规定的方法,Intercept后的估计58.1667是对应设备D的产量的样本均值,其后的t检验是检验总体均值是否为0。这里p值<0.0001<0.01 = α,故总体均值显著非0。
(2) 设备A后的估计-0.1667是设备A与设备D的产量均值之差的估计值,其后的t检验也是检验这三个产量均值之差是否为0。
由于p值的绝对值为0.9781 > 0.01,所以设备A与设备D的产量没有显著差异,即设备A与设备D的产量无显著差异。
(3) 设备B后的估计-3.3333是设备B与设备D的产量均值之差的估计值,其后的t检验也是检验这两个产量均值之差是否为0。
由于p值的绝对值为0.5841 > 0.01,所以设备B与设备D的产量没有显著差异,即设备B与设备D的产量无显著差异。
(3) 设备C后的估计-6.5000是设备C与设备D的产量均值之差的估计值,其后的t检验也是检验这两个产量均值之差是否为0。
由于p值的绝对值为0.2908 > 0.01,所以设备V与设备D的产量没有显著差异,即设备C与设备D的产量无显著差异。
残差和预测值的散点图,这个图可以帮助校验模型的假定。从图中看出,残差有大体相同的散布,它表明等方差的假设没有问题。
p值大于0.01,不能拒绝原假设,表明可以认为残差是正态分布的
【练习6-2】某学校对大一到大四的学生身高进行调查,分别在各系取男生和女生各8
人,调查结果如表6-4所示(lx6_2.xls)所示。年级和性别之间无交互作用,试在0.01的显著水平下判断:
(1) 不同年级的学生平均身高是否有显著差异;
(2) 男生和女生的平均身高是否有显著差异.
表6-4 学生身高数据
年级性别身高
大一男生175 169 173 182 165 172 175 176 女生165 164 160 167 158 172 162 165
大二男生168 175 179 185 169 172 174 176 女生163 156 162 173 180 163 168 164
大三男生172 183 172 170 169 167 173 168 女生162 165 158 156 163 170 162 166
大四男生182 175 168 173 175 172 168 180 女生156 158 165 164 168 173 167 162
(1)
结果中显示了不同年纪的盒形图。可以看出,大三、大四和大一标准差的差异不显著(菱形的高度差异不大),四者的均值间有一定的差异,但此差异是否显著则需进一步的方差分析。
拟合模型的一般信息
列名型变量信息,即grade为列名型的,有4个水平,
提供参数信息,并且约定,P_2、P_3、P_4、P_5分别为大二、大三、大四、大一的标识变量(也称哑变量)。
给出响应变量均值关于自变量不同水平的模型方程, 其中,标识变量取值:
,
其他,大二
,⎩⎨⎧==01P_2grade ,
其他,大三
,⎩⎨⎧==01P_3grade ,
其他,大四
,⎩
⎨⎧==01P_4grade 根据标识变量的取值,容易求出各年纪的平均身高:
⎪
⎪⎩⎪
⎪⎨⎧
==+=+==大四
大三大二大一的均值grade grade grade grade V 0.3750
168.7501.5000-168.7506875
.1750.168750.168
给出模型拟合的汇总信息,其中:
(1) 响应变量grade 的均值 = 168.8906; (2) 根均方误差= 7.0400;
(3) 判定系数R 2 = 0.0270,较小。其值越大,说明自变量的信息对说明因变量信息的贡献越大,即分类变量取不同的值对因变量的影响越显著。