实验 10 双因素方差分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验10 双因素方差分析
双因素方差分析是对样本观察值的差异进行分解,将两种因素下各组样本观察值之间可能存在的系统误差加以比较,据此推断总体之间是否存在显著性差异,根据两因素是否相互影响,双因素分析分为不存在交互作用的双因素方差分析和存在交互作用的双因素方差分析。
10.1 实验目的
掌握使用SAS进行双因素方差分析的方法。
10.2 实验内容
一、用INSIGHT作双因素方差分析
二、用“分析家”作双因素方差分析
三、用glm过程作双因素方差分析
10.3 实验指导
一、用INSIGHT作双因素方差分析
【实验10-1】工厂订单的多少直接反映了工厂生产的产品的畅销程度,因此工厂订单数目的增减是经营者所关心的。经营者为了研究产品的外形设计及销售地区对月订单数目的影响,记录了一个月中不同外形设计的该类产品在不同地区的订单数据如表10-1(sy10_1.xls)所示。试用双因子方差分析检验该产品的外形设计与销售地区是否对订单的数量有所影响。
表10-1 不同外形设计的产品在不同地区的订单数据
销售地区设计1 设计2 设计3
地区1 700 450 560 地区2 597 357 420 地区3 697 552 720 地区4 543 302 515
该问题即检验如下假设:
H0A:不同的设计对订单数量无影响,H1A:不同的设计对订单数量有显著影响
H0B:不同地区对订单数量无影响,H1B:不同地区对订单数量有显著影响
具体步骤如下:
1. 生成数据集
将表10-1在Excel 中整理后导入成如图10-1左所示结构的数据集,存放在Mylib.sy10_1中,其中变量a 、b 、y 分别表示销售地区、外形设计、销售量。
图10-1 数据集mylib.sy10_1与分析变量的选择 2. 方差分析
在INSIGHT 模块中打开数据集Mylib.sy10_1。
选择菜单“Analyze (分析)”→“Fit (拟合)”,在打开的“Fit(X Y)”对话框中选择数值型变量作因变量,分类型变量作自变量:选择变量y ,单击“Y ”按钮,选择变量a 和b ,单击“X ”按钮,分别将变量移到列表框中,如图10-1右所示。
单击“OK ”按钮,得到分析结果。
3. 结果分析
结果中表的含义与单因素方差分析相应的表的含义是类似的:
(1) 第一张表提供了模型的一般信息;第二张表列举了作为分类变量的a 和b 的水平的信息;第三张参数信息表给出了标识变量P_i 的定义。
图10-2 多因素方差分析第1、2、3张表 其中,标识变量取值:
,其他类似。,其他,设计,,其他类似;,其他,地区,""⎩
⎨⎧==⎩⎨⎧==01b 1P_601a 1P_2
(2) 第四张表给出了方差分析模型,利用参数信息表中标识变量P_i 的定义可以推算出在各个因素不同水平下变量y 均值的信息:
⎪⎪⎪⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎪⎪⎪⎨⎧======+==+==+==++==+==+==++==+==+==++=3
,4472.66672,4138.5
-472.66671,45.80472.66673,3203
472.66672,3138.5-203472.66671,35
.80203472.66673,26667.4472.66672,2138.5-6667.4472.66671,25
.806667.4472.66673,1116.6667472.66672,1138.5-116.6667472.66671,15.80116.6667472.6667y 设计地区设计地区设计地区设计地区设计地区设计地区设计地区设计地区设计地区设计地区设计地区设计地区的均值b a b a b a b a b a b a b a b a b a b a b a b a (3) 第五张拟合汇总表中给出变量y 的均值为534.4167,判定系数R 2为0.9220等,如图10-3。
图10-3 多因素方差分析第4、5张表
(4) 在第六张方差分析表中,检验模型显著性的F 统计量为14.19,相应的p 值小于0.05 = α,所以拒绝a 和b 对分析变量y 无显著影响的假设,即模型是显著的。
在模型显著的情况下常需要进一步
分析两个因素是否都有显著影响或者只
有一个因素是显著的,这时就需要用到第
七张表提供的信息。在III 型检验表中,进
一步将模型平方和分解为属于a 和b 的平方和。在这里两个因素的p 值都小于0.05,
说明了这两个因素对分析变量y 都有显著
影响,如图10-4。
图10-4 多因素方差分析第6、7张表 (5) 第八张是模型的参数估计表(图10-5),表中给出了对各因素不同水平下的参数之差的估计值和检验结果。
图10-5 多因素方差分析第8张表
结果表明,除a 因素中地区2与地区4的均值无显著差异,b 因素中设计1与设计3的
均值无显著差异外,其余两个因素的各水平下的均值都有显著差异。
(6) 考察模型假定:在显示窗的底部有一个残差和预测值的散点
图(如图10-6所示),可以像单因素分析一样考察残差分布的正态性
假定。
图10-6 残差和预测值的散点图 二、用“分析家”作双因素方差分析
【实验10-2】北京市房地产开发商想要了解本市商品房各类房型
及户型在各地区的销售情况,搜集了房屋的销售量数据,如表10-2
(sy10_2.xls )所示。试用有交互作用的双因子方差分析检验地区与房
型对房屋销售是否存在交互作用。
表10-2 各种房型的销售套数
三室两厅 两室两厅 复式房型 其他 1月份
652 521 67 486 朝阳区 2月份
711 548 59 338 1月份
481 521 50 391 海淀区 2月份
509 425 55 348 1月份
397 561 28 147 大兴区 2月份
314 570 24 184 1月份
157 138 8 96 通州区 2月份
164 194 5 57 1月份
217 449 5 147 其他 2月份 145 492 8 108
1. 生成数据集
将表10-2在Excel 中整理后导入成如图10-7左所示结构的数据集,存放在Mylib.sy10_2中,其中a 、b 和sl 分别表示地区、户型和销售量。
在“分析家”中打开数据集Mylib.sy10_2。
2. 方差分析
(1) 选择菜单“Statistics (统计)”→“ANOV A (方差分析)”→“Factorial ANOV A (因素方差分析)”,打开“Factorial ANOV A ”对话框。
(2) 选中变量A 、B ,单击“Independent (自变量)”按钮,将其移到“Independent ”框中;选中变量SL ,单击按钮“Dependent (因变量)”,将其移到“Dependent ”框中,如图10-7右所示。