重复测量数据方差分析在SPSS16_0软件中的实现
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计与决策2011年第1期(总第325期)
组别1
…
G
受试对象
12
…
N
…
12
…
N
1
23…P
重复观测次数
x ijk
表1重复测量数据基本格式
基金项目:湖南省教育厅教研教改资助项目(湘教通2010243号),湖南商学院教研教改项目(校教字201025号)作者简介:李
灿(1972-),女,湖南益阳人,博士研究生,副教授,研究方向:多元统计分析、市场调查。
重复测量数据方差分析在SPSS16.0软件中的实现
李
灿1,2
(1.湖南商学院信息学院统计系,长沙410205;2.中南财经政法大学信息学院统计系,武汉430060)
摘要:文章首先对重复测量数据的格式、特点与方差分析的前提条件及基本原理进行了介绍;
然后利用市场调查中的一个案例,详细介绍了利用SPSS16.0软件对重复测量数据进行方差分析的具体过程,以及对结果的解释和运用。
关键词:重复测量;重复测量数据;方差分析;SPSS16.0中图分类号:C81
文献标识码:A
文章编号:1002-6487(2011)01-0034-03
重复测量(Repeated Measure)是指对同一观察对象的某项观测指标在不同时间点上进行多次测量,用于分析观察指标在不同时间上的变化规律。
通过重复测量,可以对获得同一观察对象的某项观测指标进行多次测量的数据,即为重复测量数据。
如经济研究领域中的市场动态的研究;心理研究中观察不同时间段个体的心理调适能力;教育研究中观察不同学期学生成绩的变化等等。
由于同一受试对象在不同时点的观测值之间往往彼此不独立,存在某种程度的相关,因此对重复测量数据如果采取普通的方差分析,不能满足普通的方差分析方法所要求的独立、正态、等方差的前提条件,使得其分析方法有别于一般的统计分析方法。
在实际工作中,重复测量数据常被误作以下情形处理:一种情形是用配伍组设计资料的方差分析(two-way ANOVA )来处理,这样会导致扩大第一类错误的严重后果;另一种情形是只做单独效应分析,其后果是损失了主效应和交互效应分析的宝贵信息。
这样不仅损失了重复测量数据所蕴含的信息,还容易得出不切实际的结论。
重复测量设计并不是单纯的设计方法,重复测量可能在实验设计、临床试验设计以及调查设计出现,此时千万不能采取传统的统计分析方法,即使简单的设计类型类似于随机区组设计不能采用随机区组设计的方差分析。
本文通过实例分析,就市场调查分析研究中重复测量数据的方差分析方法进行探讨,并详细解读在SPSS16.0软件中的实现方案。
1重复测量数据的格式及其特点
重复测量数据来源于同一受试对象的某一观测值的多
次重复测量,若有分为G 个处理组,每个组有N 个观测个体,X 为观测指标,P 为重复测量次数,则其重复测量数据的
基本格式如表1所示。
重复测量数据具有以下几个特点:第一,它是单因素或平行设计的扩展。
第二,检测值有随重复测量时间(或部位等)变化的趋势。
第三,同组观察单位不同时点测定值间相关性存在,相邻时点越近,数据间相关性越大。
第四,试验结果必须按时间顺序排列。
2方差分析的前提条件及基本原理
为克服重复测量数据的自相关性,Huynh 和Feldt 等统
计学家1970年提出需满足Huynh-Feldt 条件(H-F 条件),即方差齐性条件与球对称条件。
若资料满足H-F 条件,可用重复测量设计资料的单变量方差分析方法来处理。
若不满足
H-F 条件,那么得到的F 检验统计量的值正偏,拒绝无效假
设的概率增大,即犯第一类错误的概率增大。
因此,在进行重复测量资料的方差分析前,应先对资料的协方差阵进行球形性检验。
若满足球形性要求,则直接进行方差分析;不满足球形性要求时,可以采用调整自由度的方法,需对与时间有关的F 统计量分子、分母的自由度进行校正,以减少犯I 类错误的概率,或直接进行多变量方差分析。
对重复测量数据的方差分析需考虑两个因素的影响,一个因素是处理分组,可通过施加干预和随机分组来实现;另一个因素是测量时间,由研究者根据专业知识和要求确定。
可借助多水平统计模型中的方差成分模型,把变异分解为处理组、测量时间、处理组与测量时间的交互作用、受试对象之
34
统计与决策2011年第1期(总第325期)
市场编号
11
…
1010网点
12
…
903904市场规模
33
…
11市场规模
711
…
1113方案
32
…
31第1周销售量70.6368.42
…
48.3345.09第2周销售量56.2856.74
…
50.5054.07第3周销售量70.9860.04
…
49.4858.04第4周销售量
69.9163.64
…
44.3546.82
表3数据重构后的数据库格式Within Subjects
Effect
week Mauchly's W 0.889
Approx.
Chi-Square 12.231df
5Sig.
0.032
Greenhouse -Geisser 0.934
Huynh -Feldt 1.000Lower -bound 0.333
Epsilona 表4Mauchly 球形检验结果
间的随机误差以及重复测量误差等5个部分。
重复测量数据的方差分析是对同一因变量进行重复测度的一种试验设计技术。
重复测量数据的方差分析可以是在同一条件下进行的重复测度,目的在于研究各种处理之间是否存在显著性差异,研究受试者之间是否存在显著性差异的同时,研究受试者之间的差异、受试者几次测量之间的差异以及受试者与各种处理间的交互效应。
例如,研究一种教学方法对学生学习成绩的影响,在实验过程中,对被试者进行前测、后测,这种实验是在同一条件下进行的重复测度。
重复测量数据方差分析也可以是在不同条件下进行的重复测度,目的在于研究各种处理之间是否存在显著性差异的同时,研究形成重复测度条件间的差异以及这些条件与处理间的交互效应。
例如,研究被试者对3种视觉刺激的反应,在实验过程中,每个被试者选用一种刺激方法重复测试3次,这种实验就是在不同条件下进行的重复测度。
3
重复测量数据方差分析的实例与SPSS
软件的实现3.1
实例描述与数据
经营快餐的一家连锁店计划改进某一营业品种,提出了
3种方案,并随机选择了若干个市场,每个市场有多个网点。
要求在每个市场只能销售其中的一种新产品,之后观察记录每个网点每周的销售量,连续观察4周。
其他因素还包括市场规模(mktsize )、营业年限(ageloc ),数据如表2所示。
3.2数据重构
进行重复测量数据方差分析的数据结构与其他方差分
析有所不同,它要求对被测试的若干次测验结果作为单一因变量出现在数据文件中。
因此对于表2的数据库通用格式的数据,在进行重复测量数据方差分析时,需要对数据进行重新整理,即数据重构,将数据转换成重复测量数据方差分析所要求的数据。
重构后的数据如表3所示。
在SPSS16.0软件中,可以轻松通过菜单实现从表2到表3的数据重构。
实现步骤如下:在表2的数据文件下单击
Data 菜单→Restructure …→在弹出的Restructure Data Wiz -ard 重组数据导向对话框中选择第二项Restructure selected cases into variables 将选定个案重组为变量→单击next 按
钮→把网点locid 选入Identifier Variable ,把网点locid 变量定义为数据库标示变量→把week 选入Index Variable ,把周次week 变量定义为重复测量标示变量→单击next 按钮→
Finish 按钮。
3.3
重复测量数据方差分析在SPSS 软件中的实现
重复测量数据方差分析的方法有2种:第一种为对一元
F 统计量进行校正,通过求出球对称系数ε(index of spheric -ity)以校正分子、分母的自由度,从而获得校正的概率。
第二
种为进行多元方差分析,如Hotelling T2检验、多元方差分析、轮廓分析(profile analysis)、拟合生长曲线模型和混合效应模型等。
SPSS 软件实现步骤如下:从主菜单选择Analysis →Gen -eral Linear Model 广义线性→Repeated Measures …,这时出
现Repeated Measures Define Factor (s)对话框→在Within-
Subject Factor Name 下把week 选择重复测量的变量名,同
时在Number of Levels 里输入4,表示重复测量的次数,单击
Add 按钮→在Measure Name 输入sales ,定义观察变量,单击Add 按钮→单击Define 按钮→进入Repeated Measures 主对
话框,将sales.1、sales.2、sales.3、sales.4均选入Within Sub -
ject Variable(week)栏→将分组因素(group)market id 和pro -motion 选入Between Subject Factor(s)栏,点开Model 选项
框,在Sum of squares 下拉菜单表里选择Type IV ,即IV 型平方和(本例中因市场与方案分层后,不同市场、不同方案下的网点数不相等,资料为不平衡数据,所以选择Type IV ,对于平衡数据则选择Type III )→单击Continue 按钮。
点开Plots 选项对话框,绘制交互效应轮廓图,时间因素
week 选入Horizontal Axis (横轴),分组因素promotion 选入Separate Lines(纵轴)→单击Add 按钮→单击Continue 按钮。
点开Option 选项对话框,在该对话框里对不同因素(分组因素或时间因素)进行一般的描述,对不同因素(包括时间因素及分组因素)各水平之间进行多重比较。
可以选择Esti -
mate of effect size 效应估计,显示组间和组内效应;选择SS -CP matrices ,显示平方和和各组间叉积阵;选择Homogeneity tests 等方差性检验→将week 选入Display Means for 框,Compare main effect ,选择LSD 法(软件还提供了多种方法)
进行多重比较,单击Continue 按钮→单击Continue 按钮→单击OK 按钮。
主要结果如表4所示。
表4结果为Mauchly 球形检验结果。
在Mauchly 球形检验结果当中,若P>0.05,说明满足球形假设,无需矫正,且一旦发生多元结果与一元结果冲突,应以一元为准;若P<0.05,
市场编号marketid 1111…
10
10市场规模
mktsize 3333
…
11网点
locid
1111
…
903903营业年限
ageloc 7777…
1111方案
promotion 3333
…
33周次
week
1234
…
24销售量
sales 70.6356.2870.9869.91
…
50.5049.48
表2
快餐连锁店重复测量数据35
Source
week
week* marketid
week* promotion
week* marketid* promotion
Error(week)Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Sphericity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Type IV
Sum of
Squares
163.341
163.341
163.341
163.341
703.984a
703.984a
703.984a
703.984a
134.762a
134.762a
134.762a
134.762a
1624.297
1624.297
1624.297
1624.297
9536.287
9536.287
9536.287
9536.287
df
3
2.802
3.000
1.000
27
25.221
27.000
9.000
6
5.605
6.000
2.000
48
44.838
48.000
16.000
315
294.248
315.000
105.000
Mean
Square
54.447
58.287
54.447
163.341
26.073
27.912
26.073
78.220
22.460
24.044
22.460
67.381
33.840
36.226
33.840
101.519
30.274
32.409
30.274
90.822
F
1.798
1.798
1.798
1.798
0.861
0.861
0.861
0.861
0.742
0.742
0.742
00.742
1.118
1.118
1.118
1.118
Sig.
0.147
0.151
0.147
0.183
0.668
0.661
0.668
0.562
0.616
0.607
0.616
0.479
0.285
0.290
0.285
0.349
Partial
Eta
Squared
0.017
0.017
0.017
0.017
0.069
0.069
0.069
0.069
0.014
0.014
0.014
0.014
0.146
0.146
0.146
0.146
表5重复测量单素分析结果
各周销量
sales.1:Units sold in thousands sales.2:Units sold in thousands sales.3:Units sold in thousands sales.4:Units sold in thousands
F
1.238
1.424
.893
1.025
df1
27
27
27
27
df2
105
105
105
105
Sig.
0.220
0.105
0.620
0.445
表6组间方差性检验结果
Type IV
Sum of Squares 888161.056 19721.223a 5622.897a 577.884
2607.022
df
1
9
2
16
105
Mean
Square
888161.056
2191.247
2811.448
36.118
24.829
F
35771.431
88.254
113.233
1.455
Sig.
0.000
0.000
0..000
0.131
Partial
Eta
Squared
0.997
0.883
0.683
0.181
Source
Intercept
marketid
promotion
marketid*
promotion
Error
表7组间效应检验结果
(I) Promotion
1
2
3
(J)
Promotion
2
3
1
3
1
2
Mean
Difference
(I-J)
9.2686*
2.0882*
-9.2686*
-7.1803*
-2.0882*
7.1803*
Std.
Error
.53241
.53790
.53241
.51962
.53790
.51962
Sig.
0.000
0.000
0.000
0.000
0.000
0.000
Lower
Bound
8.2129
1.0217
-10.3242
-8.2106
-3.1548
6.1500
Upper
Bound
10.3242
3.1548
-8.2129
-6.1500
-1.0217
8.2106
95%Confidence Interval
表8多重比较结果
则不满足球形假设,需用ε矫正,这时SPSS软件后面
的检验结果自动矫正。
表5为重复测量单素的分析结果。
从P值结果来看,无论是week的主效应还是其他交互效应都无统
计意义;Partial Eta Squared结果表示各项模型的贡
献很小。
表6为组间等方差性检验结果,从P值结果来看,从P值结果来看均满足等方差性。
表7是组间效应的检验结果。
结果显示:market id和promotion两个因素都具有统计学意义。
Partial
Eta Squared的结果显示market id和promotion对模
型的贡献达到了88.3%和68.3%。
两者的交互作用无
统计学意义,应该将该效应从模型中去掉。
图1和图2的轮廓分析图是对重复测量数据边际均数的大致描述,通过轮廓图可以对相关效应在时
间上的变化趋势有一个直观的认识。
图1显示方案来
看,第一种方案是3种方案中的最佳方案,销售量是
3种方案中最大,并且随着时间推移销售增加;图2
显示的销售市场来看,第一个市场是10个市场中业绩最好的,
可以推荐好的营销模式。
表8为多重比较的结果,结果显示三种方案销售量有所
不同。
从均数绝对值大小可以看出,第一种方案最好,与轮廓
分析结果一致。
4相关说明
重复测量是指对同一观察对象的同一观察指标在不同
时间或环境下进行的多次测量,用于分析观察指标的变化趋
势及有关的影响因素。
本文利用市场调查中的一个案例,详
细介绍了利用SPSS16.0对重复测量数据进行方差分析的具
体过程,以及对结果的解释和运用。
SPSS(Statistical Product
and Service Solutions)统计软件,具有多种实用的统计分析
方法,界面美观,易于学习和操作,且各个版本的通用性很
强,是非统计专业人员应用最多的统计软件。
SPSS软件由于
其方便的菜单式操作已受到众多科研人员的青睐。
希望本研
究能为采用重复测量设计的科研工作者们进行资料分析提
供借鉴和参考。
参考文献:
[1]陈平雁.定量数据重复测量的方差分析[J].中华创伤骨科杂志,
2003,5(1).
[2]宇传华.SPSS与统计分析[M]北京:电子工业出版社,2007.
[3]张文彤.SPSS11.0统计分析教程(高级篇)[M].北京:北京希望电子出
版社,2002.
[4]余松林,向惠云.重复测量资料分析方法与SAS程序[M].北京:科学
出版社,2004.
(责任编辑/易永生)36
统计与决策2011年第1期(总第325期)。