单因素方差分析(详细版) ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 以下将说明如何在SPSS中利用箱线图(Boxplots)检查是否存在异常值,以及存在异常值时的 几种处理方法。
ppt课件
6
利用箱线图(Boxplots)检查是否存在异常值,以及存在异常值时的几种处理方法
(1)在主菜单点击Analyze > Descriptive Statistics > Explore...:
研究者想知道,CWWS得分的高低是否取决于体力活 动的时间,即coping_stress变量的平均得分是否随着 group变量的不同而不同(部分数据如右图)
ppt课件
2
2、对问题的分析
研究者想分析不同group间的coping_stress得分差异,可以采用单因素方差分析。 单因素方差分析适用于2种类型的研究设计: 1)判断3个及以上独立的组间均数是否存在差异; 2)判断前后变化的差值是否存在差异。
本例数据箱线图无圆点或星号,因此无异常值。
假如数据中存在异常值和极端异常值,其箱线图 如右:
箱线图是一种比较简单和流行的异常值检验方法, 当然同样存在一些更为复杂的方法,这里不过多 介绍。
ppt课件
11
如何处理数据中存在的异常值
导致数据中存在异常值的原因有3种: (1) 数据录入错误:首先应该考虑异常值是否由于数据录入错误所致。如果是,用正确值进行替换并重新进行检验; (2) 测量误差:如果不是由于数据录入错误,接下来考虑是否因为测量误差导致(如仪器故障或超过量程); (3) 真实的异常值:如果以上两种原因都不是,那最有可能是一种真实的异常数据。这种异常值不好处理,但也没有理由将其当作无效值看 待。目前它的处理方法比较有争议,尚没有一种特别推荐的方法。 需要注意的是,如果存在多个异常值,应先把最极端的异常值去掉后,重新检查异常值情况。这是因为有时最极端异常值去掉后,其他异 常值可能会回归正常。
异常值的处理方法分为2种: (1) 保留异常值: 1)采用非参数Kruskal-Wallis H检验; 2)用非最极端的值来代替极端异常值(如用第二大的值代替); 3)因变量转换成其他形式; 4)将异常值纳入分析,并坚信其对结果不会产生实质影响。 (2) 剔除异常值: 直接删除异常值很简单,但却是没有办法的办法。当我们需要删掉异常值时,应报告异常值大小及其对结果的影响,最好分别报告删除异常值前后的 结果。而且,应该考虑有异常值的个体是否符合研究的纳入标准。如pp果t课其件不属于合格的研究对象,应将其剔除,否则会影响结果的推论。 12
使用单因素方差分析时,需要考虑6个假设。 假设1:因变量为连续变量; 假设2:有一个包含2个及以上分类、且组别间相互独立的自变量; 假设3:每组间和组内的观测值相互独立; 假设4:每组内没有明显异常值; 假设5:每组内因变量符合正态分布; 假设6:进行方差齐性检验,观察每组的方差是否相等。
那么,进行单因素方差分析时,如何考虑和处理这6项假设呢?
假设5:每组内因变量符合正态分布
正态性检验有很多方法,这里只介绍最常用的一种:Shapiro-Wilk正态性检验(其他还有偏度和峰度值、 直方图等)。在假设4的判断中,我们在Explore: Plots对话框中勾选了Normality plots with tests,输出结果 中会给出Shapiro-Wilk检验的结果。 如果样本量较小(<50),并且对正态Q-Q图或其他图形方法的结果诠释不够有把握,推荐采用ShapiroWilk检验。每组自变量都会有一个Shapiro-Wilk正态性检验结果。本例结果见如下Tests of Normality表格。
单因素方差分析
(One-Way ANOVA)
ppt课件
1
1、问题与数据
有研究者认为,体力活动较多的人能更好地应对职场 的压力。为了验证这一理论,某研究招募了31名受试 者,测量了他们每周进行体力活动的时间(分钟),以 及应对职场压力的能力。
根据体力活动的时间数,受试者被分为4组:久坐组、 低、中、高体力活动组,变量名为group。利用Likert 量表调查的总得分来评估应对职场压力的能力,分数 越高,表明应对职场压力的能力越强,变量名为 coping_stress。应对职场压力的能力,可以简写为 CWWS得分。
ppt课件
3源自文库
3、思维导图
ppt课件
4
ppt课件
5
4、对假设的判断
假设1:因变量为连续变量; 假设2:有一个包含2个及以上分类、且组别间相独立的自变量; 假设3:每组间及组内的观测值相互独立。 • 和研究设计有关,需根据实际情况判断。
假设4:每组内没有明显异常值。
• 如果某个组别中的某些因变量取值和其他值相比特别大或者特别小,则称之为异常值。异常值 会影响该组的均数和标准差,因此会对最终的统计检验结果产生很大的负面影响。对于小样本 研究,异常值的影响尤其显著,必须检查每组内是否存在明显异常值。
出现右图Explore对话框:
ppt课件
7
(2)把因变量coping_stress送入Dependent List框中, 把自变量group送入Factor List框中:
(3)点击Plots...,出现Explore: Plots对话框:
ppt课件
8
(4)在Boxplots模块内保留系统默认选项Factor levels
together,在Descriptive模块内取消选择Stem-and-leaf, 在下方勾选Normality plots with tests(执行 Shapiro-
Wilk's检验):
点击Continue,返回Explore对话框。 (5)在Display模块内点击Plots:
如果使用偏度和峰度(skewness and kurtosis)进行正态性判断, 则保留Display模块内的默认选项Both或者选择Statistics。
(6) 点击ppOt课K件,输出结果。
9
根据如下输出的箱线图,判断每个组别内是否存在异常值。
ppt课件
10
SPSS中将距离箱子边缘超过1.5倍箱身长度的数 据点定义为异常值,以圆点表示;
将距离箱子边缘超过3倍箱身长度的数据点定义 为极端值(极端异常值),以星号(*)表示。
为容易识别,在Data View窗口异常值均用其所 在行数标出。
ppt课件
6
利用箱线图(Boxplots)检查是否存在异常值,以及存在异常值时的几种处理方法
(1)在主菜单点击Analyze > Descriptive Statistics > Explore...:
研究者想知道,CWWS得分的高低是否取决于体力活 动的时间,即coping_stress变量的平均得分是否随着 group变量的不同而不同(部分数据如右图)
ppt课件
2
2、对问题的分析
研究者想分析不同group间的coping_stress得分差异,可以采用单因素方差分析。 单因素方差分析适用于2种类型的研究设计: 1)判断3个及以上独立的组间均数是否存在差异; 2)判断前后变化的差值是否存在差异。
本例数据箱线图无圆点或星号,因此无异常值。
假如数据中存在异常值和极端异常值,其箱线图 如右:
箱线图是一种比较简单和流行的异常值检验方法, 当然同样存在一些更为复杂的方法,这里不过多 介绍。
ppt课件
11
如何处理数据中存在的异常值
导致数据中存在异常值的原因有3种: (1) 数据录入错误:首先应该考虑异常值是否由于数据录入错误所致。如果是,用正确值进行替换并重新进行检验; (2) 测量误差:如果不是由于数据录入错误,接下来考虑是否因为测量误差导致(如仪器故障或超过量程); (3) 真实的异常值:如果以上两种原因都不是,那最有可能是一种真实的异常数据。这种异常值不好处理,但也没有理由将其当作无效值看 待。目前它的处理方法比较有争议,尚没有一种特别推荐的方法。 需要注意的是,如果存在多个异常值,应先把最极端的异常值去掉后,重新检查异常值情况。这是因为有时最极端异常值去掉后,其他异 常值可能会回归正常。
异常值的处理方法分为2种: (1) 保留异常值: 1)采用非参数Kruskal-Wallis H检验; 2)用非最极端的值来代替极端异常值(如用第二大的值代替); 3)因变量转换成其他形式; 4)将异常值纳入分析,并坚信其对结果不会产生实质影响。 (2) 剔除异常值: 直接删除异常值很简单,但却是没有办法的办法。当我们需要删掉异常值时,应报告异常值大小及其对结果的影响,最好分别报告删除异常值前后的 结果。而且,应该考虑有异常值的个体是否符合研究的纳入标准。如pp果t课其件不属于合格的研究对象,应将其剔除,否则会影响结果的推论。 12
使用单因素方差分析时,需要考虑6个假设。 假设1:因变量为连续变量; 假设2:有一个包含2个及以上分类、且组别间相互独立的自变量; 假设3:每组间和组内的观测值相互独立; 假设4:每组内没有明显异常值; 假设5:每组内因变量符合正态分布; 假设6:进行方差齐性检验,观察每组的方差是否相等。
那么,进行单因素方差分析时,如何考虑和处理这6项假设呢?
假设5:每组内因变量符合正态分布
正态性检验有很多方法,这里只介绍最常用的一种:Shapiro-Wilk正态性检验(其他还有偏度和峰度值、 直方图等)。在假设4的判断中,我们在Explore: Plots对话框中勾选了Normality plots with tests,输出结果 中会给出Shapiro-Wilk检验的结果。 如果样本量较小(<50),并且对正态Q-Q图或其他图形方法的结果诠释不够有把握,推荐采用ShapiroWilk检验。每组自变量都会有一个Shapiro-Wilk正态性检验结果。本例结果见如下Tests of Normality表格。
单因素方差分析
(One-Way ANOVA)
ppt课件
1
1、问题与数据
有研究者认为,体力活动较多的人能更好地应对职场 的压力。为了验证这一理论,某研究招募了31名受试 者,测量了他们每周进行体力活动的时间(分钟),以 及应对职场压力的能力。
根据体力活动的时间数,受试者被分为4组:久坐组、 低、中、高体力活动组,变量名为group。利用Likert 量表调查的总得分来评估应对职场压力的能力,分数 越高,表明应对职场压力的能力越强,变量名为 coping_stress。应对职场压力的能力,可以简写为 CWWS得分。
ppt课件
3源自文库
3、思维导图
ppt课件
4
ppt课件
5
4、对假设的判断
假设1:因变量为连续变量; 假设2:有一个包含2个及以上分类、且组别间相独立的自变量; 假设3:每组间及组内的观测值相互独立。 • 和研究设计有关,需根据实际情况判断。
假设4:每组内没有明显异常值。
• 如果某个组别中的某些因变量取值和其他值相比特别大或者特别小,则称之为异常值。异常值 会影响该组的均数和标准差,因此会对最终的统计检验结果产生很大的负面影响。对于小样本 研究,异常值的影响尤其显著,必须检查每组内是否存在明显异常值。
出现右图Explore对话框:
ppt课件
7
(2)把因变量coping_stress送入Dependent List框中, 把自变量group送入Factor List框中:
(3)点击Plots...,出现Explore: Plots对话框:
ppt课件
8
(4)在Boxplots模块内保留系统默认选项Factor levels
together,在Descriptive模块内取消选择Stem-and-leaf, 在下方勾选Normality plots with tests(执行 Shapiro-
Wilk's检验):
点击Continue,返回Explore对话框。 (5)在Display模块内点击Plots:
如果使用偏度和峰度(skewness and kurtosis)进行正态性判断, 则保留Display模块内的默认选项Both或者选择Statistics。
(6) 点击ppOt课K件,输出结果。
9
根据如下输出的箱线图,判断每个组别内是否存在异常值。
ppt课件
10
SPSS中将距离箱子边缘超过1.5倍箱身长度的数 据点定义为异常值,以圆点表示;
将距离箱子边缘超过3倍箱身长度的数据点定义 为极端值(极端异常值),以星号(*)表示。
为容易识别,在Data View窗口异常值均用其所 在行数标出。