SPSS第10章 方差分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•为便于理解,我们可以简化模型: •此时检验的含义变成了检验各组均值是否相同。 •因此原假设设定为:;而备择假设为:不全等。 •2、构造检验F统计量 •令为第i种水平的样本均值,为全部观察值的总均值。
Fra Baidu bibliotek
10.2单因素方差分析
•One-Way ANOVA过程用于进行两组及多组样本均数的比较,即成组设计 的方差分析,属于单因变量单因素方差分析,即只能分析一个因素对一 个因变量的影响。如果做了相应选择,还可进行各组之间差异的两两比 较,甚至可在各组间精确设定哪几组与哪几组进行比较。
•10.2.1 数据结构
•5)均衡(Balance):如果一个试验设计中任一因素各水平在所有 单元格中出现的次数相同,且每个单元格内的元素数目相同,则称 该试验是为均衡,否则,就被称为不均衡。不均衡试验中获得的数 据在分析时较为复杂。 •6)固定因素(Fixed Factor):指某个因素所有可能的水平都在样本 中出现了,从样本分析可以得到该因素所有水平的情况,不需要进 行推论。例如分析某种药物对病毒细胞数量的作用,按是否服药分 成2组,则药物这一因素所有可能的水平就只有2种,且在样本中都 出现了,那么药物因素就是固定因素。 •7)随机因素(Random Factor):指某个因素所有可能的水平在样 本中没有全部都出现,或不可能全部出现。例如上例中从得该病的 病人中随机抽取了40名病人,这40名病人只是所有病人的代表,在 分析时需要用这40个样本外推所有的该类病人,这时就不可避免存 在误差(随机效应),需要估计该误差的大小,则因素称为随机因 素。 •如果将随机因素当成固定因素来分析,则可能得出错误的分析结果, 但当每个单元格只有一个元素时,随机效应无法被估计出来,此时 两种做法的结果一样。 •8)交互作用(Interaction):如果一个因素的效应大小在另一个因 素不同水平中明显不同,则称为两因素间存在交互作用。当因素间 存在交互作用时,单纯研究某个因素的作用意义不大。
•在单因素方差分析中,若因素A共有r个水平,对均衡试验而言,每个水 平的样本容量为k,则共有k*r个观察值,如表10.1所示。对不均衡试验, 各水平中的样本容量可以是不同的。
10.2.2 分析步骤
•1、单因素方差模型与建立假设 •标准的单因素方差分析模型如下: •其中表示第i组的第j个观察值;μ表示总体的平均水平; 表示影响因素在i水平下对应变量的附加效应,所有之 和应当为0;为一个服从正态分布的随机变量,代表 随机误差。一般情况下,假设检验实际上就是检验各 个是否均为0,如都为0,即各组总体均数都相等,则 称为服从正态分布的一个变量。
10.1.2 常用术语
•1)因素(Factor):因素是我们需要检验的可能对因变量有影 响的变量,一般为分类或顺序变量。例如我们研究不同的包装 颜色对产品销售的影响时,销售量是因变量,包装颜色就是因 素。 •2)水平(Level):也称处理,是指因素的不同取值等级、分 类。有些水平的划分是自然形成的,如上例中颜色分成红、黄、 蓝等;而大部分水平的划分是人为的,按研究的目的来划分的, 如研究收入水平对某种商品消费的影响时,把收入分成高、中、 低3个层次。 •3)单元(Cell):各水平之间的组合称为单元,例如研究性别 (男、女)和收入(高、中、低)对消费的影响,则水平之间 共有6种可能的组合,即单元,分别为(男,高)、(男, 中)、(男,低)、(女,高)、(女,中)、(女,低)。 •4)元素(Element):元素指用于测量因变量的最小单位。一 个单元里可以有多个元素,也可以只有一个元素,甚至没有。 上例中如果测量了10位男性、收入高的消费情况,则在(男, 高)这一单元中有10个元素。
第10章 方差分析
10.1 方差分析概述 10.2单因素方差分析 10.3 单因变量多因素方差分析 10.4 协方差分析 10.5 多因变量多因素方差分析 10.6 重复测量方差分析 10.7 方差成分分析
10.1方差分析概述
•方差分析(analysis of variance) 基本思想是将观测值总 变异分解成因素间的变异和因素内部的随机变异,如 果因素间的变异显著大于因素内的随机变异,则可以 认为因素对观测值有影响。
10.1.3基本假定
• 在方差分析中通常要有以下假定:首先是各样本的独立性,只有 相互独立的随机样本,才能保证变异可分解;其次要求所有观察 值都是从正态总体中抽取的;第三要求各组样本的方差相等。在 以上条件中,独立性的要求最为严格,但一般情况都能保证,另 外两个条件,一般只要不是分布太偏或方差明显不相等,可以适 当放宽标准。
•10.1.1 方差分析过程 •SPSS提供的方差分析包含了丰富的内容,主要有: •1)One-Way ANOVA过程:单因素单因变量方差分析, 类似于前面讲过的均值检验,但分组k超过两个,均值 检验就需k(k-1)/2次类似的检验,而One-Way ANOVA过 程只需一次检验过程,检验效率大大提高。
•2)General Linear Model(简称 GLM)过程可完成简 单的多因素方差分析和协方差分析,不但可以分析各 因素的主效应,还可以分析各因素间的交互效应。该 过程允许指定最高阶次的交互效应,建立包括所有效 应的模型。
GLM过程包含以下过程:
•Univariate过程:单因变量多因素方差分析,当因变 量只有一个,因素有一个或多个时,可用这一过程来 完成方差分析。 •Multivariate过程:多因变量多因素方差分析过程,当 因变量有多个,因素有一个或多个时,可用这一过程 进行方差分析。 •Repeated Measures过程:当观察值是重复测量的数据 时,虽然前两个菜单也能分析出结果,但很多情况下 是不准确的,应该用Repeated Measures这过程。 •Variance Compnents调用 GLM过程进行方差估计分析。 通过计算方差估计值,分析如何减小方差。这部分内 容需要的专业知识比较多,本书中不进行介绍。
Fra Baidu bibliotek
10.2单因素方差分析
•One-Way ANOVA过程用于进行两组及多组样本均数的比较,即成组设计 的方差分析,属于单因变量单因素方差分析,即只能分析一个因素对一 个因变量的影响。如果做了相应选择,还可进行各组之间差异的两两比 较,甚至可在各组间精确设定哪几组与哪几组进行比较。
•10.2.1 数据结构
•5)均衡(Balance):如果一个试验设计中任一因素各水平在所有 单元格中出现的次数相同,且每个单元格内的元素数目相同,则称 该试验是为均衡,否则,就被称为不均衡。不均衡试验中获得的数 据在分析时较为复杂。 •6)固定因素(Fixed Factor):指某个因素所有可能的水平都在样本 中出现了,从样本分析可以得到该因素所有水平的情况,不需要进 行推论。例如分析某种药物对病毒细胞数量的作用,按是否服药分 成2组,则药物这一因素所有可能的水平就只有2种,且在样本中都 出现了,那么药物因素就是固定因素。 •7)随机因素(Random Factor):指某个因素所有可能的水平在样 本中没有全部都出现,或不可能全部出现。例如上例中从得该病的 病人中随机抽取了40名病人,这40名病人只是所有病人的代表,在 分析时需要用这40个样本外推所有的该类病人,这时就不可避免存 在误差(随机效应),需要估计该误差的大小,则因素称为随机因 素。 •如果将随机因素当成固定因素来分析,则可能得出错误的分析结果, 但当每个单元格只有一个元素时,随机效应无法被估计出来,此时 两种做法的结果一样。 •8)交互作用(Interaction):如果一个因素的效应大小在另一个因 素不同水平中明显不同,则称为两因素间存在交互作用。当因素间 存在交互作用时,单纯研究某个因素的作用意义不大。
•在单因素方差分析中,若因素A共有r个水平,对均衡试验而言,每个水 平的样本容量为k,则共有k*r个观察值,如表10.1所示。对不均衡试验, 各水平中的样本容量可以是不同的。
10.2.2 分析步骤
•1、单因素方差模型与建立假设 •标准的单因素方差分析模型如下: •其中表示第i组的第j个观察值;μ表示总体的平均水平; 表示影响因素在i水平下对应变量的附加效应,所有之 和应当为0;为一个服从正态分布的随机变量,代表 随机误差。一般情况下,假设检验实际上就是检验各 个是否均为0,如都为0,即各组总体均数都相等,则 称为服从正态分布的一个变量。
10.1.2 常用术语
•1)因素(Factor):因素是我们需要检验的可能对因变量有影 响的变量,一般为分类或顺序变量。例如我们研究不同的包装 颜色对产品销售的影响时,销售量是因变量,包装颜色就是因 素。 •2)水平(Level):也称处理,是指因素的不同取值等级、分 类。有些水平的划分是自然形成的,如上例中颜色分成红、黄、 蓝等;而大部分水平的划分是人为的,按研究的目的来划分的, 如研究收入水平对某种商品消费的影响时,把收入分成高、中、 低3个层次。 •3)单元(Cell):各水平之间的组合称为单元,例如研究性别 (男、女)和收入(高、中、低)对消费的影响,则水平之间 共有6种可能的组合,即单元,分别为(男,高)、(男, 中)、(男,低)、(女,高)、(女,中)、(女,低)。 •4)元素(Element):元素指用于测量因变量的最小单位。一 个单元里可以有多个元素,也可以只有一个元素,甚至没有。 上例中如果测量了10位男性、收入高的消费情况,则在(男, 高)这一单元中有10个元素。
第10章 方差分析
10.1 方差分析概述 10.2单因素方差分析 10.3 单因变量多因素方差分析 10.4 协方差分析 10.5 多因变量多因素方差分析 10.6 重复测量方差分析 10.7 方差成分分析
10.1方差分析概述
•方差分析(analysis of variance) 基本思想是将观测值总 变异分解成因素间的变异和因素内部的随机变异,如 果因素间的变异显著大于因素内的随机变异,则可以 认为因素对观测值有影响。
10.1.3基本假定
• 在方差分析中通常要有以下假定:首先是各样本的独立性,只有 相互独立的随机样本,才能保证变异可分解;其次要求所有观察 值都是从正态总体中抽取的;第三要求各组样本的方差相等。在 以上条件中,独立性的要求最为严格,但一般情况都能保证,另 外两个条件,一般只要不是分布太偏或方差明显不相等,可以适 当放宽标准。
•10.1.1 方差分析过程 •SPSS提供的方差分析包含了丰富的内容,主要有: •1)One-Way ANOVA过程:单因素单因变量方差分析, 类似于前面讲过的均值检验,但分组k超过两个,均值 检验就需k(k-1)/2次类似的检验,而One-Way ANOVA过 程只需一次检验过程,检验效率大大提高。
•2)General Linear Model(简称 GLM)过程可完成简 单的多因素方差分析和协方差分析,不但可以分析各 因素的主效应,还可以分析各因素间的交互效应。该 过程允许指定最高阶次的交互效应,建立包括所有效 应的模型。
GLM过程包含以下过程:
•Univariate过程:单因变量多因素方差分析,当因变 量只有一个,因素有一个或多个时,可用这一过程来 完成方差分析。 •Multivariate过程:多因变量多因素方差分析过程,当 因变量有多个,因素有一个或多个时,可用这一过程 进行方差分析。 •Repeated Measures过程:当观察值是重复测量的数据 时,虽然前两个菜单也能分析出结果,但很多情况下 是不准确的,应该用Repeated Measures这过程。 •Variance Compnents调用 GLM过程进行方差估计分析。 通过计算方差估计值,分析如何减小方差。这部分内 容需要的专业知识比较多,本书中不进行介绍。