SPSS统计分析第五章方差分析-82页文档
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
LSD(最小显著差异法):用 t检验完成各组均值间的配对 比较。对多重比较误差率不进行调整;
Bonferroni(修正最小显著差异法) :用 t检验完成各组均值 间的配对比较,但通过设置每个检验的误差率来控制整个误 差;
三、方差分析过程
SPSS提供的方差分析过程有:
One-way过程 (One-way ANOVA)
General Linear Model (简称GLM,一般线性模 型)过程
(一)One-way过程
One-way过程就是单因素简单方差分析过程, 它在Analyze菜单中的Compare Means过程 组中,用 One-way ANOVA菜单项调用,可 以进行单因素方差分析、均值多重比较和相 对比较。
1、单因素方差分析
单因素方差分析也称作一维(元)方差分析。 它检验由单一因素影响的一个(或几个相互 独立的)因变量按因素各水平分组的均值之 间的差异是否具有统计意义。还可以对该因 素的若干水平分组中哪一组与其他各组均值 间具有显著性差异进行分析即进行均值的多 重比较。
One-way ANOVA过程适用情况
A 133.8 125.3 143.1 128.9 135.7
饲 B 151.2 149.0 162.7 143.8 153.5
料 C
193.4 185.3 182.8 188.5 198.6
D 225.8 224.6 220.4 212.3
步骤
1、建立数据库 Fodder变量:数值型,取值1、2、3、4分别代 表A、B、C、D四种饲料。 Weight变量:数值型,其值为猪体重的增加数。 应该特别注意,不能把A、B、C、D定义为四个 变量。
Байду номын сангаас
实验数据
各组平均值
第一组 0.8 0.9 0.7 0.8
红细胞增加数(百万/m3)
第二组
第三组
1.3
0.9
1.2
1.1
1.1
1.0
1.2
1.0
第四组 2.1 2.2 2.0 2.1
这是个双因素方差分析的问题,因素A与因素B。每 个因素均有用该药与不用该药两个水平,研究药物A 和B是否对红细胞的增加有显著影响是对红细胞增加 数的均值作以下比较:
One-way ANOVA过程要求因变量属于正态 分布总体; 如果因变量的分布明显的是非正态,不能使 用该过程,而应该使用非参数分析过程; 如果几个因变量之间彼此不独立,应该用 GLM过程。
例题
用4种饲料喂猪,共19头猪分为四组,每组用一种饲 料。一段时间后称重。猪体重增加数据如下。比较四 种饲料对猪体重增加的作用有无不同。
第五章 方差分析
一、方差分析的概念
在科学实验中常常要探讨不同实验条件或处 理方法对实验结果的影响。通常是比较不同 实验条件下样本均值间差异。 方差分析是检验两个或多个样本均数间差异 是否具有统计意义的一种统计学方法。
方差分析主要用于均数差别的显著性检验、 分离各有关因素并估计其对总变异的作用、 分析因素间的交互作用和方差齐性检验;
举例:几种药物对某疾病的疗效;不同饲料 对牲畜体重增长的效果;
1.方差分析原理
随机误差,例如测量误差造成的差异,称为 组内差异。用变量在各组的均值与该组内变 量值之偏(离均)差平方和的总和表示。记作 SS组内。 实验条件, 即不同的处理造成的差异,称为组 间差异。用变量在各组的均值与总均值之偏 (离均)差平方和的总和表示。记作SS组间。 SS组间、SS组内除以各自的自由度得到其均 方值即组间均方和组内均方。
单因素方差分析的选择项
Contrasts:可以指定一种要用t检验来检验的Priori对比,即进 行均值的多项式比较选项; Post Hoc:可以指定一种多重比较检验; Option:可以指定要输出的统计量,指定处理缺失值的方法。
Contrasts(均值的多项式选项)
Polynomial(多项式比较):均值的多项式比较是包括 两个或更多个均值的比较。单因素方差分析的Oneway ANOVA过程允许进行高达5次的均值多项式比 较。Linear线性、Quadratic二次、 Cubic三次、 4th四次、 5th五次多项式
2、调用One-way过程进行单因素方差分析
3、结果说明
A NOVA
WEIGHT
Sum of Squares Betwee2n05G3r8o.u7p0s Within G6r5o2u.1p5s 9 Total 21190.86
df Mean Square F 36846.231357.467
15 43.477 18
4.因素的主效应和因素间的交互效应
有A、B两种药物治疗缺铁性贫血,患者12例, 分为4组。实验方案是:第一组用一般疗法; 第二组在一般疗法基础上加用A药;第三组在 一般疗法基础上加用B药,第四组在一般疗法 基础上A、B两药同时使用。一个月后观察红 细胞增加数。要求分析两种药物的疗效(数 据下表)。
① 比较第二组的均值与第一组的均值是否有显 著性差异。
② 比较第三组的均值与第一组的均值是否有显 著性差异。 前两项研究的是A、B两因素的主效应。
③ 除了比较第四组的均值与第一组的均值是否 有显著性差异外还要研究A药对B药的疗效 是否有影响。若A药对B药疗效无影响,那 么除抽样误差外,第四组与第二组均值之差 应该等于第三组均值减去第一组均值。但是 实际上(2.1-1.2)=0.9;(1.0-0.8) =0.2。竞相差0.7,该差值几乎与第一组均 值相同。 0.7的差值包括抽样误差和A、B药 的相互作用。
二、方差分析中的术语
因素与处理(Factor and Treament) 水平(Level) 单元(Cell) 因素的主效应和因素间的交互效应 均值比较 协方差分析
1.因素与处理
因素(Factor)是影响因变量变化的客观条件;例如影响农作物 产量的因素有气温、降雨量、日照时间等;
处理(Treatments)是影响因变量变化的人为条件。也可以通 称为因素。如研究不同肥料对不同种系农作物产量的影响时 农作物的不同种系可称为因素,所施肥料可视为不同的处理。
3. 单元(Ce11)
在方差分析中Cell指各因素的水平之间的每个 组合。例如研究问题中的因素有性别Sex,取 值为1、2;有年龄,分三个水平1(10岁)、 2(11岁)、3( 12岁)。两个变量的组合共 可形成六个单元:[1,1]、[1,2]、 [1,3]、[2,1]、[2,2]、[2,3], 代表两种性别与三种年龄的六种组合。
Sig. .000
第一栏:方差来源 第二栏:离均差平方和 第三栏:自由度 第四栏:均方差(第二栏与第三栏之比) 第五栏:F值(组间均方与组内均方之比) 第六栏:F值对应的概率即P值
4、结果分析
根据输出的p值为0.000可以看出,无论临界 值取0.05,还是取0.01,P值均小于临界值。 因此否定H0假设,四种饲料对猪体重均数有 显著性意义,结论是四种饲料对猪体重的增 加明显作用不同。根据该结论选择饲料,犯 错误的概率几乎为0。
左图是要求计算: 1.7×mean1-1×mean4 的值。检验的假设H0:第 一组值的的1.7倍与第四组 的均值相等。
Post Hoc(均数的多重比较选项)
进行多重比较是对每两个组的均值进行如下比较:MEAN(i)MEAN(j)≥4.6625×RANGE×SQRT(1/N(i)+1/N(j));其中i、j 分别为组序号, MEAN(i)、MEAN(j)分别为第i、j组均值, N(i)、N(j)分别为第i、j组中的观测数。各组均值的多重比较方 法的算法不同RANGE值也不同。
2.水平
因素的不同等级称作水平。 例如,性别因素在一般情况下只研究两个水平:男、女。化学实 验或生物实验中的“剂量”必须离散化为几个有限的水平数。如: 1ml、2ml、4ml三个水平。 应该特别注意的是在SPSS数据文件中,作为因素出现的变量不能 是字符型变量,必须是数值型变量。例如性别变量SEX,定义为 数值型,取值为0、1。换句话说,因素变量的值实际上是该变量 实际值的代码,代码必须是数值型的。可以定义值标签F、M(或 Fema1e、ma1e)来表明0、1两个值的实际含义,以便在打印方 差分析结果时使用。使结果更加具有可读性。
一种情况是处理没有作用,即各样本均来自同一总 体。 MS组间/MS组内=1。考虑抽样误差的存在, 则有MS组间/MS组内≈1。
另一种情况是处理因素确实有作用。组间均方是由于 误差与不同处理共同导致的结果,即各样本来自不同 总体。那么,组间均方会远远大于组内均方。MS组 间>>MS组内。
MS组间/MS组内比值构成F分布。用F值与其临界值 比较,推断各样本是否来自相同的总体。
6.协方差分析
在一般进行方差分析时,要求除研究的因素外应 该保证其他条件的一致。作动物实验往往采用同 一胎动物分组给予不同的处理,研究各种处理对 研究对象的影响就是这个道理。 例如研究身高与体重的关系时要求按性别分别进 行分析。这样消除性别因素的影响。不同年龄的 身高对体重的关系也是有区别的,被测对象往往 是不同年龄的。要消除年龄的影响,应该采用协 方差分析。
Coefficients:为多项式指定 各组均值的系数。因素变量分 为几组,输入几个系数,多出 的无意义。如果多项式中只包 括第一组与第四组的均值的系 数,必须把第二个、第三个系 数输入为0值。如果只包括第 一组与第二组的均值,则只需 要输入前两个系数,第三、四 个系数可以不输入 。多项式 的系数需要由读者自己根据研 究的需要输入。
一般情况下Factors与Treatments在方差分析中可作相同理 解。在要求进行方差分析的数据文件中均作为分类变量出现。 即它们的值只有有限个取值。即使是气温、降雨量等平常看 作是连续变量的,在方差分析中如果作为影响产量的因素进 行研究,就应该将其数值用分组定义水平的方法事先变为具 有有限个取值的离散变量
因素之间的相互作用在统计学上称之为交互 效应。如果交互效应存在,说明两个因素不 是相互独立的。
5.均值比较
均值的相对比较是比较各因素对因变量的效 应的大小的相对比较。例如研究A、B效应之 和是否等于它们的交互效应。或者研究A、B 对红细胞增加数的效应是否相等,等。 均值的多重比较是研究因素单元对因变量的 影响之间是否存在显著性差异,例如例题中 研究A、B药物对红细胞增加数的疗效是否存 在显著性差异。
可以同时建立多个多项式。一个多项式的一级系数输 入结束,激活Next按钮,单击该按钮后Coefficients 框中清空,准备接受下一组系数数据。
如果认为输入的几组系数中有错误,可以分别单击 Previous或Next按钮前后翻找出错误的一组数据。单 击出错的系数,该系数显示在编辑框中,可以在此进 行修改,修改后年击Change按钮,在系数显示框中 出现正确的系数值。当在系数显示框中选中一个系数 时,同时激活Remove按钮;单击该按钮将选中的系 数清除。
2.方差分析的假设检验
假设有m个样本,如果原假设H0:样本均数都相同 μ1=μ2=μ3=········=μm=μ,m个样本有共同的方差σ2。 则m个样本来自具有共同的方差σ2和相同的均数μ的 总体。
如果经过计算结果组间均方远远大于组内均方的F> F0.05(f组间,f组内),(括号中的两个f是自由度)则p <0.05,推翻原假设,说明样本来自不同的正态总体, 说明处理造成均值的差异,有统计意义。否则,F< F0.05(f组间,f组内),P>0.05承认原假设,样本来自 相同总体,处理无作用。
存在问题与解决方法
本例只考虑了猪体重的增加量,对其均值进 行了比较但实际工作中的问题往往不是这样 简单,例如是否应该考虑每头猪的进食量对 体重增加的影响,去除这个影响比较猪体重 的增加会对饲料比较得出更切合生产实际的 结论。这个问题应该使用ANOVA过程的协方 差分析功能去解决。
使用系统默认值进行单因素方差分析只能得 出是否有显著性差异的结论,本例数据量少, 哪两组之间差别最大,哪种饲料使猪体重增 加更快,几乎是可以看出来的。实际工作中 往往需要两两的组间均值比较。这就需要使 用 One-way ANOVA进行单因素方差分析时 使用选择项从而获得更丰富的信息,使分析 更深入。