4方差分析
方差分析-4
白含量总体均数相等
H1:μi¹ μ0,即各实验组与安慰剂组的低密度脂蛋
白含量总体均数不等
α=0.05
X 2.4g =2.72, X 4.8g =2.70, X 7.2g =1.97, X 0 =3.43,
ni = n0 =30, MS 误差 =0.43, 误差=116
MS误差 : 误差均方
检验界值查p696附表2 MS t 界值表 MS
误差 组内
LSD-t 检验与两样本均数比较 t 检验
两样本均数差值的标准误 合并方差 自由度ν ν=n1+n2-2 VS ν误差 VS 误差均方
例4-7 例4-2资料,问高血脂患者
的降血脂新药2.4g组、4.8g组、7.2g组 与安慰剂组的低密度脂蛋白含量总体 均数有无差别。
义。可认为降血脂新药 2.4g 组的低密度脂蛋白含量 总体均数低于安慰剂组。
同理, 新药4.8g组VS安慰剂组, LSD-t =-4.29
新药7.2g组VS安慰剂组, LSD-t =-8.59
结论:降血脂新药4.8g组、7.2g组与安慰剂组 间低密度脂蛋白含量的差别有统计学意义
二、Dunnett- t 检验
Dunnett
t2.4g
2.72 3.43 1 1 =-4.18 0.43 30 30 2.70 - 3.43 =-4.29 骣 1 1 ÷ 0.43? ç ÷ ç ç 桫 30 30 ÷ 1.97 - 3.43 =-8.59 骣 1 1 ÷ 0.43? ç ÷ ç ç 桫 30 30 ÷
Dunnett - t4.8g =
(least significant difference)
适用范围:一对或几对在专业上有特 殊意义的样本均数间的比较。
第4章 方差分析(anova)实验设计和分析
第4章方差分析(ANOV A)实验设计和分析Catherine Potvin4.1生态学问题弄懂生态学问题需要将各种环境因子的影响分开,生态工作者用实验来解决这个问题。
不论在野外还是在控制环境条件下,可控实验都可以让生态工作者们只变化一个因子来检验其影响。
例如,生长箱能使生物体生长在完全相同的温度而不同的光周期的条件下,或相同的光强而不同温度条件下的实验成为可能。
在控制实验中,通常最希望的情况是环境‘背景’,即所有的影响因子, 不是自由地变化,而是精确地得到控制,这样就能够保证在改变目标变量时,观测的反应不会受到其它因素的影响。
因而控制环境条件, 例如使用生长箱和温室,成为植物生态学的一个常用的方法,如同动物生态学中使用的生长柜和水族槽一样。
本章第一部分,我要讲一下作为实验生态学基本工具的方差分析(ANOV A)。
本章重点放在实验设计上。
虽然人们一般认为生长箱会提供同一环境条件,但不论在一个生长箱内还是生长箱间都存在环境异质性(Lee和Rawlings 1982;Potvin等1990a),因而能够充分处理环境异质性的实验设计将在本章中述及。
尽管我的论述主要是以生长箱实验为基础,其原理在其它类型的控制或野外环境的实验研究中同样适用(第5,15和16章)。
我还要讨论错误实验设计的代价。
本章应视为实验设计的起步点,这个起步点就是要考虑各种影响因素。
实验者通常进行的实验比这里展开的要复杂。
但是一旦懂得了基本原理,讨论各种实验设计就相对简单一些。
更详细的论述请见Cochran & Cox(1957)和Winter(1991)。
4.2 统计问题:环境变化与统计分析正如Underwood(1997)建议的一样,生态实验设计的第一步是建立一个线性模型使研究者能够将感兴趣的变量(因素)独立出来。
由于实验设计支配误差项,建立线性模型取决于所研究的因子以及具体的实验设计。
在任何一个实验开始时,最基本的是要检验空间与时间变化的格局。
4方差分析
4方差分析方差分析(Analysis of Variance, ANOVA)是一种统计分析方法,用于比较两个或多个样本组间的均值是否有显著差异。
方差分析通过比较组间的变差和组内的变差来进行判断。
在进行方差分析之前,需要满足以下假设:独立性假设、正态性假设和方差齐性假设。
独立性假设指样本之间相互独立,正态性假设指样本符合正态分布,方差齐性假设指不同样本组的方差相同。
方差分析的基本思想是将总体的方差分解为组间方差和组内方差两部分,然后通过比较组间均方与组内均方的大小来判断组间均值是否存在显著差异。
具体步骤如下:1.建立假设:设有k个样本组,组之间的均值分别为μ1,μ2,...,μk,假设H0:μ1=μ2=...=μk,Ha:至少有一组的均值不相等。
2.计算组间均方(MSB):MSB等于组间平方和(SSB)除以自由度(k-1,k为组数)。
组间平方和是各组均值与总体均值的差的平方和。
3.计算组内均方(MSW):MSW等于组内平方和(SSW)除以自由度(N-k,N为总体样本数)。
组内平方和是各组内各样本值与各组均值的差的平方和。
4.计算F值:F值等于MSB除以MSW。
5.查表或计算P值:根据F分布表或计算得到的P值,判断F值是否大于临界值或P值是否小于显著性水平(通常为0.05),若满足显著性要求,则拒绝原假设。
方差分析具有以下优点:1.可以同时比较多个样本组的均值差异,适用于多个样本的情况。
2.可以将总体方差分解为组间方差和组内方差,从而更好地了解不同样本组的变差情况。
3.可以通过F值和P值来判断均值差异的显著性。
4. ANOVA可以进行多重比较,如Tukey检验、LSD检验等,可以对具体的组别进行比较。
然而,方差分析也存在一些限制:1.方差分析要求样本之间相互独立,正态分布和方差齐性,如果数据不满足这些假设,则分析结果可能不准确。
2.方差分析只能检验组间均值是否有差异,无法给出具体的均值大小和差异的方向。
4.方差分析实验2014 (1)
例:某研究者欲研究甲状腺功能低下婴儿血清中甲 状腺含量(nmol/L),按病情严重程度分为三个水平: 轻度组、中度组、重度组,各组中随机选取10名婴 儿,请分析不同严重程度的婴儿血清甲状腺素水平 是否不同?实验前研究者关心重度组与中度组婴儿 血清甲状腺水平是否有不同? (ANOVA 1)
不同严重程度的婴儿血清甲状腺素水平(nmol/L) (n=10)
1、变量设置 (1)数据格式 1个分类变量,标记为1,2,3,……Group=组别 1=轻度,2=中度,3=中度 2、前提条件的假设检验 1个因变量(反应变量) X=甲状腺素含量 AnalyzeDescriptive Statistics Explore Dependent List:X Factor List: Group Plots: Boxplots(箱式图) Normality plots with tests(正态性检验) Spread vs. Level with Levene Test:none
Post Hoc Post Hoc Tests for:group LSD/SNK/Bonferroni Options Estimated Marginal Means(均数估计) Display Means for :group(显示框内因素的 均 数估计,包括均数,标准误及可信区间 Display 输出选项 Descriptive statistics Homogeneity tests
4方差分析
单因素方差查询:1. 实例【例5-1】消费者与产品生产者、销售者或服务的提供者之间经常发生纠纷。
当发生纠纷后,消费者常常会向消费者协会投诉。
为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同的企业作为样本。
每个行业各抽取5家企业,所抽取的这些企业在服务对象、服务内容、企业规模等方面基本上是相同的。
然后统计出最近一年中消费者对总共20家企业投诉的次数,结果如表5-4。
表5-4 消费者对四个行业的投诉次数通常,受到投诉的次数越多,说明服务的质量越差。
消费者协会想知道这几个行业之间的服务质量是否有显著差异,即在方差分析中检验原假设:四个行业被投诉次数的均值相等。
其中CLASS语句用来指定样本分组的分类变量,CLASS语句是必需的,而且必需位于MODEL语句之前;MODEL语句给出模型表达式,可以用来表示三种不同的效应模型:1) 主效应模型:y = a b c2) 交互效应模型:y = a b c a*b a*c b*c a*b*c3) 嵌套效应模型:y = a b c(a b)同一MODEL语句中三种效应可以混合使用。
MEANS语句指定ANOVA过程计算自变量各水平下因变量的均值、标准差,并进行组间的多重比较。
(2) GLM过程PROC GLM DATA=<数据集> [ALPHA = <p>];CLASS <自变量列表>;MODEL <因变量名> = <自变量表达式>[/<选项列表>];MEANS <自变量表达式>[/<选项>];RUN;一般地,ANOVA过程中涉及的所有语句都包含在GLM过程所涉及的语句中,其用法和功能也都是基本相同的。
使用ANOVA过程作单因素方差分析使用ANOVA过程对例5-1作方差分析的方法:proc anova data = Mylib.xfzts;classhangye;modeltousu = hangye;run;3. 使用GLM过程作单因素方差分析使用GLM过程对例5-1作方差分析的方法:proc GLM data = Mylib.xfzts;classhangye;modeltousu = hangye;run;5.3.3 用GLM过程进行双因素方差分析1. 不考虑交互作用过程GLM也可用于多因素方差分析,其用法与单因素方差分析是相同的,只需要在class语句和model语句中分别填入表示因素的多个自变量。
4.方差分析
作物品种等。处理这样的因素所用的模型称为固
定效应模型(fixed effect model)。
不同离子对木聚糖酶活性的影响(mg/ml)
Na+
K+
Mn2+
Cu2+
0.00
0.25 0.50 0.75 1.00
0.00
0.40 0.60 0.80 1.00
0.00
0.06 0.12 0.18 0.24
(xij- xi)
根据线性可加模型,则有:
x
k n i 1 j 1 k n i 1 j 1 k n
ij
x xij xi xi x
2 k n i 1 j 1 k 2 n
2
xij xi 2 xij xi xi x xi x
σ2 =
s2 =
方差分析的基本思想是将观测值出现的总变异分解为 处理效应引起的变异和试验误差引起的变异。 要把一个试验的总变异依据变异来源分为相应的变异, 首先要将总平方和及总df分解为各个变异来源的相应部分。
处理 重复
1 2 … j … n
1
2
…
i
…
k 处理间平均数的 差异是由处理效 应引起的:
t 检验可以判断两组数据平均数间的差异显著
性,而方差分析既可以判断两组又可以判断多组数
据平均数之间的差异显著性。
是否可以把多组数据化成n个两组数据,用n次t检验来完 成这个多组数据差异显著性的判断?
多组平均数差异显著性检验采用t检验的缺点:
1.检验过程烦琐。 试验包含4个处理
t 检验: C42 = 6次
试验因素( experimental factor): 试验中所研究的
SPSS教程讲义培训教程简明教程(4)方差分析
试验4:方差分析一、试验目标与要求1.帮助学生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理2.掌握方差分析的过程。
3.增强学生的实践能力,使学生能够利用SPSS统计软件,熟练进行单因素方差分析、两因素方差分析等操作,激发学生的学习兴趣,增强自我学习和研究的能力。
二、试验原理在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。
例如,农作物的产量受作物的品种、施肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。
为此引入方差分析的方法。
方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差加以比较,据以推断各组样本之间是否存在显著差异。
若存在显著差异,则说明该因素对各总体的影响是显著的。
方差分析有3个基本的概念:观测变量、因素和水平。
观测变量是进行方差分析所研究的对象;因素是影响观测变量变化的客观或人为条件;因素的不同类别或不通取值则称为因素的不同水平。
在上面的例子中,农作物的产量和商品的销量就是观测变量,作物的品种、施肥种类、商品价格、广告等就是因素。
在方差分析中,因素常常是某一个或多个离散型的分类变量。
根据观测变量的个数,可将方差分析分为单变量方差分析和多变量方差分析;根据因素个数,可分为单因素方差分析和多因素方差分析。
在SPSS中,有One-way ANOVA(单变量-单因素方差分析)、GLM Univariate(单变量多因素方差分析);GLM Multivariate (多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。
本节仅练习最为常用的单因素单变量方差分析。
三、试验演示内容与步骤单因素方差分析也称一维方差分析,对两组以上的均值加以比较。
检验由单一因素影响的一个分析变量由因素各水平分组的均值之间的差异是否有统计意义。
并可以进行两两组间均值的比较,称作组间均值的多重比较。
实验4--方差分析
学院:数学与统计学院专业:数学与应用数学学号:20111910121姓名:杨君波实验六方差分析一、实验目的通过本次实验,了解如何进行各种类型均值的比较与检验。
二、实验性质必修,基础层次三、主要仪器及试材计算机及SPSS软件四、实验内容单因素方差分析五、实验学时2学时单因素方差分析(One-Way ANOVA过程)1.某城市从4个排污口取水,进行某种处理后检测大肠杆菌数量,单位面积内菌落数如下表所示,请分析各个排污口的大肠杆菌数量是否有差别。
排污口 1 2 3 4 大肠杆菌数量9,12,7,5 20,14,18,12 12,7,6,10 23,13,16,21实验步骤:首先建立“数据视图”→单击“分析(A)”→选择“比较均值(M)”→选择“单因素ANOV A”→将“大肠杆菌数量”选入到“因变量列表(E)”→将“排污口”选入到“因子”中→在“选项(O)”中的“描述性(D)”、“方差同质性检验(H)”、“均值图(M)”上打勾→点击“继续”→点击“确定”。
运行过程及结果:变量视图:数据视图:运行结果:结果分析:①在“描述”图表中给出了四个排污口的大肠杆菌数量的基本描述性统计量。
包括样本容量、样本均值、标准差、标准误差、均值的95%的置信区间、最小值和最大值;②在“方差齐性检验”图表中P值为0.329,若我们给定显著性水平为0.05,P大于0.05,接受原假设,认为四个总体的方差相等;③在“ANOVA”图表中若取显著性水平0.05,因为P=0.003,所以P小于0.05,拒绝原假设,认为各个排污口的大肠杆菌数量存在显著差别;④在“均值图”中可以看出第四个排污口大肠杆菌数量最多,第一个排污口大肠杆菌数量最少。
2.某连锁商场有五个连锁分店。
希望比较这五个分店的营业额是否相同,调查人员各自独立地从这五个分店中取得12个营业日的日营业额,资料见下表:连锁店营业日第一分店第二分店第三分店第四分店第五分店1 924 994 1160 1072 9492 1094 1270 1185 1011 11213 1000 1261 1292 961 11594 948 1034 1319 1229 10495 1066 1542 1101 1238 9526 923 1258 1246 1035 10977 823 1215 1340 1240 11448 1035 978 1019 947 9589 1130 1316 1224 1110 91710 1019 1005 967 955 107711 985 944 1221 1091 96712 957 1295 1210 916 1039以α=0.05的显著性水平检验“这五个分店的日营业额相同”这一假设。
方差分析 (4)
319 279 318 284 359 1559 311.8
2
C
T 5509 1517454 .05 nk 20
SST 19986 .95 SSt 11435 .35 SSe 8551 .60
处理内方差 SSe 处理间方差 SSt
也就是饲料内方差可 以估计误差方差
饲料间方差,可以估 计不同饲料喂养增重 的差异。
x
判定标准
?
方差,即均方(mean squares)
3. 数学模型
xij i ij xij x ti eij
样本
固定模型(fixed model) 随机模型(random model) 混合模型(mixed model)
0 0 2 N ( 0, ) 不同的模型在平方和及自
对上面的各组平均值作新复极差检验:
2 se 534.5 sx 10.34( g ) n 5
查附表获得df=16,M=2时,SSR的值:
查附表获得df=16,M=2时,SSR的值:SSR0.05=3.0, SSR0.01=4.13,则:
LSR SSR sx LSR0.05 3.0010.34 31.02 LSR0.01 4.1310.34 42.70
梯形法
标记字母法,首先将全部平均数从大到小依次排列,然后在
最大的平均数上标记字母a,将该平均数以下各平均数相比,凡相差 不显著的(<LSD0.05)都标上字母a,直至某个与之相差显著的则标以字 母b。再以标有b的平均数为标准与各个平均数比较,凡差数差异不 显著的在字母a后再续标字母b,直至差异显著的平均数标以c,然后 重复上述工作,直到最小的平均数有标记为止。凡标有一个相同字 母的即为差异不显著。 饲料 A1 A4 A2 A3 平均数 311.8 279.8 262.8 247.4 差异显著性 0.05 a b bc c 0.01 A AB B B
实验4 方差分析
实验报告课程名称试验设计与数据分析姓名邵建智学号3110100122专业生物系统工程实验名称方差分析浙江大学生物系统工程与食品科学学院二O一三年八月制实验四:方差分析实验类型:上机操作实验地点:农生环D-414指导老师:傅霞萍实验日期:2013 年10月15 日一、实验目的和要求(1)熟练使用SPSS进行方差分析,包括单因素方差分析、双因素无交互作用方差分析、双因素有交互作用方差分析二、实验内容和原理2.1实验原理方差分析又称“变异数分析”或“F检验”,用于两个及两个以上样本均属差别的显著性检验。
由于各种因素的影响,研究所得的数据呈现波动状。
方差分析的基本思想是通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
2.2 实验内容(显著性水平α=5%)(1)单因素方差分析某公司专业生产电脑显示器,通过使用3种不同的芯片,得出显示器的某个关键参数如下(2)双因素无交互作用方差分析中北大学某研究小组根据不同水平设置的射出压力和模腔温度试验得出某成型品的关键尺寸如下表,用方差分析法分析两种因素对成型品关键尺寸是否存在重要影响。
(3)双因素有交互作用方差分析为了测定石油灰分中的钒,研究了三种溶样方法,用三种方法分别溶解四种不同组成的试样,试验结果列于表中,试由这些分析数据,评价这三种溶样方法的效果。
不同试样中钒的含量溶样方法 甲 乙 丙丁 Ⅰ 65.04 35.36 35.67 2.69 62.27 34.57 33.33 2.78 68.68 36.74 33.86 2.74 Ⅱ 57.49 36.50 34.45 3.21 54.22 36.43 35.36 3.04 56.60 35.89 33.76 3.20 Ⅲ 69.73 37.70 35.95 2.63 61.67 37.06 36.19 2.87 63.46 38.19 35.16 2.50三、 主要仪器设备/实验环境(使用的软件等)IBM SPSS 19.0等四、 操作方法与实验步骤(必填,上机操作过程,可以插图) (1)单因素方差分析五、实验数据记录和处理(必填,图表数据、计算结果、对图表的处理)(1)单因素方差分析(2)双因素无交互作用方差分析(3)双因素有交互作用方差分析六、实验结果与分析(必填)(1)单因素方差分析1)进行方差齐性检验,知P=0.305>0.05,满足方差齐性;2)在单因素方差分析表中,组间检验得P=0.000,所以组间差异显著,不同芯片对观测值有显著不同;3)在满足方差齐性的条件下进行LSD两两比较,知芯片A与B,B与C间有显著差异,A与C间无显著差异;4)由均值图也可看出,芯片B的观测值明显高于芯片A与芯片C的观测值,而芯片A与芯片C的观测值无明显差异。
(4)方差分析
x
xi• — —因素 A 在第 i 个水平下的样本均值
x• j — —因素 B 在第 j 个水平下的样本均值
第三节: 第三节:双因素方差分析
完 全 设 计 试 验 下 的 数 据 结 构
xi.是行因素的第 个水平下各观察值的平均值 是行因素的第i个水平下各观察值的平均值
r
∑x
xi. =
j =1
(或组间平方和)
第一节: 第一节:方差分析的基本概念与原理
2 S E — —它是同一水平内部观测值之间的差异状况。
方 差 分 析 的 概 念
2 SE 因此, 将 称为组内方差, 它反映了由随 n−r 机因素引起的变差。
2 S A — —它是各水平的平均值与总平均值的差异状况, 2 SA 即各水平之间的差异。 因此, 将 称为组间 r −1 方差, 它既包括系统因素引起的变差, 又包括
第三节: 第三节:双因素方差分析
B
完 全 设 计 试 验 下 的 数 据 结 构
A
B1
x11 x21 M M xt1 x•1
B2
x12 x22 M M xt 2 x•2
LHale Waihona Puke L L M M L L均值
Bs
x1s x2 s M M xts x• s
x1• x2• M M xt •
A1 A2 M M At
第二节: 第二节:单因素的方差分析
单因素方差分析——如果试验中只有一个可变 如果试验中只有一个可变 单因素方差分析 化的因素, 化的因素,针对一个可变因素变化而进行的方 差分析。 第一节中的引例,就是一个单因素4水平 差分析。(第一节中的引例,就是一个单因素 水平
的方差分析) 的方差分析)
10第5章方差分析(4)讲解
2
期望均方 A随机、B固定
2 2
sA2 sB 2 sAB 2 se
2
e nb A
2
e n AB nb A
2
e2 bn A2
e2 na B 2 e2 n AB2 na B2 e2 n AB2 an B2 2 2 n 2 2 2 2 e AB n n
se 2
e2
e2
e2
第四节 方差分析处理效应分类与期望均方
三、方差分量的估计 方差分量variance component 方差的组成成分 根据试验方差和期望方差的关系,可估算各方差分量。 例如,单因素完全随机设计资料的方差分量估算如下:
试验方差 期望均方 固定模型 随机模型
st 2
se 2
随机模型
2
A固定、B随机
2 2
sA2 sB 2 se 2
e b A e 2 a B 2
2
e b A
2 2
e 2 b A2
e 2 a B 2
e2
e a B
e2
e2
第四节 方差分析处理效应分类与期望均方
二、期望均方 3. 两因素交叉设计有重复资料方差分析的期望均方
二、期望均方 1. 单因素完全随机设计资料方差分析的期望均方
试验方差
期望均方 固定模型 随机模型
e2 n 2
e2
st n 2
e2
第四节 方差分析处理效应分类与期望均方
二、期望均方 2. 两因素交叉设计无重复资料方差分析的期望均方
试验方差 期望均方
固定模型
H0 : 2 0
4 方差分析
吴艳
生活压力的年龄(3个水平,顺序变量) 差异,或,年龄对生活压力的影响
两两t 检验?
不能做t 检验
如果有K(K≥3)个平均数,若用两两比较 的方法来检验,则需作K(K-1)/2次检验, 不但程序繁琐,而且相当于从t 分布中随 机抽取多个t 值,其落在大于临界值的范 围内的概率大大增加,犯Ⅰ类错误的概 率大大增加:如6次检验H0的概率是0.95 时的误差为:1-0.956 =0.265。
净Eta平方(partial Eta-Squared,ηp2),多因素 ANOVA中,扣除了其他自变量后某自变量 的效应。
p 2
SSeffect SSeffect SSerror
判断标准:0.01,小;0.06,中;0.14,大
Omega平方(Omega squared,ω2)
SSw ( X ij X j )2 122
求组间(between groups)平方和:各组均值与总 体均值的离差平方和,因为每个均值由5个人平 均而来,故应乘以5加权处理。
SSb n ( X j X ) 70
2
SSt SSw SSb
( X
ij
X ) ( X ij X j ) n ( X j X )
2 2
2
求自由度
dft nk 1 14 df w k (n 1) 12 dfb k 1 2 dft df w dfb
求均方(方差)
MS w MSb
SS w 10.17 df w SSb 35 dfb
做F检验(单/右侧)
MSb F 3.44 F0.05 (2,12) 3.88 MSw
知识4: 方差分析(多个总体均数比较)
方差分析/F检验(多个均数比较)前言:一、方差分析的基本思想方差是反映数据变异程度的统计指标。
利用方差的概念对变异度进行分解,所以方差分析亦称为变异度分析。
其基本思想是:根据研究目的和设计类型,将全部观察值的总变异分解为两个或多个部分,各部分的变异可由不同处理因素的影响效应或者误差的效应解释,将各影响因素产生的变异与随机误差变异进行比较,以推断该因素是否存在影响效应。
二、方差分析的应用条件独立性:各样本是相互独立的随机样本,个体观测值之间相互独立。
正态性:各样本均来自正态分布总体。
方差齐性:各样本所对应的总体方差相等。
三、常用的方差齐性检验方法F 检验:仅用于两总体方差相等Bartlett检验:通常要求数据满足正态性Levene检验(Levene‘s teste):不依赖数据的分布类型,结果更稳健四、完全随机设计的方差分析完全随机设计(completely randomized design)的方差分析是指将研究对象通过完全随机化方法,分配至多个不同的处理组,比较多组的效应指标是否存在差别,亦称为单向方差分析(one-way ANOVA)/单因素方差分析。
注:完全随机设计的方差分析只涉及一个研究因素,因此,除了用于随机分组的试验性研究外,也常用于基于随机抽样的观察性研究多个均数的比较。
SPSS正文:一、单因素方差分析(单个因素作用,处理因素——独立正态方差齐):SPSS操作:第一步:建立数据文件(变量:group 和观察值共2列;类似两组独立样本t检验的数据录入);第二步:正态性检验(类似两组独立样本t检验的正态性检验)1、分割文件(data→split file→激活compare groups→调入group→OK);自我经验,此处可有可无,分割和不分割的结果未变化。
2、正态性检验(analyze→nonparametrice tests→1-sample K-S→调入观察值,点击normal→OK)3、观察结果,若三组正态性检验P均>0.05,则进行下一步。
第4章 方差分析
浙江科技学院本科课程《化工数据处理》
方差分析基本思想:
方差分析,是按变异的不同来源,将全部观察值总的
离均差平方和和自由度分解为两个或多个部分,除随机误 差外,其余每个部分的变异可由某个因素的作用加以解释, 通过比较不同来源变异的均方(MS),借助F分布做出统 计推断,从而了解该因素对观察指标有无影响。
1 k i , i i k i 1
xij i ij
(4-1)
若令
则(4-1)式可以改写为
xij i ij
(4-2)
其中, 为全试验观测值总体平均数; 显然有
i 是第i个处理的效应,表示处理i对试验结果产生的影响。
i 1
k
1. 假定从第i个总体中抽取一个容量为ni的简单 2.
随机样本,第i个总体的样本均值为该样本的 全部观察值总和除以观察值的个数 计算公式为
xi
x
j 1
ni
ij
ni
(i 1,2,, k )
18/46
式中: ni为第 i 个总体的样本观察值个数 xij 为第 i 个总体的第 j 个观察值
浙江科技学院本科课程《化工数据处理》
12/46
浙江科技学院本科课程《化工数据处理》
三、问题的一般提法
1. 设因素有k个水平,每个水平的均值分别用 1 , 2, , k 表示 2. 要检验k个水平(总体)的均值是否相等,需要提 出如下假设: H0 : 1 2 … k H1 : 1 , 2 , ,k 不全相等
2. 3. 4.
差平方和 反映各总体的样本均值之间的差异程度,又称组 间平方和 该平方和既包括随机误差,也包括系统误差 计算公式为
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方差分析是用于两个及两个以上样本均数差别的显著性检验。
由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。
方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析主要用途:①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。
在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。
通常是比较不同实验条件下样本均值间的差异。
例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。
方差分析原理方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:(1) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SS w,组内自由度df w。
(2) 实验条件,实验条件,即不同的处理造成的差异,称为组间差异。
用变量在各组的均值与总均值之偏差平方和表示,记作SS b,组间自由度df b。
总偏差平方和 SS t = SS b + SS w。
组内SS t、组间SS w除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MS w和MS b,一种情况是处理没有作用,即各组样本均来自同一总体,MS b/MS w≈1。
另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。
那么,MS b>>MS w(远远大于)。
MS b/MS w比值构成F分布。
用F值与其临界值比较,推断各样本是否来自相同的总体。
方差分析的假设检验假设有m个样本,如果原假设H0:样本均数都相同即μ1=μ2=μ3=…=μm=μ,m个样本有共同的方差。
则m个样本来自具有共同的方差和相同的均数u的总体。
零假设H0:m组样本均值都相同,即μ1= μ2=....= μm如果,计算结果的组间均方远远大于组内均方(MS b>>MS w),F>F0.05(dfb,dfw), p<0.05,拒绝零假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义;否则, F<F0.05((dfb,dfw), p>0.05不能拒绝零假设,说明样本来自相同的正态总体,处理间无差异。
SPSS中方差分析过程1)One-Way ANOVA过程One-Way过程是单因素简单方差分析过程。
它在Analyze菜单中的Compare Means过程组中。
用0ne-Way ANOVA菜单项调用,可以进行单因素方差分析、均值多重比较和相对比较。
2)General Linear Model 过程组在SPSS主菜单“Analyze”项调用。
这些过程可以完成简单的多因素方差分析和协方差分析,不但可以分析各因素的主效应,还可以分析各因素间的交互效应。
该过程允许指定最高阶次的交互效应,建立包括所有效应的模型。
如果想建立包括某些特定的交互效应的模型也可以通过过程中的“Method”对话框中的选择项实现。
在General Linear Model菜单项的下一级菜单中有四项过程,每个菜单项分别完成不同类型的方差分析任务。
这些过程的主要功能分别是:① Univariate 过程Univariate过程完成一般的单因变量、多因素方差分析。
可以指定协变量,即进行协方差分析。
在指定模型方面有较大的灵活性并可以提供大量的统计输出。
② Multivariate过程Multivariate过程进行多因变量的多因素分析。
当研究的问题具有两个或两个以上相关的因变量时,要研究一个或几个因素变量与因变量集之间的关系时,才可以选用Multivariate过程。
例如,当你研究数学、物理的考试成绩是否与教学方法、学生性别、以及方法与性别的交互作用有关时,使用此菜单项。
如果只有几个不相关的因变量或只有一个因变量,应该使用Univariate过程。
③ Repeated Measure过程Repeated Measure过程进行重复测量方差分析。
当一个因变量在不只一种条件下进行测度,要检验有关因变量均值的假设应该使用该过程。
④ Variance Component 过程Variance Component过程进行方差估计分析。
通过计算方差估计值,可以帮助我们分析如何减小方差。
1)准备分析数据在数据编辑窗口中输入数据。
建立因变量“幼虫”和因素水平变量“品种”,然后输入对应的数值,如图5-1所示。
或者打开已存在的数据文件“DATA5-1.SAV”。
2)启动分析过程点击主菜单“Analyze”项,在下拉菜单中点击“Compare Means”项,在右拉式菜单中点击“0ne-Way ANOVA”项,系统打开单因素方差分析设置窗口如图5-2。
图5-2 单因素方差分析窗口3)设置分析变量因变量:选择一个或多个因子变量进入“Dependent List”框中。
本例选择“幼虫”。
因素变量:选择一个因素变量进入“Factor”框中。
本例选择“品种”。
4)设置多项式比较单击“Contrasts”按钮,将打开如图5-3所示的对话框。
该对话框用于设置均值的多项式比较。
图5-3 “Contrasts”对话框定义多项式的步骤为:均值的多项式比较是包括两个或更多个均值的比较。
例如图5-3中显示的是要求计算“1.1×mean1-1×mean2”的值,检验的假设H0:第一组均值的1.1倍与第二组的均值相等。
单因素方差分析的“0ne-Way ANOVA”过程允许进行高达5次的均值多项式比较。
多项式的系数需要由读者自己根据研究的需要输入。
具体的操作步骤如下:① 选中“Polynomial”复选项,该操作激活其右面的“Degree”参数框。
② 单击Degree参数框右面的向下箭头展开阶次菜单,可以选择“Linear”线性、“Quadratic”二次、“Cubic”三次、“4th”四次、“5th”五次多项式。
③ 为多项式指定各组均值的系数。
方法是在“Coefficients”框中输入一个系数,单击Add按钮,“Coefficients”框中的系数进入下面的方框中。
依次输入各组均值的系数,在方形显示框中形成—列数值。
因素变量分为几组,输入几个系数,多出的无意义。
如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。
如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。
可以同时建立多个多项式。
一个多项式的一组系数输入结束,激话“Next”按钮,单击该按钮后“Coefficients”框中清空,准备接受下一组系数数据。
如果认为输入的几组系数中有错误,可以分别单击“Previous”或“Next”按钮前后翻找出错的一组数据。
单击出错的系数,该系数显示在编辑框中,可以在此进行修改,修改后单击“Change”按钮在系数显示框中出现正确的系数值。
当在系数显示框中选中一个系数时,同时激话“Remove”按钮,单击该按钮将选中的系数清除。
④单击“Previous”或“Next”按钮显示输入的各组系数检查无误后,按“Continue”按钮确认输入的系数并返回到主对话框。
要取消刚刚的输入,单击“Cancel”按钮;需要查看系统的帮助信息,单击“Help”按钮。
本例子不做多项式比较的选择,选择缺省值。
5)设置多重比较在主对话框里单击“Post Hoc”按钮,将打开如图5-4所示的多重比较对话框。
该对话框用于设置多重比较和配对比较。
方差分析一旦确定各组均值间存在差异显著,多重比较检测可以求出均值相等的组;配对比较可找出和其它组均值有差异的组,并输出显著性水平为0.95的均值比较矩阵,在矩阵中用星号表示有差异的组。
图5-4 “Post Hoc Multiple Comparisons”对话框(1)多重比较的选择项:①方差具有齐次性时(Equal Variances Assumed),该矩形框中有如下方法供选择:LSD (Least-significant difference) 最小显著差数法,用t检验完成各组均值间的配对比较。
对多重比较误差率不进行调整。
Bonferroni (LSDMOD) 用t检验完成各组间均值的配对比较,但通过设置每个检验的误差率来控制整个误差率。
Sidak 计算t统计量进行多重配对比较。
可以调整显著性水平,比Bofferroni方法的界限要小。
Scheffe对所有可能的组合进行同步进入的配对比较。
这些选择项可以同时选择若干个。
以便比较各种均值比较方法的结果。
R-E-G-WF (Ryan-Einot-Gabriel-Welsch F) 用F检验进行多重比较检验。
R-E-G-WQ (Ryan-Einot-Gabriel-Welsch range test) 正态分布范围进行多重配对比较。
S-N-K (Student-Newmnan-Keuls) 用Student Range分布进行所有各组均值间的配对比较。
如果各组样本含量相等或者选择了“Harmonic average of all groups”即用所有各组样本含量的调和平均数进行样本量估计时还用逐步过程进行齐次子集(差异较小的子集)的均值配对比较。
在该比较过程中,各组均值从大到小按顺序排列,最先比较最末端的差异。
Tukey(Tukey's,honestly signicant difference) 用Student-Range统计量进行所有组间均值的配对比较,用所有配对比较误差率作为实验误差率。
Tukey's-b用“stndent Range”分布进行组间均值的配对比较。
其精确值为前两种检验相应值的平均值。
Duncan (Duncan's multiple range test) 新复极差法(SSR),指定一系列的“Range”值,逐步进行计算比较得出结论。
Hochberg's GT2用正态最大系数进行多重比较。
Gabriel用正态标准系数进行配对比较,在单元数较大时,这种方法较自由。
Waller-Dunca用t统计量进行多重比较检验,使用贝叶斯逼近。
Dunnett指定此选择项,进行各组与对照组的均值比较。
默认的对照组是最后一组。
选择了该项就激活下面的“ControlCategory”参数框。
展开下拉列表,可以重新选择对照组。
“Test”框中列出了三种区间分别为:∙“2-sides” 双边检验;∙“<Control” 左边检验∙“>Conbo1”“右边检验。