生物统计学3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 方差分析
引言
在第四、五章中,学习了单样本与总体或两样本间平均数的显著性检验。然而,在生物学研究中,常收集到多样本的数据,对这些多样本间平均数差异的统计分析方法即为方差分析(多样本分析)。方差分析不仅能够分析单因素多水平(处理)效应值间平均数的差异,还能同时分析两个因素、多个因素多水平间平均数的差异,以及各因素间的交互作用。
方差分析是对多因素总体作用的检验,各因素内水平间一对一的比较方法是多重比较。在方差分析检验差异显著的前提下,进行多重比较的分析。本章仅对单因素和两因素方差分析,以及多重比较进行介绍。
学习目标
1.辨析概念:固定因素和随机因素;固定模型、随机模型和混合模型。 2.掌握适于进行方差分析的不同类型生命科学数据。 3.理解不同方差分析模型计算过程的异同。
4.在方差分析中,固定因素和随机因素在对统计结果进行解释时的不同。 5.掌握方差分析的基本步骤。
6.了解多重比较的前提条件,掌握常用比较方法。
第六章 方差分析
方差分析又叫变量分析,它是对多个样本平均数差异显著性检验的一种引伸。在对多个样本进行比较时,如果用t 检验就会产生较大的误差,提高了犯α错误的概率。例如我们用t 检验一对一比较的方法检验4个样本平均数之间的差异显著性,就需要做62
4=C 次检验,每次无效假设的概率都是l 一α=0.95,而且这些检验都是独立的,那么6次都接受的概率是(0.95)6
=0.735,犯α错误的概率为1—0.735=0.265,
即6次犯错误可能性的累积,因此所犯错误的概率大大增加,使用方差分析就可以避免这一问题。方差分析是对各因素总体处理效应的显著性检验。
第一节 方差分析的基本原理
方差亦称均方,是标准差的平方,是表示变异的量。在一个多处理试验中,可以得到多组不同的观测值。各组观测值不同的原因可以分为两大类,一类是因素处理的不同引起的,叫处理效应或条件变异,另一类是试验过程中偶然性因素的干扰和测量误差所致,称为误差或试验误差。方差分析的基本思想是将测量数据的总变异按照变异原因不同分解为处理效应和试验误差,并作出其数量估计。
通过方差比较以确定两种原因在总变异中所占的重要程度,如果处理效应和试验误差相差不大,说明试验处理对指标影响不大,如二者相差较大,处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。方差分析的用途非常广泛,可用于多个样本平均数的比较、分析多个因素间的交互作用、回归方程的假设检验、方差的同质性检验等。本章主要介绍多个样本平均数的比较,并对两个因素间的交互作用进行分析。 一、数学模型
假定有k 组观测数据,每组有n 个观测值,则用线性可加模型来描述各观测值,有:
ij i ij x ετμ++=
式中,ij x 是在第i 次处理下的第j 次观测值,μ为总体平均数,i τ为处理效应,ij ε是试验误差,要求ij ε是相互独立的,且服从正态分布),0(2σN 。
对于由样本估计的线性模型为:ij i ij e t x x ++= 式中,x 为样本平均数,i t 为样本的处理效应,ij e 为试验误差。
依据对i τ的不同假定,即试验因素的性质和作用不同,将方差分析数学模型分为固定模型和随机模型。 (一)固定模型
所谓固定模型是指各个处理的效应值i τ是固定的,各个处理的平均效应μμτ-=i i 是一个常量,且
∑=0i
τ
。在试验中,我们只能讨论参加试验的个体而不是随机选择的样本,就是说除去随机误差之后每
个处理所产生的效应是固定的。实际上试验因素的各水平常常是根据试验目的,事先主观选定的而不是随机选定的。例如几种不同温度下小麦的发芽情况,不同月龄小白鼠抗药性的测定等。在这些试验中处理的水平是特意选择的,得到的结论只适合于方差分析中所考虑的那几个水平,上述的温度、月龄等因素称为固定因素,固定因素是指因素的水平可以严格地人为控制,水平固定后它的效应值也是固定的,试验重复时可以得到相同的结果。对单个或多个固定因素作用的方差分析应采用固定模型,在生产实践和科学实验中有很多这样的情况。 (二)随机模型
随机模型是指各处理的效应值i τ不是固定的数值,而是由随机因素所引起的效应。这里i τ是一个随机变量,是从期望均值为0,方差为2
σ的正态总体中得到的随机变量。得出的结论可以推广到多个随机因素的所有水平上。试验中随机因素的各水平是从总体全部水平中随机抽取的样本,水平不能严格人为控制,在水平确定之后其效应值并不固定,重复试验时也很难得出相同的结果。这类试验通过样本对所属总体作出推断时应采用随机模型,例如在研究动物体重对生长率,或土壤对植物生长的影响时,体重、土壤条件是无法人为控制的,均要用随机模型来处理。
(三)混合模型
在多因素试验中,若既有固定因素,又有随机因素存在时,方差分析则采用混合模型进行统计计算。 由于固定模型、随机模型和混合模型在设计思想和统计推断上有明显不同,因此进行方差分析时的公式推导也有所不同。所推导的平方和及自由度的分解公式没有区别,但在进行统计推断时假设检验构成的统计数是不同的。另外,模型分析的侧重点也不完全相同,方差期望值也不一样。固定模型主要侧重于效应值的估计和比较,而随机模型则侧重效应方差的估计和检验。因此在进行分析及试验设计之前就要明确关于模型的基本假设。
对于单因素方差分析来说,固定模型和随机模型统计方法完全相同,只是在根据统计数作推论时有所不同。
二、统计假设的显著性检验——F 检验
设试验A 具有k 个处理样本,每个样本有n 个观测值,则试验A 共有nk 个观测值,其样本资料可用
表7-1来表示。
从第二章可知,方差是离均差平方和除以自由度的商,对于总体:N
x ∑-=
2
2
)
(μσ
,
对于样本:1
)(2
2
--=
∑
n x x s ;因此,要把一个试验的总变异依据变异来源分为相应的变异,首先要将总
平方和和总自由度分解为各个变异来源的相应部分。
方差分析的步骤:
同t 检验相同,方差分析首先也要作假设,无效假设把各个处理的变量假设来自同一总体,即处理间
方差不存在处理效应,只有误差的影响,因而处理间的样本方差2A σ与误差的样本方差2
e σ相等,即
22
0:e A H σσ=,22:e A
A H σσ≠。还要确定显著水平α。 (一)平方和的计算
从方差分析的基本指导思想出发,引起观测值出现变异的原因有处理效应和试验误
差。处理间平均数的差异由处理的效应所致;同一处理内的变异则由随机误差引起,根据线性可加数学模型,则有:
总平方和 ∑∑∑-=-=k
n
T kn T x x x SS 11
2
2
2
)(
令矫正数kn
T C 2=, 则C x SS T -=∑2
处理间平方和 ∑∑-=-=k
k i i A C T n x x n SS 1
12
2
1)(
处理内平方和 A T i k n
i e SS SS T n
x x x SS -=-
=-=
∑∑∑∑221
1
21
)(