生物统计学 第六章 方差分析

合集下载

卫生统计学第六章-方差分析

卫生统计学第六章-方差分析

谢谢!
27
SS 组内 SS 总 SS 组间
组内 N k
平均变异
MS组间
=
SS 组间
组间
MS组内 =
组内
SS组内
14
变异分解
SS总
SS组间 SS组内
方差分析表
变异来源
SS
MS
F

X
2
( X
N
)2
N-1
组间
(
j
X ij )2 (
i
ni
X )2 N
SS k-1
MS 组间 组间
组间
MS 组内
组内
方差分析表
变异来源 SS DF MS F值 P值 组间 119.8314 2 59.916 14.32 <0.05 组内 112.9712 27 4.184
总变异 232.8026 29
18
3.求 P 值,下结论。
按=0.05水准,拒绝H0,接受H1,认为三组
的差异具有统计学意义(统计结论),不同时期切 痂对大鼠肝脏的ATP平均含量有影响,以B组最 高,其次为A组,C组最低(专业结论)。
完全随机设计资料的方差 (one-way ANOVA)
one-way ANOVA
完全随机设计(completely random design) 只设计一个处理因素,该因素有两个或两 个以上水平,采用完全随机的方法直接将 受试对象分配到各个处理水平组。各处理 水平组例数可以相等也可以不等。
表1 大鼠烫伤后肝脏ATP的测量结果(mg)
从正态分布总体的随机样本
例1中每个组测得的ATP含量服从正态分布
3. 方差齐性 ( homoscedasticity )

生物统计学之方差分析

生物统计学之方差分析

6.4 均值间的两两比较
对完全随机设计多组平均水平进行比较时,当资料满 足正态性和方差齐性,就可以尝试方差分析,若得到 P>α的结果,不拒绝零假设,认为各组样本来自均数相 等的总体,即不同的处理产生的效应居于同一水平, 分析到此结束; 若方差分析结果P≤α,则拒绝零假设, 接受备择假设,认为各处理组的总体均数不等或不全 相等,即各个处理组中至少有两组的总体均数居于不 同水平。这是一个概括性的结论,研究者往往希望进 一步了解具体是哪两组的总体均数居于不同水平,哪 两组的总体均数相等,这就需要进一步作两两比较来 考察各个组别之间的差别。
6.1 方差分析的相关术语
本例的试验涉及两个因素,称为二因素试验,试 验共有2×3=6个水平组合,即6个处理。每个马氏珠 母贝就是一个试验单位,每个地区每个品种养殖1000 个,1000称为重复。
这里因素A的2个水平三亚品系与印度品系是固定的 ,特意选择的,因素B的3个养殖海区也是特意选择的 ,我们在处理时要用固定模型来处理,得到的结论仅 仅适用试验所涉及的2个品系与3个海区。比如马氏珠 母贝在流沙港、徐闻、大亚湾都有养殖,但我们不能 拿流沙港的养殖结果说明徐闻与大亚湾的养殖情况。
6.4 均值间的两两比较
均数间的两两比较根据研究设计的不同分为两种类型 :一种常见于探索性研究,在研究设计阶段并不明确 哪些组别之间的对比是更为关注的,也不明确哪些组 别间的关系已有定论、无需再探究,经方差分析结果 提示“概括而言各组均数不相同”后,对每一对样本均 数都进行比较,从中寻找有统计学意义的差异;另一 种是在设计阶段根据研究目的或专业知识所决定的某 些均数间的比较,常见于证实性研究中多个处理组与 对照组、施加处理后的不同时间点与处理前比较。最 初的设计方案不同,对应选择的检验方法也不同,下 面分述两种不同设计均数两两比较的方法选择。

生物统计学 第六章 方差分析

生物统计学 第六章  方差分析

������������������
������
F分布右尾从F 到+∞的概率为:
P( F F ) 1 F ( F )
F
f ( F )dF
方差分析
图6-1 F分布密度曲线
F分布的取值范围是(0,+∞),其平均值为������������ =1。 附表4列出了不同自由度条件下的右尾概率。 应用举例 当������������1 =3, ������������2 =18时,������0.05(3,18) =?? 方差分析
方差分析
第四步
列出方差分析表 方差分析表
平方和 (SS) 24.3215 0.0060 24.3275 自由度 (df) 3 16 19
变异来源 处理间 处理内 总变异
均方(MS) 8.1072 0.0004
F值 20268**
方差分析
5.多重比较 F检验的结果显著,仅说明k个平均数间有显著差异, 但不能说明哪些平均数间有显著差异。 定义:判断不同处理平均数两两间差异的显著性, 每个处理的平均数都要与其他的处理进行比较, 这个种差异显著性检验方法就叫做多重比较。 方法:主要有(1)最小显著差数法LSD,(2) 最小显著极差法LSR(q检验法和邓肯检验法)
方差分析
线性数学模型 ������������������ = ������ + ������������ + ������������������ ������������������ = ������.. + (������������. − ������.. ) + (������������������ − ������������. ) kn观测值的总变异=处理间的变异+处理内的变异 其中第i处理j个观测值分解为:全试验观测值总体的 平均数(������)、第i个处理的效应(������������ )和试验误差(������������������ )。 ������������������ 相互独立且服从正态分布,所以各处理A������ 所属总 体也服从正态分布N(������������ ,������ 2 )。 基本假定 效应的可加性、分布的正态性、方差 的同质性(各处理的方差相等)。

生物统计4-方差分析

生物统计4-方差分析

第六章 方差分析一、方差分析的统计意义上章讨论的t 测验、u 测验是适应于两样本相比较的假设测验,不适于多样本比较,因为: 1) 对多个样本进行两两比较的t 测验手续实为麻烦。

如k =3个样本,要作3次测验;k =10个样本,作k (k -1)/2=45次测验。

2) 犯α错误的可能性增大。

因为两两之间取α=0.05,实际k 个样本,则k (k -1)/2次的α>0.05;且k 越大,α被扩大得越多。

3) 估计试验误差时的精确度有所损失。

设k 个样本,每一样本容量均为n ,则用t 测验,每次自由度v =(n -1)+(n -1)=2(n -1);对多个样本,v ’=k (n -1);当k =2时,v =v ’;当k ≥3时,v ’>v 。

又因为:12()x x s -=21212e ss ss s v v +=+ v =v 1+v 2 v 减小,s e 变大,12()x x s -变大。

二、自由度和平方和的分解设:k 组样本,每样本均具有n 个观察值(即样本容量相同),共有nk 个观察值。

i =1~k ,j =1~nT =ij x x =∑∑T :total 总的;t :treatment ,处理;e: error, 误差 总变异:总自由度V T =kn -1总平方和SS T =2222()()ij x x x x x C nk-=-=-∑∑∑∑矫正数:C =2()x nk∑总变异可分解为组内(随机误差)和组间(效应)两部分: 组间变异:组间自由度V t =k -1组间平方和SS t =22()ii T n x x C n-=-∑∑组内变异=总变异-组间变异组内变异:V e =V T -V t =(nk -1)-(k -1)=k (n -1)【或者这样理解:每组组内自由度为(n -1),有k 组,共计:V e =k (n -1)】 组内平方和:SS e =SS T -SS t 证明从略! 均方=平方和/自由度 总均方S T 2=2()1ijxx nk --∑组间均方22()1i t n x x S k -=-∑组内均方22()(1)ix x Se k n -=-∑∑例:以A 、B 、C 、D 4种药剂处理水稻种子,其中A 为对照,每处理各得4个苗高观察值(cm ),请分解其自由度和平方和。

生物统计与田间试验:第六章 方差分析 第3-6节r1

生物统计与田间试验:第六章 方差分析 第3-6节r1

固定模型是指各个处理的平均效应 i ( μi μ) 是固定 的一个常量,且满足 i 0(或 ni i 0 ),但常数未知;
主要是研究并估计处理效应;固定模型中所得的结论仅在
于推断关于特定的处理;
随机模型是指各个处理效应 i不是一个常量,而是从
平均数为零、方差为
2的正态总体中得到的一个随机变量,
表6.1 每组具n个观察值的k 组数据的符号表
组别 观察值 ( yij,i=1,2,…,k;j=1,2…,n) 总和 平均 均方
1 y11 y12 … y1j …
y1n
T1 y1 s12
2 y21 y22 … y2j …
y2n


T2
y2
s
2 2
i
yi1 yi2 … yij …
yin
… …
Ti
表6.13 多重比较时的 LSR0.05
LSR0.01
2
3.01
4.17
3.90
5.41
3
3.16
4.37
4.10
5.67
4
3.25
4.50
4.22
5.84
5
3.31
4.58
4.29
5.94
表6.14 施肥效果的显著性(SSR测验)
处理
尿素 碳酸氢铵 氨水1 氨水2 不施
变异来源 品种间
DF
SS
MS
期望均方(EMS):
固定模型
4
87.6 21.90
2 n 2
品种内(试验误差) 10 24.0 2.40
2
若 i 0 ,则F值等于1。
所以固定模型是测验假设H0: i 0 (i=1,2,…,k)

生物统计学-方差分析

生物统计学-方差分析

x2n x3n
xin xi·
xan xa·
x1 · x2 · x3 ·
每一个观察值可以通过如下常用的所谓线性统 计模型(linear statistical model)描述:
i 1,2,, a xij i ij j 1,2, n
(2 1)
其中:xij 是在第 i 水平(处理)下的第 j 次观 察值。μ是对所有观察值的一个参量,称为总 平均数(overall mean)。αi是仅限于对第 i 次 处理的一个参量,称为第i次处理效应 (treatment effect)。方差分析的目的,就是要 检验处理效应的大小或有无。ij是随机误差成 份。
有时固定因素和随机因素很难区分,除 上述所讲的原则外,还可以从另一角度鉴别。 固定因素是指因素水平,可以严格地人为控 制。在水平固定之后,它的效应值也是固定 的。例如,研究三种温度对胰蛋白酶水解产 物的影响。因为温度水平是可以严格控制的, 即每一温度水平,在各个重复之间都可以准 确地控制在一个固定值上,所以在重复该实 验时,水解产物的产量也是固定的。简单地 说,在水平(不同温度)固定以后,其效应 值(产量)也是固定的。因此,温度是固定 因素。
验方法,是将总变异按照来源分为处理效应和试验
误差,并做出其数量估计。
发现各变异原因在总变异中相对重要程度的一
种统计分析方法。
二、方差分析的基本原理
总变异分解为组间变异和组内变异。 组内变异是个体差异所致,是抽样误差。 组间变异可能由两种原因所致, 一是抽样误差; 二是处理不同。 在抽样研究中抽样误差是不可避免的,故 导致组间变异的第一种原因肯定存在;第二种原因 是否存在,需通过假设检验作出推断
随机因素的水平是不能严格地人为控制 的,在水平确定之后,它的效应值并不固定。 例如,在研究不同农家肥施用量对作物产量 的影响试验中,农家肥是因素,不同施用量 是该因素的不同水平,作物的产量是它的效 应值。由于农家肥的有效成份很复杂,不能 像控制温度那样,将农家肥的有效成份严格 地控制在某一个固定值上。在重复试验时即 使施以相同数量的肥料,也得不到一个固定 的效应值。即在因素的水平(施肥量)固定 之后,它的效应值(产量)并不固定,因而 农家肥是一随机因素。

生物统计学 第六章 方差分析

生物统计学 第六章   方差分析
(1)LSD法
该法是最小显著差数(Least significant difference) 法的简称,是Fisher 1935年提出的,多用于检验某一对 或某几对在专业上有特殊探索价值的均数间的两两比 较,并且在多组均数的方差分析没有推翻无效假设H0 时也可以应用。该方法实质上就是t检验,检验水准无 需作任何修正,只是在标准误的计算上充分利用了样 本信息,为所有的均数统一估计出一个更为稳健的标 准误,因此它一般用于事先就已经明确所要实施对比 的具体组别的多重比较。
xij i ij
它是方差分析的基础。
6.2 方差分析的原理
方差分析的基本原理是认为不同处理组的均数间 的差别基本来源有两个: (1) 随机误差,如测量误差造成的差异或个体间的差 异,称为组内差异,用变量在各组的均值与该组内变 量值之偏差平方和的总和表示,记作 SS e ,组内自由度 df e 。 (2) 实验条件,即不同的处理造成的差异,称为组间 差异。用变量在各组的均值与总均值之偏差平方和表 示,记作 SSt ,组间自由度 df t 。 总偏差平方和 SST SSt SSe 。
6.1 方差分析的相关术语
研究马氏珠母贝三亚、印度品系在不同地区的生 长差异,选择同一批繁殖的两品系马氏珠母贝的稚贝, 分别在海南黎安港、广东流沙港、广西防城港三个海 区进行养殖,每个地区每个品系养殖1000个,1年后 测定马氏珠母贝壳高与总重,比较生长差异。 这里壳高与总重称为试验指标,在试验中常会测定 日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生 理生化和体型指标(如血糖含量、体高、体重)等,这些 都是试验指标,就是我们需要测量的数据。
6.4 均值间的两两比较
对完全随机设计多组平均水平进行比较时,当资料满 足正态性和方差齐性,就可以尝试方差分析,若得到 P>α的结果,不拒绝零假设,认为各组样本来自均数相 等的总体,即不同的处理产生的效应居于同一水平, 分析到此结束; 若方差分析结果P≤α,则拒绝零假设, 接受备择假设,认为各处理组的总体均数不等或不全 相等,即各个处理组中至少有两组的总体均数居于不 同水平。这是一个概括性的结论,研究者往往希望进 一步了解具体是哪两组的总体均数居于不同水平,哪 两组的总体均数相等,这就需要进一步作两两比较来 考察各个组别之间的差别。

卫生统计学 第六章 方差分析

卫生统计学 第六章 方差分析

ν
Байду номын сангаасk-1
MS
SS 处理/ν
处理
F
MS 处理/MS 误差
区组间
1 n k ( xij ) 2 C k j 1 i 1
n-1
SS 区组/ν
区组
MS 区组/MS 误差
误差 总
SS 误差=SS 总- SS 处理-SS 区组
(k-1)(n-1) N-1
SS 误差/V 误差
x
i 1 j 1
两两比较方法选用
1、在研究设计阶段未预先考虑或预料到, 经假设检验得出多个总体均数不全相等的 提示后,才决定的多个均数的两两事后比 较(post hoc comparisons/unplanned comparisons),常用于探索性研究 exploratory research,两两比较用:SNK 法、Bonfferoni t检验、Sidak t检验
棉与府 棉与的 棉与尼 府与尼
两均 数之 差标 准误
q值 处 q临 理 界值 数T 0.05
q临 P 界值 值 0.01
府与的
的与尼
比较时应将均数按大小顺序排列,一般先 比较相关最大的两个均数 q的分布与两比较组间跨度a及自由度有关。 组间跨度a(对比组内包含组数a)是指XA与 XB之间涵盖的均数个数,包括XA与XB自身 在内 MS误差为误差均方或组内均方 依q值、组间跨度a(处理数Ti)、误差自由度 及检验水准查q值表,q≥qα (a,ν )时,有统计 学意义(P553,附表6-4)
第五节 拉丁方设计资料的 方差分析*
一、拉丁方设计latin square design:设计因 素(标志)两个以上,各因素的水平数相同, 可用此设计。拉丁方是以拉丁字母排列的 方阵的简称。 二、分析步骤:,例6-6,P68 1、求C 2、求l总 3、求l受试者

【生物统计】第六章 方差分析

【生物统计】第六章 方差分析

722 922 562 1162 SSt C 7056 504 n 4
Ti 2
dft k 1 4 1 3
SSe SST SSt 602 504 98
dfe dfT dft k (n 1) 4 (4 1) 12
yij y

试 验 误 差
yi y
A BLeabharlann yij yiA B C



-2 -2 -2 -2
0 0 0 0
2 2 2 2
-3 -2 -2 -1
-1 0 0 1
0 1 2 5
-1 0 0 1
-1 0 0 1
-2 -1 0 3
SSt n( yi y )2 32
SST ( yij y )2 50
2 2
因为
SST ( yij y ) ( yij yi yi y )
2
( y y ) 0
i
所以 SST SSt SSe
第一节 方差分析的基本原理
自由度的分解 总自由度: 处理项自由度: 误差项自由度:
dfT nk 1
dft k 1
dfe dfT dft k (n 1)
SSe ( yij yi )2 18
第一节 方差分析的基本原理
通过前面的平方和的直观分解可以看出: SSe SSt
SST SSt SSe
2
当然也可以由公式推导出来:
( yij yi ) ( yi y ) 2 (yij yi ) ( yi y )
18 23 14 29
y 21
第一节 方差分析的基本原理

生物统计学第6章

生物统计学第6章

ANOVA基本步骤
生物统计
Chap.6 Analysis of Variance I
• 零假设:处理无效( 1= 2= 3= 4) • 备择假设:处理有效(至少两个均数不等)
• 基本计算(1): X i. X i.
X .. X
• 基本计算(2): SST SSE SSA dfT dfA dfE
组内变异: 由于同组内的个体来自同一总体(接受同
一处里),因此组内变异仅仅是由于个体之间的 随机误差造成。 组间变异:
不同组个体间的变异,除了个体之间的随机 误差以外,还包括不用处理(不同的组来自不用 总体)所造成的差异。
方差分析法的基本思想:
组间变异 组内变异
检验统计量
比较组间变异和组内变异,如果组间变异显
误差均方
• 显著性水平:
c
总的一型错误概率 需要比较的次数
饲料
1 2 • 34例
增重 57 42 60 37 54 13 33 19 39 41 13 29 20 15 13 18 22 13 24 38
N = 20, X·· = 600, X
生物统计
Chap.6 Analysis of Variance I
dfT N 1 32 1 31
dfE N k 32 4 28 dfA k 1 4 1 3
定义统计量 均方(MS) 平方和自由度
MSA
SSA df A
85.8563 3 16.855, MSE
SSE dfE
47.5409 1.6979 28
实例-小鼠脾脏
生物统计
Chap.6 Analysis of Variance I
生物统计
Chap.6 Analysis of Variance I

生物统计学6方差分析

生物统计学6方差分析

SS A = Σ TA2 /nb -C = 1913.17 3 1
3
3
3 6 22 26 11 65
=(2752 + 408 2 + 4872 )/ 12 -38025 4 2 1
2
3 47 59 50 40 196
SS B = Σ TB2 /na -C = 3633.5 5 2
2
3
1 43 38 33 36 150
再分解原理算得的剩余SS、DF值可与之“相互佐证”,类似会计记帐时的“逼角”,是正交 表在经典试验统计中所能起到的十分独特的功用; ⑶用正交表参与复因素试验结果的方差分析过程体现了正交表与复因素试验的内在联系,认识 这种必然性对正确理解正交表在建立多元统计模型中的作用非常重要,即:正交试验设计 →回归正交设计→回归旋转设计(旋转组合设计); ⑷有正交表参与方差分析过程时,处理平方和SSt 的再分解步骤异常简洁、直观,本来烦琐的 复因素试验结果的平方和再分解运算变成用几乎是同一个算式循环操作,其程序无须专业 人员就可编制,个人电脑应用起来十分方便。
8
3
2
1
3 55 38 47 44 184
dfT = nab - 1= 4 × 9 - 1 = 35
93
3
2
1 30 33 26 19 108
SST = ΣΣY 2 -C = 7989
T1 275
529 384 396 C=38025
T
= 412 +49 2 + ┅ +19 2 -38025 T2 408
⑴A
⑵B
⑶C ⑷空


Tt
1
1
1
1
1
63.4 67.4 130.8

生物统计学第六章方差的全面分析

生物统计学第六章方差的全面分析

t检 验 的 统 计 量 是
x1x2
(n11)s1 2(n21)s2 2 n1n22
n 11n 12
这部分是对差 原 2的 始估 数计 据, 方它样 只本 用的 了数 两
但我们 a个有 样本,没有 时被 的全 利部 用同 来 2。估 所以,我们 2的 认估 为计 对有待改善。
因此,两两t检验生的物统精计学确第六性章方有差的待全面提。 分析高
a5时1作 次 0 检 H 0被 验接 ,受1 的 ) 1概 = 00.9率 15 = 00.5 为 98 (
I型错 1- 0 误 .59= 80.4 7013
通过以上分 a的析 增, 大随 , I型 着 检错 验误 的的 大大增大,是 这不 样可 的靠 检的 验。
生物统计学第六章方差的全面分析
原因(3)检验统计量的精确性低
生物统计学第六章方差的全面分析
5、试验处理(treatment):在试验对象上实施的事先设计 好的具体项目,简称处理。在进行单因素试验时,试验因 素的一个水平就是一个处理;对于双因素试验,处理的个 数等于两个因素水平个数的乘积。每个处理可以看做是一 个总体,每个处理得到的一组数据可以看做是从这个处理 总体中抽取的一个样本的数据。
2、试验指标(experiment index):为衡量试验结果的好坏 或处理效应的高低,在试验中具体测定的性状或观测的项目。
3、试验因素(experiment factor):试验中所研究的影响试 验指标的因素:单因素、双因素或多因素试验。
4、因素水平(level of factor):因素的具体表现或数量等级。
(二)两类方差
1、处理内方差:在因素的同一水平(同一个总体)下,样本 数据的方差
2、处理间方差:因素的不同水平(不同总体)下,各样本之 间的方差。

第六章 方差分析 华中农业大学生物统计学讲义

第六章 方差分析 华中农业大学生物统计学讲义

报警器型号
A1(甲型) A2(乙型) A3(丙型) A4(丁型)
反应时间
∑ xi
5.2 6.3 4.9 3.2 6.8 26.4 5.28 7.4 8.1 5.9 6.5 4.9 32.8 6.56
3.9 6.4 7.9 9.2 4.1 31.5 6.30
12.3 9.4 7.8 10.8 8.5 48.8 9.76
假定有k组观测数据,每组有ni个观测值
处理 重复 1 2 … i … k
1
x11 x21

xi1
… xk1
2
x12 x22
… …xi2
… xk2
… …… …… ……
j
x1j x2j

xij
… xkj
… …… …… ……
ni
x1n1 x2n2

xini
… xknk
平均
x1
x2

xi

xk
x
方差
S12 S22
试问(1)各种型号报警器的反应时间有无显 著差异? (2)如果各种型号报警器的反应时间有显著 差异,那么何种最优?
分析: 因素是报警器的型号,记作A;
因素A的不同水平是各种具体的型号:甲型 乙型、丙型、丁型,分别记作A1,A2,A3,A4; 我们关心的指标值是反应时间.在方差分析中 我们主要希望解决下面两个问题: (1)因素对指标有无显著影响?(2)若因 素有显著影响,取何种水平时指标值最优?
缺点
1.检验过程烦琐。
试验包含4个处理
t 检验: C42 = 6次
2.推断的可靠性低,检验时犯α错误概率大。
t检验: C42 =6次
6次检验 相互独立

《生统》第六章 方差分析

《生统》第六章 方差分析

Ak 合计
xkn
xk.
xk .
x..
x..

以总体参数表示,有:
xij i ) xij i) ( ( = i ij
——第 i 个处理的效应 i 0 ij~ N (0, 2 ) ——试验误差
二 、平方和与自由度的分解
2 i 1 i 1 j 1
k
k
n
SST
SSt

SSe
总平方和 处理间平方和 处理内平方和
SST ( x ij x.. ) 2
i 1 j 1
k n
k
n
( xi . x ..) 2 2( xi . x ..)( xij xi .) ( xij xi .) 2
i 1
k
k
k
n
k
n
i 1
j 1
i 1 j 1
=0
n ( xi. x.. ) ( xij xi. )2
2 i 1 i 1

SSe
总平方和 处理间平方和 处理内平方和
组间平方和 组间变异
between group variation
Sum of Squares Among
SS MSe e df e
(x ij x i. )
k (n 1)

SS i
k (n 1)

SS1 SS 2 SS k df1 df 2 df k
2 df1 S 12 df 2 S 2 df k S k2 S e2 估计 2 df1 df 2 df k
基本概念:

生物统计学3

生物统计学3

第六章 方差分析引言在第四、五章中,学习了单样本与总体或两样本间平均数的显著性检验。

然而,在生物学研究中,常收集到多样本的数据,对这些多样本间平均数差异的统计分析方法即为方差分析(多样本分析)。

方差分析不仅能够分析单因素多水平(处理)效应值间平均数的差异,还能同时分析两个因素、多个因素多水平间平均数的差异,以及各因素间的交互作用。

方差分析是对多因素总体作用的检验,各因素内水平间一对一的比较方法是多重比较。

在方差分析检验差异显著的前提下,进行多重比较的分析。

本章仅对单因素和两因素方差分析,以及多重比较进行介绍。

学习目标1.辨析概念:固定因素和随机因素;固定模型、随机模型和混合模型。

2.掌握适于进行方差分析的不同类型生命科学数据。

3.理解不同方差分析模型计算过程的异同。

4.在方差分析中,固定因素和随机因素在对统计结果进行解释时的不同。

5.掌握方差分析的基本步骤。

6.了解多重比较的前提条件,掌握常用比较方法。

第六章 方差分析方差分析又叫变量分析,它是对多个样本平均数差异显著性检验的一种引伸。

在对多个样本进行比较时,如果用t 检验就会产生较大的误差,提高了犯α错误的概率。

例如我们用t 检验一对一比较的方法检验4个样本平均数之间的差异显著性,就需要做624=C 次检验,每次无效假设的概率都是l 一α=0.95,而且这些检验都是独立的,那么6次都接受的概率是(0.95)6=0.735,犯α错误的概率为1—0.735=0.265,即6次犯错误可能性的累积,因此所犯错误的概率大大增加,使用方差分析就可以避免这一问题。

方差分析是对各因素总体处理效应的显著性检验。

第一节 方差分析的基本原理方差亦称均方,是标准差的平方,是表示变异的量。

在一个多处理试验中,可以得到多组不同的观测值。

各组观测值不同的原因可以分为两大类,一类是因素处理的不同引起的,叫处理效应或条件变异,另一类是试验过程中偶然性因素的干扰和测量误差所致,称为误差或试验误差。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

鱼的增重有非常 p=0.0438<0.05,有显 著差异;A1与A2间 显著的差异。
p=0.0041<0.01,有非 常显著的差异。
6.3 单因素方差分析
字母法表示的多重比较比较简洁。首先根据均值由大到小将A因 素的4个水平从上而下排列,均值排在第二列,第三列是5%显 著水平,用小写字母a、b、c等表示各因素之间的差异。第四列 是1%的显著水平,用大写字母A、B、C等表示。在5%或1%的 水平上,无论哪两个水平比较,只要看到有相同字母,就是无 显著差异,只有完全不同的字母,才是有显著差异。如在5%显 著水平,A1的“a”与A4的“b”,是完全不同的字母,就表示A1 与A4之间有显著差异;而在1%的极显著水平,A1的“A”与A4 的“AB”,由于含有相同字母“A”,就表示两者没有极显著的 差异;而A1的“A”与A2的“B”,就表示两者间有极显著的差异。
318
268 273 290
284
279 249 245
359
262 258 286
6.3 单因素方差分析
① DPS
输入数据并选择数据,点击菜单试验统计→完全随 机设计→单因素试验统计分析:
6.3 单因素方差分析
① DPS
弹出对话框,数据转换方式默认为不转换,不修改; 多重比较方式默认为Tukey法,修改为LSD法;各个处 理名称选择第一列:
如果试验中的因素既包括固定效应,又包括随机效应, 则试验需要用混合模型来处理。例如,为了推断全国 6~7岁男孩的身高发育是否平衡,从所有省(市、自治 区)中随机选取5个省,每个省又分为城市与农村两类, 各抽取30例数据进行分析。其中城市与农村2个水平组 成的地区因素是固定因素,而省份的5个水平是通过抽 样确定的,是随机因素。该实验资料就要用混合模型 来处理。
6.1 方差分析的相关术语
本例的试验涉及两个因素,称为二因素试验,试 验共有2×3=6个水平组合,即6个处理。每个马氏珠 母贝就是一个试验单位,每个地区每个品种养殖1000 个,1000称为重复。
这里因素A的2个水平三亚品系与印度品系是固定的, 特意选择的,因素B的3个养殖海区也是特意选择的, 我们在处理时要用固定模型来处理,得到的结论仅仅 适用试验所涉及的2个品系与3个海区。比如马氏珠母 贝在流沙港、徐闻、大亚湾都有养殖,但我们不能拿 流沙港的养殖结果说明徐闻与大亚湾的养殖情况。
第六章 方差分析
方差分析主要用途:
①均数差别的显著性检验
②分离各有关因素并估计其对总变异的作 用 ③分析因素间的交互作用
④方差齐性检验。在科学实验中常常要探 讨不同实验条件或处理方法对实验结果的 影响。
第六章 方差分析
通常是比较不同实验条件下样本均值 间的差异。 例如医学界研究几种药物对某种疾病 的疗效;农业研究土壤、肥料、日照时间 等因素对某种农作物产量的影响;不同化 学药剂对作物害虫的杀虫效果等,都可以 使用方差分析方法去解决。
xij i ij
它是方差分析的基础。
6.2 方差分析的原理
方差分析的基本原理是认为不同处理组的均数间 的差别基本来源有两个: (1) 随机误差,如测量误差造成的差异或个体间的差 异,称为组内差异,用变量在各组的均值与该组内变 量值之偏差平方和的总和表示,记作 SS e ,组内自由度 df e 。 (2) 实验条件,即不同的处理造成的差异,称为组间 差异。用变量在各组的均值与总均值之偏差平方和表 示,记作 SSt ,组间自由度 df t 。 总偏差平方和 SST SSt SSe 。
6.4.1 事先计划好的几对均数间的比较
适用于证实性研究。在设计时就设定了要比较的 组别, 其他组别间不必作比较。常用的方法有:Dunnett 检验、LSD检验。这两种方法不管方差分析的结果如 何——即便对于P稍大于检验水准,也可进行所关心组 别间的比较。
6.4.1 事先计划好的几对均数间的比较
6.1 方差分析的相关术语
研究马氏珠母贝三亚、印度品系在不同地区的生 长差异,选择同一批繁殖的两品系马氏珠母贝的稚贝, 分别在海南黎安港、广东流沙港、广西防城港三个海 区进行养殖,每个地区每个品系养殖1000个,1年后 测定马氏珠母贝壳高与总重,比较生长差异。 这里壳高与总重称为试验指标,在试验中常会测定 日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生 理生化和体型指标(如血糖含量、体高、体重)等,这些 都是试验指标,就是我们需要测量的数据。
第六章 方差分析
对于样本平均数的假设检验,u检验 或t检验可以对样本平均数与总体平均数的 差异及两个样本平均数间的差异进行检验。 在实际研究中,常常需要对三个及三个以 上的样本平均数进行比较,此时如果仍用u 检验或t检验进行两两比较,就会出现检验 繁琐、误差估计的精确性与检验的灵敏性 降低等问题。使用方差分析就可以避免这 些问题。
6.2 方差分析的原理
如果计算结果的组间均方远远大于组内均方 MSt MS e, F>F0.05(dft,dfe),p<0.05,拒绝零假设,说明样本来自 不同的正态总体,说明处理造成均值的差异有统计意
义;
否则, F<F0.05(,),p>0.05,接受零假设,说明样本来自 相同的正态总体,处理间无差异。
6.4.1 事先计划好的几对均数间的比较
(1)LSD法
例如,在一个单因素4水平试验中,共有A1、A2、A3、 A4这4个处理,设计时已确定只是A1与A2、A3与 A4(或1与3、2与4;或1与4、2与3)比较,而其它的处 理间不进行比较。由于该方法本质思想与t检验相同, 所以只适用于两个相互独立的样本均数的比较。LSD 法单次比较的检验水准仍为α,因此可以认为该方法是 最为灵敏的两两比较方法。
6.2 方差分析的原理
方差分析是建立在一定的线性可加模型的基础上 的。所谓线性可加模型是指总体每一个变量可按其变 异的原因分解成若干个线性组成部分,每一次观察值 都包含了总体平均数、因素主效应、随机误差三部分, 这些组成部分必须以叠加的方式综合起来,即每一个 观察值都可视为这些组成部分的累加和,即:
6.4 均值间的两两比较
对完全随机设计多组平均水平进行比较时,当资料满 足正态性和方差齐性,就可以尝试方差分析,若得到 P>α的结果,不拒绝零假设,认为各组样本来自均数相 等的总体,即不同的处理产生的效应居于同一水平, 分析到此结束; 若方差分析结果P≤α,则拒绝零假设, 接受备择假设,认为各处理组的总体均数不等或不全 相等,即各个处理组中至少有两组的总体均数居于不 同水平。这是一个概括性的结论,研究者往往希望进 一步了解具体是哪两组的总体均数居于不同水平,哪 两组的总体均数相等,这就需要进一步作两两比较来 考察各个组别之间的差别。
(3)SNK检验
SNK(Student-Newman-Keuls )检验也称为q检验法。
(4)Tukey法
原理与SNK检验基本相同,该方法要求各比较组样本含量相 同。这种方法比LSD法有更高的检验效能,具有很好的稳定性, 适用于大多数场合下的两两比较,计算简便。但是,Tukey法是 基于比较组全部参与比较这一假设下进行的,因此在只比较指 定的某几组总体均数时并不适用,建议选择Dunnett法或者是 Bonferroni方法,因为这两种方法会给出较高效能的检验结果。 如果各组样本含量不等,需要用修正的Tukey法(Tukey-Kramer 法),功效高于Bonferroni法、Sidak法或Scheffe法。
6.1 方差分析的相关术语
有时候,因素的水平不是常量,而是由随机因素 引起,例如,将引进的美国黑核桃在全国随机选择8个 不同纬度种植,观察其在不同地理条件下的适应情况, 由于各地气候、土壤肥度等都是无法人为控制的,属 于随机因素,就需要用随机模型来处理,试验结论可 以推广到随机因素的所有水平。
6.1 方差分析的相关术语
6.3 单因素方差分析
例6.1 某水产研究所比较四种不同配方的饲料对鱼的饲 养效果,选择了条件相同的鱼20尾,随机分成四组, 投喂不同饲料,1个月后,各组鱼的增重(g)资料见 下表,试进行方差分析。
饲料 重复1 重复2 重复3 重复4 重复5
A1
A2 A3 A4
319
248 221 270
279
257 236 308
6.4.1 事先计划好的几对均数间的比较
(2)Dunnett法
该法适用于k个处理组与一个对照组的均数差异比较。 默认的对照组是最后一组。适用于n-1个试验组与一个 对照组均数差别的多重比较,多用于证实性研究。
检验时可以选择双侧或单侧检验。要检验实验组的 均值是否不等于控制组的均值,就使用双侧检验。要 检验实验组的均值是否小于控制组的均值,就选择“< 控制”。类似地,要检验实验组的均值是否大于控制 组的均值,请选择“>控制”。
6.4 均值间的两两比较
均数间的两两比较根据研究设计的不同分为两种类型: 一种常见于探索性研究,在研究设计阶段并不明确哪 些组别之间的对比是更为关注的,也不明确哪些组别 间的关系已有定论、无需再探究,经方差分析结果提 示“概括而言各组均数不相同”后,对每一对样本均 数都进行比较,从中寻找有统计学意义的差异;另一 种是在设计阶段根据研究目的或专业知识所决定的某 些均数间的比较,常见于证实性研究中多个处理组与 对照组、施加处理后的不同时间点与处理前比较。最 初的设计方案不同,对应选择的检验方法也不同,下 面分述两种不同设计均数两两比较的方法选择。
(1)LSD法
该法是最小显著差数(Least significant difference) 法的简称,是Fisher 1935年提出的,多用于检验某一对 或某几对在专业上有特殊探索价值的均数间的两两比 较,并且在多组均数的方差分析没有推翻无效假设H0 时也可以应用。该方法实质上就是t检验,检验水准无 需作任何修正,只是在标准误的计算上充分利用了样 本信息,为所有的均数统一估计出一个更为稳健的标 准误,因此它一般用于事先就已经明确所要实施对比 的具体组别的多重比较。
相关文档
最新文档