0432完全随机试验的方差分析
方差分析
第三节 随机区组设计资料的方差分析
一、随机区组设计
1。随机区组设计
随机区组设计又称配伍组设计,是配对设计的扩展。 首先从总体中随机抽样,然后将样本中的所有受试对 象,按条件相同或相近配成若干组(随机区组或配伍 组),再将每组中的几个受试对象随机分配到不同的 处理组中去,这种设计的方法称随机区组设计。
变异程度。计算公式如下:
SS总
2
Xij X
X
2 ij
C
其中:
C X 2 N
用离均差平方和表示总变异大小受样本容量
的影响,样本容量越大,SS越大,所以必须扣 除n的影响,严格的讲是扣除ν的影响。
总变异的自由度:ν 总=N-1
SS总总 称为总变异的均方,用MS总表示。
2。完全随机设计资料的分析方法
完全随机设计资料在进行统计分析时,需根 据数据的分布特征选择方法,对于正态分布且方 差齐的资料,常采用完全随机设计的单因素方差
分析(one-way ANOVA)或两样本t检验(g=2);
对于非正态或方差不齐的资料,可进行数据变换 或采用秩和检验。
二、完全随机设计方差分析
SS区组 区组
MS区组 MS误差
误差 SS总 SS处理 SS区组 (g 1)(n 1) SS误差 误差
其中:C ( X )2 N
例4-4 某研究者采用随机区组设计进行实验,比较三 种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤 小白鼠按体重大小配成5个区组,每个区组内3只小白鼠 随机接受三种抗癌药物(具体分配结果见例4-3),以 肉瘤的重量为指标,试验结果见表4-9。问三种不同的 药物的抑瘤效果有无差别?
方差分析
τi
的变异度,故推断也不是关于某些供试处理, 的变异度,故推断也不是关于某些供试处理,而 是关于抽出这些处理的整个总体。 是关于抽出这些处理的整个总体。所以方差分析 要测验的假设是 H 0:σ τ2 = 0 对 H A:σ τ2 〉 0
第四节
常用试验设计资料的方差分析
一、完全随机设计资料的方差分析(见前述) 完全随机设计资料的方差分析(见前述) 二、巢式设计资料的方差分析
观 察 值 总 变 异 差
(
)
(一)平方和与自由度分解
按照上述变异原因分解进行各项平方和与自由度 的计算。 的计算。
(二)F测验 测验
巢式设计的资料属于系统分组资料, 巢式设计的资料属于系统分组资料,应注意在进 测验时, 行处理间(即组间)差异的F测验时,分母应为亚组 处理间(即组间)差异的 测验时 间方差;而进行亚组间差异的F测验时, 间方差;而进行亚组间差异的F测验时,分母应为误 差方差。 亚组间的差异未达到显著时, 差方差。当亚组间的差异未达到显著时,则应将亚组 间变异与误差进行合并,求出新的误差量, 间变异与误差进行合并,求出新的误差量,再对组间 差异进行F 差异进行F测验
PLSD0.01 〉 x1 − x 2 ≥ PLSD0.05
差异为显著; 差异为极显著; 差异为不显著。
x1 − x 2 ≥ PLSD0.01
x 1 − x 2 〈 PLSD0.05
最小显著极差法(least significant ranges) , (二)最小显著极差法 即LSR法。 法 主要介绍SSR法 SSR法即邓肯氏新复极差法。 主要介绍SSR法。SSR法即邓肯氏新复极差法。 SSR 法即邓肯氏新复极差法 步骤:1.根据平均数秩次距k和dfe查出SSRα值。 步骤:1.根据平均数秩次距k 查出SSR 根据平均数秩次距 秩次距是指相比较的两个平均数之间(含这两个平 秩次距是指相比较的两个平均数之间( 均数)包含的平均数个数。 均数)包含的平均数个数。 2.计算平均数标准误: 2.计算平均数标准误: 计算平均数标准误
方差分析(2次)
它除了推断k个样本所代表的总体均数µ1 ,µ2 , µ3 ,…是否相等外,还要推断b个区组所代表 的总体均数是否相等。由于从总变异中分离出 配伍组变异,考虑了个体变异对处理的影响, 使误差更能反映随机误差的大小,因而提高了 研究效率。
SS总 = SS处理 + SS配伍 + SS误差 df总 = df处理 + df配伍 + df误差
第一节
完全随机设计的方差分析
试验设计时,将受试对象随机分配到两组或 多组中进行实验观察,这里只涉及一个因素, 该因素的各个水平就是各个处理组。
单因素方差分析
或称单向方差分析(one way analysis of variance)或 成组设计(完全随机设计)方差分析,是指试验研究 的处理因素,或调查研究资料的分类方式只有一种。 这个处理因素(或分类方式)包含有多个离散的水平, 分析在不同水平上应变量的平均值是否来自相同总体
Xi = ∑ Xij ni
j =1
ni
X = ∑∑ Xij N = ∑ni Xi N
i =1 j =1 i =1
k
ni
k
SS总 = ∑∑ Xij − X
i=1 j =1
k
ni
(
)
2
ν总 = N −1
2、组间变异 、
SS组间 = ∑ni Xi − X
k
ν组间 = k −1
3、组内变异
i =1
(
)
2
MS组间 = SS组间 ν组间
一、基本思想
*
Xij表示第i个处理组的第j个观察值,i=1,2,…k, j=1,2,…ni
方差分析基本思想示意图
变异原因
统计:完全随机设计资料的方差分析
单因素多个均数比较的方差分析(完全随机设计资料的方差分析)方差分析的基本思想是:将全部观察值的总变异按影响实验结果的诸因素分解为若干部分变异,构造出反映各部分变异作用的统计量,之后构造假设检验统计量F,实现对总体均数的判断。
方差分析的应用条件:各样本相互独立,且均来自总体方差具有齐性的正态分布。
完全随机设计是一种将研究对象随机地分配到处理因素各水平组的单因素设计方法。
其研究目的是推断处理因素不同水平下的试验结果的差异有否统计学意义,即该处理因素是否对试验结果有本质影响。
下面以一个实例来说明完全随机设计方差分析的基本思想和假设检验步骤。
例:为研究烫伤后不同时期切痂对肝脏ATP(u/L)含量的影响,将30只大鼠随机分3组,每组10只,分别接受不同的处理,试根据下表资料说明大鼠烫伤后不同时期切痂对其肝脏的ATP(u/L)含量是否有影响大鼠烫伤后不同时期切痂肝脏ATP含量(u/L)烫伤对照组 24h切痂组 96h切痂组合计合计(∑X)(∑∑X ij)例数(n) 10 10 10 30(N)均数(X)平方和(∑X2) (∑∑X ij2)1.建立检验假设,确定检验水准:H0:u1=u2=u3,3个总体均数全相等,即3组大鼠肝脏的ATP含量值无差别;H 1:u 1,u 2,u 3,3个总体均数不相等.即3组大鼠肝脏的ATP 含量值有差别; a=2.计算检验统计量并列出方差分析表:①.计算离均数差平方和SS :首先计算每一组的合计、均数、平方和,再计算综合计数 (∑X ij 2),由表得: ∑∑X ij = ∑X ij 2= N=30 总的离均数差平方和SS 总=∑X ij2- (∑X ij )2 n= - 错误! =SS 组间=∑ (∑X ij )2 n i - (∑X ij )2n = 错误! + 错误! + 错误!- 错误!=SS 组内=SS 总- SS 组间 = - =②.计算均方MS : MS 组间 =SS 组间k-1(k 为组数) = 错误!= MS 组内 =SS 组内N-k(N 为总例数) = 错误!= ③.求F 值F = MS 组间MS 组内= 错误!=将上述计算结果列成方差分析表,如下:变异来源 平方和SS 自由度v 均方MS F 值 总变异 29组间变异 2 组内变异(误差) 27(注:自由度:v 总= N -1 = 30-1= 29;v 组间= k -1 = 3-1 = 2; v 组内=N -k = 30-3= 27)利用SPSS 作方差分析时,会得到类似于以下的方差分析表:DescriptivesCONTest of Homogeneity of VariancesCONANOVACON3.查表确定P 值,并作出统计推断:V 组间= 2, v 组内=27, 得界限值F α(2,27)为(2,27)= , 则F= > (2,27),则P<,按水准,拒绝H,可以认为3个总体均数不全相同,即3组大鼠肝脏的ATP含量值有差别。
8-完全随机设计的方差分析
26 26 30 28 21
水稻施肥盆栽试验,设A、B、C、D、E为5个处理。 A和B为工艺流程不同的氨水,C为碳酸氢钠,D为尿 素,E为对照(不施肥)。每处理重复4次(4盆) 随机放置于同一温室中,测其产量,试检验各处理 平均数的差异显著性。
自由度与平方和的分解
SS T SS t SS e df T df t df e
适 用 条 件
只适用于试验单元均匀一致的试验,如实验室试验
或各种环境影响相对容易控制。对于田间试验,很少使 用完全随机设计。
完全随机设计的方差分析
试验设计
设计方法与步骤
适用条件与特点
单因素试验结果的分析 二因素试验结果的分析
单因素完全随机设计
试验单元编号 随机分组 单因素盆栽试验、温室内、实验室内试验
总变异自由度 处理间自由度
误差自由度
df t ab 1
df e ab ( n 1)
自由度与平方和的分解
SS T
SS
A
2 A
y C
2
C
( y ) abn
2 B
2
T
bn
2பைடு நூலகம்
C
SS
T
an
B
C
SS t
T AB
n
SS
C
AB
SS t SS
A
SS
B
SS e SS T SS t
1 D 5
2 B 6
3 A 7
4 B 8
C
9 B 13 14 10
A
11 D 15
D
12 D 16
《医学统计学》医统-第八章方差分析
编辑课件
公共卫生系 流行病与统计学教研室
祝晓明
例 8-1 在评价某药物耐受性及安全性的I 期临床试验中,对符合纳入标准的30名健 康自愿者随机分为3组每组10名,各组注 射剂量分别为0.5U、1U、2U,观察48小 时部分凝血活酶时间(s)试问不同剂量的 部分凝血活酶时间有无不同?
编辑课件
编辑课件
• 方差分析
F=3.55, F>F0.05(2,18),P<0.05,三组大鼠 MT 含量的总体均值不全相同。
编辑课件
第三节 多个样本均数的两两比较
证实性研究
探索性研究
证实性研究 与探索性研究
编辑课件
Dunnett-t 检验 LSD-t 检验
SNK-q检验 Tukey检验 Schéffe检验
两个均数的比较时,同一资料所得结果与t检验等
价,即有如下关系 t 2 。F
2.方差分析的基本思想:将全部观测值的总变异按 影响因素分解为相应的若干部分变异,在此基础 上,计算假设检验的统计量 F 值,实现对总体均 数是否有差别的推断。
编辑课件
3. 方差分析有多种设计类型,但基本思想和计算步骤 相同,只是分组变量的个数不同,使用统计软件很容 易实现。 4.多重比较有多种方法,如 Dunnett-t 检验、LSD-t检 验、SNK-q (Student-Newman-Keuls)法 、Tukey法、 Schéffe法、Bonferroni t 检验和 Sidak t 检验。学习 中注意各种方法的适用性。
k1
的
2 分布, 2
2 ,
,认为方差不齐。
编辑课件
例8-1 资料方差齐性检验 提出检验假设,确定检验水准 H0:σ12=σ22=σ32 H1:三组方差不全相等 α=0.05
医学统计学:04 方差分析
1.4 f( F)
1.2
1.0
0.8
0.6
0.4
0.2
0.0
0
1
F 分布曲线
1 1, 2 5
1 5, 2 5
1 10,2 10
2F
3
4
F 界值表
附表4 F界值表(方差分析用,单侧界值) 上行:P=0.05 下行:P=0.01
分母自由度
υ2
1
161 1
4052
18.51 2
98.49
4.21 27
• 随机区组设计又称随机单位组设计、配伍组设计,也叫双因 素方差分析(two--way ANOVA)。是配对设计的扩展。
具体做法:
① 将受试对象按性质(如性别、年龄、病情等) (这些性质是
非处理因素,可能影响试验结果)相同或相近者组成m个单位 组(配伍组),每个单位组中有k个受试对象,分别随机地分 配到k个处理组。
2
7
33.4
18
2
8
38.3
19
2
9
38.4
20
2
10
39.8
21
3
1
32.9
22
3
2
37.9
23
3
3
30.5
24
3
4
31.1
25
3
5
34.7
26
3
6
37.6
27
3
7
40.2
28
3
8
38.1
29
3
9
32.4
30
3
10
35.6
35.51667
(Xij X )2
方差分析
F
MSBetween MSWithin
~ F(1 , 2 )
F分布
方差分析的最终统计推断和假设检验均依靠F分 布,所以适当了解一下F分布的特点十分有益。
F分布是英国统计学 家Fisher和Snedecor(斯内德 克 )提出的。
为了表示对Fisher的尊重, Snedecor将其命名为F分布。
进行一次假设检验,犯第一类错误的概率:
进行多次(k)假设检验,犯第一类错误的概率:
1-(1-)k
组数为3, k=3, 1-(1-0.05)k=0.1426 组数为4, k=6, 1-(1-0.05)k=0.2649 组数为5, k=10, 1-(1-0.05)k=0.4013 组数为6, k=15, 1-(1-0.05)k=0.5400
方差分析
方差分析,又称变异数分析。 Analysis of Variance,简写为ANOVA。 由英国统计学家R.A.Fisher提出。 方差分析的起源。 F检验。
Sir Ronald Aylmer Fisher
Fisher于Rothamste研究作物产量 时,完善了方差分析的思想
F 3.98
F(2,57)的F分布及界值
1
.8
.6
.4
.2
0.05
0
0
1
2
3
4
5
3.1588
完全随机设计资料的方差分析
1. H0: 1=2=3 ,即三总体均数相等; H1: 1, 2, 3 不等或不全相等。
=0.05。 2. 计算检验统计量: F=3.98 >3.1588(界值) 3. 对应的概率: P=0.0241(p<0.05) 4. 结论: 在=0.05水准,拒绝H0,接受H1,
随机区组设计方差分析
3.1733
3
3.7167
3
3.0133
3
2.9300
3
3.1133
3
3.4100
3
3.2933
3
3.1433
3
3.5033
30
(N )
3.2420 ( X )
0.6565 ( S 2 )
一、离均差平方和自由度的分解
从表9-6大白兔血中白蛋白减少量的数据中可以
看出,随机区组设计资料的变异除了总变异(即不考
随机区组设计方差分析
变异间的关系 变异之间的关系:
➢SS总= SS误差+ SS组间+ SS区组间 ➢总= 误差+ 组间+ 区组间
随机区组设计方差分析
二、随机区组设计资料方差分析的基本步骤
1.建立检验假设,确定检验水准
对于处理组:
H
:三个总体均数全相等,即A、B、C三种方案效果相同
0
H 1 :三个总体均数不全相等,即A、B、C三种方案的效果不全相同
随机区组设计方差分析
end
按随机区组设计方案,以窝别作为区组标志,给断 奶后小鼠喂以三种不同营养素A、B、C,问营养素对 小鼠所增体重有无差别。
表 8个区组小鼠按随机区组设计的分配结果
区组
1
2
3
4
56
7
8
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
随机区组设计方差分析
(3)确定P值,做出推断结论
分别以求F值时分子的自由度 v处理和v区组、分母的自 由度 v 误 差 查附表3的F界值表得处理效应的F值和区组 效应的P值。
方差分析-统计学原理
yij ai ij , j 1 ,2,..., m ,2,..., r, i ,i 1 r m ia i 0 i1 2 相 互 独 立 , 且 都 服 从 N (0, ) ij
H0 :a1 =a2 =…=ar =0
第三节 两因素方差分析 随机区组设计资料的方差分析
方差分析的应用条件
(1)各观测值相互独立,并且服从正态分布; (2)各组总体方差相等,即方差齐性。
方差分析的用途
1 2 3 4 用于两个或多个均数间的比较 分析两个或多个因素的交互作用 回归方程的假设检验 方差齐性检验
第二节 单因素方差分析 完全随机设计资料的方差分析
一、完全随机设计 完全随机设计是采用完全随机化的分组方法, 将全部试验对象分配到g个处理组,各处理组分别 接受不同的处理,试验结束后比较各组均数之间差 别有无统计学意义,以推断处理因素的效应。
一、 随机区组设计 随机区组设计( randomized block design ),又称 配伍组设计,是配对设计的扩展。 具体做法是:先按影响试验结果的非处理因素 将受试对象配成区组(block),再将各区组内的受 试对象随机分配到不同的处理组,各处理组分别接 受不同的处理,试验结束后比较各组均数之间差别 有无统计学意义,以推断处理因素的效应。
方差分析的基本概念
将衡量试验结果的标志称为试验指标。 将影响试验结果的条件称为因素。 因素在试验中所处的不同状态称为该因 素的水平。
只考察一个影响条件即因素的试验称为单因素 试验,相应的方差分析称为单因素方差分析。
二、变异分解 完全随机设计资料的方差分析表 变异来源 自由度 SS MS F 总变异
甲组 4.2 3.3 3.7 4.3 4.1 3.3
方差分析
Analysis of variation (ANOVA)
t 检验
单样本 两样本 样本均数与 总体均数 样本均数与 样本均数 n较小 n1、n2均较 小
u 检验 σ已知, σ未知但n足够大
n1、n2均较大
适用于 u 检验的资料都可以使用 t 检验
多个样本均数比较 方差分析(F检验)
方差分析的发明者
三、实例计算
例6.1 随机抽取50~59岁男性正常者、冠心病
人、脂肪肝患者各11人,测定空腹血糖值,试
推断三类人群总体均值是否相同?
3组观察对象空腹血糖测定结果(mmol/L)
组 别
甲组 乙组 丙组 4.75 5.03 6.26 4.61 5.78 5.42 4.75 4.77 4.57 4.21 4.36 5.24 5.12 5.26 6.68 5.44 5.14 6.09
各组样本含量可以相等也可以不等,相 等时检验效率较高。
由于完全随机设计的方差分析只有一个 研究因素, 所以又称为单因素方差分析。
一、数据的基本形式
完全随机设计方差分析的数据结构 … 第1组 第2组 第k组
X11 X12 ┇ X1j
┇ X1n
X21 X22 ┇ X2j
┇ X2n
… … … …
… … … … …
( ) 次 。若每次比 比较的次数为Ck 较的检验水准为α, 则每次比较不犯Ⅰ型错 误的概率为(1-α)。当这些检验独立进 行时, 则m次比较均不犯Ⅰ型错误的概率 为(1-α)m, 此时犯Ⅰ型错误的概率, 即总的 检验水准α变为1-(1-α)m。
2即
k 2
二、方差分析的目的
在无效假设成立的前提下, 通过分析各处 理组均数之间的差别, 以推断其各相应总体 均数间有无差别, 从而说明处理因素的效果 是否不同(或处理因素是否起作用)。
方差分析_精品文档
2021/5/27
44
2.2 组内观测次数相等的方差分析 K组处理中,每一处理皆有n个观测值,其方
差分析方法同前。
表5. 组内观测次数相等的单因素方差分析
2021/5/27
45
例2.测定东北、内蒙古、河北、安徽、贵 州五个地区冬季针矛的长度,每个地区
随机抽取4个样本,测定结果如表示,试 比较各地区针毛长度差异显著性。
27
其中平均数差数标准误计算公式:
s x1x2
s12s22 n1 n2
se2(n11n12)
当n1=n2时,sx1x2
2se2 n
s e 2 为处理内误差方差,n为每一处理观察次数。
2021/5/27
28
例1. 表1. 氨氮含量(ppm)
2021/5/27
29
根据例1, s 2se2 2*9.112.13
2021/5/27
9
1.4.1 平方和的分解 总平方和=处理间平方和+处理内平方和
SSTSSt SSe
k
S S T 1
n(x x )2x 2 ( x )2x 2 T 2
1
k n
k n
令 C T 2 ,
kn
SST x2C
SSt =
Ti2 C n
SSe SSTSSt
2021/5/27
10
2021/5/27
39
例如,分析不同施肥量是否给农作物产
量带来显著影响,考察地区差异是否影 响妇女的生育率,研究学历对工资收入 的影响等。这些问题都可以通过单因素 方差分析得到答案。
2021/5/27
40
• 单因素方差分析的第一步是明确观测变 量和控制变量。例如,上述问题中的观
方差分析
区组
k(x
j
b
j
x)
2
或
( xij ) 2 k
C*
b–1 N–k–b+1 或 (k–1) (b–1) N–1
误差
SS总 SS处理 SS区组
( x ) 2 x N
2
总
或
x
2
C
*
SS 总 N 1
*C
( xij ) 2
i j
k
b
N
( x ) 2
N
三、随机区组设计的方差分析
变异来源 SS v MS F P
组间 组内
总
2384.03 5497.84
7811.87
2 1192.01 27
29
203.62
5.8540
<0.01 (0.0077)
(3)确定P值和作出统计推断:
P<0.01,拒绝原假设,接受备择假设,可认 为三种人群的载脂蛋白不同。
三、随机区组设计的方差分析
例2. 对小白鼠喂以A、B、C三种不同的营养 素,目的是了解不同营养素增重的效 果。采用随机区组设计方法,以窝别 作为划分区组的特征,以消除遗传因 素对体重增长的影响。现将同品系、 同体重的 24只小白鼠分为8个区组,每 个区组3只小白鼠。三周后体重增加结 果(克)列于表3。问小白鼠经三种不 同营养素喂养后所增体重有无差别?
随机区组设计方差分析的计算公式 变异来源 离均差平方和(SS) 自由度(df) 均方(MS)
k i
F
处理组
n (x
i i
k
i
x)
2
或
b j
( xij ) 2
j
第三节 两因素完全随机设计试验资料的方差分析 《生物统计学》课件
上一张 下一张 主 页 退 出
(αβ)ij为Ai与Bj的互作效应
()ij ij i. . j
i , j , ij 分别为Ai、Bj、AiBj观测值总体
平均数;且
a
b
Байду номын сангаас
n
b
ab
i 0, j 0, ( )ij ( )ij
( )ij 0
i1
j 1
i1
j 1
i1 j1
上一张 下一张 主 页 退 出
因试验资料的总变异可分解为水平组合间 变异与水平组合内变异 即 误差两部分 ,若 记
A、B 水平组合间的平方和与自由度为 SSAB, dfAB,则两因素有重复观测值试验资料方差分
析平方和与自由度的分解式可表示为 :
SST SSAB SSe
dfT dfAB dfe
αi=μi-μ,βj=μj-μ
μi、μj分别为Ai、Bj观测值总体平均数,
且Σαi=0,Σβj=0; εij 为随机误差 ,相互独立 ,且服从
N (0,σ2)。
上一张 下一张 主 页 退 出
两因素交叉分组单个观测值的试验资料,
A因素的每个水平有b次重复,B 因素的每个 水平有a次重复,每个观测值同时受到A、B
上一张 下一张 主 页 退 出
A的效应随着B因素水平的不同而不同,反 之亦然,此时称A、B两因素间存在交互作用, 记为A×B。
或者说,某一因素的简单效应随着另一因 素水平的变化而变化时,则称该两因素间存在 交互作用。
互作效应可由(A1B1+A2B2-A1B2-A2B1)/2来估计。
表5-28中的互作效应为: (470+512-480-472)/2=15
完全随机试验的方差分析
表5-1-1 三个葡萄品种产量数据表
T=292
=10.8
解:(1)分解平方和与自由度:
01
n=9 k=3 ∑X2=3748 T=∑X =292,
02
SST =∑X2–C=62+182+…+122-C=590.07
03
SSt =
04
SSe=SST-SSt =590.07-171.18=418.89
3
(4)对各品种进行多重比较
LSD法(t测验法)
1、LSD法(t测验法): Least significant difference 最小显著差数法,实际是两个样本平均数差异显著性t测验方法倒过来用。 1)先求平均数差异标准误:
于是:
变形得到)
(由
求最小显著差数水准值LSDα LSDα= 按dfe=24 查t值表,得tα LSD0.05 = LSD0.01 =
3、F测验: 计算 将 F与Fα相比,(Fα由dft与dfe查得) 若F < Fα,判断处理间无显著差异,方差分析结束。
若处理问差异显著则作多重比较。
若F > Fα,判断处理间有显著差异,需作多重比较。
处理间的多重比较
1
多重比较的方法将在后面做介绍。
2
4、处理间的多重比较
举例:有三个葡萄品种,每品种随机抽取9 株,测定单株产量,结果数据如下表,试作方差分析。
品种
果重 X(kg/株)
品种总和 Ti
品种 平均
甲
6
18
6
5
8
12
11
13
14
93
10.33
乙
12
13
9
21
方差分析和完全随机化实验
组间方差和组内方差
组间离差平方和
������
������������������ = ������ ������ҧ������ − ������ҧ 2
������=1
组内离差平方和
������ ������
������������������ = ා ������������������ − ������ҧ������ 2
◆ 因素的不同水平(不同总体)下各样本之间的方差 ◆ 比如,三类装配方法组之间关于生产效率的方差 ◆ 组间方差既包括随机误差,也包括系统误差
6
方差分析基本思想
方差的比较
◆ 若“装配方法”因素对生产效率没有影响,则组间误差中只包含随机误差,没有 系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的 比值就会接近1
7
单因素方差分析
单因素方差分析模型(以ACTIA公司为例)
实验次数 1 2 3 4 5
均值 标准差
方法A 58 64 55 66 67 62
5.244
方法B 58 69 71 64 68 66
5.148
方法C 48 57 59 47 49 52
5.568
8
总变差(总离差平方和)的分解
总变差
������
◆ 若“装配方法”因素对生产效率存在影响,在组间误差中除了包含随机误差外, 还会包含有系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数 值,它们之间的比值就会大于1
◆ 当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自 变量对因变量有影响
判断“装配方法”因素对生产效率是否有显著影响,实际上也就是检验不 同系统生产效率的差异主要是由于什么原因所引起的。如果这种差异主要 是系统误差,说明不同装配方法水平对于平均生产效率存在显著影响!
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
……
………
XK3 …
X1n
X2n
X3n
XKn
T1
T2
T3 ……
TK
x1
x2
x 3 ……
xk
(一)组内观测值个数相等资料方差分析: 1、自由度与平方和的分解: 方差=离均差平方和÷自由度 为计算各种变异原因引起的方差 将总变异平方和分解 各原因引起的平方和 将总变异自由度分解 各原因引起的自由度
2020/6/20
举例:有三个葡萄品种,每品种随机抽取9 株, 测定单株产量,结果数据如下表,试作方差分析。
表5-1-1 三个葡萄品种产量数据表
品 种
果重 X(kg/株)
品种总和 品种 Ti 平均
甲 6 18 6 5 8 12 11 13 14 93
10.33
乙 12 13 9 21 19 16 10 16 11 127 丙 3 1 10 10 9 8 6 13 12 72
k
n
= [ ( X i j - X i ) 2 + n ( X i - X ) 2 + 2 ( X i - X ) ( X i j - X i )
11
1
1
1
组内平方和 组间平方和
SSe
SSt
2020/6/20
kn
k
= [(Xij-Xi)2+n (Xi-X)2
11
1
即SST = SSe+SSt
• LSD法 • LSR法
新复极差法 Q测验法
• 多重比较结果的表示方法
2020/6/20
1、LSD法(t测验法):
Least siLgnSifDic法ant(diftf测ere验nce法最)小显著差数法,实际
是两个样本平均数差异显著性t测验方法倒过来用。
1)先求平均数差异标准误:
S= X1 - X 2
总平方和
kn
SST =(Xij -X)2 i=1j=1
kn
=[(Xij-Xi)+(Xi-X)]2 11
kn
kn
kn
= 1 1 [ ( X i j - X i ) 2 + 1 1 ( X i - X ) 2 + 2 1 1 ( X i j - X i ) ( X i - X ) ]
kn
k
品种 平均株产( X t) X t-丙
乙
14.11
6.11※※
X t-甲
3.78
甲
10.33
2.33
丙
8.00
结论:乙品种株产极显著地高于丙品种,其它品种 间无显著差异。
2020/6/20
2、LSR法(Least significant range test ) 1)新复极差法:
(1)计算平均数的标准差,即标准误SE :
2020/6/20
K个果树品种进行品种对比试验,每个品种随机抽 取n株调查其单株产量,得到如下的数据表:
组内观测值个数相等的单向分组资料
品种 单株 及产量
1 2 3 … n Ti
Xi
2020/6/20
1 2 3 …… (i=1…K)
X12
X22
X32
XK2
X13
X23
X33
秩次距
将平均数按大小顺序排列后,欲测验的两个平均数之间 夹的平均数的总个数(含欲测的两个平均数在内)。
如对7个品种株产做多重比较,株产从大到小排列如下: 乙 丁 甲 戊 丙己 庚 8.5 7.9 7.4 7.0 6.7 6.3 5.6 测验丁与己平均产量差异显著与否时,秩次距K=5。
2020/6/20
S2 2 e n
S n n (由
=
X1-X2
S12 + S22
1
2
变形得到)
S S 于是:
=
2
2
e=
217.45=1.97
X1-X2
n
9
2020/6/20
2)求最小显著差数水准值LSDα
S LSDα= ×t X1-X2 α
按dfe=24 查t值表,得tα
S LSD0.05 = ×t = X1-X2 0.05 1.97×2.064 =4.06 S LSD0.01 = ×t = X1-X2 0.01 1.97×2.797 =5.51
总
590.07 26
85.59 4.9※ 3.4 5.61 17.45
F测验结论:因为F > F0.05,判断品种间产量有显
著差异,需作多重比较。
(F测验结论只说明在三个品种中单株产量存在有显
著差异,但并不说明任何两两之间有或无显著差异,故
还要作多重比较)。
2020/6/20
(4)对各品种进行多重比较
X 1,
……
X2
X k 之所以不同,原因可能就在于处理
(品种)和误差两个因素。
2020/6/20
由此,把总平方和按照变异原因分解成两部分, 即处理平方和与误差平方和
平方和分解的公式:
总平方和 (组间)处理平方和 (组内)误差平方和
kn
SST =(Xij -X)2 11
k
SSt = n ( X i - X )2 1
43.67 43.00 41.67 41.33
1 k 1 nXi2 j nkX2 1 k 1 nXi2 j ( 1 n 1kXij) 2nk
kn
kn
Xi2j
11
(Xij 11 nk
)2
kn
( X ij T) 11
kn
11
Xi2j
T2 nk
k
1
n
1
X
2 ij
C
2020/6/20
( T 2 C) nk
自由度分解的公式 总自由度 dfT = nK-1 处理自由度 dft = K-1 误差自由度 dfe = dfT -dft 误差自由度 dfe=K (n-1)
n
9
9
SSe=SST-SSt =590.07-171.18=418.89
2020/6/20
• dfT =nk-1=9×3-1=26 • dft=k-1=3-1=2 • dfe=dfT-dft=26-2=24
2020/6/20
2020/6/20
(2) 计算均方
s2
t = SSt / dft = 171.18/2 = 85.59
s2
e =SSe / dfe = 418.89/24 = 17.45
(3) F测验
F=S2t /S2e = 85.59 / 17.45 = 4.90
按dft = 2, dfe= 24查表得Fα
三个品种单株产量方差分析表
变异原因 平方和 自由度 均方
F
F0.05
F0.01
品种间 171.18 2
误差 418.89 24
三个葡萄品种单株果重比较表 (kg/株)
品种 乙
平均株产 ( X t ) 差异显著性
14.11 a
a
A
甲
10.33 ab
ab AB
丙
8.00 b
b
B
2020/6/20
(3)连线法
平均数下有线相连差异不显著; 无线相连差异就显著。
品种
平均株产 ( X t )
α=0.05 α=0.01
乙 14.11
甲 10.33
SE =
S
2 e
=
17.45 =1.39
n
9
(与 Sx =
s= n
s2 相比较来理解与记忆) n
2020/6/20
(2)求最小显著极差水准值LSRα
LSRα(k,dfe)=SSRα (k,dfe)×SE
K—秩次距 dfe—误差自由度 SSRα 根据K和dfe在SSR表中查得的值。
2020/6/20
2020/6/20
小结
由上面的分解过程可知: 平方和、自由度都具有可加性,总平方 和与总自由度都可以分解为导致变异各个原 因的相应部分,这就是平方和与自由度分解 的理论基础。
2020/6/20
2、计算均方:
S
2 t
= SSt / dft
S
2 e
= SSe / dfe
2020/6/20
3、F测验:
LSDα相比: 若差数小于LSD0.05,判断两个品种产量无显著
差异; 若差数大于LSD0.05,判断两个品种产量有显著
差异,在差数右上角用一个※号标记; 若差数大于LSD0.01,判断两个品种产量有极显
著差异,用两个※号标记。(结果如下页表)。
2020/6/20
表5-1-2 三个葡萄品种单株果重比较表 (kg/株)
14.11 8.00
x T=292
=10.8
2020/6/20
解:(1)分解平方和与自由度:
n=9 k=3 ∑X2=3748 T=∑X =292,
C=T2=2922 =3157.93 nk 9× 3
SST =∑X2–C=62+182+…+122-C=590.07
SSt
=
∑ T i2 -C = 9 3 2 + 1 2 7 2 + 7 2 2 -C = 2 9 9 6 2 -C = 1 7 1 .1 8
丙 8.00
2020/6/20
组合
x
-两对 -乙对 -甲对 -丙高 -乙高 -甲低 -甲高 -乙低 -甲中 -丙低 -乙中
丙中
58.67
22.67 **
22 **
(续) 18.67 17.34 17 15.67
**
**
**
**
15 **
14.67 **