方差分析的基本原理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对试验结果产生的影响。显然有
xij i ij
(7-1)
i 1
k
i
0
(7-2)
εij 是试验误差,相互独立,且服从 正态分布N(0,σ2)。
(7-1)式叫做 单因素试验的线性模型,亦称数学模型。 在这个模型中xij表示为总平均数μ、处理效应 i、
试验误差εij之和。
由εij 相 互独立且服从正态分布 N(0,σ2 ), 可知各处理i(i=1,2,…,k)所属总体亦应具 正态性,即服从正态分布N(μi , σ2 )。尽管各总 体的均数 μi 可以不等或相等, σ2则必须是相 等的。所以,单因素试验的数学模型可归纳为:
s
(2) k个处理平均值的自由度为k(n-1) ,而t 检验 查tα值的自由度为2(n-1) ,从而降低了检验的 灵敏性
3、 t检验增大犯α错误的概率
t 检验时对具有不同秩次的平均数采用同一 个tα ,会增大犯 α错误的概率,降低推断的可 靠性。 2个平均数比较: α = 0.05
5个平均数比较: α’ = 1-(1-0.05)10= 0.4013
3、因素水平(level of factor) 试验因素所处的某种特 定状态或数量等级称为因素水平,简称水平。研究某种 饲料中4种不同能量水平对肥育牛瘦肉率的影响,这4种 特定的能量水平就是饲料能量这一试验因素的4个水平。 因素水平用代表该因素的字母加添足标1,2,…,来表 示。如A1、A2、…,B1、B2、…,等。
二、方差分析的基本原理
1、线性模型与基本假定
假设某单因素试验有k个处理,每个处理有n 次重复,共有nk个观测值。这类试验资料的 数据模式如表7.1所示。
表7.1 k个处理每处理有n个观测值的数据模式
处理 观察值(xij,i =1~k ; j =1~n) 1 2 x11 x21 x12 … x22 … x1j x2j … x1n … x2n 总和 平均 T1. T2. x1. x2.
┇
i
┇
xi1
┇
xi2
…
…
┇
xij
…
…
┇
xin
┇
Ti.
┇ xi. ┇ xk.
x
┇
k
┇
xk1
┇
xk2
…
…
┇
xkj
…
…
┇
xቤተ መጻሕፍቲ ባይዱn
┇
Tk. T
T xij
注:xij指第i个处理第j个观察值(i =1~k ; j =1~n)
xij 可以分解为:
其中:μ表示全试验观测值总体的平均数;
i 是 第 i 个 处理的效应 (treatment effects)表示处理i
5
若有k个处理,则要作 检验。
C
2 k
= k(k-1)/2 次类似的
2、无统一的试验误差,误差估计的准确 性和检验的灵敏性低
(1)t 检验要进行两两比较,每次仅用2个样本信 息估计总体方差,误差估计的准确性低
两两比较合并均方: k 个样本合并均方:
s
2 e 2 e
SS1 SS2 1 2 SS1 ... SSk 1 ... k
第一节
方差分析的基本原理
一、方差分析的意义
u检验或t检验法适用于样本平均数与总体
平均数及两样本平均数间的差异显著性检验, 但在生产和科学研究中经常会遇到比较多个处 理优劣的问题, 即需进行多个平均数间的差异 显著性检验。这时,若仍采用t检验法就不适宜 了。这是因为:
1、u或t 检验过程烦琐
例如,一试验包含5个处理,采用t检验法要 进行 C 2 =10次两两平均数的差异显著性检验;
5、试验单位(experimental unit) 在试验中 能接受不同试验处理的独立的试验载体叫试验 单位。在畜禽、水产试验中,一只家禽、一头 家畜、一只小白鼠、一尾鱼,即一个动物;或 几只家禽、几头家畜、几只小白鼠、几尾鱼, 即一组动物都可作为试验单位。试验单位往往 也是观测数据的单位。 6、重复(repetition) 在试验中,将一个处理 实施在两个或两个以上的试验单位上,称为处 理有重复;一处理实施的试验单位数称为处理 的重复数。例如,用某种饲料喂4头猪,就说 这个处理(饲料)有4次重复。
4、试验处理(treatment) 事先设计好的实施在试验单 位上的具体项目叫试验处理,简称处理。在单因素试验 中,实施在试验单位上的具体项目就是试验因素的某一 水平。例如进行饲料的比较试验时,实施在试验单位(某 种畜禽)上的具体项目就是喂饲某一种饲料。所以进行单 因素试验时,试验因素的一个水平就是一个处理。在多 因素试验中,实施在试验单位上的具体项目是各因素的 某一水平组合。例如进行3种饲料和3个品种对猪日增重 影响的两因素试验,整个试验共有3×3=9个水平组合, 在多因素试验时,试验因素的一个水平组合就是一个处 理。
有关术语:
1、试验指标(experimental index) 为衡量试验结 果的好坏或处理效应的高低,在试验中具体测定的性 状或观测的项目称为试验指标。由于试验目的不同, 选择的试验指标也不相同。在畜禽、水产试验中常用 的试验指标有:日增重、产仔数、产奶量、产蛋率、 瘦肉率、某些生理生化和体型指标(如血糖含量、体高、 体重)等。 2、试验因素(experimental factor) 试验中所研究 的影响试验指标的因素叫试验因素。如研究如何提高 猪的日增重时,饲料的配方、猪的品种、饲养方式、 环境温湿度等都对日增重有影响,均可作为试验因素 来考虑。当试验中考察的因素只有一个时,称为单因 素试验;若同时研究两个或两个以上的因素对试验指 标的影响时,则称为两因素或多因素试验。试验因素 常用大写字母A、B、C、…等表示。
10个平均数比较:α” = 1-(1-0.05)45= 0.9006
因此,多个平均数的差异显著性检验不宜 用t (或u)检验,须采用方差分析法。
方差分析 (analysis of variance)由英国统计学家 R.A.Fisher于1923年提出的。
——将多个样本 (处理)的观测值作为一个总体, 用方差来表示变异,把引起事件总的变异分解 为各种因素的变异,并对每个因素引起的变异 作数量估计,从而说明各因素的变异幅度及其 在总变异中的重要程度;并用剩余变异无偏估 计随机误差,进而比较处理均值间的差异。
xij i ij
(7-1)
i 1
k
i
0
(7-2)
εij 是试验误差,相互独立,且服从 正态分布N(0,σ2)。
(7-1)式叫做 单因素试验的线性模型,亦称数学模型。 在这个模型中xij表示为总平均数μ、处理效应 i、
试验误差εij之和。
由εij 相 互独立且服从正态分布 N(0,σ2 ), 可知各处理i(i=1,2,…,k)所属总体亦应具 正态性,即服从正态分布N(μi , σ2 )。尽管各总 体的均数 μi 可以不等或相等, σ2则必须是相 等的。所以,单因素试验的数学模型可归纳为:
s
(2) k个处理平均值的自由度为k(n-1) ,而t 检验 查tα值的自由度为2(n-1) ,从而降低了检验的 灵敏性
3、 t检验增大犯α错误的概率
t 检验时对具有不同秩次的平均数采用同一 个tα ,会增大犯 α错误的概率,降低推断的可 靠性。 2个平均数比较: α = 0.05
5个平均数比较: α’ = 1-(1-0.05)10= 0.4013
3、因素水平(level of factor) 试验因素所处的某种特 定状态或数量等级称为因素水平,简称水平。研究某种 饲料中4种不同能量水平对肥育牛瘦肉率的影响,这4种 特定的能量水平就是饲料能量这一试验因素的4个水平。 因素水平用代表该因素的字母加添足标1,2,…,来表 示。如A1、A2、…,B1、B2、…,等。
二、方差分析的基本原理
1、线性模型与基本假定
假设某单因素试验有k个处理,每个处理有n 次重复,共有nk个观测值。这类试验资料的 数据模式如表7.1所示。
表7.1 k个处理每处理有n个观测值的数据模式
处理 观察值(xij,i =1~k ; j =1~n) 1 2 x11 x21 x12 … x22 … x1j x2j … x1n … x2n 总和 平均 T1. T2. x1. x2.
┇
i
┇
xi1
┇
xi2
…
…
┇
xij
…
…
┇
xin
┇
Ti.
┇ xi. ┇ xk.
x
┇
k
┇
xk1
┇
xk2
…
…
┇
xkj
…
…
┇
xቤተ መጻሕፍቲ ባይዱn
┇
Tk. T
T xij
注:xij指第i个处理第j个观察值(i =1~k ; j =1~n)
xij 可以分解为:
其中:μ表示全试验观测值总体的平均数;
i 是 第 i 个 处理的效应 (treatment effects)表示处理i
5
若有k个处理,则要作 检验。
C
2 k
= k(k-1)/2 次类似的
2、无统一的试验误差,误差估计的准确 性和检验的灵敏性低
(1)t 检验要进行两两比较,每次仅用2个样本信 息估计总体方差,误差估计的准确性低
两两比较合并均方: k 个样本合并均方:
s
2 e 2 e
SS1 SS2 1 2 SS1 ... SSk 1 ... k
第一节
方差分析的基本原理
一、方差分析的意义
u检验或t检验法适用于样本平均数与总体
平均数及两样本平均数间的差异显著性检验, 但在生产和科学研究中经常会遇到比较多个处 理优劣的问题, 即需进行多个平均数间的差异 显著性检验。这时,若仍采用t检验法就不适宜 了。这是因为:
1、u或t 检验过程烦琐
例如,一试验包含5个处理,采用t检验法要 进行 C 2 =10次两两平均数的差异显著性检验;
5、试验单位(experimental unit) 在试验中 能接受不同试验处理的独立的试验载体叫试验 单位。在畜禽、水产试验中,一只家禽、一头 家畜、一只小白鼠、一尾鱼,即一个动物;或 几只家禽、几头家畜、几只小白鼠、几尾鱼, 即一组动物都可作为试验单位。试验单位往往 也是观测数据的单位。 6、重复(repetition) 在试验中,将一个处理 实施在两个或两个以上的试验单位上,称为处 理有重复;一处理实施的试验单位数称为处理 的重复数。例如,用某种饲料喂4头猪,就说 这个处理(饲料)有4次重复。
4、试验处理(treatment) 事先设计好的实施在试验单 位上的具体项目叫试验处理,简称处理。在单因素试验 中,实施在试验单位上的具体项目就是试验因素的某一 水平。例如进行饲料的比较试验时,实施在试验单位(某 种畜禽)上的具体项目就是喂饲某一种饲料。所以进行单 因素试验时,试验因素的一个水平就是一个处理。在多 因素试验中,实施在试验单位上的具体项目是各因素的 某一水平组合。例如进行3种饲料和3个品种对猪日增重 影响的两因素试验,整个试验共有3×3=9个水平组合, 在多因素试验时,试验因素的一个水平组合就是一个处 理。
有关术语:
1、试验指标(experimental index) 为衡量试验结 果的好坏或处理效应的高低,在试验中具体测定的性 状或观测的项目称为试验指标。由于试验目的不同, 选择的试验指标也不相同。在畜禽、水产试验中常用 的试验指标有:日增重、产仔数、产奶量、产蛋率、 瘦肉率、某些生理生化和体型指标(如血糖含量、体高、 体重)等。 2、试验因素(experimental factor) 试验中所研究 的影响试验指标的因素叫试验因素。如研究如何提高 猪的日增重时,饲料的配方、猪的品种、饲养方式、 环境温湿度等都对日增重有影响,均可作为试验因素 来考虑。当试验中考察的因素只有一个时,称为单因 素试验;若同时研究两个或两个以上的因素对试验指 标的影响时,则称为两因素或多因素试验。试验因素 常用大写字母A、B、C、…等表示。
10个平均数比较:α” = 1-(1-0.05)45= 0.9006
因此,多个平均数的差异显著性检验不宜 用t (或u)检验,须采用方差分析法。
方差分析 (analysis of variance)由英国统计学家 R.A.Fisher于1923年提出的。
——将多个样本 (处理)的观测值作为一个总体, 用方差来表示变异,把引起事件总的变异分解 为各种因素的变异,并对每个因素引起的变异 作数量估计,从而说明各因素的变异幅度及其 在总变异中的重要程度;并用剩余变异无偏估 计随机误差,进而比较处理均值间的差异。