4方差分析PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6次都接受的概率(0.95)6=0.735 犯α错误的概率=1-0.735=0.265
犯α错误的概率明显增加
几个概念
试验指标(experimental index): 为衡量试验结果的
好坏和处理效应的高低,在实验中具体测定的性状或 观测的项目称为试验指标。常用的试验指标有:身高、 体重、日增重、酶活性、DNA含量等等。
用线性模型(linear model)来描述每一观测值:
xij =μ + ai +εij
(i=1,2,3…,k j=1,2,3…,n)
μ -总体平均数
ai -处理效应
xij -第 i 次处理的第 j 次观测值
εij -试验误差
εij 是相互独立的,且服从正态分布 N(0,σ2 )
根据ai的不同假定,可将数学模型分为以下三种:
在一个多处理试验中,可以得出一系列不同的观测值。
观
处理效应(treatment effect):
测
值
处理不同引起
不
同
的
试验误差:试验过程中偶然性
原
因素的干扰和测量误差所致。
因
1.1方差分析的基本思想
总变异
处理效应
试验误差
1.2 方差分析的目的
确定各种变异在总变异中所占的重要程度。
处理效应 试验误差
t 检验可以判断两组数据平均数间的差异显著
性,而方差分析既可以判断两组又可以判断多组数 据平均数之间的差异显著性。
是否可以把多组数据化成n个两组数据,用n次t检验来 完成这个多组数据差异显著性的判断?
多组平均数差异显著性检验采用t检验的缺点:
1.检验过程烦琐。 试验包含4个处理
t 检验: C42 = 6次
重复
1 2 … i …k
1 2 … j … n
总和 平均
x11 x21 x12 x22 ……
x1j x2j ……
x1n x2n
T1 T2
x1
x2
… xi1 … …xi2 ……
… xij
…… … xin
… Ti xi
… xk1 … xk2 …… … xkj …… … xkn
Leabharlann Baidu… Tk xk
T=∑xij x
不同离子对木聚糖酶活性的影响(mg/ml)
Na+
K+
0.00
0.00
0.25
0.40
0.50
0.60
0.75
0.80
1.00
1.00
1.25
1.20
Mn2+
0.00 0.06 0.12 0.18 0.24 0.30
Cu2+
0.00 0.40 0.80 1.20 1.60 2.00
在固定模型中,除去随机误差之后的每个处理 水平所产生的效应是固定的,试验重复时会得 到相同的结果
试验处理( treatment): 事先设计好的实施在实
验单位上的具体项目就叫试验处理。如进行饲料的 比较试验时,实施在试验单位上的具体项目就是具 体饲喂哪一种饲料。
试验单位( experimental unit ): 在实验中能接受不
同试验处理的独立的试验载体叫试验单位。一只小白 鼠,一条鱼,一定面积的小麦等都可以作为实验单位。
方差分析所得到的结论只适合于选定的那几个 水平,并不能将其结论扩展到未加考虑的其它 水平上。
随机模型(random model)
指各处理的效应值ai 不是固定的数值,而是
由随机因素所引起的效应。
若因素的a 个水平,是从该因素全部水平的总体 中随机抽出的,则该因素称为随机因素。从随机因 素的a 个水平所得到的结论,可以推广到这个因素的 所有水平上。处理随机因素所用的模型称为随机效 应模型(random effect model)。
第四章
方差分析的定义
方差分析(Analysis of variance,ANOVA) 又叫变量分析,是英国著名统计学家R . A . Fisher 于20世纪提出的。它是用以检验两个或多个均数间 差异显著性并能分析变异原因的一种统计方法。它 是一类特定情况下的统计假设检验,或者说是平均 数差异显著性检验的一种引伸。
重复(repetition): 在实验中,将一个处理实施在两
个或两个以上的试验单位上,称为处理有重复;同一 处理实施的试验单位数称为处理的重复数。例如,用 某种饲料喂4头猪,就说这个处理(饲料)有4个重复。
第一节 方差分析的基本原理
方差分析的基本思想、目的和用途 数学模型 平方和与df的分解 统计假设的显著性检验 多重比较
2.无统一的试验误差,误差估计的精确性和检验的 灵敏性低。 t检验:C42 =6次
需计算 6个标准误
误差估计不统一
误差估计精确性降低
3.推断的可靠性低,检验时犯α错误概率大。
例如我们用t检验的方法检验4个样本平均数之间的差异显著性
t检验: C42 =6次
6次检验 相互独立
H0的概率: 1-α=0.95
美国的黑核桃品种对不同地理条件的适应情况
河南
北京
广州
江苏 新疆
气候、水肥、土壤
无法人为控制 如果实验条件不能人为控制,那么这个样本对所属 总体作出推断就属于随机模型。
在随机模型中,水平确定之后其处理所产生的 效应并不是固定的,试验重复时也很难得到相 同的结果
相差不大,说明试验处理对指标影响不大。
相差较大,即处理效应比试验误差大得多, 说明试验处理影响是很大的,不可忽视。
1.3方差分析的用途
用于多个样本平均数的比较 分析多个因素间的交互作用 回归方程的假设检验 方差的同质性检验
1.4 数学模型
假定有k组观测数据,每组有n个观测值,则共有nk个观测值
处理
固定模型
随机模型
混合模型
固定模型(fixed model)
指每个处理水平的处理效应值ai 是固定值,
ai = μi - μ是一个常量。就是说除去随机误差以
后各水平所产生的效应是固定的。
若因素的水平是主观选定的,则该因素称为 固定因素。例如,几个不同的实验温度,几个不 同的化学药物或一种药物的几种不同浓度,几个 作物品种等。处理这样的因素所用的模型称为固 定效应模型(fixed effect model)。
试验因素( experimental factor): 试验中所研究的
影响试验指标的因素叫试验因素。当试验中考察的因 素只有一个时,称为单因素试验;若同时研究两个或 两个以上因素对试验指标的影响时,则称为两因素或 多因素试验。
因素水平( level of factor): 试验因素所处的某种
特定状态或数量等级称为因素水平,简称水平。如 研究3个品种奶牛产奶量的高低,这3个品种就是奶 牛品种这个试验因素的3个水平。