09第9讲第六章 方差分析第一节 方差分析的基本原理与步骤

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Ti
356 335 352 323 378 152076.8 442.7 4 442.7 110 .68 4 160.5 s e2 10.7 15 s t2
二、F 分布与 F 检验
设想在一正态总体 N(μ,σ2)中随机抽取样本含量为 n 的样本 k 个,将各样本观测 值整理成表 6-1 的形式。此时的各处理没有真实差异,各处理只是随机分的组。因此,由 上式算出的 S t 和 S e 都是误差方差 的估计量。以 S e 为分母, S t2 为分子,求其比值。
第 2 页 共 4 页
吉林农业科技学院
总变异平方和:
2
07 中药学文(1、2) 《医学生物统计学》 电子教案
SST= x C =152680-152076.8=603.2 组间变异平方和: SSt=
SSe=SST-SSt=603.2-442.7=160.5 进而计算各部分方差:
n C
总自由度=组间(处理间)自由度+组内(误差)自由度
记作: 将以上公式归纳如下: 总平方和 处理平方和 误差平方和
nk 1 (k 1) k (n 1) DFT=DFt+DFe
SS T x 2 C Tt C n SS e SS T SS t SS t
总的方差 处理间方差 误差方差
2 2
值表,得 F>F0.01 =4.89,P<0.01,表明 5 个不同大豆品种对产量的影响达到极显著差异。 在方差分析中,通常将变异来源、平方和、自由度、均方和 F 值归纳成一张方差分 析表,见表 6-3。
变异来源 组间 组内 总变异 平方和 442.7 160.5 603.28 表2 自由度 4 15 19 表 1 资料方差分析表 F值 方差 110.68 10.34** 10.7 F0.05 3.04 F0.01 4.89

F
f ( F ) dF


因而 F 分布右尾从 F 到+∞的概率为:
P ( F F ) 1 F ( F )
F
f ( F ) dF
附表 F 值表列出的是不同 1 和 2 下,P(F≥ F )=0.05 和 P(F≥ F )=0.01 时的 F 值, 即右尾概率α=0.05 和α=0.01 时的临界 F 值,一般记作 F0.05,F0.01。如查 F 值表,当 v1=3, v2=18 时,F0.05=3.16,F0.01=5.09,表示如以 v1=dft=3,v2=dfe=18 在同一正态总体中连续抽 样,则所得 F 值大于 3.16 的仅为 5%,而大于 5.09 的仅为 1%。
SSt n ( xij x ) 2
1
k
T
n
t
2
C
组内的变异为各组内观测值与组平均数的变异,故每组具有自由度 n 1 和平方 和
(x
1
n
ij
x ) 2 ,而资料共有 k 组,故组内自由度, k (n 1) ,而组内平方和 SSe 为:
k n
SS e ( xij xt ) 2 SST SSt
第 3 页 共 4 页
吉林农业科技学院 2.F 测验
07 中药学文(1、2) 《医学生物统计学》 电子教案
F 值表是专门为检验 S t2 代表的总体方差是否比 S e2 代表的总体方差大而设计的。若实
际计算的 F 值大于 F0.05 ( 1 , 2 ) , 则 F 值在α=0.05 的水平上显著, 我们以 95%的可靠性(即冒 5%的风险)推断 S t2 代表的总体方差大于 S e2 代表的总体方差。这种用 F 值出现概率的大小 推断两个总体方差是否相等的方法称为 F 测验。 在方差分析中所进行的 F 测验目的在于推断处理间的差异是否存在,检验某项变异 因素的效应方差是否为零。因此,在计算 F 值时总是以被测验因素的方差作分子,以误 差方差作分母。应当注意,分母项的正确选择是由方差分析的模型和各项变异原因的期 望均方决定的。 实际进行 F 测验时,是将由试验资料所算得的 F 值与根据 1 df t (大均方,即分子 均方的自由度)、 2 df e (小均方,即分母均方的自由度)查附表 F 值表所得的临界 F 值 F0.05,F0.01 相比较作出统计推断的。 若 F<F0.05,即 P>0.05,不能否定 H 0 ,统计学上,把这一测验结果表述为:各处理 间差异不显著,不标记符号;若 F0.05≤F<F0.01,即 0.01<P≤0.05,否定 H 0 ,接受 H A , 统计学上,把这一测验结果表述为:各处理间差异显著,在 F 值的右上方标记“*” ;若 F≥F0.01,即 P≤0.01,否定 H0,接受 HA,统计学上,把这一测验结果表述为:各处理间差 异极显著,在 F 值的右上方标记“**”。 对于[例 6.1],因为 F= s t s e =25.32/1.43=17.71;根据 1 =dft=4, 2 =dfe=15 查附表 F
1 1
因此,得到表 1 类型资料平方和与自由度的分解式为: 总平方和=组间(处理间)平方和+组内(误差)平方和
( xij x ) 2 n ( xt x ) 2 ( xij xt ) 2
1 1 i 1 1 1
k
n
k
k
n
记作: 即:
SS T SS t SS e
2
总自由度 处理自由度 误差自由度
2 SS T DFT
wenku.baidu.com
DFT kn 1 DFt k 1 DFe k (n 1)
求得各变异来源的平方和与自由度后,进而求得:
2 sT
SS t2 DFt SS 2 s e2 e DFe s t2
根据以上分析,将表 1 中的数据代入公式中,进一步计算得到:
f(F) ( 1 =2, 2 =5)
( 1 =8, 2 =20)
( 1 =4, 2 =10)
F
图 不同自由度下的 F 分布曲线
F 分布的取值范围是(0,+∞) ,其平均值 F =1。 用 f ( F ) 表示 F 分布的概率密度函数,则其分布函数 F ( F ) 为:
F ( F ) P ( F F )
表中的 F 值应与相应的被测验因素齐行。因为经 F 测验差异极显著,故在 F 值 10.34 右上方标记“**”。 在实际进行方差分析时,只须计算出各项平方和与自由度,各项均方的计算及 F 检 验可在方差分析表上进行。
授课内容总结
主要讲授方差分析的基本原理:自由度与平方和的分解、F 检验。
复习思考题:
吉林农业科技学院
07 中药学文(1、2) 《医学生物统计学》 电子教案
第九讲
授课日期: 2009 年 月 日 节课 授课题目:第六章 方差分析 6.1 方差分析的基本原理与步骤 教学目的:了解方差分析的概念和作用;掌握方差分析的基本原理和步骤。 教学重点:试验总变异剖分原理、F 测验。 教学难点:方差分析的基本原理 教学方 法及时 复习提问: 间分配 1.单个总体率假设检验的方法步骤? 5 2.两个总体率假设检验的方法步骤? 多媒体 导言: 我们在研究中,经常遇到的是多个样本之间进行比较,这个时候再用 授 课 假设检验的方法就显得麻烦,比较的精度也差了,用什么方法?方差分析。 教 学 进 程 新课内容: 第六章 方差分析
SS T
上式中的 C 称为矫正数:
(x
1
nk
ij
x )2 x2 C
C
( x) 2 nk

T nk
产生总变异的原因可从两方面来分析:一是同一处理不同重复观测值的差异是由偶 然因素影响造成的,即试验误差,又称组内变异;二是不同处理之间平均数的差异主要 是由处理的不同效应所造成,称处理间变异,又称组间变异。因此,总变异可分解为组 间变异和组内变异两部分。 组间的差异即 k 个 x 的变异,故自由度 v k 1 ,而其平方和 SSt 为:
练习方差分析的步骤。
本次课小结: 重点讲授 平方和的分解、自由度的分解、F 分布与 F 检验。 课后总结:
第 4 页 共 4 页
对一个或两个样本进行平均数的假设测验,可以采用 u 测验或 t 测验来测定它们之 间的差异显著性。而当试验的样本数 k≥3 时,上述方法已不敷应用。其原因是当 k≥3 时,就要进行 k(k-1)/2 次测验比较,不仅工作量大,而且精确度降低。因此,对多个 样本平均数的假设测验,需要采用一种更加适宜的统计方法,即方差分析法。方差分析 法是科学研究工作的一个十分重要的工具。 第一节 方差分析的基本原理与步骤 方差分析(analysis of variance,ANOVA)就是将试验数据的总变异分解为来源于不 同因素的相应变异,并作出数量估计,从而发现各个因素在总变异中所占的重要程度; 即将试验的总变异方差分解成各变因方差,并以其中误差方差作为和其他变因比较的标 准,以推断其他变因所引起变异量是否真实的一种统计分析方法。 一、自由度与平方和分解 方差是平方和除以自由度的商。要将一个试验资料的总变异分解为各个变异来源的 相应变异,首先将总平方和与总自由度分解为各个变异来源的相应部分。因此,平方和 与自由度的分解是方差分析的第一步骤。下面以单因素完全随机试验设计的资料为例说 起。 假设有 k 个处理,每个处理有 n 个观察值,则该试验资料共有 nk 个观察值。 例题 1 考察温度对某药得率的影响,选取 5 种温度,不同温度下各做 4 次试验,结 果如表 1,试问温度对该药的得率有无显著影响? 表1 某药在不同温度下的得率 60 65 70 75 80 温度(℃) 86 80 83 76 96 89 83 90 71 93 得率(%) 91 88 94 81 95 90 84 85 84 94 356 335 352 323 378 T=1744 总和(%)Ti 89 83.75 88 80.75 94.5 x =87.2 平均(%) x i 首先,对该表格的数据进行分析: 试验总变异:试验有多少个观察值?有几个处理(样本)?回答 5 个,用 k 表示, k=5。每个样本有几个观察值?用 n 表示,n=4,试验共有几个观察值?kn 个观察值。 第 1 页 共 4 页
2 2 2 2
1.F 分布
统计学上把两个方差之比值称为 F 值。 即 F S t2 / S e2 F 具有两个自由度: 1 df t k 1, 2 df e k ( n 1) 。 F 值所具有的概率分布称为 F 分布。F 分布密度曲线是随自由度 df1、df2 的变化而变 化的一簇偏态曲线,其形态随着 df1、df2 的增大逐渐趋于对称,如下图所示。
讲授 40
40
5
吉林农业科技学院
07 中药学文(1、2) 《医学生物统计学》 电子教案
那么变异用什么表示?用方差表示,而方差是平方和除以自由度的商。 要将一个试验资料的总变异分解为各个变异来源的相应变异,首先将总平方和与总 自由度分解为各个变异来源的相应部分。因此,平方和与自由度的分解是方差分析的第 一步骤。下面以上面的单因素完全随机试验设计的资料为例说起。 表 1 中,总变异是 20(nk)个观测值的变异,故其自由度 =nk-1=20-1=19,而其平 方和 SST 则为:
相关文档
最新文档