第六章 F检验和多重比较
多重比较教案
多重比较F 值显著或极显著,否定了无效假设H O ,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。
因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。
统计上把多个平均数两两间的相互比较称为多重比较。
多重比较的方法甚多,常用的有最小显著差数法(LSD 法)和最小显著极差法(LSR 法),现分别介绍如下。
(一)最小显著差数法 (LSD 法,least significant difference ) 此法的基本作法是:在F 检验显著的前提下,先计算出显著水平为α的最小显著差数αLSD ,然后将任意两个处理平均数的差数的绝对值..j i x x -与其比较。
若..j i x x ->LSD a 时,则.i x 与.j x 在α水平上差异显著;反之,则在α水平上差异不显著。
最小显著差数..)(j i e x x df a a S t LSD -=式中:)(e df t α为在F 检验中误差自由度下,显著水平为α的临界t 值,..j i x x S -为均数差异标准误。
n MS S e x x j i /2..=-其中e MS 为F 检验中的误差均方,n 为各处理的重复数。
当显著水平α=0.05和0.01时,从t 值表中查出)(05.0e df t 和)(01.0e df t :....)(01.001.0)(05.005.0j i e j i e x x df x x df S t LSD S t LSD --==利用LSD 法进行多重比较时,可按如下步骤进行:(1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;(2)计算最小显著差数05.0LSD 和01.0LSD ;(3)将平均数多重比较表中两两平均数的差数与05.0LSD 、01.0LSD 比较,作出统计推断。
《统计分析和SPSS的应用(第五版)》课后练习答案解析(第6章)
《统计分析和SPSS的应用(第五版)》课后练习答案解析(第6章)《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第6章SPSS的方差分析1、入户推销有五种方法。
某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。
从应聘人员中尚无推销经验的人员中随机挑选一部分人,并随机地将他们分为五个组,每组用一种推销方法培训。
一段时期后得到他们在一个月内的推销额,如下表所示:第一组20.0 16.8 17.9 21.2 23.9 26.8 22.4第二组24.9 21.3 22.6 30.2 29.9 22.5 20.7第三组16.0 20.1 17.3 20.9 22.0 26.8 20.8第四组17.5 18.2 20.2 17.7 19.1 18.4 16.5第五组25.2 26.2 26.9 29.3 30.4 29.7 28.21)请利用单因素方差分析方法分析这五种推销方式是否存在显著差异。
2)绘制各组的均值对比图,并利用LSD方法进行多重比较检验。
(1)分析→比较均值→单因素ANOV A→因变量:销售额;因子:组别→确定。
ANOVA销售额平方和df 均方 F 显著性组之间405.534 4 101.384 11.276 .000组内269.737 30 8.991总计675.271 34概率P-值接近于0,应拒绝原假设,认为5种推销方法有显著差异。
(2)均值图:在上面步骤基础上,点选项→均值图;事后多重比较→LSD多重比较因变量: 销售额 LSD(L)(I) 组别 (J) 组别平均差(I-J) 标准错误显著性95% 置信区间下限值上限第一组第二组 -3.30000*1.60279 .048 -6.5733 -.0267 第三组 .72857 1.60279 .653 -2.5448 4.0019 第四组3.05714 1.60279 .066 -.2162 6.3305 第五组-6.70000* 1.60279 .000 -9.9733 -3.4267 第二组第一组 3.30000* 1.60279 .048 .0267 6.5733 第三组 4.02857* 1.60279 .018 .7552 7.3019 第四组 6.35714* 1.60279 .000 3.0838 9.6305 第五组-3.40000* 1.60279 .042 -6.6733 -.1267 第三组第一组 -.72857 1.60279 .653 -4.0019 2.5448 第二组 -4.02857* 1.60279 .018 -7.3019 -.7552 第四组 2.32857 1.60279 .157 -.9448 5.6019 第五组-7.42857* 1.60279 .000 -10.7019 -4.1552 第四组第一组-3.057141.60279.066-6.3305.2162第二组-6.35714* 1.60279 .000 -9.6305 -3.0838第三组-2.32857 1.60279 .157 -5.6019 .9448第五组-9.75714* 1.60279 .000 -13.0305 -6.4838第五组第一组6.70000* 1.60279 .000 3.4267 9.9733 第二组3.40000* 1.60279 .042 .1267 6.6733第三组7.42857* 1.60279 .000 4.1552 10.7019第四组9.75714* 1.60279 .000 6.4838 13.0305*. 均值差的显著性水平为 0.05。
方差分析中的多重比较
XD XC
XB XE XA
67 69.5 71.5 74 74.5
XC 2.5 XB 4.5 2.0 XE 7.0* 4.5 XA 7.5* 5.0
2 .5 3.0 0.5
等级排列为:
1、2、3、4、5
(2)根 据 比 较 等 级 r, 自 由 度 df w ,
在
附
表
中
查
相
应
的
q
0
或
.05
q
的
0.01
值
。
比 较 等 级 r ri -rj 1, 如 :
X
与
B
X
比
C
较,
r
2-1
1;
X
A
与
X
比
D
较
,
r
5
3
1
3;
[应用心理学专业必修课 心理统计学 淮北煤师院教育学院 李怀龙] Email:lihlong@
由 上 述 结 果 ,可 以 作 出 统 计 结 论
[应用心理学专业必修课 心理统计学 淮北煤师院教育学院 李怀龙] Email:lihlong@
6
Psychology Statistics
2、N-K法(q检验)
步骤:
(1)把要比较的各个平均数从小到大作等级排列;
如5个平均数从小到大顺序是XB,XC,XA,XE,XD, 则
27.3 29.6 26.4 31.5
[应用心理学专业必修课 心理统计学 淮北煤师院教育学院 李怀龙] Email:lihlong@
多重比较
四、多重比较F值显著或极显著,否定了无效假设H O,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。
因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。
统计上把多个平均数两两间的相互比较称为多重比较(multiplecomparisons )。
多重比较的方法甚多,常用的有最小显著差数法(LSD 法)和最小显著极差法(LSR 法),现分别介绍如下。
(一)最小显著差数法 (LSD 法,least significant difference ) 此法的基本作法是:在F 检验显著的前提下,先计算出显著水平为α的最小显著差数αLSD ,然后将任意两个处理平均数的差数的绝对值..j i x x-与其比较。
若..j i x x ->LSD a 时,则.i x 与.j x 在α水平上差异显著;反之,则在α水平上差异不显著。
最小显著差数由(6-17)式计算。
..)(j i e x x df a a S t LSD -=(6-17)式中:)(e df t α为在F 检验中误差自由度下,显著水平为α的临界t 值,..j i x x S -为均数差异标准误,由(6-18)式算得。
n MS S e x xj i /2..=- (6-18)其中e MS 为F 检验中的误差均方,n 为各处理的重复数。
当显著水平α=0.05和0.01时,从t 值表中查出)(05.0e df t和)(01.0e df t ,代入(6-17)式得:....)(01.001.0)(05.005.0j i e j i e x x df x x df S t LSD S t LSD--==(6-19)利用LSD 法进行多重比较时,可按如下步骤进行:(1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;(2)计算最小显著差数05.0LSD和LSD;.001(3)将平均数多重比较表中两两平均数的差数与05.0LSD比较,作LSD、01.0出统计推断。
多重比较方法
多重⽐较⽅法前篇讲的是两个总体样本之间的⽐较⽅法,如果有多个处理⽔平,通常使⽤三种常见的⽅法,最⼩显著差数法(LSD法)、复极差法(q 法)和Duncan⽒新复极差法(SSR法)。
本质上都属于t检验法。
因此,使⽤这三种⽅法必须满⾜⽅差齐性。
如果通过F检验p>0.05,⽅差具有齐次性。
具体操作⽅法可参考:例如,⼀个试验中k个处理平均数间可能有k(k-1)/2个⽐较,因⽽这种⽐较是复式⽐较亦称为多重⽐较(multiple comparisons)。
进⾏⽅差分析时需要满⾜独⽴样本、⽅差齐性、正态分布等条件,如果⽅差不具备齐性(F检验),可⾸先进⾏数据转换,如通过对数变换、平⽅根变换、倒数变换、平⽅根反正弦变换等⽅法变换后再进⾏⽅差齐性检验,若还不⾏只能进⾏⾮参数检验。
1:最⼩显著差数法(least significant difference,简称LSD法),LSD 法实质上是t测验。
其程序是:在处理间的F测验为显著的前提下,计算出显著⽔平为α的最⼩显著差数;任何两个平均数的差数如其绝对值≥,即为在α⽔平上显著;反之则为不显著。
举例:试以LSD法测验各种药剂处理的苗⾼平均数之间的差异显著性。
下⾯⽤字母标记法对各种药剂处理的苗⾼平均数之间的差异显著性进⾏⽐较。
⾸先约定:(1)5%⽔平的差异显著性⽤⼩写英⽂字母标记,1%⽔平的差异显著性⽤⼤写英⽂字母标记;(2)若两平均数之间差异显著⽤不同字母标记,若两平均数之间差异不显著⽤相同字母标记。
2:复极差法(q法)LSD法的t测验是根据两个样本平均数差数(k=2)的抽样分布提出来的,但是⼀组处理(k>2)是同时抽取k个样本的结果。
抽样理论提出k=2时与k>2时,例如k=10时其随机极差是不同的,随着k的增⼤⽽增⼤,因⽽⽤k=2时的t测验有可能夸⼤k=10时最⼤与最⼩两个样本平均数差数的显著性。
基于极差的抽样分布理论,Student-Newman-Keul提出了q测验或称复极差测验,有时⼜称SNK测验(SAS软件中就是这种叫法)或NK测验。
单因素方差分析与多重比较
方差分析方差分析(analysis of variance ), 简称ANOV A,由英国统计学家,后人为纪念Fisher ,以F命名方差分析的统计量,故方差分析又称F 检验。
样本均数的差异,可能有两种原因所致。
首先可能由随机误差所致随机误差包括两种成分:个体间的变异和测量误差两部分;其次可能是由于各组所接受的处理不同,不同的处理引起不同的作用和效果,导致各处理组之间均数不同。
一般来说,个体之间各不相同,是繁杂的生物界的特点;测量误差也是不可避免的,因此第一种原因肯定存在。
而第二种原因是否存在,这正是假设检验要回答的问题。
方差分析的基本思想是将所有观察值之间的变异(称总变异)按设计和需要分解成几部分。
如完全随机设计资料的方差分析,将总变异分解为处理间变异和组内变异两部分,后者常称为误差。
将各部分变异除以误差部分,得到统计量F值,并根据F值确定P值作推断。
由于方差分析是根据实验设计将总变异分成若干部分,因此设计时考虑的因素越多,变异划分的越精细,各部分变异的涵义越清晰明确,结论的解释也越容易,同时由于变异划分的精细,误差部分减小,提高了检验的灵敏度和结论的准确性。
方差分析可用于:(1)两个或多个样本均数间的比较(2)分析两个或多个因素的交互作用(3)回归方程的假设检验(4)方差齐性检验多个样本均数间比较的方差分析应用条件为:(1)各样本必须是相互独立的随机样本(独立性)(2)各样本均来自正态总体(正态性)(3)相互比较的各样本的总体方差相等(方差齐性)一、完全随机设计的方差分析医学实验中,根据某一实验因素,用随机的方法,将受试对象分配到各组,各组分别接受不同的处理后,观察各种处理的效果,比较各组均数之间有无差别。
临床研究中,还可能遇到:比较几种不同疗法治疗某种疾病后某指标的变化,以评价它们的疗效;或比较某种疾病不同类型之间某一指标有无差别等。
这些都是一个因素不同水平(或状态)间几个样本均数的比较,可用单因素的方差分析(one-way ANOV A)来处理此类资料。
Friedman检验和多重比较
Friedman 检验和多重比较,手算、SPSS 、R 。
数据来源:《非参数统计(第二版)》 吴喜之 中国统计出版社 119页题3一项关于销售茶叶的研究报告说明销售方式可能和售出率有关。
三种方式为:在商店内等待,在门口销售和当面表演炒制茶叶。
对一组商店在一段时间的调查结果列再下表中(单位为购手算:(一)Friedman 检验三种销售方式有差异三种销售方式无差异:H :H 10计算检验统计量:13)13(83)241410()13(3812)1(3)1(1222222=+⨯-+++⨯=+-+=∑k n R k nk jr χ α=0.05,df=3-1=2,查表可知,1399.52205.0=<=r χχ因此数据在5%的显著性水平下拒绝原假设,即认为三种销售方式有显著差异。
(二)多重比较32/232/)1(=⨯=-=n n P24R 14R 10R 321===,,4-21=R R 14-31=R R 10-32=R R394.2=Z 经查表得到:46133894.326)1(=+⨯⨯⨯=+)(n kn Z将j i R R -与6)1(+n kn Z相比较可知,6)1(-+≤n kn Z R R j i 因此在5%的显著性水平下认为三种销售方式之间有重大差异,且当面表演炒制茶叶的销售方式效果最好,其次是在门口销售,在商店内等待的销售方式效果最差。
SPSS 计算:步骤: 1、Analyze-Nonparametric Tests-K Related Samples 2、将三个变量移入检验变量框中,并选择Friedman(F)检验方法。
单击精确,选择精确方法。
3、单击确定,输出结果。
输出结果:由输出结果可知,卡方值99.513205.02=>=χχr ,精确的显著性概率P<0.001,与手算结果一致,在5%的显著性水平下拒绝原假设,即认为三种销售方式有显著差异。
R 计算:> d=read.table("g:/c.txt") > friedman.test(as.matrix(d))Friedman rank sum testdata: as.matrix(d)Friedman chi-squared = 13, df = 2, p-value = 0.001503由输出结果可知,卡方值99.513205.02=>=χχr ,精确的显著性概率P=0.001503,与以上计算方法计算结果一致,在5%的显著性水平下拒绝原假设,即认为三种销售方式有显著差异。
计量经济第六章多重共线性
• 2、数据采集的范围有限,或采集 的样本量小于模型的自变量个数。
• 如在罕见疾病的研究过程中,由于病 情罕见、病因又相当复杂,而只能在 少数的患者身上采集大量的变量信息。
3、模型中采用滞后变量
在计量经济模型中,往往需要引入 滞后变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相 关性。
up
三、方差膨胀因子法
• 自变量间的共线性程度越大时,VIF值也随之 增大。所以也可利用方差膨胀因子来检验 多重共线性问题。 • 一般来说,当VIF >10时,表明 涉及的两个 变量存在高度线性相关,模型存在不完全 多重共线性。
P111 【经典实例】
• 计算得到的方差膨胀因子值分别为
VIF1 =10000,VIF2 =10000,VIF3 =9.6525,VIF4 =11.5875
2 2 2 1
同理易得
ˆ ) Var( 2
• EVIEWS遇到完全多重共线性时,会 显示 • Near singular matrix,无法进行估 计
2、不完全多重共线性下的后果
(1)估计量的方差增大 2 2 x 2 ˆ) 由于 Var ( 1 2 x12x2 (x1 x2 )2
• 可以看出,除了 VIF3 10 ,其余的方 差膨胀因子值均大于10,表明模型中 存在较严重的多重共线性问题。
up
第三节 多重共线性的修正 一、改变模型的形式 二、删除自变量 三、减少参数估计量的方差 四、其它方法 习题
up
• 一、改变模型的形式
• (一)变换模型的函数形式
• 例如将线性回归模型转化为对数模 型或者多项式模型。 • (二)改变模型的自变量的形式
第六章 完全随机设计
课堂作业
练习:
在试验顾客对一种新产品的接受程度时, 采用了四种不同的柜台陈列方式。又选择了 36家各方面都不相上下的商店,并使每家商 店采用一种柜台陈列方式。这些商店的一周 总销售额(代码)列于下表。
试以0.05的显著性水平,检验关于在四种 陈列方式下所得到的总销售额无差别的零假 设。
二是实验材料的随机分组
二、完全随机的分组方法
1、抽签、抓阎、掷色子 2、查随机数表
假定现有12个实验单元,进行A、B、C、 D四种不同配方,每种配方重复三次实验。 实验随机化设计的方法如下:
抽签法
先将12个实验单元分别标记1,2……,12。 在一个坛中放红、黄、监、绿4种不向颜色的 球各3个,例如用红球代表A种配方,黄球代表 B种配方,蓝球代表C种配方,绿球代表D种配 方。依次从坛中随机不重复地每次模取一个球, 假如第一次摸到绿球,则将—个D配方实验分 配给1号实验单元,第二次模到黄球,则将一 个B配方实验分配给2号实验单元,等等。依次 类推,—直到12个实验单元分配完毕为止。
表6-3 离差平方和计算表
处理 观察值(yij)
yi.
a1 3 3 6 4 5
21
a2 4 2 6 4 4
20
a3 8 7 9 8 5
37
a4 9 12 8 7 11 47
合计
y..=125
yi.
yij 2
4.2 95
4 88
7.4 283
9.4 459
yij2 =925
实验数据及计算:
各种基本量的计算
(三)实验数据及计算
营销方式 A1 A2 A3 A4 (k) 3489
n 6 6 9 8
多重比较
四、多重比较F值显著或极显著,否定了无效假设H O,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。
因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。
统计上把多个平均数两两间的相互比较称为多重比较(multiplecomparisons )。
多重比较的方法甚多,常用的有最小显著差数法(LSD 法)和最小显著极差法(LSR 法),现分别介绍如下。
(一)最小显著差数法 (LSD 法,least significant difference ) 此法的基本作法是:在F 检验显著的前提下,先计算出显著水平为α的最小显著差数αLSD ,然后将任意两个处理平均数的差数的绝对值..j i x x -与其比较。
若..j i x x ->LSD a 时,则.i x 与.j x 在α水平上差异显著;反之,则在α水平上差异不显著。
最小显著差数由(6-17)式计算。
..)(j i e x x df a a S t LSD -=(6-17)式中:)(edf t α为在F 检验中误差自由度下,显著水平为α的临界t 值,..j i x x S -为均数差异标准误,由(6-18)式算得。
n MS S e x x j i /2..=-(6-18)其中eMS 为F 检验中的误差均方,n 为各处理的重复数。
当显著水平α=0.05和0.01时,从t 值表中查出)(05.0e df t 和)(01.0e df t ,代入(6-17)式得:....)(01.001.0)(05.005.0j i e j i e x x df x x df S t LSD S t LSD --==(6-19)利用LSD 法进行多重比较时,可按如下步骤进行:(1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;LSD和(2)计算最小显著差数05.0LSD;.001(3)将平均数多重比较表中两两平LSD比较,作均数的差数与05.0LSD、01.0出统计推断。
多重比较
上节对一组试验数据通过平方和与自由度分解,将所估计的处理均方与误差均方作比较,由F测验推论处理间有显著差异。
但我们并不清楚那些处理间存在差异,故需要进一步做处理平均数间的比较。
一个试验中k个处理平均数间可能有k(k-1)/2个比较,因而这种比较是复式比较亦称为多重比较(multiple comparisons)。
多重比较有多种方法,本节将介绍常用的三种:最小显著差数法(LSD法)、复极差法(q法)和Duncan氏新复极差法(SSR法)。
【最小显著差数法(LSD法)、复极差法(q法)和Duncan氏新复极差法(SSR法)本质上都属于t检验法。
因此,使用这三种方法必须满足方差齐性。
因为使用T检验是有条件的,其中之一就是要符合方差齐次性,这点需要F检验来验证。
方差齐次性检验(Homogeneity-of-variance)结果,从显著性慨率:各组方差无差异),c说明各组的方差在看,p>0.05,接受零假设(零假设Ha=0.05水平上没有显著性差异,即方差具有齐次性。
这个结论在选择多重比较方法时作为一个条件(方差齐次时有齐次时的多重比较法,非齐次时有非齐次时的多重比较法)。
比较计算所得F值与某显著水平(如0.05)下F值,可得处理间差异是否显著。
若处理间差异显著,则需进一步比较哪些处理间差异是显著的。
也就是只有在方差分析中F检验存在差异显著性时,才有比较(多重比较)的统计意义。
进行方差分析时需要满足独立样本、方差齐性、正态分布等条件,如果方差不具备齐性(F检验),可首先进行数据转换,如通过对数变换、平方根变换、倒数变换、平方根反正弦变换等方法变换后再进行方差齐性检验,若还不行只能进行非参数检验。
】7.2.1 最小显著差数法最小显著差数法(least significant difference,简称LSD法),LSD 法实质上是t测验。
其程序是:在处理间的F测验为显著的前提下,计算出显著水平为α的最小显著差数;任何两个平均数的差数如其绝对值≥,即为在α水平上显著;反之则为不显著。
多重比较
多重比较四、多重比较F 值显著或极显著,否定了无效假设H O ,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。
因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。
统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons )。
多重比较的方法甚多,常用的有最小显著差数法(LSD 法)和最小显著极差法(LSR 法),现分别介绍如下。
(一)最小显著差数法 (LSD 法,least significant difference ) 此法的基本作法是:在F 检验显著的前提下,先计算出显著水平为α的最小显著差数αLSD ,然后将任意两个处理平均数的差数的绝对值..j i x x -与其比较。
若..j i x x ->LSD a 时,则.i x 与.j x 在α水平上差异显著;反之,则在α水平上差异不显著。
最小显著差数由(6-17)式计算。
..)(j i e x x df a a S t LSD -=(6-17)式中:)(e df t α为在F 检验中误差自由度下,显著水平为α的临界t 值,..j i x x S -为均数差异标准误,由(6-18)式算得。
nMS S e x x j i /2..=-(6-18)其中e MS 为F 检验中的误差均方,n 为各处理的重复数。
当显著水平α=0.05和0.01时,从t 值表中查出)(05.0e df t 和)(01.0e df t ,代入(6-17)式得:....)(01.001.0)(05.005.0j i e j i e x x df x x df S t LSD S t LSD --==(6-19)利用LSD 法进行多重比较时,可按如下步骤进行: (1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;(2)计算最小显著差数05.0LSD 和01.0LSD ; (3)将平均数多重比较表中两两平均数的差数与05.0LSD 、01.0LSD 比较,作出统计推断。
第六章 方差分析
班组
水平
观测值
因素
分析均值间是否有明显差异。
3、方差分析的基本假定
方差分析基本假定的一般性的表述为,设因
素 A 有个 k 水平,在每个具体水平下,总体分布
为 N j, 2 ,j 1, 2, ,k 。注意这里个总体
方差均相等,并且在每个水平下抽取一个样本,
所取得的个样本相互独立。
注:
最后,构造统计量: 不加证明的引入如下的结论: 1)SSA与SSE相互独立
2) SSE ~ 2 n k 2 3)原假设成立情况下 SSA ~ 2 k 1 2 因此构造统计量:
SSA 2 k 1 F = SSE 2 n k SSA H 0为真 k 1 ,则F ~ F k 1,n k SSE nk
实际计算中主要有如下计算流程 a)水平均值 水平均值是指根据具体水平下的观察值的均 值。有计算公式为 nj 1 xi xij ni j 1 b)总均值 总均值是指全部观察值的均值
x 1
ni
i 1
k
x
i 1 j 1
k
ni
ij
1
ni
i 1
k
x
i 1
k
i
ni
c)总离差平方和 反映了全部观察值离散程度的总规模。有
H1:1, 2, , k 不全相等
2) 构造统计量及拒绝域 首先,分析三类离差平方和: a)总离差(总变差)平方和: 各样本观察值之间的差异称之为总差异,用总 离差平方和来表示。总离差平方和是每一观察值与 其总均值的离差的平方的总和。 b)组内离差(组内变差)平方和: 同一水平下观察值之间的差异,用组内离差平 方和来度量。 c)组间离差(组间变差)平方和: 不同水平观察值之间的差异,称之为组间离差, 用组间离差平方和来度量。
医学统计学之F检验
1.总变异(total sum of square)
SS总 Yij Y Yij2 C
a 2 a i 1 j 1 i 1 j 1 ni ni
Yij2 C=(N 1) S 2
i, j
N
总 N 1
校正系数: C
( Yij )
i 1 j 1 a ni 2
1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0 0
f( F)
F 分布曲线
1
2 F
3
4
1.4 1.2 1.0 0.8 0.6 0.4 0.2 0.0 0
f( F)
F 分布曲线
1 1, 2 5
1 5, 2 5
1 10, 2 10
1
2 F
3
4
单因素方差分析
total beteewn within
均方差,均方(mean square,MS)
变异程度除与离均差平方和的大小有关外, 还与其自由度有关,由于各部分自由度不相等, 因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值 称为均方差,简称均方 (mean square , MS ) 。组 间均方和组内均方的计算公式为 :
查表F( 0.05,, 组间 , 组内 ) 若F F( 0.05,, 组间 , 组内 ) , 则P 0.05; 若F F( 0.05,, 组间 , 组内 ) , 则P 0.05.
查表F( 0.05, 组间 , 组内 )
若F F( 0.05, 组间 , 组内 ) , 则P 0.05; 若F F( 0.05, 组间 , 组内 ) , 则P 0.05.
总 n 1 36 1 35
第六章 F检验和多重比较
回顾上次课方差分析基本思想和平方和与自由度的分解知识,F 检验和多重比较概念。
四、统计假设的显著性检验方差分析的目的:确定各种原因(处理效应、试验误差)在总变异中所占的重要程度。
处理间的方差(st2 )可以作为处理效应方差的估计量处理内的方差(se2 )可以作为试验误差差异的估计量二者相比,如果相差不大,说明不同处理的变异在总变异中所占的位置不重要,也就是不同试验处理对结果影响不大。
如果相差较大,也就是处理效应比试验误差大得多,说明试验处理的变异在总变异中占有重要的位置,不同处理对结果的影响很大,不可忽视。
从第三章我们已经知道,从一正态总体(μ ,σ2 )中随机抽取两个样本,其样本方差s12 与s22 的比值为F :试验误差 F = s12s 22其F 分布曲线随着df1 和df2 的变化而变化。
由于F 值表是一尾的( F 值的区间〔0,+∞) ),一般将大方差作分子,小方差作分母,使F 值大于1,因此,表上df1 的代表大方差自由度, df2 代表小方差自由度。
用处理效应的方差(st2 )和实验误差的方差(se2 )比较时,我们所做的无效假设是假设处理效应的变量和实验误差的变量是来自同一正态总体的两个样本,因此处理效应的方差(st2 )和实验误差的方差(se2 )的比值就是F 值,即在进行不同处理差异显著性的F 检验时,一般是把处理间方差作为分子,称为大方差,误差方差作为分母,称为小方差。
无效假设是把各个处理的变量假设来自同一总体,即处理间方差不存在处理效应,只有误差的影响,因而处理间的样本方差σt2 与误差的样本方差σe2 相等:Ho :σt2 = σe2 HA :σt2 ≠ σe2无论无效假设是否为真,se2 均为总体方差σ2的估计。
只有无效假设为真时,st2 (=se2 )才是总体方差σ2 的估计;当无效假设不真时,将st2 (>se2 )是一个比σ2 更大的估计值。
= 处理效应试验误差无效假设是否成立,要看计算的F 值在F 分布中出现的概率。
多重比较方差检验公式
~
F (1,
fe )
mi mj
从而可以要求 cij c
1 1 ,在此要求下可推出
mi mj
P(W) P(max1i jr Fij (c /ˆ)2)
可以证明
, max1i jr
r 1
Fij
~
F (r 1,
fe )
从而 亦即
(c / ˆ )2 F1 (r 1, fe )
第5页
譬如,设E1 , …, Ek是k个随机事件,且有
P(Ei)=1,i=1 ,…,k ,则其同时发生的概率
k
k
k
P( Ei ) 1 P( Ei ) 1 P(Ei ) 1 k
i 1
i 1
i 1
这说明它们同时发生的概率可能比1 小很多。
为了使它们同时发生的概率不低于1,一个 办法是把每个事件发生的概率提高到1 /k.
min s12 , s22 , , sr2
(8.3.2)
这个统计量的分布无明显的表达式,但在诸方
差相等条件下,可通过随机模拟方法获得H分布
的分位数,该分布依赖于水平数r 和样本方差的
自由度f=m1,因此该分布可记为H (r,f),其分
位数表列于附表10上。
第21页
直观上看,当H0成立,即诸方差相等(12 =22==r2)时,H的值应接近于1,当H的值
这说明: 1与3之间无显著差别,而它们与2之间都有显
著差异。
第12页
8.2.4 重复数不等场合的S法
在重复数不等时,若假设 (8.2.2) 成立,则
tij
( yi. 1
y j. )
1 ˆ
~ t( fe)
mi m j
第六章多重比较、第二节单因素方差分析
第六章,第三、四次课 多重比较和第二节单因素方差分析在试验中所考虑的因素只有一个时,称为单因素实验。
单因素方差分析是最简单的一种,它适用于只研究一个试验因素的资料,目的在于正确判断该试验因素各处理的相对效果(各水平的优劣).组内观测次数相等的方差分析:是指在k 组处理中,每一处理皆含有n 个观测值,其方差分析方法前面已做介绍,这里以方差分析表的形式给出有关计算公式:组内观测次数相等的方差分析例:测定东北、内蒙古、河北、安徽、贵州5个地区黄鼬冬季针毛的长度,每个地区随机抽取4个样本,测定的结果如表,试比较各地区黄鼬针毛长度s e 2k(n-1) SS e 误差或处理内nk-1SS T总和s t2 k-1 SS t处理间 F 均方 自由度 平方和 变异来源 F = s t 2 s e21)分解平方和和自由度=186.7-173.71=12.99作方差分析F 测验 查F 值表,得F0.05 (4,15) =3.06, F0.01 (4,15) =4.89,故F >F0.01 ,P < 0.01,说明5个地区黄鼬冬季针毛长度差异极显著。
不同地区黄鼬冬季针毛长度方差分析表为了确定各个地区之间的差异是否显著,需要进行多重比较。
这里用最小显著差数法(LSD )进行检验。
查t 值表,当dfe =15时,t0.05 =2.131,t0.01 =2.947,于是有:LSD0.05 = 2.131 ×0.658 =1.402 LSD0.01 = 2.947 ×0.658 =1.939本例中各组内观测数相等,而且组内方差均为0.866,故任何两组的比较均可用LSD0.05 及LSD0.01。
在进行LSD0.05 及LSD0.01比较时各组间差数 > LSD0.01,说明两地间差异极显著,标以不同的大写字母;LSD0.01 >各组间差数>LSD0.05 ,说明两地间差异显著,标以不同的小写字母;51.14071455.53022=⨯==nk T C 7.18651.1407121.142582=-=-=∑C x SS T C T n SS i t -=∑2171.17351.14071)4.916.1094.126(41222=-+++⨯= t T e SS SS SS -=43.43471.1732===tt t df SS s 866.01599.122===e e e df SS s 15.50866.043.4322===e t s s F平均数多重比较表结果表明,东北与其它地区,内蒙古与安徽、贵州,河北与贵州黄鼬冬季针毛长度差异均达到极显著水平,安徽与贵州差异达到显著水平,而内蒙古与河北、河北与安徽差异不显著。
f检验的判别条件
f检验的判别条件f检验是一种常用的统计方法,用于比较两个或多个样本的均值是否有显著差异。
它通过计算样本均值之间的差异以及差异的标准差来判断差异是否显著。
在进行f检验时,需要满足以下几个条件。
样本必须是独立的。
这意味着每个样本的观测值之间应该是相互独立的,互不影响。
例如,我们可以研究两组学生的成绩,但是这两组学生之间的成绩不能相互影响。
样本应该是正态分布的。
正态分布是一种对称的连续概率分布,它的均值、中位数和众数都相等,呈钟形曲线。
如果样本的数据不服从正态分布,那么f检验的结果就会失真。
我们可以通过绘制直方图或者使用统计软件进行正态性检验。
不同样本的方差应该是相等的。
这个条件称为方差齐性。
如果样本的方差不相等,那么f检验的结果就会失真。
我们可以使用Bartlett 检验或Levene检验来检验样本的方差齐性。
当满足以上条件时,我们可以进行f检验。
f检验的原理是比较组间变异与组内变异的比值。
组间变异是各组均值与总体均值之差的平方和,而组内变异是各组内个体值与各组均值之差的平方和。
f检验的结果是计算得到的f值,它代表了组间变异与组内变异的比值。
在进行f检验时,我们需要设定显著性水平。
显著性水平是我们对差异的容忍程度,通常选择0.05或0.01。
如果计算得到的f值大于临界值,就说明组间差异显著,我们可以拒绝零假设,认为两个或多个样本的均值存在显著差异。
需要注意的是,f检验只能判断均值之间是否有显著差异,不能确定哪个均值与其他均值不同。
如果f检验结果显著,我们可以进行进一步的事后多重比较,比如Tukey HSD检验或Dunnett检验,来确定具体的差异情况。
f检验是一种常用的统计方法,用于比较两个或多个样本的均值是否有显著差异。
在进行f检验时,需要满足样本独立、正态分布和方差齐性的条件。
通过计算组间变异与组内变异的比值,我们可以得到f值,并根据显著性水平判断差异是否显著。
如果差异显著,我们可以进行进一步的事后多重比较来确定具体的差异情况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
回顾上次课方差分析基本思想和平方和与自由度的分解知识,F 检验和多重比较概念。
四、统计假设的显著性检验
方差分析的目的:
确定各种原因(处理效应、试验误差)在总变异中所占的重要程度。
处理间的方差(st2 )可以作为处理效应方差的估计量
处理内的方差(se2 )可以作为试验误差差异的估计量
二者相比,如果相差不大,说明不同处理的变异在总变异中所占的位置不重要,也就是不同试验处理对结果影响不大。
如果相差较大,也就是处理效应比试验误差大得多,说明试验处理的变异在总变异中占有重要的位置,不同处理对结果的影响很大,不可忽视。
从第三章我们已经知道,从一正态总体(μ ,σ2 )中随机抽取两个样本,其样本方差s12 与s22 的比值为F :
试验误差 F = s
12
s 22
其F 分布曲线随着df1 和df2 的变化而变化。
由于F 值表是一尾的( F 值的区间〔0,+∞) ),一般将大方差作分子,小方差作分母,使F 值大于1,因此,表上df1 的代表大方差自由度, df2 代表小方差自由度。
用处理效应的方差(st2 )和实验误差的方差(se2 )比较时,我们所做的无效假设是假设处理效应的变量和实验误差的变量是来自同一正态总体的两个样本,因此处理效应的方差(st2 )和实验误差的方差(se2 )的比值就是F 值,即
在进行不同处理差异显著性的F 检验时,一般是把处理间方差作为分子,称为大方差,误差方差作为分母,称为小方差。
无效假设是把各个处理的变量假设来自同一总体,即处理间方差不存在处理效应,只有误差的影响,因而处理间的样本方差σt2 与误差的样本方差σe2 相等:
Ho :σt2 = σe2 HA :σt2 ≠ σe2
无论无效假设是否为真,se2 均为总体方差σ2的估计。
只有无效假设为真时,st2 (=se2 )才是总体方差σ2 的估计;当无效假设不真时,将st2 (>se2 )是一个比σ2 更大的估计值。
= 处理效应
试验误差
无效假设是否成立,要看计算的F 值在F 分布中出现的概率。
与t 检验相类似,F 检验是把计算所得的F 值与临界F α值比较,判断由误差造成的概率大小,最后作出统计推断。
我们确定显著标准水平α后,从F 值表中查出在dft 和dfe 下的F α值
五、多重比较
多重比较(multiple comparisons ):要明确不同处理平均数两两间差异的显著性,每个处理的平均数都要与其他的处理进行比较,0.05 0.05 处理间差异不显著 0.05 0.05 处理间差异显著
0.01 0.01
综上所述,可归纳成方差分析表(analysis of variance table)
s e 2 k(n-1) SS e 误差或处理内
nk-1 SS T 总和
s t 2 k-1 SS t 处理间
F 均方 自由度 平方和 变异来源
F = s t 2 s e 2 处理间差异极显著
这种差异显著性的检验就叫多重比较。
统计上把多个平均数两两间的相互比较称为多重比较。
最小显著差数法:least significant difference LSD法
最小显著极差法:least significant ranges LSR法
LSD法的实质是两个平均数相比较的t检验法。
LSR法克服了LSD法的局限性,采用不同平均数间用不同的显著差数标准进行比较,它可用于平均数间的所有相互比较。
(一)最小显著差数法(LSD法)
1.检验的方法
(1)先计算出达到差异显著的最小差数,记为LSDα
(2)用两个处理平均数的差值绝对值与LSDα比较:
2.结果表示方法
标记字母法:首先将全部平均数从大到小依次排列。
然后在最大的平均数上标字母a,将该平均数与以下各平均数相比,凡相差不显著的(< LSDα)都标上字母a,直至某个与之相差显著的则标字母b。
再以该标有b的平均数为标准,与各个比它大的平均数比较,凡差数差异不显著的在字母a的右边加标字母b。
然后再以标b的最大平均数为标准与以下未曾标有字母的平均数比较,凡差数差异不显著的继续标以字母b,直至差异显著的平均数标字母c,再与上面的平均数比较。
如此重复进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。
在各平均数间,凡有一个相同标记字母的即为差异不显著,凡具
不同标记字母的即为差异显著。
差异极显著标记方法相同,但用大写字母标记。
梯形法: 又叫三角形法,是将各处理的平均数差数按梯形列于表中,并将这些差数和LSD α值比较:
LSD 法应用的说明
1. 进行LSD 检验时,这一对平均数的比较是检验之前已经指定的,且经F 检验证实平均数间的差异已达到显著之后,才可以进行LSD 检验。
2. LSD 法实质上是t 检验,但LSD 法是利用F 检验中的误差自由度dfe 查t 临界值,利用误差方差se2 计算平均数差异标准误,从一定程度上缓解了t 检验过程中的三个弊病,但是LSD 法仍然存在提高犯α错误的概率,所以进行LSD 检验必须限制其应用范围。
3. LSD 法适用于各处理组与对照组的比较,不适用于处理组间的比较。
(二)最小显著极差法(LSR 法):是指不同平均数间用不同的显著差数标准进行比较,可用于平均数间的所有相互比较。
新复极差法:(New multiple rang method )SSR 法:SSR 法又称Duncan 法。
无效假设H0为:
μA –μB = 0
(1)按相比较的样本容量计算平均数标准误:
(2)根据误差方差se2所具有自由度dfe 和比较所含平均数个数M ,查SSR 值(附表8),然后算出最小显著极差值(LSR 值)。
(3)将各平均数按大小顺序排列,用各个M 值的LSR α值,检验各平均数间极差的显著性。
q 检验:(q-test ):也称Newman-keuls 检验,方法与新复极差法相似,其区别仅在于计算最小显著极差LSR α时不是查SSR α,而是查q α值(附表9)
q0.05 = 3. 08, q0.01=4.32。
同理可查M =3,M=4时的 当n 1 =n 2=n 时 √ x S = s e 2 n LSR α = SSR α · x 1 S LSR α = q α · x 1 S 还对上例作q 检验: x 1 S =1.5094,查q 值表,df e =12,M=2时
qα值,算出最小显著极差LSR。
在实际计算中:
对于精度要求高的试验——q检验法
一般试验——SSR检验法
试验中各个处理均数皆与对照相比的试验——LSD检验法
方差分析的基本步骤
(1)将样本数据的总平方和与总自由度分解为各变异因素的平方和与自由度;
(2)列方差分析表进行F检验,以弄清各变异因素在总变异中的重要程度;
(3)对各处理平均数进行多重比较。