第7章 方差分析2
EXCEL_应用版_第7章__方差分析
(5)在单元格D11中输入“=B11/C11”,并将 其复制到D12和D13。 (6)在单元格E11中输入“=D11/D12”,计算 F值。 (7)在单元格F11中输入公式 “=FDIST(E11,C11,C12)”,回车后显示 0.078425,即为P值。计算结果如图7-4所示。
图7-4 方差分析表
图7-3 各离差平方和的计算 返回本节
7.1.3 方差分析表
下面用Excel建立方差分析表。
(1)打开“方差分析”工作表和“计算表”工作表。
(2)在“方差分析”工作表的单元格B10~F10中分别 输入“平方和”、“自由度”、“均方差”、“F值”、 “P值”;分别在单元格A11~A13中输入“组间方差”、 “组内方差”和“总方差”。 (3)将“计算表”工作表单元格E17、F17、G17中的 数据“粘贴链接”到“方差分析”工作表的B12、B11 和B13单元格中。 (4)确定各方差的自由度。总方差的自由度是样本容 量数之和减1,因此应为5+5+5-1=14,在单元格C13 中输入14。
图7-5 “方差分析:单因素方差分析”对话框
图7-6 单因素方差分析输出结果
图7-6 单因素方差分析输出结果
用Excel进行方差分析。
(1)输入原始数据。
(2)实现自动计算,得出方差分析结果。
图7-7 “增重试验分析”工作表
图7-8 单因素方差分析输出结果 返回本节
7.3 双因素方差分析
(1)建立“方差分析”工作表,如图7-1所示。
(2)在单元格A7中输入“样本均值”,在单元格A8 中输入“总体均值”。
( 3 ) 选 择 单 元 格 B7, 输 入 公 式 “=AVERAGE(B2:B6)”,计算样本均值,并将其复制 到 C7 和 D7 单 元 格 中 , 得 到 的 值 分 别 是 2 2 2 8 . 8 0 、 2928.00和1951.60。 (4)在单元格D8中输入公式“=AVERAGE(B2:D6)”, 回重复方差分析”工作表,输入相 关数据,如图7-12所示。
第7章:方差分析
15.75
k
x
njxj
j 1
K
nj
811.5 88.625 815.75 888
11.9583
kr
SST
(xij - x)2
i1 j1
8
8
8
(x1 j - x)2 (x2 j - x)2 (x3 j - x)2
j 1
2.水平 水平是指因子在实验中所处的不同状态。如,例7.1中三个分 店处于三个不同的位置,每个位置被看作是一种水平。
3.观察值 观察值是指在具体的因素水平下,实验样本的观察数据。如, 例7.1中每个分店在8个观察日的销售额。
4.交互影响 当方差分析的影响因素不唯一时,需要关注各因素之间是否独 立。如果因素之间存在相互作用,我们称之为“交互影响”, 实际中这个交互影响可以看成是试验结果产生作用的一个新因 素,需要单独分离出来进行分析。
17
3
10
9
13
4
13
12
14
5
11
7
18
6
9
9
14
7
8
6
16
8
15
8
19
试分析这三家分店的平均日营业额是否相同,从而确定营业 地点这个位置因素是否对营业额有显著影响(α=5%)
相应的假设为:
H0 : 1 2 3 1,2,3三者不全相等
如果原假设成立,意味着营业位置对销售没有显著影响;如 果原假设不成立说明至少有两个地点的营业额是有显著差异的 ,即承认营业位置对销售存在显著影响。
方差分析是20世纪20年代发展起来的一种统计方法,是由 英国统计学家费舍尔在进行试验设计时为解释试验数据而首先 引入的。
第七章协方差分析
相应的总体相关系数ρ 可用x与y的总体标
准差 x 、 y ,总体协方差COV(x,y)或 xy 表
示如下:
CO(Vx,y) xy xy xy
(10-4)
均积与均方具有相似的形式 , 也有相似的
性质。在方差分析中,一个变量的总平方和与
自由度可按变异来源进行剖分,从而求得相应
的均方。统计学已证明:两个变量的总乘积和
(covariance),记为COV(x,y)或 xy 。统 计学证明了,均积MPxy是总体协方差COV(x,y) 的无偏估计量,即 EMPxy= COV(x,y)。
于是,样本相关系数r可用均方MSx、MSy,
均积MPxy表示为:
r MPxy MSx MSy
(10-3)
上一张 下一张 主 页 退 出
在分析阶段控制混杂因素的方法:
1、采用分层分析:如把年龄分组,再比较 同一年龄组的正常体重与超重组有无差别。 (适用:计量、计数资料)
2、协方差分析(适用:计量资料)
3、多因素分析(适用:计量、计数资料)
协方差分析(analysis of covariance,ANCOVA)
将线性回归与方差分析结合起来,检 验两组或多组修正均数间有无差异的一种 统计方法,用于消除混杂因素对分析指标 的影响。
Yijuti eij
第i组第j个观 测值
一般均值
第i组的组效 应
随机误差
方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变量
下面我们再看协方差分析数据结构(单因 素完全随机设计试验资料的协方差分析):
观测值=一般均值+水平影响+协变量影响+随机误差
Y ij u y tie (X ij u x )ij
统计学-方法、数据与R的应用 第7章 方差分析
——方法、数据与R的应用
第7章 方差分析
上课之前的话
t检验用于检验两个独立正态总体均值是否相 等。例如,检验对照组和处理组之间是否存在 差异 当要同时检验多个总体的均值是否存在差异时 ,此时就不能用t检验了,而需要使用方差分 析(Analysis of Variance,简称ANOVA)
基本引概言念
基本引概言念
做一些假定把所研究的问题归结为一个统计问题 ,然后用方差分析方法进行分析
• 一般情况下,把年龄分组这样的离散型变量称为因素或因子(factor) ,记为A。因素的取值称为水平(level)或处理(treatment)。这里, 因素就是变量,水平就是该变量的取值,这些名词是分类或属性变量 所特有的。对于本例,三个年龄段称为因素A的水平,分别记为A1, A2,A3。xij表示第i组的第j个职工的保险消费额,其中i=1,2,3; j=1,2,…,12
方差分析是英国统计学家费歇尔(R.A.Fisher) 在20世纪20年代提出并逐渐发展起来的一种在 实践中广泛运用的统计方法
• 形式上,方差分析是比较多个总体的均值是否相等 • 本质上,它所研究的是分类型自变量对数量型因变量
的影响,这使得它与后面介绍的回归分析关系密切, 但又不完全相同
基本引概言念
通过总离差平方和分解公式,我们发现若SSB明显大于SSW ,说明各总体(或各水平)之间的差异显著大于抽样误差, 那么零假设可能并不成立
SSB/SSW的比值大到什么程度,可以否定零假设呢?由于 SSB的自由度为r-1,而SSW的自由度为N-r,其中r是组数,
r
N是所有的观测数,即 N ni
i 1
7.1.1 基本思想
i1 j 1
7.1.1 基本思想
生物统计第7章 单因素方差分析
7.2 固定效应模型
7.2.1 线性统计模型
在固定效应模型中,αi是处理平均数与总体 平均数的离差,是个常量,故:∑αi=0(i=1,
2,…n),要检验a个处理效应的相等性,就 要判断各αi是否都等于0。若各αi都等于0,则
各处理效应之间无差异。因此,零假设为:H0: α1=α2= … =αa =0 备择假设为:HA: αi≠0(至少有一个i)
2020/6/19
7.3.3 不等重复时平方和的计算
• 上述情况,无论是固定效应模型,还是随机效 应模型,各处理的观测次数都是相同的。若不 同处理观测次数不同,以上的方差分析方法仍 然适用,但在计算平方和时,公式要作改动。
• 检验程序及结果分析同上述讨论。
2020/6/19
7.4 多重比较(multiple comparison)
2020/6/19
7.1 方差分析的基本原理
7.1.1 方差分析的一般概念
方 差 分 析 ( analysis of variance , ANOV)是一类特定情况下的统计假设检验, 平均数差异显著性检验----成组数据 t检验的一 种引伸。t检验可以判断两组数据平均数间的差 异显著性,而方差分析则可以同时判断多组数 据平均数之间的差异显著性。当然,在多组数 据的平均数之间做比较时,可以在平均数的所 有对之间做t检验。但这样做会提高犯Ⅰ型错误 的概率,因而是不可取的。
2020/6/19
7.2.3 均方期望与统计量F
2020/6/19
7.2.4 平方和的简易计算方法
• 实际应用时,总的平 方和与处理平方和一 般按右式计算:
• 式中的被减数C通常被称 为校正项(correction) :
• 误差平方由右式算出 : • 用SAS软件更简便
高级统计学:第七章方差分析
第七章方差分析第一节方差分析的基本原理方差分析(Analysis of variance,简称ANOV A)是对多个总体均值是否相等这一假设进行检验的一种方法。
一、方差分析的内容1实例[例] 某饮料生产企业研制出一种新型饮料。
饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。
这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。
现从地理位置相似、经营规模相仿的五家超级市场上收集了前一期该种饮料的销售量情况,见表7—1。
新型饮料在五家超市的销售情况表解:从表7—1中看到20个数据各不相同,什么原因使其不同呢?2产生的原因①是销售地点的影响;②是饮料颜色的影响。
A 有可能是抽样的随机性造成的;B 有可能是由于人们对不同颜色有所偏爱。
可以将上述问题就归结为一个检验问题——检验饮料颜色对销售量是否有影响,即要检验各个水平的均值k μμμ,,21 是否相等。
二、方差分析的原理1基本概念因素:一个独立的变量就称为一个因素。
如,颜色水平:将因素中不同的现象称为水平。
(每一水平也称为一组) 单因素方差分析:方差分析只针对一个因素进行。
多因素方差分析:同时针对多个因素进行分析。
观察值之间的差异产生来自于两个方面:①是由因素中的不同水平造成系统性差异的; ②是由于抽选样本的随机性产生的差异。
方差分析数据结构表7-2在一元情形下假设:ik i2i1X ,,X ,X ,i=1,2…n j ,j=1,2,…k,为来自总体)N(2σ,μ的随机样本。
如果假设k H μμμ=== 210:也可表达为 j j αμμ+=其中j α是第j 个水平的偏差。
如果各水平下均值相等,则可以表述为: 0:210====k H ααα对于第j 个因素有ij j ij X εαμ++=其中()2,0~σεN ij 为独立同分布随机变量。
对于观察值则有)()(j ij j ij x x x x xx -+-+=将式两端减去x 然后平方,得))((2)()()(222j ij j j ij j ij x x x x x x x x x x --+-+-=-等式两边求和,有也即如上例可以建立如下的假设:43210:μμμμ===H ;43211,,,:μμμμH 不全相等。
心理统计学基础讲义 第七章 方差分析、统计效力
第七章 方差分析、统计效力方差分析原理:综合的F检验应用:两个以上平均数之间的差异检虚无假设:H0:μ1 = μ2 = μ3方差可分解,实验数据的总变异分解为若干不同来源的分变异,一般分为组内变异和组间变异组内变异:实验误差、被试差异等组间变异:不同实验条件造成的变异考察F = 组间均方/ 组内均方的显著性方差分析的前提总体正态分布变异互相独立各实验条件的方差齐性方差分析的步骤a. 求总和方、组间和方、组内和方b. 求总自由度、组间自由度、组内自由度c. 求组间均方、组内均方d. 计算F观测值e. 列方差分析表f. 查F表求F临界值g. 作判断符号系统K = 处理条件或组的数目n i = 第i 组的被试数目,若每组被试相等,则为n N = Σn i = 总被试数T i = ΣX ij = 每个组分数值的和 G = ΣX ij = 所有分数的总和 P = 每个被试的观察数目 单因素完全随机方差分析例:检验三个不同的学习方法的效应。
将学生随机分配到3个处理组 方法 A :让学生只读课本, 不去上课. 方法 B :上课,记笔记,不读课本.方法 C :不读课本,不去上课, 只看别人的笔记解:虚无假设H 0:μ1 = μ2 = μ3 ,三种方法学习效果没有差异 备择假设:至少有一个组和其他不同G=30, N=15, 215G ==, 2106,3XK ==∑SS 总= ΣX 2 - G 2 / N =106 – 900 / 15 = 106 – 60 = 46 SS 组内= SS 1 + SS 2 + SS 3 = 6 + 6 + 4 = 16SS组间= Σ(T2/n i) - G2/N = 52/5 + 202/5 + 52/5 - 302/15 = 5 + 80 + 5 –60 = 30实际SS组间可以用SS总- SS组内快速求得,但不推荐df总= N – 1 = 15 -1 = 14df组内= N –K = 15 - 3 = 12df组间= K – 1 = 3 – 1 = 2MS组内= SS组内/ df组内= 16/12 = 1.333MS组间= SS组间/ df组间= 30/2 = 15F obs = MS组间/ MS组内= 15 / 1.333 = 11.25F0.05(2, 12) = 3.88F obs = 11.25 > F0.05(2, 12) = 3.88所以拒绝H0,至少有一组和其他不同事后检验N-K检验HSD检验Scheffe检验……注意:不能用两两之间t检验,P = 1 - (1 - α)n,例如本例P = 1 - (1 –0.05)3 = 0.143随机区组设计的方差分析又称重复测量方差分析,单因素组内设计,相关组设计,被试内设计解:G = 305.5,N = 32,ΣX2 = 2934.91,K = 4, n = 8SS总= ΣX2 - G2 / N = 2934.91 –305.52 / 32 = 18.33SS组内= SS1 + SS2 + SS3 + SS4 = 2.8 + 3.14 + 1.535 + 1.429 = 8.894SS组内= SS被试间+ SS误差SS被试间=Σ(P2/K) - G2/N = 1544.49/4 + 1482.25/4 + 1584.04/4 + 1310.44/4 + 1303.21/4 + 1444/4 + 1755.61/4 + 1274.49/4 - 305.52/32 = 8.062SS误差= SS组内- SS被试间= 8.894 - 8.062 = 0.832SS组间= Σ(T2/n i) - G2/N = 80.82/8 + 79.62/8 + 75.42/8 + 69.72/8 –305.52/32 = 816.08 + 792.02 + 710.645 + 607.261 –2916.57 = 9.436df总= N – 1 = 32 -1 = 31df组内= N –K = 32 - 4 = 28df组间= K – 1 = 4 – 1 = 3df被试= n – 1 = 8 – 1 = 7df误差= df组内–df被试= 28 –7 = 21MS误差= SS误差/ df误差= 0.832/21 = 0.040MS组间= SS组间/ df组间= 9.436/3 = 3.145F obs = MS组间/ MS误差= 3.145 / 0.040 = 78.63F0.01(3, 21) = 4.87F obs = 78.63 > F0.01(3, 21) = 4.87所以拒绝H0,至少有一组和其他不同事后检验:略协方差分析在某些实际问题中,有些因素在目前还不能控制或难以控制,如果直接进行方差分析,会因为混杂因素的影响而无法得出正确结论。
第7章 方差分析
第7章 方差分析7.2单因素方差分析(单因变量单因素方差分析)基本描述:设影响某个指标的因素只有一个A ,相应的水平为A 1, A 2, …,A k ,假设各个水平所对应的总体服从正态分布,方差相等.单因素方差分析的目的之一就是检验012:k H μμμ=== .若拒绝原假设,则认为至少有两个水平间存在着差异,到底是那些水平间存在差异呢?这时可以进行多重比较,一致性子集检验(把均值间不存在差异的水平划分为一类).若不知方差是否相等,还可以进行方差齐性检验.方差分析是对总平方和进行分解,分解为因素的平方和,残差平方和, 然后在此基础上构造统计量, 从而对原假设进行检验功能:分析一个因素的各个水平之间是否存在差异;进行多重比较,一致性子集检验;进行方差齐性检验。
方法:Analyze →Compare Means →ANOV A注1:在数据文件时,因变量(即指标)只有一个,各个水平下的观测量通过分类变量来区分.注2:因变量一般要求服从正态分布。
对照:12342μμμμ++= 例:data07-01.sav 例:data07-02.sav7.3单因变量多因素方差分析基本描述:设影响某个指标的因素有多个,假设各个水平组合所对应的总体服从正态分布,方差相等.单因变量多因素方差分析的目的之一就是检验0:H某个因素的各个水平之间无差异。
或0:H某些因素间不存在交互作用。
主效应: 反映一个因素对指标的影响性的一个度量.主效应的作用可通过相应的平方和来体现.交互效应: 两个以上因素间的相互作用对指标的影响性的一个度量.方差分析是对总平方和进行分解,分解为各个因素的平方和,交互作用的平方和,残差平方和, 然后在此基础上构造统计量, 从而对原假设进行检验功能:分析一个变量是否受多个因素影响?检验因素之间是否存在交互作用;进行协方差分析。
要求:(1)因变量和协变量(或伴随变量):数值型变量。
二者之间存在线性关系。
(2)因子变量:分类变量。
第七章 方差分析
A.完全等价且F=t
B.完全等价且t=√F
C.t检验结果更准确
D.方差分析结果更准确
答案:B
6.无重复试验的方差分析中,一定有( )
A. MST=MSA+ MSB+MSE
B .SST≤SSA+SSB+SSE
C.MST≤MSA+MSB+MSE
D.SST=SSA+SSB+SSE
答案:D
7.单因素方差分析中的SSA表示( )
A.某因素效应与抽样误差综合结果
B.某因素效应大小
C.抽样误差大小
D.不可预见的误差
答案:A
8.在方差分析中,如果P≤a,则( )
A.各个总体均数全相等
B.至少有两个样本均数不等
C.至少有两个总体均数不等
D.各个样本均数不全相等
答案:C
34.在方差分析中,方差分析的目的是( )
A.分析各个正态总体的方差是否相同B.分析各个正态总体的标准差是否相同
C.分析来自正态总体各组的样本均值是否相同D.分析各个正态总体的均值是否相同E.无正确选项
答案:D
二、填空题
1.方差分析用于两个或多个总体均数间的比较、分析两个或多个因素的交互作用、_____________________的假设检验和方差齐性检验。
答案:C
9.方差分析的前提条件不包括()
A.独立性
B.正态性
C.均匀性
D.方差齐性
答案:C
10.方差分析的主要目的是
A.判断各总体是否存在方差
B.比较各总体的方差是否相等
C.分析各样本数据之间是否存在显著差异
第七篇 方差分析(stata统计分析与应用)
主要选项
描述
category(varlist) class(varlist) repeated(varlist) partial sequential noconstant regress [no]anova
分类变量
分类变量,与上同义。如不注明,Stata默 认所有变量都是分类变量。
重复观测因子
使用边际平方和,默认选项
描述
bonferroni 多重比较检验 scheffe 多重比较检验 sidak 多重比较检验 产生列表 [不]显示均值 [不]显示标准差 [不]显示频数 [不]显示观测个数 不显示方差分析表 以数值形式显示,而不是以标签形式 列表不隔开 将缺失值作P为age一类10
STATA从入门到精通
■ longway命令的基本格式如下: ■ loneway response_var group_var [ i f ] [ i n ] [weight] [ , options]
■ 表7-15 员工信息表
minority educ
salary
beginsalar y
gender
0
8
15750
10200
Female
0
8
15900
10200
Female
0
8
16200
9750
Female
0
8
16650
9750
Female
0
8
16800
10200
Female
0
8
16950
10200
喝减肥茶后体 重(公斤) 63 71 79 73 74 65 67 73 60 76 71 72 75 62
第七章SPSS方差分析
1-1
方差分析概述
一、问题的提出 通过参数检验可以解决两两总体均值的比较 多个总体均值的检验如何作?(如:钻卡、金卡和银 卡客户的平均移动话费的比较)
可以多次采用两样本t检验方法实现 产生的问题:犯第一类错误的概率明显增大
例如:K个变量两两进行t检验,需要作N=k! ÷(2! ×(k-2)!)次, 如果为0.05,那么每次比较不犯第一类错误的概率为0.95。N 次检验均不犯第一类错误的概率为0.95N,而犯第一类错误的 概率为1-0.95N,远远大于设定的0.05
1 - 14
单因素方差分析
(四)基本操作步骤 (1)菜单选项: analyze->compare means->one-way ANOVA (2)选择一个或多个变量作为观察变量到 dependent list 框
(3)选择一个变量作为控制变量到factor框
(4) option中的statistics项:
1-3
方差分析概述
(三)涉及的概念 (1)观察因素:作为观测的对象,称为观测变量(如:
移动话费、学生成绩等).
(2)影响因素:两类
人为可以控制的因素(如:资费、促销策略、投入学 习的时间等),在方差分析中称为控制因素.将控制 因素的不同情况称为控制因素的不同水平. 人为很难控制的因素(如:消费习惯、个体智力差异 、抽样误差等),在方差分析中称为随机因素.
1 - 27
单因素方差分析中的先验对比
(一)目的 先凭经验确定各水平均值之间的对比系数,以正负符号分别 代表两组,然后判定这两组均值的线性组合是否存在显 著差异.如:1/3 (k1+k2+k3)=1/2 (k4+k5)
第7章方差分析
3. 组间方差(between groups) 因素的不同水平(不同总体)下各样本之间的方差 组间方差既包括随机误差,也包括系统误差
方差分析的基本思想和原理
(方差的比较)
2. 如果原假设成立,则表明没有系统误差,组间平方和 SSA除以自由度后的均方与组内平方和SSE和除以自由 度后的均方差异就不会太大;如果组间均方显著地大于 组内均方,说明各水平(总体)之间的差异不仅有随机误 差,还有系统误差
3. 判断因素的水平是否对其观察值有影响,实际上就是比 较组间方差与组内方差之间差异的大小
i1 j1
x
i1
n
n
式中:n n1 n2 nk
构造检验的统计量
(例题分析)
构造检验的统计量
(计算总误差平方和 SST)
1. 全部观察值 x i与j 总平均值 x 的离差平方和 2. 反映全部观察值的离散状况 3. 其计算公式为
k ni
SST xij x2
单因素方差分析的数据结构
(one-way analysis of variance)
观察值 ( j )
水平A1
因素(A) i
水平A2
…
水平Ak
1
x11
x21
…
xk1
2
x12
x22
…
xk2
:
:
:
:
:
:
:
:
:
:
n
x1n
x2n
…
xkn
提出假设
1. 一般提法
H0 : 1 = 2 =…= k 自变量对因变量没有显著影响
第七章 方差分析
15
三、方差分析的原理
所有数据的误差称总平方和(
sum of squares for total),或总变异,记为SST。
SST xij x
c j 1 i 1
nj
2
例如:所抽取的20家专卖市场销售额之间的误差 平方和称总变异,反映全部观测值的离散程度。
SST=SS因子+SSE
商业区
超市位置
居民小区
写字楼
3个以上 470 500 390 430 420 530 240 270 320
2
第七章 方差分析
你是一名研究人员,会考虑从哪几方面进行分析呢?
你可以考虑单独分析超市位置的影响、竞争者数量的 影响,或是超市位置和竞争者数量搭配在一起的影响。
如果只考虑超市位置对销售额是否有显著的影响,实 际上也是要判断不同位置超市的销售均值是否相同。 若它们的均值相同,就意味着超市位置对销售额没有 显著影响;若均值不相同,则意味着超市位置对销售 额有显著的影响。 在这里超市位置和竞争者数量是定性自变量,销售额 售额是定量因变量。
2
…
N r ,
2
x11 , x12 ,...,x1n j x21 , x22 ,...,x2n j
…
xr1, xr 2 ,...,xrn j
x1 , s
2 1
x2 , s
2 2
…
xr , s
2 r
Back 20
二、单因素方差分析的步骤
Step1:建立假设
H0 : 1 2
r
16
三、方差分析的原理
将各类误差除以自身的自由度,以消除观测值对 其影响,得到均方(mean square),分别称为组 间方差或因子均方(MS因子)、组内方差或残差均方 (MSE)。 如果因子中不同水平对因变量没有影响,则组间 方差只有随机误差而没有系统误差,此时,组间 误差和组内误差应该很接近,两个比值接近1。 当H0为真时,两个比值可建构检验统计量F 进行 假设检验。
第七章 方差分析与回归分析
Se
2
~ 2 (n r),还可证明,在 H0 为真时
SA
2
~
2 (r 1) ,且与 Se 相互独立.
因而,由 F 分布的构造可知,在 H0 为真时,(21)
式给出的检验统计量 F ~ F(r 1, n r) ,当取 c F1 (r 1, n r)
便有 P(F c} ,故得拒绝域为 W {F F1 (r 1 n r)}.
i 个总体获得容量为 mi 叫的样本yi1, yi2 ,, yimi , i 1,2,, r
各样本间还是相互独立的.这些样本可以通过试验或某种
观察获得.为方便起见,本章对样本及其观察值都用同一
符号 y 加下标表示,其含义可从上下文理解.
在 Ai 水平下获得的 yij 与 i 不会总是一致的,记
A 的各水平间无显著差异,简称因子 A不显著;
反之,当 H0 不真时,各i 不全相同,这时称因子 A 的各水平间有显著差异,简称因子 A显著.图(1)
示意了这两种说法的含义.
(a)A 不显著
图(1)
(b)A 显著
定义1 用于检验假设(1)式的统计方法称为方差分 析法,其实质是检验若干个具有相同方差的正态总体的 均值是否相等的一种统计方法.在所考察的因子仅有一 个的场合,称为单因子方差分析. 为检验假设(1)式需要从每一总体中抽取样本.设从第
二、单因子方差分析的统计模型
在例1中所考察的因子只有一个,称其为单因子试验.
通常在单因子试验中,设因子 A有 r 个水平A1, A2,, Ar ,
在每一水平下考察的指标可以看成一个总体,现有 r 个
水平,故有 r 个总体,并假定:
(1)每一总体均服从正态分布; (2)每一总体的方差相同; (3)从每一总体中抽取的样本相互独立.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
案例7-1 讨论
某医院妇产科测定几种卵巢功能异常患者血清中 促黄体素的含量(U/L),结果如下: 1.卵巢发育不良 2.丘脑性闭经
11.82 3.86 8.26 42.50 38.31 35.76 33.60 6.71 3.32 2.63 4.50 2.20 2.75 11.14 5.98 1.90 5.43 4.59 1.67 31.38
Xi
21.54
Si
3.43
19.54 19.56 19.46 22.47 29.79 28.65 27.13 23.37
18.03 17.39 25.63 29.38 22.68 25.13 28.79 28.44
22.88
3.56Βιβλιοθήκη 28.064.3831.83
4.54
26.07
5.70
⑴建立假设,确定检验水准
∑
ni ( X
i
− X )
g-1
N-g
SS 组间
MS 组间 MS 组内
ν 组间
SS 组内
组内变异
SS 总 − SS 组间
ν 组内
表 7-4 变异来源 总变异 组间变异 组内变异
SS
例 7-1 的方差分析表
ν
59 3 56
MS
F
P
1915.80 1017.41 898.39
339.14 16.04
21.14
请问该研究者所作统计处理是否合理?为什么? 正确的做法是什么?
各组小白鼠耐缺氧时间/min
耐缺氧时间
ni
24.03 24.37 28.81 20.16 23.01 34.44 33.24 34.22 22.82 16.01 18.74 22.51 28.32 31.69 31.68 35.08 60 28.29 15 29.04 15 18.42 15 18.72 15
用角度表示:X ' = arcsin X
4. 倒数变换
适用:数据两端波动较大的资料,可使极端 值的影响减少。 将原始数据X的倒数作为新的分析数据:
X ' = 1/ X
7.2 多个样本均数间的两两比较
关于多个样本均数的比较方法有20多种 本教材仅介绍常用的两种方法: 1.LSD-t检验法 2. Bonferroni法 3. Tukey 检验
7.2.2 Bonferroni 法 简称:BON法
该法适用于所有的两两比较,均数两 两比较和多个频率间的两两比较。 比较次数不多时,效果较好。 一般认为10次以上,效果较差。
Tukey 检验
它适用于k个试验组与一个对照组均数差 别的多重比较。但也可做两两比较,此法 检验功效高于Bonferroni法。
2.平方根变换
适用:观察值为Poisson分布的计数资料 将原始数据X的平方根作为新的分析数据:
X '= X 当原始数据有小值或零时,可用 X ' = X + 0.5
3.平方根反正弦变换
当观察值服从二项分布比例资料时,由于平均值靠近 0或1时,方差较小,而在0.5时方差最大,此时宜 采用数据X的平方根反正弦值作为新的分析数据。
响,将60只Wistar小白鼠随机分为低、中、 高三个剂量组和一个对照组,每组15只小白 鼠,对照组给予蒸馏水0.25ml灌胃,低、中、 高剂量分别给予2.0、4.0、8.0g/kg的饮料溶于 0.2~0.3ml蒸馏水后灌胃,每天一次。40天 后,对小鼠进行耐缺氧存活时间实验,结果 见表7-1,试比较不同剂量的茶多酚饮料对延 长小鼠的平均耐缺氧存活时间有无差别。
1组 2组 3组 4组 0.15 1.20 0.50 1.50 0.30 135 1.20 1.50 0.40 1.40 1.40 2.50 0.50 1.50 2.00 2.50 1.90 2.20 2.30 2.20
【分析思路】 先对数据进行正态性检验和方差齐性检验:
Tests of Normality Kolmogorov-Smirnov Shapiro-Wilk 组别 Statistic df Sig. Statistic df Sig. 增加量 1 .162 4 . .989 4 .952 2 .270 6 .195 .889 6 .314 3 .231 6 .200* .890 6 .316 4 .307 4 . .729 4 .024 *. This is a lower bound of the true significance.
否
O
是
单因素方差分析
近似检验, 如Tamhane’s T2
7.3 多个样本非参数检验 Kruskal - Wallis test
例
对按完全随机设计分组的四组大白鼠,给予不
同剂量的某种激素后,测量耻骨间隙宽度的增加 量(mm),试分析给予不同剂量的某种激素后大白 鼠耻骨间隙宽度的平均增加量有无差异?
a. Lilliefors Significance Correction
a
第4组数据不正态
Test of Homogeneity of Variances 增加量 Levene Statistic 4.078
df1 3
df2 16
Sig. .025
4个总体方差不齐
【分析思路 】 此时,不适合直接进行单因素方差分析,考虑 进行变量变换或秩和检验。多个独立样本的秩和 验(Kruskal-Wallis Test)其基本思想和两独立 样本一样( wilcoxon rank sum test),只是在 编秩时将所有数据混在一起编秩,然后分别计算 组的秩和。
10.51 2.96
3.垂体性闭经
11.05 22.03
研究者运用t 检验进行两两比较,共 比较了3次。结论是卵巢发育不良者 血清中促黄体素的含量高于丘脑性闭 经和垂体性闭经者。这样做是否妥 当?为什么?正确的做法是什么?
案例7-2
讨论
某研究人员将15只小白鼠随机分为3组, 比较小白鼠接种3种不同的细菌后存活 的天数是否有差别,实验数据如下: A细菌 B细菌 C细菌 2 4 8 4 5 9 5 7 10 7 8 17 9 12 23
表7-1
组别
对照组 21.31 23.46 低剂量组 20.16 26.13 中剂量组 35.07 24.33 高剂量组 30.23 38.47 合计 23.14 20.34 24.49 25.24 28.11 33.97 36.84 35.10 27.48 26.98 21.32 20.23 24.74 21.86 38.61 28.01
对下结论特殊说明:
若 F≥Fα ,则 P≤α,按α水准,拒绝 H0 ,接 受 H1 ,有统计学意义。可以认为多个总体均 至于多个总体均数中哪些不同?
常用的多重比较方法有LSD-t,Bonferroni等。
不全相同,即多个总体均数中至少有两个不同。
需要进行多个均数间的两两比较 ,教材7.2内容。
7.1.4 方差分析应用条件
单因素方差分析主要内容
One- way analysis of variance ● 方差分析的基本思想 ● 方差分析的步骤 ● 平均值之间的多重比较 ● 方差分析的变量变换
7.1.3 方差分析基本步骤
⑴建立假设,确定检验水准
⑵计算统计量 ⑶确定P值,作出推断结论
例7-1
为研究茶多酚饮料对急性缺氧的影
SPSS提供14种多样本均数比较方法
不满足方差齐性的多重比较方法
7.2.1 LSD-t(least significant difference)检验 用于检验某一对或几对在专业上有特殊意义的均 数之差的总体均数是否为0。
LSD − t = XA−XB SX A−X B
SX A−X B
1 1 = MS误差 ( + ) n A nB
LSD − t ≥ tα ,ν 时,即 X A − X B ≥ tα ,ν
1 1 ( + )时,可以认为在 MS误差 n A nB
α等于0.05水平上两组总体均数µ A和µ B 有差别。
本法缺陷:进行两两比较的次数越多,犯Ⅰ类错 误的概率越大。
表 7.2 例 7.1 的两两比较(LSD-t 检验) 对 比 组 对照组与低剂量组 对照组与中剂量组 对照组与高剂量组 低剂量组与中剂量组 低剂量组与高剂量组 中剂量组与高剂量组
方差齐性检验
ANOVA 方差齐性检验
例题
总的讲有统计学意义,需要作两两比较。 总的讲有差别,但哪一组有差别?
ANOVA
两两比较
两两比较结果
方差分析流程
完全随机设计多组间定量资料的比较
否
各样本是否来自正态总体?
否
变量变换 秩和检验
是
各样本来自的总体方差是否齐?
是 否 是
秩和检验 变 量 变 换
增加量 0.15 0.3 0.4 0.5 1.2 1.35 1.4 1.5 1.9 2.3 0.5 1.2 1.4 2 2.2 2.2 1.5 1.5 2.5 2.5
秩次 1 2 3 4.5 6.5 8 9.5 12 14 18 4.5 6.5 9.5 15 16.5 16.5 12 12 19.5 19.5
⒈各样本必须是相互独立的随机样本 ⒉各样本均来自正态总体或近似正态分布 ⒊相互比较的各总体方差要相等(齐性) Homogeneity of variance
当样本量较大时,样本均数的抽样分布服 正态分布或近似正态分布。但极度情况下 要做变量变换。
7.1.5 方差分析齐性检验
采用:Levene 检验,手工计算较为繁琐。 略。。。。。见教材119: 公式7-9 条件:不依赖总体分布类型,正态偏态都可以, 用于两样本和多样本齐性检验。 直接看统计软件运行结果。。。 见教材:P128页:实验结果 操作步骤:实习课上演示
1. 建立检验假设 H0 :接受不同剂量(4 种)激素的大白鼠耻骨间隙 宽度的增加量总体分布相同 H1 :接受不同剂量(4 种)激素的大白鼠耻骨间隙 宽度的增加量总体分布不全相同 α =0.05 2. 编秩 将各组数据混合,由小到大编秩,若有相等数 值则取平均秩次。