第七章方差分析(心理)
统计学 7方差分析
13
四、单因素方差分析
(二)分析步骤
•1、提出假设 •2、构造检验统计量 •3、统计决策
2020/4/26
14
1、提出假设
1) 一般提法
▪ H0 : 1 = 2 =…= k
• 自变量对因变量没有显著影响
▪ H1 : 1 ,2 ,… ,k不全相等
• 自变量对因变量有显著影响
2) 注意:拒绝原假设,只表明至少有两个总 体的均值不相等,并不意味着所有的均值 都不相等
12
四、单因素方差分析
(一)单因素方差分析的数据结构 (one-way analysis of variance)
观察值 ( j )
1 2 : ni
水平A1
x11 x12 :
x 1n1
因素A ( i )
水平A2
…
x21
…
x22
…
:
:
x 2n2
…
水平Ak
xk1 xk2 :
x knk
2020/4/26
3. 判断因素的水平是否对其观察值有影响,实际上就
是比较组间方差与组内方差之间差异的大小
2020/4/26
23
(4)计算均方MS
1. 各误差平方和的大小与观察值的多少有关,为
消除观察值多少对误差平方和大小的影响,需
要将其平均,这就是均方,也称为方差
2. 计算方法是用误差平方和除以相应的自由度
3. 三个平方和对应的自由度分别是
系统误差:在因素的不同水平(不同总体)下,各
观察值之间的差异。比如,同一家超市,不同颜色饮
料的销售量也是不同的,这种差异可能是由于抽样的 随机性所造成的,也可能是由于颜色本身所造成的, 后者所形成的误差是由系统性因素造成的,称为系统 误差。
第七章 方差分析
职称 高级工程师 工程师 高级工程师 助理工程师 助理工程师 无技术职称 无技术职称 无技术职称 工程师 助理工程师 高级工程师 工程师 助理工程师 工程师 助理工程师 助理工程师
文化程度 本科 专科 高中 高中 本科 高中 高中 高中 专科 本科 专科 专科 初中 本科 初中 初中 STATA从入门到精通
单样本t检验有两种用法。一是检验样本平均数是否显著地不同于某个假设值。二是检 验同一套观察值中的两个变量的统计指标是否显著地不同。这等价于两者的差值的平 均数是否等于零。 在Stata应用中使用ttest命令来完成,单样本ttest有两种命令格式: 命令格式1(通过样本进行t检验): ttest varname == # [if] [in] [, level(#)] 命令格式2(通过样本的统计指标进行t检验): ttesti #obs #mean #sd #val [, level(#)] 其中,#obs为样本容量,#mean为样本均值,#sd为标准差,#val为待检验数值, level为置信度水平。
表7-15 员工信息表
minority 0 0 0 0 0 0 0 0 educ 8 8 8 8 8 8 8 8 salary 15750 15900 16200 16650 16800 16950 17400 17700 beginsalar y 10200 10200 9750 9750 10200 10200 10200 10200 gender Female Female Female Female Female Female Female Female
本例中,我们检验大学生饮酒行为平均数是否会因为是否就业而有所变化。
Page 12
STATA从入门到精通
第七章 1单因素方差分析
j 1
s
s
因为
nj [ nj ( X j X )] nj ( X j X )
j1
j1
s nj
Xij nX 0
j1 i1
所以 SA 的自由度为s 1.
SA与SE独立 , H0为真时,
S
A 2
~
2
(
s
1).
四、假设检验问题的拒绝域
检验假设 H1 : 1 2 s 0,
H0 :
1,
2,
,
不全为零
s
.
构造检验统计量 因为H0为真时,
F SA (s 1) . SE (n s)
S
E2~
2
(n
s
),
S
A2~
2
(
s
1),
SA (s 1) SA 2
SE (n s) (s 1)
SE 2 ~F (s 1, n s).
j1 i1
s
nj
2 ( X j X )[ ( Xij X j )]
j 1
i 1
s
nj
2 ( X j X )[ Xij nj X j ]
j 1
i 1
0
于是ST可分解为 ST SE SA,
s nj
其中 SE
( Xij X j )2
X n11
A2
X12 X 22
X n2 2
T1
T2
X 1
X2
1
2
As
X1s
第7章 方差分析-1
第一节 方差分析的基本原理
在科学研究中进行多个平均数间的 差异显著性检验,即方差分析。 方差分析的基本思想是将测量数据 的总变异按照变异原因不同分解为处 理效应和试验误差,并作出其数量估 计。
一、数学模型
假设有k组观测数据,每组有n个观 测值,则用线性可加模型来描述每 一个观测值,有:
xij i ij
F检验 若实际计算的F值大于 F0.05( df ,df ),则 F 值在α=0.05的水平上显著,我们以95% 的可靠性推断 代表的总体方差大于 S t2 S e2 代表的总体方差。这种用F值出现概率 的大小推断两个总体方差是否相等的 方法称为 F检验。 无效假设把各个处理的变量假设来自 同一总体,即H0:σt2=σe2,对HA:σt2≠σe2 。
在多因素试验中,实施在试验单位上的具体项 目是各因素的某一水平组合。例如进行3种饲
料和3个品种对猪日增重影响的两因素试验,
整个试验共有3×3=9个水平组合,实施在试 验单位(试验猪)上的具体项目就是某品种与某
种饲料的结合。所以,在多因素试验时,试验
因素的一个水平组合就是一个处理。
5、试验单位(experimental unit) 在试验中能接受不同试验处理的独立的试 验载体叫试验单位。 在畜禽、水产试验中, 一只家禽、 一头
2 ( x xi )( xi x ) 0
1
2
(x x)
1
n
2
( x x ) ( xi x )
2 1 1
n
n
2
把 k 个处理的离均差平方和累加,得:
( x )
1 1
k
n
2
n ( xi x ) ( x x )
统计学原理第七章 方差分析
三、方差分析的基本假定
1.观测值是来自于服从正态分布总体的随 机样本 2.各总体的方差相同。 3.各总体相互独立。
四、方差分析的基本步骤
• 第一步:提出假设 • 第二步:构造检验统计量F • 第三步:查表得Fα,进行统计决策(右侧 检验)
• 若F>F,则拒绝原假设 • 若F<F,则不能拒绝原假设
2.构造并计算检验统计量
• • • • SSR:行因素误差平方和 SSC:列因素误差平方和 SSE:随机因素误差平方和 SST:总因素误差平方和 SST=SSR+SSC+SSE
计算方差
平方和 自由度 方差
行因素
列因素 随机因素 总和
SSR
SSC SSE SST
K-1
r-1
(K-1)(r-1)
• 方差分析中涉及两个分类型自变量时, 称为双因素方差分析。
• 例如,在分析空调销售额的影响因素时, 除了品牌因素之外,还需考虑地区、价 格、质量等因素。
方差分析
单因素方差分析 双因素方差分析
无交互作用
有交互作用
• 1.无交互作用的双因素分析(无重复双 因素分析)
• 因素间的影响是相互独立的
• 2.有交互作用的双因素分析(可重复双 因素方差分析)
万元
1.提出假设:
• 原假设H0: μ1=μ2=μ3=μ4
• 品牌对空调销售额没有显著影响 • 品牌对空调销售额有显著影响
• 备择假设H1: μ1、μ2、μ3、μ4不完全相等
2.计算检验统计量
各水平的均值与方差 观测数
品牌A
品牌B 品牌C 品牌D
求和
2121
1746 1634 1408
平均
353.5
第七章 方差分析
第三节 平均数的多重比较
F检验是一种整体性检验,当经方差分析鉴别 多个正态总体的平均数有显著时,并不能说明 各组水平之间都存在显著差异,只是说至少有 一对差异显著,究竟哪些均数差异显著,哪些 差异不显著,则还需进行均数的多重比较。
一、图凯法
是一种能将所有各对平均值同时比较的方法。 设因素A分成两组,每组有相等的含量,并经
第二节 单因素方差分析
概念
观察的因素只有一个的实验叫单因素实验。对 此种实验结果进行方差分析的方法叫单因素方 差分析。
单因素方差分析所讨论的是k个总体标准差皆 相等的条件下,解决k个总体平均数是否相等 的问题。
一、计算步骤(见P140~142)
1、依据表中数据,计算各组内的 x,x2, xi,n 2、然后计算 x,x2,n, 并令
过方差分析判别各组之间存在显著性差异,为 了比较两者之间差异显著性,可按下式计算T
值: T QS x
其中Q值按预先确定的α水平,组数K和组内 自由度(N-k)查附表获得。
任何一对平均值之差,只要超过T值,就表明 这一对平均值之间的差别是显著的。
图凯法要求所有的样本含量都相等。
例题:P147~148 当各组被试不相等时,可采用S法检验进行两
X x, X 2 x2, N n
3、计算离差平方和:(总离差平方和、组间 离差平方和和组内离差平方和)
4、计算方差:(组间方差和组内方差) 5、计算F值
二、方差分析的计算
见课本P142~143
方差分析计算的两种情况:
当样本含量相等时:
当样本含量不等时: 例题7.2,P144~146
二、实验误差与条件误差
在方差分析的试验中,即使各水平的试验条件 完全相同,但由于随机抽样或试验过程中随机 因素的影响,其试验结果(指标)仍然会存在 偏差,我们称这种偏差为试验误差或随机误差。
第七章 方差分析
表示
调查分析师资格培训--天津商业大学
二、方差分析的数据结构模型
y = µ + αi + β j + γ k + L + ε
其中:y是所观测的变量 µ为常数,代表共同的环境对观测变量的影响,称为平 均效应 αβγ则代表各个因子的某个水平对观测的变量的影响 ε代表实验观测的随机误差,独立同分布于正态分布
调查分析师资格培训--天津商业大学
三、方差分析的意义
一个因子的各个水平作用是否相同,即这个 因子对所观察变量的影响是否显著。 如果是显著的找出该最佳的水平或者各个显 著因子的最佳配合
调查分析师资格培训--天津商业大学
第二节 单因子方差分析
单因子数据结构模型 模型参数估计 单因子方差分析表 各水平效应的多重比较
第四节 两个因子方差分析
两个因子数据结构模型 模型参数的估计 方差分析表的构造 各个水平效应的多重比较
调查分析师资格培训--天津商业大学
一、随机区组因子数据结构模型
yijk = µ + α i + β j + (αβ ) ij + ε ijk i = 1, L p; j = 1, L , q; k = 1, L , n
检验假设
H 0 : α1 = α 2 = L = α m = 0 H1 : 至少α i ≠ 0 or H 0 : µ1 = µ 2 = L = µ m
m ni m
H1 : 至少µi ≠ 0
m ni
总变动平方和分解(SST=SSA+SSE)
( yij − y ) 2 = ∑ ni ( yi − y ) 2 + ∑∑ ( yij − yi ) 2 ∑∑
i =1 j =1 i =1 i =1 j =1
第七章 方差分析
第七章方差分析方差分析的主要目的是(B )。
A.分解平方和 B.进行多个平均数的假设测验 C.分解自由度 D.进行F测验进行方差分析,第一步需要进行(C )。
A.平方和分解 B.自由度分解 C.A+B D.方差分解设有k组数据,每组皆有n个观察值,该资料共有nk个观察值,其总平方和可分解为(B )。
A.组内平方和与误差平方和 B.组间平方和与误差平方和C.组间平方和与处理平方和 D.误差平方和F测验显著,说明处理间(C )。
A.均显著 B.方差同质 C.存在显著差异 D.不显著在分解平方和的过程中,误差平方和一般(D )。
A.通过合并组内平方和得到 B.通过合并组间平方和得到C.通过合并处理平方和得到 D.通过减法得到F测验的先决条件是( D)。
A.变数y服从正态分布 B.样本方差来自不同总体C.两个样本方差彼此独立 D.A+C多重比较是指( B)。
A.多个方差之间互相比较 B.多个平均数之间互相比较C.多个处理之间互相比较 D.多个F值之间互相比较LSD实质上是(),用它进行多重比较,通常会增大犯(D)的概率。
A.t测验,II类错误 B.F测验,I类错误 C.u测验,I类错误D.t测验,I类错误自由度等于(A )。
A.观察值个数减约束条件个数 B. n-1 C. n-2 D. n-k系统分组资料的方差分析可分解出(B )。
A.系统误差 B.两个误差项 C.两个处理效应 D.互作项方差分析是一种 (C ) 的方法。
A.分解平方和 B. F 测验 C.多样本平均数测验 D.假设测验平方和与自由度的分解基于样本观察值的(A )。
A.线性模型 B.大小 C.变异情况 D.数量在 A 、 B 两因素方差分析中如果处理的 F 测验不显著,有无必要筛选最佳组合( A)。
A.无必要 B.有必要 C.视情况而定 D.不好确定如果样本平均数与其方差有比例关系,这种资料宜用(B )。
A.对数转换 B.平方根转换 C.反正弦转换 D.用平均数代替观察值下表是 6 种溶液及对照的雌激素活度鉴定,指标是小鼠子宫重量。
第七章 协方差分析
( x x )( y y ) 2 2 ( x x ) ( y y )
若将公式右端的分子分母同除以自由度(n1),得
r
( x x )( y y ) /( n 1) ( x x ) ( y y )
2
2
(n 1)
若 y 的变异主要由x的不同造成(处理没有显 著效应),则各矫正后的 y 间将没有显著差异(但 原y间的差异可能是显著的)。 若 y的变异除掉x不同的影响外, 尚存在不 同处理的显著效应,则可期望各y 间将有显著差 异 (但原y间差异可能是不显著的)。此外,矫正 后的 y 和原y的大小次序也常不一致。
k n k n
(10-7)
df e=k(n-1)
以上是各处理重复数n相等时的计算公式, 若各处理重复数n不相等,分别为n1、n2、…、 k nk,其和为 ni ,则各项乘积和与自由度的计 i 1 算公式为:
SPT xij y ij
i 1 j 1 k ni
xi . y i .
于是,样本相关系数r可用均方MSx、MSy,
均积MPxy表示为:
r MPxy MS x MS y
上一张 下一张 主 页 退 出
(10-3)
相应的总体相关系数ρ 可用x与y的总体标 准差 x 、 y ,总体协方差COV(x,y)或 xy 表 示如下:
COV ( x, y)
x y
在分析阶段控制混杂因素的方法:
1、采用分层分析:如把年龄分组,再比较 同一年龄组的正常体重与超重组有无差别。 (适用:计量、计数资料)
2、协方差分析(适用:计量资料) 3、多因素分析(适用:计量、计数资料)
心理统计学基础讲义 第七章 方差分析、统计效力
第七章 方差分析、统计效力方差分析原理:综合的F检验应用:两个以上平均数之间的差异检虚无假设:H0:μ1 = μ2 = μ3方差可分解,实验数据的总变异分解为若干不同来源的分变异,一般分为组内变异和组间变异组内变异:实验误差、被试差异等组间变异:不同实验条件造成的变异考察F = 组间均方/ 组内均方的显著性方差分析的前提总体正态分布变异互相独立各实验条件的方差齐性方差分析的步骤a. 求总和方、组间和方、组内和方b. 求总自由度、组间自由度、组内自由度c. 求组间均方、组内均方d. 计算F观测值e. 列方差分析表f. 查F表求F临界值g. 作判断符号系统K = 处理条件或组的数目n i = 第i 组的被试数目,若每组被试相等,则为n N = Σn i = 总被试数T i = ΣX ij = 每个组分数值的和 G = ΣX ij = 所有分数的总和 P = 每个被试的观察数目 单因素完全随机方差分析例:检验三个不同的学习方法的效应。
将学生随机分配到3个处理组 方法 A :让学生只读课本, 不去上课. 方法 B :上课,记笔记,不读课本.方法 C :不读课本,不去上课, 只看别人的笔记解:虚无假设H 0:μ1 = μ2 = μ3 ,三种方法学习效果没有差异 备择假设:至少有一个组和其他不同G=30, N=15, 215G ==, 2106,3XK ==∑SS 总= ΣX 2 - G 2 / N =106 – 900 / 15 = 106 – 60 = 46 SS 组内= SS 1 + SS 2 + SS 3 = 6 + 6 + 4 = 16SS组间= Σ(T2/n i) - G2/N = 52/5 + 202/5 + 52/5 - 302/15 = 5 + 80 + 5 –60 = 30实际SS组间可以用SS总- SS组内快速求得,但不推荐df总= N – 1 = 15 -1 = 14df组内= N –K = 15 - 3 = 12df组间= K – 1 = 3 – 1 = 2MS组内= SS组内/ df组内= 16/12 = 1.333MS组间= SS组间/ df组间= 30/2 = 15F obs = MS组间/ MS组内= 15 / 1.333 = 11.25F0.05(2, 12) = 3.88F obs = 11.25 > F0.05(2, 12) = 3.88所以拒绝H0,至少有一组和其他不同事后检验N-K检验HSD检验Scheffe检验……注意:不能用两两之间t检验,P = 1 - (1 - α)n,例如本例P = 1 - (1 –0.05)3 = 0.143随机区组设计的方差分析又称重复测量方差分析,单因素组内设计,相关组设计,被试内设计解:G = 305.5,N = 32,ΣX2 = 2934.91,K = 4, n = 8SS总= ΣX2 - G2 / N = 2934.91 –305.52 / 32 = 18.33SS组内= SS1 + SS2 + SS3 + SS4 = 2.8 + 3.14 + 1.535 + 1.429 = 8.894SS组内= SS被试间+ SS误差SS被试间=Σ(P2/K) - G2/N = 1544.49/4 + 1482.25/4 + 1584.04/4 + 1310.44/4 + 1303.21/4 + 1444/4 + 1755.61/4 + 1274.49/4 - 305.52/32 = 8.062SS误差= SS组内- SS被试间= 8.894 - 8.062 = 0.832SS组间= Σ(T2/n i) - G2/N = 80.82/8 + 79.62/8 + 75.42/8 + 69.72/8 –305.52/32 = 816.08 + 792.02 + 710.645 + 607.261 –2916.57 = 9.436df总= N – 1 = 32 -1 = 31df组内= N –K = 32 - 4 = 28df组间= K – 1 = 4 – 1 = 3df被试= n – 1 = 8 – 1 = 7df误差= df组内–df被试= 28 –7 = 21MS误差= SS误差/ df误差= 0.832/21 = 0.040MS组间= SS组间/ df组间= 9.436/3 = 3.145F obs = MS组间/ MS误差= 3.145 / 0.040 = 78.63F0.01(3, 21) = 4.87F obs = 78.63 > F0.01(3, 21) = 4.87所以拒绝H0,至少有一组和其他不同事后检验:略协方差分析在某些实际问题中,有些因素在目前还不能控制或难以控制,如果直接进行方差分析,会因为混杂因素的影响而无法得出正确结论。
第七章方差分析ppt课件
精选课件ppt
13
4、各种方差、F值的计算:
各种方差的计算: (1)组间方差:
s
2 A
SS A df A
(2)组内方差:
s
2 e
SS e df e
F检验及其实质: F
s
2 A
s
2 e
本质差异
= —————
试验误差
精选课件ppt
14
第二节 单方面分类的方差分析
例:整地深度(A,cm)对比试验,试分析不同的 整地深度对苗木的高生长有否显著的影响?
5*5拉丁方设计
D BC A E E DACB A CBED B AEDC C EDBA
精选课件ppt
20
第二节 三方面分类的方差分析
分析造成差异的原因? 1、横行间 2、直行间 3、处理间(类间) 4、机误
精选课件ppt
21
第二节 三方面分类的方差分析
三方面分类的方差分析:
SS总=SS横行间+SS直行间+ SS类间+SS误差 即
小:0.05
结论的可靠性
低:统计量的自由 高:统计量的自由度大 度小(df =18) (df =45)
精选课件ppt
3
第一节 方差分析的基本原理
二、方差分析的种类:
1、单因子试验的方差分析 (1)单方面分类的方差分析----完全随机排列、成组法等 (2)双方面分类的方差分析----随机区组设计、配对法等 (3)三方面分类的方差分析----拉丁方设计 2、复因子试验的方差分析 (1)无交互作用的方差分析 (2)有交互作用的方差分析
d
m
LS 0.0D 5t0.05 sd
LS 0.0D 1 t0.01 sd
第七章SPSS方差分析
1-1
方差分析概述
一、问题的提出 通过参数检验可以解决两两总体均值的比较 多个总体均值的检验如何作?(如:钻卡、金卡和银 卡客户的平均移动话费的比较)
可以多次采用两样本t检验方法实现 产生的问题:犯第一类错误的概率明显增大
例如:K个变量两两进行t检验,需要作N=k! ÷(2! ×(k-2)!)次, 如果为0.05,那么每次比较不犯第一类错误的概率为0.95。N 次检验均不犯第一类错误的概率为0.95N,而犯第一类错误的 概率为1-0.95N,远远大于设定的0.05
1 - 14
单因素方差分析
(四)基本操作步骤 (1)菜单选项: analyze->compare means->one-way ANOVA (2)选择一个或多个变量作为观察变量到 dependent list 框
(3)选择一个变量作为控制变量到factor框
(4) option中的statistics项:
1-3
方差分析概述
(三)涉及的概念 (1)观察因素:作为观测的对象,称为观测变量(如:
移动话费、学生成绩等).
(2)影响因素:两类
人为可以控制的因素(如:资费、促销策略、投入学 习的时间等),在方差分析中称为控制因素.将控制 因素的不同情况称为控制因素的不同水平. 人为很难控制的因素(如:消费习惯、个体智力差异 、抽样误差等),在方差分析中称为随机因素.
1 - 27
单因素方差分析中的先验对比
(一)目的 先凭经验确定各水平均值之间的对比系数,以正负符号分别 代表两组,然后判定这两组均值的线性组合是否存在显 著差异.如:1/3 (k1+k2+k3)=1/2 (k4+k5)
应用统计学(第七章 方差分析)
5)检验方法 F 检验 比较处理效应的均方(MSt )和试验误差的均方(MSe) 假设处理效应的变量和试验误差的变量是来自同一正态 总体的两个样本 处理效应的均方(MSt )和实验误差的均方(MSe)的比值就 是F 值,即: F MSt MSe
与t 检验相类似,把计算所得的F 值与临界Fα值比较,
➢ 结果表示方法 (1)字母标示法,(2)梯形表示法
(1) 梯形表示法 a.按大小顺序排列数据 b.依次用本行数据减去比本行数据小的所有值列为列 c.比较所得数值,大于LSD0.05的标*,大于LSD0.01的标**
则:
SST xi2j C SSt Ti2 n C
处理 1 2 … i … k 重复
1
x11 x21 … xi1 … xk1
2
x12 x22 … xi2 … xk2
… …… …………
j
x1j x2j … xij … xkj
… …… …………
n
x1n x2n … xin … xkn
总和 T1 T2 … Ti … Tk
n
(xij
xi. ) 0
约束,
j 1
dfe=k(n-1)=(nk-1)-(k-1)=dfT - dft 3) 均方(方差)的计算
MSt=SSt / dft,
MSe=SSe / dfe
4)统计检验 方差分析的目的在于确定处理效应和试验误差在总变异 中的重要程度 处理间的均方(MSt)可以作为处理效应方差的估计量 处理内的均方(MSe)可以作为试验误差差异的估计量 如果二者相差不大,说明处理的变异在总变异中所占的 位置不重要,即不同试验处理对结果影响不大 如果二者相差较大,即处理效应比试验误差大得多,说 明试验处理的变异在总变异中占有重要的位置,不同处理对 结果的影响很大,不可忽视
方差分析 - 第七章方差分析
L A
X ij2
X ij2
n i
N
X ij2 c n i
(3)组内离差平方和
LELTLA
3、计算自由度
(1)总自由度 (2)组间自由度 (3)组内自由度 4、计算方差 (1)组间方差
nT N1
nA k1
n EN kn T n A
MS
A
LA n A
(2)组内方差
MS E
LE n E
FF0.0(1n1 ,n2 )
p0.01 因素对试验 显 结 著 果 性 有
对[例1]进行单因素方差分析
H 0:1234
方方方方 法法法法 一二三四 1 3.3 3.0 0.4 3.6
2 1.2 2.3 1.7 4.5
3 0 2.4 2.3 4.2
4 2.7 1.1 4.5 4.4
5 3.0 4.0 3.6 3.7
二、单因素方差分析的基本原理
[例1]为考查不同训练方法对磷酸肌酸增长的 影响,我们采用了四种不同的训练方法。每 种方法选取条件相仿的6名运动员,通过三个 月的训练以后,其磷酸肌酸的增长值(单 位:mg/100ml)如下表。试检验训练方法对 运动员磷酸肌酸增长值有无显著性影响?即 四种训练方法运动员磷酸肌酸平均增长值差
xij23
xi2j 493
C232 29.389
18
LT 49329.38946.6311
LA
302 352
57
182
6
2
9.3
893
7.691
1
LE 46.631137.691184.000
n T 1 1 1 8n 7 A 3 1 2n E 1 3 1 85
MAS372.691118.8905
第七章 方差分析
15
三、方差分析的原理
所有数据的误差称总平方和(
sum of squares for total),或总变异,记为SST。
SST xij x
c j 1 i 1
nj
2
例如:所抽取的20家专卖市场销售额之间的误差 平方和称总变异,反映全部观测值的离散程度。
SST=SS因子+SSE
商业区
超市位置
居民小区
写字楼
3个以上 470 500 390 430 420 530 240 270 320
2
第七章 方差分析
你是一名研究人员,会考虑从哪几方面进行分析呢?
你可以考虑单独分析超市位置的影响、竞争者数量的 影响,或是超市位置和竞争者数量搭配在一起的影响。
如果只考虑超市位置对销售额是否有显著的影响,实 际上也是要判断不同位置超市的销售均值是否相同。 若它们的均值相同,就意味着超市位置对销售额没有 显著影响;若均值不相同,则意味着超市位置对销售 额有显著的影响。 在这里超市位置和竞争者数量是定性自变量,销售额 售额是定量因变量。
2
…
N r ,
2
x11 , x12 ,...,x1n j x21 , x22 ,...,x2n j
…
xr1, xr 2 ,...,xrn j
x1 , s
2 1
x2 , s
2 2
…
xr , s
2 r
Back 20
二、单因素方差分析的步骤
Step1:建立假设
H0 : 1 2
r
16
三、方差分析的原理
将各类误差除以自身的自由度,以消除观测值对 其影响,得到均方(mean square),分别称为组 间方差或因子均方(MS因子)、组内方差或残差均方 (MSE)。 如果因子中不同水平对因变量没有影响,则组间 方差只有随机误差而没有系统误差,此时,组间 误差和组内误差应该很接近,两个比值接近1。 当H0为真时,两个比值可建构检验统计量F 进行 假设检验。
第七章方差分析(AnalysisofVariance,ANOVA)
第七章方差分析(Analysis of Variance, ANOVA)7.1 方差分析概述7.2 单因素方差分析7.3 无重复双因素方差分析7.4 可重复双因素方差分析7.5 案例研究7.6 试验设计初步7-17.1 方差分析概述⒈方差分析的概念⒉方差分析中的基本术语⒊ANOVA:对比多个总体的均值⒋方差分析中的基本假定7-27-3方差分析的概念方差分析:通过检验多个总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
解决:①A 、B 、C 是否Y 的重要影响因素;②如果为重要影响因素,最优水平?研究系统A B C分类型自变量Y数值型因变量A (a 1,a 2,a 3,…)B (b 1,b 2,b 3,…)C (c 1,c 2,c 3,…)7-4方差分析中的基本术语第1周第9周第14周第2周第7周第16周第4周第12周第17周第5周第10周第13周第3周第8周第18周第6周第11周第15周AB品牌底部中部顶部货架位置因素因素水平实验单元:“一周”响应变量:“每周销售量”处理:品牌—货架位置组合随机安排试验例:一项市场营销研究。
考察品牌和货架位置对咖啡周销售量的影响。
试验单元(experiment unit )、响应变量(responsevariable )、因素(factor )、因素水平(factor level )、处理(treatment )。
ANOVA:对比多个总体的均值佣金固定薪金佣金加固定薪金165120140981151561309022021012611219510713418715523524080总平均样本均值175.00113.29166.17151.48三类报酬构成的推销人员的月销售额(千美元)问题:(1)三种报酬类型销售人员的销售业绩是否存在显著差异?(2)如果存在差异,哪类销售人员的业绩最佳?三个总体的均值是否相等?7-57-6散点图佣金固定薪金佣金+固定薪金50100150200250300分类型自变量销售业绩均值差异分析:(1)同一总体内部的差异(随机差异)?(2)不同总体之间的差异(随机差异+系统差异)?(3)两类差异大小分析?7-71x 2x 3x ()f x x31x 2x 3x ()f x x2 1 H 0为真时,样本均值的抽样分布H 0为假时,样本均值的抽样分布方差分析中的基本假定•基本假定:•(1)每个总体均服从正态分布;•(2)每个总体的方差相等;•(3)来自每一总体的样本都是独立随机样本三个总体均值是否相等?012311::H H 23,,不全相等7.2 单因素方差分析(One-way Analysis of Variance)⒈基本概念与数据结构表⒉ANOVA:k个总体均值的检验⒊ANOVA表:单因素方差分析⒋最佳方案的选择7-87-9基本概念与数据结构研究一个分类型自变量对一个数值型因变量的影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ΣX 217.40 216.20 213.20 214.40 nk=12
(ΣX)2 47262.76 46742.44 45454.24 45967.36 185426.80
1 2 3 4 n ΣX ΣX2 X
n
4 283.9 20151.51
4 290.50 21098.45
4 286.80 20564.90
SSB
n
n
SSW
2 X X 2
n
2
SST X
2
X
n
dfT dfB dfW
组间自由度
dfB k 1
组内自由度
dfW n k
dfT n 1
总自由度
计算方差 组间方差
SSB MS B dfB
MSW SSW dfW
ij X t k n
X
n j 1 i 1
ij X j
n X
k j 1
j
Xt
2
令SSt X ij X t
j 1 i 1
2
总平方和,自由度为N 1,
k
SS b n X j X t
j 1 k n
k
2
n X j X t
随机区组设计由于同一区组接受所有实验处理,试实 验处理之间有相关,所以也称为相关组设计(被试内设 计)。它把区组效应从组内平方和中分离出来。这时, 总平方和=组间平方和+区组平方和+误差项平方和
随机区组设计中平方和的分解:
SST SSB SSR SSE
SST
2 X X 2
Fmax
2 S max 2 S min
各组容量不等时,用最大的n计算自由度
df n 1
二、单因素完全随机设计的方差分析
完全随机设计(Complete randomized design):把被试随 机分成若干组,每个组分别接受一种实验处理。完全随机分 组后,各实验组的被试之间是相互独立的,因而这种设计 又称“ 独立组设计” 或被试间设计。 该设计的不足之处:误差项既包括实验本身的误差又 包括个体差异引起的误差,因而它的检验效率往往不高。
185426 .80 861.202 3 12
3.48
SSE SST SSB SSR 9.41 5.47 3.48
0.46
3、确定自由度
dfT nk 1
12 1 11
dfB k 1 3 1 2
dfR n 1 4 1 3
2 n i 1
j
Xt
2 X
2
Xt
X
n i 1
ij
Xj
X ij X j 0,
i 1 n
X ij X t
i 1
X
2 n i 1 2 k
ij X j
n X
2 2
j
Xt
2
对k组求和 ,
X
k n j 1 i 1
2、方差分析的逻辑基础
所有数据总的变异来源于两部分:实验处理的不同(组 间变异)、各组内被试的个体差异(组内变异)。 如果能证明组间变异对总变异的贡献大于组内变异,即 证明了引起因变量变化的主要原因是自变量的变化。 变异的分解(平方和的分解 ) 平方和的优越性在于其可加性 方差只有在自由度相等时才可加
组内方差 计算F值
MS B F MSW
进行F检验
•如果F1, 说明数据的总变异中大部分是由实验误差或个体 差异造成的,不同的实验处理A、B、C之间差异不大,即实
验处理基本无效;
•如果F>1且落入F分布的临界区外,即只有实验处理的作用
显著地大于组内变异的作用时,才能确认实验处理的有效作
用, A、B、C三种处理之间的差异显著。 •方差分析的主要任务是检验组间方差在统计上是否显著地 大于组内方差。
例:研究人员采用四种不同的心理治疗方案, 对每个志愿参加治疗的患者进行心理治疗。他们 用录音机记录了每个被试在一段时间中所讲的词 数。由于录音的困难每种方案记录的人数各不相 同,问这几种方案是否有差异?
序号
治疗方案
X1
1 2 3 30 74 46
X2
50 38 66
X3
18 56 34
X4
88 78 60
dfE dfT dfB dfR 11 2 3 6
4、计算方差(均方)
SSB 5.47 MSB 2.74 dfB 2
3.48 SSR 1.16 MS R 3 dfR
SSE MS E dfE
0.46 0.08 6
5、计算F值、进行F检验 组间方差与误差方差的F比值
n
n
SSW X 2
2 X 76444 71657 .5 4786 .5
n
SST
2 X X 2
n
1258 76444
23
2
7636 .9
dfB k 1 4 1 3
dfW n k 23 4 19
XA 71.1 71.5 70.1 70.5
XB 73.4 72.5 72.3 72.2
XC 72.3 72.1 70.8 71.6
表: 4位空管员抗压力测试的方差分析计算表
学生 序号
XA 71.1 71.5 70.1 70.5
XB 73.4 72.5 72.3 72.2
XC 72.3 72.1 70.8 71.6
表: 四组记录数据的完全随机设计方差分析表
变异 来源 组间 变异 组内 变异 总变异
平方和
自由度
方差
F 值
概率
2850.4
3
950.1 3.77* P<0.05
4786.5 7636.9
19 22
251.9
三、单因素随机区组设计的方差分析 (repeated measures analysis of varicace)
dfT n 1 23 1 22
3、计算方差并进行F检验
SSB MS B dfB
MSW SSW dfW
2850 .4 950 .1 3
4786 .5 251 .9 19
MS B F MSW
950 .1 3.77 251 .9
4、做统计决断,列方差分析表
在完全随机设计中,SSt=SSb+SSw,即总变异=组间 变异+组内变异。实际上,这时,组内变异不仅反映了实 验的随机误差,而且还反映了实验组内被试间 个体差异。 单因素的完全随机化实验设计把可以控制的个体差异作为 随机误差而不加以控制,从而增大了实验误差,使F检验 不敏感。 随机区组设计就是要从实验误差中将被试的个体差异 区分开来,从而增加实验数据的有效信息,降低实验误差。
2 X =71657.5
X 2
n
n
1.提出假设
H0:μ 1=μ 2=μ 3=μ 4 (或:无处理效应)
H1:至少有两个总体平均数不等(或:有处理效应)
2.计算平方和、自由度
2 2 X X 71657 .5 68807 .1 2850 .4 SSB
一、方差分析的基本原理
1、方差分析中的几个概念
实验中的自变量称为因素。只有一个自变量的实验称 为单因素实验,两个或两个以上称为多因素实验。 某一因素的不同情况称为因素的“水平”。 每一个实验条件称为实验处理。单因素实验中因素的 一个水平就是一个实验处理,多因素实验中不同因素的不 同水平的交叉形成不同的实验处理。 自变量影响的结果因变量。
4
5 6 7
ni
ΣX
58
62 38
6
62
44 58 80
7
24
66 52
6
76
4
Σn=23 ΣΣX=1258
308 51.33
398 56.86
250 41.67
302 75.5
X
X 2
17144 2857.33
23844 3406.29
12252 2042
23204 5801
X 2 =76444
MS B 2.74 F 34.25 MS E 0.08
区组方差与误差方差的F比值
1.16 MS R 14.50 F 0.08 MS E
对区组间的差异进行检验,主要是考察区组 之间在水平上是否存在显著性差异区组间差异的 显著与否并不影响各种实验处理间平均数差异的 显著性。
6、列方差分析表 4位空管员抗压力测试的方差分析表
n
dfT nk 1
SSB
2 X
n
2 X
n
dfB k 1
dfR n 1
SSR
2 X
k
2 X
nk
SSE SST SSB SSR
dfE dfT dfB dfR
n为区组数,k为实验处理数
计算方差、进行F检验
2、计算平方和
SST
2 X X 2
n
861.202 61814 .86 12
9.41
SSB
2 2 X X
n
n
861.202 61810 .92 12
5.47
SSR
2 2 X X
k
nk
3、方差分析的过程
建立假设
H0:无处理效应
H1:有处理效应