统计学课件 (10)第10章 方差分析与试验设计

合集下载

方差分析(ANOVA)PPT参考课件

方差分析(ANOVA)PPT参考课件

三、多个样本均数的两两比较
34
2020/1/15
方差分析能说明什么问题?
不拒绝H0,表示拒绝总体均数相等的证据不
足 分析终止
拒绝H0,接受H1, 表示总体均数不全相等
哪两两均数之间相等?哪两 两均数之间不等?
需要进一步作多重比较
35
2020/1/15
能否用T检验呢 当有k个均数需作两两比较时,比较的次数共 有c= = k!/(2!(k-2)!)=k(k-1)/2
18~岁 21.65 20.66
… … 18.82 16 22.07 8.97
30~岁 27.15 28.58
… … 23.93 16 25.94 8.11
45~60岁 20.28 22.88 … … 26.49 16 25.49 27 7.19
2020/1/15
基本步骤
(1)建立假设,确定检验水准
2020/1/15
单因素方差分析 (1) 方差齐性检验
结果分析
2020/1/15
Test of Homogeneity of Variances
no
Levene Statistic 3.216
df1 2
df2 33
Sig. .053
Levene方法检验统计量为3.216,其P值为0.053,可 认为样本所来自的总体满足方差齐性的要求。
方差分析(ANOVA)
1
2020/1/15
n4
n3 n2 n1
Y4
Y3 Y2
Y1
2
2020/1/15
例子:某研究者在某单位工作人员中进行了体重指 数(BMI)抽样调查,随机抽取不同年龄组男性受试 者各16名,测量了被调查者的身高和体重值,由此按 照BMI=体重/身高2公式计算了体重指数,请问,不 同年龄组的体重指数有无差异。

第10章-单因素方差分析PPT课件

第10章-单因素方差分析PPT课件

(四)重复 (repeat)
在试验中,将一个处理实施在两个或两个以上的试验单位
上,称为处理有重复;一处理实施的试验单位数称为处理的重
复数。
.
6
第一节 单因素方差分析的基本原理
一、线性模型 二、固定线性模型 三、随机线性模型 四、多重比较 五、基本假定
.
7
一、线性模型
(一)线性模型 假设某单因素试验有a个处理,每个处理有n
第10章 单因素方差分析
One-factor analysis of variance
.
1
用6种培养液培养红苜蓿,每一种培养液做5次重复,测 定5盆苜蓿的含氮量,结果如下表(单位:mg).问用6 种不同培养液培养的红苜蓿含氮量差异是否显著?
培养方法 盆号 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ
1 19.4 17.7 17.0 20.7 14.3 17.3
χi2
χa2
χi3
χa3


χ2j χ3j
χij
χaj
χ2n χ3n
χin
χan
x 2
x 3
x i
x a x
x 2
x 3
2
3
x i
x a x
i
a
a2
a3
.
ai
aa
9
符号
文字表述
a
因素水平数
n
x ij n
xi
xij
j 1
xi
1 n
xi
每一水平的重复数 第i水平的第j次观察值 第i水平所有观察值的和
ij 是试验误差,相互独立,且服从正态分布N(0,σ2)。
.
11
xiji ij ij11,,22,, an

方差分析—田间试验统计PPT课件

方差分析—田间试验统计PPT课件

因素的效应或方差是否存在。所以在计算F值时,
总是将要测验的那一项变异因素的均方作分子,而
以另一项变异(如误差项)作分母。
第18页/共100页
F测验需具备的条件:(1)变数y遵循N(μ,σ2);
(2) s12 和 s22 彼此独立。
[例6.3] 在例6.1中算得药剂间均方 st2=168.00,药剂内均方 se2=8.17,具有自由度ν1=3,ν2=12。试测验药剂间变异
LSR q;df ,p SE SE MSe / n
第26页/共100页
[例6.5] 试以q法测验各种药剂处理的苗
高平均数之间的差异显著性。
SE 8.17 / 4 1.43
查附表7,得到当DF=12时,p=2,3,4的qα值
第27页/共100页
• LSRα值
P
q 0.05
q 0.01
LSR0.05
F分布下一定区间的概率可从已制成的
统计表中查出。附表5给出了各种ν1和ν2 下右尾概率α=0.05和α=0.01
第17页/共100页
时的临界F 值。其值是专供测验s12的总体方

2 1
是否显著大于
s22
的总体方差
2 2
而设计的(H0

2 1

2 2
对HA
2 1

2 2
)。
二、F 测验
在方差分析的体系中,F测验可用于检测某项变异
[例5.1]以A、B、C、D4种药剂处理水稻种 子,其中A为对照,每处理各得4个苗高观 察值(cm),试分解其自由度和平方和。
药剂 A B C D
苗高观察值 yi 18 21 20 13 20 24 26 22 10 15 17 14 28 27 29 32

方差分析法PPT课件

方差分析法PPT课件

计算各样本平均数 y 如i 下:
表 6-2
型号
ABCDE F
yi
9.4 5.5 7.9 5.4 7.5 8.8
•5
引言 方差分析的基本概念和原理
两个总体平均值比较的检验法 把样本平均数两两组成对:
y 1与 y ,2 与y 1 ,…y 3 与 y ,1 与y 6 ,…y ,2 与y 3 ,共有y (5
6.3 显著性检验
利用(6-17)式来检验原假设H0是否成立.对于给定的显著水
平,可以从F分布表查出临界值
A的值.
F(k1,k(再m根1)据),样本观测值算出F
当 FAF(k1,时k(m ,拒1绝))H0,
当 FAF(k1,,时k(m ,接1 受))H0。
即:如果H0成立,F应等于1;相反应大于1,而且因素的影响越大, F值也越大
m
km
T Tj Yij
•38
j1
作统计假设:6种型号的生产线平均维修时数无显 著差异,即
H0: i=0(i=1,2,…,6),H1:i不全为零
•37
6.3 显著性检验
计算SA及SE
k
SA
k
m
i1
(Yi
Y)2
Ti2
i1
m
T2 km
k
km
km
Ti2
SE i1
(Yij Yi)2
j1
i1
j1Yij2i1m
m
Ti Yij
j 1
相当于检验假设
H0 : i 0 (i=1,2,…,k) , H1 : αi不全为零
•29
6.3 显著性检验
可以证明当H0为真时,
ST
2
~2(k

统计学课件--方差分析与实验设计2

统计学课件--方差分析与实验设计2

For = .05, F.05 (2, 8) = 4.46

Test Statistic Conclusion
F = MSTR/MSE = 2.6/.68 = 3.82
Байду номын сангаас
p-value Approach : The p-value (.07) is larger than .05 where F = 4.46 Critical Value Approach : The test statistic (3.82) is smaller than F.05 = 4.46. Therefore, we cannot reject H0. There is insufficient evidence to conclude that miles per gallon13 ratings differ for the three gasoline blends.

Formula for this partitioning SST = SSTR + SSBL + SSE


Total d.f., nT - 1, are partitioned such that k - 1 d.f. go to treatments, b - 1 go to blocks, and (k - 1)(b - 1) go to the error term. nT (total number) = k (number of treatments) × b (number of blocks)
SST nT = kb
nT - 1
7
Case 3: Crescent Oil Co.

Randomized Block Design

方差分析与试验设计

方差分析与试验设计

用 SSE 表示误差项平方和,反映各水平数据的离散情
况,即
k ni
SSE
(xij xi)2
i1 j1
对例 10.1 ,零售业的误差项平方和
n1
(x1j x1)2 700
j1
(10.5)

类似可得
从而
n2
(x2j x2)2 924
j1
n3
(x3j x3)2 434
3. 只考察一个因素的方差分析,称为单因素方差分析. 4. 同时考察两个或两个以上因素的方差分析,称为多因 素方差分析. 5. 假定各水平的数据是来自正态分布总体的随机样本, 各水平的样本互相独立,且方差相等.
二. 方差分析的基本思想和原理 1.两类误差及两类方差
(1) 每个水平为一个总体 (2) 每个水平的一组观察值为总体的一个随机样本,同一 水平下样本观察值之间的差异称为随机误差,用组内方差来 表示. (3) 不同水平下样本观察值之间的差异可能是由于不同水 平引起的,这种误差称为系统误差,但也包含随机误差. 不 同水平样本观察值之间差异用组间方差来表示,即组间方差 包括随机误差,也包括系统误差.
MSE
代替
S
2 P
.
于是统计量 t 为
t
(xi
xj )(i
j )
~t(nk)
MS(E1 1)
ni nj
多重比较的步骤
(1) 提出原假设和备择假设
H 0: ij, H 1: ij
(2) 检验统计量
t
(3) 若
xi x j MSE ( 1 1 )
ni n j
MSE270814.52263 234
续(计算统计量)
如果 H 0 成立,那么 12 k

方差分析 PPT

方差分析 PPT
H0: 1 =2 … H0: 1 =2 …
假定原假设成立
r
2 i
i1 =0
1
E(S A ) =
SS A 2 1
SSA = SSe
1 (r 1)
FA SA / Se 1
说明条件引起的波动与试验 误差引起的波动差不多。
§1.2 单因素方差分析
方差分析的原理
➢ (5)统计量的分布
➢方差齐性 (homoscedascity):各水平下的总体具有相 同的方差。但实际上,只要最大/最小方差小于3,分析结果
都是稳定的。可用Levene test、Brown- Forsythe‘s Test 。
§1 方差分析
主要内容
§1.1 基本概念 §1.2 单因素方差分析 §1.3 双因素方差分析 §1.4 多因素方差分析 §1.5 多重t-test方法
∼ N (02, )
r
E( i. 2 ) 2 r
E( 2 ) 2
r
[ ] r
SS A E
( )2 r
i
i.
2 i
(
1)
2
i1 j
i1
1
SA
SS A
1
r
2 i
i1
1
2
Se =
SSe
(r 1)
2
误差方差是总体方差的无偏估计
§1.2 单因素方差分析
单因素方差分析的数学模型
(4)构造原假设和统计量
§1.1 §1.2 §1.3 §1.4
§1 方差分析
主要内容
基本概念 单因素方差分析 两因素方差分析 多因素方差分析
§1.2 单因素方差分析
概述
➢单因素方差是仅仅讨论一种试验条件对试验结果有无显 著影响的分析。 ➢单因素方差分析对因素的水平数没有限制,可任意选择 ,但一般多见的是选3至6个水平。

最新人大版_贾俊平_第五版_统计学_第10章_方差分析PPT课件

最新人大版_贾俊平_第五版_统计学_第10章_方差分析PPT课件
• 当这个比值大到某种程度时,就可以说不同水 平之间存在着显著差异
பைடு நூலகம்
10.1.3 方差分析中的基本假定 1.每个总体都应服从正态分布
• 对于因素的每一个水平,其观察值是来自服从正态 分布总体的简单随机样本。
• 比如,每种颜色饮料的销售量必需服从正态分布 2.各个总体的方差必须相同
• 对于各组观察数据,是从具有相同方差的总体中抽 取的
10.2 单因素方差分析
10.2.1 数据结构
观察值 ( j )
1 2 : : n
水平A1
x11 x21 : : xn1
因素(A) i
水平A2

x12

x22

:
:
:
:
xn2

水平Ak
x1k x2k : : xnk
10.2.2 分析步骤
1.提出假设
• 一般提法 H0: m1 = m2 =…= mk (因素有k个水平) H1: m1 ,m2 ,… ,mk不全相等
身所造成的,后者所形成的误差是由系统性因素造成的, 称为系统误差
2.两类方差 (1)组内方差(误差平方和 、残差平方和、 SSE)
– 因素的同一水平(同一个总体)下样本数据的方差 – 比如,无色饮料A1在5家超市销售数量的方差 – 组内方差只包含随机误差
(2)组间方差(因素平方和、SSA)
– 因素的不同水平(不同总体)下各样本之间的方差 – 比如,四种颜色饮料销售量之间的方差 – 组间方差既包括随机误差,也包括系统误差
水平A ( i ) 粉色(A2) 橘黄色(A3)
绿色(A4)
1
26.5
31.2
27.9
30.8

方差分析PPT课件

方差分析PPT课件

方差分析的用途
1. 用于多个样本平均数的比较 2. 分析多个因素间的交互作用 3. 回归方程的假设检验 4. 方差的同质性检验
为了规范事业单位聘用关系,建立和 完善适 应社会 主义市 场经济 体制的 事业单 位工作 人员聘 用制度 ,保障 用人单 位和职 工的合 法权益
第一节 方差分析的基本问题
▪ 一、方差分析问题的提出 问题:为了探索简便易行的发展大学生心 血管系统机能水平的方法,在某年级各项 身体发育水平基本相同,同年龄女生中抽 取36人随机分为三组,用三种不同的方法 进行训练,三个月后,测得哈佛台阶指数 如表 1 ,试分析三种不同的训练方法对女 大学生心血管系统的影响有无显著性差异。
结果的好坏和处理效应的高低,实际中具体测 定的性状或观测的项目称为试验指标。常用的 试验指标例如有:身高、体重、日增重、酶活 性、DNA含量等等。
影响因素( experimental factor): 观测中所
研究的影响观测指标的定性变量称之为因素。 当考察的因素只有一个时,称为单因素试验; 若同时研究两个或两个以上因素的影响时,则 称为两因素或多因素试验。
N (3, 2)
A3
61.31 60.00
┆ 67.26 69.05
为了规范事业单位聘用关系,建立和 完善适 应社会 主义市 场经济 体制的 事业单 位工作 人员聘 用制度 ,保障 用人单 位和职 工的合 法权益
分析
根据研究目的,这里有三个正态总体 N (1, 2),N (2, 2 ), N (3 , a2 ) 。三组数据分别为来自三个总体的样本,问题是 推断 1 ,2 和 3 之间有无显著差异。 由 x1, x2, x3不相等,不能直接得出1, 2, 3不尽相等的结论, 原因是:造成 x1, x2, x3不相等可能有两个方面因素:一是 1, 2, 3 不等,二是1 2 3,但由于抽样误差,造成 x1, x2, x3 之间有差异。现在的任务是通过样本推断1, 2, 3之间有无 显著性差异。

方差分析课件-PPT

方差分析课件-PPT
、 、 、 增重表就是选用S-N-K法作均数多重两两比较得结果
增重表就是选用S-N-K法作均数多重两两比较得结果:
本例按a=0、05水准,将无显著性差异得数归为一类 (Subset for alpha=0、05)。可见
品种5、2、3得样本均数位于同一个子集( Subset )内,说 明品种5、品种2、品种3得样本均数两两之间无显著差异; 品种3、4、1位于同一个Subset内,她们之间无显著差异;而 品种5、2与品种4、1得样本均数有显著差异。
即三组均数间差异极显著,即不同时期切痂对大鼠肝脏 ATP含量有影响。
LSD法多重比较:
“*”显著性标注 两组均数得差
•S-N-K法:本例按0、5水平,将无显著差异得均数归为一类。
•第一组与第三组为一类,无显著差异,它们与第二组之间均数差 异显著。
•LSD与S-N-K法,不同得两两比较法会有不同。
如欲了解就是否达到极显著差异,需要将显著水平框中得 值输入0、01。
例、 为了研究烫伤后不同时间切痂对大鼠肝脏 ATP得影响,现将30只雄性大鼠随机分成3组,每组 10只:A组为烫伤对照组,B组为烫伤后24小时切痂 组,C组为烫伤后96小时切痂组。全部大鼠在烫伤 168小时候处死并测量器肝脏ATP含量,结果如下。 问试验3组大鼠肝脏ATP总数均数就是否相同。
该12个观察值得总得均值为91、5,标准差为34、 48。
上图为品系、剂量间均值得方差分析(F检验)结果
由表中可知,品系得F=23、771,P=0、001<0、01,差异极显著;
剂量得F=33、537,P=0、001<0、01,差异极显著。说明不同品系与 不同雌激素剂量对大鼠子宫得发育均有极显著影响,故有必要进一步对 品系、雌激素剂量两因素不同水平得均值进行多重比较。

统计学课件之方差分析

统计学课件之方差分析

2.9850 2.9320
-1.8100 -1.8960
平均
2.0320 3.8850 2.9585 -1.8530
a1-a2
0.0960 0.0100 0.0530
单独效应 其他因素固定时,同一因素不同水平的差异 主效应 某一因素各水平的平均差别 交互效应 某因素的各单独效应随另一因素改变而变化
完全随机设计方案与随机区组设计方案的比较
方差齐性检验(Bartlett法,求一个卡方值)
方差不齐的处理——非参数检验
在设计阶段未预先考虑或预料到,经假设检验得 出多个总体均数不全相等的提示后,才决定的多 个均数的两两事后比较,多用于探索性研究 方法有:SNK-q test、Bonfferoni-t test等
xi
0.5542 0.4167 0.3438 0.1646 0.3698 ( x )
xi2 3.9350 2.3925 1.7006 0.5906 8.6187 ( x2 )
随机区组设计
方案 配伍组设计,为配对设计的扩展(1:m) 首先将受试对象按可能影响试验结果的属性
相同或相近分组(非随机),如按性别、体重、 年龄、职业、病情等。共形成b个区组,再分别将 各区组内的试验单位随机分配到各处理组。
试问:三组ATP总体均数是否存在差别? 若三组间存在差别,则推论B组和C组的处理对ATP
的影响。
表1 大鼠烫伤后ATP的测量结果(mg)
A组
B组
C组
xij
7.76
11.14
10.85
7.71
11.60
8.58
8.43
11.42
7.19
8.47
13.85
9.36
10.30

方差分析与实验设计幻灯片

方差分析与实验设计幻灯片
什么是方差分析?
统计学
STATISTICS (第三版)
什么是方差分析(ANOVA)?
(analysis of variance)
1. 方差分析的根本原理是在20世纪20年代由英国统计 学家Ronald A.Fisher在进展实验设计时为解释实验 数据而首先引入的
2. 检验多个总体均值是否相等
3. 通过分析数据的误差判断各总体均值是否相等
▪ 反映全部观测数据的误差称 ▪ 所抽取的全部36家超市的销售额之间差异
2. 随机误差(random error)—组内误差(within-group
error)
▪ 由于抽样的随机性造成的误差 ▪ 反映样本内部数据之间的随机误差
3. 处理误差(treatment error)—组间误差(between-
group error)
▪ 不同的处理影响所造成的误差
▪ 反映样本之间数据的差异
7 - 13
2021年8月
统计学
STATISTICS (第三版)
方差分析的根本原理 (误差分解)
1. 数据的误差用平方和(sum of squares)表示,记为SS
2. 总平方和(sum of squares for total)记为SST
什么是方差分析?
(例题分析)
【 例 】确定超市的位置和竞争者的数量对销售额是否有 显著影响,获得的年销售额数据(单位:万元)如下表
因子
7 - 10
水平或处理
样本数据
2021年8月
统计学
STATISTICS (第三版)
什么是方差分析?
(例题分析)
1. 如果只考虑“超市位置〞对销售额是否有显著影响,实 际上也就是要判断不同位置超市的销售额均值是否一样
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机样本,第i个总体的样本均值为该样本的 全部观察值总和除以观察值的个数 计算公式为
xi
x
j 1
ni
ij
ni
(i 1,2,, k )
10 - 31
式中: ni为第 i 个总体的样本观察值个数 xij 为第 i 个总体的第 j 个观察值
统计学
构造检验的统计量
(计算全部观察值的总均值)
1. 全部观察值的总和除以观察值的总个数 2. 计算公式为
10 - 25
统计学
§10.2
单因素方差分析
一. 二. 三. 四.
数据结构 分析步骤 关系强度的测量 用Excel进行方差分析
10 - 26
统计学
单因素方差分析的数据结构
(one-way analysis of variance)
因素(A) i 水平A1 水平A2 … 水平Ak
观察值 ( j )
10 - 17
统计学
方差分析的基本思想和原理
(方差的比较)
1. 若不同不同行业对投诉次数没有影响,则组间误差中只包
含随机误差,没有系统误差。这时,组间误差与组内误差 经过平均后的数值就应该很接近,它们的比值就会接近1 2. 若不同行业对投诉次数有影响,在组间误差中除了包含随 机误差外,还会包含有系统误差,这时组间误差平均后的 数值就会大于组内误差平均后的数值,它们之间的比值就 会大于1 3. 当这个比值大到某种程度时,就可以说不同水平之间存在 着显著差异,也就是自变量对因变量有影响 例,判断行业对投诉次数是否有显著影响,实际上也就是检验
10 - 13
统计学
方差分析的基本思想和原理
1. 仅从散点图上观察还不能提供充分的证据证明不 同行业被投诉的次数之间有显著差异

这种差异也可能是由于抽样的随机性所造成的
2. 所以,需要有更准确的方法来检验这种差异是否 显著,也就是进行方差分析

所以叫方差分析,因为虽然我们感兴趣的是均值, 但在判断均值之间是否有差异时则需要借助于方差
统计学
方差分析的基本思想和原理
10 - 11
统计学
80 60
方差分析的基本思想和原理
(图形分析)
» ¶ ß Î ý ±Í Ë ´ Ê
40 20 0 0
零售业 1
旅游业 2
航空公司 3
家电制造 5 4
Ð Ò µ
» ¬ ² Í Ð Ò ±Í Ë ´ Ê µ É µ Í µ » ¶ ß Î ý Ä ¢ ã ¼
SST xij x
k ni i 1 j 1 2
前例的计算结果:
SST = (57-47.869565)2+…+(58-47.869565)2 =4164.608696
10 - 34
统计学
构造检验的统计量
(计算组间平方和 SSA)
1. 是各组平均值 xi (i 1,2,, k ) 与总平均值 x 的
数独立
10 - 20
布总体的简单随机样本 比如,每个行业被投诉的次数必需服从正态分布
统计学
方差分析中的基本假定
1. 在上述假定条件下,判断行业对投诉次数是否 有显著影响,实际上也就是检验具有同方差的 四个正态总体的均值是否相等 2. 如果四个总体的均值相等,可以期望四个样本 的均值也会很接近 四个样本的均值越接近,推断四个总体均值相等
4. 误差是由各部分的误差占总误差的比例来 测度的
10 - 15
统计学
方差分析的基本思想和原理
(两类误差)
1. 随机误差

因素的同一水平(总体)下,样本各观察值之间的差异 比如,同一行业下不同企业被投诉次数是不同的 这种差异可以看成是随机因素的影响,称为随机误差
2. 系统误差
因素的不同水平(不同总体)下,各观察值之间的差异 比如,不同行业之间的被投诉次数之间的差异 这种差异可能是由于抽样的随机性所造成的,也可能
统计学
第 10 章 方差分析与试验设计
10 - 1
统计学
第 10 章 方差分析与试验设计
方差分析的引论 单因素方差分析 方差分析中的多重比较 双因素方差分析 试验设计初步
§10.1 §10.2 §10.3 §10.4 §10.5
10 - 2
统计学
学习目标
1. 2. 3. 4. 5. 6.
解释方差分析的概念 解释方差分析的基本思想和原理 掌握单因素方差分析的方法及应用 理解多重比较的意义 掌握双因素方差分析的方法及应用 掌握试验设计的基本原理和方法
1 2 : : n
10 - 27
x11 x12 : : x1n
x21 x22 : : x2n
… … : : …
xk1 xk2 : : xkn
统计学
分析步骤 • 提出假设 • 构造检验统计量 • 统计决策
10 - 28
统计学
1. 一般提法
提出假设

• 自变量对因变量有显著影响 2. 注意:拒绝原假设,只表明至少有两个总 体的均值不相等,并不意味着所有的均值 都不相等
10 - 35
统计学
构造检验的统计量
(计算组内平方和 SSE)
1. 是每个水平或组的各样本数据与其组平均值的离
2.
3. 4.
差平方和 反映每个样本各观察值的离散状况,又称组内平 方和 该平方和反映的是随机误差的大小 计算公式为
SSE x
k ni i 1 j 1
10 - 3
统计学
§10.1 方差分析引论
方差分析及其有关术语 方差分析的基本思想和原理 方差分析的基本假定 问题的一般提法
一. 二. 三. 四.
10 - 4
统计学
方差分析及其有关术语
10 - 5
统计学
什么是方差分析(ANOVA)?
(analysis of variance)
1. 用于检验多个总体均值是否相等 通过分析观察数据的误差判断各总体均值是否
10 - 22
X
统计学
方差分析中基本假定
若备择假设成立,即H1: mi (i=1,2,3,4)不全相等

至少有一个总体的均值是不同的 四个样本分别来自均值不同的四个正态总体
f(X)
m3 m1 m2 m4
10 - 23
X
统计学
方差分析问题的一般提法
10 - 24
统计学
方差分析问题的一般提法
相等
2. 用于研究分类型自变量对数值型因变量的影 响

一个或多个分类尺度的自变量

2个或多个 (k 个) 处理水平或分类
3. 有单因素方差分析和双因素方差分析

单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量
10 - 6
统计学
什么是方差分析?
(例题分析)
【例】为了对几个行业的服务质量进行评价,消费者协会在 四个行业分别抽取了不同的企业作为样本。最近一年中消费 者对总共23家企业投诉的次数如下表
消费者对四个行业的投诉次数 行业 观测值 零售业 旅游业 航空公司 家电制造业
1 2 3 4 5 6 10 7 7 -
57 66 49 40 34 53 44
68 39 29 45 56 51
31 49 21 34 40
44 51 65 77 58
统计学
什么是方差分析?
(例题分析)
1. 分析四个行业之间的服务质量是否有显著差 异,也就是要判断“行业”对“投诉次数” 是否有显著影响 2. 作出这种判断最终被归结为检验这四个行业 被投诉次数的均值是否相等 3. 如果它们的均值相等,就意味着“行业”对 投诉次数是没有影响的,即它们之间的服务 质量没有显著差异;如果均值不全相等,则 意味着“行业”对投诉次数是有影响的,它 们之间的服务质量有显著差异
2. 3. 4.
离差平方和 反映各总体的样本均值之间的差异程度,又称组 间平方和 该平方和既包括随机误差,也包括系统误差 计算公式为
SSA xi x ni xi x
k 2 k i 1 j 1 i 1 ni 2
前例的计算结果:SSA = 1456.608696
被投诉次数的差异主要是由于什么原因所引起的。如果这种差 异主要是系统误差,说明不同行业对投诉次数有显著影响
10 - 18
统计学
方差分析的基本假定
10 - 19
统计学
方差分析的基本假定
1. 每个总体都应服从正态分布 对于因素的每一个水平,其观察值是来自服从正态分
2. 各个总体的方差必须相同 各组观察数据是从具有相同方差的总体中抽取的 比如,四个行业被投诉次数的方差都相等 3. 观察值是独立的 比如,每个行业被投诉的次数与其他行业被投诉的次
1. 设因素有k个水平,每个水平的均值分别用m 1、 m 2 、 、mk 表示 2. 要检验k个水平(总体)的均值是否相等,需要提出如 下假设: H0: m1 m2 … mk H1: m1 , m2 , ,mk 不全相等 3. 设m1为零售业被投诉次数的均值,m2为旅游业被投诉 次数的均值,m3为航空公司被投诉次数的均值,m4为 家电制造业被投诉次数的均值,提出的假设为 H0: m1 m2 m3 m4 H1: m1 , m2 , m3 , m4 不全相等
10 - 12
统计学
方差分析的基本思想和原理
(图形分析)
1. 从散点图上可以看出

不同行业被投诉的次数是有明显差异的 即使是在同一个行业,不同企业高,航空公司被投诉的次数 较低
2. 看出行业与被投诉次数之间有一定的关系

如果行业与被投诉次数之间没有关系,那么它们被 投诉的次数应该差不多相同,在散点图上所呈现的 模式也就应该很接近
相关文档
最新文档