概率论难与数理统计(91 单因素试验的方差分析)
合集下载
单因素试验的方差分析——概率论与数理统计(李长青版)
其次, 同一品种下数据表现出来的差异称为试验(随
机)误差, 这是由客观条件的偶然干扰造成, 与因素(品种) 无直接联系.
方差分析正是分析两类误差的有效工具.
本问题只考虑品种一种因素,故是单因素试验,即只有
一个因子,记为 A, 5个不同的品种就是该因子的5个不同 的水平,分别记为 A1 , A2 , A3 , A4 , A5 , 由于同一品种在不 同的田块上的亩产量不同,故可以认为一个品种的亩产 量 就是一个母体,在方差分析中,总是假定各母体相互独 立地服从同方差的正态分布,即第 j 个品种的亩产量是 一个随机变量,它服从正态分布:
nj
ns , 称为总平均,
它是从 s 个总体中抽得的样本的样本均值.
用样本值 xij 与总平均
x 之间的偏差平方和来反映
种子品种代 号 (水平)
重复试验序号及作物实测产量 1 128 125 148 2 126 137 132 3 139 125 139 4 130 117 125 5 142 106 151 133 122 139
A1 A2
A3
这里试验的指标是作物产量, 作物是因素, 三种种 子品种代表三个不同的水平. 首先,形成数据差异的直接原因是种子的不同品 种.因此, 每个品种下产量的均值差异检验是我们的主 要任务.这种由因素(种子品种)造成的差异称为条件(系 统)误差.
H 0 : 1 2 s 0, H1 : 1 , 2 , , s 不全为零.
(二) 离差平方和分解 引入记号
nj
1 xj nj
s
x
i 1
ij
( j 1, 2,
, s) 水平Aj下的样本均值,
称为组内平均(或列平均)
数理统计 单因素方差分析
表1 试验数据的形式
总体
观测值
样本容量
1 2 s
y11 , y12 , y1 n1 y 21 , y 22 , y 2 n2 y s 1 , y s 2 , y sn s
n1 n2 ns
1、方差分析的任务是: (1) 检验s 个总体均值是否相等,即
H 0 : 1 2 s H 1 : 1 , 2 , , s 不全相等
记
1 s ni i ,称为总平均, n i 1
i i 称为水平 Ai 的效应。
从而模型可以写为:
yij i ij 2 ~ N ( 0 , ) ij ni i 0 i
(i 1,2,, s; j 1,2,, ni )
来源
因子 误差 总和
平方和
318 .98
395 .46
714 .44
自由度
3
均方
106 .33 28.25
F 3.76
14
17
3.76 F0.05 (3,14) 3.34
拒绝H 0
例3
例4
5、未知参数的估计
不管 H 0 是否为真,
2
SE ˆ 因此 为 2 的无偏估计。 n s
因此,给定检验水平 时,拒绝域为:
F F ( s 1, n s )
表2 方差分析表 来源 因子 误差 总和 平方和
S A ni y ny
i 1 2 i s 2
自由度 均方
s 1
SA s1
SE n s
F
S A ( s 1) S E (n s)
S E ST S A
单因素方差分析
2.0
0.7
1.5
0.9
0.9
0.8
1.1
-0.3
-0.2
0.7
1.3
1.4
概率论与数理统计
3
❖ 前言 方差分析的思想
➢ 我们可以计算出各组的均值与方差,但是如何通过这些数据 结果来判断呢?这就需要进行方差分析.
➢ 在实际问题中, 影响一个数值型随机变量的因素一般会有很多, 例如影响农作物产量的因素就有种子品种,肥料、雨水等; 影 响化工产品的产出率的因素可能有原料成分、剂量、催化剂 、反应温度、机器设备和操作水平等;影响儿童识记效果的 因素有教学材料、教学方法等. 为了找出影响结果(效果)最显 著的因素, 并指出它们在什么状态下对结果最有利, 就要先做 试验, 方差分析就是对试验数据进行统计分析, 鉴别各个因素 对对我们要考察的指标(试验指标)影响程度的方法.
概率论与数理统计
7
❖ 1.单因素试验的方差 概念
➢ 推断三种治疗方案是否存在差异的问题,就是要辨别治 疗方案的差异主要是由随机误差造成的,还是由不同方 案造成的,这一问题可归结为三个总体是否有相同分布 的讨论.根据实际问题的情况,可认为血红蛋白的增加 值服从正态分布,且在安排试验时,除所关心的因素( 这里指的是这里方案)外,其它试验条件总是尽可能做 到一致,这就使我们可以近似的认为每个总体的方差相 同,即xi~N(μi,σ2) i = 1,2,3.
概率论与数理统计
❖2. 单因素方差分析的数学模型
➢ 单因素方差分析问题的一般提法为: ➢ 因素A有m个水平A1, A2, …, Am, 在Ai水平下, 总体Xi~N(μi,
σ2), i = 1, 2, …, m.其中μi和σ2均未知, 但方差相等, 希望 对不同水平下总体的均值进行比较. 设xij表示第i个总体的第j个观测值(j = 1, 2, …, ni, i = 1, 2, …, m), 由于Xij~N(μi, σ2), i = 1, 2, …, m.单因素方差分 析模型常可表示为:
《数理统计》第9章§1单因素试验的方差分析
S A nj n 118515 114720.5 3794.5 j 1
S E ST - S A 3972.5 3794.5 178方差分析及回归分析 第九章
§1 单因素试验的方差分析
14/14
2
第九章 方差分析及回归分析
第九章 方差分析及回归分析
§1 单因素试验的方差分析 记
n nj
j 1 s
7/14
样本总容量 总均值 第 j 组样本均值
1
s
s j
1
s
1 Xj n j
j 1 nj
X ij i 1
s nj nj
Xn
1
X ij s X j j 1 j 1i 1 ( X ij X j )2 i 1
只有当 H 0 : 1 2 s成立时,统计量
S A SA s 1 S A ~ 2 ( s 1) ;当 才是 2的无偏估计,且 H 0 不真时, S A有 2
偏大于 2的趋势 SE , S A相互独立 对于给定的显著性水平 , H 0的拒绝域是
SA S A /( s 1) F ( s 1, n s) S E /(n s ) SE
90 56 55 92 75 88 62 48 99 72 87 95 81 94 91 252 359 118 103 377 228 ( 0.01) 21194 32249 ( 6980 5329 35571 17370 j) 2 X 59~ N51.5 ( j , ) ( j76 1, 2, , 6) 84 89.75 94.25
j 1
S j2 nj 1 1
X j 是 j的无偏估计 S j2 是 2的无偏估计
概率论与数理统计—单因素试验的方差分析
53
xij 15 36.4
i1 j 1
纵向个体间的差异称为随机误差(组内差异),由试验造 成;横向个体间的差异称为系统误差(组间差异),由因素的 不同水平造成。
单因素试验的方差分析的数学模型
首先,我们作如下假设:
1. Xi ~ N i , 2 , i 1, 2,...r 具有方差齐性。
2. X1, X 2,...X r 相互独立,从而各子样也相互独立。 由于同一水平下重复试验的个体差异是随机误差,
灯泡
寿命
1 2 3 4 5 678
灯丝
甲 1600 1610 1650 1680 1700 1720 1800
乙 1580 1640 1640 1700 1750
丙 1460 1550 1600 1620 1640 1740 1660 1820
丁 1510 1520 1530 1570 1680 1600
dfA 2, dfE 6, dfT 8
SSA
r i1
Ti 2 ni
T2
n
1822
4
742
3
512
2
3072
9
11406.8310472.11 934.72
SSE
r i1
ni
X1 i
512 402 ... 282 11406.83
11497 11406.83
SSE dfE
MSE
(记 SSA dfA MSA, SSE dfE MSE ,称作均方和)
对给定的检验水平 ,由 PF F r 1, n r
得H0 的拒绝域为:F F r 1, n r F 单侧检验
思考:为什么此处只做单侧检验?
结论:方差分析实质上是假设检验,从分析离差 平方和入手,找到F统计量,对同方差的多个正态总体 的均值是否相等进行假设检验。单因素试验中两个水 平的均值检验可用第七章的T检验法。
xij 15 36.4
i1 j 1
纵向个体间的差异称为随机误差(组内差异),由试验造 成;横向个体间的差异称为系统误差(组间差异),由因素的 不同水平造成。
单因素试验的方差分析的数学模型
首先,我们作如下假设:
1. Xi ~ N i , 2 , i 1, 2,...r 具有方差齐性。
2. X1, X 2,...X r 相互独立,从而各子样也相互独立。 由于同一水平下重复试验的个体差异是随机误差,
灯泡
寿命
1 2 3 4 5 678
灯丝
甲 1600 1610 1650 1680 1700 1720 1800
乙 1580 1640 1640 1700 1750
丙 1460 1550 1600 1620 1640 1740 1660 1820
丁 1510 1520 1530 1570 1680 1600
dfA 2, dfE 6, dfT 8
SSA
r i1
Ti 2 ni
T2
n
1822
4
742
3
512
2
3072
9
11406.8310472.11 934.72
SSE
r i1
ni
X1 i
512 402 ... 282 11406.83
11497 11406.83
SSE dfE
MSE
(记 SSA dfA MSA, SSE dfE MSE ,称作均方和)
对给定的检验水平 ,由 PF F r 1, n r
得H0 的拒绝域为:F F r 1, n r F 单侧检验
思考:为什么此处只做单侧检验?
结论:方差分析实质上是假设检验,从分析离差 平方和入手,找到F统计量,对同方差的多个正态总体 的均值是否相等进行假设检验。单因素试验中两个水 平的均值检验可用第七章的T检验法。
概率论与数理统计第九章方差分析与回归分析
版权所有 BY 张学毅
2019/7/25
21
【例9.2】 某市消费者协会为了评价该地旅游业、居民服务业、
公路客运业和保险业的服务质量,从这4个行业中分别抽取了不 同数量的企业。经统计,最近一年消费者对这23家企业投诉的 次数资料如下表所示。这4个行业之间服务质量是否有显著差异? 如果有,究竟是在哪些行业之间?
2
二、单因素方差分析的数据结构
2019/7/25
版权所有 BY 统计学课程组
3
因素A 水平A1 水平A2…水平As
1 2 :
2019/7/25
版权所有 BY 张学毅
4
表中: X i j 为第 i个水平的第j个观测值。 记第j个水平观测值的均值为X .j ,则有
nj
X ij
X .j
2019/7/25
版权所有 BY 张学毅
31
【例9.4】 某种火箭使用了四种燃料,三种推进 器做试验。每种燃料和每种推进器的组合各做一 次试验,得火箭射程数据如下表所示。试问不同 的燃料、不同的推进器分别对火箭射程有无显著 影响?
2019/7/25
版权所有 BY 张学毅
32
列方差分析表:
2019/7/25
版权所有 BY 张学毅
19
从未采 1年前采 8年前采
伐过
伐过
伐过
27
12
18
22
12
4
29
15
22
21
9
15
19
20
18
33
18
19
16
17
22
20
14
12
24
14
第9.1节 单因素试验的方差分析——概率论与数理统计(李长青版)
ES A ( s 1) 2 n j 2 j
j 1
s
由此得
Se 2 E , ns
1 s SA 2 2 E n j j s 1 s 1 j 1
在 H0 为真时, 即 1 2 s 0 时, 有
S A ( s 1) 将 从而在 H0 不真时, 比值 S ( n s ) 有偏大的趋势, 其 e
S A ( s 1) . 记为 F, 即 F Se (n s )
则 F 可以作为检验 H0 的统
计量. 将 Se 写成如下分项相加的形式
Se ( xi1 x1 ) 2 ( xi 2 x2 ) 2 ( xis xs ) 2
的 影响.
种子品种代 号 (水平) 重复试验序号及作物实测产量
1 128 125 148 2 126 137 132 3 139 125 139 4 130 117 125 5 142 106 151 133 122 139
A1 A2
A3
这里试验的指标是作物产量, 作物是因素, 三种种 子品种代表三个不同的水平. 首先,形成数据差异的直接原因是种子的不同品 种.因此, 每个品种下产量的均值差异检验是我们的主 要任务.这种由因素(种子品种)造成的差异称为条件(系
s nj
从而有
Se ( ij j ) ,
2 j 1 i 1
s
nj
S A n j ( j j ) 2
j 1
s
由此知, Se 反映了误差的波动, 称其为误差的偏差 平方和(或称为组内平方和), 它集中反映了试验中与因 素及其水平无关的全部随机误差. 在 H0 为真时, SA 反 映误差的波动, 在 H0 不真时, SA 反映因子A 的不同水
单因素试验的方差分析
概率学与数理统计
单因素试验的方差分析
在方差分析中,我们将要考察的指标称为试验指标,影响 试验指标的条件称为因素(或因子),常用A、B、C, …来表示. 因 素可分为两类,一类是人们可以控制的;一类是人们不能控 制的。 例如,原料成分、反应温度、溶液浓度等是可以控制 的,而测量误差、气象条件等一般难以控制。 以下我们所说 的因素都是可控因素,因素所处的状态称为该因素的水平。 如果在一项试验中只有一个因素在改变,这样的试验称为单 因素试验,如果多于一个因素在改变,就称为多因素试验.
一、单因素试验方差分析的统计模型
例9.1 为求适应某地区的高产水稻的品种( 因素或因子) , 现选了 五个不同品种( 水平)的种子进行试验, 每一品种在四块试验田上进 行试种。假设这 20块土地的面积与其他条件基本相同, 观测到各块 土地上的产量( 单位: 千克) 见表9–1。
在这个问题目中, 要考察的指标是水稻的产量, 影响产量的因
分析的统计模型 .
方差分析的任务是对于模型(9. 1 ) , 检验 s 个总体 N ( 1 , 2) , …, N
( s , 2)的均值是否相等, 即检验假设
H0 : 1 2 s H1 : 1 , 2 , s , 不全相等。
(9.2)
为将问题( 9. 2 ) 写成便于讨论的形式, 采用记号
s nj
ST
(xij x)2
j1 i1
(9.3)
这里
x
1 n
s j 1
nj i1
xij ,
ST能反应全部试验数据之间的差异,又称
为总变差 Aj下的样本均值
x
j
1 n
nj i1
xij
(9.4)
注意到
(xij x )2 (xij x j x j x )2 =(xij x j )2 (x j x )2 2(xij x j )(x j x )
单因素试验的方差分析
在方差分析中,我们将要考察的指标称为试验指标,影响 试验指标的条件称为因素(或因子),常用A、B、C, …来表示. 因 素可分为两类,一类是人们可以控制的;一类是人们不能控 制的。 例如,原料成分、反应温度、溶液浓度等是可以控制 的,而测量误差、气象条件等一般难以控制。 以下我们所说 的因素都是可控因素,因素所处的状态称为该因素的水平。 如果在一项试验中只有一个因素在改变,这样的试验称为单 因素试验,如果多于一个因素在改变,就称为多因素试验.
一、单因素试验方差分析的统计模型
例9.1 为求适应某地区的高产水稻的品种( 因素或因子) , 现选了 五个不同品种( 水平)的种子进行试验, 每一品种在四块试验田上进 行试种。假设这 20块土地的面积与其他条件基本相同, 观测到各块 土地上的产量( 单位: 千克) 见表9–1。
在这个问题目中, 要考察的指标是水稻的产量, 影响产量的因
分析的统计模型 .
方差分析的任务是对于模型(9. 1 ) , 检验 s 个总体 N ( 1 , 2) , …, N
( s , 2)的均值是否相等, 即检验假设
H0 : 1 2 s H1 : 1 , 2 , s , 不全相等。
(9.2)
为将问题( 9. 2 ) 写成便于讨论的形式, 采用记号
s nj
ST
(xij x)2
j1 i1
(9.3)
这里
x
1 n
s j 1
nj i1
xij ,
ST能反应全部试验数据之间的差异,又称
为总变差 Aj下的样本均值
x
j
1 n
nj i1
xij
(9.4)
注意到
(xij x )2 (xij x j x j x )2 =(xij x j )2 (x j x )2 2(xij x j )(x j x )
单因素方差分析-PPT课件
单因素方差分析的假设检验的步骤:
(1)提出统计假设 H 0 : μ 1μ2 μs
H1: μ1, μ2, , μs 不全相等.
(2)编制单因素试验数据表
s nj
(3)根据数据表计算 T ,
x
2 ij
,
ST,SA,SE
j1 i1
(4)填制单因素方差分析表
单因素方差分析表
一、基本概念
我们将要考察的对象的某种特征称为指标, 影响指标的各种因素称为因子,一般将因子控 制在几个不同的状态上,每一个状态称为因子 的一个水平.
若一项试验中只有一个因子在改变,而其 它的因子保持不变,称这样的试验为单因素试 验.多于一个因子在改变的的试验为多因素试验. 这里,我们只讨论单因素试验.
否则接受H0 ,认为因子A对指标没有显著影响.
例1. 在显著性水平α=0.01下,用单因素方差分析法判断
实例1中,三个工厂所生产的电池的平均寿命有无显著 差异?
解:提出统计假设
H0: μ1μ2μ3
H1: μ1, μ2, μ3 不全相等.
编制单因素试验数据表
部分 总体
A1
A2 A3
37
样 47 本 40 值 60
6444
S A
s j1
1 nj
T2j
n1T2
1 12 81 442 91 826 27 192 49
4
6
3
13
4284
SESTSA644 44 28 24 160
单因素方差分析表
方差来源 平方和 自由度
因子A 4284 2
随机误差 2160 10 总和 6444 12
ST σ2
~
概率论与数理统计教案第9章方差分析及回归分析
概率论与数理统计教案第9章方差分析及回归分析第9章方差分析及回归分析教学要求1.理解单因素实验的基本概念;了解单因素实验中数学模型的建立思想;了解偏差平方和的分解过程,掌握偏差分解的分解式.2.掌握单因素方差分析表,会用单因素方差分析表进行方差分析.3.了解一元线性回归思想,掌握一元线性回归模型所要解决的问题.4.掌握一元线性回归模型中参数,a b 的点估计方法;掌握一元线性回归模型中参数2σ的估计方法;会对一元线性回归方程进行假设检验,掌握三种常见假设检验方法.5.理解预测和控制的概念,会用回归方程进行预测和控制.6.了解常见的非线性回归函数的形式,会利用变量代换将非线性函数转化为一元线性函数.教学重点单因素实验的基本概念,单因素方差分析表,一元线性回归模型中参数,a b 的点估计方法,一元线性回归模型中参数2σ的估计方法,三种常见假设检验方法,用回归方程进行预测和控制,利用变量代换将非线性函数转化为一元线性函数方法.教学难点偏差分解的分解式,单因素方差分析表的推导过程,一元线性回归模型中参数,a b 的点估计方法,一元线性回归模型中参数2σ的估计方法,三种常见假设检验方法. 课时安排本章安排8课时.教学内容和要点一、单因素试验的方差分析1.单因素实验的基本概念2.单因素实验的数学模型3.偏差平方和及其分解4.统计分析二、一元线性回归1.一元线性回归模型2.未知参数,a b 的点估计3.未知参数2σ的估计4.回归方程的假设检验5.预测与控制问题6.可化为一元线性回归的情形主要概念1.单因素试验方差分析的数学模型2.单因素方差分析表3.一元线性回归模型4.未知参数的点估计和方差的无偏估计5.线性假设的显著性检验6.观察值000Y a bx ε=++的点预测和区间预测。
单因素方差分析 PPT课件
解:
ssA
5 i1
1 m
10 l1
2 xil
1 510
5 i1
10 l1
2 xil
22.865
fA 51 4
ssE
5 i1
10 l1
x
2 il
1 510
5 i1
10 xil 2 l1
53.055
fE 510 5 45
s 2A
ssA fA
22.865 4
5.71
1 m
m L1
xiL
2
fE km k
m
有km个数据,但存在 k个约束条件,即有 k个 xiL xi 0 L1
3.总离差平方和ssT、自由度fT
• 它反映了全部数据的波动程度。
k m
2
ssT
xiL x
i1 L1
k m
2 km
2
xiL xi
xi x
i1 L1
试验次数
1
2
34
水平
A1
38
36
35 31
A2
20
24
26 30
A3
21
22
31 34
样本 X1 X2
试验数据 X11,X12,..X1L…X1m X21,X22,…X2L,…X2m
.
Xi
Xi1,Xi2,…XiL…Xim
.
.Xk
Xk1,Xk2,…XkL,…Xkm
样本平均值
x1
x2
xi
xk
m
xiL
L1
因素A第i个水平平均值为
xi
1 m
m
xiL
L1
1.因素A离差平方和 ssA、自由度fA
概统第10.1节 单因素的方差分析
r i1
ni
2 i
r i1
ni
1 ni
1 n
2
r i1
ni
2 i
(r
1) 2.
24
故
E SE 2,
nr
E SA 2 1
r 1
r 1
ni
2 i
记
MS A
SA r 1
称 组间均方离差
MS E
SE nr
称 组内均方离差
15
一元方差分析用于考察某因素(多水平) 对试验结果有无显著影响. 例1 不同体育活动对儿童身高有无显著影响.
活动
身
高 (mm)
1 1281 1341 1331 1389 1408 1274 2 1503 1479 1368 1260 1507 1558 3 1406 1431 1445 1437 1485 1464
1 n
r i1
ni
ij .
j 1
于是,SE 和 SA 可表示成
r ni
r ni
SE
( i ij i i )2
(ij i )2
i1r j1
i1 j1 r
SA ni ( i i )2 ni (i i )2
82% 69% 59%
77% 85% 84%
9
§10.1 单因素方差分析
一、线性模型 二、固定线性模型 三、随机线性模型 四、多重比较 五、基本假定
10
一、线性模型
(一)线性模型 假设某单因素试验有a个处理,每个处理有n
次重复,共有na 个观测值。这类试验资料的数 据模式如表10-1所示。
概率论与数理统计第九章方差分析与回归分析
9.当这个比值大到某种程度时,就可以说不同水平之间 存在着显著差异,也就是自变量对因变量有影响。
2020/8/2
版权所有 BY 张学毅
11
六、离差平方和与自由度的分解
总离差平方和 ST ( sum of squares for total)
1)全部观察值 Xij与总均值 X 的离差平方和;
2)反映全部观察值的离散状况。
若方差分析中考察的因素只有一个时,称为单因素方差分 析;若同时研究两个因素对试验指标的影响时,则称为两因
素试验。同时针对两个因素进行,则称为双因素方差分析。
2020/8/2
版权所有 BY 张学毅
2
二、单因素方差分析的数据结构
2020/8/2
版权所有 BY 统计学课程组
3
2020/8/2
版权所有 BY 张学毅
2020/8/2
版权所有 BY 张学毅
6
四、单因素方差分析的数学模型
由于 xij : N(j , 2 ), ij xij j : N(0, 2 )
则有单因素方差分析的数学模型1:
xij j ij
ij
:
N(0, 2),各ij 相互独立。
2020/8/2
版权所有 BY 张学毅
7
四、单因素方差分析的数学模型
3)该平方和既包括随机误差,也包括系统误差。 计算公式为:A
X.j X nj X.j X
i1 j1
j 1
误差平方和(组内平方和)
SE :Sum of squares for error
1)每个水平或组的各样本数据与其组平均值的离差 平方和;
2)反映每个样本各观察值的离散状况,又称组内离 差平方和;
变差源
2020/8/2
版权所有 BY 张学毅
11
六、离差平方和与自由度的分解
总离差平方和 ST ( sum of squares for total)
1)全部观察值 Xij与总均值 X 的离差平方和;
2)反映全部观察值的离散状况。
若方差分析中考察的因素只有一个时,称为单因素方差分 析;若同时研究两个因素对试验指标的影响时,则称为两因
素试验。同时针对两个因素进行,则称为双因素方差分析。
2020/8/2
版权所有 BY 张学毅
2
二、单因素方差分析的数据结构
2020/8/2
版权所有 BY 统计学课程组
3
2020/8/2
版权所有 BY 张学毅
2020/8/2
版权所有 BY 张学毅
6
四、单因素方差分析的数学模型
由于 xij : N(j , 2 ), ij xij j : N(0, 2 )
则有单因素方差分析的数学模型1:
xij j ij
ij
:
N(0, 2),各ij 相互独立。
2020/8/2
版权所有 BY 张学毅
7
四、单因素方差分析的数学模型
3)该平方和既包括随机误差,也包括系统误差。 计算公式为:A
X.j X nj X.j X
i1 j1
j 1
误差平方和(组内平方和)
SE :Sum of squares for error
1)每个水平或组的各样本数据与其组平均值的离差 平方和;
2)反映每个样本各观察值的离散状况,又称组内离 差平方和;
变差源
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《概率论与数理统计》
*****大学理学院数学系
伯努利(Bernoulli) 柯尔莫哥洛夫(Kolmogorov)
2020年4月14日星期二
1
目录
上页
下页
返回
第九章 方差分析与回归分析
§9.1 单因素试验的方差分析 §9.2 双因素试验的方差分析 §9.3 一元线性回归 §9.4 多元线性回归
2020年4月14日星期二
13
目录
上页
下页
返回
二、平方和的分解
ST 分解成
其中
ST SE SA ,
s nj
SE
( Xij X gj )2 ,
j1 i1
s nj
s
s
SA
(Xgj X )2
nj (Xgj X )2 Leabharlann nj X2 gjnX
2
j1 i1
j 1
j 1
SE 为组内平方和或误差平方和(error sum of squares)
A1
A2
…
As
X 11
X 12
…
X 1s
X 21
X 22
…
X 2s
M
M
M
X n11
X n2 2
…
X nss
样本总和
Tg1
Tg2
…
Tg s
样本均值
X g1
X g2
…
X gs
总体均值
1
2
…
s
2020年4月14日星期二
8
目录
上页
下页
返回
二、平方和的分解
从例 1 中可以看出,同一种饲料喂养的小鸡体重的 增加存在着差异,这种差异看作试验过程中各种随机因 素的干扰和测量误差造成的,这部分差异称为试验误差 (test error),它反映了因素同一水平下的差异.而不 同饲料喂养的小鸡体重的增量也不同,引起这部分差异 的原因除了试验误差之外,更主要的原因是饲料的配方 不同,这部分差异称为系统误差(system error),它主 要反映了不同水平的影响.
SA 为组间平方和或因素 A 的效应平方和。
2020年4月14日星期二
14
目录
上页
下页
返回
三、检验方法
若 H0 为真,即 1 2 L s ,则所有样本来自同
一正态总体 N (, 2 ) ,即 Xij ~ N(, 2) , i 1, 2,L , nj ,
j 1, 2,L , s ,且它们之间相互独立.
因素A的三个不同水平
检验假设
H0 : 1 2 3 , H1 : 1 , 2 , 3 不全相等.
2020年4月14日星期二
6
目录
上页
下页
返回
单因素试验方差分析的一般提法是:
设在单因素试验中,因素 A 有 s 个水平,记为 A1 , A2 , … , As , 在 水 平 Ai 下 的 总 体 为 X i , 并 设 X i ~ N (i , 2 ) , i 1, 2,L , s ,其中 i , 2 均为未知.
s nj
s
nj
2
( Xij X gj )( X gj X ) 2 ( X gj X ) ( Xij X gj )
j1 i1
j 1
i1
= 2
s
nj (Xgj X )
X ij
nj
X gj
0.
j 1
i1
于是我们将 ST 分解成 ST SE SA ,
2020年4月14日星期二
2
目录
上页
下页
返回
9.1 单因素试验的方差分析
一、单因素试验方差分析问题的提法 二、平方和的分解 三、检验方法
2020年4月14日星期二
3
目录
上页
下页
返回
几个概念
试验指标(experiment index) 在试验和生产实践中,称将要考察的指标 .
因素(factor) 影响试验指标的条件. 可控因素 不可控因素
2
ST
( Xij Xgj ) ( Xgj X )
j1 i1
s nj
s nj
( X ij X gj )2
(Xgj X )2
j1 i1
j1 i1
s nj
2
( Xij X gj )( X gj X ).
j1 i1
2020年4月14日星期二
12
目录
上页
下页
返回
二、平方和的分解
注意到上式第三项(即交叉项)
2020年4月14日星期二
9
目录
上页
下页
返回
二、平方和的分解
总偏差平方和
其中
s nj
ST
( Xij X )2 ,
j1 i1
X
1 n
s j 1
nj
Xij , n n1 n2 L
i1
ns .
X 是数据的总平均. ST 能反映全部试验数据之间的差
异,因此 ST 又称为总变差.
2020年4月14日星期二
【例 1】在饲料养鸡增肥的研究中,某研究所提出三种 饲料配方:A1 是以鱼粉为主的饲料,A2 是以槐树粉为主 的饲料,A3 是以苜蓿粉为主的饲料.为比较三种饲料的 效果,特选 24 只相似的小鸡随机均分为三组,每组各 喂一种饲料,60 天后观察它们增加的重量.试验结果数 据如下表 9-1 所示,试问不同的饲料对小鸡体重的增加 有无显著差异?
2020年4月14日星期二
5
目录
上页
下页
返回
因素
饲料 A
小鸡体重的增量(克)
A1
1073 1009 1060 1001 1002 1012 1009 1028
A2 1107 1092 990 1109 1090 1074 1122 1001
A3 1093 1029 1080 1021 1022 1032 1029 1048
可以证明:
nj
ST 2
(n 1)S 2
2
~ 2 (n 1);
SE
2
s j 1
( Xij X gj )2
i1
2
10
目录
上页
下页
返回
二、平方和的分解
又记
1 nj
X gj
nj
Xij , j 1, 2,L
i 1
, s,
nj
Tgj Xij , j 1, 2,L , s, i 1
s nj
T Xij. j1 i1
2020年4月14日星期二
11
目录
上页
下页
返回
二、平方和的分解
则,将 ST 写成
s nj
水平(level) 因素所处的状态. 单因素试验(single-factor test) 在一项试验中只有一个因素在改变,其它因素控制不变. 多因素试验(multi-factor test) 在一项试验中有多于一个因素在改变.
2020年4月14日星期二
4
目录
上页
下页
返回
一、单因素试验方差分析问题的提法
设在水平 Aj ( j 1, 2,L , s) 下,进行了 n j (n j 2) 次独 立试验,将这 s 个样本列表如下(见表 9-2).
现在要求根据这些样本检验假设
H0 : 1 2 L s , H1 : 1 , 2 ,…, s 不全相等.
2020年4月14日星期二
7
目录
上页
下页
返回
因素水平 观测结果
*****大学理学院数学系
伯努利(Bernoulli) 柯尔莫哥洛夫(Kolmogorov)
2020年4月14日星期二
1
目录
上页
下页
返回
第九章 方差分析与回归分析
§9.1 单因素试验的方差分析 §9.2 双因素试验的方差分析 §9.3 一元线性回归 §9.4 多元线性回归
2020年4月14日星期二
13
目录
上页
下页
返回
二、平方和的分解
ST 分解成
其中
ST SE SA ,
s nj
SE
( Xij X gj )2 ,
j1 i1
s nj
s
s
SA
(Xgj X )2
nj (Xgj X )2 Leabharlann nj X2 gjnX
2
j1 i1
j 1
j 1
SE 为组内平方和或误差平方和(error sum of squares)
A1
A2
…
As
X 11
X 12
…
X 1s
X 21
X 22
…
X 2s
M
M
M
X n11
X n2 2
…
X nss
样本总和
Tg1
Tg2
…
Tg s
样本均值
X g1
X g2
…
X gs
总体均值
1
2
…
s
2020年4月14日星期二
8
目录
上页
下页
返回
二、平方和的分解
从例 1 中可以看出,同一种饲料喂养的小鸡体重的 增加存在着差异,这种差异看作试验过程中各种随机因 素的干扰和测量误差造成的,这部分差异称为试验误差 (test error),它反映了因素同一水平下的差异.而不 同饲料喂养的小鸡体重的增量也不同,引起这部分差异 的原因除了试验误差之外,更主要的原因是饲料的配方 不同,这部分差异称为系统误差(system error),它主 要反映了不同水平的影响.
SA 为组间平方和或因素 A 的效应平方和。
2020年4月14日星期二
14
目录
上页
下页
返回
三、检验方法
若 H0 为真,即 1 2 L s ,则所有样本来自同
一正态总体 N (, 2 ) ,即 Xij ~ N(, 2) , i 1, 2,L , nj ,
j 1, 2,L , s ,且它们之间相互独立.
因素A的三个不同水平
检验假设
H0 : 1 2 3 , H1 : 1 , 2 , 3 不全相等.
2020年4月14日星期二
6
目录
上页
下页
返回
单因素试验方差分析的一般提法是:
设在单因素试验中,因素 A 有 s 个水平,记为 A1 , A2 , … , As , 在 水 平 Ai 下 的 总 体 为 X i , 并 设 X i ~ N (i , 2 ) , i 1, 2,L , s ,其中 i , 2 均为未知.
s nj
s
nj
2
( Xij X gj )( X gj X ) 2 ( X gj X ) ( Xij X gj )
j1 i1
j 1
i1
= 2
s
nj (Xgj X )
X ij
nj
X gj
0.
j 1
i1
于是我们将 ST 分解成 ST SE SA ,
2020年4月14日星期二
2
目录
上页
下页
返回
9.1 单因素试验的方差分析
一、单因素试验方差分析问题的提法 二、平方和的分解 三、检验方法
2020年4月14日星期二
3
目录
上页
下页
返回
几个概念
试验指标(experiment index) 在试验和生产实践中,称将要考察的指标 .
因素(factor) 影响试验指标的条件. 可控因素 不可控因素
2
ST
( Xij Xgj ) ( Xgj X )
j1 i1
s nj
s nj
( X ij X gj )2
(Xgj X )2
j1 i1
j1 i1
s nj
2
( Xij X gj )( X gj X ).
j1 i1
2020年4月14日星期二
12
目录
上页
下页
返回
二、平方和的分解
注意到上式第三项(即交叉项)
2020年4月14日星期二
9
目录
上页
下页
返回
二、平方和的分解
总偏差平方和
其中
s nj
ST
( Xij X )2 ,
j1 i1
X
1 n
s j 1
nj
Xij , n n1 n2 L
i1
ns .
X 是数据的总平均. ST 能反映全部试验数据之间的差
异,因此 ST 又称为总变差.
2020年4月14日星期二
【例 1】在饲料养鸡增肥的研究中,某研究所提出三种 饲料配方:A1 是以鱼粉为主的饲料,A2 是以槐树粉为主 的饲料,A3 是以苜蓿粉为主的饲料.为比较三种饲料的 效果,特选 24 只相似的小鸡随机均分为三组,每组各 喂一种饲料,60 天后观察它们增加的重量.试验结果数 据如下表 9-1 所示,试问不同的饲料对小鸡体重的增加 有无显著差异?
2020年4月14日星期二
5
目录
上页
下页
返回
因素
饲料 A
小鸡体重的增量(克)
A1
1073 1009 1060 1001 1002 1012 1009 1028
A2 1107 1092 990 1109 1090 1074 1122 1001
A3 1093 1029 1080 1021 1022 1032 1029 1048
可以证明:
nj
ST 2
(n 1)S 2
2
~ 2 (n 1);
SE
2
s j 1
( Xij X gj )2
i1
2
10
目录
上页
下页
返回
二、平方和的分解
又记
1 nj
X gj
nj
Xij , j 1, 2,L
i 1
, s,
nj
Tgj Xij , j 1, 2,L , s, i 1
s nj
T Xij. j1 i1
2020年4月14日星期二
11
目录
上页
下页
返回
二、平方和的分解
则,将 ST 写成
s nj
水平(level) 因素所处的状态. 单因素试验(single-factor test) 在一项试验中只有一个因素在改变,其它因素控制不变. 多因素试验(multi-factor test) 在一项试验中有多于一个因素在改变.
2020年4月14日星期二
4
目录
上页
下页
返回
一、单因素试验方差分析问题的提法
设在水平 Aj ( j 1, 2,L , s) 下,进行了 n j (n j 2) 次独 立试验,将这 s 个样本列表如下(见表 9-2).
现在要求根据这些样本检验假设
H0 : 1 2 L s , H1 : 1 , 2 ,…, s 不全相等.
2020年4月14日星期二
7
目录
上页
下页
返回
因素水平 观测结果