第九章 方差分析及回归分析
第九章 方差分析与回归分析
σ2
a、b是α、β的最小方差线性无偏估计,一般称为最 佳线性无偏估计,简记为BLUE。
因yi = a + bxi, .
1 (xi − x) 2 可得yi ~N(α + βxi, + ( )σ ), n Sxx
∧ 2
∧
1 (xi − x)2 2 a + bxi +εi~N(α + βxi,+ + (1 )σ ) n Sxx
称U = ∑( yi − y) 为回归离差平方和,
2 n ∧
总离差平方和Syy和剩余离差平方和Q、回归离差平 方和U之间有如下关系:Syy=Q+U 。
i=1
可以证明:Syy的自由度fT=n-1,Q的自由度 fe=n-2,U的自由度fU=1。
E(Syy ) = (n −1)σ + β Sxx,E(U) = σ + β Sxx,
对确定的x,Y=Y(x)是随机变量,设其期望存在, 记 µ(x)=E(Y|x),称µ(x) 为Y(x) 对x的回归函数, 简称回归。回归函数描述了x与Y(x) 的平均值的依 存关系。( E(Y|x)表示对于固定的x, Y(x)的数学 期望。)
估计µ(x): 求Y(x) 对x的回归问题。
二、直线回归模型 设x与Y(X)之间有因果关系,且直线相关 y=α+βx
r=
第九章 复习-方差分析及回归分析
2 ij ~ N (0 , ) , 各 个 ij 独 立, i 1,2 ,...,n , j 1,2 ,...,s , s n j j 0. j 1
X ij j ij ,
(1.1)’
• 而假设(1.2)等价于假设
2
SE / ~ F ( s 1, n s) (n s)
2
• 所以检验问题(1.2)’的拒绝域的形式是: S A /( s 1) F k S E /(n s ) • 其中k由预先给定的显著性水平α确定,由此得 此检验问题的拒绝域是:
S A /( s 1) F F ( s 1, n s) S E /(n s )
X n1 1 X n2 2 …
X ns s
T.s μs
X 1
μ1
X 2
μ2
… … …
X s
• 假定,各个水平Aj (j=1,2,…,s)下样本X1j,X2j,…, X n j来自具有相同方差ζ2,均值分别为μj (j=1,2…s)的 正态总体N(μj, ζ2), μj和ζ2未知, 且在不同水平Aj下的 样本之间相互独立. 由于 X ij ~ N ( j , 2 ) , 即有 ij j ~ N (0, 2 ) X
1 1 SE ( ) n j nk ( X . j X .k ) ( j k )
第9章-方差分析与线性回归
j1 i1
s j 1
nj i1
[
2
(
j
)2 ]
2
n[ n
2]
s
s
n 2 n 2 2
nj j
n j
2 j
2
n 2
j 1
j 1
s
n j
2 j
n
1
2
j 1
E(SE )
s
E
nj
X ij X • j
2
j1 i1
s
(nj 1) 2 (n s) 2 j 1
s
E(SA ) E(ST SE )
第九章 回归分析和方差分析
关键词: 单因素试验 一元线性回归
方差分析(Analysis of variance, 简 称:ANOVA),是由英国统计学家费歇尔 (Fisher)在20世纪20年代提出的,可用于推 断两个或两个以上总体均值是否有差异 的显著性检验.
§9.1单因素方差分析
例:为了比较三种不同类型日光灯管的寿命 (小时), 现将从每种类型日光灯管中抽取 8 个, 总共 24 个日光灯管进行老化试验,根据 下面经老化试验后测算得出的各个日光灯 管的寿命(小时),试判断三种不同类型日光
检验假设 H0 : 1 2 ... s H1 : 1, 2,..., s不全相等。
记
1 n
概率论 教学课件-第九章 方差分析及回归分析
第九章 方差分析及回归分析
§1单因素试验的方差分析
方差分析是对试验结果所得数据作分析的一种常用的数理统计方法。
在第八章曾讨论过两个正态总体均值21,μμ是否相等的假设检验法,在那里建立了t 检验法,本章要讨论三个或三个以上正态总体的均值是否相等的假设法。
当试验中仅有一个因素在改变,其他保待不变的情形称为单因素试验,因素所处的状态称为水平,例子见书P270例1,2,例3则为多因素试验法。
对例1,数据(表9.1)可看成来自三个不同的总体的样本值,
321,,μμμ为各个总体的均值,需检验假设
。
H H 不全等32113
210,,::μμμμμμ==
一般地,设因素A 有s 个水平s A ,
,A A ......,.21,今考虑这s 个水平对于某总体X 的效应:设在每个水平s i A i <=<=1,下,总体服从
s i N i ....1).,..,(2=σμ,其中2,σμi 均未知。在s i A i <=<=1,下,取得样本为)....1(,,....,21s i X X X i n i i i =并假定这S 组样本相互独立。
(表9.4)水平观测结果A 1 A 2
s j i A A A ..............
11X 12X s j i X X X 111............ 21X 22X s j i X X X 222............ ………..
11
n X 22
n X s j i X X X 11............
样本总和 1*T 2*T ∑==⇒s
第九章 线性回归与方差分析
图9-2
为了求Q(a, b)的最小值,分别求Q关于a, b的偏导数,并令它们等于零:
n ∂ ∂a Q(a, b) = ∑( yi − a − bxi )(−2) = 0 i= 1 n ∂ Q(a, b) = ( y − a − bx )(−2x ) = 0 ∑ i i i ∂b i= 1
120
140
160
180
200
解 现在n=10, 所需计算列表如下表
x 100 110 120 130 140 150 160 170 180 190 ∑ 1450 y 45 51 54 61 66 70 74 78 85 89 673 x2 10000 12100 14400 16900 19600 22500 25600 28900 32400 36100 218500 y2 2025 2601 2916 3721 4356 4900 5476 6084 7225 7921 47225 xy 4500 5610 6480 7930 9240 10500 11840 13260 15300 16910 101570
, 则称 yi − yi为x i 处的残差
(
)
2
$ $ = ∑ yi − a − bxi 称为残差平方和
i =1
n
(
)
2
为了计算Qe, 将Qe作如下分解:
第9章方差分析及回归分析
H0 ~ 2 ( s 1)
19
经简单的分析,已知总的数据变异是由因素效应及随机误差 引起的,即ST S A S E,若因素效应S A明显大于随机误差S E, 就说明效应是显著的,即应拒绝H 0 . H 0 : 1 2 s 0, H1 : 1 , 2 , , s不全相等
s SE 2 由 分布可加性, 2 ~ (n j 1) ,即 2 n s 。 j 1 2
18
性质3 (1) S A与S E 相互独立; (2)
2 ~ (n s); 2 SA (3)当H 0为真时, 2 ~ 2 ( s 1)。
SE
均方
SA SA s 1
单因素试验方差分析表
方差来源
因素A
平方和
自由度
F比
SA
SE
ST
s- 1
误差
总和
n-s
n-1
SE
SE
ns
SA SE
20
计算ST , S A , SE的简便公式:
记T j X ij , j 1, 2, , s, T X ij
i 1
s
nj
s
假设等价于 H 0 : 1 2 s 0 H1 : 1 , 2 , , s不全为零。
14
(二)平方和分解
《数理统计》第9章§1单因素试验的方差分析
s
s
nj ( X j ) nj ( X ) 2 nj ( X j )( X )
2 2
j 1 s j 1 s
s
s
j 1
ห้องสมุดไป่ตู้
j 1
nj ( X j )2 n( X )2 2n( X )2 j 1 s 2 Xj 2 S X A / nj 2 / n j 1
无论 H 0 : 1 2 s 是否成立,统计量 ns
(n j 1) n j s j 1 j 1
s
s
第九章 方差分析及回归分析
§1 单因素试验的方差分析
S A n j ( X j X )2
j 1 s
10/14
S A n j ( X j X ) n j [( X j ) ( X )]2 j 1
A1 A2 A3 A4 A5 A6 1 87 90 56 55 92 75 2 85 88 62 48 99 72 80 87 95 2 81 设燃料 3 的射程 X ~ N ( j , ) (j Aj 4 94 j 91
1, 2, , 6)
故在 Aj下的试验数据应视为来自总体 X j的样本 问不同燃料对火箭射程是否有显著差异? 影响火箭射程的 火箭射程 X 1 2 6 因子只有一个 提出假设 燃料 A H 0 : 1 2 6, H1: 1, ,, 6不全相同 燃料的不同种类 21 A A, 3 , A4 , A5 , A6 2, A 拒绝 H如何建立单因子试验的统计模型 意味六种燃料的火箭射程有显著差异 0 接受 H 0意味六种燃料的火箭射程无显著差异 第九章 方差分析及回归分析
第九章方差分析和回归分析
第九章方差分析和回归分析
第九章方差分析和回归分析
内容提要
1、方差分析
(1)基本概念
方差分析:通过随机抽样及数据处理,检验试验结果是否受试验条件这一类可控制因素显著影响,从而确认对质量指标影响主要来自哪一类因素,即用来鉴别所谓因素效应的有效统计分析方法.
因素(因子):人为可以控制的实验条件称为因素或因子.
水平:因素或因子的不同等级或因素所处的不同状态称为因素的不同水平. 单因素试验:试验中如果只有一个因素或因子在变化,其它可控条件保持不变,这样的方差试验称为单因素试验.
多因素试验:试验中不止一个因素或因子在变化,称为多因素试验.若只有二个因素在变化就叫双因素试验.
(2)单因素试验的方差分析
设因素A 有j 个不同水平(r j ,,2,1 =),在总的r 个水平下均重复试验i 次(m i ,,2,1 =).每一个水平视为一个独立总体),(~2 j j j N X σμ,每个水平下总的m 次试验结果视为取自j X 的容量为m 的样本),,,,(21mj kj j j X X X X .单因素方差分析的一般方法步骤如下:
1)提出待检假设H 0:μμμμ====r 21; 2)列方差计算表9-1,计算2
A S 、2
E S ; 3)选取建立
F 统计量
),1(~122
r mr r F S S r r mr F E
A
--?--=
,并计算F 统计量的值; 4)对给定的检验水平α,查F 分布表,找到F 统计量的临界值(表值); 5)比较得出结论:
① 若计算值F F >临界值),1(r mr r F --α,拒绝H 0,即因素水平影
第9章_方差分析及回归分析9.1_单因素试验的方差分析
单因素试验的方差分析
一、单因素试验 二、平方和的分解
三、S A , SE的统计特性
四、假设检验问题的拒绝域 五、未知参数的估计 六、小结
一、单因素试验
机器设备 反应时间
原料成分
原料剂量
化工产品的 数量和质量
溶液浓度
操作水平
反应温度
压
力
鉴别各个 方差分析 ——根据试验的结果进行分析,
有关因素对试验结果.
2 S ( n s ) 都是 的无偏估计. 不管 H0 是否为真 , E
S A ( s 1) F . S E (n s)
1. 分子和分母相互独立;
2. 分母 SE 的数学期望始终是 2 ;
3. H 0 为真时, 分子的期望为 2 , H 0 不真时, 分子
取值有偏大的趋势.
j 1 s i 1 nj
nj
2 ( X j X )[ X ij n j X j ]
j 1 i 1
0
于是ST 可分解为 ST S E S A,
其中 S E ( X ij X j )2
j 1 i 1 s nj
s
nj
2 ( X X ) n ( X X ) S A j j j
A3
A4
试验指标: 射程 因素: 推进器和燃料 水平:推进器有3个,
第九章方差分析及回归分析
, r,
T .. X ij ,
i 1 j 1
r
ni
即有
2019/1/28
20
2 T 2 2 ST X ij n X X ij , n i 1 j 1 i 1 j 1 2 2 r r 2 2 Ti T S A ni X i n X , n i 1 i 1 ni S E ST S A r ni 2 r ni
H 0 : 1 2 H1 : 1 , 2 , r ;
, ni ; i 1, 2,
r中不全相等。
(1.2)
2019/1/28
9
记
1 n
n , 其中n n , 称为总平均。
i 1 i i i 1 i
r
r
再引入i i , i 1, 2,
ST 为离差平方和,是总样本方差的(n-1)倍;
S E 表示样本观察值与样本均值的差异,这是由 随机误差所引起的,S E叫做误差平方和;
S A表示样本平均值与数据总平均的差异,这是因素的效应 的差异以及随机误差引起的,S A叫做因素的效应平方和。
2019/1/28
15
SE的统计特性
SE ( X i1 X 1 )
ni
r
ni
r
ni
i 1 j 1
第9章方差分析与回归分析ppt课件
问题(9.1.3)作出判断.首先分析一下引起各样本值 y i j 波动的原
因可以分为两种情况:一种是假设检验(9.1.3)中 H 0 为真时,
各样本值 y i j 的波动纯粹是由相应的 i j 的随机波动而引起的;另
一种是由于
H
不真所带来的.为研究各样本值 y
0
ij
波动的原因,
我们从方差分析中常用的平方和分解入手来导出检验(9.1.3)
表9-4 方差分析
方差来源 平方和 自由度 均方
因素 A 3536.3
4
884.075
误差
2162.25
15
144.15
总和
5698.55
19
F比
6.133
显著性
FF0.05(4,15)3.06 拒绝原假设
即认为五中不同施肥方案对该农作物产量有显著影响.
.
§9.2 回归分析
9.2.1 一元线性回归数学模型
(xi,Yi),i1,2,L,n,令
n
n
Q ( 0, 1) i2 (Y i01xi)2
i 1
i 1
ຫໍສະໝຸດ Baidu
(9.2.3)
最小二乘法的基本思想是寻找 0 , 1的估计值 ˆ0 , ˆ1 使得 Q 达到最小. 由微分学的知识,可将 Q 分别关于 0 , 1 求偏导数,并令它们等于
概率论与数理统计教案第9章方差分析及回归分析
概率论与数理统计教案第9章方差分析及回归分析
第9章方差分析及回归分析
教学要求
1.理解单因素实验的基本概念;了解单因素实验中数学模型的建立思想;了解偏差平方和的分解过程,掌握偏差分解的分解式.
2.掌握单因素方差分析表,会用单因素方差分析表进行方差分析.
3.了解一元线性回归思想,掌握一元线性回归模型所要解决的问题.
4.掌握一元线性回归模型中参数,a b 的点估计方法;掌握一元线性回归模型中参数2σ的估计方法;会对一元线性回归方程进行假设检验,掌握三种常见假设检验方法.
5.理解预测和控制的概念,会用回归方程进行预测和控制.
6.了解常见的非线性回归函数的形式,会利用变量代换将非线性函数转化为一元线性函数.
教学重点
单因素实验的基本概念,单因素方差分析表,一元线性回归模型中参数,a b 的点估计方法,一元线性回归模型中参数2σ的估计方法,三种常见假设检验方法,用回归方程进行预测和控制,利用变量代换将非线性函数转化为一元线性函数方法.
教学难点
偏差分解的分解式,单因素方差分析表的推导过程,一元线性回归模型中参数,a b 的点估计方法,一元线性回归模型中参数2σ的估计方法,三种常见假设检验方法. 课时安排
本章安排8课时.
教学内容和要点
一、单因素试验的方差分析
1.单因素实验的基本概念
2.单因素实验的数学模型
3.偏差平方和及其分解
4.统计分析
二、一元线性回归
1.一元线性回归模型
2.未知参数,a b 的点估计
3.未知参数2σ的估计
4.回归方程的假设检验
5.预测与控制问题
6.可化为一元线性回归的情形
主要概念
spss第9章
( x1 , y1 ), ( x2 , y 2 ),L, ( xn , y n )
来估计a和b,以估计值的 a和b 代替(1.2)中的a,b, 估计a ˆ ˆ 代替(1.2)中的a 得回归方程
ˆ ˆ ˆ y = a + bx
(1.6) )
由于此方程的建立有赖于观察或试验积累的数据, 由于此方程的建立有赖于观察或试验积累的数据,所 以有时称其为经验回归方程 经验回归方程。 以有时称其为经验回归方程。
(一)一元线性回归 设随机变量Y 设随机变量Y与X之间存在着某种相关关系。 之间存在着某种相关关系。 X是可以控制或可以精确观察的变量(如年龄、身高 是可以控制或可以精确观察的变量(如年龄、 控制或可以精确观察的变量 、试验时的温度、压力、电压与时间等),可以给出X的n 试验时的温度、压力、电压与时间等),可以给出X ),可以给出 个值 x1 , x2 ,L xn 。为了研究方便,把它当作普通变量,而不 为了研究方便,把它当作普通变量 普通变量, 看作随机变量。 看作随机变量。
E (ε ) = 0 D(ε ) = σ 2 > 0
通常称
σ 2未知
Y = a + bx + ε ,
一元线性回归模型。 为一元线性回归模型。 上式表明, 由两部分组成: 上式表明,Y由两部分组成:
ε ~ N (0,σ ),
2ຫໍສະໝຸດ Baidu
方差分析及回归分析
第九章 回归分析
教学要求 1.一元线性回归及线性相关显著性的检验法,利用线性回归方程进行预测。 2.可线性化的非线性回归问题及简单的多元线性回归。
⏹本章重点:理解线性模型,回归模型的概念,掌握线性模型中参数估计的最小二乘法估计法。
⏹教学手段:讲练结合 ⏹课时分配:6课时
§9.1 一元线性回归
回归分析是研究变量之间相关关系的一种统计推断法。
例如,人的血压y 与年龄x 有关,这里x 是一个普通变量,y 是随机变量。Y 与x 之间的相依关系f(x)受随机误差ε的干扰使之不能完全确定,故可设有:
ε+=)(x f y (9.1) 式中f(x)称作回归函数,ε为随机误差或随机干扰,它是一个分布与x 无关的随机变量,我们常假定它是均值为0的正态变量。为估计未知的回归函数f(x),我们通过n 次独立观测,得x 与y 的n 对实测数据(x i ,y i )i=1,……,n ,对f(x)作估计。
实际中常遇到的是多个自变量的情形。
例如 在考察某化学反应时,发现反应速度y 与催化剂用量x 1,反应温度x 2,所加压力x 3等等多种因素有关。这里x 1,x 2,……都是可控制的普通变量,y 是随机变量,y 与诸x i 间的依存关系受随机干扰和随机误差的影响,使之不能完全确定,故可假设有:
ε+=),,,(21k x x x f y (9.2) 这里ε是不可观察的随机误差,它是分布与x 1,……,x k 无关的随机变量,一般设其均值为0,这里的多元函数f(x 1,……,x k )称为回归函数,为了估计未知的回归函数,同样可作n 次独立观察,基于观测值去估计f(x 1,……,x k )。
第九章回归分析与方差分析
3
概率论与数理统计
第九 章 回归分 析与方差分析
a + bx 的无偏估计。我们还可得到回归直线方程:
yˆ = aˆ + bˆx
(2.9)
2.σˆ 2 的估计
记 yˆi = aˆ + bˆxi
Qe
=
n
∑ ( yi
−
yˆi )
=
n
∑ ( yi
− aˆ − bˆx)2
=
Q ( aˆ, bˆ
)
i =1
i =1
二、 a, b 和σ 2 的估计
1. a, b 的最小二乘估计
从样本 (x1, y1 ),(x2 , y2 ),",(xn , yn ) 作出了 a, b 的估计 aˆ, bˆ 后,我们立刻可以得到回归 函数的估计 µˆ (x) = aˆ + bˆ x ,和回归方程的估计
yˆ = aˆ + bˆ x
行预测与控制。
具有相关关系的变量,一般都是随机变量,在某些问题中,如身高 X 与体重 Y ,可以把
其中的任何一个看作“因变量”,另一个看作“自变量”。但在某些问题中,有一个变量是不
可控制的,另一变量是可控制的或可被精确观测的。如广告费 X 是可被控制的,但是销售量 Y 却是不可控制的。这时我们可以随意指定 n 个值给 X ,因此我们可以不把变量 X 看成随机
概率论及数理统计9方差分析与回归分析
四、总平方和分解公式
仅由随机误差引起的数据间的差异可以用 组内偏差平方和 表示, 也称为误差偏差平方和,其自由度为 fe=nr ;
水平
数据(原始数据-1000)
Ti
Ti2
A1
73
9
60
1
2
12
9
28
194
37636
10024
A2
107
92
-10
109
90
74
122
1
585
342225
60355
A3
93
29
80
21
22
32
29
48
354
125316
20984
1133
505177
91363
利用(8.1.19),可算得各偏差平方和为: 把上述诸平方和及其自由度填入方差分析表
8.1.3 平方和分解
一、试验数据 通常在单因子方差分析中可将试验数据列成如下页表格形式。
表8.1.2中的最后二列的和与平均的含义如下:
表8.1.2 单因子方差分析试验数据
因子水平
试 验 数 据
和
平均
A1
y11 y12 … y1m
T1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
电路的响应时间
类型1 19 15 22 20 18
类型2 20 40 21 33 27
类型3 16 17 15 18 26
类型4 18 22 19
这里,试验的指标是电路的响应时间。电路类 型为因素,这一因素有四个水平。这是一个单 因素的试验。试验的目的是为了考察各种类型 电路的响应时间有无显著性差异。
2020/8/4
1
例1 设有三台机器,用于生产规格相同的铝 合金薄板。取样,测量薄板的厚度精确至千 分之一厘米。得结果如下表所示。
铝合金板的厚度
机器1
机器2
机器3
0.236
0.257
0.258
0.238
0.253
0.264
0.248
0.255
0.259
0.245
0.254
0.267
0.243
0.261
i1 j1
r
ni
(Xi. X ) (Xij Xi.) 0
i1
j 1
所以
r ni
r
( Xij X )2 ni ( Xi. X )2
3、从不同总体中取出的各个样本,
即各个X
相互独立。
ij
2020/8/4
6
设因素A有r个水平A1,A2,…,Ar,在每个水平Ai(i=1,2,…, r)下,进行ni (ni≥2)次独立试验,整理试验结果如下表所示。
试验结果
试验批号
样本 样本均 和值
1 2…
j…
ni
1
X 11 X 12 X 1 j X 1n1 T1
第九章 方差分析及回归分析
§1 单因素试验的方差分析
(一)单因素试验
在科学试验和生产实践中,影响一事物的因素很多。 方差分析是根据试验的结果进行分析,鉴别
各个有关因素对试验结果影响的有效方法。
在试验中,我们将要考察的指标称为试验指标。影响试验 指标的条件称为因素。因素可分为两类,一类是人们可以 控制的(可控因素);一类是人们不可控制的。以下我们 所说的因素都是指可控因素。因素所处的状态,称为该因 素的水平。如果在一项试验中只有一个因素在改变时称为 单因素试验。如果多于一个因素在改变称为多因素试验。
Xij ,
j 1
1 ni
X i ni
Xij .
j 1
2020/8/4
10
利用上面的记号,模型(1.1)可以写成
X ij i ij ,
ij ~ N(0, 2),各ij独立,
i 1, 2, , r, j 1, 2, , ni
r
nii 0.
i 1
而假设(1.2)等价于假设
H0:1 2 r 0,
X 1
因
2
X 21 X 22 X 2 j X 2n2 T2
X 2
素
水
i
X i1 X i2 X ij X ini
Ti
X i
平
r
X r1 X r 2 X rj X rnr
Tr
X r
其中Xij表示在水平Ai下进行第j次试验的结果(j=1, 2,…,ni,i=1,2,…,r)。
2020/8/4
0.262
这里,试验的指标是薄板的厚度。机器为因素,不同的
三台机器就是这个因素的三个不同的水平。我们假定除
机器这一因素外,材料的规格、操作人员的水平等其他
条件都相同。这就是单因素试验。试验的目的是为了考
察各台机器所生产的薄板的厚度有无显著的差异。
2020/8/4
2
例2 下面列出了随机选取的、用于计算器的 四种类型的电路的响应时间(以毫秒计)。
(1.2)
2020/8/4
9
r
r
记
1 n
nii , 其中n
ni, 称为总平均。
i 1
i 1
再引入i i ,i 1, 2, , r.
此时,有n11 n22 nrr 0,i表示水平Ai下的总体 平均值与总平均的差异,习惯上将i称为水平Ai的效应。
作下面的记号:X
1 n
r i1
ni
2020/8/4
3
例3 三名工人分别在四种不同的机器上生产同一种零件, 每人在每台机器上工作3天,其日产量如下表所示:
工人(B)
A1
机
器
A2
(A)
A3
B1 15,15,17 17,17,17 15,17,16
A4 18,20,22
B2 19,19,16 18,15,15 18,17,16 15,16,17
H1 : 1,2 ,
,
不全为零。
r
(1.1) (1.2)
2020/8/4
11
(四)检验方法
若H 0成立,则r个总体之间无差异。这样,各个X ij
间的差异只是由随机因素引起的,若H
不成立,则
0
所有X
的总变差中,除了随机波动引起的变差之外,
ij
还包含了由于因素的不同水平作用所引起的变差。
r ni
r ni
7
由于Xij ~ N(i , 2),即有Xij i ~ N(0, 2),
故X ij
i可看成是随机误差。记X ij
i
ij
,
则X
可写成
ij
X ij i ij ,
ij
~
N
(0,
2
),各
独立,
ij
i 1, 2, , r, j 1, 2, , ni.
(1.1)
其中,i与 2均为未知参数。则上式称为
B3 16,18,21 19,22,22 18,18,18 17,17,17
2020/8/4
4
这里试验指标是零件的日产量,工人和机器 是因素,它们分别有3个、4个水平。这是一个双 因素试验。试验目的在于考察不同工人在不同机 器上生产零件的日产量有无显著差异。
本节先讨论单因素试验的方差分析。
2020/8/4
5
(二)方差检验的基本前提:
1、对变量因素的某一个水平,第 i 个水平进
行试验,得到的观察结果 Xi1, Xi2,
X
看作是从
ini
正态总体 N (i , 2 )i 1, 2, r 中取出的一个容
量为ni 的样本,且 i , 2均未知i 1, 2, r 。
2、对于表示r个水平的r个正态 总体的方差,认为都是相等的。
(Xij X )2
( Xij Xi. Xi. X )2
i1 j1
i1 j1
r ni
r
r ni
( Xij Xi.)2 ni ( Xi. X )2 2
( Xij Xi.)( Xi. X )
i1 j1
i1
i1 j1
2020/8/4
12
因为
r ni
(Xij Xi.)(Xi. X )
单因素试验方差分析的数学模型。
来自百度文库
2020/8/4
8
(三)统计假设
如果要检验的因素对试验结果没有显著影响, 则试验的全部结果X ij 应来自同一正态总体。因此, 提出一项统计假设:所有的X(ij j 1, , ni ;i 1, 2,
, r)都取自同一正态总体N(, 2 ).即
H0 : 1 2 r ; H1 : 1, 2, r中不全相等。