第9章_方差分析与一元回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i 1 j 1
r
ni
2
组内离差平方和
SE ( X ij X i )2
2 2 ( X X ) n ( X X ) i i i i 1 j 1 i 1
r
ni
组间离差平方和 S A
i 1 j 1 r ni
r
ST 反映了样本的总变动幅 度. S E反映了为从r个总体中选取一个容量 为ni的样本所进行的 重复试验而产生的误差 . S A反映了从各不同水平总 体中取出的各个样本之 间的差异.
2
3
3.2 8.6 4.2 5.4 7.2
4
7.8 6.5 8.2 4.1 9.6 10.1
行和
1 2 3 4 5 6
11.4
37.5 21.8 31.6 21.7 29.8 35.3
x 7.404
问六种温度对袜子的缩水率有无影响?
从表上的数据可以直观地看到: 1.表中数据不全相同,说明在不同的试验中存在着差异; 2.不同温度(水平)下缩水率的平均数不同,表明温度对 缩水率有一定影响,即有系统误差存在; 3.同温度(水平)下的4只袜子,缩水率也有差异,显然 这个差异不是由温度引起的,而是由随机因素引起的 随机误差; 4.由于有随机误差与随机误差的存在, 那么不同温度 下的平均缩水率之间的差异主要是随机因素造成的呢 ? 还是不同温度的影响?
2 2 i 1
ni X i 2 X ni X i nX
2
r
r
2
ni X i nX
2
i 1 r
i 1 2
1 ni ( ni i 1
r ni
i 1 r
X
j 1
ni
ij
) nX
2
r
2
1 1 2 ( X ij ) ( X ij )2 n i 1 j 1 i 1 ni j 1
ni
DP
(3) 若令Y aX b (a 0), 有Y aX b S a S
2 Y 2
2 X
1 n 1 n Y Yi (aX i b) n i 1 n i 1 1 n 1 n aX i b a X n i 1 n i 1
b
j 1
2 x rj j 1
P 1 r ni ( xij ) 2 n i 1 j 1
D 1 ni ( xij ) 2 i 1 ni j 1
r r
R
x
i 1 j 1
ni
2 ij
计算时,可用以下公式
p r 1 2 ST ( X ij X )2 X ij ( X ij )2 R P n i 1 j 1 i 1 j 1 i 1 j 1 r r ni ni
教学要求
1.掌握单因素试验的方差分析 2.掌握一元线性回归分析 学时 4- 6
第一节、方差分析
一、方差分析的基本原理 二、单因素方差分析的方法 三、单因素方差分析的步骤
四、双因素方差分析的方法
一、方差分析的基本原理 因素 在试验时,待考察的而受人为控制的“条件”称为因素. 单因素试验 在一次试验中,如果只有一个因素在改变,其他
i 1 j 1 2 ij 2
i 1 j 1 2 ij 2
r
ni
r
ni
1 X ( X ij )2 i 1 j 1 i 1 ni j 1
2 ij
r
ni
r
ni
RD
(2) S A ni ( X i X ) 2
i 1
r
r
ni ( X i 2 X i X X )
二、单因素方差分析的方法 1.假定条件
设有r个相互独立的正态总体 X ( , 2, r) , 现从 i i 1 X i中抽取容量为 ni的样本X i1 , X i 2 , X ini (i 1,2, r ). 记n n1 n2 nr (1).各样本间相互独立 , 各样本观测值具有随机 性; (2).各样本均来自正态总体 , 且具有方差齐性 ,即 X i ~ N ( i , ), 其中i , 均未知.
我们以下例来说明方差分析的基本原理和方法. [例] 把一批用同种纱线织成的袜子放在不同温度的 水中洗涤, 进行缩水率试验, 六种不同温度各洗涤4 只, 并在同一温室内凉干, 测得缩水率的百分数如
下:
袜号 温度
1
9.5 4.3 6.5 6.1 10.0 9.3 8.8 7.8 8.3 7.3 4.8 8.7
ni
nj
方差分析表
方差来源 离差平方和 自由度 F值 组间 F临界值 显著性
SA
SE
ST
r 1
组内
nr
n 1
S A (r 1) F S E (n r )
F (r 1, n r )
总和
例9.1 在下表中列出了某种树苗的高度的观测值,按所施的肥料 的不同分成5组,每组6个观测值.设苗高服从方差相等的正态分布, 问:在显著水平0.01下检验5组树苗的平均高度有无显著影响.
2.研究的基本问题
检验假设H 0 : 1 2 r ( i未知, 理论值) 1 r 设 ni i n i 1 令 i i 称 i为第i个水平对试验指标的效 应(简称Ai的效应) 原假设又可表示为 H 0:1 2 r 0
2
SA
2
~ (r 1)
2
(*)
*
不显著,接受H0
F0.1 较
**
F0.01
极 显 著
显 著
F0.05
显 著
拒绝H0
7.关于计算
(1) SE ( X ij X i ) ( X 2 X i X ij X i )
2 i 1 j 1
r
i 1 j 1 2 ij 2
i 1 j 1
r
ni
ST SE S A
6.构造检验统计量
可以证明,当 H 0 : 1 2 r 成立时, 有 S A (r 1) F ~ F (r 1, n r ) S E (n r ) (证明略)
ST
2
~ (n 1)
2
SE
2
~ (n r )
S A (r 1) F ~ F (r 1, n r ) S E (n r )
4.给出 的值,查分位数 F (r 1, n r ) 5.由以上结果列出方差分析表.
1
j
ni
xij
j 1
ni
( xij )
j 1
n1
ni
2
2 x ij j 1
ni
A1 Ai Ar
n 1 1 n 2 2 SY (Yi Y ) [(aX i b) (a X b)]2 n i 1 n i 1
1 n (aX i a X )2 n i 1
1 n 2 a (Xi X ) n i 1
2
a S
2
2 X
三、单因素方差分析的步骤 1.确定假设检验 H0 : 1 2 r. 2.列出方差分析计算表(见教材P173表9-2). 3.计算检验统计量
n pr 5 6 30 843.0 x 28.1
x
3.方差分析的数据结构
因素 重复号
1
X11 X 21 X r1
2
X12 X 22 Xr2
ni
ni
X1n1 X 2 n2 X rnr
Xi
X1 X2 Xr
A1 A2 Ar
组内平均值 总平均值
1 Xi ni
X
j 1
r ni
ij
i 1, 2 r
1 X X ij n i 1 j 1
处理方法 (水平数) 苗高xij(cm)
1 2
3
4
5
6
1 2 3 4 5
39.2 29.0 25.8 33.5 41.4 37.2 206.4 34.4 37.3 27.7 23.4 33.4 29.2 35.6 186.6 31.1 20.8 33.8 28.6 23.4 22.7 30.9 160.2 26.7 31.0 27.4 19.5 29.6 23.2 18.7 149.4 24.9 20.7 17.6 29.4 27.7 25.5 19.5 140.4 23.4
x11 x1 j x1n1 xi1 xij xini xr1 xrj xrnr
x
j 1
n1
1j
( x1 j ) 2
j Байду номын сангаас1
x
j 1
n1
2 1j
ij
x
nr
( xij ) 2 ( xrj )
j 1 nr 2
x
nr
2 ij
xrj
ni 1 2 SE ( X ij X i )2 X ij ( X ij )2 R D i 1 j 1 i 1 j 1 i 1 ni j 1 r r r
ni r ni 1 1 S A ni ( X i X )2 ( X ij )2 ( X ij )2 D P n i 1 j 1 i 1 i 1 ni j 1 r r
可以证明: ST SE S A
2 证明: ST ( X ij X ) i 1 j 1
r ni
r
ni
[( X ij X i ) ( X i X )]2
i 1 j 1
ni
( X ij X i )2 2 ( X ij X i )( X i X ) ( X i X )2
由于随机误差和系统误差常常交织在一起,方 差分析的基本想法就是要设法对总离差平方和S进 行分解, 因有两种可能:
(I)若H0为真, 则S为随机因素引起的误差;
(II)若H0不真, 则S除了随机误差外, 还包含了各 种条件造成的系统误差. 所以只要对S中的随机误差和包含不同条件造成 的那部分系统误差分开, 然后相互比较, 问题就解 决了.
因素保持不变,则称为单因素试验. 水平 因素变化所分的等级或组别,称为“水平”或“处理”.
方差分析 方差分析就是鉴别各因素效应(因素变化对试验指 标的影响)是否显著的一种统计方法.
[系统(条件)误差]: 在方差分析中,凡是由于试验因素的变异而引起的 试验结果的差异,称为“系统误差”或“条件误差”. [随机(试验)误差]: 在试验中,当我们把所有能控制的试验条件都控 制在固定的状态下,进行多次重复试验,所得的的试 验结果也不会完全一致,仍存在一定程度的差异.
和通常的统计推断问题一样, 方差分析的任务
是要寻求适当的统计量, 对参数作假设检验. 需要
检验六个正态总体的均值是否相等, 即:
H0 :
1 2 6
如果温度对试验结果并无显著影响, 表中的24个 数据应当来自同一正态总体, 即可接受H0 . 如果温度对 试验结果有显著影响,那么只有每一行的结果来自同一 正态总体, 不同的行并不来自同一总体, 当然只能否定 H0(条件不同所引起的系统误差主要表现在μi上; 随机 因素引起的误差主要表现在σi上.)
r
ni
r
ni
( X 2 X i X ij X i )
i 1 j 1 2 ij 2 j 1 j 1
ni
ni
ni
( X 2 X i X ij ni X i )
i 1 j 1 2 ij 2 j 1
r
ni
ni
( X 2 X i ni X i ni X i ) [ X ni X i ]
4.方差分析的数学模型
X ij i ij (i 1,2, r , j 1,2, ni )
ij ~ N (0, ), 表示独立的随机试验误 差.
2
或X ij i ij
(i i )
5.总离差平方和的分解
样本总离差平方和 ST ( X ij X )
r
r
n
r
ni
( X ij X i ) ni ( X i X )2
2
i 1 j 1 r ni
i 1 j 1
i 1 j 1
r
其中
(X
i 1 j 1
r
ni
i 1 j 1
i 1
ij
X) i ( X i X ) ( X i X ) ( X ij X i ) 0
r
ni
2
组内离差平方和
SE ( X ij X i )2
2 2 ( X X ) n ( X X ) i i i i 1 j 1 i 1
r
ni
组间离差平方和 S A
i 1 j 1 r ni
r
ST 反映了样本的总变动幅 度. S E反映了为从r个总体中选取一个容量 为ni的样本所进行的 重复试验而产生的误差 . S A反映了从各不同水平总 体中取出的各个样本之 间的差异.
2
3
3.2 8.6 4.2 5.4 7.2
4
7.8 6.5 8.2 4.1 9.6 10.1
行和
1 2 3 4 5 6
11.4
37.5 21.8 31.6 21.7 29.8 35.3
x 7.404
问六种温度对袜子的缩水率有无影响?
从表上的数据可以直观地看到: 1.表中数据不全相同,说明在不同的试验中存在着差异; 2.不同温度(水平)下缩水率的平均数不同,表明温度对 缩水率有一定影响,即有系统误差存在; 3.同温度(水平)下的4只袜子,缩水率也有差异,显然 这个差异不是由温度引起的,而是由随机因素引起的 随机误差; 4.由于有随机误差与随机误差的存在, 那么不同温度 下的平均缩水率之间的差异主要是随机因素造成的呢 ? 还是不同温度的影响?
2 2 i 1
ni X i 2 X ni X i nX
2
r
r
2
ni X i nX
2
i 1 r
i 1 2
1 ni ( ni i 1
r ni
i 1 r
X
j 1
ni
ij
) nX
2
r
2
1 1 2 ( X ij ) ( X ij )2 n i 1 j 1 i 1 ni j 1
ni
DP
(3) 若令Y aX b (a 0), 有Y aX b S a S
2 Y 2
2 X
1 n 1 n Y Yi (aX i b) n i 1 n i 1 1 n 1 n aX i b a X n i 1 n i 1
b
j 1
2 x rj j 1
P 1 r ni ( xij ) 2 n i 1 j 1
D 1 ni ( xij ) 2 i 1 ni j 1
r r
R
x
i 1 j 1
ni
2 ij
计算时,可用以下公式
p r 1 2 ST ( X ij X )2 X ij ( X ij )2 R P n i 1 j 1 i 1 j 1 i 1 j 1 r r ni ni
教学要求
1.掌握单因素试验的方差分析 2.掌握一元线性回归分析 学时 4- 6
第一节、方差分析
一、方差分析的基本原理 二、单因素方差分析的方法 三、单因素方差分析的步骤
四、双因素方差分析的方法
一、方差分析的基本原理 因素 在试验时,待考察的而受人为控制的“条件”称为因素. 单因素试验 在一次试验中,如果只有一个因素在改变,其他
i 1 j 1 2 ij 2
i 1 j 1 2 ij 2
r
ni
r
ni
1 X ( X ij )2 i 1 j 1 i 1 ni j 1
2 ij
r
ni
r
ni
RD
(2) S A ni ( X i X ) 2
i 1
r
r
ni ( X i 2 X i X X )
二、单因素方差分析的方法 1.假定条件
设有r个相互独立的正态总体 X ( , 2, r) , 现从 i i 1 X i中抽取容量为 ni的样本X i1 , X i 2 , X ini (i 1,2, r ). 记n n1 n2 nr (1).各样本间相互独立 , 各样本观测值具有随机 性; (2).各样本均来自正态总体 , 且具有方差齐性 ,即 X i ~ N ( i , ), 其中i , 均未知.
我们以下例来说明方差分析的基本原理和方法. [例] 把一批用同种纱线织成的袜子放在不同温度的 水中洗涤, 进行缩水率试验, 六种不同温度各洗涤4 只, 并在同一温室内凉干, 测得缩水率的百分数如
下:
袜号 温度
1
9.5 4.3 6.5 6.1 10.0 9.3 8.8 7.8 8.3 7.3 4.8 8.7
ni
nj
方差分析表
方差来源 离差平方和 自由度 F值 组间 F临界值 显著性
SA
SE
ST
r 1
组内
nr
n 1
S A (r 1) F S E (n r )
F (r 1, n r )
总和
例9.1 在下表中列出了某种树苗的高度的观测值,按所施的肥料 的不同分成5组,每组6个观测值.设苗高服从方差相等的正态分布, 问:在显著水平0.01下检验5组树苗的平均高度有无显著影响.
2.研究的基本问题
检验假设H 0 : 1 2 r ( i未知, 理论值) 1 r 设 ni i n i 1 令 i i 称 i为第i个水平对试验指标的效 应(简称Ai的效应) 原假设又可表示为 H 0:1 2 r 0
2
SA
2
~ (r 1)
2
(*)
*
不显著,接受H0
F0.1 较
**
F0.01
极 显 著
显 著
F0.05
显 著
拒绝H0
7.关于计算
(1) SE ( X ij X i ) ( X 2 X i X ij X i )
2 i 1 j 1
r
i 1 j 1 2 ij 2
i 1 j 1
r
ni
ST SE S A
6.构造检验统计量
可以证明,当 H 0 : 1 2 r 成立时, 有 S A (r 1) F ~ F (r 1, n r ) S E (n r ) (证明略)
ST
2
~ (n 1)
2
SE
2
~ (n r )
S A (r 1) F ~ F (r 1, n r ) S E (n r )
4.给出 的值,查分位数 F (r 1, n r ) 5.由以上结果列出方差分析表.
1
j
ni
xij
j 1
ni
( xij )
j 1
n1
ni
2
2 x ij j 1
ni
A1 Ai Ar
n 1 1 n 2 2 SY (Yi Y ) [(aX i b) (a X b)]2 n i 1 n i 1
1 n (aX i a X )2 n i 1
1 n 2 a (Xi X ) n i 1
2
a S
2
2 X
三、单因素方差分析的步骤 1.确定假设检验 H0 : 1 2 r. 2.列出方差分析计算表(见教材P173表9-2). 3.计算检验统计量
n pr 5 6 30 843.0 x 28.1
x
3.方差分析的数据结构
因素 重复号
1
X11 X 21 X r1
2
X12 X 22 Xr2
ni
ni
X1n1 X 2 n2 X rnr
Xi
X1 X2 Xr
A1 A2 Ar
组内平均值 总平均值
1 Xi ni
X
j 1
r ni
ij
i 1, 2 r
1 X X ij n i 1 j 1
处理方法 (水平数) 苗高xij(cm)
1 2
3
4
5
6
1 2 3 4 5
39.2 29.0 25.8 33.5 41.4 37.2 206.4 34.4 37.3 27.7 23.4 33.4 29.2 35.6 186.6 31.1 20.8 33.8 28.6 23.4 22.7 30.9 160.2 26.7 31.0 27.4 19.5 29.6 23.2 18.7 149.4 24.9 20.7 17.6 29.4 27.7 25.5 19.5 140.4 23.4
x11 x1 j x1n1 xi1 xij xini xr1 xrj xrnr
x
j 1
n1
1j
( x1 j ) 2
j Байду номын сангаас1
x
j 1
n1
2 1j
ij
x
nr
( xij ) 2 ( xrj )
j 1 nr 2
x
nr
2 ij
xrj
ni 1 2 SE ( X ij X i )2 X ij ( X ij )2 R D i 1 j 1 i 1 j 1 i 1 ni j 1 r r r
ni r ni 1 1 S A ni ( X i X )2 ( X ij )2 ( X ij )2 D P n i 1 j 1 i 1 i 1 ni j 1 r r
可以证明: ST SE S A
2 证明: ST ( X ij X ) i 1 j 1
r ni
r
ni
[( X ij X i ) ( X i X )]2
i 1 j 1
ni
( X ij X i )2 2 ( X ij X i )( X i X ) ( X i X )2
由于随机误差和系统误差常常交织在一起,方 差分析的基本想法就是要设法对总离差平方和S进 行分解, 因有两种可能:
(I)若H0为真, 则S为随机因素引起的误差;
(II)若H0不真, 则S除了随机误差外, 还包含了各 种条件造成的系统误差. 所以只要对S中的随机误差和包含不同条件造成 的那部分系统误差分开, 然后相互比较, 问题就解 决了.
因素保持不变,则称为单因素试验. 水平 因素变化所分的等级或组别,称为“水平”或“处理”.
方差分析 方差分析就是鉴别各因素效应(因素变化对试验指 标的影响)是否显著的一种统计方法.
[系统(条件)误差]: 在方差分析中,凡是由于试验因素的变异而引起的 试验结果的差异,称为“系统误差”或“条件误差”. [随机(试验)误差]: 在试验中,当我们把所有能控制的试验条件都控 制在固定的状态下,进行多次重复试验,所得的的试 验结果也不会完全一致,仍存在一定程度的差异.
和通常的统计推断问题一样, 方差分析的任务
是要寻求适当的统计量, 对参数作假设检验. 需要
检验六个正态总体的均值是否相等, 即:
H0 :
1 2 6
如果温度对试验结果并无显著影响, 表中的24个 数据应当来自同一正态总体, 即可接受H0 . 如果温度对 试验结果有显著影响,那么只有每一行的结果来自同一 正态总体, 不同的行并不来自同一总体, 当然只能否定 H0(条件不同所引起的系统误差主要表现在μi上; 随机 因素引起的误差主要表现在σi上.)
r
ni
r
ni
( X 2 X i X ij X i )
i 1 j 1 2 ij 2 j 1 j 1
ni
ni
ni
( X 2 X i X ij ni X i )
i 1 j 1 2 ij 2 j 1
r
ni
ni
( X 2 X i ni X i ni X i ) [ X ni X i ]
4.方差分析的数学模型
X ij i ij (i 1,2, r , j 1,2, ni )
ij ~ N (0, ), 表示独立的随机试验误 差.
2
或X ij i ij
(i i )
5.总离差平方和的分解
样本总离差平方和 ST ( X ij X )
r
r
n
r
ni
( X ij X i ) ni ( X i X )2
2
i 1 j 1 r ni
i 1 j 1
i 1 j 1
r
其中
(X
i 1 j 1
r
ni
i 1 j 1
i 1
ij
X) i ( X i X ) ( X i X ) ( X ij X i ) 0