第二章单因子试验设计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i1 j1
称为组内平方和 S内 ,又称为误差平方和 Se ,其自由度 f e n r .第二个平方和
r
mi ( yi y)2.
i 1
称为组间平方和 S间 ,又称为因子 A 的平方和 S A ,其自由度 fA r 1.
总平方和分解公式: ST = S e + S A , fT fe f A . 注意:通常先计算 ST , S A ,后计算 S e
重复数
m1 =7 m2 =5 m3 =6 m4 =6
n=24
组内平方和
Q1 =12.83 Q2 =11.30 Q3 =12.03 Q4 = 5.61 S e =41.77
• SA 23.50 , fA 4 1 3 .
• ST 65.27 , fT 24 1 23. • Se 65.27 23.50 41.77 , fT 23 3 20 .
2011
随机化
• 这里一次测试就是一次试验,试验次序要随机化。
因子 A 的水平
试验编号
A1
1234567
A2
8 9 10 11 12
A3
13 14 15 16 17 18
A4
19 20 21 22 23 24
•把试验结果“对号入坐”,填写试验结果。
因子 A 的水平
数据(毫克)
A1
7.9 6.2 6.6 8.6 8.9 10.1 9.6
平方和: k Q ( y1 y)2 ( y2 y)2 ( yk y)2 ( y j y)2 j 1
称为 k 个数据的偏差平方和,有时简称为平方和,它是一个重要
的统计量。
• 偏差平方和 Q 常用来度量若干个数据集中与分散(即波动)的程
度.
• Q 中的 k 个偏差 y1 y,y2 y,,yk y 间有一个恒等式: k (y j y) 0 . j 1
y i j i i , j i 1 , 2 , , r , j 1 , 2 , , m i
其中 y ij 是因子A的第i个水平下第j次试验结果;
i 是因子A的第i个水平的均值,是待估参数;
ij 是因子A的第i个水平下第j次试验误差,它
们是相互独立同分布 N(0,2) 的随机变量。
由此可知: E(yij)i,V(yij)2
故 Q 中独立的偏差只有 k-1 个.记 f=k-1,并称 f 为 Q 的自由度。
总平方和的分解公式
单因子试验共有 n m1 m2 mr 个数据,其总平均值为
y 1 n
r i1
mi
yij
j 1
这 n 个数据的波动可用总偏差平方和 ST 表示:
r mi
ST
( yij y)2, fT n 1.
H 0 : 1 2 ... r
H1 : 诸i 不全相等
若在显著性水平 下拒绝 H 0 ,则称因子 A 在水平 下是显著的,或因子 A 显著。否则称因子 A 不显著。
上述假设检验的关键在于总平方和及自由度的分 解。
偏差平方和及其自由度
在统计学中,把 k 个数据 y1, y2 ,, yk 对其均值 y 的偏差的
A2
5.7 7.5 9.8 6.1 8.4
A3
6.4 7.1 7.9 4.5 5.0 4.0
A4
6.8 7.5 5.0 5.3 6.1 7.4
样本均值
8.27 7.50 5.82 6.35
单因子试验的一般概述
在一个试验中只考察一个因子A及其r个水平A1,A2,… ,Ar.
在水平Ai下重复mi次试验,总试验次数n= m1+m2 +…+ mr. 记yij是第i个水平下的第j次重复试验的结果,这里 i ——水平号,j ——重复号.
经过随机化后,所得的n个试验结果列于表2.2.1.
表2.2.1 单因子试验的数据
因子 A 的水平
A1 A2
Ar
数据
y11 y12 y1m1 y21 y22 y2m2
yr1 yr 2 yrmr
和
T1 y11 y12 y1m1 T2 y21 y22 y2m2
均值
y1 T1 / m1 y2 T2 / m2
图2.2.1 单因子试验所涉及的多个正态总体
单因子试验中要研究的问题
• r个水平均值 1, 2, , r 是否彼此
相等? 这要用单因子方差分析方法来研究
• 假如r个均值不全相等,哪些均值间的差 异是重要的? 这要用多重比较的方法来研究
单因子试验的统计模型
单因子试验的三项基本假定用到试验数据yij上去, 可得到如下统计模型:
诸 i 的最小二乘估计
由于 E(yij)i,诸 i 最小二乘法是使所有的偏差 yij i的
平方和
r mi
Q
(yij i)2
i1 j1
达到最小,用微分法立即可得诸 i的最小二乘估计是:
ˆiy i, i 1 ,2 , ,r
它是第i个水平下的平均值。 譬如,在例2.1.1中,由表2.1.2可得 .
ˆ 1 8 .2 , ˆ 7 2 7 .5 , ˆ 0 3 5 .8 , ˆ 2 4 6 .35
即四个产地绿茶的叶酸含量平均值为8.27,7.50,5.82,6.35
2.2 单因子方差分析
单因子方差分析问题就是在方差相等情况下对多个 正态均值是否彼此相等的一个假设检验问题。所涉及的 一对假设如下:
i1 j1
对 ST 中每一项插入 yi 二项,利用代数运算,可把 ST 分解为
如下两个平方和
r mi
ST
( yij yi ) ( yi y) 2
i1 j1
r mi
r
( yij yi )2 mi ( yi y)2 .
i1 j1
i 1
总平方和的分解公式
其中第一个平方和
r mi
( yij yi )2
例 2.2.3.对表 2.1.2 上所列茶叶的叶酸含量,计算各类平方和 及自由度。
水平
A1 A2 A3 A4
和
数据
7.9 6.2 6.6 8.6 8.9 10.1 9.6 5.7 7.5 9.8 6.1 8.4 6.4 7.1 7.9 4.5 5.0 4.0 6.8 7.5 5.0 5.3 6.1 7.4
…
Tr yr1 yr 2 yrmr
…Biblioteka Baidu
yr Tr / mr
单因子试验的三项基本假定
自正A1态.正总态体性N:(在i,水i2平)的A一i下个的样数本据,yii=1,1y,2i2…,…,r, 。yimi是来
A2.方差齐性:r个正态总体的方差相等,即:
1 22 2 r 22。
A3.随机性:所有数据yij都相互独立。
称为组内平方和 S内 ,又称为误差平方和 Se ,其自由度 f e n r .第二个平方和
r
mi ( yi y)2.
i 1
称为组间平方和 S间 ,又称为因子 A 的平方和 S A ,其自由度 fA r 1.
总平方和分解公式: ST = S e + S A , fT fe f A . 注意:通常先计算 ST , S A ,后计算 S e
重复数
m1 =7 m2 =5 m3 =6 m4 =6
n=24
组内平方和
Q1 =12.83 Q2 =11.30 Q3 =12.03 Q4 = 5.61 S e =41.77
• SA 23.50 , fA 4 1 3 .
• ST 65.27 , fT 24 1 23. • Se 65.27 23.50 41.77 , fT 23 3 20 .
2011
随机化
• 这里一次测试就是一次试验,试验次序要随机化。
因子 A 的水平
试验编号
A1
1234567
A2
8 9 10 11 12
A3
13 14 15 16 17 18
A4
19 20 21 22 23 24
•把试验结果“对号入坐”,填写试验结果。
因子 A 的水平
数据(毫克)
A1
7.9 6.2 6.6 8.6 8.9 10.1 9.6
平方和: k Q ( y1 y)2 ( y2 y)2 ( yk y)2 ( y j y)2 j 1
称为 k 个数据的偏差平方和,有时简称为平方和,它是一个重要
的统计量。
• 偏差平方和 Q 常用来度量若干个数据集中与分散(即波动)的程
度.
• Q 中的 k 个偏差 y1 y,y2 y,,yk y 间有一个恒等式: k (y j y) 0 . j 1
y i j i i , j i 1 , 2 , , r , j 1 , 2 , , m i
其中 y ij 是因子A的第i个水平下第j次试验结果;
i 是因子A的第i个水平的均值,是待估参数;
ij 是因子A的第i个水平下第j次试验误差,它
们是相互独立同分布 N(0,2) 的随机变量。
由此可知: E(yij)i,V(yij)2
故 Q 中独立的偏差只有 k-1 个.记 f=k-1,并称 f 为 Q 的自由度。
总平方和的分解公式
单因子试验共有 n m1 m2 mr 个数据,其总平均值为
y 1 n
r i1
mi
yij
j 1
这 n 个数据的波动可用总偏差平方和 ST 表示:
r mi
ST
( yij y)2, fT n 1.
H 0 : 1 2 ... r
H1 : 诸i 不全相等
若在显著性水平 下拒绝 H 0 ,则称因子 A 在水平 下是显著的,或因子 A 显著。否则称因子 A 不显著。
上述假设检验的关键在于总平方和及自由度的分 解。
偏差平方和及其自由度
在统计学中,把 k 个数据 y1, y2 ,, yk 对其均值 y 的偏差的
A2
5.7 7.5 9.8 6.1 8.4
A3
6.4 7.1 7.9 4.5 5.0 4.0
A4
6.8 7.5 5.0 5.3 6.1 7.4
样本均值
8.27 7.50 5.82 6.35
单因子试验的一般概述
在一个试验中只考察一个因子A及其r个水平A1,A2,… ,Ar.
在水平Ai下重复mi次试验,总试验次数n= m1+m2 +…+ mr. 记yij是第i个水平下的第j次重复试验的结果,这里 i ——水平号,j ——重复号.
经过随机化后,所得的n个试验结果列于表2.2.1.
表2.2.1 单因子试验的数据
因子 A 的水平
A1 A2
Ar
数据
y11 y12 y1m1 y21 y22 y2m2
yr1 yr 2 yrmr
和
T1 y11 y12 y1m1 T2 y21 y22 y2m2
均值
y1 T1 / m1 y2 T2 / m2
图2.2.1 单因子试验所涉及的多个正态总体
单因子试验中要研究的问题
• r个水平均值 1, 2, , r 是否彼此
相等? 这要用单因子方差分析方法来研究
• 假如r个均值不全相等,哪些均值间的差 异是重要的? 这要用多重比较的方法来研究
单因子试验的统计模型
单因子试验的三项基本假定用到试验数据yij上去, 可得到如下统计模型:
诸 i 的最小二乘估计
由于 E(yij)i,诸 i 最小二乘法是使所有的偏差 yij i的
平方和
r mi
Q
(yij i)2
i1 j1
达到最小,用微分法立即可得诸 i的最小二乘估计是:
ˆiy i, i 1 ,2 , ,r
它是第i个水平下的平均值。 譬如,在例2.1.1中,由表2.1.2可得 .
ˆ 1 8 .2 , ˆ 7 2 7 .5 , ˆ 0 3 5 .8 , ˆ 2 4 6 .35
即四个产地绿茶的叶酸含量平均值为8.27,7.50,5.82,6.35
2.2 单因子方差分析
单因子方差分析问题就是在方差相等情况下对多个 正态均值是否彼此相等的一个假设检验问题。所涉及的 一对假设如下:
i1 j1
对 ST 中每一项插入 yi 二项,利用代数运算,可把 ST 分解为
如下两个平方和
r mi
ST
( yij yi ) ( yi y) 2
i1 j1
r mi
r
( yij yi )2 mi ( yi y)2 .
i1 j1
i 1
总平方和的分解公式
其中第一个平方和
r mi
( yij yi )2
例 2.2.3.对表 2.1.2 上所列茶叶的叶酸含量,计算各类平方和 及自由度。
水平
A1 A2 A3 A4
和
数据
7.9 6.2 6.6 8.6 8.9 10.1 9.6 5.7 7.5 9.8 6.1 8.4 6.4 7.1 7.9 4.5 5.0 4.0 6.8 7.5 5.0 5.3 6.1 7.4
…
Tr yr1 yr 2 yrmr
…Biblioteka Baidu
yr Tr / mr
单因子试验的三项基本假定
自正A1态.正总态体性N:(在i,水i2平)的A一i下个的样数本据,yii=1,1y,2i2…,…,r, 。yimi是来
A2.方差齐性:r个正态总体的方差相等,即:
1 22 2 r 22。
A3.随机性:所有数据yij都相互独立。