生物统计-方差分析的基本假定与数据转换PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方差分析的基本假定与数据转换
• 方差分析的基本假定 • 数据转换
方差分析的前提
• 随机误差:独立、正态、等方差 • ①独立性:每组或水平组合内的个体之间
相互独立,可通过试验设计来保证; • ②正态性:每组或水平组合所代表的总体
服从正态分布,需要进行检验; • ③等方差性(方差同质):每个正态总体
的方差相等,也需要进行检验。
样本号
S
2 i
dfi ni 1
dfi
S
2 i
log
S
2 i
dfi
log
S
2 i
18
8
64 0.903 7.2248
2 4.6
5
23.35 1
3.3465
37
4
16 0.669 2.4048
百度文库
合计 4
17 103.3 3
12.9797
解:假设H 0为各个总体的方5差相01等.60。2
C 1 1 ( 1 1 ) 3(k 1) i d f i d fT
S
2 1
6.21
,
S
2 2
5.12, S32
4.34 ,
样本含量均为20,试对3个样本所在总体的方差
的同质性进行检验。
解:假设H 0为各个总体的方差相等。
检验统计量 F
S
2 max
S
2 min
6.21 4.34
1.43
0.05时 , F 0.05(3,19) 2.95, F 2.95,
3个总体的方差是同质的
1
1 3(3 1)
(
1 8
1 5
1 4
1 17
)
1.086
例8-3. 对3个样本的方差作同质性检验:
样本号
S
2 i
dfi ni 1
dfi
S
2 i
log
S
2 i
dfi
log
S
2 i
18
8
64 0.903 7.2248
2 4.6
5
23.35 1
3.3465
37
4
16 0.669 2.4048
合计 4
6.7.2 方差的稳定性转换 方法1:平方根转换
适用于总体方差与平均数成正比的情形, 例如总体服从普哇松分布。
设Y X 或Y X 1 或Y X X 1
转 换 前 平方根转换
区组
1 2 3 4 合计 平均 标准差
除草剂 1 23 4 5
合计
538 438 77 115 17 422 442 61 57 31 377 319 157 100 87 315 380 52 45 16 1652 1579 347 317 151 413 394. 75 86. 75 79. 25 37. 75
51 40
24
28
0.302
0.05时 ,G 0.05(5,9) 0.4241, F 0.4241,
5个总体的方差是同质的
方法3:Bartlett 检验
适用于各总体都服从正态分布的情形,样本含量可以
不等。假设H 0: 各个总体的方差相等。检验统计量:
2
2.3026 C
(d
fT
log
6.7.1 方差的同质性检验
方法1:F max 检验 只适用于所有样本的含量均相等的情形。
假设H 0:各个总体的方差相等。
检验统计量 :
Fmax
S
2 max
S
2 min
分子为各个样本方差的最大值,分母为各个 样本方差的最小值。
临界值: 根据样本的个数及自由度查附表7,
自由度=样本容量-1 。
例. 设有3个样本的方差分别为
本容量-1; 如果样本含量不相等, 则自由度=
样本容量的调和平均数-1 。
例. 设有5个样本的方差分别为
S
2 1
26
,
S
2 2
51, S32
40, S42
24, S52
28 ,
样本含量均为10,试对5个样本所在总体的方差
的同质性进行检验。
解:假设H 0为各个总体的方差相等。
检验统计量 G
26
51
2 4.6
5
23.35 1
3.3465
37
4
16 0.669
合计 4
17 103.3 3
5 0.602
C 1.086, S 2 6.079,
1
2.4048 12.9797
2
2.3026 (d
C
fT
log S 2
d
i
fi
log
S
2 i
)
2.3026 1.086
(17
log 6.079
12.9797)
1185 1013 1040 808 4052 202. 6
117. 3 57. 9 47. 96 33. 55 33. 53
0.731
2 0.05
(2)
5.99
, 0.731
5.99 , 认为3个总体方差同质
小结:方差分析的基本假定
• 独立、正态、等方差
为什么要进行数据转换?
• 通常,数据的非正态性和方差的不同质相 伴出现,因为往往正是经过适当的数据转 换,两者都可以得到改善。
6.7.2 方差的稳定性转换
当各个总体的方差有显著的差异(不同质)时, 对数据进行稳定性转换,可以使转换后的数据 的方差近似于同质。
17 103.3 3
12.9797
5 0.602
1d
f
i
S
2 i
S 2( 平均的样本方差 ) i
d fT
103.35 6.079, 17
例8-3. 对3个样本的方差作同质性检验:
样本号
S
2 i
dfi ni 1
dfi
S
2 i
log
S
2 i
dfi
log
S
2 i
18
8
64 0.903 7.2248
方法2: G max 检验 适用于某个样本方差明显地大于其他样本方
差的情形。假设H 0:各个总体的方差相等。
检验统计量 :
Gmax
S
2 max
S
2 1
S
2 2
S
2 k
式中的
S
2 k
是第
k
个样本的方差
,S
2max是最大
的样本方差 临界值: 根据样本的个数及自由
度附表 8,如果样本含量相等, 则自由度=样
S
2
i
d
f
i
log
S
2 i
)
,
式中的 C 1 1 ( 1 1 ) ,
3(k 1) i d f i d fT
k 为样本数 , d f i 第i 个样本的容量 n i 1,
d fT
dfi ,
S
2 i
为第i 个样本的方差,
d
f
i
S
2 i
S 2 ( 平均的样本方差 ) i d fT
例8-3. 对3个样本的方差作同质性检验:
方差的同质性检验
• Hartley F检验(F max 检验) • Cochran检验 • Bartlett检验
Herman Otto Hartley (1912 – 1980), a German-American statistician. William Gemmell Cochran (1909–1980), a British-American statistician Maurice Stevenson Bartlett (1910 - 2002), an English statistician
• 方差分析的基本假定 • 数据转换
方差分析的前提
• 随机误差:独立、正态、等方差 • ①独立性:每组或水平组合内的个体之间
相互独立,可通过试验设计来保证; • ②正态性:每组或水平组合所代表的总体
服从正态分布,需要进行检验; • ③等方差性(方差同质):每个正态总体
的方差相等,也需要进行检验。
样本号
S
2 i
dfi ni 1
dfi
S
2 i
log
S
2 i
dfi
log
S
2 i
18
8
64 0.903 7.2248
2 4.6
5
23.35 1
3.3465
37
4
16 0.669 2.4048
百度文库
合计 4
17 103.3 3
12.9797
解:假设H 0为各个总体的方5差相01等.60。2
C 1 1 ( 1 1 ) 3(k 1) i d f i d fT
S
2 1
6.21
,
S
2 2
5.12, S32
4.34 ,
样本含量均为20,试对3个样本所在总体的方差
的同质性进行检验。
解:假设H 0为各个总体的方差相等。
检验统计量 F
S
2 max
S
2 min
6.21 4.34
1.43
0.05时 , F 0.05(3,19) 2.95, F 2.95,
3个总体的方差是同质的
1
1 3(3 1)
(
1 8
1 5
1 4
1 17
)
1.086
例8-3. 对3个样本的方差作同质性检验:
样本号
S
2 i
dfi ni 1
dfi
S
2 i
log
S
2 i
dfi
log
S
2 i
18
8
64 0.903 7.2248
2 4.6
5
23.35 1
3.3465
37
4
16 0.669 2.4048
合计 4
6.7.2 方差的稳定性转换 方法1:平方根转换
适用于总体方差与平均数成正比的情形, 例如总体服从普哇松分布。
设Y X 或Y X 1 或Y X X 1
转 换 前 平方根转换
区组
1 2 3 4 合计 平均 标准差
除草剂 1 23 4 5
合计
538 438 77 115 17 422 442 61 57 31 377 319 157 100 87 315 380 52 45 16 1652 1579 347 317 151 413 394. 75 86. 75 79. 25 37. 75
51 40
24
28
0.302
0.05时 ,G 0.05(5,9) 0.4241, F 0.4241,
5个总体的方差是同质的
方法3:Bartlett 检验
适用于各总体都服从正态分布的情形,样本含量可以
不等。假设H 0: 各个总体的方差相等。检验统计量:
2
2.3026 C
(d
fT
log
6.7.1 方差的同质性检验
方法1:F max 检验 只适用于所有样本的含量均相等的情形。
假设H 0:各个总体的方差相等。
检验统计量 :
Fmax
S
2 max
S
2 min
分子为各个样本方差的最大值,分母为各个 样本方差的最小值。
临界值: 根据样本的个数及自由度查附表7,
自由度=样本容量-1 。
例. 设有3个样本的方差分别为
本容量-1; 如果样本含量不相等, 则自由度=
样本容量的调和平均数-1 。
例. 设有5个样本的方差分别为
S
2 1
26
,
S
2 2
51, S32
40, S42
24, S52
28 ,
样本含量均为10,试对5个样本所在总体的方差
的同质性进行检验。
解:假设H 0为各个总体的方差相等。
检验统计量 G
26
51
2 4.6
5
23.35 1
3.3465
37
4
16 0.669
合计 4
17 103.3 3
5 0.602
C 1.086, S 2 6.079,
1
2.4048 12.9797
2
2.3026 (d
C
fT
log S 2
d
i
fi
log
S
2 i
)
2.3026 1.086
(17
log 6.079
12.9797)
1185 1013 1040 808 4052 202. 6
117. 3 57. 9 47. 96 33. 55 33. 53
0.731
2 0.05
(2)
5.99
, 0.731
5.99 , 认为3个总体方差同质
小结:方差分析的基本假定
• 独立、正态、等方差
为什么要进行数据转换?
• 通常,数据的非正态性和方差的不同质相 伴出现,因为往往正是经过适当的数据转 换,两者都可以得到改善。
6.7.2 方差的稳定性转换
当各个总体的方差有显著的差异(不同质)时, 对数据进行稳定性转换,可以使转换后的数据 的方差近似于同质。
17 103.3 3
12.9797
5 0.602
1d
f
i
S
2 i
S 2( 平均的样本方差 ) i
d fT
103.35 6.079, 17
例8-3. 对3个样本的方差作同质性检验:
样本号
S
2 i
dfi ni 1
dfi
S
2 i
log
S
2 i
dfi
log
S
2 i
18
8
64 0.903 7.2248
方法2: G max 检验 适用于某个样本方差明显地大于其他样本方
差的情形。假设H 0:各个总体的方差相等。
检验统计量 :
Gmax
S
2 max
S
2 1
S
2 2
S
2 k
式中的
S
2 k
是第
k
个样本的方差
,S
2max是最大
的样本方差 临界值: 根据样本的个数及自由
度附表 8,如果样本含量相等, 则自由度=样
S
2
i
d
f
i
log
S
2 i
)
,
式中的 C 1 1 ( 1 1 ) ,
3(k 1) i d f i d fT
k 为样本数 , d f i 第i 个样本的容量 n i 1,
d fT
dfi ,
S
2 i
为第i 个样本的方差,
d
f
i
S
2 i
S 2 ( 平均的样本方差 ) i d fT
例8-3. 对3个样本的方差作同质性检验:
方差的同质性检验
• Hartley F检验(F max 检验) • Cochran检验 • Bartlett检验
Herman Otto Hartley (1912 – 1980), a German-American statistician. William Gemmell Cochran (1909–1980), a British-American statistician Maurice Stevenson Bartlett (1910 - 2002), an English statistician