4.5 完全区组设计:Friedman 秩和检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对于随机区组的数据,传统的方差分析要求试验误差是 正态分布的,当数据不符合方差分析的正态前提时, Friedman 建立采用秩方差分析法.
Friedman 检验对试验误差没有正态分布的要求,仅仅依赖 于每个区组内所观测的秩次.
Friedman 检验的问题是 k 个样本的位置参数 (用1 ,2 , ,k 表示)是否相等.
2 当 Q (k 1) 时,在水平 上拒绝 H 0; 2 当 Q (k 1) 时,不能拒绝 H 0 .
当数据有相同秩时,秩取平均值, 在某区组存在结时,此时需要对 Q 统计量进行修正: Q Qc . k b ( i3, j i , j ) 1 i 1 j 1 2 bk (k 1) 其中 i , j 为第 j 个区组的第 i 个结统计量 .
(3)作出决策
2 2 (4 1) 7.82,而 Q (4 1),所以不能拒绝 H 0 .
表明四个技术训练的有效性没有显著差异.
练习: 根据下列资料,检验三种培训方案的有效性有无显著差异
0.05 .
学生组
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
在表中加上各处理在每个区组(职业) 中的秩,得
区组(职业) 处理(城市)
I 80(3) 52(2) 40(1)
II 100(3) 76(2) 52(1)
III 51(2) 52(3) 34(1)
IV 65(3) 53(2) 35(31)
Ri 11 9 4
A B C
Q 由此算出 Q 6.5, 对于 k 3 和 b 4,W 0.815. 4 3 1
j 1 b
, k.
• 如果 H 0 为真,则每一行中秩的分布应该是随机的, 即各个秩出现在所有行中的频数应几乎相等.
在零假设成立的情况下, 各处理的平均秩 Ri Ri b 有下述性质.
k 1 E Ri , 2 k 2 1 D( Ri ) , 12b k 1 Cov( Ri , R j ) . 12
k 个样本是匹配的,可以由 k 个条件下同一组受试者构成, 也可以将受试者分为 n 组,每组均有 k 个匹配的受试者, 随机地将 n 组受试者置于 k 个条件下.
在不同受试者匹配的样本中,应尽量使不同受试者的有关 因素匹配即相似.
1. 建立假设检验
假设检验问题:
H0 : 1 2 ... k H1 : 不是所有的位置参数都相等.
Hollandre Wolfe(1973)提出两处理间的比较公式: Dij Ri R j SE .
其中 Ri,Rj 分别表示第 i 样本与第 j 样本(处理)的秩和
(k 1)(k 1) k 2 2 SE Var bRij b 2 12 k 1 b b bk (k 1) / 6
k
b k 1 其中 R . 2 计算总均方(MST )
bk (k 1) 2 , 4
Var Rij MST SST bk 1 ( Rij R ) 2 bk
i 1 j 1 2 k b bk k 1 2 k 1 bk k 1 1 1 2 2 Rij R bk bk i 1 j 1 6 4 bk
k (k 1) 2
,
Z * 2 为标准正态分布分位数.
显然这个检验很保守,也就是说,很不容易拒绝零假设.
设来自四个地区的四名厨师制作名菜水煮鱼,四位美食 专家评分结果如下表.
地区(处理)
专家 (区组)
A 85 87 90 80
B 82 75 81 75
C 82 86 80 81
D 79 82 76 75
方案A
1 1 2 3 2 1 1 2 2 2 1 1 1 1 1 1 1 1
方案B
3 2 3 2 1 3 2 3 1 1 3 3 2 3 2.5 2 2 2
方案C
2 3 1 1 3 2 3 1 3 3 2 2 3 2 2.5 3 3 3
Hollandre-Wolfe 两处理间的比较
当秩方差分析结果显示处理间存在差异时, (或者想知道某两个处理的比较时)
随机化完全区组设计的秩数据表
区组 处理
1
2
…
b
秩和 Ri.
1
2
R11
R21
R12
R22
…
…
R1b
R2b
R1
R2
k
秩和 R.j
Rk1
k(k+1)/2
Rk2
k(k+1)/2
…
k(k+1)/2
Rkb
k(k+1)/2
Rk
bk(k+1)/2
其中 Rij 表示在第 j 个区组中 i 处理的秩, (行)和 Ri Rij ,i 1, 2,
接下来的做法与 Kruskal Wallis 检验相同. 计算处理平方和(SSt )
k b 2 k 2 i 1 j 1 k i 1
SSt ( Ri R ) b (Ri R ) Ri2 b R2 bk
i 1 2 R i i 1
k
b
k 1 k 1 . 12
• Friedman 检验统计量 Q 为: SSt 12 k 2 2 Q Ri b bk (k 1) 4 . Var Rij (k 1)(k 1) i 1
• Friedman 建议用 k 1 k 乘 Q 得校正式 Q.
查表得到相应于 0.0417 的临界值 c 0.8125. 即 P W 0.8125 0.0417. 此时 0.0417 也是 p 值.
对于水平 0.05,可以拒绝零假设. 也就是说,不同汽车密度的城市居民的血铅含量的确不一样.
按照 2 2 近似,得到 p 值为 0.0388,比上面的小一点 .
Friedman 检验统计量为:
k b k 1 12 12 2 Q R R i j 3b(k 1). bk (k 1) j 1 2 bk (k 1) j 1 k 2
Q 渐近服从自由度为 k 1的 2 分布. 即 Q ~ 2 (k 1).
例 某田径队对新入队的学员要进行四个部分的技术训练, 以提高学员的身体素质。为检验这四个部分的技术训练是否确实 有效,随机抽选了14 名新学员,分别接受四个部分的训练。 每个训练结束后,均进行该部分的测试,成绩以 10 分为最高。 检测结果如下表所示:
等级 学员编号
技术训练
A 10 2 4 6 3 5 7 6 10 8 5 3 4 6
1 2 3 4
试比较四个地区的四名厨师制作名菜水煮鱼的品质是否相同.
由于不同评委在口味和美学欣赏上存在差异,因此适合用 Freidman 检验方法比较.
解:假设检验问题 H 0: 4 个地区的京城 水煮鱼品质相同. H1: 4 个地区的京城 水煮鱼品质不同.
专家 (区组)
地区(处理)
A
85 4
B
82 2.5
区组(职业) 处理(城市)
I 80 52 40
II 100 76 52
IIIFra Baidu bibliotek51 52 34
IV 65 53 35
A B C
试判断对于显著性水平 0.05, 不同汽车密度的城市居民的血铅含量是否一样.
解:建立假设检验 H 0 : 1 2 3 H1 : 不是所有的位置参数都相等.
或者说,提出假设
H 0: k 个样本间无显著差异. H1: k 个样本间有显著差异.
2. 选择检验统计量
• Friedman 检验所分析的数据应是定序尺度测量.
• 获得的数据排出一个 k 行 n 列的表, 列代表不同的受试者或匹配的受试小组, 行代表各种条件(处理).
• Friedman 检验的实质是符号检验推广到多个处理的比较问题.
大样本时基于 Friedman 秩和检验的一个方法.
如果零假设 H 0 为 i 处理和 j 处理没有区别, 那么,双边检验的统计量为 Ri R j .
对于置信水平 ,如果 Ri R j Z * 2 bk (k 1) / 6, 则拒绝零假设,这里 *
总共可比较的对数
技术训练C
2 4 1 4 4 3 2 1 3 2 1 2 4 3
技术训练D
3 2 3 2 3 4 1 2 2 1 4 4 3 4
合计 ( Ri )
33
33
36
38
计算检验统计量 Q
12 Q (332 332 362 382 ) 3 14 (4 1) 0.7714 14 4 (4 1)
解:()建立假设 1 H 0: 四个部分技术训练的有效性无显著差异 H1: 四个部分技术训练的有效性有显著差异
(2)计算检验统计量 Q.
学员编号
1 2 3 4 5 6 7 8 9 10 11 12 13 14
技术训练A
4 1 2 3 1 2 3 3 4 3 3 1 1 2
技术训练B
1 3 4 1 2 1 4 4 1 4 2 3 4 1
由于区组的影响, Friedman 检验首先在每一个区组中计算 各个处理的秩,再把每一个处理在各区组中的秩相加.
Rij 表示在第 j 个区组中 i 处理的秩,则秩按照处理而求得的 (行)和为 Ri Rij ,i 1, 2,
j 1 b
, k.
注: 由于区组的影响,不同区组中的秩没有可比性. 但是,如果按照不同的区组收集数据,那么同一区组中 的不同处理之间的比较时有意义的. 比如,同个年龄段中比较药品的疗效比不分年龄来比较 疗效要合理. 因此,首先应在每一个区组内分配各处理的秩,从而 得到秩数据表.
C
82 2.5
D
79 1
1
2
3 4 秩和
87 4
90 4
75 1
81 3
86 3
• Qc 的小样本零分布无表可查,但是其零分布的极限分布 与 Q 一样.
• 修正后统计量 Qc 的数学期望等于 k 1,
2 仍然服从 (k 1) 分布. 2 • 若实测 Q (k 1),则拒绝 H 0 .
反之不拒绝 H 0 .
例 4.2 在不同的城市对不同的人群进行血液中铅含量的测试, 一共有 A, B, C 三个城市,代表着三种不同的处理 (k 3). 对试验者按职业分成四组 (b 4) 取血. 他们血铅含量如下表所示:
4.5 Friedman 检验
Friedman 检验又称 Friedman 2 检验或 Friedman 两因素秩方差分析. 它是由 Friedman 于 1937 年提出的,后来又被 Kendall 和 Smith 发展到多元度量的协同系数相关问题上.
它是针对完全区组设计而提出的检验方法.
3. 作出决策
对于有限的 k 和 b,有零假设下的分布表可查, Q 查的时候要作变换 W . b k 1
当查不到时,可用自由度为 k 1的 2 分布近似. 对于固定的 k,当 b 时,在零假设下有 Q ~ 2 (k 1).
4. 小结
检验步骤: ( 1 )提出假设 H 0: k 个样本间无显著差异. H1: k 个样本间有显著差异. (2)计算检验统计量 Q. (3)作出决策
B 3 5 10 3 4 4 10 10 5 9 4 5 5 5
C 6 9 3 10 10 6 6 3 7 7 2 4 10 8
D 8 4 8 4 6 7 5 5 6 6 6 7 9 10
1 2 3 4 5 6 7 8 9 10 11 12 13 14
试问在5%的显著性水平下四个部分技术训练的有效性有无 显著差异?
若有相同秩,则 bk (k 1) - 6 b ( i3 i )
i 1 g
SE
6(k 1)
其中 i 为同秩观测值个数,g 为同秩组数.
当实测数值 Dij Z1- * 时,表示两处理间有差异,反之则无差异. 其中 *
k (k 1)
.
或者称之为 成对处理的比较