4.8 完全区组设计:Page 检验
完全区组试验设计及分析
第二章完全区组试验设计及分析第一节对比法和间比法试验设计及分析第二节完全随机设计及分析第三节随机区组设计及分析第四节拉丁方设计及分析(复习)第一节对比法和间比法试验设计及分析1CK23CK45CK67CK81.对比法试验设计7CK81CK23CK45CK65CK67CK81CK23CK48个处理3次重复对比排列(阶梯式)2.对比法试验结果的统计分析步骤•T t= 各处理在各重复中的小区产量相加•=各重复中的小区平均产量x t 各重复中的小区平均产量•相对生产力%=某处理总产量邻近CK总产量×100某处理平均产量邻近CK平均产量或×100实例有A、B、C、D、E、F6个玉米品种的比较试验,设标准品种CK,采用3次重复的对比试验设计。
试验结果如下(小区计产面积40 cm2),作分析。
119.398.3100.036.535.736.3平均109.5107.2109.0总和34.537.038.0B34.036.836.4A35.536.537.0CKⅢⅡⅠ各重复小区产量(kg)品种名称玉米品比试验(对比法)的产量结果分析相对生产力107.2109.0×100100.090.485.3100.0106.7111.7100.032.729.525.930.432.434.230.698.088.677.891.297.3102.591.830.532.335.0CK28.329.730.6F23.625.828.4E27.732.930.6CK30.132.035.2D31.035.036.5C29.530.831.5CK3.间比试验设计CK1234CK5678CKCK9101112CK1234CKCK5678CK9101112CK 4.间比法试验结果的统计分析步骤计算各品系的相对生产力某处理在各重复中的小区产量总和、平均数某处理平均产量前后CK平均产量×100相对生产力=计算前后两个对照产量的平均数CK实例有12个小麦新品系鉴定试验,另加一推广品种CK,采用5次重复间比法设计,田间排广品种,采用次重复间比法设计,田间排列在下表第一列基础上按阶梯更替,小区计产面积70m2,每隔4个品系设一个CK,其结果如下,作分析。
4.5 完全区组设计:Friedman 秩和检验
例 某田径队对新入队的学员要进行四个部分的技术训练, 以提高学员的身体素质。为检验这四个部分的技术训练是否确实 有效,随机抽选了14 名新学员,分别接受四个部分的训练。 每个训练结束后,均进行该部分的测试,成绩以 10 分为最高。 检测结果如下表所示:
Z10.0167 Z0.09833 2.13
SE 4 4 5 4 12 3.266. 6 63
比较式 A vs B A vs C A vs D B vs C B vs D C vs D
Ri-Rj的绝对值 15-8=7 15-11.5=3.5 15-5.5=9.5 8-11.5=3.5 8-5.5=2.5 11.5-5.5=6
6(k 1)
这是大样本时基于 Friedman 秩和检验的一个方法.
如果零假设 H 0 为 i 处理和 j 处理没有区别, 那么,双边检验的统计量为 Ri R j .
对于置信水平 ,如果 Ri R j Z * 2 bk (k 1) / 6, 则拒绝零假设,这里
*
总共可比较的对数
4.5 Friedman 检验
Friedman 检验又称弗利德曼 2 检验或弗利德曼 两因素秩方差分析. 它是由 Friedman 于 1937 年提出的,后来又被 Kendall 和 Smith 发展到多元度量的协同系数相关问题上.
它是针对完全区组设计而提出的检验方法.
Friedman 检验的问题是 k 个样本的位置参数 (用1 , 2 , , k 表示)是否相等.
技术训练A
4 1 2 3 1 2 3 3 4 3 3 1 1 2 33
技术训练B
完全随机试验设计方法
任一方向(左、右、上、下)连续抄下18个(两 不同畜舍、不同池塘等划分为单位组。
/kn- C =(942+812+1022)/12-2131. 各组头数不等,应将甲组多余的2头调整1头给乙组 、 1头给丙组。
处理组合:12个 重复:3 区组条件:试验场 用完全随机的方法将试验动物分为四组、五组或更多的组,方法相同。 LSRσ=SSRσ(k,dfe) ×√MSe/r √MSe/r= √0. 处理数以不超过20为宜 各组头数不等,应将甲组多余的2头调整1头给乙组 、 1头给丙组。 00b 2.
首先从随机数字表中任意一个随机数字开始 ,向 仍用随机的方法进行调整。
0 14 21 3
3
6 55 1
1 15 76 4
4
7
6
0
0 16 33 3
3
8 88 4
4 17 50 2
2
9 77 5
5 18 25 1
1
组别 编号
Ⅰ3
组别 编号
6 13 18 95 Ⅰ 3
6 18
Ⅱ 11 17
3 Ⅱ 11 13 17
Ⅲ 4 14 16
Ⅲ 4 14 16
Ⅳ 8 10 15
Ⅳ 8 10 15
【例】不同中草药饲料添加剂对猪增重的效果
添加剂
区组(母猪) Ⅰ Ⅱ ⅢⅣ
A
4
6
14 20
B
3
10 12 17
C
5
7
13 19
D
2
8
15 16
E
1
试验设计:区组设计
平衡不完全区组设计, Balanced incomplete block design, BIB设计
(3)b v, r k.
处理数超过区组数的 BIB设计是不存在的。
附表9(P401)对 4 v 10, r 10 给出了一些BIB设计表。 附表使用方法见书本P90 例3.2.1,例3.2.2
j 1 b
,v
它们之间的差异受到区组间差异的影响,故按 传统的公式计算处理平方和已经不再适合,下 面用最小二乘法来获得SA ,为此先计算误差平 方和Se。
误差平方和Se可从最小二乘的剩余平方和获得:
Se min nij ( yij i j ) 2
i 1 j 1 v b
方差分析
一、区组是试验设计的基本原则之一。
几点注释
错误结 论是因 为没有 重视区 组设计 而造成 的!
二、把区组看成另一个因子,有争议。
三、随机效应问题
• 在实际中,处理效应和区组效应可能是随机的: 1)仅仅处理效应是随机的; 2)仅仅区组效应是随机的; 3)处理效应和区组效应都是随机的 这一类问题的处理将放在下一章“两因子试 验的统计模型”详细叙述。
统计模型及其参数估计
平衡不完全区组设计只适用于处理和区组 间无交互作用的试验问题。其统计模型是:
平衡不完全区组设计和随机化完全区 组设计模型相同,差别仅在于BIB设计中 不是每个区组都包含所有处理。
考虑到BIB设计是“不完全的”,不是 对所有(i,j)做试验,关联矩阵N会起到区分 作用。 下面先求处理效应i的最小二乘估计。
假如每个区组都包含着每个处理(区组大小正好等于处 理个数a),成为随机化完全区组设计。
若区组大小小于处理个数a,这样的设计被称为随机化 不完全区组设计。
4.9 不完全区组设计:Durbin 检验
1. 建立检验问题
Durbin 检验的假设如下: H 0 : 1 2 k . H1 : 不是所有的位置参数都相等.
这里 d1 k 1, d 2 bt b k 1. 最近的一些研究表明,DF 比 Da 更精确.
例 4.3 比较四种材料(k 4)在四个部位(b 4)的磨损.
区组
I
处理
II 28 30
III 36
IV
A B
34 36
45
C
D
40
44
48
54
60
59
解:建立假设检验 H 0 : 1 2 3 4 . H1 : 不是所有的位置参数都相等.
2
性水平临界值 F 6, 8 3.58. 相同.
D 小于其 5% 显著性水平临界值 12.59,DF 大于其 5% 显著
小样本下后者更准确,所以几种冰淇淋受欢迎程度不完全
两处理间的多重比较: 自由度为 bt b k 1 8 的 t1 / 2 2.306. 所以 rt (t 1) t1 / 2 (n(t 1) Da ) 6(nt n k 1)
r t 1 1 k 1 k b 秩总平均为 Ri Rij . k i 1 k i 1 j 1 2
k 个处理的秩和在 H 0 下是非常接近的,
当某处理效应大时,则反映在秩上,其秩和与总平均之间 的差异也较大,于是可以构造
Durbin 检验统计量为 12( k 1) k r (t 1) D Ri 2 rk (t 1) i 1 2
箱线图是利用数据中的五个统计量
1.箱线图是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与
最大来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息。
下四分位数 (QL)等于该样本中所有数值由小到大排列后第25%的数字。
中位数等于该样本中所有数值由小到大排列后第50%的数字。
上四分位数 (QV)等于该样本中所有数值由小到大排列后第75%的数字。
极小值等于该样本中所有数值由小到大排列后最小的数字。
极大值等于该样本中所有数值由小到大排列后最大的数字。
2.Kruskal-Wallis秩和检验,正态记分检验,Jonckheere-Terspstra检验。
完全区组设
计(Friedman秩和检验,关于二元响应的Cochran检验,Page检验,Kendall协同系数检验)。
不完全区组设计(Durbin检验)
3. 1.假设组(x,y)①H0:X与Y不相关—H1:X与Y相关②H0:X与Y不相关—H1:X与
Y正相关③H0:X与Y不相关—H1:X与Y负相关。
2.检验统计量:Ri-Xi在X中的秩,Si-Yi在Y中的秩。
(公式) Rs(1完全正相关,-1完全负相关,0不相关,越接近1相关程度越高,越接近0相关程度越低)。
3.判断:双侧:2p<α拒绝,单侧:p<α拒绝。
随机完全区组设计
随机完全区组设计的设计特点是每个区组的受试对象数与处理组数相等,区组内的受试对象生物学特性较均 衡,可减少实验误差,提高统计假设检验的效率,是对完全随机设计的改进,但分组较繁。其数据统计分析方法 常用随机完全区组设计方差分析或Friedman秩和检验,可分析出处理组与配伍组2因素的影响。
概念
具体做法 配组原响实验结果的属性配组(非随机),如按动物的性别、体重配组,按病 人的年龄、职业、病情配组等。
配组的原则是属性相同或相近的分在同一区组内,共形成若干个区组,再分别将各区组内的受试对象随机分 配到各处理组中。
1)把试验单位分成a个处理和b个区组,每个处理在一个区组内仅出现一次;
如从随机数字表中第6行第9列起向下读取4个随机数为39、74、00、99,排列后的序号(R)为2、3、1、4, 如规定组别A、B、C、D对应的序号(R)为1、2、3、4,则第一个区组4头动物的组别顺序为B、C、A、D。其余3个 区组的随机分组方法类推,本例各区组分组结果见表1。
如果该动物实验又分甲、乙、丙、丁4种不同的处理方法,哪种方法用哪组动物呢?仍可用随机数字表进行分 配。对应甲、乙、丙、丁分别抄录4个随机数字,将4个随机数字按大小顺序排序号(R),再按序号规定甲、乙、 丙、丁分别对应的组别。
随机区组设计在临床观察和实验研究中是最常用的一种设计。多组实验中凡能做到划分区组的都应尽量采取 随机区组设计方法。
实例分析
例1
例2
将16头动物随机分为4组。
先将16头动物称重后,按体重由小到大依次编号为1,2,…,16,再把体重相近的每4头动物配成一个区组, 共形成4个区组。
从随机数字表中任意一行一列作起点顺序取4个两位随机数字,对应于第一个区组的4头动物,然后将随机数 字在同一区组内由小到大顺序排列得序号(R),再按序号大小规定组别。
4.1-Kruskal-Wallis-秩和检验(共42张)
xij ai ij , i 1, 2, , k,j 1, 2, , ni
其中 xij 表示第 i 个处理的第 j 个重复观测值,ni 表示第 i 个处理的 观测样本量.
第10页,共42页。
假设有 k 个总体 F x i ,i 1, 2, , k,即 k 个处理(水平),
k
• 样本独立地分别从各自的总体中抽取,并记 N ni . i 1
• 数据的测量层次至少在定序尺度上.
第14页,共42页。
完全随机设计数据形态
总体 1
总体 2
重
x11
x21
复
x12
x22
测
量
x1n1
x2 n2
其中 xij 表示第 i 个处理的第 j 个观测值.
总体 k xk1 xk 2
xknk
记第 i 个样本的第 j 个观测值 xij 的秩为 Rij .
ni
对每一个样本的观测值的秩求和,得到 Ri Rij , i 1, , k.
j 1
再找到它们在每组中的平均值
Ri
Ri ni
.
所有数据混合后的秩和为 R 1 2 ... N N (N 1) 2,
秩平均为 R (N 1) 2.
H1 : Fi (x) F (x i ) i 1, 2,..., k
( k 个总体位置不同)
这里 F 是某连续分布函数,而且这些位置参数 i 并不全部相同.
第16页,共42页。
这个问题也可以写成线性模型的形式. 假定有 k 个样本(总体),各样本(总体)的样本量为 ni ,i 1, 2, , k. 那么,观测值可以写成下面的线性模型:
xij i ij , i 1, 2, , k,j 1, 2, , ni
4.5 完全区组设计:Friedman 秩和检验解析
k
b
k 1 k 1 . 12
• Friedman 检验统计量 Q 为: SSt 12 k 2 2 Q Ri b bk (k 1) 4 . Var Rij (k 1)(k 1) i 1
• Friedman 建议用 k 1 k 乘 Q 得校正式 Q.
k 个样本是匹配的,可以由 k 个条件下同一组受试者构成, 也可以将受试者分为 n 组,每组均有 k 个匹配的受试者, 随机地将 n 组受试者置于 k 个条件下.
在不同受试者匹配的样本中,应尽量使不同受试者的有关 因素匹配即相似.
1. 建立假设检验
假设检验问题:
H0 : 1 2 ... k H1 : 不是所有的位置参数都相等.
3. 作出决策
对于有限的 k 和 b,有零假设下的分布表可查, Q 查的时候要作变换 W . b k 1
当查不到时,可用自由度为 k 1的 2 分布近似. 对于固定的 k,当 b 时,在零假设下有 Q ~ 2 (k 1).
4. 小结
检验步骤: ( 1 )提出假设 H 0: k 个样本间无显著差异. H1: k 个样本间有显著差异. (2)计算检验统计量 Q. (3)作出决策
2 当 Q (k 1) 时,在水平 上拒绝 H 0; 2 当 Q (k 1) 时,不能拒绝 H 0 .
当数据有相同秩时,秩取平均值, 在某区组存在结时,此时需要对 Q 统计量进行修正: Q Qc . k b ( i3, j i , j ) 1 i 1 j 1 2 bk (k 1) 其中 i , j 为第 j 个区组的第 i 个结统计量 .
Friedman 检验统计量为:
4.4 区组设计数据分析回顾
但在实际问题中,并不一定能够保证每一个区组都能有对应的 样本出现(即不一定把每一个处理分配到每一个区组中), 这样就产生了不完全区组设计.
当处理组非常大,而同一区组的所有样本数又不允许太大时, 在一个区组中可能不能包含所有的处理, 此时只能在同一区组内安排部分处理. 即 不是所有的处理都被用于各区组的试验中,这种区组设计称为 不完全区组设计(incomplete block ).
这里仅考虑对于每对 i, j 只有一个观测值的情况.
假设检验问题为 H 0 : 1 2 k H1 : i, j,i j .
如果随机地把所有处理分配到所有的区组中, 使得总的变异可以分解为: (1). 处理造成的不同; (2). 区组内的变异; (3). 区组之间的变异.
.
统计量 F 在 H 0 下的分布为自由度为 b 1, k 1 b 1 的 F 分布.
若 F F b 1, k 1 b 1 ,则考虑拒绝零假设 H 0 .
随机化完全区组设计的基本使用条件如下:
(1) 试验材料为异质,试验者根据需要将其分为几组,几个性质 相近的试验单位为一区组 (如一个人的血液分成四份,此人即为 同一区组,不同人为不同区组),使区组内试验个体之间的差异 相对较小,而区组之间的差异较大;
平衡的不完全区组设计 BIBD k , b, r , t , 满足下面条件: (1). 每个处理在同一区组中最多出现一次; (2). t k ( t 为每个区组设计的样本量, t 小于处理个数 k ); (3). 每个处理都出现在相同多的 r 个区组中; (4). 每两个处理在一个区组中相遇次数一样 次 .
区组数据的影响,这时非参数检验情形适用于多个相关样本情形.
生化实验 设计试验--PAGE
生 物 化 学 实 验
生命科学学院
3、过硫酸铵 5、Acr 10.0g 6、蔗糖 40.0g
4、1mol/L盐酸48 mL Tris 5.98g TEMED 0.48 mL
7、电极缓冲液Tris 6.0克;甘氨酸 28.8克;加水到1L 用时稀释10倍
Exit
生命科学学院
设计试验
实验步骤
生 物 化 学 实 验
一、样品的提取 二、PAGE电泳 三.结果分析
生命科学学院
生 物 化 学 实 验
Exit
设计试验
生 物 化 学 实 验
Exit
生命科学学院
设计试验
生 物 化 学 实 验
Exit
生命科学学院
设计试验
生 物 化 学 实 验
Exit
生命科学学院
设计试验
试剂
生 物 化 学 实 验
1、1mol/L盐酸48.0 mL Tris 36.6g TEMED 0.24 mL 2、Acr 28.0g Bis 0.753g 0.14- 0.3g Bis 2.5g
Exit
生命科学学院
设计试验
生 物 化 学 实 验
Exit
生命科学学院
设计试验
(⑶电位梯度的不连续性。电位梯度的高低与电泳速 度的快慢有关( V=mE) , 迁移率低的离子在高电位梯度中 可以与迁移率高而处于低电位梯度的离子具有相应的速度 (即E高m慢=E低m快),电泳开始后 ,由于快离子迁移率最 大,就会很快超过蛋白质,因此在快离子后面形成一个离子浓 度低的区域,即低电导区,电场强度与电导成反比关系:I=Eη, 式中 E为电场强度 ,I为电流强度 ,η为电导率 ,E与电导率成反 比,所以低电导区就有了较高的电位梯度。这种高电位梯 度使蛋白质和慢离子在快离子后面加速移动。在快离子和 慢离子的移动速度相等的稳定状态建立之后,则在快离子 和慢离子之间形成一个稳定而又不断向阳极移动的界面。 由于蛋白质的有效迁移恰好介于快、慢离子之间,因此也就 聚集在这个移动的界面附近 ,被浓缩形成一个狭小的中间层。 由于浓缩胶为大孔胶, 对样品没有分子筛作用。
非参数统计第四章多样本数据检验
第四章多样本数据检验在参数检验中,我们常常对三个或三个以上的总体的均值进行相等性检验,使用的方法是方差分析。
方差分析过程需要假定条件,F检验才有效。
可有时候所采集的数据常常不能满足这些条件。
像两样本比较时一样,我们不妨尝试将数据转化为秩统计量。
在非参数分析中也会遇到同样的问题,检验多个总体的分布是否相同。
更严密的说,当几个总体的分布相同的条件下,讨论其位置参数是否相等。
因为秩统计量的分布与总体分布无关,可以摆脱总体分布的束缚。
第一节 Kruskal-Wallis检验正态总体:第一节 Kruskal-Wallis检验基本原理:与处理两样本位置检验的W-M-W方法类似,将多个样本混合起来求秩,如果遇到打结的情况,采用平均秩,然后再按样本组求秩和。
将 k 组数据混合,并从小到大排列,列出等级,如有相同数据则取平均等级,如果原假设为不真,某个总体的位置参数太大,则其观测值也倾向于取较大的值,则该总体的观测值的秩和也会偏大。
一般总体:检验方法计算第i组的样本平均秩:对秩依照正态总体中MST的结构,得到Kruskal-Wallis的H统计量:在零假设情况下,H近似服从,当的时候拒绝零假设,p值为P(H≥h)。
大样本近似[例]为研究4种不同药物对儿童咳嗽的治疗效果,将25个体质相似的病人随机分为4组,各自采用A/B/C/D四种药物进行治疗,假定其他条件均保持相同。
5天后测量每个病人每天咳嗽次数如下,试比较这4种药物的治疗效果是否相同。
多重比较对比其中每两组差异的时候,用Dunn(1964)年提出用:其中如果那么表示i和j两组之间存在差异,,为标准正态分布分位数。
本节软件的注kw3>.test=function(m1=5,m2=5,m3=4,Hvalue=9.4114){m<-m1+m2+m3;Jh5=function(m){a<-rep(0,5);for(i in 1:(m-4)){for(j in (i+1):(m-3)){for(k in (j+1):(m-2)){for(l in (k+1):(m-1)){for(f in (l+1):m){a<-rbind(a,c(i,j,k,l,f))}}}}};a[2:nrow(a),]};JTid1<-Jh5(m1+m2+m3);n1<-nrow(JTid1);JTid2<-Jh5(m2+m3);n2<-nrow(JTid2);nn<-n1*n2;const<-1:m;y<-0;for(i in 1:n1){for(j in 1:n2){temp1<-c(JTid1[i,]);temp2<-(const[-temp1])[c(JTid2[j,])];temp3<-const[-c(temp1, temp2)];y<-c(y,12/(m*(m+1))*((sum(temp1))^2/m1+(sum(temp2))^2/m2+(sum(temp3))^2/m3)-3*(m+1))}};y<-y[2:(nn+1)];pvalue<-(sum(y>=Hvalue))/nn;y<-sort(y) ;aaa<-aa<-y[1];tempc<-1;for(i in 2:nn){if ((y[i]-aa)>10^{-12}){aaa<-c(aaa,y[i]);aa<-y[i];tempc<-c(t empc,1-(i-1)/nn)}};out<-cbind(aaa,tempc);List(c(;(m1,m2,m3); =c(m1.m2,m3), ;H; =Hvalue, ;pval; =pvalue),out)}改进kw.test=function(m1=5,m2=5,m3=4,Hvalue=9.4114){m<-m1+m2+m3;Jh5=function(m){a<-rep(0,5);for(i in 1:(m-4)){for(j in (i+1):(m-3)){for(k in (j+1):(m-2)){for(l in (k+1):(m-1)){for(f in (l+1):m){a<-rbind(a,c(i,j,k,l,f))}}}}};a[2:nrow(a),]};JTid1<-Jh5(m1+m2+m3);n1<-nrow(JTid1);JTid2<-Jh5(m2+m3);n2<-nrow(JTid2);nn<-n1*n2;const<-1:m;y=matrix(0,ncol=nn, nrow=1)for(i in 1:n1){for(j in 1:n2){temp1<-c(JTid1[i,]);temp2<-(const[-temp1])[c(JTid2[j,])];temp3<-const[-c(temp1,temp2)];y[(i-1)*n2+j]<-12/(m*(m+1))*((sum(temp1))^2/m1+(sum(temp2))^2/m2+(sum(temp3))^2/m3)-3*(m+1)}};pvalue<-(sum(y>=Hvalue))/nn;y<-sort(y);aaa<-aa<-y[ 1];tempc<-1;for(i in 2:nn){if ((y[i]-aa)>10^{-12}){aaa<-c(aaa,y[i]);aa<-y[i];tempc<-c(t empc,1-(i-1)/nn)}};out<-cbind(aaa,tempc);list(c(;(m1,m2,m3); =c(m1.m2,m3), ;H; =Hvalue, ;pval; =pvalue),out)}第二节正态记分检验*本节软件的注第三节 Jonckheere-Terpstra 检验在上一节中,我们只是考虑了备选假设无方向时的秩检验法,而在实际中有许多问题,其备选假设可能是有方向的。
完全随机区组设计
注意:本部分须列出统计模型或统计检验假设、SPSS步骤、关键结果及结果分析和结论。
9、表3是10个病人分别服用Dextro-和Levo-两种安眠药的试验结果,睡眠时间(小时)的测量值均以没有服药之前的睡眠时间为基准,试对比两种药物的催眠效果。
(共10分)表3病人Dextro- Levo-1 0.7 1.92 -1.6 0.83 -0.2 1.14 -1.2 0.15 -0.1 -0.16 3.4 4.47 3.7 5.58 0.8 1.69 0.0 4.610 2.0 3.4假设H0:两种药物的催眠效果一样。
H1:两种药物的催眠效果存在差异。
分析→比较均值→独立样本T检验,检验变量选择“催眠结果”,标识变量“安眠药种类”到分组变量中,得出结果如下。
从上述独立样本t 检验结果可以得出,莱文方差等同性检验中p=0.441>0.05,不拒绝原假设,则在假定等方差的情况下,显著性(双尾)0.079大于0.05,两组平均值差异不显著,说明安眠药种类对于催眠效果无显著差异。
10、表4是5种大麦栽培试验的产量数据,试验采用完全随机区组设计,随机选取了12个不同的地方来种植这5种大麦。
表4 5种大麦的产量数据区组品种1 2 3 4 51 81 105.4 119.7 109.7 98.32 80.7 82.3 80.4 87.2 84.23 146.6 142.0 150.7 191.5 145.74 100.4 115.5 112.2 147.7 108.15 82.3 77.3 78.4 131.3 89.66 103.1 105.1 116.5 139.9 129.67 119.8 121.4 124.0 140.8 124.88 98.9 61.9 96.2 125.5 75.79 98.9 89 69.1 89.3 104.110 66.4 49.9 96.7 61.9 80.311 86.9 77.1 78.9 101.8 96.012 67.7 66.7 67.4 91.8 94.1(1)请分析这5个品种的大麦产量是否存在显著差异?(6分)(2)如果存在显著差异,哪个或者哪几个品种的大麦产量较高,并且与其他品种的产量存在显著差异?(6分)假设:H0:a0=a1=a2=a3=a4=a5=0,各个品种对大麦产量无显著差异。
4.8 完全区组设计:Page 检验
L E ( L) 55 48 7 2 故 ZL 2.4749. 4 D ( L) 2 2 计算 p 值为 0.0067. 故在 5%的显著性水平下,拒绝零假设.
或者由于 u10.05 1.65 Z L,故拒绝零假设,存在上升趋势.
Page 检验还可以很容易地推广到每一个 i, j 位置有任意多 的观测值 nij 的情况. 并且简单地对每一个区组对观测值排序. 这里所必需的假设是:不存在区组和处理的交互作用.
例 4.2 在不同的城市对不同的人群进行血液中铅含量的测试, 一共有 A, B, C 三个城市,代表着三种不同的处理 (k 3). 对试验者按职业分成四组 (b 4) 取血. 他们血铅含量如下表所示:
区组(职业)Βιβλιοθήκη 处理(城市)I 80 52 40
II 100 76 52
III 51 52 34
L iRi .
i 1
k
• 每一项乘以 i 的原理在于: 如果备择假设 H1 正确,可以放大备择假设 H1 的效果.
注:在总体分布为连续的条件下,如果没有打结, 则该检验是和总体分布无关的.
Page 检验统计量的性质
bk (k 1)2 b(k 3 k )2 E ( L) ;D( L) . 4 144(k 1)
此时 Page 检验统计量的大样本近似:
当 k 固定, b 时,在零假设下有正态近似: ZL L E ( L) N (0,1) D( L)
IV 65 53 35
A B C
试判断对于显著性水平 0.05, 不同汽车密度的城市居民的血铅含量是否一样.
解:建立假设检验 H 0 : 1 2 3 H 1 : 1 2 3 .
医学统计学案例分析(1)
案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。
经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。
表1-4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7西药 6(8.67)7(4.33)1346.2合计1892766.7【问题1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】(1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。
(2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。
(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。
当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率案例分析-卡方检验(一)【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。
该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。
【问题1-1】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。
(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IV 65 53 35
A B C
试判断对于显著性水平 0.05, 不同汽车密度的城市居民的血铅含量是否一样.
解:建立假设检验 H 0 : 1 2 3 H 1 : 1 2 3 .
为了符号简单起见,把第一个城市 A 和第三个城市 C 对调. 于是检验成为 H 0 : 1 2 3 H 1 : 1 2 3 .
Page 检验统计量的大样本近似
当 k 固定, b 时,在零假设下有正态近似: L E ( L) ZL N (0,1) D( L)
有结数据情形
在区组内有打结的情况下,D L 作如下修正: D( L) k (k 2 1)
3 bk (k 2 1) ij ij i j
此时 Page 检验统计量的大样本近似:
当 k 固定, b 时,在零假设下有正态近似: ZL L E ( L) N (0,1) D( L)
4.8 完全区组设计:Page检验
• 对于完全区组设计数据,也可以进行趋势性检验, 进行类似于 Jonckheere Terpstra 检验的 Page 检验.
1. 建立假设检验
H0 : 1 2 k . H1 : 1 2 k .
2. 选择检验统计量
• 与 Friedman 检验统计量一样, 首先 在每个区组中,对各处理排序; 然后 对每个处理把观测值在各区组中的秩累加, 得到 Ri , i 1, 2, , k; 最后构造统计量:
L 如果备择假设 H1 正确,可以放大备择假设 H1 的效果.
注:在总体分布为连续的条件下,如果没有打结, 则该检验是和总体分布无关的.
Page 检验统计量的性质
bk (k 1)2 b(k 3 k )2 E ( L) ;D( L) . 4 144(k 1)
例 4.2 在不同的城市对不同的人群进行血液中铅含量的测试, 一共有 A, B, C 三个城市,代表着三种不同的处理 (k 3). 对试验者按职业分成四组 (b 4) 取血. 他们血铅含量如下表所示:
区组(职业) 处理(城市)
I 80 52 40
II 100 76 52
III 51 52 34
L E ( L) 55 48 7 2 故 ZL 2.4749. 4 D ( L) 2 2 计算 p 值为 0.0067. 故在 5%的显著性水平下,拒绝零假设.
或者由于 u10.05 1.65 Z L,故拒绝零假设,存在上升趋势.
Page 检验还可以很容易地推广到每一个 i, j 位置有任意多 的观测值 nij 的情况. 并且简单地对每一个区组对观测值排序. 这里所必需的假设是:不存在区组和处理的交互作用.
在表中加上各处理在每个区组(职业) 中的秩,得
区组(职业) 处理(城市)
I
40(1) 52(2) 80(3)
II
52(1) 76(2) 100(3)
III
34(1) 52(3) 51(2)
IV
35(31) 53(2) 65(3)
Ri
4 9 11
C B A
可以得到 R1 4, R2 9, R3 11,而且 L 4 2 9 3 11 55.
查表得,对于 k 3, b 4,P L 55 0.00694. 即精确检验 p 值为 0.00694.
对于水平 0.05,可以拒绝零假设. 也就是说,不同汽车密度的城市居民的血铅含量的确不一样.
方法二:应用正态分布近似 nk (k 1) 2 4 3 42 由于 E ( L) 48, 4 4 n(k 3 k ) 2 4 (33 3) 2 242 D ( L) 8. 144(k 1) 144 2 72
144(k 1)
.
这里 ij 为第 j 个处理中及第 i 个结中的观测值个数(结统计量). i 1, 2, , e k.
3. 作出决策
对于一部分 k, b 和 的值,可以由查表来得到在零假设下 的临界值 c, 满足 P L c .
可利用正态分布近似计算 p 值.
对于所有 i, j 位置的观测值都相等 nij n , 大样本时的近似正态统计量的 E ( L) 和 D( L) 为 nbk (k 1)(nk 1) E ( L) ; 4 3 nbk (n 2 k 2 1) ij ij i j D( L) nk (k 2 1) . 144(k 1)