秩转换非参数检验
公布规划-第八章秩转换的非参数检验
假设:M=45.3 求差、编秩、求和
查表:n=11、T=1.5,P<0.005,差别有统 东部 西部 北部
第一季度 第二季度 第三季度 第四季度
20.4
27.4
90
20.4
30.6
38.6
34.6
31.6
45.9
46.9
45
43.9
计学意义,可认为该厂工人的尿氟含量
高于当地正常人的尿氟含量。
**第二节 两个独立样本 比较的Wilcoxon秩和检验
本含量相等的资料)
补充2、各实验组与对照组 比较的秩和检验
1、各样本秩和从大到小排列
2、q | RT RC | sRT RC
n(na)(na 1)
s RT RC
6
3、查表下结论(此法仅适用于各组样本含量相
等的资料)
结束
7
29.0
9
36.0
12
—
38
—
5
6.5
1
9.0
2
12.5
3
18.0
5
24.0
8
—
19
—
5
*一、多样本比较的秩和检验
1.建立检验假设: H0:三个处理组总体分布相同; H1:三个总体的分布不同或不全相同。 =0.05。
2.计算 编秩:将各组由小到大排队,再将三个组的数据统一
编秩。 编秩中,
若有相同的数据在同一组内,其秩次按位置顺序编号; 若相同的数据在不同组内,则取其平均秩次。
20 10 48 2 -2 0 15 13 31 6 -36 5 T =54.5 T
8 5 11 1.5 -1.5
7 6 9 4 -10 3 =11.5
秩转换的非参数检验正式文稿演示
0 0 0.2 2.8 0 0 0.3 7.4 0 0 0.4 13.0 0 0 0.4 0 0 0.9
0 1 5.5
0 0 0.9
X1=? S1=? M1=0.6
X2=1.06 S2=2.72 M2=0
问题二
例:两医院26例RA患者血清lgG抗体测定结果
甲医院(n1=26)
乙医院(n2=26)
- + + +++
15 13 31 6 -36 5
正态性检验: 概率图(probality-probality plot,P-P plot)
Normal P-P Plot of 差值
1.00
.75
.50
.25
0.00
0.00
.25
.50
Observed Cum Prob
.75
1.00
数据点不为直线, 并未分布在线上, 提示本资料不为 正态.
10 40 160 1280
- + ++ +++
10 40 160 1280
- + ++
10 80 320
- + ++ - + ++
10 80 320 20 80 640
+ + ++
20 80 640
+ + ++ + + +++
20 80 640 40 160 640
X1=? S1=? M1=?
X2=? S2=? M2=?
等)的资料(必选); 等级资料: 若选行×列表资料的χ2检验,只能推断构成
秩转换的非参数检验
(2)正态近似法u 检验 如果n超出附表10范 围,则用以下公式计算u值,进行u检验:
u T n1 (n1 n2 1) / 2 t 3 t j) ( j n1n2 (n1 n2 1) 1- 3 12 N N
( t C 1-
3 3 j
二、两组频数表或等级资料比较
例8-4 39名吸烟工人和40名不吸烟工人的碳氧血红蛋 白HbCO(%)含量见表8-6。问吸烟工人的HbCO(%)含量 是否高于不吸烟工人的HbCO(%)含量?
表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较 含量 吸烟 不吸烟 合 秩次 平均 秩和 工人 工人 计 范围 秩次 吸烟 不吸烟
(3)计算正负秩和: T = 54.5, T = 11.5 (4)确定检验统计量T 任取T 和 T 为T ,本例取T =11.5。 3.确定P 值,作出推论: (1) n≤50,查表法。本例n=11,查附表9得 T0.05, 为 ~56, 11 10
本例11.5在此范围内,故P >0.05,按α =0.05 水准,不拒绝Ho 还不能认为两法测定结果有差别。 (2) n>50,u 检验。
第八章
秩转换的非参数检验
非参数检验的概念: 非参数检验是指对原始资料无特殊要求(如正 态分布、总体方差相等)的一类检验方法,它不 是比较参数,而是比较分布的位置。不符合t 检验 和F检验的数值变量资料可用秩和检验,此外,秩 和检验还可用于两组或多组等级资料以及“开口” 资料的比较。等级相关也属于非参数检验。
表8-9 三种药物杀灭钉螺的死亡率(%)比较 甲药 乙药 丙药 死亡率 秩次 死亡率 秩次 死亡率 秩次 32.5 10 16.0 4 6.5 1 35.5 11 20.5 6 9.0 2 40.5 13 22.5 7 12.5 3 46.0 14 29.0 9 18.0 5 49.0 15 36.0 12 24.0 8 63 ─ 38 ─ 19 Ri ni 5 ─ 5 ─ 5
8.秩转换的非参数检验-10.14
11.5
一、配对样本差值的中位数和0比较 配对样本差值的中位数和 比较
附表9 T 界值表(配对比较的符号秩和检验用) 界值表(配对比较的符号秩和检验用) 单侧:0.05 0.025 0.01 0.005 N 双侧:0.10 0.05 0.02 0.010 5 0-15 .-. .-. .-. 6 2-19 0-21 .-. .-. 7 3-25 2-26 0-28 .-. 8 5-31 3-33 1-35 0-36 , 9 8-37 n=11,T=11.5 3-142 5-140 1-44 查表法: ①查表法: 10 10-45 8-47 5-50 3-52 11 13-53 10-56 7-59 5-61 当 n≤50 时 , 根 据 n 和 12 17-61 13-65 9-69 7-71 T 查 T 界值表 ( 附表 界值表( 13 21-70 17-74 12-79 0.05<P<0.10,按照 水准, 9-82 ,按照α=0.05水准,不 水准 14 25-80 21-84 15-90 12-93 9)。 ) 拒绝H30-90 拒绝 0,尚不能认为两组测定结果有 15 25-95 19-101 15-105 16 35-101 29-107 23-113 19-117 差别。 差别。 17 41-112 34-119 27-126 23-130 18 47-124 40-131 32-139 27-144 若统计量T值在某 界值范围内, 53-137 相应概率; 值在某T界值范围内 若统计量 值在某 界值范围内,P值 > 相应概率; 37-153 值 19 46-144 32-158 60-150 43-167 37-173 值恰好等于界值, 值 20相应概率; 若T值恰好等于界值,P值 = 相应概率; 52-158 值恰好等于界值 . . . . . . . . . 值在界值范围外, 值 相应概率。 若T值在界值范围外,P值 <. 相应概率。 值在界值范围外 50 466-809 434-841 397-878 373-902
秩转换的非参数检验
秩转换的非参数检验基本概念1.参数检验方法(parametric test):总体分布类型已知的条件下对其参数进行估计或检验。
(如t-test, F- test)2.非参数检验方法(nonparametric test):一种不依赖总体分布的具体形式,也不对参数进行估计或检验的统计方法来分析此类资料这种方法不受总体参数的影响,检验的是分布或分布位置,而不是参数。
这样的检验方法称为非参数检验(如基于秩次的检验)3.秩次(rank)):秩统计量,是指全部观察值按某种顺序排列的位序。
在一定程度上反映了等级的高低。
4.秩和(rank sum):同组秩次之和。
在一定程度上反映了等级的分布位置非参数检验的优缺点:优点:无严格的条件限制,且多数非参数统计方法较为简单,易于理解和掌握,应用范围广缺点:对适宜参数统计的资料,若用非参数统计处理,常损失部分信息,降低检验效能。
总结:因此对适合参数统计条件的资料或经变量变换后适合参数统计的资料,应最好用参数统计。
但资料不具备用参数统计的条件时,非参数统计是很有效的分析方法适用范围:(1)总体分布为偏态或分布形式未知的计量资料(尤其在n<30的情况下)。
(2)等级资料。
(3)个别数据偏大或数据的某一端无确定的数值。
(4)各总体方差不齐。
检验步骤1、检验假设H0:差值的总体中位数Md=0 H1:差值的总体中位数Md≠0 α=0.052、求差值3、编秩:依差值的绝对值从小到大编秩遇差值为0的对子,舍去不计,同时样本量减一遇差值绝对值相等则取平均秩,称为相同秩(ties)然后按差值的正负对秩次冠以正负号4、求检验统计量:任取正秩和或负秩和为T5、确定P值并做出统计推断(查附表9,内大外小原则)正态近似法(n>50时)超出附表9范围,可用正态近似法作u检验。
两样本比较的秩和检验基本思想:如果H0 成立,即两组分布位置相同,则A组的实际秩和应接近理论秩和n1(N+1)/2; (B组的实际秩和应接近理论秩和n2(N+1)/2).或相差不大,差值很大的概率应很小。
秩转换的非参数检验
2)正态近似法:大样本时 (n≥50时), 可按式11-1计算统计量u值,作正态检验:
| T-n(n+1) / 4|-0.5 u=
n(n+1)(2n+1) / 24
(11-1)
如有相同秩次,应用校正公式:
u=
| T n(n 1) / 4 | 0.5
n(n 1)(2n 1) 1
24
48
(t
3 j
Tests of Normality
Kolmogorov-Smirnova
Statistic
差值
.420
df
Sig.
8
.000
a. Lilliefors Significance Correction
Shapiro-Wilk
Statistic
df
.628
8
Sig. .000
Tests of Normality
第八章 秩转换旳非参数检验
癌症. 1997;16(3):219
用改良旳Seldinger’s插管技术对8例临床及病理证明旳恶性滋养细胞 肿瘤进行选择性盆腔动脉插管灌注化疗。治疗前后hCG放免测定值。 采用t检验进行分析,治疗前后血hCG值经统计学处理有明显性差别。
1、资料类型 2、何种设计 3、统计措施
差值对数
Kolmogorov-Smirnova
Statistic df
Sig.
.372
8 .002
Shapiro-Wilk
Statistic df
.559
8
a. Lilliefors Significance Correction
Sig. .000
参数统计
(parametric statistics)
秩转换的非参数检验
参数检验
参数检验方法:t 检验,方差分析; 总体分布假定:各组样本所来自的总体为 正态分布(已知的分布形式),各组样本所 来自的总体方差齐性。
非参数检验
定义:不依赖于总体的分布类型,对样本 所来自总体的分布不作严格假定的统计推 断方法,称为非参数检验(nonparametric test)。直接对总体分布做假设检验。 又称为任意分布检验(distribution-free test)。
(1) 很低 低 中 偏高 高 合计
(2) 1 8 16 10 4
(3) 2 23 11 4 0
(4) 3 31 27 14 4 79
(5) 1~3 4~34 35~61 62~75 76~79 —
(6) 2 19 48 68.5 77.5 —
39(n1) 40(n2)
1917(T1) 1243(T2)
查T界值表。
(3)确定P值,作出结论
若n1≤10且n2-n1≤10,可通过查阅T界值表
(附表10)确定P值;
若两样本量不满足上述条件,则可采用正
态近似法作u检验,按公式(8-2)计算u值。
正态近似法
| T n 1(N 1)/2 | n 1 n 2(N 1) ( t j t j ) ) (1 3 12 N N
(通常取秩和较小者)。
, 较小例数组的秩和 n 1 n 2 T min(R1 ,R 2 ),n 1 n 2
N n1 n2 n0 min( n1 , n2 )
较小例数组的平均秩和为:
n0(1 N)/2
若H0成立,T值应接近 n0(1 N)/2 ,若T值严重偏离
n0(1 N)/2 ,则提示H0可能是不正确的。小样本时,
秩转换的非参数检验
非参数检验是相对于参数检验而言地.参数检验——如果总体分布为已知地数学形式,对其总体参数作假设检验.计量资料——正态分布——假设检验——检验、检验计量资料:不满足参数检验条件地假设检验方法,一变量变换,二非参数检验(等级资料)非参数检验对总体分布不作严格假定(任意分布检验)秩转换————推断一个总体表达分布位置地中位数(非参数)和已知、两个或多个总体地分布是否有差别.秩转换地非参数检验时先将数值变量资料自小到大,或等级资料从弱到强转换成秩后,再计算检验统计量,其特点是假设检验地结果对总体分布地形状差别不敏感,只对总体分布地位置差别敏感.文档来自于网络搜索配对样本比较地符号秩检验符号秩检验符号秩和检验——用于配对样本差值地中位数和比较——用于单个样本中位数和总体中位数比较配对样本差值地中位数和比较———————<—————————————目地是推断配对样本差值地总体中位数是否和有差别——即推断配对地两个相关样本所来自地两个总体中位数是否有差别.平均秩——相同秩—————————————>———————————单个样本中位数和总体中位数比较—————————————————————目地是推断样本所来自地总体中位数和某个已知地总体中位数是否有差别——用样本各变量值和地差值,即推断差值地总体中为数和是否有差别本法地原理()界值表制作地原理()正态近似法地原理第二节两个独立样本比较地秩和检验————————秩和检验()————用于推断计量资料或等级资料地两个独立样本所来自地两个总体分布是否有差别. ——————推断两个总体分布地位置是否有差别.原始数据地两样本比较————计量资料为原始数据频数表资料和等级资料地两样本比较————计量资料为频数表资料,是按数量区间分组————等级资料是按等级分组本法地原理界值表制作地原理正态近似法地原理、检验第三节完全随机设计多个样本比较地检验一、多个独立样本比较地检验————用于推断计量资料或等级资料地多个独立样本所来自地多个总体分布是否有差别.原始数据地多个样本比较————计数资料为原始数据——————————频数表资料和等级资料地多个样本比较————计量资料为频数表资料,是按数量区间分组————等级资料是按等级分组本法地原理界值表制作地原理地近似法原理多个独立样本两两比较地法检验————进一步推断两两总体分布位置不同——————————————————随机区组设计多个样本比较地检验多个相关样本比较地检验————用于推断随机区组设计地多个相关样本所来自地多个总体分布是否相等.、方法步骤————————————————————————————————、本法地原理()界值表制作地原理()近似法地原理————————————>或>——————————、近似法二、多个相关样本两两比较地检验——————进一步推断两两总体分布位置不同秩转换地非参数检验参数检验————如果总体分布为已知地数学形式,对其总体参数作检验假设非参数检验(任意分布检验)————对总体分布不作严格假定,直接对总体分布作假设检验秩转换地非参数检验————推断一个总体表达分布位置地中位数(非参数)和已知、两个或多个总体地分布是否有差别.————先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量.————假设检验地结果对总体分布地形状差别不敏感,只对总体分布地位置差别铭感.应用范围:——————对于计量资料不满足正态和方差齐性条件地小样本资料分布不明地小样本资料一端或两端是不确定数值地资料——————对于等级资料若选行*列表资料地检验,只能推断构成比差别选秩转换地非参数检验,可推断等级强度差别注意:如果已知其计量资料满足(或近似满足)检验或检验条件,当然选检验或检验,因为这时若选秩转换地非参数检验,会降低检验效能.文档来自于网络搜索配对样本比较地符号秩检验(符号秩和检验)————用于配对样本差值地中位数和比较;————用于单个样本中位数和总体中位数比较配对样本差值地中位数和比较————目地是推断配对样本差值地总体中位数是否和有差别——即推断配对地两个相关样本所来自地两个总体中位数是否有差别检验步骤()建立检验假设,确定检验水平()求检验统计量值()确定值,作出推断结论——————————————《时,查界值表——————————————>时,正态近似法作检验注意:配对等级资料采用符号秩和检验最好选用大样本单个样本中位数和总体中位数比较————目地是推断样本所来自地总体中位数和某个已知地总体中位数是否有差别————用样本各变量值和地差值,即推断差值地总体中位数和是否有差别第二节两个独立样本比较地秩和检验————用于推断两个独立样本所来自地两个总体分布是否有差别.————目地是推断两个总体分布地位置是否有差别、原始数据地两样本比较——————————《和《时,查界值表——————————> 或> 时,用正态近似法作检验频数表资料和等级资料地两样本比较————计数资料为频数表资料,是按数量区间分组————等级资料是按等级分组第三节完全随机设计多个样本比较地检验一、多个独立样本比较地检验————用于推断计量资料或等级资料地多个独立样本所来自地多个总体分布是否有差别.、原始数据地多个样本比较—————————————————或————查界值表———————且最小样本地例数大于或>时,查界值表、频数表资料和等级资料地多个样本比较二、多个独立样本两两比较地法检验————————————进一步推断两两总体分布位置不同第四节随机区组设计多个样本比较地检验一、多个相关样本比较地检验————用于推断随机区组设计地多个相关样本所来自地多个总体分布是否有差别.————————————————《和《时,查界值表————————————————>或>时,用近似法多个相关样本两两比较地检验——————进一步推断两两总体分布位置不同————检验。
秩转换的非参数检验课件.ppt
(parametric statistics)
已知总体分布类型,对
未知参数(μ、π)进
行统计推断
依赖于特定分布类 型,比较的是参数
非参数统计
(nonparametric statistics)
对总体的分布类 型不作任何要求
不受总体参数的影响, 比较分布或分布位置
适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
本例:本例,n=11,T=11.5,查附表9,得双侧 0.05≺P≺0.10,按α=0.05水准不拒绝H0,尚不能认
为两法测谷-丙转氨酶结果有差别。
(ii)大样本(n>50)时,可采用正态近似
Tn(n1)/4
u
n(n1)(2n1) (t3j tj)
24
48
n是对子数,tj为第j个
相同秩次的个数。
A组:- ± + + + ++
12 3 4 5 7
1 2 4.5 4.5 4.5 8.5
B组:
+ ++ ++ ++ +++ +++
6 8 9 10 11 12
4.5 8.5 8.5 8.5 11.5 11.5
秩和
A组: - 、、+、+、+、 ++ 秩和: 1 2 4.5 4.5 4.5 8.5 TA=25
1.5 3 4 5 6 7 8 9 10 11 64.5
负 秩 (4) 1.5
1.5
解: 1.检验假设和检验水准: H0:该厂工人尿氟含量的总体中位数M=45.30 H1:M>45.30 α=0.05 2.编秩、求统计量T: 所有观察值与总体中位数45.30之差,按绝对值由小到 大编秩,绝对值相同取平均秩次,然后分别计算正负秩 次之和,即表8-2第(3)、(4)栏。
秩转换非参数检验
其总体参数作假设检验。
如: t 检验和 F 检验 。
非参数检验
➢对总体分布不作严格假定,又称任意分
布检验(distribution-free test),
它直接对总体分布作假设检验。
a
3
秩转换的非参数检验
➢ 推断一个总体表达分布位置的中位数M (非参数)和已知M0、两个或多个总体的分 布是否有差别。
用 Wilcoxon 符号秩检验。
a
21
检验步骤
H 0: 尿 氟 含 量 的 总 体 中 位 数 M 45.30 H 1: M 45.30
0.05
据表8-2第(3)、(4)栏,取T=1.5。
有效差值个数n11。据n11和T1.5查 附表9(P534) , 得单侧P0.005, 按 0.05 水 准拒绝H0,接受H1,可认为该厂工人的尿氟 含量高于当地正常人的尿氟含量。
合计
(1)-45.30
(2)
-1.09
0
1.09
4.17
5.75
7.86
7.96
9.07
11.86
22.07
25.75
42.07
─
a
正秩 (3)
1.5 3 4 5 6 7 8 9 10 11 64.5
负秩 (4)
1.5
1.5
20
本例样本资料经正态性检验,推断
得总体不服从正态分布( P <0.05),现
对子数为n,见表8-1第(4)栏,本例 n=11;
➢若多个差值为0,可通过提高测量工具的精
度来解决。
a
13
②按差值的绝对值从小到大编秩,然后分别 冠以正负号。遇差值绝对值相等则取平均秩,称为 相同秩(ties)(样本较小时,如果相同秩较多, 检验结果会存在偏性,因此应提高测量精度,尽量 避免出现较多的相同秩), 表8-1第(4)栏差值的 绝对值为2有2个,其秩依次应为1,2,皆取平均秩 为1.5,见表8-1第(5)、(6)栏;
秩转换非参数检验
秩转换的非参数检验 (Nonparametric Test)
秩转换非参数检验
主要内容
第一节 配对样本资料的Wilcoxon符号秩检验 第二节 两个独立样本比较的Wilcoxon秩和检验 第三节 完全随机设计多个样本比较的Kruskal-
Wallis H检验 第四节 随机区组设计多个样本的Friedman M检验
秩转换:将某一变量值从小到大排序后, 获得每一变量值的秩次,并用此秩次代替 原有变量值的过程。
秩转换非参数检验
秩和检验的方法----秩转换
秩和检验的基本计算步骤: 1.将数据(x)按大小转化为秩次(i),用秩次的
大小反映变量值的大小。 2.对各组”秩次”求和,称为秩和(T =∑i)。 3.对各组秩和(T)做检验的方法称为秩和检验。
60 142 195 80 242 220 190 25 198 38 236
95
新法 (3)
76 152 243 82 240 220 205 38 243 44 190
100
差值d (4)=(3)-(2)
16 10 48 2 -2 0 15 13 45 6 -46
5
—
—
—
秩转换非参数检验
例8-1:两种方法测量12份血清ALT测量结果
秩转换非参数检验
非参数检验的优缺点:
优点:
适用范围广
对数据要求不严
方法简便、易于理解和掌握
缺点:
损失信息、检验效能低
符合条件
首选参数检验
不符合条件
非参数检验
秩转换非参数检验
第一节 配对样本比较的Wilcoxon 符号秩检验
秩转换非参数检验
Wilcoxon符号秩检验简介
秩转换的非参数检验
A法
B法
差值 d 正秩
负秩
3 0 .6
3 0 .6
0
--
--
5 9 .9
6 3 .1
-3 .2
3
4 6 .0
5 8 .0
-1 2 .0
6
2 3 .0
1 0 .9
1 2 .1
7
2 0 .3
3 3 .7
-1 3 .4
9 .5
4 8 .6
9 9 .5
-5 0 .9
11
2 5 .0
2 4 .4
0 .6
1
2 3 .4
3 6 .2
-1 2 .8
8
4 4 .1
4 5 .2
-1 .1
2
3 9 9 .8 4 0 4 .1 -4 .3
4
2 5 .9
3 9 .3
-1 3 .4
9 .5
5 3 5 .6 5 4 4 .8 -9 .2
5
——
——
——
8
58
可编辑ppt
9
秩和分布的特点
对子号
1 2 3
N = 3 时两样本配对比较
10
•秩和分布的特点 (1)离散型的对称分布; (2)N一定时,秩和分布也一定; (3)靠近中央的频数较多; (4)当N足够大时,秩和分布逼近正态分布。
可编辑ppt
11
配对资料的秩和均数:
T+与T-是以T为中心的两个对称点 例11.2资料:T= 11(11 + 1)/ 4 = 33 T+ = 8 , T- = 58, 差值均为 25。
可编辑ppt
4
一、秩和检验的基本思想
总体A
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本数据两端有不确定值时无法使用。 例:仪器性能限制,超出可测量范围
以上情况下强行使用参数统计方法可能会得到错误结论
非参数检验一般不直接用样本观察值作分析,统 计量的计算基于原数据在整个样本中按大小所占位 次。由于丢弃了观察值的具体数值,而只保留其大 小次序的信息,凡适合参数检验的资料,应首选参 数检验。但不清楚是否适合参数检验的资料,则应 采用非参数检验;尤其对于难以确定分布又出现少 量异常值的小样本数据,非参数检验在剔除这些数 据前后所得结论显示出其较好的稳健性。
预备知识
秩(Rank):对于样本,按由小到大排成一列,若数据X在这 一列中占据第i位,称X的秩为Ri
实际上就像是考试成绩的排名,只不过倒了过来 相同秩(Ties,得分相同,不分胜负,平手):在许多情况
下,数据中会有相同的值出现,此时如果排秩的话就会出现 同秩的现象,这种情况被称为数据中的相同秩。
参数统计
(parametric statistics)
非参数统计
(nonparametric statistics)
已知总体分布类型,对
未知参数(μ、π)进
行统计推断
依赖于特定分布类 型,比较的是参数
对总体的分布类 型不作任何要求
不受总体参数的影响, 比较 3
1。 建立假设并确定检验水准
H0:差值的总体中位数为0,Md=0 H1:差值的总体中位数不为0,Md≠0 α=0.05 2。计算统计量T T+=34.5 T-=10.5 T=10.5
3. 确定P值,作出统计推断 n=9,T=T-=10.5,查界值表:P>0.10
按α=0.05的水准,不拒绝H0,还不能认为两
2。计算统计量T
① 省略所有差值为0的对子,令余下的有效对子
数为n 本例n=11
② 对剩余的差值的绝对值从小到大编秩,并根 据差值的正负号标上符号。编秩时遇到绝对值相 同时取平均秩次。
③ 分别求正负秩次之和,用T+和T-表示,并任选
正秩和或负秩和作为统计量值。
本例T=T-=11.5
3. 确定P值,作出统计推断 ① 查表法:n≤50查界值表,若T在上下界值范 围内,P大于表中上方对应的概率水平;若T等于 上侧界值或下侧界值,P近似等于表中上方对应 的概率水平;若T不在上下界值范围内,P小于表
n=11,T=T-=1.5,查界值表:P<0.005
按α=0.05的水准,拒绝H0,接受H1,可以认
为该厂工人尿氟含量高于当地正常人。
第二节 两个独立样本比较的 Wilcoxon秩和检验
两组独立样本比较的秩和检验(Wilcoxon秩和检验), 目的是推断计量资料或等级资料的两个独立样本代表 的两个总体分布是否有差别。
表中上方对应的概率水平。
本例n1=10,n2-n1=2,T=141.5,查界值表: 0.025<P<0.05
按α=0.05的水准,拒绝H0,接受H1,可以认
为肺癌病人的RD值高于矽肺工人的RD值。
Wilcoxon检验
1。 建立假设并确定检验水准
H0:肺癌病人和矽肺0期工人RD值的总体分布位
置相同
H1:肺癌病人的RD值高于矽肺0期工人的RD值
(总体分布位置靠右)
α=0.05
2。计算统计量T
① 把两样本数据混合小到大编秩,遇到数据相 同的取平均秩次
② 分别求两样本秩次之和,用T1和T2表示(样本 含量小的为T1),选择T1作为统计量值T。若样本 含量相等,任取一个秩和作为T(T1或T2)。
如:考试成绩的并列第三名 在默认情况下,秩和检验中的相同秩为它们按大小顺序 排列后所处位置的平均值。
非参数检验的方法很多,有符号检验、游程 检验、等级相关分析、秩和检验等。秩转换的 非参数检验(秩和检验)是在非参数检验中占 有重要地位且检验功效高的一种方法。
秩转换的非参数检验(秩和检验),首先 将观察值从小到大,或者等级从弱到强转换为 秩次后,再计算统计量,这种用数据的秩代替 原始数据进行假设检验的方法称为秩和检验。 秩和检验对总体分布的形状差别不敏感,只对 总体分布的位置差别敏感。
理论上H0为两总体分布相同,即两样本来自同一总 体;H1为两总体分布不同。由于秩和检验对两总体分
布形状的差别不敏感,对位置相同、形状不同但类似 的两总体分布,推断不出两总体分布(形状)有差别,
故在实际应用中,H0可写作两总体分布位置相同,也
可简化为两总体中位数相等。
例8-3 对10例肺癌病人和12例矽肺0期工人用X光片 测量肺门横径右侧距RD值(cm),结果见表8-5。问 肺癌病人的RD值是否高于矽肺0期工人的RD值?
本身在利用信息上就有丢失
Ⅰ型错误和Ⅱ型错误
真实结果
H0成立 H0不成立
由样本推断的结果
拒绝H0 Ⅰ型错误 α
不拒绝H0 推断正确(1-α)
推断正确(1-β) Ⅱ型错误β
(1-β)即把握度(检验效能)(power of a test):两总体确有差别,在α检验水准下,被检
出有差别的能力
(1-α)即可信度(confidence level):重复 抽样时,样本区间包含总体参数(m)的百分数
一、配对样本差值的中位数与0的比较
比较目的是推断配对样本差值得总体中位数是 否为0,也可以说是推断配对的两个相关样本所来 自的两个总体中位数是否相等。
例8-1 对12份血清分别用原方法(检测时间20分
钟)和新方法(检测时间10分钟)测谷-丙转氨酶, 结果见表8-1的(2)、(3)栏。问两法所得结果有无 差别?
非参数检验的适用范围:
① 计量资料不满足正态或方差齐性条件 ② 对于分布不知是否正态的小样本资料 ③ 对于一端或两端无确定数值的资料 ④ 等级资料进行等级强度差别的比较
非参数方法的特点:
������ 适用范围广,几乎可用于任何情况。 ������ 当资料符合参数检验方法的适用条件时,
使用非参数方法的检验效能较低。 ������ 原因:无法借助总体分布得到许多推论,
表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较
肺癌病人
RD值 秩
2.78
1
3.23
2.5
4.20
7
4.87 14
5.12 17
6.21 18
7.18 19
8.05 20
8.56 21
9.60 22
n1=10 T1=141.5
矽肺0期工人
RD值
秩
3.23
2.5
3.50
4
4.04
5
4.15
6
4.28
合计
(1)-45.30 -1.09 0 1.09 4.17 5.75 7.86 7.96 9.07 11.85 22.07 25.75 42.07 ─
正 秩负 秩 1.5
1.5
3
4
5
6
7
8
9
10
11
64.5
1.5
1。 建立假设并确定检验水准
H0:该厂工人尿氟含量的总体中位数为45.30 H1:该厂工人尿氟含量的总体中位数大于45.30 α=0.05 2。计算统计量T T+=64.5 T-=1.5 T=1.5 3。 确定P值,作出统计推断
秩转换的非参数检验
参数检验:总体分布为已知的数学形式,对
其总体参数做假设检验。
非参数检验:是针对参数检验而言的,不
依赖于总体分布的一种假设检验方法,它直接 对总体分布进行假设,不受总体分布的限制, 适用范围广,而且简便易学。
参数统计方法的局限性
必须要先对总体分布进行确定,当总体分布未知,或分 布不符合要求时无法使用。 例:住院时间
表8-1 12份血清用原法和新法测血清谷-丙转氨酶的比较
编号 1 2 3 4 5 6 7 8 9
10 11 12 合计
原法 60 142 195 80 242 220 190 25 198 38 236 95 -
新法 76
152 243
82 240 220 205
38 243
44 190 100
-
甲 好 好 好好差中好 好 中差 好 差 中 乙 差 差 好中中差中 差 中差 好 好 差
符号秩和检验若用于配对等级资料,则应先将 等级从弱到强赋值,然后再进行符号秩检验。但 对于等级资料,相同秩次多,小样本的检验结果 会存在偏差,最好为大样本。
两种疗法的治疗结果
病例号 1 2 3 4 5 6 7 8 9 10 11 12 13
对工人尿氟含量进行正态性检验得W=0.845, P=0.032,不满足正态性的条件,使用符号秩检验。
表8-2 12名工人的尿氟含量(μmol/L)与45.30比较
尿氟含量 44.21 45.30 46.39 49.47 51.05 53.16 53.26 54.37 57.16 67.37 71.05 87.37
缺点:对于符合参数统计分析 条件者,采用非参数统计分析, 其检验效能较低
预备知识
分析方法心中有数: 当手中有了数据,首先要对它进行充分、直观的了解,
直方图,茎叶图,箱图等可以帮助我们对数据的分布形状进 行探索,避免因对数据的特性缺乏了解而盲目使用一些方法 作出错误的或不合理的结论。
如果能使用参数方法,当然还是参数方法更好一些,参 数法效能高,方法多。
t
3 j
t
j
24
48
tj为第j个相同秩次的个数
如:相同秩中有2个1.5,5个8,3个14,则
t1=2,t3=5,t3=3
配对的等级资料
例 配对比较甲、乙两种方法治疗扁平足效果,记录
如下,问两种疗法是否有差别?
两种疗法的治疗结果 病例号 1 2 3 4 5 6 7 8 9 10 11 12 13