非参数检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
15 14 13 12 11 10
9
8
7
6
5
4
3
2
1
0
n=20时T分布
0.18 0.16 0.14 0.12
当n>25时,T值近似服从正 0.10 态分布,故可使用u检验! 0.08
0.06 0.04 0.02 0.00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
C
tj为第j组相同秩次的个数
在相同秩次较多时,应用下式进行校正:
uC u /
3 C 1 (t 3 t ) /( N N) j j
频数表资料(或等级资料)两样本资料比较 正常人和铅作业工人尿棕色素定性检查结果
人数 结果 铅作业 正常人 工人
18 2 8 10 7 3 4 n2=32
1+2 1+3 1+4 1+5 2+5 3+5 4+5 2+3+5 2+4+5 3+4+5 2+3 2+4 3+4 1+3+4 2+3+4 1+2+3+4
2 2 3 3 3 3 3 3 2 2 1 1 1
1+2+3+4+5
合计
32
1.00000
n=5的T分布
0.10 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0.00
1、方法步骤:
建立假设
假设:H0:Md(x)= Md(y)
H1:Md(x)≠Md(y) 求差值 编秩: a. 差值按绝对值大小从小到大排序,编以秩次, 根据差值的正负号冠以正负号。 b. 编秩次时遇零舍弃,遇有差值绝对值相等, 编以平均秩次,如果符号相同可以不取平均秩次。
求秩和并确定检验统计量:任取 T+ 或 T- 作 为检验统计量T*,但常用小的秩和。 确定P值和作出推断结论。 当n≤ 25 时,查附表 9 , T 界值表。若 T* 值在上下界值范围内,其p值大于表上相应 概率水平,若 T* 值在上下界值范围外,则 其p值小于表上相应概率水平。
2
χ2 9.375 χ
2 c
χ2 3 (tj t j )
1
9.375 9.50 3 3 3 (2 2)(3 3)(2 2)
确定P值和作出推断结论
若组数k=3,每组例数小于等于5,可查
附表11,H界值表得出P值。否则H近似服 从ν=k-1的卡方分布。故可查χ2界值表, 确定其p值。
2、正态近似法
当n>25,可用u检验:
u
T n( n 1) / 4 0.5 n( n 1)( 2n 1) / 24
T n( n 1) / 4 0.5 n( n 1)( 2n 1) ( t t j ) 24 48
3 j
当相同差值较多时(不包括0),用下式校正。
偏态资料 分布类型不明的资料 等级资料 相互比较的各组变异程度相差悬殊
非参数检验的主要优缺点
优点:
a. 不受总体分布的限制,适用范围广;
非参数检验只有在参数检 方便。 验不能用的时候才使用!
缺点:
b. 可用“等级”或“符号”来评定,收集资料
造成信息的丢失,导致检验效率下降。增加犯 第二类错误的概率。
u
式中tj为第j个相同差值组的相同差值的个数。
3、本法的基本思想
配对比较符号秩和T的分布: 假定从一总体中随机抽取样本n=5的样本,则 可分别求出T+和T- ;当重复抽取所有可能组合 的样本,秩和T+的分布是对称的非连续分布。 且其均数和T的标准差为:
T n( n 1) / 4 T
12 对双胞胎兄弟心理测试结果 后出生者得分 差 值 yi di =yi -xi (3) (4) 88 2 77 6 76 -1 64 -4 96 5 72 0 65 12 90 -1 65 -5 80 9 81 -7 72 -15 绝对差值秩次 秩次 | Ri | Ri (5) (6) 3 3 7 7 1.5 -1.5 4 -4 5.5 5.5 --10 -10 1.5 -1.5 5.5 -5.5 9 9 8 -8 11 -11
4.1662
(t C 1
tj )
N3 N (263 26) (123 12) (73 7) (33 3) (4 3 4) C 1 523 52 C 0.8599
u c 4.1662/ 0.8599 4.493
三、多个独立样本比较的秩和检验 (Kruskal-Wallis test)
秩和组成情况 (2 )
F (3 )
1 1 1
概率 (4 )
0.03125 0.03125 0.03125 0.06250 0.06250 0.09375 0.09375 0.09375 0.09375 0.09375 0.09375 0.06250 0.06250 0.03125 0.03125 0.03125
一、配对样本符号秩检验
(Wilcoxon Signed Rank test)
例9-1 为研究孪生兄弟出生先后对智力是 否存在差异, 对12对双胞胎兄弟进行某 项心理测试, 其测试得分结果见表3第2、 第3列。
表 9-3 对子号 i (1) 1 2 3 4 5 6 7 8 9 10 11 12 先出生者得分 xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 出生体重 xij 相应秩次 Rij ───────────── ────────────── A B C D A B C D ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 2.7 2.9 3.3 3.5 3 4 7 11 2.4 3.2 3.6 3.6 2 5.5 12.5 12.5 2.2 3.2 3.4 3.7 1 5.5 9 14 3.4 3.4 9 9 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ ni 4 3 4 3 Ri 15 15 37.5 37.5 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
二、两独立样本比较的秩和检验 (Wilcoxon Rank Sum test)
• 例9-2 在缺氧条件下, 观察4只猫与12只
兔的生存时间(分)结果示于表9-4。欲比 较猫、兔在缺氧条件下的生存时间是否 存在显著性差异。
表 9-4
缺氧条件下猫与兔的生存时间 ( 分 ) 比较
猫 兔 ─────── ──────── 生存时间 秩次 生存时间 秩次 ─────────────────────────── 25 9.5 15 1.5 34 15 15 1.5 44 17 16 3 46 18.5 17 4 46 18.5 19 5 21 6.5 21 6.5 23 8 25 9.5 27 11 28 12.5 28 12.5 30 14 35 16 ──────────────────────── n1 =5 T 1 =78.5 n2 =14 T 2 =111.5 ────────────────────────
例9-3 14名新生儿出生体重(kg)按其母亲 的吸烟习惯分组,(A组:每天吸烟大于1包; B组:
每天吸烟少于1包; C组:过去吸烟而现已戒烟;
D 组: 从不吸烟者), 原数据归纳如表9-5的左
侧部分, 试问4个吸烟组中出生体重分布是否
相同?
表 9-5 不同吸烟习惯母亲的新生儿体重分布及秩检验计算
2 Ri 12 χ 3(N 1) N(N 1) n i 2
A 3 2 1 9 4 15
相应秩次 Rij B C 4 7 5.5 12.5 5.5 9 9 3 4 15 37.5
D 11 12.5 14 3 37.5
152 152 37.52 37.52 12 χ 3(14 1) 14(14 1) 4 3 4 3
结果 (1) + ++ +++ ++++ 合计
正常人
(2 ) 18 2
n1=20
人数 铅作业工 人 (3 ) 8 10 7 3 4 n2=32
合计
(4 ) 26 12 7 3 4 52
秩次范 围 (5 ) 1-26 27-38 39-45 46-48 49-52
平均秩 次 (6 ) 13.5 32.5 42.0 47.0 50.5
常用几种非参数假设检验
配对样本符号秩检验(Wilcoxon signed rank test) 两独立样本比较的秩和检验(Wilcoxon rank sum test) 多个独立样本比较的秩和检验(Kruskal-Wallis test) 随机区组设计资料的秩和检验(Friedman test) K组秩均值的多重比较
参数检验(parametric test):针对总 体参数进行的检验。 非参检验(nonparametric test):与 参数检验不同,非参检验不要求样本所代 表总体的分布类型,所以又称为 distribution-free test 。不考虑总体分 布型,也不针对总体的参数进行检验。
非参检验的适用范围
0.01(5,14)=22,
TU
0.01(5,14)
=78,即
99%的区间为22-78. ∵T* >TU 0.01(5,9),
∴P<0.01
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1 ( N 1) / 2 | 0.5 n1 n2 ( N 1) / 12
非参数检验
Nonparametric Statistics
主要内 容
基本概念 非参检验的适用范围 非参检验主要优缺点
常用几种非参数假设检验
小结
基本概念
参数(parameter):反映总体特征的 统计数值。 统计量( statistic ):由样本观察值所 计算出的反映样本特征的统计指标。
假设:
H0 :
猫与兔在缺氧条件下的总体生存时间分布相同, Md1 =Md2
H1 : 两总体生存时间分布不同, Md1 ≠Md2
编秩:将两组数据混合由小到大排秩, 相同数据
若在同一组,其秩次按位臵依次给定,若在不同
组则取平均秩次;
求秩和并确定检验统计量: a. 当n1<n2时,取样本例数较小者的秩和为T* b. 当n1=n2时,取秩和较小者为检验统计量T*
秩和 秩次范 平均秩 围 次 合计 正常人 铅作业
26 12 7 3 4 52 1-26 27-38 39-45 46-48 49-52 13.5 32.5 42.0 47.0 50.5 243 65 108 325 294 141 202
T2=1070
+ ++ +++ ++++
合计
n1=20
T1=308
正常人
(7 ) 243 65
308
秩和 铅作业工 人 (8 ) 108 325 294 141 202 1070
u
| T n1 (N 1)/2 | 0.5 n1n2 (N 1)/12
3 j
| 308 20(52 1)/2 | 0.5 (20)(30)(5 2 1)/12
n( n 1)(2n 1) / 24
表 9-2
n=5 时秩和 T 的分布
T( 秩和) (1 )
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 0 1 2 3 4 5 1+2+3 1+2+4 1+2+5 1+3+5 1+4+5 1+2+3+5 1+2+4+5 1+3+4+5 2+3+4+5
Байду номын сангаас
方法步骤
假设: H0 :
k个总体分布函数相同;
H1 : k个总体中至少有两个总体分布函数不同。
编秩:数据相等则取平均秩,
求秩和
计算检验统计量H值
Ri2 12 H 3( N 1) N ( N 1) ni
出生体重(kg)xij A B C D 2.7 2.9 3.3 3.5 2.4 3.2 3.6 3.6 2.2 3.2 3.4 3.7 3.4 3.4 ni Ri
确定P值和作出推断结论。
若 T* 落入 TL α(n1,n2) ~ TU α(n1,n2) 区间 , 则其概率 P >α; T* 恰好等于该区间的下限值 [TL α(n1,n2) ] 或上限值 [TU α(n1,n2) ], 则其概 率P=α;若T* 落入区间之外, 则其概率P<α。
查附表10,TL