非参数检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
出现组合(21:57)的双侧尾部概率:P=2/37=0.054. 出现组合(21:57)的单侧尾部概率:P=1/37=0.027.
内容提要: 配对样本比较的Wilcoxon符号秩和检验
成组设计两样本比较的Wilcoxon秩和检验
成组设计多个样本比较的Kruskal-Wallis 秩和检验
Wilcoxon秩和检验可用于: 计量资料的两样本比较 等级资料的两样本比较 适用条件:
11 10 3 0 24
16 28 19 5
1-16 17-44 45-63 64-68
8.5 30.5 54.0 66
第三节 多组独立样本的秩和检验(Kruskal-Wallis 法)
适用条件: 不满参数检验的应用条件的完全随机设计的 多个样本比较 多个等级资料比较
H检验的基本思想:
在H0成立的条件下,检验统计量
21 57 40 38 22 23 56 55 41 42 37 36 24 25 26 27 28 54 53 52 51 50 43 44 45 46 47 35 34 33 32 31 29 30 49 48 48 49 30 29 31 47 50 28 32 33 34 46 45 44 51 52 53 27 26 25 35 43 54 24 36 42 55 23 37 41 56 22 38 39 40 39 57 21
假设检验步骤
1、建立假设检验,确定检验水准 H0:三组人群的血浆总皮质醇含量的总体分布相同。 H1:三组人群的血浆总皮质醇含量的总体分布位置 不全相同。 α =0.05 2、计算统计量
Ti 2 12 H 3( N 1) N ( N 1) ni 96.52 117.52 2512 12 3 30 1 18.12 30 30 1 5 5 5
非参数检验的优缺点:
优点:
不受总体分布的限制,适用范围广 对数据要求不严 方法简便、易于理解和掌握
缺点:
损失信息、检验效能低,二类错误的概率增 大。
符合条件 不符合条件
首选参数检验
非参数检验
参数检验与非参数检验比较
参数检验 要求资料服从 参数分布(如 正态分布) 非参检验 1. 对资料没有特殊要求,总体为偏 态、总体分布未知的计量资料 (尤其在n<30的情况) 2. 等级资料 3. 有过大或过小值的数据,或数据 的某一端没有具体值 4. 总体方差不齐 检验效率低,容易犯第二类错误, 原因信息丧失或信息利用不足。
炎病人痰液嗜酸性粒细胞数有无显著差别?
嗜酸性 粒细胞数 健康
(1) (2)
两组人痰嗜酸性粒细胞的秩和计算 频数 秩次范围 平均秩次 病人 总
(3) (4) (5) (6)
秩和 93.5 305 162 0 T-=560.5
( 7 )= (3 )×(5 )
+ ++ +++ 合计
5 18 16 5 44
1、明显偏态分布的计量资料
2、方差不齐
3、有不确定数值资料
4、等级资料
一般步骤 ⒈ 建立假设; H0:差值的总体中位数为0; H1:差值的总体中位数不为0; α =0.05。 ⒉计算统计量 ⑴ 算出各对值的代数差; ⑵ 根据差值的绝对值大小编秩; ⑶ 将秩次冠以正负号,计算正、负秩和(T+,T-); ⑷ 用不为“0”的对子数n及取绝对值小的秩和作为统计 量T ⒊查表及结论 查检验界值表得到P值作出判断。
⒊ 查表及结论 n=n2-n1,查T界值表, T0.05/2界值为28-72, T0.01/2界值为22-78, 本例,T=78.5, 所以 P<0.01,拒绝H0,接受H1,差异有统 计学意义,可认为两组的平均生存时间不同。
如果样本含量较大,表中查不到时,可用正态近似法 作检验,公式为:
兔的生存时间(min),结果见表18-2,试推
断猫和兔在缺氧条件下生存时间的差异有无
统计学意义。
第二节 两独立样本比较的秩和检验
基本思想:
如果H0成立,在两样本来自分布相同的总体,两 样本的平均秩次应相等或很接近,与总的平均秩次
(N+1)/2相差较小。含量为n1样本的秩和T1应在
n1(N+1)/2的左右变化。
不依赖总体的分布类型,不受参数的影响,
只对总体分布间进行比较的一种统计分析方法。 又称任意分布检验(distribution-free test)。
非参数检验适用范围:
① 总体分布形式未知或分布类型不明; ② 偏态分布的资料(非正态分布的资料): ③ 等级资料:不能精确测定,只能以严重程度、优劣 等级、次序先后等表示 ——单向有序行×列表资料 ④ 不满足参数检验条件的资料:各组方差明显不齐。 ⑤ 数据一端或两端是不确定数值, (必选) 如“>50kg”等。
Ti 12 H N ( N 1) ni
2
3( N 1)
H反映实际获得的k个独立样本的秩和平均值和理论值偏离的
程度。各样本的秩和平均值和理论值的差距越大,H值就越大, P值就越小。当P≤α时,拒绝H0。随着N的增大和或k的增多,H 近似ν=(k-1)的χ2分布。在k及样本例数较小时,直接计算检验 统计量H,查H界值表确定P值。当N较大或/和k较多时,利用近 似χ2分布确定P值。
实验组 10 12 15 17 23 90以上 对照组 2 3 6 7 10 11
秩和检验的基本原理:
对12名受试对象的测定值进行排秩序并给秩序号,其和是多少? 1,2,3,4,5,6,7,8,9,10,11,12 秩和为:12☓(12+1)/2=156/2=78, 公式:n(n+1)/2. 将这12名受试对象分为两组,但统一按取值大小排秩序,如果两组在 秩序上无差别,每组的秩次和应各为多少? 应各得78/2=39。 最极端的秩和应为多少?21-57 介于21与57之间的组合数有多少?(57-21)+1=37种组合
假设检验步骤
1.建立假设检验
H0 : 三种类型颈动脉炎眩晕患者的疗效总体分布相同。 H1 : 三种类型颈动脉炎眩晕患者的疗效总体分布位置
不全相同 α=0.05 2.计算统计量
Ti 2 12 H 3( N 1) N ( N 1) ni 156667.52 199982 34259.52 12 3 649 1 649 649 1 429 66 154 66.6792 C 1
u T n n 1 / 4 0.5 n(n 1)(2n 1) / 24
当相同秩次较多时u值需进行校正。
u T n n 1 / 4 0.5
3 ( t n(n 1)(2n 1) i ti ) 24 48
例18-2
在缺氧条件下,观察5只猫与14 只
u T n1 ( N 1) / 2 0.5 n1 n 2 ( N 1) / 12
当相同秩次较多时,应采用校正公式:
uc u c
3 c 1 (t 3 t ) /( N N) j j
N n1 n 2
例
44 例健康人与24例慢性气管炎病人痰液嗜酸性粒
细胞数的测量值(×106/L),问健康人与慢性气管
假设检验步骤
1.建立假设,确定检验水准 H0:多个总体分布相同。 H1:多个总体分布不全相同。 2. 编秩:多组数据从小到大混合编秩。注 意:遇不同组相同数据,取平均秩次。 3.求各组秩和:将各组秩次相加,即Ri,i 表示组号。 4.计算检验统计量: 2 Ri 12 H ( ) 3( N 1) N N 1 ni
第一节
配对样本比较的Wilcoxon符号秩和检验
例18.1 为研究出生先后的孪生兄弟间智 力是否存在着差异,选用12 对孪生兄弟 对其智力进行了测试,其结果如表18-1
假设检验步骤
⒈ 建立建设:H0:差值的总体中位数=0,
H1:差值的总体中位数0;
=0.05 2. 首先计算每个对子的差值d,见上表第(4)列,根据8个d 的绝对值,由小到大编秩,并冠以原d的正负号,见上表第(5) 列。然后分别相加正负秩次,得到秩和 T+= 24.5,T- = 41.5取统计量: T = min(T+,T-)=T+ = 24.5。 3. 查表及结论 n=11,查T界值表,P>0.05,不拒绝H0,尚不能认为孪生兄 弟对其智力有差异。
若T值偏离此值太远,H0发生的可能性就很小。
若偏离出给定的α值所确定的范围时,即P≤α,拒 绝 H0
假设检验步骤
1. 建立建设:
H0:两总体分布相同,
H1:两总体分布不同; =0.05 ⒉ 计算统计量 将两个样本由小到大的顺序统一编次, 数值相等时取平均秩次,求出两组秩和, 以样本含量较小组的秩和作为检验统计量T, T1=78.5
当有相同秩次时,H 需校正:
C 1 (t t j ) /( N N )
3 j 3
来自百度文库
HC H / C
5.确定p值,得出结论: (1)当k=3,每组例数≤5,查H界值表。 (2)k>3,ni>5,近似服从 = k – 1 的 2 分布,查2界值表。
例18-3 试推断三种人群的血浆总皮质醇含量的差别有无统计学意义
3、查表及结论 查2界值表, 20.05,2=5.99,
20.005,2=10.60, P<0.005,
按α =0.05水准,拒绝 H0,接受H1,故可认为三 组人群的血浆总皮质醇含量含量有差别。
例18.4 某医师用药物治疗慢性、亚急性、急性 颈动脉炎眩晕患者的疗效,数据资料见表18-4, 试分析该药物对三种类型颈动脉炎眩晕患者的疗 效有无差别?
第九章
非参数检验
检验方法的选择及应用条件
t 检 验: u 检 验: 方差分析:
参数统计(parameter statistics ):
假定随机样本所来自已知的参数分布(如 正态分布),在这种假设前提下,对其总体参 数进行估计或假设检验,称为参统计。
条件不满足时——采用非参数统计的方法。
非参数检验(non-parameter statistics):
检验效率高
秩次和秩和
本章介绍的非参数统计方法均基于秩次;
秩次(rank):将数值变量值从小到大,或等
级变量值从弱到强所排列的序号。
秩和:用秩次号代替原始数据后,所得某些 秩次号之和,即按某种顺序排列的序号之和, 称为秩和。
例:某实验室观察局部温热治疗小鼠移植肿瘤的疗效, 以生存日数作为观察指标,实验结果见下表,试检验两 组小鼠生存日数有无差别? 两组小鼠发癌后生存日数
3 t j tj 3 3 3 242 242 77 77
N N 0.902665
1
6493 649
H c H / C 73.87
3.查表及结论 现k=3,ν=k-1=3-1=2 查界值表20.01(2)=9.21, 2>20.01(2); P<0.01, 按 α = 0.05 水准,拒绝 H0 ,接受 H1 ,三组类型的眩 晕患者的疗效的差别有统计学意义,故可认为三组类 型的眩晕患者的疗效有差别。
1、当5≤n≤25时 可查附表18-1的 T界值表,T 愈小,P愈小。 当T恰为附表中的界值时,P值一般都小于 表中对应的概率值。
n=11
T+= 24.5,T- = 41.5
双侧0.01
双侧0.02
双侧0.05
双侧0.10
5 7 10 13 53 56 59 61
2、当n>25时 可用正态近似法计算u值进行u检验,