非参数检验课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
13.71
5
19.61
24.37
4.76
6
14.50
92.75
78.25
7
49.63
121.57
71.94
8
44.56
89.76
45.20
编秩次,求秩和 去掉d=0的对子,总的对子数也要相应减去; 用绝对值︱d︳编秩次,如果出现绝对值相等时(ties) ,则将它们的平均秩次值作为他们的秩次;
第二节 单样本资料的符号秩和检验
• 目的:推断样本中位数与已知总体中位数 (常为标准值或大量观察的稳定值)有无 差别,常用于不满足单样本t检验应用条 件的资料;其检验假设是M=M0.
• 例10-2 已知某地正常人尿氟含量的中位 数为2.15mmol/L.今在该地某厂随机抽取 12名工人,测得尿氟含量,结果见表2。 问该工厂的尿氟含量是否高于当地正常人 ?
参数检验方法
• t检验 两独立样本t检验要求:正态、方差相等、个体独立 配对t检验要求:差值正态、个体独立
• 方差分析 完全随机设计方差分析要求:正态、方差相等、个体独 立
参数检验方法
• 两组性别结构是否相同?
• 两组某种不良反应的发生率是否相同?
• 多组发生率是否相同? • 多组构成是否相同?
定性无序分 类资料
未解决的问题
• 疗效用痊愈、显效、有效、无效四级分类法进行 评价时,两组或多组如何比较?
• 对两组患者空腹胰岛素水平进行比较时,有的病 例测量结果为Ins<2.0 或Ins>300,如何处理?
未解决的问题
• 对应于多分类变量(有序) • 非正态分布 • 不完整数据:如,Ins<2.0 或Ins>300 • 正态分布但方差不相等时
非参数检验的优缺点
1.优点 适用范围广,且收集资料、统计分析比较简单。
2.缺点 损失了部分信息,检验效能降低了,容易犯第二
类错误。
参数统计
(parametric statistics)
已知总体分布类型,对 未知参数(μ、π)进行 统计推断
依赖于特定分布类 型,比较的是参数
非参数统计
(nonparametric statistics)
秩次(3)
-2.5 2.5 -1 4 5 6 7 8 9 10 11
• 1. 求差值 Md=Xi-M0,见表2中的第二栏; • 2. 检验假设
H0:Md=0,即差值的总体中位数等于零, H1:Md>0,即差值的总体中位数大于零, 取单侧检验水准为0.05。
• 3. 编秩
去掉d=0的对子,总的对子数也要相应减去; 用绝对值︱d︳编秩次,如果出现绝对值相等时(
秩次和秩和
“秩”即按数据大小排定的次序号,又称秩次号。编秩 就是将观察值按顺序由小到大排列,并用序号代替原始 变量值本身。用秩次号代替原始数据后,所得某些秩次 号之和,即按某种顺序排列的序号之和,称为秩和。设 有以下两组数据:
A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7
表2 尿氟含量X(1)
2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 2.99 3.19 3.37 4.57
12名工人尿氟含量测定的结果 差值d=X-2.15 (2) 0 -0.05 0.05 -0.03 0.27 0.37 0.47 0.57 0.84 1.04 1.22 2.42
表10-1 白癜风病人的不同部为白介素IL-6指标(u/l)
病人号
白斑部位
正常部位
1
40.03
88.57
2
97.13
80.00
3
80.32
123.72
4
25.32
39.03
5
19.61
24.37
6
14.50
92.75
7
49.63
121.57
8
44.56
89.76
一般步骤
建立假设检验
H0:差值的总体中位数为0; H1:差值的总体中位数不为0(双侧);或
非参数性检验
主要内容
• 配对设计资料的符号秩和检验 • 单样本资料的符号秩和检验 • 完全随机化设计两独立样本的秩和检验 • 完全随机设计多个独立样本的秩和检验 • 随机化区组设计资料的秩和检验
复习
• 参数统计: 计量资料通常要求样本来自正态总体,
或方差齐等,在此基础上用样本统计量对 总体参数进行推断或作假设检验的统计分 析方法。
7
14
6
5
2
63
15
39
12
36
11
10
5
40
13
3
1
7
4
18
8
22
10
20
9
98 n1=8
16 秩和R1=89
6 n2=8
3 秩和R2=47
分析步骤:
1.建立检验假设,确定检验水准(α) H0:两总体分布相同 H1:两总体分布不同 α=0.05。
2.编秩 按两组数值由小到大统一编秩,若遇相同 数据则取平均秩。
表 2 两独立样本秩和检验计算表
例3 用某方法
A样本
B样本
对样品进行检测,
观察值
秩号
得到样品的直径
48 14
(mm),问两样
63
观察值 17 5 39
秩号
本的直径有无差
36
10
异?
40
3
7
18
22
20
98
6
n1=8
n2=8
表 2 两独立样本秩和检验计算表
A样本
B样本
观察值
秩号
观察值
秩号
48
14
17
差值的总体中位数>0(<0)(单侧);确定 检验水准为0.05。
求出各对数据的差值
表 2 白癜风病人的不同部为白介素IL-6指标(u/l)
病人号
白斑部位
正常部位
d=正常-白斑
1
40.03
88.57
48.54
2
97.13
80.00
-17.13
3
80.32
123.72
43.40
4
25.32
39.03
此拒绝H0。
正态近似法
• 当n>50,可采用正态近似法,计算z值。
Tn(n1)/40.5 Z
n(n1)(2n1)/24
正态近似法
若相同秩次较多(超过25%),应作校正计算。
Tn(n1)/40.5
Z
n(n1)(2nZ1或) (t3j tj)
24
48
式中,tj为第j(j=1,2,…)个相同差值的个数 到例题
2. 等级资料 3. 有过大或过小值的数据,或数据的某
一端没有具体值 4. 总体方差不齐
检验效能低,容易犯第二类错误 原因:信息丧失或信息利用不足。
方法的起点--排队与秩次
• 统计描述中排秩思想的成功应用 百分位数、中位数
• 排队的优点 广泛适用于多种分布
• 排队的结果 将原始数据的比较转化为秩次的比较
Wilcoxon符号秩检验,用于推断配对资料的 差值是否来自中位数为0的总体。
表1
家兔号 (1) 1 2 3 4 5 6 7 8 9 10 11 12 合计
家兔皮肤损伤程度(评分)
A照射
B照射
A-B
秩次
(2)
(3)
(4)
(5)
39
55
16
10
42
54
12
9
51
55
4
3
43
47
4
3
55
53
-2
-1
45
第三节 完全随机设计两独立样本的 秩和检验
• Wilcoxon秩和检验,目的是推断连续型变
量资料或有序变量资料的两个独立样本代
表的总体分布位置是否有差别
适用条件: 1.完全随机设计的两组定量资料,若 不满足参数检验的应用条件,则用 本法 2.有序分类变量两组独立样本比较
一、原始数据的两样本比较
问题1. 在统计检验中是否选用非参数统计方法( )。 • A. 要根据研究目的和数据特征作决定 • B. 可在算出几个统计量和得出初步结论后进行选择 • C. 要看哪个统计结论符合专业理论 • D. 要看哪个值更小 • E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直
接使用
• 问题2. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是() • A. T越大,P值越小 • B. T越大,P值越大 • C. T值在界值范围内,P值小于相应的α • D. T值在界值范围内,P值大于相应的α值 • E. T值在界值范围上,P值大于相应的α
ties),则将它们的平均秩次值作为他们的秩次;
把差值的符号标在秩上,如果d>0,则秩次为“+”, d<0,则秩次为“-”;
• 4. 求正负秩和并确定检验统计量
– T+=62.5, T-=3.5; T=min(T+,T-)=3.5
5. 确定P值并作出统计推断
• 本例n=11,T=3.5,查配对设计T界值表 ,得P<0.005,差异有统计学意义,拒绝 H0,接受H1.可认为工人尿氟含量高于当 地正常人。
秩次(rank)——将数值变量值从小到大,或等级变量值从弱到
强所排列的序号。
例1 11只大鼠存活天数: 存活天数4,10,7,50,3,15,2,9,13,>60,>60
秩次 3 6 4 9 2 8 1 5 7 10 11
例2 9名 肺炎病人的治疗结果:
10.5 10.5
危险程度 治愈 治愈 死亡 无效 治愈 有效 治愈 有效 无效
非参数检验的概念
• 非参数检验又称为任意(不拘)分布检验( distribution-free test),这类方法并不依 赖总体分布的具体形式,应用时可以不考虑研 究变量为何种分布以及分布是否已知,进行的 是分布之间而不是参数之间的检验,故又称非 参数检验(nonparametric test),简称非参 检验。
秩次
1 29 73 5468
平均秩次 2.5 2.5 9 7.5 2.5 5.5 2.5 5.5 7.5
第一节 配对设计资料的符号秩和检验
复习:配对设计 1.同一受试对象分别接受两种不同的处理 2.同一受试对象处理前后 3.两个同质受试对象分别接受两种不同的处理
适用条件 1. 配对设计的计量资料,但不服从 正态分布或分布未知 2. 配对设计的等级资料
d=正常-白斑 48.54 -17.13 43.40 13.71 4.76 78.25 71.94 45.20
T+=33
秩次
6 -3 34 2 1 8 7
5 T-=3
查配对比较的符号秩和检验表,确定P值范围。
当n≤50时,查T界值表,当T恰为附表的界值时
, P值一般小于 表中对应的概率值;
本例n=8,查T界值表T0.05(8)=3~33,P < 0.05,因
对总体的分布类型 不作任何要求
不受总体参数的影响, 比较分布或分布位置 适用范围广;可用于任 何类型资料(等级资料, 或“>50mg” )
参数检验与非参数检验比较
参数检验 要求资料服从 某种分布
检验效率高
非参检验
1. 对资料的分布没有特殊要求,总体为 偏态、总体分布未知的计量资料(尤 其在n<30的情况)
63
18
11
22
52
30
12
48
44
-4
-3
40
48
8
6
45
55
10
8
40
32
-8
-6
49
57
8
6
R=10(68)
分析步骤:
(1)建立检验假设,确定检验水准 Ho:差值总体中位数Md=0 H1:差值总体中位数Md≠0 α=0.05
(2)编秩:
•求大编秩。
•编秩时注意两点: 遇差值为0者,舍去不计,n相应 减少;差值的绝对值相等,取平均秩次
两组各有5个变量值。现在依从小到大的顺序将 它们排列起来,并标明秩次,结果如下:
A组
2.6 3.2
4.7 5.2 6.4
B组 1.7 2.3 2.6
3.6 3.7
秩次 1 2 3 4 5 6 7 8 9 10
上面A组和B组中各有五个原始值,按顺序排列:最小值设 为1,再按绝对值大小对余下的变量逐个排序,最大值为 两组变量个数之和10。依次可得1,2,3.5, 3.5, 5, 6,7,8,9,10。这10 个序号即是秩次。A组秩和就是等于 3.5+5+8+9+10=35.5,B组秩和就是等于1+2+3.5+6+7=19.5 。从两组的原始变量值也可以初步看出:A组偏大,B组偏 小。现在得出的秩和也是A组大于B组,与由变量值所观察 到的一致。
•编秩后,按差值的正负给秩次冠上符号。
分析步骤:
(3)求差值为正或负的秩和 差值为正的秩和以T+表示 差值为负的秩和以T-表示。 T++T-=n(n+1)/2 T=min(T+,T-)
(4)确定P值和作出推断结论:
当n≤50时,查T界值表
T在界值范围内
P>α
T在界值范围外或相等 P<α
例1 临床某医生研究白癜风病人的白介素IL6水平(u/l)在白斑部位与正常部位有无差异 ,调查的资料如表1所示:
把差值的符号标在秩上,如果d>0,则秩次为“+”,d<0, 则秩次为“-”;
求正负秩次之和T+与T-,绝对值较小者,作为统计量T值。
病人号 1 2 3 4 5 6 7 8
合计
白斑部位 40.03 97.13 80.32 25.32 19.61 14.50 49.63 44.56
正常部位 88.57 80.00 123.72 39.03 24.37 92.75 121.57 89.76