第十一讲 秩和检验
医学统计学秩和检验课件课件
医学统计学秩和检验课件xx年xx月xx日CATALOGUE目录•秩和检验概述•秩和检验的类型与计算方法•秩和检验的数据分析步骤•秩和检验的实例分析•秩和检验的注意事项与建议•总结与展望01秩和检验概述秩和检验是一种非参数统计方法,它通过将原始数据转换为秩(即相对位置),并利用秩的分布来进行假设检验。
定义秩和检验基于这样一个原理,即在不同组别中,如果总体分布相同,则秩的平均数应该相等。
因此,通过比较各组的秩平均数,可以判断各组的分布是否存在显著差异。
原理定义与原理优点适用于小样本数据:在样本量较小时,秩和检验仍然能够有效地检验假设,不受分布形状的限制。
不受异常值影响:由于秩和检验关注的是相对位置而不是具体数值,因此即使存在异常值,也不会对检验结果产生太大影响。
缺点对数据条件要求较高:秩和检验要求数据满足独立性、正态性和方差齐性等条件,否则可能导致误判。
检验效能较低:相对于参数检验方法,秩和检验的检验效能较低,即需要更大的样本量才能达到相同的检验效果。
秩和检验的优缺点临床医学研究在临床医学研究中,常常需要比较不同治疗方案的效果,此时可以使用秩和检验对不同组别的疗效进行比较。
秩和检验的应用场景生物医学研究在生物医学研究中,常常需要对不同生物样本(如动物、人类等)的生理指标进行比较,此时可以使用秩和检验来分析指标的差异。
流行病学研究在流行病学研究中,需要对不同地区、不同人群的疾病发病率、患病率等进行比较,此时可以使用秩和检验来分析差异是否存在。
02秩和检验的类型与计算方法配对比较法也称为配对t检验,它是对同一研究对象进行两种不同的处理,然后比较它们的结果。
配对比较法定义适用于小样本数据,特别是无法确定总体分布或总体方差未知的情况。
适用范围首先对配对数据求差值,然后对这些差值进行t检验。
计算方法独立样本法定义01独立样本法也称为独立t检验,它是对两个不同的总体进行比较。
适用范围02适用于大样本数据,并且样本的总体分布是正态分布或近似正态分布的情况。
秩和检验
三、建立假设检验,确定检验水准
H0: 三组总体分布相同,即三组吞噬指数的总体 分布相同
H1: 三组总体分布不全相同,即三组吞噬指数的 总体分布不全相同
787.47
880.83
差值
10
27.88
1.15
154.72
结果展示: 根据样本数据分布类型,选择合适的表示方法 正态分布时,用均数和标准差表示(mean±SD) 偏态分布时,用中位数和四分位间距表示
两样本比较的秩和检验
例2、在河流监测断面优化研究中,研究者从某河流甲乙两个
断面分别随机抽取10和15个样本,测得其亚硝酸盐氮(mg/L)
表1 不同剂量组小鼠肝糖原含量(mg/100g)
小鼠对号 1 2 3 4 5 6 7 8 9 10
中剂量组 620.16 866.50 641.22 812.91 738.96 899.38 760.78 694.95 749.92 793.94
高剂量组 958.47 838.42 788.90 815.20 783.17 910.92 758.49 870.80 862.26 805.48
要求掌握内容
计算机操作
配对比较的秩和检验 两样本比较的秩和检验 多个独立样本比较的秩和检验
结果的表达
配对比较的秩和检验
例1、某研究者欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性 别和年龄相同、体重相近配成对子,共10对,并将每对中的两只小鼠随 机分到保健食品两个不同的剂量组,过一定时期将小鼠处死,测得其肝 糖原含量(mg/100g),结果见表1,问不同剂量组的小鼠肝糖原含量有 无差别?
秩和检验
某药对两种病情的老年慢性支气管炎患者的疗效
合 计 秩次范围 平均秩 次 秩 单纯性 和 肺气肿
控 制 显 效 有 效 无 效 合 计
65 42 107 1~107 18 6
54
3510 2151 4740
2268 717 3634
24 108~131 119.5 53 132~184 158
30 23 13 11
(2)大样本时,正态近似法:
| T n( n 1 ) / 4 | 0.5 u n( n 1 )( 2n 1 ) / 24
校正公式:(当相持个数较多时)
u | T n( n 1 ) / 4 | 0.5 ( t3 tj ) n( n 1 )( 2n 1 ) j 24 48
12 342 602 262 H 3(15 1) 6.32 15(15 1) 5 5 5
2 i
Hc H C
分子为H值,分母C为校正数,
tj C 1 N N 校正后,Hc>H,P值减小。
3 j 3
t
HC 1
H ( t3 tj ) j N3 N
此例n1=82,n2=126,n2-n1=44, 用正态分布法。求u值
计算校正的uc值,即:
8780.5 82 208 1 / 2 0.5 u 0.4974 82 126 208 1) 12 ( /
tj ( 3 107 243 24 533 53 243 24 107 )( )( )( ) C 1 1 0.8443 3 N N 208 208
3 j 3
t
0.4974 uc 0.541 0.8443
医学统计学等级资料的秩和检验
在某些情况下,可以排除异常值以提高检验的稳定性。但应谨慎处理,确保不会排除对 总体分布有重要影响的值。
稳健统计方法
采用稳健统计方法可以在一定程度上减少异常值对检验结果的影响,如使用中位数、众 数等稳健统计量进行秩和检验。
06
秩和检验的展望
秩和检验的发展趋势
广泛应用
秩和检验作为一种非参数统计方法,在医 学、生物学、环境科学等秩和,判断 两组数据的优劣或差异性,从而 进行假设检验。
适用范围
适用于等级资料和连续变量资料, 尤其适用于小样本和不服从正态 分布的数据。
秩和检验的步骤
01
数据整理
对等级资料进行排序,并赋予相应 的秩。
确定检验统计量
根据秩和计算出检验统计量,如Z值、 H值等。
03
02
计算秩和
在蛋白质组学研究中,秩和检验 用于分析蛋白质表达水平在不同 样本之间的差异。
在其他领域的应用
环境卫生研究
在环境卫生研究中,秩和检验用于评估不同暴露水平对健康的影响。
心理学研究
在心理学研究中,秩和检验用于比较不同干预或实验条件下的心理状态或行为差异。
05
秩和检验的注意事项
样本量的问题
样本量过小
当样本量过小时,无法充分反映总体分布情况,可能导致 检验结果不准确。
等级资料
按照事物的属性特征进行等级划分所得的数据,如 疗效评价中的治愈、显效、好转、无效等。
计量资料
通过度量衡等方法获得的数据,如身高、体重等。
等级资料的特点
有序性
等级资料具有有序性,不同等级之间存在一定的顺序 关系。
差异性
不同等级之间存在差异,同一等级内的数据具有相似 性。
相对性
《秩和检验》课件
3
解读结果
4
根据统计显著性水平和效应大小,确定 是否存在差异。
ห้องสมุดไป่ตู้确定研究问题
明确需要比较的两组样本和所要检验的 假设。
执行秩和检验
使用适当的统计软件进行秩和检验的计 算与分析。
总结和展望
重要性
秩和检验为非参数统计提供了 有力的工具,可以处理不满足 正态分布的数据。
发展趋势
随着大数据时代的到来,秩和 检验在更多领域的应用前景可 期。
秩和检验的实例分析
案例一
对两种不同工艺的制程数据进行 秩和检验,以确定是否存在显著 差异。
案例二
案例三
通过秩和检验,分析两组受访者 的回答差异,从而验证研究假设。
使用秩和检验,比较新药与常规 治疗的疗效,为临床决策提供依 据。
秩和检验的操作步骤
1
收集数据
2
采集两组样本的数据,并整理成适合秩
和检验的格式。
实践意义
掌握秩和检验的方法和应用, 能够更准确地分析数据,做出 科学决策。
秩和检验的重要性
秩和检验常用于医学、心理学 和社会科学等领域的研究,能 帮助我们发现隐藏在数据中的 差异。
秩和检验的基本原理
1
排序数据
将两组样本的数据合并后按大小排序。
2
计算秩和
为每个数据分配秩次,相同数值的数据排名取平均值。
3
比较秩和
使用统计检验方法来比较两组样本的秩和,确定是否存在显著差异。
秩和检验的应用领域
药物研究
秩和检验可用于比较不同药物的疗效,排除个体差异的影响。
市场调研
秩和检验可用于比较不同广告策略的效果,确定哪种策略更受欢迎。
社会调查
秩和检验可用于比较不同群体之间的意见差异,揭示社会问题的本质。
统计学课件之秩和检验
某研究者欲研究保健食品对小鼠的抗疲劳作用, 将同种属的小鼠按性别和年龄相同、体重相近配 成对子,共14对, 并将每对中的两只小鼠随机分 配到两个不同的剂量组,测量小鼠负重游泳时间 (分钟,负重5%体重)。试比较不同剂量组的小 鼠负重游泳时间有无差别。
小鼠对子 1 2 3 4 5 6 7 8 9 10 11 12 13 14
(H检验)
back
检验目的 配对设计两组资料的总体分布是否相同
(本质为考察差值的总体分布其中位数是否为0)
检验步骤
建立假设 H0:差值的总体中位数为0(Md=0) 编秩 按差值的绝对值从小到大编秩,再相应赋以
正负号;其中,①差值为0舍去;②若差值 绝对值相等且符号相同,则顺序编秩;③若 差值相等但符号相反,则取平均秩次。
计算统计量T 分别求T+与T-,并以绝对值较小者 作为最终统计量T 。
确定P值(T界值表或正态近似法),作出结论 back
检验目的 完全随机设计两组资料的总体分布位
置是否相同
检验步骤
建立假设 H0:两总体分布或分布位置相同 编秩 将两组数据从小到大统一编秩,其中 ①若
数值相等且在同一组,则顺序编秩; ② 若 数值相等但不在同一组,则取平均秩次。
中剂量组 14.00 13.00 15.00 17.00 13.00 18.00 17.50 10.20 10.00 10.50 13.80 3.03 15.20 16.50
高剂量组 15.20 5.50 14.00 6.50 5.50 13.50 10.00 10.20 10.00 9.50 6.80 3.48 5.50 9.00
3N
1
确定P值(
)2界,值作表 出结论
(注意:若经过检验,得到有显著性的结果,只能
第十一讲 秩和检验
多个样本比较秩和检验
(Kruskal-Wallis test)
例 某医生在研究再生障碍性贫血时,测得不同
程度再生障碍性贫血患者血清中可溶CD8抗原水 平(U/ml)如表第⑴、⑶、⑸栏,问不同程度再生 障碍性贫血患者血清中可溶性CD8抗原水平有无 差别?
不同程度再生障碍性贫血患者血清中可溶CD8 抗原水平(U/ml)
参数统计
(parametric statistics) 已知总体分布类型,对 未知参数(μ、π)进 行统计推断 依赖于特定分布类 型,比较的是参数
非参数统计
(nonparametric statistics) 对总体的分布类 型不作任何要求 不受总体参数的影响, 比较分布或分布位置 适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
⑶ 确定P值作结论:
①查表法 (n1≤10,n2n1≤10) 查T界值表, n1 与n2n1交叉处即为T的界值 如果T位于检验界值区间内, P ,不拒绝H0;否 则, P ,拒绝H0 本例T =47,取α =0.05,查表得双侧检验界值区 间(49,87),T位于区间外, P<0.05,因此在按 α =0.05的水准,拒绝 H0 ,接受 H1 ,差别有统计学意 义。
H1:两型老慢支疗效分布不同
α =0.05
2.编秩,求各组秩和,确定检验统计量T 本例T1=40682.5, T2=40723.5,取T= T1=40682.5 因为n1=182>10,超出T界值表范围,需用正态近似法
u | T n1 ( N 1) / 2 | 0.5 n1n2 ( N 1) /12
家兔号
(1) 1 2 3 4 5 6 7 8 9 10 11 12 合计
秩和检验
Z < Z0.05/2 = 1.96,P>0.05,不拒绝H0,尚不 能认为接触重金属工人和非接触工人的血 胰岛素平均水平有差别。
14
• 检验两样本均数有无差别时,应首先考虑两样本 所来自的总体是否满足正态性(正态性检验)和方差 齐性(方差齐性检验)的条件。 • 当资料满足正态性、方差齐性的条件时,可采用 两样本均数比较的t检验; • 当不满足方差齐性要求时,可采用两样本均数比 较的t’检验。 • 当总体不服从正态分布、分布未知、或数据一端 或两端有不确定值、或虽满足正态性但不满足方 差齐性的要求时,可采用两样本均数比较的 Wilcoxon秩和检验。 • 当资料满足t检验条件时而选用秩和检验,会降低 检验效能。 15
8
• 1,建立检验假设,确定检验水准。
– H0:患与未患妊娠合并症的孕妇葡萄糖耐 受水平总体分布相同; – H1:患与未患妊娠合并症的孕妇葡萄糖耐 受水平总体分布不同。 – 取检验水准 α=0.05 。
2,编秩, 求秩 和,确 定统计 量T。
9
将两组原始数据混合由小到大排序编秩,遇到相同的数据, 取平均秩次。分别将两组的秩次相加,得到两组的秩和T1和 T2。如两组样本含量不等,以样本含量较小组的秩和作为统 计量T;如两组样本量相等,任取一组秩和作为统计量T。 本例两组样本量不等,取T1为统计量T,即T=47.5。 10
注意:如果已知其计量资料满足(或近似 满足)t 检验或F检验条件,当然选t检 验或F检验,因为这时若选秩转换的非 参数检验,会降低检验效能。
• 如果资料不满足方差齐性或正态分布的条 件,或者资料分布未知,或者数据一端或两 端为不确定数据,这时可以用两样本资料的 Wilcoxon秩和检验。 • Wilcoxon秩和检验不直接比较两总体均数 是否相等,而是比较两总体分布是否相同。
医学统计学秩和检验课件
秩和检验基于以下原理:对于来自同一总体的两个样本,它 们的样本分布形状应该相同;如果来自不同总体的两个样本 ,它们的样本分布形状应该有显著差异。
秩和检验的优缺点
优点
秩和检验不依赖于数据的分布假设,因此它比参数统计方法更具有稳健性; 同时,秩和检验可以处理各种类型的数据,包括定性和定量数据。
缺点
场景3
在社会科学研究中,对于一些评价社会现象的指标,如幸福感、生活质量等,秩和检验可 以用来比较不同地区或不同群体之间的差异。
02
秩和检验的类型与方法
配对比较法
01 02
定义
配对比较法也称为配对t检验,它是在医学研究中经常使用的一种统计 方法。这种方法主要用于分析两组配对的样本,以评估它们之间的平 均值是否存在显著差异。
适用范围
配对比较法适用于分析两种相关样本间的关系,例如同一组患者在治 疗前后的血压或血糖水平的变化。
03
步骤
首先,将两组配对的样本数据按大小进行排序,并赋予秩次;然后,
计算每组的平均秩次,并使用t检验来比较两组的平均秩次是否存在显
著差异。
独立样本法
定义
独立样本法也称为独立t检验,它是在医学研究中常用的 另一种统计方法。这种方法主要用于比较两个独立的样 本,以评估它们的平均值是否存在显著差异。
其他秩和统计量及其分布
Mann-Whitne…
也称为U统计量,用于比较两个独立样本的总体中 位数是否相同。
Jonckheere-…
也称为Z统计量,用于比较两个或更多有序样本的 总体中位数是否相同。
分布
Mann-Whitney U统计量服从于正态分布,其均 值和方差与Wilcoxon秩和统计量相同。
选择研究对象
秩和检验的原理
秩和检验的原理
秩和检验是一种用于比较两个样本的非参数性统计方法。
它的原理是基于对样本数据进行排序,计算出两个样本的秩和,然后通过比较秩和的大小来判断两个样本的总体分布是否有显著差异。
具体而言,秩和检验将样本数据排序后,按照排序后的位置进行秩次的赋值。
对于同样的观测值,将其排名的平均值作为秩次;对于出现连续相同观测值的情况,将其秩次取为连续区间的平均值。
然后,分别计算两个样本的秩和,并比较它们的大小。
通过比较秩和的大小,可以得出以下结论:
- 如果两个样本的秩和相差显著大,则说明两个样本的总体分布有显著差异,即两个样本来自于不同的总体分布。
- 如果两个样本的秩和相差不大,则说明两个样本的总体分布没有显著差异,即两个样本来自于相同的总体分布。
需要注意的是,秩和检验适用于两个独立样本的比较。
在实际应用中,可以使用不同的秩和检验方法,如Mann-Whitney U 检验、Wilcoxon秩和检验等。
这些方法的具体计算方式有所差异,但基本原理相同。
它们都是通过对样本数据排序和秩次赋值,来判断两个样本的总体分布是否有显著差异。
医学统计学之秩和检验
医学统计学之秩和检验什么是秩和检验?秩和检验(Wilcoxon rank-sum test),又称为Mann-Whitney U检验,是非参数假设检验的一种常用方法,用于比较两个独立样本的位置差异。
这个方法基于样本的秩次,而不依赖于数据的具体分布。
秩和检验的适用场景秩和检验通常用于以下情况:1.样本数据不满足正态分布假设;2.无法满足方差齐性假设;3.样本容量较小。
秩和检验是一种非常灵活的方法,适用于大部分类型的数据分布,甚至可以包括极端的离群值。
秩和检验的原理秩和检验的原理是将两个样本的观察值合并后,按照大小重新排列,并赋予秩次。
然后利用秩次之和来比较两个样本的位置差异。
1.对于两个独立样本,将两组数据合并为一个整体的样本。
2.对于每个观察值,分别计算出在整体样本中的秩次。
3.计算两组样本的秩和,比较其大小。
4.根据秩和的大小以及样本容量,查表或计算检验统计量的p-value。
秩和检验的步骤秩和检验的具体步骤如下:1.将两个样本合并为一个整体样本,并标记属于哪个样本。
2.对整体样本中的观察值进行排序,得到秩次。
3.计算秩和,并比较两个样本的秩和大小。
4.根据秩和大小以及样本容量,查找临界值。
5.根据临界值判断是否拒绝原假设,或者计算统计量的p-value。
6.根据p-value判断是否拒绝原假设。
秩和检验的示例假设我们有两个医学治疗方法A和B,想要比较其对病人治疗效果的差异。
我们随机选择了两组病人,分别给予方法A和B进行治疗,然后观察他们的疗效。
以下是我们观察到的结果:组A:8, 10, 12, 10, 14 组B:9, 11, 14, 12, 13我们可以按照秩次将两组数据合并,并计算秩和:组A:8(1), 10(3), 12(4), 10(3), 14(5) 组B:9(2), 11(4), 14(5), 12(4), 13(2)组A的秩和为16,组B的秩和为17。
然后,我们根据秩和的大小以及样本容量,在秩和表中查找临界值。
秩和检验 PPT课件
样本数据两端有不确定值时无法使用。 例:仪器性能限制,超出可测量范围
以上情况下强行使用参数统计方法可能会得到错误结论
非参数检验一般不直接用样本观察值作分析,统 计量的计算基于原数据在整个样本中按大小所占位 次。由于丢弃了观察值的具体数值,而只保留其大 小次序的信息,凡适合参数检验的资料,应首选参 数检验。但不清楚是否适合参数检验的资料,则应 采用非参数检验;尤其对于难以确定分布又出现少 量异常值的小样本数据,非参数检验在剔除这些数 据前后所得结论显示出其较好的稳健性。
表8-1 12份血清用原法和新法测血清谷-丙转氨酶的比较
编号 1 2 3 4 5 6 7 8 9
10 11 12 合计
原法 60 142 195 80 242 220 190 25 198 38 236 95 -
新法 76
152 243
82 240 220 205
38 243
44 190 100
-
本身在利用信息上就有丢失
Ⅰ型错误和Ⅱ型错误
真实结果
H0成立 H0不成立
由样本推断的结果
拒绝H0 Ⅰ型错误 α
不拒绝H0 推断正确(1-α)
推断正确(1-β) Ⅱ型错误β
(1-β)即把握度(检验效能)(power of a test):两总体确有差别,在α检验水准下,被检
出有差别的能力
(1-α)即可信度(confidence level):重复 抽样时,样本区间包含总体参数(m)的百分数
如:考试成绩的并列第三名 在默认情况下,秩和检验中的相同秩为它们按大小顺序 排列后所处位置的平均值。
非参数检验的方法很多,有符号检验、游程 检验、等级相关分析、秩和检验等。秩转换的 非参数检验(秩和检验)是在非参数检验中占 有重要地位且检验功效高的一种方法。
《秩和检验》课件
秩和检验在应用中需要注意数据的分布情况、样本量 大小等因素,以确保结果的准确性和可靠性。
秩和检验是一种非参数统计方法,适用于处理 等级数据和不符合正态分布的数据,能够有效 地解决实际应用中的问题。
秩和检验具有广泛的应用领域,如医学、生物学 、心理学、经济学等,可用于比较不同组别之间 的差异、探索影响因素等。
案例二:独立样本的秩和检验
总结词
独立样本的秩和检验适用于对两个独立 样本进行比较的情况,例如不同组别之 间的比较。
VS
详细描述
独立样本的秩和检验通过将两个独立样本 的数据进行混合,然后按照大小进行排序 ,再利用秩次进行统计分析,从而得出两 个独立样本是否有统计学差异。
案例三:等级资料的秩和检验
总结词
检验统计量及其分布
检验统计量
根据秩和数据计算检验统计量,如Z、T等。
分布情况
检验统计量需要符合特定的概率分布,如正态分布、t分布等。在计算检验统计 量的过程中,需要考虑其分布情况。
03
秩和检验的优缺点
秩和检验的优点
适用范围广
无假设限制
秩和检验可用于连续变量、有序分类变量 和无序分类变量的比较,适用范围较广。
《秩和检验》ppt课件
• 秩和检验概述 • 秩和检验的基本步骤 • 秩和检验的优缺点 • 秩和检验的案例分析 • 结论与展望
01
秩和检验概述
秩和检验的定义
秩和检验是一种非参数统计检验方法 ,通过将原始数据转换为秩次,然后 对秩次进行统计分析,以判断两组数 据是否存在显著差异。
它不需要假设数据符合特定的概率分 布,因此具有更广泛的应用范围。
研究展望
01
进一步研究秩和检验在不同领域 中的应用,拓展其应用范围和深 度。
统计学秩和检验
案例展示:医学研究中应用秩和检验
案例一
某医学研究比较了两种不同治疗方法对患者疼痛程度的影响。由于疼痛程度为等级资料,且样本量较小,研究者 选择了Wilcoxon符号秩和检验进行分析。结果显示,两种治疗方法的疼痛程度存在统计学差异(P<0.05),表 明其中一种治疗方法在减轻患者疼痛方面更有效。
案例二
THANKS
感谢观看
适用于连续型数据,且两个样本相互独立的情况 。
多重比较与Kruskal-Wallis H检验
目的
用于比较多个独立样本所来自的总体的分布是否存在显著差异。
方法
将多个样本数据混合后按大小排序,计算每个样本的秩和,通过比较各组秩和的差异判 断多个总体分布是否存在显著差异。如果存在差异,可进一步进行两两比较。
基于模型的秩和检验
基于模型的秩和检验方法结合了参数模型和非参数检验的优点,通过建立适当的统计模型来描述数据 的分布规律,并利用模型参数进行假设检验,从而提高了检验的灵活性和准确性。
前沿动态及未来发展趋势
基于大数据的秩和检验
随着大数据时代的到来,基于大数据的秩和检验方法将具有更广阔的应用前景。这些方法 可以利用大规模数据集提供的丰富信息,通过挖掘数据间的关联性和规律性,进一步提高 秩和检验的效能和准确性。
• · 适用范围:秩和检验适用于等级资料、不满足参数检验前提的计量资料以及某些特殊情况下 的计数资料。例如,在临床医学中,常常用于评价两种治疗方法对患者生存时间的影响是否 存在差异;在生物学中,可用于比较不同基因型对某种表型的影响等。
适用范围及优缺点
优点:秩和检验的优点包 括
对异常值和离群点相对不 敏感;
03
适用范围
适用于连续型数据,且样本量较小的 情况。
秩和检验(卫生统计学课件)
(2)编秩次并求秩和统计量 首先求出各对数据的差值,见表的第(4)列;然后编秩次,按照差值绝对值由小 到大编秩,并按差值的正负给秩次加上正负号;若差值为“0”,舍去不计,总的对 子数也要减去此对子数(记为 n);若差值的绝对值相等,取其平均秩次。最后,分 别求正负秩次之和T+ 和 T- ,任取T+ 或 T- 为检验统计量 ,本例选取T=2 。
(t
3 j
t
j
)
24
48
实例说明
➢ 例2 指导28名有轻度牙周疾病的成年人进行良好的口腔卫生保健,6个月后,按照牙 周情况好转高低程度分别给予+3,+2,+1;牙周情况变差程度依次给予分数-1,-2,3;没有变化给予0分。数据如下表(表2所示),试对此项干预的结果进行评价。
表 2 实行良好口腔卫生习惯6个月后牙周情况的变化程度
➢ 【适用情况】 ➢ (1)配对设计的计量资料,—但不服从正态分布或分布未知 ➢ (2)配对设计的等级资料
实例说明
➢ 例1 临床研究白癜风病人的IL-6指标在白斑部位与正常部位有无差异,检测结果如下表 (表1所示) 。
表1 白癜风病人的不同部位白介素指标(pg/ml)
病人号 (1)
1 2 3 4 5 6 7 8 合计
(n1+n2+1)/2 与n2 (n1+n2+1)/2越明显,H0 检验假设成立的可能
性越小。
Frank Wilcoxon
实例说明 例1 观察有无淋巴细胞转移的胃癌患者的生存时间如下表,问两组患者的生
存时间是否不同?
表1 两组胃癌患者的生存时间(月)
无淋巴细胞转移
时间
秩次
12
秩和检验原理
秩和检验原理
秩和检验是一种非参数统计方法,主要用于比较两组相关样本或配对样本的差异是否显著。
该检验方法不要求数据满足正态分布、方差齐性等假设,因此在某些情况下更为适用。
秩和检验的原理是基于秩次的比较。
对于两组相关或配对样本,首先将数据按照大小进行排序,并为每个数据赋予相应的秩次,然后计算两组样本秩次和的差值。
如果两组样本的差异并无显著性,那么这些差值在排序后应该是随机分布的。
因此,比较两组样本的秩次和差值的分布情况,可以得出样本差异是否显著。
在进行秩和检验时,首先计算两组样本的秩次和,然后计算秩次和差值的绝对值,并将其秩次,最后根据样本的大小和秩次之间的比较,计算出秩和的值。
根据秩和值,可以查找相应的临界值,从而判断样本差异是否显著。
若秩和值大于临界值,则可以拒绝原假设,即两组样本存在显著差异。
总之,秩和检验通过对样本的秩次进行比较,来评估两组样本或配对样本的差异是否显著。
它的原理简单,不要求数据满足特定的分布假设,因此在某些情况下是一种较为有用的统计方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
适用范围
1、成组设计的两样本计量数据,不符合 t 检 验的条件(方差相等,且服从正态分布); 2、两组等级资料或两端无确切值的资料。
一、原始数据的两样本比较
基本思想: • 假定:两组样本的总体分布形式相同(即 H0成立),则两样本来自同一总体,且任 一组秩和不应太大或太小 。即T 与平均秩 和 n1(N+1)/2应相差不大。 N = n1+n2
• 前面介绍的检验方法首先假定分析变量 服从特定的已知分布(如正态分布), 然后对分布参数(如均数)作检验。这 类 检 验 方 法 称 参 数 检 验 ( parametric test)。 • 今天介绍的检验方法不对变量的分布作 严格假定,这类检验称非参数检验 (nonparametric test)。
非参数统计
(nonparametric statistics)
对总体的分布类型不 作特殊要求 ,统计 推断时不涉及参数 不受总体参数的影响,比 较的是分布或分布位置
依赖于特定分布类 型,比较的是参数
非参数统计的适用情况
• • • • • 等级资料 偏态分布资料 分布不明资料 个别数据偏离过大的资料 各组方差明显不齐的资料
• 确定P值: 以较小绝对值的秩和为T值。 本例T=3.5 以n=11查附表6(P268,单侧) p<0.005, • 判定结果: 按α=0.05水准,拒绝H0,接受H1,故可以 认为该厂工人尿氟含量高于当地健康人。
第二节 成组设计两样本比较 的秩和检验
Wilcoxon rank sum test
这下面一行(记为Ri)就是上面一行数 据Xi的秩。
秩和检验原理
• 秩和检验(rank sum test):是通过对数 据依小到大排列的秩次,以求秩次之和来 进行假设检验的方法。
• 例如:欲比较两个班级学生身高均值的大 小,可先将两个班的学生混合按高矮顺序 排队,报数。然后分别清点各班级报数的 总和。
二、单一样本与总体中位数比较
1、建立检验假设:调查资料的总体中位数等 于已知总体中位数; 2、用各观察值与已知总体中位数求差值,按 差值绝对值从小到大编秩,加上符号; 3、分别求正、负秩和,任取正、负秩和之一 作为统计量T; 4、查T界值表,若T在上下界范围内,P大于 a,在T上下界范围外,P小于a 。
第七章 秩和检验 (秩转换的非参数检验)
问题的提出
• 前面学习了连续型资料两组样本均数差异 的假设检验方法: • 小样本用t检验,条件是变量服从正态分布 和总体方差齐; • 如果是小样本,变量的分布不清,或者已 知不服从正态分布或经变量转换后仍不服 从正态分布时,如何检验两个样本或多个 样本均数差异的统计学意义呢? • 需要一种不依赖于分布假定的检验方法, 即非参数检验。
0.005 0.010 0~36 1~44 … 68 ~257
• 确定P值: 以较小绝对值的秩和为T值。 本例T=3.5 以n=9查附表6(P268,双侧) 0.02<p<0.05, • 判定结果: 按α=0.05水准,拒绝H0,接受H1,故可以 认为甲乙两种方法测定大气中SO2日平均浓 度有差别。
秩和检验的基本步骤
1、建立检验假设,但假设中不涉及参数; 2、编秩(依实验设计方法不同而异),计算统 计量“秩”; 3、确定P值(小样本查表,超出表的范围用 正态近似或卡方近似),下结论。
第一节 Wilcoxon符号秩和检验
(Wilcoxon signed rank test)
Wilcoxon符号秩和检验的应用
尿氟含量 ( 1)
2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 3.00 3.18
差值 (2)=(1)-2.15 0.00 -0.05 0.05 -0.03 0.27 0.37 0.47 0.57 0.85 1.03
秩次 ( 3) -2.5 2.5 -1.0 4 5 6 7 8 9 T+=62.5,T- =3.5
秩和
病人数 合计(4)
秩次 范围 (5)
平8)=(3)(6)
107 24 53 24 208
1~107 108~131 132~184 185~208 -
54.0 119.5 158.0 196.5 -
3510 2151 4740 2554.5 T2=12955.5
判断资料分布类型的途径
• 据文献或以往经验 • 频数表 • 正态性检验
– 若测定值(都是正值)服从正态分布, 则一般来说,标准差s不会大于均值,更 不会是均值的若干倍。
秩和检验
• 什么是一个数据的秩呢?一般来说,秩就 是该数据按照升序排列之后,每个观测值 的位置。例如我们有下面数据
Xi Ri 15 7 9 5 18 9 3 1 17 8 8 4 5 2 13 6 7 3 19 10
3 确定P值作结论: ①查表法 :(n1≤10,n2n1≤10)时查表 • 如果T 位于检验界值区间内,p>a,不拒绝 H0;否则,p<a, 拒绝H0。 ②正态近似法: | T n1 (N 1)/2 | 0.5 u n1n2 (N 1)/12 *校正公式(当相同秩次较多时)
3 uc u / c ; c 1 ( t 3 t ) /( N N ); j j
p268附表6 T界值表(配对比较的符号秩和检验用)
n
5 6 7 8 9 … 25
0.025 单侧:0.05 0.05 双侧:0.10 0~15 2~19 0~21 3~25 2~26 5~31 3~33 8~37 5~40 … … 100 ~ 225 89 ~236
0.01 0.02 0~28 1~35 3~42 … 76~249
t j 为第j个相同秩号的数据个数
• 例7.3 研究不同饲料对雌鼠体重增加的关系 ,资料如表7.3,试比较两种饲料对雌鼠体 重增加是否不同?p73 • 建立假设: H0:两种饲料所喂雌鼠增重的总体分布相同 H1:两种饲料所喂雌鼠增重的总体分布不相同 α=0.05 • 计算统计量T值
1 编秩: 将两组数据从小到大统一编秩 2 求秩和:分别求秩和。两组例数不等,以例 数较小者的秩和为统计量: 高蛋白组:n1=12;T1=145.5 低蛋白组:n2=7;T2=44.5 此时n=7较小,故T=44.5 查T值表(P269附表7),表左侧找到较小 样本n1, 表上方找到n2-n1(本例为5),交叉 处即为T的界值,确定概率,0.02<p<0.05 判定结果: …不同。
• 例7.2 已知某地正常人尿氟含量的中位数为 2.15mmol/L,今在该地某工厂随机抽取12 名工人的尿氟如表7.2,问该厂工人的尿氟 含量是否高于当地正常人? • 建立假设:
H0 :该厂……总体中位数等于2.15mmol/L H1:该厂……总体中位数不等于2.15mmol/L 单侧单侧α=0.05 • 计算统计量
T分布与正态分布
当H0成立,从总体随机抽取任一个样本, 所得T值在均数附近的概率最大,而T值远离 均数概率较小,随着n增大,T的分布逐渐逼 近均数为n(n+1)/4,方差为n(n+1)(2n+1)/24的 正态分布,当n>25时,T分布已近似正态分 布。当n>50时可用正态近似法做u检验。
正态近似法
T μT 0.5 T n(n 1)/4 0.5 u σT n(n 1)(2n 1)/24
相同秩序较多时作同分校正:
uc T n(n 1)/4 0.5 n(n 1)(2n 1) 24
3 (t j t j)
48
如秩次中遇有相同秩次:3.5,3.5,6,6,6,则 ∑(tj3-tj) =(23 – 2)+ (33 – 3)=30
t j为第j个相同秩号的数据个数
u
8780.5 82 (208 1) / 2 0.5 82 126 (208 1) / 12
3 j
0.4974
(t c 1
tj)
N N 3 3 (107 107) ... (24 24 ) 1 0.8443 3 208 208
检验步骤
1、建立检验假设:差值总体中位数为0; 2、求差值,按差值绝对值从小到大编秩(注 意取平均秩次),加上符号; 3、分别求正、负秩和,任取正、负秩和之一 作为统计量T; 4、当对子数小于等于50时查T界值表,若T在 上下界范围内,P大于a,在T上下界范围外, P小于a ; 5、当对子数大于50时,用正态近似法。
3
uc u / c 0.4974 / 0.8443 0.5413
• Uc=0.5413<1.96, P>0.05 • 按α =0.05,不能认为……分布不同.
甲法 ( 2) 210 40 320 30 232 35 35 300 45
乙法 差值d 秩次 (3) (4)=(2)-(3) ( 5) 225 -15 -6.5(6) 45 -5 -2.5(2) 335 -15 -6.5(7) 37 -7 -4 (4) 250 -18 -8 (8) 30 5 2.5 ( 3) 34 1 1 ( 1) 327 -27 -9 (9) 53 -8 -5 (5) T+=3.5 T-=41.5
二、频数表或等级资料的两样本比较
1 建立检验假设: H0: 两总体分布相同
H1:两总体分布不相同
2 按组段计算两样本合计,编秩次范围,计 算平均秩次,以各组例数与平均秩次相乘, 计算两组秩和。
n1 n 2时 :以较小样本的秩和为T值 T n1 n 2时 :以较小秩和为T值
• 例7.4 某医生将老年慢性支气管炎按是否合 并肺气肿分为两类,用某药治疗这两类病 人208人,其中未合并肺气肿126人,合并 肺气肿82人,疗效如表7.4,问该药对两种 病型的疗效有无不同? 1 建立检验假设:两总体分布相同 2 按组段计算两样本合计,编秩次范围,计 算平均秩次,以各组例数与平均秩次相乘, 计算两组秩和。