医学统计学第3版 秩和检验
医学统计学秩和检验
对统计分析的结果进行解释和报告,包 括显著性水平、效应大小等。
医学统计学秩和检验的优势
1 非参数方法
医学统计学秩和检验不需要假设数据服从特 定的分布,更适用于真实世界的数据。
2 强大的统计推断
医学统计学秩和检验能够进行假设检验、置 信区间估计和相关分析等多种统计推断。
3 对异常值的鲁棒性
由于基于秩次而不是原始数据,医学统计学 秩和检验对异常值具有较好的鲁棒性。
3 基本原理
医学统计学秩和检验基于 非参数统计方法,不依赖 于数据的分布情况,更适 用于小样本和偏态数据。
医学统计学秩和检验的应用
药效试验
用于评估不同药物的疗效,判断药物之间的差异。
生存分析
用于分析患者的生存时间和生存率,评估不同因 素对生存的影响。
配对设计研究
用于比较两种相关观察结果之间的差异,如治疗 前后的数据比较。
相关分析
用于分析两个变量之间的相关程度,评估它们的 线性关系。
医学统计学秩和检验的步骤
1
收集数据
收集与研究目的相关的数据,并确保数
将数据转换为秩次
ห้องสมุดไป่ตู้
2
据质量和完整性。
对数据进行排序,将其转换为秩次,以
便进行后续的统计分析。
3
应用适当的秩和检验方法
根据研究设计和研究问题选择合适的秩
解释和报告结果
4
和检验方法。
4 广泛适用性
医学统计学秩和检验适用于不同类型的数据, 包括定量数据、定性数据和顺序数据。
医学统计学秩和检验的案例
临床试验
通过医学统计学秩和检验,研究 人员可以评估新药的疗效和安全 性。
流行病学调查
医学统计学秩和检验可以用于分 析调查数据,研究疾病的发病率 和风险因素。
秩和检验【医学统计学】
568.4
14.0
384.6
3.0
556.2
13.0
369.1
1.0
435.7
7.0
377.8
2.0
574.8
15.0
436.7
8.0
468.7
12.0
662.9
19.5
433.4
6.0
582.8
16.5
442.3
10.0
438.1
9.0
426.1
5.0
n1 10
T1 101
n2 12
T2 152
2.求检验统计量T 值
①省略所有差值为0的对子数,观察单位数减去0对子数 的个数 ②按差值的绝对值从小到大编秩,绝对值相等的差值若 符号不同取平均值,并保持原差值的正负号;
③任取正秩和或负秩和为T,本例取T-=3。
3. 确定P 值,作出推断结论
2020/8/8
15
检验步骤
查附表12 • 本例T=3,n=10,
3 9 6 8 7 -1 10 4 -2 5
T 52 T 3
2020/8/8
10
配对符号秩检验基本思想
• 当H0(差值的总体中位数Md=0)成立,任一配对差值出现正号、负号的 机会均等,秩和T-与T+的理论数也应相等为n(n+1)/4
• 可以证明:
• H0为真时,秩统计量T是对称分布 • H0非真时,T呈偏态分布
单纯⑴虚寒型 ⑵3 ⑶6 ⑷25 ⑸26 13 ⑻ 73
喘息虚寒型
1
3 10
9
3 26
虚寒阻塞型 16 28 61 27 ⑹9 141
2020/8/8
21
35页卫生统计学:秩和检验
确定P值与结论
确定P值
根据统计量和样本量等参数,计算出相应的P值。
结论推断
根据P值的大小,判断差异是否具有统计学显著性,从而得出研究结论。一般来 说,P值小于0.05或0.01时,认为差异具有统计学显著性。
04
秩和检验的优缺点分析
优点分析
非参数性质
秩和检验是一种非参数统计方法,不需要假设数据符合特定的概率分 布,因此具有更广泛的适用性。
计算方法
将两个样本的秩次相加,并根据总数计算检 验统计量。
特点
对数据分布要求较低,能够处理非参数数据 。
等级相关秩和检验
适用范围
适用于等级资料或有序分类数据的关联性分析 。
计算方法
利用Spearman或Kendall等级相关系数计算秩 和检验统计量。
特点
能够分析有序分类变量之间的相关性,不受数据分布限制。
35页卫生统计学:秩和检验
• 秩和检验概述 • 秩和检验的基本类型 • 秩和检验的步骤与操作 • 秩和检验的优缺点分析 • 秩和检验的实例分析 • 结论与展望
01
秩和检验概述
定义与背景
秩和检验是一种非参数统计方法 ,用于比较两组或多组独立样本 来判断它们是否来自同一总体。
它基于对观察值进行排序,并利 用秩次(即观察值的顺序位置) 进行统计分析,适用于数据不服
对等级数据适应性有限
秩和检验主要适用于连续型数 据,对于等级数据(如评分等 级)的适应性相对有限。
对样本量要求较高
相对于其他参数检验方法,秩 和检验需要的样本量较大,在 小样本情况下可能不适用。
对数据关联性假设敏感
秩和检验依赖于独立同分布的假设 ,如果数据间存在相关性或集群效 应,可能会影响检验结果的准确性 。
医学统计学--秩和检验
4、求秩和并确定检验统计量T
(1)分别求正、负秩次之和T+、T本例:T+=3.5 ;T- =41.5 (2)以绝对值较小的秩和为检验统计量T,本例 T=T-=3.5 n( n 1) 注:总秩和= 2 而 9(9 1) 45 2 , 本例T++ T_=45,
5、确定P值 (1)查表法 当n≤50时,查附表6: T界值表 (配对比较的符号秩和检验) 以例数n确定查哪一行,然后自左向右用T与 每一 栏界值相比。 T在界值范围之内,P值大于表上方相应概率 T在界值范围之外,P值小于表上方相应概率 (往右移一栏继续查) 本例 n=9,T=3.5,在双侧P=0.05的界值 范围(5~40)之外,在双侧P=0.02的界值范 围(3~42)之内,故 0.02< P <0.05
uc= u/ c df=∽的t值, 就是u值! C=1-∑(t3j-tj)/(N3-N) =1-[(1073-107)+(243-24)+(533-53)+ (243-24)]/(2083-208) =0.8443 查u值表 uc=0.4974/ 0.8443 =0.5413 uc=0.5413<u0.5, =0.6745,P>0.5 5、推断结论 本例P>0.5, 在α=0.05水准上,不拒绝H0,差别 无统计学意义,尚不能认为该药对两种支气管炎 的疗效不同。
低蛋白组平均秩和
蛋白组增重较多。
T2 =44.5/7=6.4,故可认为高
二、正态近似法: 当n1或/和n2-n1超出附表7范围
时,可计算u值,确定P值 。
| T n1 ( N 1) / 2 | 0.5 u n1n2 ( N 1) / 12
而当相同秩次较多(超过25%)时,需计算校正u值。
医学统计学等级资料的秩和检验
表 8.1 复方猪胆胶囊治疗两型老年性慢性支气管炎疗效比较
疗效
喘息型
人数 单纯型
合计
(1)
(2)
(3)
(4)
控制
23
60
83
显效
83
98
181
好转
65
51
116
无效
11
12
23
合计
n1=182
n2=221
403
24
Biostatistics
第二十四页,讲稿共七十二页哦
例题( page90 )
表 8.1 复方猪胆胶囊治疗两型老年性慢性支气管炎疗效比较
B:
+ ++ ++ ++ +++ +++
4.454..56588.58.85 88.59.9588.511.500 11111.5 111212.5
秩次相同(tie)取平均秩次!!
7
Biostatistics
第七页,讲稿共七十二页哦
秩和
A组: - 、、+、+、+、 ++
秩和: 1 2 4.5 4.5 4.5 8.5
TA=25
B组: +、++、++、++、+++、+++
秩和: 4.5 8.5 8.5 8.5 11.5 11.5
TB=53
TA+TB=N(N+1)/2=78
8
Biostatistics
第八页,讲稿共七十二页哦
2 秩次与秩和
医学统计学第3版 秩和检验
检验水准α=0.05
2.计算检验统计量T值: (1)求出各对数据的差值. (2)编秩
差值为0,不编秩,n要相应减小(有效n)。按差
值的绝对值从小到大编秩,并标明原差值的正负 号。
有绝对值相均秩次。秩次相 等称为相持。
先选参数统计方法,后选非参数统计方法。
6/90
第一节 Wilcoxon符号秩和检验
符号:
7/90
一、配对设计的两样本比较
配对设计计量资料两处理效应的比较,一般采用配
对 t 检验,如果差数明显偏离正态分布,应采用 Wilcoxon配对符号秩和检验,亦称符号秩和检验
(signed rank test)。
4/90
非参数检验适用范围(资料)
定量资料不满足参数检验条件。
1.总体分布类型不清或总体分布呈明显偏态
分布,而又无适当转换法转为正态分布;
2.有序(等级)资料、秩次资料;
3.分组数据一端或两端有不确定数值 ;
4.总体方差不齐。
5/90
非参数检验特点
优点: 1.适用范围广,不受总体分布的限制 。 2.方法简单。 缺点: 检验效能低(适合用参数检验的资料,如果用非参数检验会 造成数据信息的丢失(观察值转秩次),检验效能下降) 。
秩次 (5) 10 -5 8 1.5 6 3.5 -1.5 9 7 3.5
T+=48.5
T-=6.5
13/90
求正、负秩和
(3)分别求正、负秩和: 本例, T+ =48.5,T- =6.5. T+ + T- =n(n+1)/2=[10(10+1)/2]=55,计算无误。 (4)确定检验统计量:任取T+或T-为统计量T ,宜取 T+或T-小者为统计量T 。 本例T+=48.5、T- =6.5,宜取较小T- =6.5者。
医学统计学秩和检验
在医学研究中,秩和检验常用于比较两种或多种治疗方案的效果,如药物、手术等。通过 对秩和的统计分析,可以得出哪种方案更有效的结论。
疾病流行病学研究
在疾病流行病学研究中,秩和检验可用于分析不同人群或地区的发病率或死亡率差异。通 过对这些数据的分析,可以评估不同因素对疾病发生的影响。
临床决策支持
秩和检验在临床决策支持系统中也得到广泛应用。通过对病人的各种指标进行统计分析, 医生可以更好地了解病人的病情,从而制定更有效的治疗方案。
生物领域的应用
01
基因表达分析
在基因表达分析中,秩和检验可用于比较不同样本之间的基因表达谱
差异。通过对基因表达谱的统计分析,可以找出与特定疾病或生理过
程相关的关键基因。
根据样本数据计算检验统计量的值。
确定显著性水平
确定在假设检验中拒绝零假设的最小显著 性水平。
假设检验的推断与解释
推断
根据计算出的p值或其他统计指标,推断样 本数据所来自的总体的特性或参数。
解释
解释推断结果,考虑研究的假设和目的, 结合其他相关信息做出科学结论。
05
秩和检验的实际应用与案例 分析
医学领域的应用
社会科学研究
在社会科学研究中,秩和检验常用于比较不同群体或地区的经济社会指标差异。通过对这些数据的统计分析,可以评估不同 因素对社会发展的影响。
公共政策评估
秩和检验可用于评估公共政策的效果。通过对政策实施前后的数据进行统计分析,可以得出政策是否有效的结论,从而为 政策制定者提供参考。
市场调研
在市场调研中,秩和检验可用于比较不同产品或品牌的市场占有率差异。通过对这些数据的统计分析,可以帮助企业了解 市场状况,从而制定更有效的市场策略。
医学统计学秩和检验
1、确定资料的类型: 分类资料、定量资料;
2、选择适当的统计方法;
3、作出统计推断结论。 牛牛文档分享定量资料的分析:t检验 Z检验 F检验
分类资料的分析: 2 检验 牛牛文档分享 2检验的应用范围
① 比较两个或多个样本的总体率(构成比)有无差异
非参数检验的优缺点
优点:
1、不受总体分布的限制,适用范围广。 2、不受资料类型的限制,可以是计量资料、等级资 料以及一合参数检验条件的资料,首先参数检验方 法;如果用非参数检验,没有充分利用资料提供的信 息,检验效能(power)低于参数检验。 2、非参数检验一般犯第二类错误的概率β比参数检 验大,若要使β相同,非参数检验要比参数检验需要 更多的样本例数。
配对设计的两样本比较
例12.1 某研究用甲、乙两种方法对某地方 性砷中毒地区水源中砷含量(mg/L)进行测 定,检测10处,测量值如表12.1的(2)、(3) 栏。问两法测定某地区10处水源中砷含量的结果(mg/L)
② 分析两个分类变量之间的关联性 ③ 判断频数分布类型 ④ 分析率的线性趋势 牛牛文档分享t 检验的应用条件
① σ 未知且n 较小 ② 样本取自正态总体 ③ 两样本均数比较时,两样本总体方差相等
Z 检验的应用条件
①样本取自正态总体,两样本总体方差相等
② σ未知但n 较大(如 n > 100), n 较小但σ 已知。
配对设计计量差值比较 单一样本与总体中位数比较 牛牛文档分享配对设计两样本比较
配对设计资料主要是对差值进行分析。
通过检验配对样本的差值是否来自中位数为0
的总体,来推断两个总体中位数有无差别,即
推断两种处理的效应是否不同。 牛牛文档分享 牛牛文档分享
医学统计学秩和检验课件
确定样本量和分组
在应用秩和检验时,需要确定合适的 样本量和分组,以使结果更具有代表 性和可靠性。
统计结果的解读与报告
解读P值
秩和检验的P值是用来判断假设是否成立的 重要依据。如果P值小于显著性水平(如 0.05),则可以拒绝原假设。
报告结果
在报告秩和检验结果时,需要包括以下内容 :样本量、分组、秩和统计量、P值、95% 置信区间等。同时还需要对结果进行解释和 说明。
案例四:多个样本比较法应用实例
总结词
多个样本比较法是将多个样本的秩和分别进行排列,然 后根据秩和顺序进行多重比较的一种秩和检验方法。
详细描述
多个样本比较法适用于需要对三个或更多个样本进行比 较的情况,例如在药物疗效研究中比较不同药物的治疗 效果。该方法可以通过一次检验同时处理多个样本,提 高统计效率,但需要注意控制假阳性率。
在生物统计学中的应用
遗传学研究
在遗传学研究中,秩和检验可用于比较不同基因或基因组在不同物种或种群之间的差异。通过对基因序列、表达 谱等数据进行统计分析,有助于揭示遗传多样性和物种演化的规律。
生物分类学
在生物分类学研究中,秩和检验可用于比较不同物种或类群之间的形态特征、生态习性等方面的差异。为生物分 类学研究和系统发生学分析提供定量方法支持。
原理
秩和检验基于这样一种思想:在大多数情况下,如果两个样本的总体分布相同, 那么它们在各个样本中的相对大小(即秩)应该大致相同。因此,如果两个样本 的秩存在显著差异,那么我们就可以认为它们的总体分布存在显著差异。
秩和检验的适用范围
适用范围
秩和检验主要用于处理等级数据,例如病人症状的轻重程度、治疗效果的好坏 等。它不适用于处理不服从正态分布的数据。
医学统计学秩和检验课件课件
它利用数据排序后的秩次(即数 据在排序后的位置)代替原始数 据,通过比较不同组别间秩次的 平均值来推断各组之间的差异。
适用范围
适用于总体分布不明 确或不符合正态分布 的情况。
可用于处理等级数据 、有序分类数据和无 序分类数据。
适用于小样本或样本 量不均衡的情况。
特点
01
秩和检验不受总体分布 限制,具有较好的稳健 性。
秩和检验无法处理含有缺失值的数 据,如果数据中存在缺失值,需要 进行适当的处理或剔除。
使用注意事项
选择合适的检验方法
在应用秩和检验时,需要根据数据的实际情况选择合适的检验方 法,如配对比较、独立样本或等级数据等。
注意数据的异常值和离群点
在应用秩和检验前,需要关注数据中的异常值和离群点,并进行适 当的处理。
数据清洗
对数据进行预处理,如缺 失值填充、异常值处理等 。
描述性统计
对数据进行描述性统计分 析,如均值、中位数、标 准差等,以了解数据的基 本特征。
秩和检验实施
根据数据类型和检验目的 选择适当的秩和检验方法 ,如Wilcoxon秩和检验或 Mann-Whitney U检验。
结果解释与结论
结果解释
根据秩和检验的结果,解释数据间的差异是否有统计学显著性。
考虑数据的分布情况
在应用秩和检验时,需要考虑数据的分布情况,如果数据不符合正 态分布,可能需要采用其他统计方法。
05
秩和检验的实例分析
实例选择与数据收集
实例选择
选择一组实际的临床数据或公共卫生数据,数据应具有代表性且符合正态分布 。
数据收集
确保数据来源可靠,收集过程严谨,避免数据误差和偏倚。
实例分析过程
03
医学统计学秩和检验课件
秩和检验基于以下原理:对于来自同一总体的两个样本,它 们的样本分布形状应该相同;如果来自不同总体的两个样本 ,它们的样本分布形状应该有显著差异。
秩和检验的优缺点
优点
秩和检验不依赖于数据的分布假设,因此它比参数统计方法更具有稳健性; 同时,秩和检验可以处理各种类型的数据,包括定性和定量数据。
缺点
场景3
在社会科学研究中,对于一些评价社会现象的指标,如幸福感、生活质量等,秩和检验可 以用来比较不同地区或不同群体之间的差异。
02
秩和检验的类型与方法
配对比较法
01 02
定义
配对比较法也称为配对t检验,它是在医学研究中经常使用的一种统计 方法。这种方法主要用于分析两组配对的样本,以评估它们之间的平 均值是否存在显著差异。
适用范围
配对比较法适用于分析两种相关样本间的关系,例如同一组患者在治 疗前后的血压或血糖水平的变化。
03
步骤
首先,将两组配对的样本数据按大小进行排序,并赋予秩次;然后,
计算每组的平均秩次,并使用t检验来比较两组的平均秩次是否存在显
著差异。
独立样本法
定义
独立样本法也称为独立t检验,它是在医学研究中常用的 另一种统计方法。这种方法主要用于比较两个独立的样 本,以评估它们的平均值是否存在显著差异。
其他秩和统计量及其分布
Mann-Whitne…
也称为U统计量,用于比较两个独立样本的总体中 位数是否相同。
Jonckheere-…
也称为Z统计量,用于比较两个或更多有序样本的 总体中位数是否相同。
分布
Mann-Whitney U统计量服从于正态分布,其均 值和方差与Wilcoxon秩和统计量相同。
选择研究对象
医学统计学-秩和检验
(4)求秩和并确定检验统计量
求出T+ TT+=18.5 T-=36.5
Page 23
(5)确定p值和作出统计推断
n≤50时 查附表9得n=10时,双侧P=0.10界值
是10~45 而T+=18.5在其中, P>0.10 按双侧0.05水准,不拒绝H0,差异无统计学意
义,故尚不能认为两法测定血清中谷丙转氨 酶含量有差别。
合计
128
88
216
~
~
12250 11186
以样本含量小的为T T=11186 n=88
Page 38
正态近似法(n1,n2-n1超出表的范围时)
n1>10或n2-n1 >10时
u T n1(N 1) / 2 0.5 n1n2 (N 1) /12
相同秩次多时校正 N n1 n2
uc u / c
同组秩次之和
Page 12
编秩
A组: - ± + + + ++ 秩次 1 2 4.5 4.5 4.5 8.5
TA=25
B组: + ++ ++ ++ +++ +++ 秩次 4.5 8.5 8.5 8.5 11.5 11.5
TA+TB=N(N+1)/2=78
TB=53
Page 13
➢秩次:在一定程度上反映了等级的高低; ➢秩和:在一定程度上反映了等级的分布位置。
Page 4
非参数检验适用情况
①等级资料(有序分类资料) ②偏态分布资料 ③未知分布型资料 ④要比较各组变异度较大,方差不齐,且 变
换不能达到齐性的资料 ⑤一端或两端有不确定的资料
Page 5
医学研究中的等级资料
➢疗 效:痊愈、显效、有效、无效、恶化 ➢化验结果:-、、++、+++ ➢体格发育:下等、中下、中等、中上、上等 ➢心功能分级:I、II、III ➢文化程度:小学、中学、大学、研究生 ➢营养水平:差、一般、好
医学统计学秩和检验课件课件
假阳性是指当原假设为真时,错误地拒绝原假设而得出 有统计学意义的结论;假阴性则是指当原假设为假时, 错误地接受原假设而得出无统计学意义的结论。
建议
在解读秩和检验结果时,要根据研究目的和实际情况, 正确选择临界值和显著性水平,同时考虑样本量和效应 大小等因素,以减少假阳性和假阴性的发生。
06
Whitney U检验等,每种方法适用于不同的数据类型和研究场景。
03
建议
在选择秩和检验方法时,首先要明确研究目的和数据类型,然后根据
实际情况选择最适合的方法。同时,要了解各种方法的优缺点和适用
范围,避免方法选择不当导致结果偏差或错误。
注意假设检验的假阳性与假阴性结果
总结词
在假设检验中,要关注假阳性与假阴性结果,正确解读 结果并作出合理推断。
总结与展望
总结
01
秩和检验是一种非参数统计方法,在医学统计学中具有广泛的应用价值。它能 够处理不满足正态分布的数据,避免了对数据的过度拟合,从而更加稳健地检 测出总体参数。
02
秩和检验可以用于比较两组或多组数据的分布位置,以及检验两个或多个相关 样本的总体分布位置是否相同。
03
在医学研究中,秩和检验常用于比较实验组和对照组之间的疗效差异,以及评 估不同治疗方法的效果。它能够提供一种更加直观和客观的评价方式,特别是 在处理一些难以用数值精确描述的临床观察指标时。
建议
在应用秩和检验前,应先对数据进行正态性和方差齐性的检验,如果数据不满足这些条件 ,可以尝试进行数据转换或使用其他适合的统计方法。
正确选择比较方法和适用场景
01
总结词
针对不同的数据类型和研究目的,选择合适的秩和检验方法至关重要
。
医学统计学之秩和检验
医学统计学之秩和检验什么是秩和检验?秩和检验(Wilcoxon rank-sum test),又称为Mann-Whitney U检验,是非参数假设检验的一种常用方法,用于比较两个独立样本的位置差异。
这个方法基于样本的秩次,而不依赖于数据的具体分布。
秩和检验的适用场景秩和检验通常用于以下情况:1.样本数据不满足正态分布假设;2.无法满足方差齐性假设;3.样本容量较小。
秩和检验是一种非常灵活的方法,适用于大部分类型的数据分布,甚至可以包括极端的离群值。
秩和检验的原理秩和检验的原理是将两个样本的观察值合并后,按照大小重新排列,并赋予秩次。
然后利用秩次之和来比较两个样本的位置差异。
1.对于两个独立样本,将两组数据合并为一个整体的样本。
2.对于每个观察值,分别计算出在整体样本中的秩次。
3.计算两组样本的秩和,比较其大小。
4.根据秩和的大小以及样本容量,查表或计算检验统计量的p-value。
秩和检验的步骤秩和检验的具体步骤如下:1.将两个样本合并为一个整体样本,并标记属于哪个样本。
2.对整体样本中的观察值进行排序,得到秩次。
3.计算秩和,并比较两个样本的秩和大小。
4.根据秩和大小以及样本容量,查找临界值。
5.根据临界值判断是否拒绝原假设,或者计算统计量的p-value。
6.根据p-value判断是否拒绝原假设。
秩和检验的示例假设我们有两个医学治疗方法A和B,想要比较其对病人治疗效果的差异。
我们随机选择了两组病人,分别给予方法A和B进行治疗,然后观察他们的疗效。
以下是我们观察到的结果:组A:8, 10, 12, 10, 14 组B:9, 11, 14, 12, 13我们可以按照秩次将两组数据合并,并计算秩和:组A:8(1), 10(3), 12(4), 10(3), 14(5) 组B:9(2), 11(4), 14(5), 12(4), 13(2)组A的秩和为16,组B的秩和为17。
然后,我们根据秩和的大小以及样本容量,在秩和表中查找临界值。
医学统计学 秩和检验讲解
(10-3)
zc z / C
C 1
(t
3 j
t
j
)
/(
N
3
N
)
data li10_3; do c=1 to 2; input n@@; do i=1 to n; input x@@; output; end; end; cards; 10 10 12 15 15 16 17 18 20 23 90 12 2 3 4 5 6 7 8 9 10 11 12 13 ; proc univariate normal; class c; var x; proc npar1way wilcoxon; class c; var x; run;
3、求秩和,并确定检验统计量 当两样本例数不等 时,取样本例数小值为n1,其秩和为T。
4、确定P值和作出推断结论。本例n1=10,n2-n1= 2,T=170,查附表11,得双侧P<0.01,按=0.05水 准拒绝H0,接受H1。对照组平均秩次为83/12=6.92, 实验组平均秩次170/10=17.00,故可认为实验组平 均生存日数较对照组长。
1582
20
4
24
77~ 100
88.5
1770
354
n1=38 n2=62 100
-
- T1=2559 T2=2491
1、建立假设
H0:家庭功能良好和家庭功能障碍的糖 尿病患者的血糖控制情况无差别
H1:家庭功能良好的糖尿病患者的血糖 控制情况优于家庭功能障碍的糖尿病患者
单侧 =0.05 2、编秩 本资料为等级资料,编秩的方法
第二节 两样本分布比较的秩和检验 一、两组数值变量资料的秩和检验 (一)秩和检验(Wilcoxon)方法步骤
医学统计学-秩与检验
例题9.3
对无淋巴细胞转移与有淋巴细胞转移的胃癌患者, 观察其生存时间,问两组患者的生存时间是否不同?
两组患者生存时间(月)
无淋巴细胞转移
有淋巴细胞转移
时间 秩次
时间 秩次
12
4.5
5
1
25
10
8
2
27
11
12
4.5
29 12.5
12
4.5
38
17
12
4.5
42
19
17
7
46
20
21
8
46
21
24
据,取平均秩次。
3.求各组秩和:将各组秩次相加,即Ti,i表示组号。。
4.计算检验统计量:
HN1N21(
Ti2)3(N1) ni
相同秩次太多时,上式需校正。
5.确定p值,得出结论:
(1)当k=3,每组例数≤5,查H界值表。
(2)k>3,ni>5,近似服从 k 1χ2的分布,查χ2界值表。
H 的校正与2近似
实 行 良 好 口 腔 卫 生 习 惯 6个 月 后 牙 周 情 况 的 变 化 程 度
变化对应的分数
+3 +2 +1 0 -1 -2 -3
人数
4 5 6 5 4 2 2
1. 建立假设H0:差值总体中位数为0 H1:差值总体中位数不为0; α=0.05
2. 计算统计量
d
(1)
1 2 3 合计
3.
正负秩和计算表
故可认为四组DNA含量有差别。
例 9.6下表是霍乱菌苗不同途径免疫21天后血清抗 体滴度水平测定结果,问各组间的血清抗体滴度水平之 间差异是否有统计学意义?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
检验水准α=0.05
2.计算检验统计量T值: (1)求出各对数据的差值. (2)编秩
差值为0,不编秩,n要相应减小(有效n)。按差
值的绝对值从小到大编秩,并标明原差值的正负 号。
有绝对值相同且符号相同的差值,按顺序编秩;
绝对值相同但符号不同,须取平均秩次。秩次相 等称为相持。
秩次 (5) 10 -5 8 1.5 6 3.5 -1.5 9 7 3.5
T+=48.5
T-=6.5
10/90
本例配对样本差值经正态性检验,推断得总体不服从正态分
布,现用Wilcoxon符号秩检验。
配对设计资料的符号秩和检验步骤
1.建立检验假设,确定检验水准:
H0:差值的总体中位数等于零,即Md=0
秩次 (5) 10 -5 8 1.5 6 3.5 -1.5 9 7 3.5
T+=48.5
T-=6.5
13/90
求正、负秩和
(3)分别求正、负秩和: 本例, T+ =48.5,T- =6.5. T+ + T- =n(n+1)/2=[10(10+1)/2]=55,计算无误。 (4)确定检验统计量:任取T+或T-为统计量T ,宜取 T+或T-小者为统计量T 。 本例T+=48.5、T- =6.5,宜取较小T- =6.5者。
T+=62.5
T-=3.5
根据专业知识可知,尿氟含量值呈明显的正偏峰分布,对样 本观测值与已知总体中位数的差值做正态性检验(W检验)结 果是不满足单样本t检验条件,故选用Wilcoxon符号秩和检验。
21/90
单样本秩和检验的基本步骤
1.建立检验假设,确定检验水准:
H0
表 12-2 12 名工人尿氟含量(mmol/L)测定结果 尿氟含量 差值 秩次 X d=X-2.15 2.15 0 2.10 -0.05 -2.5 2.20 0.05 2.5 2.12 -0.03 -1 2.42 0.27 4 2.52 0.37 5 2.62 0.47 6 2.72 0.57 7 2.99 0.84 8 3.19 1.04 9 3.37 1.22 10 4.57 2.42 11
先选参数统计方法,后选非参数统计方法。
6/90
第一节 Wilcoxon符号秩和检验
符号:
7/90
一、配对设计的两样本比较
配对设计计量资料两处理效应的比较,一般采用配
对 t 检验,如果差数明显偏离正态分布,应采用 Wilcoxon配对符号秩和检验,亦称符号秩和检验
(signed rank test)。
肺癌病人
n1 10
T1 141.5
规定: n1≤n2, n1对应的秩和为 T。
27/90
1.建立检验假设,确定检验水准
H0:肺癌病人和矽肺工人的RD值总体中位数
相等(总体分布位置相同)
H1:肺癌病人的RD值高于矽肺工人的RD值
检验水准α=0.05
28/90
2.计算检验统计量T值
(1)编秩: 将两组数据从小到大统一编秩次 1)相同数据在同一个样本中,按顺序编秩 2)相同数据在不同样本中,须取平均秩次
14/90
3.确定P值,做出推断
(1)查表法 查配对设计T 界值表(附表10 p334 ): T 在其上、下界值范围内,P值大于相应的概率。 T 在其上、下界值范围外,P值小于相应的概率。 T 等于其上、下界限值,P值小于等于相应的概率。(内 大外小)
15/90
本例,n=10,T=6.5,查配对设计用的T界值表
8/90
配对设计资料的符号秩和检验
例12-1
某研究者欲研究保健食品对小鼠抗疲劳作用,
将同种属的小鼠按性别和年龄相同、体重相近配成对
子,共10对,并将每对中的两只小鼠随机分到保健食 品两个不同的剂量组,过一定时期将小鼠杀死,测得 其肝糖原含量(mg/100g),结果见表12-1, 问不同 剂量的小鼠肝糖原含量有无差别?
29/90
求秩和
(2)求秩和:以样本例数较小者为n1,其秩和为
T1(141.5)。 N=n1+n2,本例 N=22, T1 + T2
=[N(N+1)/2]=253,秩和计算无误。
(3)确定检验统计量T值:
若n1 = n2,则T= T1或T= T2 。若n1 ≠ n2 ,则T= T1 。
本例, T= 141.5。
T
T n(n 1) / 4 0.5 n(n 1)( 2n 1) / 24
若出现相持较多(如超过25%),用上式求得的Z 值偏小, 应按下公式计算校正的统计量值Zc。
Zc T n(n 1) / 4 0.5
3 ( t j tj)
n(n 1)(2n 1) 24 48 tj为第j个相同秩次(绝对值)的个数, 如,3.5,3.5,6,
30/90
3.确定P值,做出推断
(1)查表法:当n1≤10,且n2 - n1≤10查T界值表(附表11,p336,两独 立样本秩和检验用)。先从左侧找到n1(n1和n2中的较小者),本例为10; 再从表上方找两组例数的差(n2-n1),本例,n2-n1=2,在两者交叉处即为T 的临界值。 确定 P值方法同前。本例 T= 141.5,单侧:0.025<P<0.05,按α =0.05 水准,拒绝H0,可以认为肺癌病人的RD值高于矽肺工人的RD值。
4/90
非参数检验适用范围(资料)
定量资料不满足参数检验条件。
1.总体分布类型不清或总体分布呈明显偏态
分布,而又无适当转换法转为正态分布;
2.有序(等级)资料、秩次资料;
3.分组数据一端或两端有不确定数值 ;
4.总体方差不齐。
5/90
非参数检验特点
优点: 1.适用范围广,不受总体分布的限制 。 2.方法简单。 缺点: 检验效能低(适合用参数检验的资料,如果用非参数检验会 造成数据信息的丢失(观察值转秩次),检验效能下降) 。
12/90
小鼠对子号 (1) 1 2 3 4 5 6 7 8 9 10
表 12-1 不同剂量组小鼠肝糖原含量(mg/100g) 中剂量组 高剂量组 差值 d (2) (3) (4)=(3)-(2) 620.16 958.47 338.31 866.50 838.42 -28.08 641.22 788.90 147.68 812.91 815.20 2.29 738.96 783.17 44.21 899.38 910.92 11.54 760.78 758.49 -2.29 694.95 870.80 175.85 749.92 862.26 112.34 793.94 805.48 11.54
32/90
二、等级资料的两样本比较
例 12-4 某研究者欲评价新药按摩乐口服液治疗高甘油 三脂血症的疗效,将高甘油三脂血症患者189例随机分为两 组,分别用按摩乐口服液和山楂精降脂片治疗,数据见表 12-4,问两种药物治疗高甘油三脂血症的疗效有无不同?
绝对值相同但符号不同,须取平均秩次。秩次 相等称为相持。见表第三栏。
23/90
(3)分别求正、负秩和:分别以T+和 T-表示。 本例, T+ =62.5,T- =3.5. 核对:T++T- =n(n+1)/2=[11(11+1)/2]=66,计算无误。 (4)确定检验统计量:任取T+或T-为检验统计量T 。 一般应取T+或T-小者为T。 本例T-=3.5或T+=62.5宜取T-=3.5为检验统计量T。
若单组随机样本来自正态总体,比较其总体
均数与某已知常数是否不同,可用t检验;若
样本来自非正态总体或总体分布无法确定,
可用Wilcoxon符号秩和检验,检验总体中位
数是否等于某已知数值。
19/90
单样本资料的符号秩和检验例题
例12-2 已知某地正常人尿氟含量的中位数
为2.15mmol/L。今在该地某厂随机抽取12名工 人,测得尿氟含量(mmol/L)的结果见表12-2。 问该厂工人的尿氟含量是否高于当地正常人?
H1:差值的总体中位数大于零,即 Md>0
检验水准α=0.05
22/90
2.计算检验统计量T值:
(1)求差值 d=xi-2.15,见表第二栏。
(2)编秩:
差值为0,不编秩,n要相应减小(有效n)。按
差值的绝对值从小到大编秩,并标明原差值的 正负号。
有绝对值相同且符号相同的差值,按顺序编秩;
9/90
小鼠对子号 (1) 1 2 3 4 5 6 7 8 9 10
表 12-1 不同剂量组小鼠肝糖原含量(mg/100g) 中剂量组 高剂量组 差值 d (2) (3) (4)=(3)-(2) 620.16 958.47 338.31 866.50 838.42 -28.08 641.22 788.90 147.68 812.91 815.20 2.29 738.96 783.17 44.21 899.38 910.92 11.54 760.78 758.49 -2.29 694.95 870.80 175.85 749.92 862.26 112.34 793.94 805.48 11.54
(p334),双侧:T0.05,10=8-47,T0.02,10=5-50 得0.02<P<0.05,按α=0.05检验水准,拒绝H0,。 可以认为该保健食品的不同剂量对小鼠肝糖原含 量的作用不同。
16/90
(2)正态近似法(n>50时)超出附表10范围,可用正态近似法检验。
Z
T T 0.5
24/90
3.确定P值,做出推断 本例查配对设计T 界值表(p334 ),n=11,单侧: