【统计学】9基于秩次的非参数检验
医学统计学 -第10章 基于秩次的非参数检验
H0:多个总体分布相同(或者中位数相等) H1:多个总体分布不同或不全相同(或者中位数不全相等)
26
例10.5
某医院用3种方法治疗15例胰腺癌患者,每种方 法各治疗5例,治疗后生存月数如下表,问3种方法的 疗效有无差别?
当n≤50时,通过查T界值表来确定是否波动过
大
T在界值范围内,波动不大
P>α
T在界值范围外或等于界值时,波动大,P≤α
11
(4) 查表及推断结论 查T界值表T0.05(16)=29~107 由于T=28在上下界值范围外,所以P≤0.05。 按a=0.05检验水准拒绝H0,接受H1,可以 认为该厂工人尿铅含量不当地正常人有差异, 通过正负秩和的大小可以推断工人的尿铅含 量要高于正常人。
第十章 基于秩次的非参数检验
1
假设检验的方法分为两类
参数检验(parametric test)
已知总体分布类型,对未知参数(μ、π)进行统计推断 依赖于特定分布类型,比较的是参数 一般有严格的适用条件
如:样本来自正态分布、总体方差齐同等 这类方法比如:t检验、F检验等
非参数检验(nonparametric test)
Z
T n1(N 1) / 2 0.5
n1n2 (N 3 N
12N(N 1)
(t
3 j
t
j
))
2036 40(84 1) / 2 0.5
40 44 (843 84 (323 32) (323 32) (203 20)) 12 40 (84 1)
7.01
由于Z=7.01,大于Z0.05=1.96,所以P<0.05,按照α=0.05 检验水准拒绝H0,接受H1,可以认为夏冬两季居民体 内核黄素含量有差别。根据平均秩次可以知道夏季的含
基于秩次的非参数检验
第七章基于秩次的非参数检验前言:1. 问题的提出:前面学习了连续型资料两组样本均数差异的假设检验方法:★小样本用t检验,条件是变量服从正态分布和方差齐。
★大样本用Z检验(中心极限定理)。
如果是小样本,变量的分布不清、已知不服从正态分布或经数学转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?★需要一种不依赖于分布假定的检验方法,即非参数检验。
2. 基本概念:前面介绍的检验方法首先假定变量服从特定的已知分布(如正态分布),然后对分布的参数(如均数)作检验。
这类检验方法称为参数检验。
今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量分布的中心位置或分布形态作检验。
这类检验称非参数检验,由于其对总体分布不作严格假定,所以又称任意分布检验。
(1)非参数检验的优点:a. 不受总体分布的限制,适用范围广。
b. 适宜定量模糊的变量和等级变量。
c. 方法简便易学。
(2)缺点:对于适合用参数检验的资料,如用非参数检验会造成信息的丢失,犯第Ⅱ类错误的概率增大,造成检验功效下降。
(3)基于秩次的非参数检验(秩和检验)的基本思想:例:假设有一组观察值为1.1, 1.3, 1.7, 4.3, 11.4 。
显然这一变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。
如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。
对秩和分布的中心位置(平均秩和)作检验,这就是秩和检验。
一.配对样本的符号秩检验(Wilcoxon signed rank test):例7.1:研究出生先后的孪生兄弟智力是否存在差异?表7.3 12对孪生兄弟智力测试结果9 70 65 -5 -5.510 71 80 9 911 88 81 -7 -812 87 72 -15 -11差值一般在5左右,但个别较大,如15,可能不服从正态分布。
第十章基于秩次的非参数检验课件
缺点:方法比较粗糙,对于符合参数检验条件者,采用
非参数检验会损失部分信息,其检验效能较低;样本含
2020/9/24量较大时,两者结论常相同
10
一、非参数统计的概念
秩次:观察值由小到大排列后得到的秩序号, 当几个数据大小相同时,取平均秩次作 为其秩次。
秩和:用秩次代替原始数据求和得到。 秩和检验:用秩和进行假设检验的方法。
(甲,乙,丙,丁,戊)(很好,好,一般,差)
2020/9/24
等级资料?
2
以下资料如何进行统计推断呢?
•不服从正态分布的资 料 •多组资料满足正态分 布但方差不齐 •等级资料
2020/9/24
非参数检验方法!
3
第十章 基于秩次的非参数检验
nonparametric test
第十章 基于秩次的非参数检验
2020/9/24
11
本章介绍的非参数统计方法 均基于秩次
秩次(rank)——将数值变量值从小到大,或等级变量值从弱到
强所排列的序号。
例1 11只大鼠存活天数:
存活天数4,10,7,50,3,15,2,9,13,>60,>60
秩次 3 6 4 9 2 8 1 5 7 10 11
秩次相同(tie)取平均秩次!!
10.5 10.5
例2 7名 肺炎病人的治疗结果: 危险程度 治愈 治愈 死亡 无效 治愈 有效 治愈
秩次 1 2 7 6 3 5 4 平均秩次 2.5 2.5 7 6 2.5 5 2.5
2020/9/24
12
二、配对设计和单样本资料的符号秩和检验
(一)、 配对设计资料的符号秩和检验
例10-1 某研究者欲研究保健食品对小鼠抗疲劳作用,将同 种属的小鼠按性别和年龄相同、体重相近配成对子,共10 对,并将每对中的两只小鼠随机分到保健食品两个不同的 剂量组,过一定时期将小鼠杀死,测得其肝糖原含量 (mg/100g),结果见表10-1, 问不同剂量组的小鼠肝糖 原含量有无差别?
基于秩次的非参数检验PPT课件
表10-4 某地居民夏冬两个季节体内核黄素营养状况比较
核黄素 营养状况
例数
夏季
冬季
合计 累积频数 秩次范围 平均秩次
缺乏
10
22
32
32
1~32
16.5
不足
14
18
32
64
33~64 48.5
适宜
16
4
20
84
65~84 74.5
合计
40
44
84
-
-
n140 T11.5 61 04.5 81 47.5 41 62036
绝对值|d| 1.88 1.72 0.37 0.02 0.04 0.18 0.23 0.51 0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
秩次 12 10 5 1 2 3 4 6 7 8 9 12 12 14 15 16
分配符号 -12 -10 -5 -1 2 3 4 6 7 8 9 12 12 14 15 16
9
3
14.9
13.5
1.4
3
3
4
30.2
27.6
2.6
8
8
5
8.4
9.1
-0.7
1.5
-1.5
6
7.7
7.0
0.7
1.5
1.5
7
16.4
14.7
1.7
5
5
8
19.5
17.2
2.3
6
6
9
127.0
155.0
-28.0
10
-10
10
18.7
16.3
第十章 基于秩次的非参数检验(本)_PPT幻灯片
(二)正态近似法
若n>25,超出T界值表的范围,可用正态 近似法作Z检验:
T nn 1 4
T n(n 1)(2n 1)/ 24
Z T T T nn 1 4 0.5
T
n(n 1)(2n 1)/ 24
式中0.5为连续性校正数。
如果相同秩次较多(不包括差值为0 者),应计算校正的Zc。
T nn1 4 0.5
0
77
65
-12
-10
91
90
-1
-1.5
70
65
-5
-5.5
71
80
9
9
88
81
-7
-8
87
72
-15
-11
T+=24.5, T-=41.5
H0:Md=0 (M1=M2) H1:Md≠0 (M1≠M2) α=0.05 求各对子的差值d; 编秩:按差值绝对值大小编秩并加上正负号,差值的绝对值
相同时取平均秩次;
治疗后 4.2 5.5 6.3 3.8 4.4 4.0 5.9 8.0 5.0
差值(d)
秩次
1.8
6.5
-0.7
-4.5
-1.8
-6.5
-0.4
-3
2.6
8
-0.2
-2
0.1
1
-4.5
-9
-0.7
-4.5
T+=15.5, T-=29.5
(二)方法步骤
H0:Md=0 H1:Md≠0
α=0.05
求各对子的差值d;
H0:Md=0 (即M=2.15) H1:Md>0 (即M>2.15) 单侧α=0.05
非参数统计中的秩和检验方法详解(Ⅰ)
非参数统计中的秩和检验方法详解统计学是一门研究数据收集、分析、解释和展示的学科,它在各个领域都有着广泛的应用。
而在统计学中,参数统计和非参数统计是两种常见的方法。
参数统计是根据总体的参数进行推断,而非参数统计则是不对总体参数做出假设的一种统计方法。
在非参数统计中,秩和检验方法是一种常用且重要的方法。
本文将详细介绍非参数统计中的秩和检验方法。
一、秩和检验简介秩和检验是一种基于秩次的非参数检验方法,它主要用于对两个独立样本或多个相关样本的总体分布进行比较。
这种方法的优势在于对数据的分布形状没有要求,适用于各种类型的数据。
在进行秩和检验时,首先需要将样本数据进行排序,然后根据排序后的秩次进行计算。
接下来,通过比较秩和的大小来进行假设检验,从而得出结论。
二、秩和检验的应用场景秩和检验方法可以应用于诸多实际场景中。
比如,在医学研究中,可以用秩和检验方法来比较两种不同治疗方法的疗效;在工程领域,可以用秩和检验方法来比较不同生产工艺的产品质量;在市场营销中,可以用秩和检验方法来比较不同促销策略的效果等等。
总之,秩和检验方法在实际问题的解决中有着广泛的应用。
三、秩和检验的类型秩和检验包括了许多不同类型,其中最常见的包括Mann-Whitney U检验、Wilcoxon秩和检验和Kruskal-Wallis H检验。
下面将分别对这些检验进行详细介绍。
1. Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两个独立样本的非参数检验方法。
它基于两组数据的秩次进行比较,通过计算秩和来判断两组数据是否来自同一总体分布。
Mann-Whitney U检验的原假设是两组样本来自同一总体分布,备择假设是两组样本来自不同总体分布。
通过计算U统计量和p值来进行假设检验,从而得出结论。
2. Wilcoxon秩和检验Wilcoxon秩和检验是一种用于比较两个相关样本的非参数检验方法。
它与Mann-Whitney U检验类似,同样是基于秩次进行比较。
统计学选择题
一、选择题1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
A.已知二组患者的白细胞计数均降低B.已知二组患者的白细胞计数均升高C.不清楚哪一组的白细胞计数水平有变化D.已知非典型肺炎患者的白细胞计数不高于普通肺炎E.两组白细胞计数值的总体方差不相等【答案】D9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为______.A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比D.应进行假设检验后再下结论E.以上都不对【答案】D10.比较两个率时,不需要进行率的标准化的情况有______.A.内部构成不同B.内部构成相同C.未知各年龄别人口数D.缺乏各年龄别死亡人数E.不易寻找标准人口构成【答案】B11.四格表资料在哪种情况下作χ2检验不必校正______.A.T>1且n>40B.T>5或n>40C.T>5且n>40D.1E.T>5且n<40【答案】C12.欲比较三种药物的疗效(无效、好转、显效、痊愈)孰优孰劣,最好选择______.A.t检验B.方差分析C.χ2检验D.秩和检验E.u检验【答案】D13.下面说法中不正确的是_____.A.没有个体差异就不会有抽样误差B.抽样误差的大小一般用标准误来表示C.好的抽样设计方法,可避免抽样误差的产生D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别【答案】C14.实验设计和调查设计的根本区别是_____.A.实验设计以动物为对象B.调查设计以人为对象C.调查设计可随机分组D.实验设计可人为设置处理因素E.以上都不对【答案】D15.在下述抽样调查方法中,在样本量相同的前提下,抽样误差最小的是_____.A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样E.多阶段整群抽样【答案】C16.对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______.A.有相关关系B.无任何关系C.无直线相关关系D.无因果关系E.有伴随关系【答案】C17.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组无任何处理,这种对照属于______.A.实验对照B.空白对照C.相互对照D.标准对照E.历史对照【答案】B18.在两独立样本比较的秩和检验中,实验组的观察值为0,0,7,14,32,40,对照组的观察值为0,1,2,4,4,8.编秩中零值的秩应分别编为______.A.2,3;1B.1.5,1.5;3C.2,2;2D.2.5,2.5;1E.不参加编秩【答案】C19.两样本比较的秩和检验(两组样本例数相等),如果假设成立,则对样本来说:______.A.两组秩和相等B.两组秩和的绝对值相等C.两组秩和相差很大D.两组秩和相差一般不会很大E.两组秩和的差值相等【答案】D20.在简单线性回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明______.A.X对Y的影响占Y变异的30%B.X增加一个单位,Y平均减少30%C.X增加一个单位,Y平均减少0.30个单位D.Y增加一个单位,X平均减少30%E.Y增加一个单位,X平均减少0.30个单位【答案】C二、多选题在A、B、C、D和E中选出一个最佳答案,将答案的字母填在相应下划线的空格里。
【统计学】9基于秩次的非参数检验
第一节 单样本和配对资料的符号秩和检验
• 单样本符号秩和检验 • 又称符号秩和检验(signed rank test ),差数秩和检验 • 适用:不能用单样本t检验进行分析的资料。 • 目的:是推断样本中位数与已知总体中位数是否相等。 • 例题:已知某地正常人尿铅含量的中位数为2.5微摩尔/升,今在
0.40 2 0.30 1.5 0.36 1 0.70 3 0.16 1 0.60 1
— 9.5
八月 测定值 秩次
0.35 1
0.30 1.5 0.50 2 0.10 1 0.80 2 1.55 2
—
9.5
56
方法一:
(1)编秩 每一区组(同一采样点)数据由小到大编秩。编秩时,若 有相同数据则取平均秩次,若第2行有2个0.3,均取原秩次1和2的平 均秩次1.5。
30
• 确定p值,下结论 • 查表得T0.05(12)=13-65, • 本例 T+=68, T-=10,不在范围之内,P<0.05 ,拒绝Ho,接受H1,
两种方法处理效果不同
31
两种方法治疗扁平足效果观察
病例号
原始记录 A法 B法
1
好
差
2
好
好
3
好
差
4
好
中
5
差
中
6
中
差
7
好
中
8
好
差
9
中
中
10
差
差
11
)
(
52 3
52
)
( 483 300 3
48 ) 300
(
62 3
62
)
( 98 3
98
非参数检验
2011-01-09
36
(1)建立检验假设
H0
H1
:肺炎患者与正常人的血铁蛋白总体分布相同 :肺炎患者与正常人血铁蛋白总体分布不同
α =0.05
(2)计算检验统计量 T 值 编秩 将两组数据合起来由小到大统一编秩,即从小到大编号,最 小的数据的秩为 1,第二小的数据的秩为 2,依此类推。编秩时如遇 有相同数据,且相同数据在不同组时,要取其平均秩次,例如,本 例中有两个数据均为 68,应编秩次为 11,12,取平均秩次(11+12) /2=11.5。若相同数据在同一组,可取平均秩次,也可不取,如本例 中有 3 个 47,可编秩次 6、7、8,也可取其平均秩次为 7。
0 -0.05 0.05 -0.03 0.27 0.37 0.47 0.57 0.84 1.04 1.22 2.42
0 -0.05 -2.5 0.05 2.5 0.03 -1 0.27 4 0.37 5 0.47 6 0.57 7 0.84 8 1.04 9 1.22 10 2.42 11
29
(2)编秩,方法同上。 (3)求秩和T+=62.5,T-=3.5,取T=3.5。 3.确定P值,做出推断结论 本例n=11,T=3.5,查T界值表得P<0.05,按
2011-01-09
11
第二节
配对设计和单样本资料 的符号秩和检验
2011-01-09
12
【案例1】
留取12名在医用仪表厂工作的工人尿液,分成两份,一份用 离子交换法,另一份用蒸馏法测得尿汞值如下,问两种方法 测得尿汞值平均含量有无差别? 表1
编 号 离子交换法 蒸馏法 1 0.200 0.320
20
校正公式:
zc = T − n(n + 1) / 4 − 0.5 n(n + 1)(2n + 1) ∑ (t j − t j ) − 24 48
卫生统计学复习题库(含答案)
卫生统计学复习题库(含答案)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)直方图(适用于数值变量,连续性资料的频数表变量)直条图(适用于彼此独立的资料)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性材料,尤其比较数值相差差异的多组材料时接纳,线段的升降用来表示某事物的开展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的整体是1000名易感儿童E.该研究的整体是228名阳性儿童【答案】D5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.整体中随机抽取的一局部D.总体中选取的有意义的一部分E.总体中信息明确的一部分【谜底】C6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的均匀值【谜底】D7.某地易感儿童打针乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其均匀水平,宜接纳______.A.均数B.几何均数C.中位数D.方差E.四分位数间距【谜底】B多少均数(geometric mean)是用于反映一组经对数转换后呈对称分布的变量值在数量上的均匀水平,在医学研究中常适用于免疫学的目标。
医学统计学重要试题1
医学统计学重要试题1一、选择题1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P 越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
A.已知二组患者的白细胞计数均降低B.已知二组患者的白细胞计数均升高C.不清楚哪一组的白细胞计数水平有变化D.已知非典型肺炎患者的白细胞计数不高于普通肺炎E.两组白细胞计数值的总体方差不相等【答案】D9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为______.A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比D.应进行假设检验后再下结论E.以上都不对【答案】D10.比较两个率时,不需要进行率的标准化的情况有______.A.部构成不同B.部构成相同C.未知各年龄别人口数D.缺乏各年龄别死亡人数E.不易寻找标准人口构成【答案】B11.四格表资料在哪种情况下作χ2检验不必校正______.A.T>1且n>40B.T>5或n>40C.T>5且n>40D.1E.T>5且n<40【答案】C12.欲比较三种药物的疗效(无效、好转、显效、痊愈)孰优孰劣,最好选择______.A.t检验B.方差分析C.χ2检验D.秩和检验E.u检验13.下面说法中不正确的是_____.A.没有个体差异就不会有抽样误差B.抽样误差的大小一般用标准误来表示C.好的抽样设计方法,可避免抽样误差的产生D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别【答案】C14.实验设计和调查设计的根本区别是_____.A.实验设计以动物为对象B.调查设计以人为对象C.调查设计可随机分组D.实验设计可人为设置处理因素E.以上都不对【答案】D15.在下述抽样调查方法中,在样本量相同的前提下,抽样误差最小的是_____.A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样E.多阶段整群抽样【答案】C16.对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______.A.有相关关系B.无任何关系C.无直线相关关系D.无因果关系E.有伴随关系【答案】C17.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组无任何处理,这种对照属于______.A.实验对照B.空白对照C.相互对照D.标准对照E.历史对照【答案】B18.在两独立样本比较的秩和检验中,实验组的观察值为0,0,7,14,32,40,对照组的观察值为0,1,2,4,4,8.编秩中零值的秩应分别编为______.A.2,3;1B.1.5,1.5;3C.2,2;2D.2.5,2.5;1E.不参加编秩19.两样本比较的秩和检验(两组样本例数相等),如果假设成立,则对样本来说:______.A.两组秩和相等B.两组秩和的绝对值相等C.两组秩和相差很大D.两组秩和相差一般不会很大E.两组秩和的差值相等【答案】D20.在简单线性回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明______.A.X对Y的影响占Y变异的30%B.X增加一个单位,Y平均减少30%C.X增加一个单位,Y平均减少0.30个单位D.Y增加一个单位,X平均减少30%E.Y增加一个单位,X平均减少0.30个单位【答案】C:二、二、多选题在A、B、C、D和E中选出一个最佳答案,将答案的字母填在相应下划线的空格里。
第十章基于秩次的非参数检验
53-99
55-105
…
47-97
49-103
51-109
45-99
47-105
49-111
…
…
…
…
说明
• 如果n1或n2-n1超出了T界值表的范围, 可用正态近似检验。
正态近似法
当n1>10或(n2-n1)>10时
连续性校正
Z T n1 (n1 n2 1) 2 0.5
n1n2 (n出1 现n2相1同) 1的2 数据 若Z值超过标准正态分布的临界值,则拒绝 H0;若出现相持较多,则用下式进行校正
秩次
8
7
6
0.3
1
2.2
6
3.5
9
10
n2=8
表1 高中生与大学生的每周平均上网时间比较(小时/周)
高中生
上网时间
秩次
0.5
2 2.5
3
1
4
0.5
3 2.5
11
1.5
5
2.5
7
3.5
n1=8
大学生
上网时间
秩次
8
7
6
0.3
1
2.2
6
3.5
9
10
n2=8
表1 高中生与大学生的每周平均上网时间比较(小时/周)
α=0.05
秩和检验的步骤
2. 编秩
3.
将两组数据由小到大统一编秩,编
秩时如遇有相同数据,取平均秩次。
4. 3. 求秩和
5.
两组秩次分别相加。
6. 4. 确定统计量
7.
若两组例数相等,则任取一组的秩
和为统计量,若两组例数不等,则以样本
统计学:非参数检验
例10-1 某研究者欲研究保健食品对小鼠抗 疲劳作用,将同种属的小鼠按性别和年龄相 同、体重相近配成对子,共10对,并将每对 中的两只小鼠随机分到保健食品两个不同的 剂量组,过一定时期将小鼠杀死,测得其肝 糖原含量(mg/100g),结果见表10-1, 问 不同剂量组的小鼠肝糖原含量是否不同?
5
表10-1 不同剂量组小鼠肝糖原含量(mg/100g) 小鼠对号 中剂量组 高剂量组 差值 d (1) (2) (3) (4)=(3)-(2) 1 620.16 958.47 338.31 2 866.50 838.42 -28.08 3 641.22 788.90 147.68 4 812.91 815.20 2.29 5 738.96 783.17 44.21 6 899.38 910.92 11.54 7 760.78 758.49 -2.29 8 694.95 870.80 175.85 9 749.92 862.26 112.34 10 793.94 805.48 11.54
15
表 10-3 某河流甲乙断面亚硝酸盐氮含量(mg/L)监测
河流甲断面 亚硝酸盐氮 秩次 含量 0.014 1.0 0.018 2.5 0.024 8.5 0.025 10.5 0.027 12.0 0.034 15.0 0.038 19.0 0.043 20.0 0.064 22.5 0.100 25.0 n1=10 T1=136 亚硝酸盐氮 含量 0.018 0.019 0.020 0.022 0.023 0.024 0.025 0.028 0.030 0.035 河流乙断面 秩次 亚硝酸盐氮 含量 2.5 0.036 4.0 0.037 5.0 0.055 6.0 0.064 7.0 0.067 8.5 10.5 13.0 14.0 16.0 n2=15 秩次 17.0 18.0 21.0 22.5 24.0
医学统计学(课件)基于秩次的非参数检验
缺点:方法比较粗糙,对于符合参数检验条件者,采用 非参数检验会损失部分信息,其检验效能较低;样本含 量较大时,两者结论常相同
本章内容
配对设计和单样本资料的符号秩和检验 完全随机设计两组独立样本的秩和检验 完全随机设计多组独立样本的秩和检验
秩次与秩和
秩次(rank),秩统计量 是指全部观察值按某种顺序排列的位序。一般
对于分布不知是否正态的小样本资料,为保险起见,宜选 用非参数检验
对于一端或两端是不确定数值(如<0.5、>0.5等)的资料, 不管是否正态分布,只能选用非参数检验
对于等级资料,若选行×列表资料的卡方检验,只能推断 构成比差别,而选用非参数检验,可推断等级强度差别
参数检验
(parametric test)
秩和检验的目的是推断两个总体分布的位置是否有差 别,而不关心其分布的形状有无差别
两个总体分布位置不同,实际情况一般是两个总体分 布形状相同或类似,这时可简化为两个总体中位数不 等
一、两组连续变量资料的秩和检验
如果资料方差相等,且服从正态分布,就可以 用t检验比较两样本均数
如果此假定不成立或不能确定是否成立,就应 采用秩和检验来推断两样本分别代表的总体分 布是否不同
11.5 11(111) / 4 0.5
u
1.91
11(111)(2 111) (23 2)
24
48
u <1.96, 故P>0.05,在 0.05 水准上接受H0,拒绝H1, 结论与查表法相同。
注意
符号秩检验若用于配对的等级资料,则先把等 级从弱到强转换成秩(1,2,3,…);然后求各对 秩的差值,省略所有差值为0的对子数,令余下的有 效对子数为n;最后按n个差值编正秩和负秩,求正 秩和或负秩和。但对于等级资料,相同秩多,小样 本的检验结果会存在偏性,最好用大样本。
基于秩次的非参数检验PPT课件
18
编辑版ppt
表10-2 两法测定11份工业污水中氟离子浓度结果比较
样品号
氟离子浓度
差值d 差值秩次 分配符号
(1)
电极法(2) 分光光度法(3) (4)=(2)-(3)
1
10.5
8.8
1.7
4
4
2
21.6
18.8
2.8
9
基于秩次的非参数检验
1
编辑版ppt
基于秩次的非参数检验
单样本和配对设计资料的符号秩和检验 两组独立样本比较的秩和检验 多组独立样本比较的秩和检验 随机区组设计多组比较的秩和检验 案例讨论
2
编辑版ppt
非参数检验
假设检验方法分为参数检验和非参数检验 参数检验
以特定的总体分布为前提,对未知的总体参数做推 断
5
编辑版ppt
非参数检验
满足参数检验的资料采用非参数检验,会损失 数据信息,降低检验效能
秩和检验
常用的且检验效能较高的非参数检验方法 较完备的大样本抽样分布理论基础。 以秩和为检验统计量
6
编辑版ppt
单样本和配对设计资料的符号秩和检验
Wilcoxon符号秩和检验
推断总体中位数是否等于某个指定值(常数) 可用于单样本设计或配对设计,定量资料不满足参
查表法
根据n和T查附表9(配对比较的符号秩和检验) 若T值在上、下界值内,P值大于相应的概率; 若T值等于上、下界值,P值等于相应概率; 若T值在上、下界值范围外,P值小于相应的概率。 本例:n=16,T=108或28,查表得0.01<P<0.025
13
编辑版ppt
第九章 基于秩次的非参数统计方法 ppt课件
区组设计各处理组的观察指标是数值变量 资料,且满足方差分析的条件时,可用随机 化区组设计方差分析。否则,可用本节介绍 的Friedman秩和检验。
一、多组相关样本比较的FriedmanM 检验
多组相关样本比较的秩和检验是由Friedman在 符号检验的基础上提出来的,常称为
FriedmanM 检验,目的是推断各处理组样本分 别代表的总体分布位置是否不同。
3. 确定P 值,作出推断
(1)查表法 当b≤15,k≤15时,查M 界值表(附 表11)。
(2)χ2 分布近似法 当处理数k 或区组数b 超出M 界值表的范围时,可以采用近似χ2 分布法。
二、多重比较
对于多组相关样本比较,当用Friedman检验 拒绝H0 后,同样需要对各处理组间进行多重
比较,与完全随机设计秩和检验的多重比较 类似,只是正态近似检验中的估计方差的算 法不同。
其方法步骤如下: 1. 建立检验假设,确定检验水准 H0:任两组的总体分布位置相同 H1:任两组的总体分布位置不同 α=0.05
• 如果老师最后没有总结一节课的重点的难点,你 是否会认为老师的教学方法需要改进?
• 你所经历的课堂,是讲座式还是讨论式? • 教师的教鞭
• “不怕太阳晒,也不怕那风雨狂,只怕先生骂我 笨,没有学问无颜见爹娘 ……”
• “太阳当空照,花儿对我笑,小鸟说早早早……”
学习内容
第一节 第二节
秩检验 第三节 第四节 第五节
1. 建立检验假设,确定检验水准 H0:四个季节婴儿出生数的总体分布位置相同 H1:四个季节婴儿出生数的总体分布位置不同
或不全相同
α=0.05 2. 计算统计量M 值 先将各区组内数据由小
到大编秩,遇相同数值取平均秩次。再将各 处理组的秩次相加,得到各处理组秩和Rj。按
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 怎样编秩? • 编秩就是将观察值按顺序由小到大排列,并用序号代替原始变
量值本身。不同的实验设计类型,有不同的编秩规则.
15
配对资料的编秩规则
按照配对设计,先求出对子之间的差值,按其差 值的绝对值,从小到大进行排序,其序号即秩次, 并在秩次之前保持原差值的正负号不变。 编秩遇到差值为零时则舍去不编秩; 对绝对值相等的差值取平均值,并在秩次之前保持原 差值的正负号; 一般来说,秩次最小为1,最大为对子数N,当有差值 为零时,最大秩次等于对子数n减去差值为零的个数 。
法确定,可选用wilcoxon(威尔科克森)符号秩和检验方法; • 若是两组独立样本资料,来自非正态分布的定量资料或有序二分类变量
资料(等级资料)宜用wilcoxon秩和检验。
18
• 若是多组独立样本资料,来自非正态总体或方差不齐(转化后也 不满足)的定量资料或者是有序多分类变量资料(等级资料)宜 用Kruskal-Wallis秩和检验。
• A组 4.7 6.4 2.6 3.2 5.2 • B组 1.7 2.6 3.6 2.3 3.7
12
• 两组各有5个变量值。现在依从小到大的顺序将它们排列起 来,并标明秩次,结果如下:
• A组
2.6 3.2
4.7 5.2 6.4
• B组 1.7 2.3 2.6 3.6 3.7
• 秩次 1 2 3 4 5 6 7 8 9 10
例题 采用配对设计,用某种放射线的A,B 两种方式分别局部照射家兔的两个部位,观察放 射性急性皮肤损伤程度,见表。 比较A,B的损 伤程度是否不同。
26
27
• 1、检验பைடு நூலகம்骤:
• H0:两处理效应相同
• H1:两处理效应不相同。
•
a=0.05
• 2.求差值
• 3、编秩次、求秩和
•
28
29
• 求秩号和即将正、负秩号分别相加,本例得正秩号和为68,负秩 号和为10,正负秩号绝对值之和应等于n(n+1)/2,可用以核对, 如本例 68+10=12(12+1)/2=78,说明秩号计算正确。
• 若是随机区组设计的自非正态总体或方差不齐(转化后也不满足) 的定量资料,宜用Firedman秩和检验。
19
注意:
秩和检验确定P值通常有: ①查表确定p值,适用于小样本; ②正态近似法,计算z值,确定p值,适用于大样本的资料。 在相同秩次的个数大于样本量的25%时需要采用相应的公式进行校 正。
20
13
• 原始值中有两个“2.6”,分属A、B组,它们的秩次应是3和4,然 而它们的数值本来是同样大小的,哪组取“3”,哪组取“4”呢? 我们计算它们的平均数(3+4)/2=3.5,作为“2.6”的秩次,称为 “平均秩次”,这样才公平合理。这样两组所得的秩次及秩和如 下:
• A组 3.5 5 8 9 10 /35.5 • B组 1 2 3.5 6 7 /19.5
• 当n>50,采用正态分布法
T n(n 1) / 4 0.5
z
•
n(n 1)(2n 1) / 24
24
T为T+或者Tn为样本含量 0.5为连续性校正数
当相同秩次(差值较多时)用校正公式:
T n(n 1) / 4 0.5
z
n(n 1)(2n 1)
(t
3 j
t
j
)
24
48
25
• 二、配对设计资料的秩和检验
差值d 0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
秩次 7 8 9 12 12 14 15 16
• 3、确定p值
• 当n≤50,查附表9 根据n的大小,当统计量T值在α界值范围之内,则 P>α,当等于界值或超出界值范围,则P ≤ α。本例T在界值范围之外, P<0.05,拒绝Ho,接受H1.
30
• 确定p值,下结论 • 查表得T0.05(12)=13-65, • 本例 T+=68, T-=10,不在范围之内,P<0.05 ,拒绝Ho,接受H1,
两种方法处理效果不同
31
两种方法治疗扁平足效果观察
病例号
原始记录 A法 B法
该地某厂随机抽取16名工人,测定血铅值,问该厂工人的血铅值 是否高于当地正常人?
21
• 1、建立检验假设 • Ho: 该厂的工人血铅值和正常人相同 • H1:该厂的工人血铅值高于正常人 • 单侧 α=0.05 • 2、计算统计量T (见下表) • (1)求差值d=x-2.5 • (2)编秩次,根据差值绝对值排序,序号前加符号 • (3)求秩和
第一节 单样本和配对资料的符号秩和检验
• 单样本符号秩和检验 • 又称符号秩和检验(signed rank test ),差数秩和检验 • 适用:不能用单样本t检验进行分析的资料。 • 目的:是推断样本中位数与已知总体中位数是否相等。 • 例题:已知某地正常人尿铅含量的中位数为2.5微摩尔/升,今在
基于秩次的非参数检验
2
3
4
5
6
5、组内个别观察值偏离过大的资料。 6、开口分组资料。
7
8
9
秩和检验几个概念 • 秩次与平均秩次 • 秩和 • 编秩与编秩原则
10
11
一、秩次和秩和
• “秩”即按数据大小排定的次序号,又称秩次号。编秩就是将观 察值按顺序由小到大排列,并用序号代替原始变量值本身。用秩次 号代替原始数据后,所得某些秩次号之和,即按某种顺序排列的序 号之和,称为秩和。设有以下两组数据:
16
完全随机设计的两组或多组资料的编秩规则
❖将各组变量依据从小到大的顺序进行统一排序,其 序号即为秩次,
❖如果有多个相等的变量值分布在同一组中,则按顺 序依次对其编列秩次,如果有多个相等的变量值分 布在不同组中,则按顺序排序然后取其平均秩次。
17
怎样选用不同设计的秩和检验方法
• 首先要区分试验设计和资料的类型: • 若是一个样本资料或者配对设计的资料,来自非正态总体或总体分布无
22
尿铅X 0.62 0.78 2.13 2.48 2.54 2.68 2.73 3.01
差值d -1.88 -1.72 -0.37 -0.02 -0.04 0.18 0.23 0.51
秩次 -12 -10 -5 -1 -2
3 4 6
T+=108, T-=28
23
尿铅X 3.13 3.27 3.54 4.38 4.38 5.05 6.08 11.27