第7章基于秩次的非参数检验
秩转换的非参数检验

(2)正态近似法u 检验 如果n超出附表10范 围,则用以下公式计算u值,进行u检验:
u T n1 (n1 n2 1) / 2 t 3 t j) ( j n1n2 (n1 n2 1) 1- 3 12 N N
( t C 1-
3 3 j
二、两组频数表或等级资料比较
例8-4 39名吸烟工人和40名不吸烟工人的碳氧血红蛋 白HbCO(%)含量见表8-6。问吸烟工人的HbCO(%)含量 是否高于不吸烟工人的HbCO(%)含量?
表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较 含量 吸烟 不吸烟 合 秩次 平均 秩和 工人 工人 计 范围 秩次 吸烟 不吸烟
(3)计算正负秩和: T = 54.5, T = 11.5 (4)确定检验统计量T 任取T 和 T 为T ,本例取T =11.5。 3.确定P 值,作出推论: (1) n≤50,查表法。本例n=11,查附表9得 T0.05, 为 ~56, 11 10
本例11.5在此范围内,故P >0.05,按α =0.05 水准,不拒绝Ho 还不能认为两法测定结果有差别。 (2) n>50,u 检验。
第八章
秩转换的非参数检验
非参数检验的概念: 非参数检验是指对原始资料无特殊要求(如正 态分布、总体方差相等)的一类检验方法,它不 是比较参数,而是比较分布的位置。不符合t 检验 和F检验的数值变量资料可用秩和检验,此外,秩 和检验还可用于两组或多组等级资料以及“开口” 资料的比较。等级相关也属于非参数检验。
表8-9 三种药物杀灭钉螺的死亡率(%)比较 甲药 乙药 丙药 死亡率 秩次 死亡率 秩次 死亡率 秩次 32.5 10 16.0 4 6.5 1 35.5 11 20.5 6 9.0 2 40.5 13 22.5 7 12.5 3 46.0 14 29.0 9 18.0 5 49.0 15 36.0 12 24.0 8 63 ─ 38 ─ 19 Ri ni 5 ─ 5 ─ 5
卫生学医学统计学流行病学试题及精准答案

卫生学一、名词解释1、生物富集作用:生物富集作用又叫生物浓缩,是指生物将环境中低浓度的化学物质,通过食物链的转运和蓄积达到高浓度的能力。
2、原生环境:原生环境指天然形成,并且基本上未受人为活动影响的自然环境,其中存在着对人体健康有利的许多因素。
3、limiting amino acid: 食品蛋白质中,按照人体的需要及其比例关系相对不足的氨基酸4、合理营养:合理营养的含义是,由食物中摄取的各种营养素与身体对这些营养素的需要达到平衡,既不缺乏,也不过多。
5、职业病:职业病是指企业、事业单位和个体经济组织等用人单位的劳动者在职业活动中,因接触粉尘、放射性物质和其他有毒、有害物质等因素而引起的疾病。
6、刺激性气体:刺激性气体(irritant gases)是指对眼、呼吸道粘膜和皮肤具有刺激作用的一类有害气体,在化学工业生产中最常见。
此类气体多具有腐蚀性,常因不遵守操作规程或容器、管道等设备被腐蚀而发生跑、冒、滴、漏而污染作业环境。
7、晚发性矽肺: 硅肺病,由于长期过量吸入含结晶型游离二氧化硅的岩尘所引起的尘肺病。
有时虽未出现矽肺征象,但在脱离工作后经若干年再出现矽肺,常称为"晚发性矽肺"8、population:population,表示考察对象的全体。
又称母体。
总体中每个成员称为个体。
population 表示考察对象的全体。
又称母体。
总体中每个成员称为个体。
9、统计推断:统计推断statistical inference 根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。
10、直线回归:线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。
二、简答1、简述大气污染对人类健康的危害。
大气是由一定比例的氮、氧、二氧化碳、水蒸气和固体杂质微粒组成的混和物。
对人体健康的危害:人需要呼吸空气以维持生命。
兰大《卫生统计学》15春在线作业1 答案

《卫生统计学》15春在线作业1
一、单选题(共15 道试题,共60 分。
)
1. 关于基于秩次的非参数检验,下列说法错误的是( )
A. 符号秩和检验中,差值为零不参加编秩
B. 两样本比较的秩和检验方法中的正态近似法为参数检验
C. 当符合正态假定时,非参数检验犯II类错误的概率较参数检验大
D. 当样本足够大时,秩和分布近似正态
E. 秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异
正确答案:B
2. 若X的方差等于6,Y的方差等于4.X与Y独立,则X-Y的方差等于( )
A. 0
B. 5
C. 2
D. 1
E. 10
正确答案:E
3. 在同一总体随机抽样,其他条件不变,样本含量越大,则( )
A. 样本标准差越大
B. 样本标准差越小
C. 总体均数的95%可信区间越窄
D. 总体均数的95%可信区间越宽
正确答案:C
4. 比较非典型肺炎和普通肺炎患者的白细胞计数水平,若( ),可作单侧检验。
A. 已知二组患者的白细胞计数均降低
B. 已知二组患者的白细胞计数均升高
C. 不清楚哪一组的白细胞计数水平有变化
D. 已知非典型肺炎患者的白细胞计数不高于普通肺炎
E. 两组白细胞计数值的总体方差不相等
正确答案:C
5. R×C表的卡方检验的自由度为( )
A. R-1
B. C-1
C. R*C-1
D. (R-1)(C-1)
E. R*C-2
正确答案:D。
卫生统计学复习题库(含答案)

卫生统计学复习题库(含答案)1.根据某地6至16岁学生近视情况的调查资料制作统计图,反映患者的年龄分布。
适用的图形种类是直方图,因为6至16岁是连续变量,得到的是连续变量的频数分布。
2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,适用的图形种类是复式直条图,因为有一个检测指标和两个分组变量。
3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,适用的图形种类是复式直条图,因为有一个检测指标和两个分组变量。
4.调查某疫苗在儿童中接种后的预防效果,样本是1000名易感儿童,因为这是研究的总体。
5.要通过样本作统计推断,样本应该是总体中随机抽取的一部分。
6.关于均数,正确的说法是均数是所有观察值的平均值。
7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,适用的描述平均水平的指标是几何均数。
The geometric mean is used to reflect the average level of a set of variable values that are XXX or a log-normal n (skewed n)。
such as antibody titers。
XXX us diseases。
XXX.According to the n d data of 164 cases of Salmonella food poisoning patients。
the one-sided 95% upper limit of the n d was calculated using the percentile method as 57.8 hours。
This means that approximately 5% of the patients have an n d greater than 57.8 hours.A is incorrect: Approximately 5 people have an n d greater than 57.8 hours。
基于秩次的非参数检验PPT课件

表10-4 某地居民夏冬两个季节体内核黄素营养状况比较
核黄素 营养状况
例数
夏季
冬季
合计 累积频数 秩次范围 平均秩次
缺乏
10
22
32
32
1~32
16.5
不足
14
18
32
64
33~64 48.5
适宜
16
4
20
84
65~84 74.5
合计
40
44
84
-
-
n140 T11.5 61 04.5 81 47.5 41 62036
绝对值|d| 1.88 1.72 0.37 0.02 0.04 0.18 0.23 0.51 0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
秩次 12 10 5 1 2 3 4 6 7 8 9 12 12 14 15 16
分配符号 -12 -10 -5 -1 2 3 4 6 7 8 9 12 12 14 15 16
9
3
14.9
13.5
1.4
3
3
4
30.2
27.6
2.6
8
8
5
8.4
9.1
-0.7
1.5
-1.5
6
7.7
7.0
0.7
1.5
1.5
7
16.4
14.7
1.7
5
5
8
19.5
17.2
2.3
6
6
9
127.0
155.0
-28.0
10
-10
10
18.7
16.3
非参数统计中的秩和检验方法详解(Ⅰ)

非参数统计中的秩和检验方法详解统计学是一门研究数据收集、分析、解释和展示的学科,它在各个领域都有着广泛的应用。
而在统计学中,参数统计和非参数统计是两种常见的方法。
参数统计是根据总体的参数进行推断,而非参数统计则是不对总体参数做出假设的一种统计方法。
在非参数统计中,秩和检验方法是一种常用且重要的方法。
本文将详细介绍非参数统计中的秩和检验方法。
一、秩和检验简介秩和检验是一种基于秩次的非参数检验方法,它主要用于对两个独立样本或多个相关样本的总体分布进行比较。
这种方法的优势在于对数据的分布形状没有要求,适用于各种类型的数据。
在进行秩和检验时,首先需要将样本数据进行排序,然后根据排序后的秩次进行计算。
接下来,通过比较秩和的大小来进行假设检验,从而得出结论。
二、秩和检验的应用场景秩和检验方法可以应用于诸多实际场景中。
比如,在医学研究中,可以用秩和检验方法来比较两种不同治疗方法的疗效;在工程领域,可以用秩和检验方法来比较不同生产工艺的产品质量;在市场营销中,可以用秩和检验方法来比较不同促销策略的效果等等。
总之,秩和检验方法在实际问题的解决中有着广泛的应用。
三、秩和检验的类型秩和检验包括了许多不同类型,其中最常见的包括Mann-Whitney U检验、Wilcoxon秩和检验和Kruskal-Wallis H检验。
下面将分别对这些检验进行详细介绍。
1. Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两个独立样本的非参数检验方法。
它基于两组数据的秩次进行比较,通过计算秩和来判断两组数据是否来自同一总体分布。
Mann-Whitney U检验的原假设是两组样本来自同一总体分布,备择假设是两组样本来自不同总体分布。
通过计算U统计量和p值来进行假设检验,从而得出结论。
2. Wilcoxon秩和检验Wilcoxon秩和检验是一种用于比较两个相关样本的非参数检验方法。
它与Mann-Whitney U检验类似,同样是基于秩次进行比较。
非参数统计中的秩和检验方法详解(七)

非参数统计中的秩和检验方法详解统计学作为一门应用广泛的学科,其研究对象主要是各种数据的收集、整理、分析和解释。
在统计学中,参数统计和非参数统计是两种常用的分析方法。
在本文中,我们将重点介绍非参数统计中的一种常见方法——秩和检验。
一、秩和检验的基本原理秩和检验是一种基于秩次的非参数假设检验方法,它不需要对总体分布进行任何假设,因此在数据分布未知或不满足正态分布假设的情况下,秩和检验可以很好地进行统计推断。
秩和检验的基本原理是将样本数据进行排序,然后将排序后的数据转化为秩次,再通过对秩次进行比较来进行假设检验。
秩和检验适用于两组或多组独立样本的比较,常用于检验总体的中位数是否相等或者总体分布是否相同。
二、秩和检验的步骤秩和检验的步骤主要包括数据排序、秩次转换和秩和比较。
具体步骤如下:1. 数据排序:首先对样本数据进行排序,可以按照从小到大或者从大到小的顺序进行排序。
2. 秩次转换:将排序后的数据转化为秩次,即给每个数据赋予一个秩次,通常情况下,秩次是按照数据在样本中出现的顺序进行分配的。
如果出现相同的数据,可以采取加权秩次的方法进行处理。
3. 秩和比较:对计算得到的秩次进行比较,通过比较秩和的大小来进行假设检验,得出检验统计量并进行显著性检验。
三、秩和检验的应用秩和检验方法在实际应用中有着广泛的应用,特别是在医学、生物学、社会科学和工程领域等。
下面以两组独立样本的比较为例,介绍秩和检验的应用。
假设有两组独立样本,分别记为X和Y,我们要比较这两组样本的中位数是否相等。
首先对两组样本数据进行排序,并进行秩次转换,得到秩和值RX和RY,然后对秩和值进行比较,通过比较得到的检验统计量进行显著性检验,从而判断两组样本的中位数是否相等。
四、秩和检验的优缺点秩和检验作为一种非参数方法,具有一些优点和局限性。
优点:秩和检验不需要对数据分布进行假设,因此对于不满足正态分布假设的数据具有较好的适用性;同时,秩和检验是一种较为稳健的检验方法,对异常值和极端值的影响相对较小。
基于秩的非参数检验介绍

基于秩的非参数检验介绍秩检验是一种常用的非参数检验方法,它不依赖于总体的具体分布形式,适用于数据不满足正态分布等假设的情况。
秩检验的核心思想是将原始数据转化为秩次,通过比较秩次的大小来进行假设检验。
本文将介绍基于秩的非参数检验的原理、常见的秩检验方法以及如何应用秩检验进行统计推断。
### 一、秩的概念在介绍秩检验之前,首先需要了解秩的概念。
秩是指将一组数据按照大小顺序排列后得到的位置序号,即数据在排序后的位置。
例如,对于一组数据{5, 3, 7, 2},排序后的序列为{2, 3, 5, 7},则对应的秩次为{2, 1, 3, 4}。
### 二、秩和秩次的计算在进行秩检验时,需要计算每个数据点的秩次。
对于有重复数值的情况,可以采用两种方法计算秩次:一是平均秩法,即将重复数值的秩次取平均值;二是顺序秩法,即按照数据出现的先后顺序依次赋予秩次。
### 三、秩和秩次的应用秩和秩次在非参数检验中起着重要作用。
在进行秩检验时,常用的方法包括Wilcoxon秩和检验、Mann-Whitney U检验、Kruskal-Wallis 检验等。
这些方法都是基于秩次进行统计推断,适用于不同类型的假设检验问题。
1. Wilcoxon秩和检验Wilcoxon秩和检验是一种用于比较两组相关样本的非参数检验方法。
它的原假设是两组样本来自同一总体,备择假设是两组样本来自不同总体。
通过比较两组样本的秩和来判断它们是否存在显著差异。
2. Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两组独立样本的非参数检验方法。
它的原假设是两组样本来自同一总体,备择假设是两组样本来自不同总体。
通过比较两组样本的秩和来进行假设检验。
3. Kruskal-Wallis检验Kruskal-Wallis检验是一种用于比较多组独立样本的非参数检验方法。
它的原假设是多组样本来自同一总体,备择假设是多组样本来自不同总体。
通过比较多组样本的秩和来进行假设检验。
卫生统计学考前复习综合测试卷及答案一

2018年卫生统计学考前复习综合测试卷及答案一一、选择题1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加实验,分别测得实验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
A.已知二组患者的白细胞计数均降低B.已知二组患者的白细胞计数均升高C.不清楚哪一组的白细胞计数水平有变化D.已知非典型肺炎患者的白细胞计数不高于普通肺炎E.两组白细胞计数值的总体方差不相等【答案】D9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为______.A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比D.应进行假设检验后再下结论E.以上都不对【答案】D10.比较两个率时,不需要进行率的标准化的情况有______.A.内部构成不同B.内部构成相同C.未知各年龄别人口数D.缺乏各年龄别死亡人数E.不易寻找标准人口构成【答案】B11.四格表资料在哪种情况下作χ2检验不必校正______.A.T>1且n>40B.T>5或n>40C.T>5且n>40D.1E.T>5且n<40【答案】C12.欲比较三种药物的疗效(无效、好转、显效、痊愈)孰优孰劣,最好选择______.A.t检验B.方差分析C.χ2检验D.秩和检验E.u检验【答案】D13.下面说法中不正确的是_____.A.没有个体差异就不会有抽样误差B.抽样误差的大小一般用标准误来表示C.好的抽样设计方法,可避免抽样误差的产生D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别【答案】C14.实验设计和调查设计的根本区别是_____.A.实验设计以动物为对象B.调查设计以人为对象C.调查设计可随机分组D.实验设计可人为设置处理因素E.以上都不对【答案】D15.在下述抽样调查方法中,在样本量相同的前提下,抽样误差最小的是_____.A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样E.多阶段整群抽样【答案】C16.对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______.A.有相关关系B.无任何关系C.无直线相关关系D.无因果关系E.有伴随关系【答案】C17.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组无任何处理,这种对照属于______.A.实验对照B.空白对照C.相互对照D.标准对照E.历史对照【答案】B18.在两独立样本比较的秩和检验中,实验组的观察值为0,0,7,14,32,40,对照组的观察值为0,1,2,4,4,8.编秩中零值的秩应分别编为______.A.2,3;1B.1.5,1.5;3C.2,2;2D.2.5,2.5;1E.不参加编秩【答案】C19.两样本比较的秩和检验(两组样本例数相等),如果假设成立,则对样本来说:______.A.两组秩和相等B.两组秩和的绝对值相等C.两组秩和相差很大D.两组秩和相差一般不会很大E.两组秩和的差值相等【答案】D20.在简单线性回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明______.A.X对Y的影响占Y变异的30%B.X增加一个单位,Y平均减少30%C.X增加一个单位,Y平均减少0.30个单位D.Y增加一个单位,X平均减少30%E.Y增加一个单位,X平均减少0.30个单位【答案】C二、多选题在A、B、C、D和E中选出一个最佳答案,将答案的字母填在相应下划线的空格里。
基于秩次的非参数检验

P<0.05.
检验步骤
1. H0:差值的总体中位数为0。 H1:差值的总体中位数不为0。 α=0.05
2. 编秩,求秩和,统计量为T=3.5 3. 确定P值:查表得到T界值为13~65。 4. 判断结果:3.5不在T界值范围内,则
法。
七. 完全随机设计多个样本两两比较 的秩和检验(multiple comparisons)
1.建立假设 2.计算检验统计量并确定P值:
(1)计算k个处理组的平均勇秩于开和始;,才能找到成 (2)样本含量较小时,用精功确的法路 确定P值;样本含量
较大时,用正态近似法确定P值; 3.作出统计推断结论:
检验水准的调整:
八. 随机区组设计资料的多重比较
(multiple comparisons)
1.建立假设 2.计算检验统计量并确定P值:
(1)计算k个处理组的平均勇于秩开和始,;才能找到成 (2)样本含量较小时,用精功确的路法确定P值;样本含量较
大时,用正态近似法确定P值; 3.作出统计推断结论:
R×C表2检验
配伍组方 差分析
Fridman M检验
等级
Wilcoxon符 号秩和检验
Wilcoxon 符号秩和检
验
Wilcoxon秩和 检验
K-W H检验
Fridman M检验
基于秩次的非参数检验
2020年4月24日星期五
一.非参数统计的概念
1.参数统计:总体分布型已知,对总体参 数进行估计或检验。
2.非参数统计:不依赖于总体的分布型( 应用时可不考虑被研究对象为何种分布 或分布是否已知)。其优点是不受总体 分布的限定,适用范围广。但对适宜用 参数检验的资料,若用非参数检验,则 回损失部分信息,降低效率。
医学统计学(课件)基于秩次的非参数检验

缺点:方法比较粗糙,对于符合参数检验条件者,采用 非参数检验会损失部分信息,其检验效能较低;样本含 量较大时,两者结论常相同
本章内容
配对设计和单样本资料的符号秩和检验 完全随机设计两组独立样本的秩和检验 完全随机设计多组独立样本的秩和检验
秩次与秩和
秩次(rank),秩统计量 是指全部观察值按某种顺序排列的位序。一般
对于分布不知是否正态的小样本资料,为保险起见,宜选 用非参数检验
对于一端或两端是不确定数值(如<0.5、>0.5等)的资料, 不管是否正态分布,只能选用非参数检验
对于等级资料,若选行×列表资料的卡方检验,只能推断 构成比差别,而选用非参数检验,可推断等级强度差别
参数检验
(parametric test)
秩和检验的目的是推断两个总体分布的位置是否有差 别,而不关心其分布的形状有无差别
两个总体分布位置不同,实际情况一般是两个总体分 布形状相同或类似,这时可简化为两个总体中位数不 等
一、两组连续变量资料的秩和检验
如果资料方差相等,且服从正态分布,就可以 用t检验比较两样本均数
如果此假定不成立或不能确定是否成立,就应 采用秩和检验来推断两样本分别代表的总体分 布是否不同
11.5 11(111) / 4 0.5
u
1.91
11(111)(2 111) (23 2)
24
48
u <1.96, 故P>0.05,在 0.05 水准上接受H0,拒绝H1, 结论与查表法相同。
注意
符号秩检验若用于配对的等级资料,则先把等 级从弱到强转换成秩(1,2,3,…);然后求各对 秩的差值,省略所有差值为0的对子数,令余下的有 效对子数为n;最后按n个差值编正秩和负秩,求正 秩和或负秩和。但对于等级资料,相同秩多,小样 本的检验结果会存在偏性,最好用大样本。
基于秩次的非参数检验讲义

n2=15
T2=189.0
例题分析
解: H0:甲、乙两河流断面亚硝酸盐氮含量的总体分布相同 H1:甲、乙两河流断面亚硝酸盐氮含量的总体分布不相同
n1=10 , n2-n1=5 , α=0.05(双) T=136 ,查附表10,得 [94 ,166 ] , T在界内, P>0.05,不拒绝H0,不能认为甲、乙两河流断面亚硝酸盐 氮含量的总体分布不相同。
T在界内,P> ; T在界外,P≤ . 当n1>10 或 n2 - n1>10时,可用正态近似法的Z检验
1.两组连续变量资料的秩和检验
例10-3
亚硝酸盐氮含量(mg/L)的检测结果
河流甲
河流乙
含量值
秩次
含量值
秩次
0.014
1
0.018
2.5
0.018
2.5
0.019
4
0.024
8.5
0.020
(3) Wilcoxon 配对法基本思想
本法的基本思想是假定两种处理结果的效应相同,即差值之总体 分布是对称的(H0:Md=0) ,总体中位数为0;同理,假定某种处理 无作用,则 每一受试对象处理前后所得结果之差值的总体中位数亦 为0。如果假设成立,则样本的正、负秩和应比较接近;若正、负秩 和相差悬殊,即T特别小,则假设成立的可能性也小。
卫生统计学试题及答案(二)

卫生统计学试题及答案(二)1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5<P<0.5< P>【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
A.已知二组患者的白细胞计数均降低B.已知二组患者的白细胞计数均升高C.不清楚哪一组的白细胞计数水平有变化D.已知非典型肺炎患者的白细胞计数不高于普通肺炎E.两组白细胞计数值的总体方差不相等【答案】D9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为______.A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比D.应进行假设检验后再下结论E.以上都不对【答案】D10.比较两个率时,不需要进行率的标准化的情况有______.A.内部构成不同B.内部构成相同C.未知各年龄别人口数D.缺乏各年龄别死亡人数E.不易寻找标准人口构成【答案】B11.四格表资料在哪种情况下作χ2检验不必校正______.A.T>1且n>40B.T>5或n>40C.T>5且n>40D.1<T<5< P>E.T>5且n<40【答案】C12.欲比较三种药物的疗效(无效、好转、显效、痊愈)孰优孰劣,最好选择______.A.t检验B.方差分析C.χ2检验D.秩和检验E.u检验【答案】D13.下面说法中不正确的是_____.A.没有个体差异就不会有抽样误差B.抽样误差的大小一般用标准误来表示C.好的抽样设计方法,可避免抽样误差的产生D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别【答案】C14.实验设计和调查设计的根本区别是_____.A.实验设计以动物为对象B.调查设计以人为对象C.调查设计可随机分组D.实验设计可人为设置处理因素E.以上都不对【答案】D15.在下述抽样调查方法中,在样本量相同的前提下,抽样误差最小的是_____.A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样E.多阶段整群抽样【答案】C16.对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______.A.有相关关系B.无任何关系C.无直线相关关系D.无因果关系E.有伴随关系【答案】C17.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组无任何处理,这种对照属于______.A.实验对照B.空白对照C.相互对照D.标准对照E.历史对照【答案】B18.在两独立样本比较的秩和检验中,实验组的观察值为0,0,7,14,32,40,对照组的观察值为0,1,2,4,4,8.编秩中零值的秩应分别编为______.A.2,3;1B.1.5,1.5;3C.2,2;2D.2.5,2.5;1E.不参加编秩【答案】C19.两样本比较的秩和检验(两组样本例数相等),如果假设成立,则对样本来说:______.A.两组秩和相等B.两组秩和的绝对值相等C.两组秩和相差很大D.两组秩和相差一般不会很大E.两组秩和的差值相等【答案】D20.在简单线性回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明______.A.X对Y的影响占Y变异的30%B.X增加一个单位,Y平均减少30%C.X增加一个单位,Y平均减少0.30个单位D.Y增加一个单位,X平均减少30%E.Y增加一个单位,X平均减少0.30个单位【答案】C。
基于秩次的非参数检验PPT课件

18
编辑版ppt
表10-2 两法测定11份工业污水中氟离子浓度结果比较
样品号
氟离子浓度
差值d 差值秩次 分配符号
(1)
电极法(2) 分光光度法(3) (4)=(2)-(3)
1
10.5
8.8
1.7
4
4
2
21.6
18.8
2.8
9
基于秩次的非参数检验
1
编辑版ppt
基于秩次的非参数检验
单样本和配对设计资料的符号秩和检验 两组独立样本比较的秩和检验 多组独立样本比较的秩和检验 随机区组设计多组比较的秩和检验 案例讨论
2
编辑版ppt
非参数检验
假设检验方法分为参数检验和非参数检验 参数检验
以特定的总体分布为前提,对未知的总体参数做推 断
5
编辑版ppt
非参数检验
满足参数检验的资料采用非参数检验,会损失 数据信息,降低检验效能
秩和检验
常用的且检验效能较高的非参数检验方法 较完备的大样本抽样分布理论基础。 以秩和为检验统计量
6
编辑版ppt
单样本和配对设计资料的符号秩和检验
Wilcoxon符号秩和检验
推断总体中位数是否等于某个指定值(常数) 可用于单样本设计或配对设计,定量资料不满足参
查表法
根据n和T查附表9(配对比较的符号秩和检验) 若T值在上、下界值内,P值大于相应的概率; 若T值等于上、下界值,P值等于相应概率; 若T值在上、下界值范围外,P值小于相应的概率。 本例:n=16,T=108或28,查表得0.01<P<0.025
13
编辑版ppt
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于秩次的非参数检验1. 问题的提出前面学习了连续型资料两组样本均数差异的假设检验方法:小样本用t检验,条件是变量服从正态分布和方差齐;大样本用标准正态分布的Z检验。
如果是小样本,变量的分布不清,或者已知不服从正态分布或经变量转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?需要一种不依赖于分布假定的检验方法,即非参数检验。
2. 基本概念前面介绍的检验方法首先假定分析变量服从特定的已知分布(如正态分布),然后对分布参数(如均数)作检验。
这类检验方法称参数检验(parametric test)。
今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量的中心位置或分布位置作比较。
这类检验称非参数检验(nonparametric test),由于其对总体分布不作严格假定,所以又称任意分布检验。
(distribution-free test)非参数检验的优点:a.不受总体分布的限制,适用范围广。
b.适宜定量模糊的变量和等级变量。
c.方法简便易学。
缺点:如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布(如正态分布),这时人为地将精确测量值变成顺序的秩,将丢失部分信息,造成检验功效能下降。
基于秩次非参数检验(秩和检验)的基本思想假设变量X有观察值1.1, 1.3, 1.7, 4.3, 11.4显然这变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。
但如果将变量作转换,变成秩变量Y=1,2,3, 4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。
然后对这秩分布的中心位置(中位数)作检验,这就是秩和检验。
7.1 配对样本的符号秩检验(Wilcoxon signed rank test)例7.1为研究出生先后的孪生兄弟间智力是否存在差异,12对孪生兄弟测试的结果见表7.3。
表7.3 12对孪生兄弟测试结果T+=24.5,T-=41.5符号秩检验的分布理论:假定有4个差值,如果H0成立时,这4个差值有同等的概率取正值或负值,即每个值取正值的概率等于1/2。
4个差值每种组合发生的可能性就是:0625.021212121=⨯⨯⨯=P 。
所有可能的秩和情况和T *的分布见表7.1。
表7.1 n =4时所有可能秩和情况和T *的分布正差数 的秩次 负差值 的秩次 正秩和 T + 负秩和 T - 检验统计量T *概率P 1,2,3,4 -- 10 0 0 0.0625 2,3,4 1 9 1 1 0.0625 1,3,4 2 8 2 2 0.0625 1,2,4 3 7 3 30.12503,4 1,2 7 3 31,2,3 4 6 4 4 0.12502,4 1,3 6 4 4 1,4 2,3 5 5 50.12502,3 1,4 5 5 51,3 2,4 4 6 4 0.12504 1,2,3 4 6 41,2 3,4 3 7 3 0.12503 1,2,4 3 7 32 1,3,4 2 8 2 0.06251 2,3,4 1 9 1 0.0625- 1,2,3,4 0 10 0 0.0625如果零假设成立,观察的结果应该服从这分布,即出现极端的可能性很小。
如果真是出现小概率,那么我们对零假设的真实性产生怀疑,拒绝零假设。
表 7.2 Wilcoxon符号秩检验的判断原则双侧检验单侧检验(1) 单侧检验(2) 检验假设H0:Md(d)=0 H0:Md(d)=0 H0:Md(d)=0 H1:Md(d)≠0 H1:Md(d)>0 H1:Md(d)<0 统计决策:小样本查表法若T*≤Tα/2(n),则拒绝H0若T-≤Tα(n),则拒绝H0若T+≤Tα(n),则拒绝H0大样本正态近似法若│Z│>Zα/2 ,则拒绝H0若│Z│>Zα ,则拒绝H0若│Z│>Zα,则拒绝H0当研究例数较大时(n>50),秩和T的分布近似正态分布,可以用正态分布理论作假设检验。
这时正态分布的均数和标准差分别等于:μT=n(n+1)/424/)12)(1(++=n n n T σ检验的公式为:24/)12)(1(5.04/)1(5.0**++-+-=--=n n n n n Z T T TT σμ具体计算步骤:a. 建立检验假设:H 0: 中位数为零; H 1:中位数不等于零;α=0.05b. 编秩、计算秩和:差数为零不参加编秩,相同差值求平均秩。
分别求正号和负号的秩和,取绝对值小的为T 。
c. 确定概率:查附表10,在n=11时,T 0.05=11。
现24.5>11,故p>0.05。
7.2 两独立样本的秩和检验(Wilcoxon rank sum test)例7.2 在缺氧条件下,观察4只猫与12只兔的生存时间(分),结果见表7.5。
试判断猫、兔在缺氧条件下生存时间的差异是否具有统计学意义。
这是生存时间资料,一般不服从正态分布,样本也较小,需考虑用非参数检验---秩和检验。
秩和检验的基本思想:两组观察值共有n例,设例数较少的组有n1例,按观察值大小顺序分别编秩为1,2,…,n。
如果零假设成立,观察的结果有较大的可能出现分布在中间的结果。
如果极端的结果出现,则可能零假设不成立,我们就拒绝零假设。
表7.5 缺氧条件下猫与兔的生存时间(分)比较当样本较大时,秩和的分布近似正态分布,可以用正态分布理论作假设检验。
这时正态分布的均数和标准差分别等于:μT*=n 1(n +1)/2⎥⎥⎦⎤⎢⎢⎣⎡---+=∑*n n t t n n n k k T 33222)(112)1(σ检验公式为:21*5.0|2/)1(|*-+-=T n n T Z σ 具体计算步骤: a. 建立检验假设:H 0:Md 1=Md 2,即两总体分布位置相同;H 1:Md 1≠Md 2,即两总体分布位置不同;α=0.05b. 编秩和计算秩和:两组混合编秩,有相同值求平均秩(仅有同组相同值可忽略)。
当n1<n2时,取较小样本的秩和为检验统计量T*=R1;当n1=n2时,取秩和较小者为检验统计量T*=min(R1,R2)。
本例求例数较少组的秩和T*=78.5。
c.确定概率:T值在表中两数字值之间时,p值大于相应界值,反之则小于。
n1=5,n2=14,n2-n1=9,查附表11,T L0.01=22,T U0.01=78,T*>T U0.01,P<0.01,故拒绝H0,可认为猫、兔在缺氧条件下的生存时间的中位数不相等。
7.3 多个样本分布位置相同的假设检验1.完全随机化设计资料分布位置的假设检验(Kruskal- Wallis test)表7.7 不同吸烟习惯母亲的新生儿体重(kg)出生体重x ij相应秩次r ijA B C D A B C D2.7 2.93.3 3.5 3 4 7 112.43.2 3.6 3.6 2 5.5 12.5 12.52.23.2 3.4 3.7 1 5.5 9 143.4 3.4 9 9n i 4 3 4 3R i15 15 37.5 37.5计算步骤:a. 建立检验假设: H0:k个总体中位数相等;H1:k个总体中位数不等;α=0.05。
b. 计算统计量:各组混合编秩。
如不同组间出现相同值,求平均秩。
计算各组的秩和。
如果H 0:成立,第i 组秩和的期望(总体均数)Ri μ与方差2Ri σ分别为:2)1(+=n n i R iμ 12)1)((2+-=n n n n i i Riσ 在此基础上建立检验统计量:[][]∑∑==+-+-=-=ki i i i i ki RiRi i n n n n n n R R H 1212212/)1)((2/)1(σμ当H 0成立时,该检验统计量近似服从自由度为(k-1)的χ2分布。
为简化运算,由上式推导出如下公式:)1(3)()1(1212--+=∑=n n R n n H k i ii375.9)114(3)35.3745.37315415()114(14122222=+-++++=H校正:)()(1313n n t t HH mp p pC ---=∑=5018.91414)]22()33()22[(1375.93333=--+-+--=C H c. 确定概率和判断结果:自由度(df)=4-1=3,查χ2值表得χ20.05(3) =7.815,p<0.05,故拒绝零假设,说明不同吸烟习惯对新生儿体重有影响。
2.随机化区组设计资料分布位置的假设检验(Friedman test)与配对设计的思想一样,为控制某些因素对试验效应的混杂影响,可以在设计时,将试验对象配成组,再随机地分配处理因素给每组中的各个对象,这种设计称随机化区组设计。
对于随机化区组设计资料,考虑k个处理组的分布差异时,可采用由M. Friedman在符号检验基础上扩展的秩和检验,称为Friedman检验(Friedman test)。
令x ij为第i区组(i=1,2....b)、第j处理组(j=1,2....k)的个体观察值,数据按区组(b行)与处理组(k列)排列如表7.8。
表7.8 随机化区组设计的资料格式区组处理组1 2 ... k1 x11x12... x1k2 x21x22... x2k┆┆┆┆┆b x b1x b2... x bk其检验假设为H0:k个处理组效应的中位数相等;H1:k个处理组效应的中位数不全相等。
进行Friedman检验时,首先在每区组(行)内将观察值按其数值由小到大排秩,然后再按处理组(列)求秩和,最后产生一个综合区组内差异的检验统计量。
令r ij为第i区组、第j处理组观察值x ij所对应的秩次,因为每一区组(行)内有k个从1到k的整数秩,所以任何区组(行)的秩和为2)1( 1+=∑=k kr kjij令R j为第j处理组的秩和,即R j=∑=kjijr1,故总秩和为2)1( 1+=∑=k bkRkji当H0成立时,第j列秩和的期望与方差分别为2)1(+=k b Riμ, 12)1(22-=k b Rj σ 大样本时,统计量 2RjRjj j R Z σμ-=~ N(0,1)取其加权和,[]∑∑==++-=⎪⎭⎫ ⎝⎛-=kj j j kj k kb k b R Z k k 1221212/)1(2/)1(1χ 近似服从自由度为(k-1)的2χ分布,通过与2χ分布界值的比较便可作出判定。
与K-W 检验统计量的情况相似,可导出计算式)1(3)1(12122+-+=∑=k b R k bk k j j χ 例7.4 三批甘蓝叶样本分别在甲、乙、丙、丁四种条件下测量核黄素浓度,试验结果如表7.9所示。
问四种条件下的测量结果的差异是否具有统计学意义?表7.9 甘蓝叶核黄素浓度测量值(g μ/g)批次 测量条件 甲 乙 丙 丁1 27.2(2) 24.6(1) 39.5(4) 38.6(3)2 23.2(1) 24.2(2) 43.1(4) 39.5(3)3 24.8(2) 22.2(1) 45.2(4) 33.0(3) R j 54 12 9解 (1) 建立检验假设H 0:四种测量条件下的测量结果的中位数相等; H 1:四种测量条件下的测量结果的中位数不全相等。