基于秩次的非参数检验
医学统计学 -第10章 基于秩次的非参数检验
H0:多个总体分布相同(或者中位数相等) H1:多个总体分布不同或不全相同(或者中位数不全相等)
26
例10.5
某医院用3种方法治疗15例胰腺癌患者,每种方 法各治疗5例,治疗后生存月数如下表,问3种方法的 疗效有无差别?
当n≤50时,通过查T界值表来确定是否波动过
大
T在界值范围内,波动不大
P>α
T在界值范围外或等于界值时,波动大,P≤α
11
(4) 查表及推断结论 查T界值表T0.05(16)=29~107 由于T=28在上下界值范围外,所以P≤0.05。 按a=0.05检验水准拒绝H0,接受H1,可以 认为该厂工人尿铅含量不当地正常人有差异, 通过正负秩和的大小可以推断工人的尿铅含 量要高于正常人。
第十章 基于秩次的非参数检验
1
假设检验的方法分为两类
参数检验(parametric test)
已知总体分布类型,对未知参数(μ、π)进行统计推断 依赖于特定分布类型,比较的是参数 一般有严格的适用条件
如:样本来自正态分布、总体方差齐同等 这类方法比如:t检验、F检验等
非参数检验(nonparametric test)
Z
T n1(N 1) / 2 0.5
n1n2 (N 3 N
12N(N 1)
(t
3 j
t
j
))
2036 40(84 1) / 2 0.5
40 44 (843 84 (323 32) (323 32) (203 20)) 12 40 (84 1)
7.01
由于Z=7.01,大于Z0.05=1.96,所以P<0.05,按照α=0.05 检验水准拒绝H0,接受H1,可以认为夏冬两季居民体 内核黄素含量有差别。根据平均秩次可以知道夏季的含
卫生统计学试题及答案(二)
卫生统计学试题及答案(二)1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____. A.b无统计学意义 B.b有高度统计学意义 C.b有统计学意义 D.不能肯定b有无统计学意义 E.a有统计学意义 【答案】C 2.关于基于秩次的非参数检验,下列说法错误的是_____. A.符号秩和检验中,差值为零不参加编秩 B.两样本比较的秩和检验方法中的正态近似法为参数检验 C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大 D.当样本足够大时,秩和分布近似正态 E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异 【答案】B 3.随机事件的概率为______. A.P=1 B.P=0 C.P=-0.5 D.0≤P≤1 E.-0.5<P<0.5< P> 【答案】D 4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______. A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E.越有理由认为两总体均数相同 【答案】C 5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率, 应用何种统计检验方法来较好地分析此数据_____. A.配对t检验 B.成组t检验 C.成组秩和检验 D.配对秩和检验 E.两组方差齐性检验 【答案】A 6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____. A.T值越大P值越小 B.T值越大越有理由拒绝H0 C.P值与T值毫无联系 D.T值越小P值越小 E.以上都不对 【答案】D 7.方差分析中要求______. A.各个样本均数相等 B.各个总体方差相等 C.各个总体均数相等 D.两样本方差相等 E.两个样本来自同一总体 【答案】B 8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
兰大《卫生统计学》15春在线作业1 答案
《卫生统计学》15春在线作业1
一、单选题(共15 道试题,共60 分。
)
1. 关于基于秩次的非参数检验,下列说法错误的是( )
A. 符号秩和检验中,差值为零不参加编秩
B. 两样本比较的秩和检验方法中的正态近似法为参数检验
C. 当符合正态假定时,非参数检验犯II类错误的概率较参数检验大
D. 当样本足够大时,秩和分布近似正态
E. 秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异
正确答案:B
2. 若X的方差等于6,Y的方差等于4.X与Y独立,则X-Y的方差等于( )
A. 0
B. 5
C. 2
D. 1
E. 10
正确答案:E
3. 在同一总体随机抽样,其他条件不变,样本含量越大,则( )
A. 样本标准差越大
B. 样本标准差越小
C. 总体均数的95%可信区间越窄
D. 总体均数的95%可信区间越宽
正确答案:C
4. 比较非典型肺炎和普通肺炎患者的白细胞计数水平,若( ),可作单侧检验。
A. 已知二组患者的白细胞计数均降低
B. 已知二组患者的白细胞计数均升高
C. 不清楚哪一组的白细胞计数水平有变化
D. 已知非典型肺炎患者的白细胞计数不高于普通肺炎
E. 两组白细胞计数值的总体方差不相等
正确答案:C
5. R×C表的卡方检验的自由度为( )
A. R-1
B. C-1
C. R*C-1
D. (R-1)(C-1)
E. R*C-2
正确答案:D。
基于秩次的非参数检验
第七章基于秩次的非参数检验前言:1. 问题的提出:前面学习了连续型资料两组样本均数差异的假设检验方法:★小样本用t检验,条件是变量服从正态分布和方差齐。
★大样本用Z检验(中心极限定理)。
如果是小样本,变量的分布不清、已知不服从正态分布或经数学转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?★需要一种不依赖于分布假定的检验方法,即非参数检验。
2. 基本概念:前面介绍的检验方法首先假定变量服从特定的已知分布(如正态分布),然后对分布的参数(如均数)作检验。
这类检验方法称为参数检验。
今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量分布的中心位置或分布形态作检验。
这类检验称非参数检验,由于其对总体分布不作严格假定,所以又称任意分布检验。
(1)非参数检验的优点:a. 不受总体分布的限制,适用范围广。
b. 适宜定量模糊的变量和等级变量。
c. 方法简便易学。
(2)缺点:对于适合用参数检验的资料,如用非参数检验会造成信息的丢失,犯第Ⅱ类错误的概率增大,造成检验功效下降。
(3)基于秩次的非参数检验(秩和检验)的基本思想:例:假设有一组观察值为1.1, 1.3, 1.7, 4.3, 11.4 。
显然这一变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。
如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。
对秩和分布的中心位置(平均秩和)作检验,这就是秩和检验。
一.配对样本的符号秩检验(Wilcoxon signed rank test):例7.1:研究出生先后的孪生兄弟智力是否存在差异?表7.3 12对孪生兄弟智力测试结果9 70 65 -5 -5.510 71 80 9 911 88 81 -7 -812 87 72 -15 -11差值一般在5左右,但个别较大,如15,可能不服从正态分布。
卫生统计学考试试题及答案(附解释)
卫生统计学试题及答案(一)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)直方图(适用于数值变量,连续性资料的频数表变量)直条图(适用于彼此独立的资料)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A.均数B.几何均数C.中位数D.方差E.四分位数间距【答案】B几何均数(geometric mean)是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。
第十章 基于秩次的非参数检验
第十章基于秩次的非参数检验习题一、选择题1.两小样本均数比较,方差不齐时,下列说法不正确的是().A. 采用秩和检验B. 采用t′检验C. 仍用t检验D. 变量变换后再作决定E. 要结合正态性检验结果方能作出决定H是().2. 两样本秩和检验的A. 两样本秩和相等B. 两总体分布相同C. 两样本分布相同D. 两总体秩和相等E. 两总体均数相等3. 在统计检验中是否选用非参数统计方法().A. 要根据研究目的和数据特征作决定B. 可在算出几个统计量和得出初步结论后进行选择C. 要看哪个统计结论符合专业理论D. 要看哪个P值更小E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用4. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是().A. T越大,P值越小B.T越大,P值越大C. T值在界值范围内,P值小于相应的αD. T值在界值范围内,P值大于相应的αE. T值在界值范围上,P值大于相应的α5. 成组设计两样本比较的秩和检验,其检验统计量T是().A. 为了查T界值表方便,一般以秩和较小者为TB. 为了查T界值表方便,一般以秩和较大者为TC. 为了查T界值表方便,一般以例数较小者秩和为TD. 为了查T界值表方便,一般以例数较大者秩和为TE. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表多样本定量资料比较,当分布类型不清时应选择().A. 方差分析B. t检验C. Z检验D. Kruskal-Wallis检验E. Wilcoxon检验6. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后H值,则会().的cA.提高检验的灵敏度B.把一些无差别的总体推断成有差别C. 把一些有差别的总体推断成无差别D.Ⅰ、Ⅱ类错误概率不变E. 以上说法均不对二、简答题1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法?2. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?3. 多组定量资料比较时,统计处理的基本流程是什么?。
非参数统计中的秩和检验方法详解(Ⅰ)
非参数统计中的秩和检验方法详解统计学是一门研究数据收集、分析、解释和展示的学科,它在各个领域都有着广泛的应用。
而在统计学中,参数统计和非参数统计是两种常见的方法。
参数统计是根据总体的参数进行推断,而非参数统计则是不对总体参数做出假设的一种统计方法。
在非参数统计中,秩和检验方法是一种常用且重要的方法。
本文将详细介绍非参数统计中的秩和检验方法。
一、秩和检验简介秩和检验是一种基于秩次的非参数检验方法,它主要用于对两个独立样本或多个相关样本的总体分布进行比较。
这种方法的优势在于对数据的分布形状没有要求,适用于各种类型的数据。
在进行秩和检验时,首先需要将样本数据进行排序,然后根据排序后的秩次进行计算。
接下来,通过比较秩和的大小来进行假设检验,从而得出结论。
二、秩和检验的应用场景秩和检验方法可以应用于诸多实际场景中。
比如,在医学研究中,可以用秩和检验方法来比较两种不同治疗方法的疗效;在工程领域,可以用秩和检验方法来比较不同生产工艺的产品质量;在市场营销中,可以用秩和检验方法来比较不同促销策略的效果等等。
总之,秩和检验方法在实际问题的解决中有着广泛的应用。
三、秩和检验的类型秩和检验包括了许多不同类型,其中最常见的包括Mann-Whitney U检验、Wilcoxon秩和检验和Kruskal-Wallis H检验。
下面将分别对这些检验进行详细介绍。
1. Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两个独立样本的非参数检验方法。
它基于两组数据的秩次进行比较,通过计算秩和来判断两组数据是否来自同一总体分布。
Mann-Whitney U检验的原假设是两组样本来自同一总体分布,备择假设是两组样本来自不同总体分布。
通过计算U统计量和p值来进行假设检验,从而得出结论。
2. Wilcoxon秩和检验Wilcoxon秩和检验是一种用于比较两个相关样本的非参数检验方法。
它与Mann-Whitney U检验类似,同样是基于秩次进行比较。
非参数统计中的秩和检验方法详解(七)
非参数统计中的秩和检验方法详解统计学作为一门应用广泛的学科,其研究对象主要是各种数据的收集、整理、分析和解释。
在统计学中,参数统计和非参数统计是两种常用的分析方法。
在本文中,我们将重点介绍非参数统计中的一种常见方法——秩和检验。
一、秩和检验的基本原理秩和检验是一种基于秩次的非参数假设检验方法,它不需要对总体分布进行任何假设,因此在数据分布未知或不满足正态分布假设的情况下,秩和检验可以很好地进行统计推断。
秩和检验的基本原理是将样本数据进行排序,然后将排序后的数据转化为秩次,再通过对秩次进行比较来进行假设检验。
秩和检验适用于两组或多组独立样本的比较,常用于检验总体的中位数是否相等或者总体分布是否相同。
二、秩和检验的步骤秩和检验的步骤主要包括数据排序、秩次转换和秩和比较。
具体步骤如下:1. 数据排序:首先对样本数据进行排序,可以按照从小到大或者从大到小的顺序进行排序。
2. 秩次转换:将排序后的数据转化为秩次,即给每个数据赋予一个秩次,通常情况下,秩次是按照数据在样本中出现的顺序进行分配的。
如果出现相同的数据,可以采取加权秩次的方法进行处理。
3. 秩和比较:对计算得到的秩次进行比较,通过比较秩和的大小来进行假设检验,得出检验统计量并进行显著性检验。
三、秩和检验的应用秩和检验方法在实际应用中有着广泛的应用,特别是在医学、生物学、社会科学和工程领域等。
下面以两组独立样本的比较为例,介绍秩和检验的应用。
假设有两组独立样本,分别记为X和Y,我们要比较这两组样本的中位数是否相等。
首先对两组样本数据进行排序,并进行秩次转换,得到秩和值RX和RY,然后对秩和值进行比较,通过比较得到的检验统计量进行显著性检验,从而判断两组样本的中位数是否相等。
四、秩和检验的优缺点秩和检验作为一种非参数方法,具有一些优点和局限性。
优点:秩和检验不需要对数据分布进行假设,因此对于不满足正态分布假设的数据具有较好的适用性;同时,秩和检验是一种较为稳健的检验方法,对异常值和极端值的影响相对较小。
2425第十章--基于秩次的非参数检验(1)
秩和检验(rank sum test)
秩号:将各原始数据从小到大排列,分别给每个数
据一个顺序号,也就是秩号(rank)。
如:
9 6 7.5 13
秩号: 3 1 2
4
秩和:秩号的和
秩和检验:用各组秩和代替原始数据进行假设检验。
T=7663 (样本量较小组 对应的秩和)
①先确定各等级的合计人数、 秩范围和平均秩,见表4的(4) 栏、(5)栏和(6)栏,再计 算两样本各等级的秩和,见(7) 栏和(8)栏;
②本例T=7663;
3 计算Z值
7663 69 (189 1) / 2 0.5
Z
3.0587
120 69 (189 1) /12
0.05
2.5
2.12
-0.03
-1
2.42
0.27
4
2.52
0.37
5
2.62
0.47
6
2.72
0.57
7
2.99
0.84
8
3.19
1.04
9
3.37
1.22
10
4.57
2.42
11
T+=62.5 T-=3.5
确定P值并做出推断结论
本例,n=11,T=3.5,查配对
设计用T界值表,得P<0.005,
检验步骤 1. 建立检验假设,确定检验水平
H0 :差值的总体中位数Md 0 H1 :M d 0
0.05
2. 求检验统计量T值
(1) 编秩:
① 差数为0的数据忽略不计; ② 余下的n个差数按绝对值由小到大排秩号,
第十章基于秩次的非参数检验
53-99
55-105
…
47-97
49-103
51-109
45-99
47-105
49-111
…
…
…
…
说明
• 如果n1或n2-n1超出了T界值表的范围, 可用正态近似检验。
正态近似法
当n1>10或(n2-n1)>10时
连续性校正
Z T n1 (n1 n2 1) 2 0.5
n1n2 (n出1 现n2相1同) 1的2 数据 若Z值超过标准正态分布的临界值,则拒绝 H0;若出现相持较多,则用下式进行校正
秩次
8
7
6
0.3
1
2.2
6
3.5
9
10
n2=8
表1 高中生与大学生的每周平均上网时间比较(小时/周)
高中生
上网时间
秩次
0.5
2 2.5
3
1
4
0.5
3 2.5
11
1.5
5
2.5
7
3.5
n1=8
大学生
上网时间
秩次
8
7
6
0.3
1
2.2
6
3.5
9
10
n2=8
表1 高中生与大学生的每周平均上网时间比较(小时/周)
α=0.05
秩和检验的步骤
2. 编秩
3.
将两组数据由小到大统一编秩,编
秩时如遇有相同数据,取平均秩次。
4. 3. 求秩和
5.
两组秩次分别相加。
6. 4. 确定统计量
7.
若两组例数相等,则任取一组的秩
和为统计量,若两组例数不等,则以样本
基于秩的非参数检验介绍
基于秩的非参数检验介绍秩检验是一种常用的非参数检验方法,它不依赖于总体的具体分布形式,适用于数据不满足正态分布等假设的情况。
秩检验的核心思想是将原始数据转化为秩次,通过比较秩次的大小来进行假设检验。
本文将介绍基于秩的非参数检验的原理、常见的秩检验方法以及如何应用秩检验进行统计推断。
### 一、秩的概念在介绍秩检验之前,首先需要了解秩的概念。
秩是指将一组数据按照大小顺序排列后得到的位置序号,即数据在排序后的位置。
例如,对于一组数据{5, 3, 7, 2},排序后的序列为{2, 3, 5, 7},则对应的秩次为{2, 1, 3, 4}。
### 二、秩和秩次的计算在进行秩检验时,需要计算每个数据点的秩次。
对于有重复数值的情况,可以采用两种方法计算秩次:一是平均秩法,即将重复数值的秩次取平均值;二是顺序秩法,即按照数据出现的先后顺序依次赋予秩次。
### 三、秩和秩次的应用秩和秩次在非参数检验中起着重要作用。
在进行秩检验时,常用的方法包括Wilcoxon秩和检验、Mann-Whitney U检验、Kruskal-Wallis 检验等。
这些方法都是基于秩次进行统计推断,适用于不同类型的假设检验问题。
1. Wilcoxon秩和检验Wilcoxon秩和检验是一种用于比较两组相关样本的非参数检验方法。
它的原假设是两组样本来自同一总体,备择假设是两组样本来自不同总体。
通过比较两组样本的秩和来判断它们是否存在显著差异。
2. Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两组独立样本的非参数检验方法。
它的原假设是两组样本来自同一总体,备择假设是两组样本来自不同总体。
通过比较两组样本的秩和来进行假设检验。
3. Kruskal-Wallis检验Kruskal-Wallis检验是一种用于比较多组独立样本的非参数检验方法。
它的原假设是多组样本来自同一总体,备择假设是多组样本来自不同总体。
通过比较多组样本的秩和来进行假设检验。
卫生统计学试题及答案1
一、选择题1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<),则_____. 无统计学意义有高度统计学意义有统计学意义D.不能肯定b有无统计学意义有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.=1=-≤P≤1E.-< p="">【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.值越大P值越小值越大越有理由拒绝H0值与T值毫无联系值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
A.已知二组患者的白细胞计数均降低B.已知二组患者的白细胞计数均升高C.不清楚哪一组的白细胞计数水平有变化D.已知非典型肺炎患者的白细胞计数不高于普通肺炎E.两组白细胞计数值的总体方差不相等【答案】D9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为%和%,可认为______.A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比D.应进行假设检验后再下结论E.以上都不对【答案】D10.比较两个率时,不需要进行率的标准化的情况有______.A.内部构成不同B.内部构成相同C.未知各年龄别人口数D.缺乏各年龄别死亡人数E.不易寻找标准人口构成【答案】B11.四格表资料在哪种情况下作χ2检验不必校正______.>1且n>40>5或n>40>5且n>40< p="">>5且n<40【答案】C12.欲比较三种药物的疗效(无效、好转、显效、痊愈)孰优孰劣,最好选择______. 检验B.方差分析C.χ2检验D.秩和检验检验【答案】D13.下面说法中不正确的是_____.A.没有个体差异就不会有抽样误差B.抽样误差的大小一般用标准误来表示C.好的抽样设计方法,可避免抽样误差的产生D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别【答案】C14.实验设计和调查设计的根本区别是_____.A.实验设计以动物为对象B.调查设计以人为对象C.调查设计可随机分组D.实验设计可人为设置处理因素E.以上都不对【答案】D15.在下述抽样调查方法中,在样本量相同的前提下,抽样误差最小的是_____.A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样E.多阶段整群抽样【答案】C16.对两个变量进行直线相关分析,r=,P>,说明两变量之间______.A.有相关关系B.无任何关系C.无直线相关关系D.无因果关系E.有伴随关系【答案】C17.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组无任何处理,这种对照属于______.A.实验对照B.空白对照C.相互对照D.标准对照E.历史对照【答案】B18.在两独立样本比较的秩和检验中,实验组的观察值为0,0,7,14,32,40,对照组的观察值为0,1,2,4,4,8.编秩中零值的秩应分别编为______.,3;1,;3,2;2,;1E.不参加编秩【答案】C19.两样本比较的秩和检验(两组样本例数相等),如果假设成立,则对样本来说:______.A.两组秩和相等B.两组秩和的绝对值相等C.两组秩和相差很大D.两组秩和相差一般不会很大E.两组秩和的差值相等【答案】D20.在简单线性回归分析中,得到回归系数为,经检验有统计学意义,说明______.对Y的影响占Y变异的30%增加一个单位,Y平均减少30%增加一个单位,Y平均减少个单位增加一个单位,X平均减少30%增加一个单位,X平均减少个单位【答案】C二、多选题在A、B、C、D和E中选出一个最佳答案,将答案的字母填在相应下划线的空格里。
卫生统计学试题及答案附解释
卫生统计学试题及答案一1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图答案C6——16岁为连续变量,得到的是连续变量的频数分布2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图一个检测指标,两个分组变量答案E3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势C.半对数线图适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度D.直条图E.复式直条图答案E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名;若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童答案D5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分答案C6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值答案D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A.均数B.几何均数C.中位数D.方差E.四分位数间距答案B8.有人根据某种沙门菌食物中毒患者164例的潜伏期资料,用百分位数法求得潜伏期的单侧95%上限为小时,其含义是:______.A.大约有95人的潜伏期小于小时B.大约有5人的潜伏期大于小时C.大约有5人的潜伏期小于小时D.大约有8人的潜伏期大于小时全体的百分之五,即是约有8人E.大约有8人的潜伏期小于小时答案D9.以下说法中不正确的是______.A.方差除以其自由度就是均方B.方差分析时要求各样本来自相互独立的正态总体C.方差分析时要求各样本所在总体的方差相等D.完全随机设计的方差分析时,组内均方就是误差均方E.完全随机设计的方差分析时,F=MS组间/MS组内答案A10.两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______.值不变值变小值变大值变小或变大E.不能判断答案A11.甲乙两地某病的死亡率进行标准化计算时,其标准的选择______.A.不能用甲地的数据B.不能用乙地的数据C.不能用甲地和乙地的合并数据D.可用甲地或乙地的数据E.以上都不对答案D12.以下属于数值变量的是______.A.性别B.病人白细胞计数C.血型D.疗效E.某病感染人数答案B13.以下关于样本的说法,不正确的是______.A.样本是从总体中随机抽取的B.样本来自的总体应该是同质的C.样本中应有足够的个体数D.样本来自的总体中不能有变异存在E.样本含量可以估计答案D14.以下属于分类变量的是___________.得分B.心率C.住院天数D.性别E.胸围答案D15.在抽样研究中,当样本例数逐渐增多时_____.A.标准误逐渐加大B.标准差逐渐加大C.标准差逐渐减小D.标准误逐渐减小E.标准差趋近于0答案D16.某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下,为了形象表达该资料,适合选用_____.年龄岁:10~20~30~40~50~60~人数:6405085 20 1A.线图B.条图C.直方图D.圆图E.散点图答案C17.关于构成比,不正确的是_____.A.构成比中某一部分比重的增减相应地会影响其他部分的比重B.构成比说明某现象发生的强度大小某现象发生的强度大小用“概率”即“率”表示C.构成比说明某一事物内部各组成部分所占的分布D.若内部构成不同,可对率进行标准化E.构成比之和必为100%答案B18.若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____.A.直线相关分析B.秩相关分析C.直线回归分析D.方差分析E.病例对照研究答案C19.根据下述资料,样本指标提示_____.甲疗法乙疗法病情病人数治愈数治愈率%病人数治愈数治愈率%轻型403690605490重型604270402870合计10078781008282A.乙疗法优于甲疗法B.甲疗法优于乙疗法C.甲疗法与乙疗法疗效相等D.此资料甲、乙疗法不能比较E.以上都不对答案C20.若算得F药物=,P<;F区组=,P>.按α=水准,则4种药物的抑瘤效果和5个随机区组的瘤重的推断结论分别为_____.A.药物组间瘤重不同,区组间也不同B.不能认为药物组间瘤重不同,不能认为区组间不同C.药物组间瘤重不同,但不能认为区组间不同D.不能认为药物组间瘤重不同,但区组间不同E.药物差别较大,不能认为区组间不同答案C卫生统计学试题及答案二1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义P<,则_____.无统计学意义有高度统计学意义有统计学意义r有统计学意义,b也有统计学意义D.不能肯定b有无统计学意义有统计学意义答案C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异答案B3.随机事件的概率为______.=1=0=-≤P≤1E.-<P<< P>答案D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同答案C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率, 应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验答案A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.值越大P值越小值越大越有理由拒绝H0值与T值毫无联系值越小P值越小E.以上都不对答案D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体答案B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若, 可作单侧检验;A.已知二组患者的白细胞计数均降低B.已知二组患者的白细胞计数均升高C.不清楚哪一组的白细胞计数水平有变化D.已知非典型肺炎患者的白细胞计数不高于普通肺炎E.两组白细胞计数值的总体方差不相等答案D9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为%和%,可认为______.A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比D.应进行假设检验后再下结论E.以上都不对答案D10.比较两个率时,不需要进行率的标准化的情况有______.A.内部构成不同B.内部构成相同C.未知各年龄别人口数D.缺乏各年龄别死亡人数E.不易寻找标准人口构成答案B11.四格表资料在哪种情况下作χ2检验不必校正______.>1且n>40>5或n>40>5且n>40<T<5< P>>5且n<40答案C12.欲比较三种药物的疗效无效、好转、显效、痊愈孰优孰劣,最好选择______.检验B.方差分析C.χ2检验两样本配对的计数资料卡方检验D.秩和检验多样本的计数资料的秩和检验检验答案D13.下面说法中不正确的是_____.A.没有个体差异就不会有抽样误差B.抽样误差的大小一般用标准误来表示C.好的抽样设计方法,可避免抽样误差的产生抽样误差不可避免D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别答案C14.实验设计和调查设计的根本区别是_____.A.实验设计以动物为对象B.调查设计以人为对象C.调查设计可随机分组D.实验设计可人为设置处理因素E.以上都不对答案D15.在下述抽样调查方法中,在样本量相同的前提下,抽样误差最小的是_____.A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样E.多阶段整群抽样答案C16.对两个变量进行直线相关分析,r=,P>,说明两变量之间______.A.有相关关系B.无任何关系C.无直线相关关系D.无因果关系E.有伴随关系答案C17.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组无任何处理,这种对照属于______.A.实验对照B.空白对照C.相互对照D.标准对照E.历史对照答案B18.在两独立样本比较的秩和检验中,实验组的观察值为0,0,7,14,32,40,对照组的观察值为0,1,2,4,4,8.编秩中零值的秩应分别编为______.,3;1,;3,2;2,;1E.不参加编秩答案C19.两样本比较的秩和检验两组样本例数相等,如果假设成立,则对样本来说:______.A.两组秩和相等B.两组秩和的绝对值相等C.两组秩和相差很大D.两组秩和相差一般不会很大E.两组秩和的差值相等答案:A 多组均数的秩和有:各组的平均秩和近似相等医学统计学模拟试题一、单选题:在A、B、C、D 和E 中选出一个最佳答案,将答案的字母填在相应下划线的空格里;每题1 分1. 卫生统计工作的基本步骤包括_____;A 动物实验、临床试验、全面调查和抽样调查B 资料整理、统计描述、参数估计和统计推断C 实验设计、资料收集、资料整理和统计分析D 资料收集、资料核对、资料整理和资料分析E 统计设计、统计描述、统计估计和统计推断2. 以下_____不属于定量资料;A. 体块指数体重/身高2B. 白蛋白与球蛋白比值C. 细胞突变率%D. 中性核细胞百分比%E. 中学生中吸烟人数3. 关于频数表的制作, 以下_____论述是正确的;A. 频数表的组数越多越好B. 频数表的下限应该大于最小值C. 频数表的上限应该小于最大值D. 一般频数表采用等距分组E. 频数表的极差是最小值与最大值之和4. 比较身高与坐高两组单位相同数据变异度的大小,宜采用_____;A. 变异系数CVB.标准差sC.方差s2D.极差RE.四分位间距5. 从μ到μ+1.96s 范围外左右两则外正态曲线下的面积是_____ ;A.% B.95% C.% D.99% E.%6. 关于假设检验的以下论述中,错误的是_____;A. 在已知A药降血压疗效只会比B 药好或相等时, 可选单侧检验B. 检验水准定得越小, 犯I型错误的概率越小C. 检验效能1-定得越小, 犯II型错误的概率越小D. P 值越小, 越有理由拒绝H0E. 在其它条件相同时, 双侧检验的检验效能比单侧检验低7. 两组数据中的每个变量值减同一常数后,做两个样本均数差别的t 检验,____;A. t 值不变B. t 值变小C. t 值变大D. t 值变小或变大E. 不能判断8. 将90 名高血压病人随机等分成三组后分别用A、B 和C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是____ ;A. 作三个样本两两间差值比较的t 检验B. 作三个样本差值比较的方差分析C. 作服药前后配对设计资料的t 检验方差分析D. 作配伍组设计资料的方差分析E. 以上都不对9. 某医师治疗了两例视网膜炎患者,1 例有效,下列哪项说法是错误的:_____;A. 有效率为50%B.最好用绝对数表示C.必须用率表示时,应同时给出其可信区间D.分母太小,用相对数不可靠E.不能得知总体有效率10. 经调查甲乙两地的冠心病粗死亡率均为4/105,经统一年龄构成后,甲地标化率为105,乙地为105;因此可认为_____ ;A. 甲地人群平均年龄较乙地大B.甲地人群实际冠心病死亡率较乙地高C.甲地老年人构成较乙地大D.甲地各年龄别冠心病死亡率都较乙地高E.甲地人群冠心病平均死亡风险较乙地高11.不适宜用Poisson分布描述的实例是_____;A.广深高速公路一定时间发生的交通事故数分布B.每毫升水样品中大肠杆菌数分布C.放射性物质在单位时间内放射出质点数分布D.单位空间中某些昆虫数分布E.一定人群中乙型肝炎病人数分布12.调查某地居民1600 人,得蛔虫感染率为50%,则其总体率的95%可信区间为_____;A.~%B.~%C.45~55%D.~%E.据此资料不可推知13. 以下不是χ2 检验的用途;A. 推断两个或两个以上总体率之间有无差别B. 交叉分类资料两属性间有无相关关系C. 检验频数分布与理论分布的拟合优度D. 推断两个或两个以上总体构成比之间有无差别E. 推断两个或两个以上总体均数之间有无差别14.在两组样本比较的秩和检验中,实验组的观察值为0,3,7,14,32,对照组的观察植为,0,2,4,4,8;编秩中零值的秩应分别编为______;A.1; 2,3 B.3; ,1.5 C. 2; 2,2 D. 1; , E. 不参加编秩15. 根据某地6 至16 岁学生近视情况的调查资料, 反映患者的年龄分布可用_____;A.普通线图B.半对数线图C. 直方图D. 直条图E.复式直条图16. 根据样本算得两个变量X 与Y 之间的相关系数r,经t 检验,P<,可认为_____;A. X 与Y 间相关密切B. B. 总体相关系数ρ=1C. 总体相关系数ρ=0D. 总体相关系数ρ≠0E. 总体相关系数ρ>017. 对药物半衰期较长的某药作不同剂量疗效的临床试验,以下_____设计不适宜;A. 配对设计B. 完全随机设计C .交叉设计D. 配伍组设计E. 以上设计都不合适18. 现时寿命表的期望寿命_____;A. 受人群数量的影响B. 不能进行不同地区间的比较C. 受人口年龄别构成的影响D. 是各年龄别死亡率的综合反映E. 是死亡年龄的平均数19. 与实验相比,_______________;A. 调查中对非研究因素控制更为严格B. 调查不对研究对象作人为干预C. 调查结果更为可靠D. 调查设计要遵循随机和均衡的原则E. 调查研究的样本可以更小20. 在某化疗药物治疗肺癌的临床随访研究中, 不属于截尾数据的是_____;A. 随访对象死于其它疾病B. 随访对象因在随访期间移民出国C. 随访对象因严重付作用未能完成治疗D. 随访对象到研究结束时仍未死亡E. 随访对象失去联络\医学统计学模拟试题B一、单选题:在A,B,C,D,E 中选一个最佳答案, 将答案字母填在下划线里每题 1 分1. 在医学统计学中样本与总体的关系是__________;A 样本是总体中有代表性的一部分B 样本是总体中最有特点的一部分C 样本是总体中典型的一部分D 样本是总体中有意义的一部分E 样本是总体中精心挑选出来的一部分2. 以下关于概率的定义中,__________是错误的;A. 当概率小于, 则为不可能事件B. 当概率等于1, 则为必然事件C. 当概率在0 至1 之间时, 为随机事件D. 当重复实验次数足够大时, 事件发生频率接近概率E. 当概率等于零, 则为非随机事件3. 频数表不能__________;A. 反映频数分布的特征B. 方便进一步统计分析计算C. 便于发现异常值D. 精确估计算术均数的值E. 用于分类资料4. 在描述定量资料的集中趋势时, 以下论述中错误的是__________;A. 均数适宜于对称分布资料B. 几何均数和中位数都适宜于正偏倚分布C. 同一正偏倚分布资料, 估计的均数值小于中位数值D. 对称分布资料的均数值等于中位数值E. 几何均数特别适宜于细菌学和免疫学检测指标的描述5. 用大量来自同一总体的独立样本对总体参数作估计时,关于95%可信区间CI,正确的说法是__________;A. 大约有95%样本的95%CI覆盖了总体参数B. 对于每一个95%CI而言,总体参数约有95%的可能落在其内C. 各个样本的95%CI是相同的D. 对于每一个95%CI而言,有95%的可能性覆盖总体参数E. 以上说法都不对6. 在假设检验中,关于P 值与值,下列说法不正确的是__________;A. α值是决策者事先确定的一个可以忽略的、小的概率值B. P 值是在H0 成立的条件下,出现当前值以及更极端状况的概率C.α值并不一定要取, 根据实际需要甚至可以取到D. 在同一次假设检验中,作单侧检验时所得P 值比作双侧检验时所得P 值小E. α值越小,所得结论越可靠7. 当组数等于2 时,对于同一资料,方差分析与t 检验的关系是____ ;A.完全等价且F=t B.方差分析结果更准确C.t 检验结果更准确D.完全等价且t=E.以上都不对8. 下列关于方差分析的陈述中正确的是____;A. 方差分析用于比较各组的总体方差是否相等B. 方差分析结果有统计学意义表明各样本均数来自同一总体C. 方差分析中判断F 值相对应的P 值时需查双侧界值表D. 方差分析得到的F 值越大, 表明总体均数差别越大E. 方差分析得到的F 值越小, 越没有理由怀疑H0 成立9. 调查某疫苗在儿童中接种后的预防效果,在某地全部1000 名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228 名;若要研究该疫苗在该地儿童中的接种效果,则________;A. 该研究的样本是1000 名易感儿童B. 该研究的样本是228 名阳性儿童C. 该研究的总体是300 名易感儿童D. 该研究的总体是1000 名易感儿童E. 该研究的总体是228 名阳性儿童10. Poisson分布独有的特征是______;A. 离散型分布B. 参数是总体均数C. 方差等于均数D. 当样本较小时是偏倚分布E. 当样本足够大时近似正态11.在比较两个率时,进行标准化的目的是______;A.使两个率之间的差异减小B. 使两个率更能代表二人群的实际水平C. 使两个率更能代表二人群的相对水平D. 任两个率进行比较都必须先进行标准化E. 代替假设检验发现两个率之间的差别12. 用A法和B 法分别检测100名确诊的癌症病人,A法的阳性率为pA,B 法的阳性率为pB;检验两种方法阳性率差异的方法应采用______;A. 检验两样本率是否相等的u检验B. 检验两总体率是否相等的u检验C. 检验两样本率是否相等的χ2 检验D. 检验两总体率是否相等的χ2 检验E. 两非独立样本的总体率是否相等的χ2 检验13.两独立样本比较的秩和检验结果判定为______;越大,P 越大B.T越大, P 越小C. T值在界值范围内, P 小于相应的D.T值在界值范围内,P 大于相应的E.以上都不对14. 关于基于秩次的非参数检验, 下列说法错误的是______;A. 符号秩和检验中, 差值为零不参加编秩B. 随机区组设计资料的秩和检验中, 各组混合编秩C. 当符合正态假定时, 非参数检验犯II类错误的概率较参数检验大D. 当样本足够大时, 秩和分布近似正态E. 秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异15. 为比较某地两年几种疾病的患病率, 可采用______;A. 直方图B.复式直条图C. 线图D. 构成比直条图D.圆图16. 回归分析是研究______;A. 两变量X, Y 变化的关联性B. 两变量X, Y 变化的方向性C. 因变量依赖自变量变化的数量关系D. 两变量变化的紧密程度E. 一个变量对另一个变量的相关比例17. 为减少测量顺序对比较新药与常规药治疗结果的影响, 作统计设计时最好应采用以下哪项措施______;A. 设对照组B. 随机化安排C. 增加实验次数D. 盲法E. 以上都不行18. 关于寿命表, 以下正确的陈述是______;A. 现时寿命表资料来自对特定人群某时点的调查B. 定群寿命表资料来自对特定人群某时点的调查C. 期望寿命又称平均寿命, 指所有调查对象死亡时年龄的平均值D. 随访某特定人群的死亡情况所得资料可做现时寿命表分析E. 因期望寿命受人群年龄构成的影响, 不能直接比较不同地区的期望寿命19. 关于随机抽样, 以下论述中正确的是______;A. 单纯随机抽样适合大规模的抽样调查B. 当学生学号按入学成绩编排时, 评价学生成绩的抽样调查可采用系统抽样C. 整群抽样的优点是抽样误差较小D. 分层抽样可以通过分层控制非研究因素对调查结果的影响E. 在一次抽样调查中只能采用一种抽样方法20. 以下指标中, ______的分母不是用平均人口数;A.死因别死亡率B.粗死亡率C.某疾病发病率D.婴儿死亡率E.以上都不是1. II 型错误2. 非参数检验3. 正常值范围4. 组内变异四、简答题:扼要回答以下问题;每题6 分1. 简述怎样描述一组计量资料的集中趋势和离散趋势2. 试述假设检验中I 型错误与II 型错误的意义及关系;3. 试比较完全随机设计和随机区组设计资料的方差分析基本思想;4. 医院拟研究某新药治疗高血压的疗效,试确定该研究设计中的三要素;5. 试述死亡概率、生存概率与生存率的关系;五、论述和计算题每题12 分1. 某研究调查了山区、丘陵、平原和沿海地区居民饮用水中氟含量与氟骨症患病率如下表,试问1饮用水中氟含量与氟骨症患病率有无关系2有人说,如相关系数的检验结果为P<,可认为,饮水中氟含量高是导致氟骨症高发的原因之一,对吗氟含量mg/l X患病率%Y Y2. 在某地卫生服务调查中随机抽样调查了400 户家庭,他们的平均年医疗费用支出是947元,标准差是291 元;设家庭医疗费用近似正态分布,请估计这些家庭的95%年医疗费用支出范围,并估计当地家庭年医疗费用平均支出;1. 检验效能2. 参数检验3. 可信区间4. 组间变异四、简答题:扼要回答以下问题;每题6 分1. 试比较标准差和标准误的关系与意义;2. 请简述对两总体均数作独立样本假设检验可以采用的统计方法及适用条件;3. 简述非参数检验的应用条件和优缺点;4. 简述二项分布、Poisson 分布、正态分布三者的关系;5. 试述直线相关与直线回归的区别与联系;五、论述和计算题每题12 分1.某医生欲比较三种镇咳药的疗效, 分析三种镇咳药延迟咳嗽的时间;结果经方差分析得下表,2. 请补充并完成方差分析,3. 解释结果;表三种镇咳药延迟咳嗽时间的方差分析表变异来源SS νMS F P组间变异组内变异总变异392. 测得老年性慢性支气管炎病人与健康人的尿中17 酮类固醇排出量见下表, 比较两组均数差异是否有统计学意义并解释结果;表老年慢支病人与健康人尿中17 酮类固醇排出量mg/24h病人组健康组20.在简单线性回归分析中,得到回归系数为,经检验有统计学意义,说明______.对Y的影响占Y变异的30%增加一个单位,Y平均减少30%增加一个单位,Y平均减少个单位增加一个单位,X平均减少30%增加一个单位,X平均减少个单位答案C。
卫生统计学试题及答案(附解释)
卫生统计学试题及答案(一)1。
用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D。
直条图E。
复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______。
A。
直方图B。
普通线图C。
半对数线图D。
直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E?3。
为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B。
普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C。
半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E。
复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______。
A.该研究的样本是1000名易感儿童B。
该研究的样本是228名阳性儿童C。
该研究的总体是300名易感儿童D。
该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5。
若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B。
总体中任一部分C.总体中随机抽取的一部分D。
总体中选取的有意义的一部分E.总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______。
A.当样本含量增大时,均数也增大B.均数总大于中位数C。
均数总大于标准差D.均数是所有观察值的平均值E。
均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A。
高级卫生专业资格正高副高疾病控制专业资格(正高副高)模拟题241)_真题-无答案14
高级卫生专业资格(正高副高)疾病控制专业资格(正高副高)模拟题2021年(41)(总分95.XX01,考试时间120分钟)A1/A2题型1. 关于基于秩次的非参数检验,下列说法错误的是A. 符号秩和检验中,差值为零不参加编秩B. 两样本比较的秩和检验方法中的正态近似法为参数检验C. 当符合正态假定时,非参数检验犯Ⅱ类错误的概率较参数检验大D. 当样本足够大时,秩和分布近似正态E. 秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异2. 现时寿命表的期望寿命A. 受人群数量的影响B. 不能进行不同地区间的比较C. 受人口年龄别构成的影响D. 是各年龄别死亡率的综合反映E. 是死亡年龄的平均数3. 某地区抽样调查1000名成年人的血压值并制作成频数表,此资料属于A. 计量资料B. 计数资料C. 等级资料D. 半定量资料E. 离散型资料4. 一种新的治疗方法可以延长生命,但不能治愈其病,则发生下列情况A. 该病患病率将增加B. 该病患病率将减少C. 该病发病率将增加D. 该病发病率将减少E. 该病的生存率增加5. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属( )资料A. 计算B. 计数C. 计量D. 等级E. 都对6. 描述一组对称(或正态)分布资料的离散趋势时,最适宜选择的指标是A. 极差B. 标准差C. 均数D. 变异系数E. 标准误7. 横轴上,标准正态曲线下从0到1.96的面积为A. 95%B. 45%C. 97.5%D. 47.5%E. 49.5%8. 反映事物内部组成部分的比重大小应选用A. 构成比B. 相对比C. 绝对数D. 率E. 变异系数9. 男性人口数/女性人口数,这一指标为A. 率B. 构成比C. 相对比D. 动态数列E. 不是相对数10. 所谓流行病学描述性研究是指A. 在特定时间内了解人群中疾病或健康状况及其相关因素的情况B. 长期、系统地收集监测疾病及相关问题的有关资料C. 在群体水平上研究疾病与某一(或某一些)因素的关系D. 通过收集、分析某一地区或某特定人群在特定时间内已有的常规数据进行研究E. 通过调查、观察,了解所研究问题(如疾病、健康状况或其他卫生事件)在人群中的分布情况的一类方法11. 形成病因假设的流行病学研究方法有A. 普查B. 社区实验C. 队列研究D. 现场实验E. 临床试验12. 队列研究中调查对象应选择A. 在有该病者中,选择有、无某种暴露因素的两个组B. 在有该病者中,选择有某种暴露因素的为一组,在无该病者中,选择无某种暴露因素的为另一组C. 病者中选择有某种暴露因素的为一组,在有该病者中选择无某种暴露因素的为另一组D. 在无该种疾病者中,选择有、无某种暴露的各为一组E. 任选有、无暴露的两个组13. 实验设计中要求严格遵守四个基本原则,其目的是为了A. 便于统计处理B. 严格控制随机误差的影响C. 便于进行试验D. 减少和抵消非实验因素的干扰E. 以上都不对14. 频数表不能A. 反映频数分布的特征B. 方便进一步统计分析计算C. 便于发现异常值D. 精确估计算术均数的值E. 用于分类资料15. 统计学常将P≤0.05或P≤0.01的事件称A. 必然事件B. 不可能事件C. 随机事件D. 小概率事件E. 偶然事件16. 频数分布类型不明的资料,要表示其平均水平,宜计算A. XB. GC. MD. SE. CV17. 某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时),问该食物中毒的平均潜伏期为多少小时A. 5B. 5.5C. 6D. 10E. 1218. 下面哪一项分布的资料,均数等于中位数A. 对数正态B. 左偏态C. 右偏态D. 偏态E. 正态19. 表示血清学滴度资料平均水平最常计算A. 算术均数B. 几何均数C. 中位数D. 全距E. 率20. 作四格表卡方检验,当N>40,且( )时,应该使用校正公式A. T<5B. T>5C. T<1D. T>5E. 1<T<521. 定性权重确定法最常用的方法是A. 选题小组访谈B. 德比克法C. 特尔菲法D. 个人深入访谈E. 专题小组访谈22. 在病因学上,轮状模型与三角模型相比,其主要的不同点是A. 更强调影响疾病发生的三要素B. 有差别地看待疾病的三要素C. 强调环境及环境与机体的密切关系D. 更强调特异性的病原学说E. 更强调环境的作用23. 下列哪一种方法不能用来控制混杂偏倚A. 限制B. 严格的质量控制C. 随机化D. 分层分析E. 多因素分析24. 山区地方性甲状腺肿患病率高,饮水中碘含量低;而平原地方性甲状腺肿患病率低,饮水中碘含量高,由此推断,饮水缺碘与地方性甲状腺肿有关。
卫生统计学考前复习综合测试卷及答案一
2018年卫生统计学考前复习综合测试卷及答案一一、选择题1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加实验,分别测得实验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
A.已知二组患者的白细胞计数均降低B.已知二组患者的白细胞计数均升高C.不清楚哪一组的白细胞计数水平有变化D.已知非典型肺炎患者的白细胞计数不高于普通肺炎E.两组白细胞计数值的总体方差不相等【答案】D9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为______.A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比D.应进行假设检验后再下结论E.以上都不对【答案】D10.比较两个率时,不需要进行率的标准化的情况有______.A.内部构成不同B.内部构成相同C.未知各年龄别人口数D.缺乏各年龄别死亡人数E.不易寻找标准人口构成【答案】B11.四格表资料在哪种情况下作χ2检验不必校正______.A.T>1且n>40B.T>5或n>40C.T>5且n>40D.1E.T>5且n<40【答案】C12.欲比较三种药物的疗效(无效、好转、显效、痊愈)孰优孰劣,最好选择______.A.t检验B.方差分析C.χ2检验D.秩和检验E.u检验【答案】D13.下面说法中不正确的是_____.A.没有个体差异就不会有抽样误差B.抽样误差的大小一般用标准误来表示C.好的抽样设计方法,可避免抽样误差的产生D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别【答案】C14.实验设计和调查设计的根本区别是_____.A.实验设计以动物为对象B.调查设计以人为对象C.调查设计可随机分组D.实验设计可人为设置处理因素E.以上都不对【答案】D15.在下述抽样调查方法中,在样本量相同的前提下,抽样误差最小的是_____.A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样E.多阶段整群抽样【答案】C16.对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______.A.有相关关系B.无任何关系C.无直线相关关系D.无因果关系E.有伴随关系【答案】C17.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组无任何处理,这种对照属于______.A.实验对照B.空白对照C.相互对照D.标准对照E.历史对照【答案】B18.在两独立样本比较的秩和检验中,实验组的观察值为0,0,7,14,32,40,对照组的观察值为0,1,2,4,4,8.编秩中零值的秩应分别编为______.A.2,3;1B.1.5,1.5;3C.2,2;2D.2.5,2.5;1E.不参加编秩【答案】C19.两样本比较的秩和检验(两组样本例数相等),如果假设成立,则对样本来说:______.A.两组秩和相等B.两组秩和的绝对值相等C.两组秩和相差很大D.两组秩和相差一般不会很大E.两组秩和的差值相等【答案】D20.在简单线性回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明______.A.X对Y的影响占Y变异的30%B.X增加一个单位,Y平均减少30%C.X增加一个单位,Y平均减少0.30个单位D.Y增加一个单位,X平均减少30%E.Y增加一个单位,X平均减少0.30个单位【答案】C二、多选题在A、B、C、D和E中选出一个最佳答案,将答案的字母填在相应下划线的空格里。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于秩次的非参数检验1. 问题的提出前面学习了连续型资料两组样本均数差异的假设检验方法:小样本用t检验,条件是变量服从正态分布和方差齐;大样本用标准正态分布的Z检验。
如果是小样本,变量的分布不清,或者已知不服从正态分布或经变量转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?需要一种不依赖于分布假定的检验方法,即非参数检验。
2. 基本概念前面介绍的检验方法首先假定分析变量服从特定的已知分布(如正态分布),然后对分布参数(如均数)作检验。
这类检验方法称参数检验(parametric test)。
今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量的中心位置或分布位置作比较。
这类检验称非参数检验(nonparametric test),由于其对总体分布不作严格假定,所以又称任意分布检验。
(distribution-free test)非参数检验的优点:a.不受总体分布的限制,适用范围广。
b.适宜定量模糊的变量和等级变量。
c.方法简便易学。
缺点:如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布(如正态分布),这时人为地将精确测量值变成顺序的秩,将丢失部分信息,造成检验功效能下降。
基于秩次非参数检验(秩和检验)的基本思想假设变量X有观察值1.1, 1.3, 1.7, 4.3, 11.4显然这变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。
但如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。
然后对这秩分布的中心位置(中位数)作检验,这就是秩和检验。
7.1 配对样本的符号秩检验(Wilcoxon signed rank test)例7.1为研究出生先后的孪生兄弟间智力是否存在差异,12对孪生兄弟测试的结果见表7.3。
表7.3 12对孪生兄弟测试结果T +=24.5,T -=41.5符号秩检验的分布理论:假定有4个差值,如果H 0成立时,这4个差值有同等的概率取正值或负值,即每个值取正值的概率等于1/2。
4个差值每种组合发生的可能性就是:0625.021212121=⨯⨯⨯=P 。
所有可能的秩和情况和T *的分布见表7.1。
表7.1 n=4时所有可能秩和情况和T*的分布正差数的秩次负差值的秩次正秩和T+负秩和T-检验统计量T*概率P1,2,3,4 -- 10 0 0 0.0625 2,3,4 1 9 1 1 0.0625 1,3,4 2 8 2 2 0.0625 1,2,4 3 7 3 3 0.1250 3,4 1,2 7 3 31,2,3 4 6 4 4 0.1250 2,4 1,3 6 4 41,4 2,3 5 5 5 0.1250 2,3 1,4 5 5 51,3 2,4 4 6 4 0.1250 4 1,2,3 4 6 41,2 3,4 3 7 3 0.12503 1,2,4 3 7 32 1,3,4 2 8 2 0.06251 2,3,4 1 9 1 0.0625- 1,2,3,4 0 10 0 0.0625如果零假设成立,观察的结果应该服从这分布,即出现极端的可能性很小。
如果真是出现小概率,那么我们对零假设的真实性产生怀疑,拒绝零假设。
表 7.2 Wilcoxon符号秩检验的判断原则双侧检验单侧检验(1) 单侧检验(2) 检验假设H0:Md(d)=0 H0:Md(d)=0 H0:Md(d)=0 H1:Md(d)≠0 H1:Md(d)>0 H1:Md(d)<0统计决策:小样本查表法若T*≤Tα/2(n),则拒绝H0若T-≤Tα(n),则拒绝H0若T+≤Tα(n),则拒绝H0大样本正态近似法 若│Z │>Z α/2 , 则拒绝H 0 若│Z │>Z α , 则拒绝H 0 若│Z │>Z α, 则拒绝H 0当研究例数较大时(n>50),秩和T 的分布近似正态分布,可以用正态分布理论作假设检验。
这时正态分布的均数和标准差分别等于: μT =n(n +1)/424/)12)(1(++=n n n T σ 检验的公式为:24/)12)(1(5.04/)1(5.0**++-+-=--=n n n n n Z T T TT σμ具体计算步骤: a. 建立检验假设:H0: 中位数为零; H1:中位数不等于零;α=0.05b. 编秩、计算秩和:差数为零不参加编秩,相同差值求平均秩。
分别求正号和负号的秩和,取绝对值小的为T。
c. 确定概率:查附表10,在n=11时,T0.05=11。
现24.5>11,故p>0.05。
7.2 两独立样本的秩和检验(Wilcoxon rank sum test)例7.2 在缺氧条件下,观察4只猫与12只兔的生存时间(分),结果见表7.5。
试判断猫、兔在缺氧条件下生存时间的差异是否具有统计学意义。
这是生存时间资料,一般不服从正态分布,样本也较小,需考虑用非参数检验---秩和检验。
秩和检验的基本思想:两组观察值共有n例,设例数较少的组有n1例,按观察值大小顺序分别编秩为1,2,…,n。
如果零假设成立,观察的结果有较大的可能出现分布在中间的结果。
如果极端的结果出现,则可能零假设不成立,我们就拒绝零假设。
表7.5 缺氧条件下猫与兔的生存时间(分)比较当样本较大时,秩和的分布近似正态分布,可以用正态分布理论作假设检验。
这时正态分布的均数和标准差分别等于:T*=n 1(n +1)/2⎥⎥⎦⎤⎢⎢⎣⎡---+=∑*n n t t n n n k kT 33222)(112)1(σ检验公式为:21*5.0|2/)1(|*-+-=T n n T Z σ具体计算步骤: a. 建立检验假设:H0:Md1=Md2,即两总体分布位置相同;H1:Md1≠Md2,即两总体分布位置不同;α=0.05b.编秩和计算秩和:两组混合编秩,有相同值求平均秩(仅有同组相同值可忽略)。
当n1<n2时,取较小样本的秩和为检验统计量T*=R1;当n1=n2时,取秩和较小者为检验统计量T*=min(R1,R2)。
本例求例数较少组的秩和T*=78.5。
c.确定概率:T值在表中两数字值之间时,p值大于相应界值,反之则小于。
n1=5,n2=14,n2-n1=9,查附表11,T L0.01=22,T U0.01=78,T*>T U0.01,P<0.01,故拒绝H0,可认为猫、兔在缺氧条件下的生存时间的中位数不相等。
7.3 多个样本分布位置相同的假设检验1.完全随机化设计资料分布位置的假设检验(Kruskal- Wallis test)表7.7 不同吸烟习惯母亲的新生儿体重(kg)出生体重x ij相应秩次r ijA B C D A B C D2.7 2.93.3 3.5 3 4 7 112.43.2 3.6 3.6 2 5.5 12.5 12.52.23.2 3.4 3.7 1 5.5 9 143.4 3.4 9 9n i 4 3 4 3R i15 15 37.5 37.5 计算步骤:a. 建立检验假设: H0:k个总体中位数相等;H1:k个总体中位数不等;α=0.05。
b. 计算统计量:各组混合编秩。
如不同组间出现相同值,求平均秩。
计算各组的秩和。
如果H 0:成立,第i 组秩和的期望(总体均数)Ri μ与方差2Ri σ分别为:2)1(+=n n i R iμ 12)1)((2+-=n n n n i i Riσ 在此基础上建立检验统计量:[][]∑∑==+-+-=-=ki i i i i ki RiRi i n n n n n n R R H 1212212/)1)((2/)1(σμ当H 0成立时,该检验统计量近似服从自由度为(k-1)的2分布。
为简化运算,由上式推导出如下公式:)1(3)()1(1212--+=∑=n n R n n H k i ii375.9)114(3)35.3745.37315415()114(14122222=+-++++=H 校正:)()(1313n n t t HH mp p p C ---=∑= 5018.91414)]22()33()22[(1375.93333=--+-+--=C H c. 确定概率和判断结果:自由度(df)=4-1=3,查χ2值表得χ20.05(3)=7.815,p<0.05,故拒绝零假设,说明不同吸烟习惯对新生儿体重有影响。
2.随机化区组设计资料分布位置的假设检验(Friedman test)与配对设计的思想一样,为控制某些因素对试验效应的混杂影响,可以在设计时,将试验对象配成组,再随机地分配处理因素给每组中的各个对象,这种设计称随机化区组设计。
对于随机化区组设计资料,考虑k个处理组的分布差异时,可采用由M. Friedman在符号检验基础上扩展的秩和检验,称为Friedman检验(Friedman test)。
令x ij为第i区组(i =1,2....b)、第j处理组(j=1,2....k)的个体观察值,数据按区组(b行)与处理组(k列)排列如表7.8。
表7.8 随机化区组设计的资料格式区组处理组1 2 ... k1 x11x12... x1k2 x21x22... x2k┆┆┆┆┆b x b1x b2... x bk其检验假设为H0:k个处理组效应的中位数相等;H1:k个处理组效应的中位数不全相等。
进行Friedman检验时,首先在每区组(行)内将观察值按其数值由小到大排秩,然后再按处理组(列)求秩和,最后产生一个综合区组内差异的检验统计量。
令r ij为第i区组、第j处理组观察值x ij所对应的秩次,因为每一区组(行)内有k 个从1到k 的整数秩,所以任何区组(行)的秩和为2)1(1+=∑=k k r kj ij 令R j为第j 处理组的秩和,即R j=∑=kj ijr 1,故总秩和为2)1(1+=∑=k bk R kj i 当H 0成立时,第j 列秩和的期望与方差分别为2)1(+=k b Riμ, 12)1(22-=k b Rj σ大样本时,统计量 2RjRjj j R Z σμ-=~N(0,1)取其加权和,[]∑∑==++-=⎪⎭⎫ ⎝⎛-=kj j j kj k kb k b R Z k k 1221212/)1(2/)1(1χ 近似服从自由度为(k-1)的2χ分布,通过与2χ分布界值的比较便可作出判定。
与K-W 检验统计量的情况相似,可导出计算式)1(3)1(12122+-+=∑=k b R k bk k j j χ 例7.4 三批甘蓝叶样本分别在甲、乙、丙、丁四种条件下测量核黄素浓度,试验结果如表7.9所示。
问四种条件下的测量结果的差异是否具有统计学意义?表7.9 甘蓝叶核黄素浓度测量值(/g)批次测量条件甲乙丙丁1 27.2(2) 24.6(1) 39.5(4) 38.6(3)2 23.2(1) 24.2(2) 43.1(4) 39.5(3)3 24.8(2) 22.2(1) 45.2(4) 33.0(3)R j 5 4 12 9解 (1) 建立检验假设H0:四种测量条件下的测量结果的中位数相等;H1:四种测量条件下的测量结果的中位数不全相等。