医学统计学 -第10章 基于秩次的非参数检验
医学统计学秩和检验
对统计分析的结果进行解释和报告,包 括显著性水平、效应大小等。
医学统计学秩和检验的优势
1 非参数方法
医学统计学秩和检验不需要假设数据服从特 定的分布,更适用于真实世界的数据。
2 强大的统计推断
医学统计学秩和检验能够进行假设检验、置 信区间估计和相关分析等多种统计推断。
3 对异常值的鲁棒性
由于基于秩次而不是原始数据,医学统计学 秩和检验对异常值具有较好的鲁棒性。
3 基本原理
医学统计学秩和检验基于 非参数统计方法,不依赖 于数据的分布情况,更适 用于小样本和偏态数据。
医学统计学秩和检验的应用
药效试验
用于评估不同药物的疗效,判断药物之间的差异。
生存分析
用于分析患者的生存时间和生存率,评估不同因 素对生存的影响。
配对设计研究
用于比较两种相关观察结果之间的差异,如治疗 前后的数据比较。
相关分析
用于分析两个变量之间的相关程度,评估它们的 线性关系。
医学统计学秩和检验的步骤
1
收集数据
收集与研究目的相关的数据,并确保数
将数据转换为秩次
ห้องสมุดไป่ตู้
2
据质量和完整性。
对数据进行排序,将其转换为秩次,以
便进行后续的统计分析。
3
应用适当的秩和检验方法
根据研究设计和研究问题选择合适的秩
解释和报告结果
4
和检验方法。
4 广泛适用性
医学统计学秩和检验适用于不同类型的数据, 包括定量数据、定性数据和顺序数据。
医学统计学秩和检验的案例
临床试验
通过医学统计学秩和检验,研究 人员可以评估新药的疗效和安全 性。
流行病学调查
医学统计学秩和检验可以用于分 析调查数据,研究疾病的发病率 和风险因素。
医学统计学 吉大考试题库答案
医学统计学一、单选题1. 描述某地某年250 名健康成人尿汞含量的频数分布情况, 宜绘制 B. 直方图2. 正态分布曲线下中间面积为99% 的变量值范围为 B.3. 比较某医院8个病区的病床周转率,宜绘制 B. 直条图5. 正态曲线下,横轴上,从均数到+∞的面积为 B. 50%6. 表示某地区某年各种死因的构成比,可绘制 B. 圆图7. 标准正态曲线下中间95%的面积所对应的横轴尺度u的范围是 A. -1.96到+1.968. 等级资料比较宜用 D. 秩和检验9. 在圆形构成图中,36%所占的圆心角度数为 C. 129.6°10. 第一类错误α和第二类错误β的关系有 D. α愈大β愈小11. 下面关于均数的正确的说法是 D. 均数是所有观察值的平均值12. 反映一组偏态分布资料平均水平的指标宜用 C. 中位数13. 直线相关系数r的计算公式为 D.14. 两样本秩和检验与t检验相比 D. 各有优缺点15. 统计推断的内容 D. A、C均是16. 下述( )种资料为计数资料 D. 血型17. 对于t 分布,当ν=∞时,完全成为 B. 标准正态分布18. 比较身高(cm)和体重(Kg)两组数据的变异度大小宜选用 C. 变异系数(CV)19. 四格表检验专用公式的应用条件为 B. 每一格的T≥5且n≥4020. 关于构成比的叙述,下列是正确的 B. 反映某事物内部各部分占全部构成的比重21.已知r=1,则一定有 C. b>022. 下列资料____ ____为分类资料 B. 血型分布(A、B 、O 、AB)23. 完全随机设计方差分析中的组间均方是的统计量 C. 表示某处理因素的效应和随机误差两者综合影响的结果24. 下列___ ___情况时,回归方程拟合得越好。
C. 决定系数越大25. 偏态分布的数据宜用描述其分布的集中趋势 C. 中位数1.表示事物内部各个组成部分所占比重的相对数是 C. 构成比2.样本标准差的计算公式为 B.3.对X、Y两个随机变量作直线回归分析时,下列正确的说法是 C. 只要求Y 满足正态分布4.某血库积累的6094例ABO血型数据如下:该资料的类型是 D. 定性分类资料6.某地某年肺癌死亡率城区为郊区的194.1%,本指标是 C. 相对比。
医学统计学习题
医学统计学习题《医学统计学》习题集第⼀章绪论1.下⾯的变量中,属于分类变量的是( B )。
A.脉搏B.⾎型C.肺活量D.红细胞计数E.⾎压2.某⼈记录了50名病⼈体重的测定结果:⼩于50kg的13⼈,介于50kg和70kg间的20⼈,⼤于70kg的17⼈,此种资料本属于( A )。
A.定量资料B.分类资料C.有序资料D.⼆分类资料E.名义变量资料%第⼆章定量资料的统计描述1.欲⽐较⾝⾼(cm)和体重(kg)哪个指标变异程度⼤,应采⽤(D )。
A.标准差B.极差C.四分位数间距D.变异系数2.已知某疾病患者10⼈的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>20,其潜伏期的平均⽔平约为( B )天。
.3.调查测定某地107名正常⼈尿铅含量(mg/L)如下:0~ 4~ 8~ 12~ 16~ 20~ |24~ 28~ 合计尿铅含量例数14 22 29 18 —15 6 1 2 107 (1)描述该资料的集中趋势,宜⽤(B )。
A.均数B.中位数C.⼏何均数D.极差(2)描述该资料的离散趋势,宜⽤(C )。
.A.极差B.变异系数C.四分位间距D.标准差第三章定性资料的统计描述1.某医院某年住院病⼈中胃癌患者占5%,则( B )。
%是强度指标 B. 5%是频率指标C. 5%是相对⽐指标D. 5%是绝对数—2.某病患者120⼈,其中男性114⼈,⼥性6⼈,分别占95%与5%,则结论为( D )。
A.该病男性易得B.该病⼥性易得C.该病男性、⼥性易患程度相等D.尚不能得出结论3.⼀项新的治疗⽅法可延长病⼈的⽣命,但不能治愈该病,则最有可能发⽣的情况是( A )。
A.该病的患病率增加B.该病的患病率减少C.该病的发病率增加D.该病的发病率减少-4.某市有30万⼈⼝,2002年共发现2500名肺结核患者,全年总死亡⼈数为3000,其中肺结核死亡98⼈,要说明肺结核死亡的严重程度,最好应⽤()。
医学统计学非参数检验秩和检验详解演示文稿
• 基本特点:与分布无关
• 基本方法: χ2 检验
基于秩(等级,rank)的方法 基于特定参照点(如中位数)的方法 ……
第四页,共150页。
非参数检验的优点:
①适用范围广
②受限条件少。参数检验对总体分布等有特别限定 ,而非参数检验的假定条件少,也不受总体分布 的限制,更适合一般的情况。 ③具有稳健性。参数检验是建立在严格的假设条件基
Z=3.630,P=0.000
第二十五页,共150页。
【例2】20名正常人和32名铅作业工人尿铅定性检查 结果如表。问铅作业工人尿铅是否高于正常人?
结果
-
+
++ +++ ++++
正常人
18
2
0
0
0
铅作业工人 8
10
7
3
4
第二十六页,共150页。
第二十七页,共150页。
第二十八页,共150页。
U检验:
• 随机区组设计多个样本比较的非参数检 验
诊断试验ROC曲线分析
第六十四页,共150页。
配对设计差值比较的符号秩和检验由
Wilcoxon1945年提出,又称Wilcoxon 符号秩和检验,常用于检验差值的总体
中位数是否等于零。
第六十五页,共150页。
分析步骤:
(1)建立检验假设,确定检验水准
Ho:差值总体中位数Md=0 H1:差值总体中位数Md≠0
若相同秩次较多,应作校正计算
Zc = Z/ c
∑ c = 1-
(t
3 i
-ti
) /(N
3
-
N
);
医学统计学模拟试题
医学统计学模拟试题(A)一、单选题:在A、B、C、D 和E 中选出一个最佳答案,将答案的字母填在相应下划线的空格里。
(每题1 分)1. 卫生统计工作的基本步骤包括_____。
A 动物实验、临床试验、全面调查和抽样调查B 资料整理、统计描述、参数估计和统计推断C 实验设计、资料收集、资料整理和统计分析D 资料收集、资料核对、资料整理和资料分析E 统计设计、统计描述、统计估计和统计推断2. 以下_____不属于定量资料。
A. 体块指数(体重/身高2)B. 白蛋白与球蛋白比值C. 细胞突变率(%)D. 中性核细胞百分比(%)E. 中学生中吸烟人数3. 关于频数表的制作, 以下_____论述是正确的。
A. 频数表的组数越多越好B. 频数表的下限应该大于最小值C. 频数表的上限应该小于最大值D. 一般频数表采用等距分组E. 频数表的极差是最小值与最大值之和4. 比较身高与坐高两组单位相同数据变异度的大小,宜采用_____。
A. 变异系数(CV)B.标准差(s)C.方差(s2)D.极差(R)E.四分位间距5. 从μ到μ+1.96s 范围外左右两则外正态曲线下的面积是_____ 。
A.2.5% B.95% C.5.0% D.99% E.52.5%6. 关于假设检验的以下论述中,错误的是_____。
A. 在已知A药降血压疗效只会比B 药好或相等时, 可选单侧检验B. 检验水准 定得越小, 犯I型错误的概率越小C. 检验效能1- 定得越小, 犯II型错误的概率越小D. P 值越小, 越有理由拒绝H0E. 在其它条件相同时, 双侧检验的检验效能比单侧检验低7. 两组数据中的每个变量值减同一常数后,做两个样本均数( X)差别的t 检验,____。
A. t 值不变B. t 值变小C. t 值变大D. t 值变小或变大E. 不能判断8. 将90 名高血压病人随机等分成三组后分别用A、B 和C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是____ 。
医学统计学练习题
第一章绪论一、名词解释:1. population 2. sample 3. homogeneity 4. variation 5. parameter二、辨别正误:()1.定量变量、分类变量和有序变量可以相互转换。
()2.同质的个体间不存在变异。
()3.如果个体间有变异,则它们一定不是不是来自同一总体。
()4.离散变量在数值很大时,单位为“千”或“万”时可以取小数值,此时可以近似认为是连续型变量。
()5.样本是总体中典型的一部分。
三、选择题1. 统计工作的前提和基础是()A 收集资料B 整理资料C 分析资料D 调查资料E 校对资料2.为了由样本推断总体,样本应该()A 总体中的任意部分B 总体中的典型部分C 总体中有价值的一部分D 总体中有意义的一部分E 总体中有代表性的一部分3.统计分析的主要内容有()A 描述性统计和统计学检验B 区间估计和假设检验C 统计图表和统计报告D 描述性统计和分析性统计E 描述性统计和统计图表4.统计学上的总体为()A任意想象的研究对象的全体B根据研究目的确定的研究对象的全体C根据时间划分的研究对象的全体D根据人群划分的研究对象的全体E根据地区划分的研究对象的全体 5.搞好统计工作,达到预期目标,最重要的是( )A原始资料要正确B原始资料要多C分析资料要先进D整理资料要详细E统计计算精度要高四、问答题:统计工作的基本步骤是什么?第二章定量资料的统计描述一.名词解释1. mean2. :median]3. Q4. S5. CV二.填空1. 对定量资料的描述,有()趋势和()趋势。
2.描述定量资料的集中趋势,常用的指标有()、()和()。
3.描述定量资料的离散趋势,常用的指标有()、()、()、()和()4.变异系数的应用条件为()或()。
5.描述等级资料的集中趋势,适宜选用()。
三.选择题1. 从一个数值变量资料的总体中抽样,产生抽样误差的原因是A. 总体中的个体值存在差别B. 总体均数不等于零C. 样本中的个体值存在差别D. 样本均数不等于零E. 样本只包含总体的一部分2.在正态分布条件下表示变量值变异情况的指标最常用的是A 标准差B 标准误C 变异系数D 全距E 百分位数3.变异系数越大说明A 标准差越大B 平均数越大C 标准差、平均数都大D 平均数小E以均数为准变异程度大4.反映定量变量观察数据集中位置的指标是A 标准差B 标准误C 频率D 全距E 均数5.在服从正态分布的条件下,样本标准差的值A 与集中趋势有关B 与观察例数有关C 与平均数有关D 与平均数无关 E 与个体的变异程度有关四.简答题试述描述定量资料的集中趋势的常用指标、计算方法和应用条件。
10非参数秩和检验
n2=7
T2=134
Kruskal-Wallis test
(1) 建立假设检验
H0:四组鼠脾DNA含量的总体分布相同
H1:四组鼠脾DNA含量的总体分布位置不全相同 α=0.05
(2) 计算统计量
‣ 四个样本总例数N=8+7+9+8=32。将四样本32个观
察值统一由小到大编秩,见上表第(2)、(4)、(6)、 (8)列。在不同组中有相同含量值10.3两个,12.3三 个,均取各自的平均秩次。
Kruskal-Wallis test
Ti 2 12 H 3( N 1) N ( N 1) ni 1262 1342 123.5 2 54.5 2 12 3( 32 1) 19.90 32( 32 1) 8 7 9 8
Wilcoxon rank sum test
(3) 查表及结论
‣ n=n2-n1,查T界值表T0.05(4)=91~159,
两组患者的平均生存时间不同。
T1=162
落在界值范围外,所以P<0.05,拒绝H0,认为
二、正态近似法
例10-3 44例健康人与24例慢性气管炎病人痰液嗜酸 性粒细胞数的测量值(×106/L),问健康人与慢性 气管炎病人痰液嗜酸性粒细胞数有无显著差别?
0
计量 T 与总体的平均秩和应该相差不大;当与平均
秩相差太大时,超过了抽样误差可以解释的范围,
则 有 理 由 怀 疑 原 假 设 的 正 确 性 , 从 而 拒 绝 H0 。
(刘启贵)
的血清抗体滴度水平间差异是否有统计学意义?
抗体 滴度 (1) 1:10 1:20 1:40 1:80 1:160 1:320 合计 气 雾 组 皮下注 80亿 100亿 射组 (2) (3) (4) 2 15 10 5 1 — 33 4 7 12 7 2 — 32 2 1 13 9 5 1 31 累计 平均 秩次 (6) 4.5 20 49 77 91.5 96 秩 80亿 (7) 9 300 490 385 91.5 — 1275.5 100亿 (8) 18 140 588 539 183 — 1468 和 皮下 (9) 9 20 637 693 475.5 96 1912.5 和
卫生统计学试题及答案(附解释)
卫生统计学试题及答案(一)1。
用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B。
半对数线图C。
直方图D.直条图E。
复式直条图【答案】C(6—-16岁为连续变量,得到的是连续变量的频数分布)2。
为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______。
A.直方图B.普通线图C。
半对数线图D。
直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E?3。
为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B。
普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D。
直条图E.复式直条图【答案】E4。
调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名.若要研究该疫苗在该地儿童中的接种效果,则______。
A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D。
该研究的总体是1000名易感儿童E。
该研究的总体是228名阳性儿童【答案】D5。
若要通过样本作统计推断,样本应是__________。
A。
总体中典型的一部分B。
总体中任一部分C。
总体中随机抽取的一部分D.总体中选取的有意义的一部分E。
总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______.A。
当样本含量增大时,均数也增大B。
均数总大于中位数C。
均数总大于标准差D。
均数是所有观察值的平均值E。
均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______。
医学统计学模拟试题1
医学统计学模拟试题(A)一、单选题:在A、B、C、D 和E 中选出一个最佳答案,将答案的字母填在相应下划线的空格里。
(每题 1 分)1. 卫生统计工作的基本步骤包括_____。
A 动物实验、临床试验、全面调查和抽样调查B 资料整理、统计描述、参数估计和统计推断C 实验设计、资料收集、资料整理和统计分析D 资料收集、资料核对、资料整理和资料分析E 统计设计、统计描述、统计估计和统计推断2. 以下_____不属于定量资料。
A. 体块指数(体重/身高2)B. 白蛋白与球蛋白比值C. 细胞突变率(%)D. 中性核细胞百分比(%)E. 中学生中吸烟人数3. 关于频数表的制作, 以下_____论述是正确的。
A. 频数表的组数越多越好B. 频数表的下限应该大于最小值C. 频数表的上限应该小于最大值D. 一般频数表采用等距分组E. 频数表的极差是最小值与最大值之和4. 比较身高与坐高两组单位相同数据变异度的大小,宜采用_____。
A. 变异系数(CV)B.标准差(s)C.方差(s2)D.极差(R)E.四分位间距5. 从μ到μ+1.96s 范围外左右两则外正态曲线下的面积是_____ 。
A.2.5% B.95% C.5.0% D.99% E.52.5%6. 关于假设检验的以下论述中,错误的是_____。
A. 在已知A药降血压疗效只会比B 药好或相等时, 可选单侧检验B. 检验水准定得越小, 犯I型错误的概率越小C. 检验效能1-定得越小, 犯II型错误的概率越小D. P 值越小, 越有理由拒绝H0E. 在其它条件相同时, 双侧检验的检验效能比单侧检验低7. 两组数据中的每个变量值减同一常数后,做两个样本均数( X)差别的t 检验,____。
A. t 值不变B. t 值变小C. t 值变大D. t 值变小或变大E. 不能判断8. 将90 名高血压病人随机等分成三组后分别用A、B 和C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是____ 。
医学统计学秩和检验课件
秩和检验基于以下原理:对于来自同一总体的两个样本,它 们的样本分布形状应该相同;如果来自不同总体的两个样本 ,它们的样本分布形状应该有显著差异。
秩和检验的优缺点
优点
秩和检验不依赖于数据的分布假设,因此它比参数统计方法更具有稳健性; 同时,秩和检验可以处理各种类型的数据,包括定性和定量数据。
缺点
场景3
在社会科学研究中,对于一些评价社会现象的指标,如幸福感、生活质量等,秩和检验可 以用来比较不同地区或不同群体之间的差异。
02
秩和检验的类型与方法
配对比较法
01 02
定义
配对比较法也称为配对t检验,它是在医学研究中经常使用的一种统计 方法。这种方法主要用于分析两组配对的样本,以评估它们之间的平 均值是否存在显著差异。
适用范围
配对比较法适用于分析两种相关样本间的关系,例如同一组患者在治 疗前后的血压或血糖水平的变化。
03
步骤
首先,将两组配对的样本数据按大小进行排序,并赋予秩次;然后,
计算每组的平均秩次,并使用t检验来比较两组的平均秩次是否存在显
著差异。
独立样本法
定义
独立样本法也称为独立t检验,它是在医学研究中常用的 另一种统计方法。这种方法主要用于比较两个独立的样 本,以评估它们的平均值是否存在显著差异。
其他秩和统计量及其分布
Mann-Whitne…
也称为U统计量,用于比较两个独立样本的总体中 位数是否相同。
Jonckheere-…
也称为Z统计量,用于比较两个或更多有序样本的 总体中位数是否相同。
分布
Mann-Whitney U统计量服从于正态分布,其均 值和方差与Wilcoxon秩和统计量相同。
选择研究对象
医学统计学重要试题1
医学统计学重要试题1一、选择题1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P 越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
A.已知二组患者的白细胞计数均降低B.已知二组患者的白细胞计数均升高C.不清楚哪一组的白细胞计数水平有变化D.已知非典型肺炎患者的白细胞计数不高于普通肺炎E.两组白细胞计数值的总体方差不相等【答案】D9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为______.A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比D.应进行假设检验后再下结论E.以上都不对【答案】D10.比较两个率时,不需要进行率的标准化的情况有______.A.部构成不同B.部构成相同C.未知各年龄别人口数D.缺乏各年龄别死亡人数E.不易寻找标准人口构成【答案】B11.四格表资料在哪种情况下作χ2检验不必校正______.A.T>1且n>40B.T>5或n>40C.T>5且n>40D.1E.T>5且n<40【答案】C12.欲比较三种药物的疗效(无效、好转、显效、痊愈)孰优孰劣,最好选择______.A.t检验B.方差分析C.χ2检验D.秩和检验E.u检验13.下面说法中不正确的是_____.A.没有个体差异就不会有抽样误差B.抽样误差的大小一般用标准误来表示C.好的抽样设计方法,可避免抽样误差的产生D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别【答案】C14.实验设计和调查设计的根本区别是_____.A.实验设计以动物为对象B.调查设计以人为对象C.调查设计可随机分组D.实验设计可人为设置处理因素E.以上都不对【答案】D15.在下述抽样调查方法中,在样本量相同的前提下,抽样误差最小的是_____.A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样E.多阶段整群抽样【答案】C16.对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______.A.有相关关系B.无任何关系C.无直线相关关系D.无因果关系E.有伴随关系【答案】C17.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组无任何处理,这种对照属于______.A.实验对照B.空白对照C.相互对照D.标准对照E.历史对照【答案】B18.在两独立样本比较的秩和检验中,实验组的观察值为0,0,7,14,32,40,对照组的观察值为0,1,2,4,4,8.编秩中零值的秩应分别编为______.A.2,3;1B.1.5,1.5;3C.2,2;2D.2.5,2.5;1E.不参加编秩19.两样本比较的秩和检验(两组样本例数相等),如果假设成立,则对样本来说:______.A.两组秩和相等B.两组秩和的绝对值相等C.两组秩和相差很大D.两组秩和相差一般不会很大E.两组秩和的差值相等【答案】D20.在简单线性回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明______.A.X对Y的影响占Y变异的30%B.X增加一个单位,Y平均减少30%C.X增加一个单位,Y平均减少0.30个单位D.Y增加一个单位,X平均减少30%E.Y增加一个单位,X平均减少0.30个单位【答案】C:二、二、多选题在A、B、C、D和E中选出一个最佳答案,将答案的字母填在相应下划线的空格里。
医学统计学之秩和检验
医学统计学之秩和检验什么是秩和检验?秩和检验(Wilcoxon rank-sum test),又称为Mann-Whitney U检验,是非参数假设检验的一种常用方法,用于比较两个独立样本的位置差异。
这个方法基于样本的秩次,而不依赖于数据的具体分布。
秩和检验的适用场景秩和检验通常用于以下情况:1.样本数据不满足正态分布假设;2.无法满足方差齐性假设;3.样本容量较小。
秩和检验是一种非常灵活的方法,适用于大部分类型的数据分布,甚至可以包括极端的离群值。
秩和检验的原理秩和检验的原理是将两个样本的观察值合并后,按照大小重新排列,并赋予秩次。
然后利用秩次之和来比较两个样本的位置差异。
1.对于两个独立样本,将两组数据合并为一个整体的样本。
2.对于每个观察值,分别计算出在整体样本中的秩次。
3.计算两组样本的秩和,比较其大小。
4.根据秩和的大小以及样本容量,查表或计算检验统计量的p-value。
秩和检验的步骤秩和检验的具体步骤如下:1.将两个样本合并为一个整体样本,并标记属于哪个样本。
2.对整体样本中的观察值进行排序,得到秩次。
3.计算秩和,并比较两个样本的秩和大小。
4.根据秩和大小以及样本容量,查找临界值。
5.根据临界值判断是否拒绝原假设,或者计算统计量的p-value。
6.根据p-value判断是否拒绝原假设。
秩和检验的示例假设我们有两个医学治疗方法A和B,想要比较其对病人治疗效果的差异。
我们随机选择了两组病人,分别给予方法A和B进行治疗,然后观察他们的疗效。
以下是我们观察到的结果:组A:8, 10, 12, 10, 14 组B:9, 11, 14, 12, 13我们可以按照秩次将两组数据合并,并计算秩和:组A:8(1), 10(3), 12(4), 10(3), 14(5) 组B:9(2), 11(4), 14(5), 12(4), 13(2)组A的秩和为16,组B的秩和为17。
然后,我们根据秩和的大小以及样本容量,在秩和表中查找临界值。
医学统计学习分享题
《医学统计学》习题集第一章绪论lo下面的变量中,属于分类变量的是(B ) OAo脉搏Bo血型C.肺活量Do红细胞计数Eo血压2O某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料本属于(A ).A.定量资料Bo分类资料C.有序资料D.二分类资料Eo名义变量资料第二章定量资料的统计描述lo欲比较身高(cm)和体重(kg)哪个指标变异程度大,应采用(D ) oAo标准差B.极差C.四分位数间距Do变异系数2.已知某疾病患者10人的潜伏期(天)分别为:6,13, 5, 9, 12, 10,8, 11, 8, >20,其潜伏期的平均水平约为(B )天。
A.9 Bo 9.5 C. 10 Do 10.2 Eo 11 3.调查测定某地107名正常人尿铅含量(mg/L)如下:Do需做随机区组设计3个均数比较的ANOVA才能确定5o某医师用A、B、C三种方案分别治疗7例、6例和8例婴幼儿贫血患者.治疗1个月后,记录Hb的增加量(g/L),求得其均数为26。
0、18.0和6.0。
若用AN0VA分析推断3种治疗方案对婴幼儿贫血的治疗效果是否不同,其检验假设%为().Ao 3个样本均数不同Bo 3个样本均数全相同Co 3个总体均数全相同D. 3个总体方差全相同Eo 3个总体方差不全相同6. 64只大鼠被随机地均分到4种不同的饲料组中去,饲养一段时间后,观测每只鼠的肝重比值(即肝重/体重),希望评价4种饲料对肝重比值的影响大小.如果资料满足正态的前提条件,正确的统计方法应当是()。
A.进行6次t检验B.进行6次Z检验Co先做方差分析后作t检验D.先做方差分析后作Dunnett—t检验Eo先做方差分析后作SNK-q检验第九章X?检验lo下列不能用X 2检验的是()。
Ao多个均数比较Bo多个率比较Co多个构成比比较D两个分类变量的关联2o三个样本频率比较,X2>x2°.°L2可以认为(),Ao各总体频率不等或不全相等B.各总体频率均不相等Co各样本频率均不相等D.各样本频率不等或不全相等E.各总体频率相等第十章基于秩次的非参数检验lo以下检验方法除()外,其余均属非参数方法。
卫生学+医学统计学+流行病学精彩试题及精准问题详解
卫生学一、名词解释1、生物富集作用:生物富集作用又叫生物浓缩,是指生物将环境中低浓度的化学物质,通过食物链的转运和蓄积达到高浓度的能力。
2、原生环境:原生环境指天然形成,并且基本上未受人为活动影响的自然环境,其中存在着对人体健康有利的许多因素。
3、limiting amino acid: 食品蛋白质中,按照人体的需要及其比例关系相对不足的氨基酸4、合理营养:合理营养的含义是,由食物中摄取的各种营养素与身体对这些营养素的需要达到平衡,既不缺乏,也不过多。
5、职业病:职业病是指企业、事业单位和个体经济组织等用人单位的劳动者在职业活动中,因接触粉尘、放射性物质和其他有毒、有害物质等因素而引起的疾病。
6、刺激性气体:刺激性气体(irritant gases)是指对眼、呼吸道粘膜和皮肤具有刺激作用的一类有害气体,在化学工业生产中最常见。
此类气体多具有腐蚀性,常因不遵守操作规程或容器、管道等设备被腐蚀而发生跑、冒、滴、漏而污染作业环境。
7、晚发性矽肺: 硅肺病,由于长期过量吸入含结晶型游离二氧化硅的岩尘所引起的尘肺病。
有时虽未出现矽肺征象,但在脱离工作后经若干年再出现矽肺,常称为"晚发性矽肺"8、population:population,表示考察对象的全体。
又称母体。
总体中每个成员称为个体。
population 表示考察对象的全体。
又称母体。
总体中每个成员称为个体。
9、统计推断:统计推断statistical inference 根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。
10、直线回归:线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。
二、简答1、简述大气污染对人类健康的危害。
大气是由一定比例的氮、氧、二氧化碳、水蒸气和固体杂质微粒组成的混和物。
对人体健康的危害:人需要呼吸空气以维持生命。
卫生统计学考试试题及答案(附解释)
卫生统计学试题及答案(一)1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.A.普通线图B.半对数线图C.直方图D.直条图E.复式直条图【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布)直方图(适用于数值变量,连续性资料的频数表变量)直条图(适用于彼此独立的资料)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.A.直方图B.普通线图C.半对数线图D.直条图E.复式直条图(一个检测指标,两个分组变量)【答案】E? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.A.直方图B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)D.直条图E.复式直条图【答案】E4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.A.该研究的样本是1000名易感儿童B.该研究的样本是228名阳性儿童C.该研究的总体是300名易感儿童D.该研究的总体是1000名易感儿童E.该研究的总体是228名阳性儿童【答案】D5.若要通过样本作统计推断,样本应是__________.A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分【答案】C6.下面关于均数的正确的说法是______.A.当样本含量增大时,均数也增大B.均数总大于中位数C.均数总大于标准差D.均数是所有观察值的平均值E.均数是最大和最小值的平均值【答案】D7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.A.均数B.几何均数C.中位数D.方差E.四分位数间距【答案】B几何均数(geometric mean)是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。
医学统计学
方差分析结果,,则统计推论是•A。
各总体均数不全相等•B。
各总体均数都不相等•C。
各样本均数都不相等• D. 各总体方差不全相等得分:0知识点:医学统计学作业题收起解析答案A解析2。
(4分)下面说法中不正确的是•A。
没有个体差异就不会有抽样误差• B. 抽样误差的大小一般用标准误来表示•C。
好的抽样设计方法,可避免抽样误差的产生•D。
医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等得分:0知识点:医学统计学作业题收起解析答案C解析3。
(4分)某地某年肺癌死亡率城区为郊区的194。
1%,本指标是•A。
率•B。
构成比•C。
相对比• D. 中位数得分:0知识点:医学统计学作业题收起解析答案C解析4.(4分)某地2012年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74 g/L,标准差为4g/L,则其95%的参考值范围•A。
7444•B。
741.964•C。
742。
584• D. 742.58410得分:0知识点:医学统计学作业题收起解析答案B解析5.(4分)在作两样本均数比较时,只要其总体服从正态分布,则考虑• A. 用t检验• B. t'检验•C。
秩和检验•D。
资料符合t检验还是秩和检验的条件得分:0知识点:医学统计学作业题收起解析答案A解析6.(4分)标准正态曲线下中间95%的面积所对应的横轴尺度u的范围是•A。
—1。
96到+1。
96• B. —1。
65到+1.65•C。
-2。
58到+2。
58•D。
—1。
28到+1。
28得分:0知识点:医学统计学作业题收起解析答案A解析7。
(4分)对X、Y两个随机变量作直线相关分析时,下列正确的说法是• A. 要求X、Y满足双变量正态分布•B。
只要求X满足正态分布• C. 只要求Y满足正态分布•D。
只要求X、Y是定量变量得分:0知识点:医学统计学作业题收起解析答案A解析8.(4分)根据一次横断面调查资料图示职业与高血压患病率的关系, 宜绘制•A。
卫生学医学统计学流行病学试题及精准答案
卫生学一、名词解释1、生物富集作用:生物富集作用又叫生物浓缩,是指生物将环境中低浓度的化学物质,通过食物链的转运和蓄积达到高浓度的能力。
2、原生环境:原生环境指天然形成,并且基本上未受人为活动影响的自然环境,其中存在着对人体健康有利的许多因素。
3、limiting amino acid: 食品蛋白质中,按照人体的需要及其比例关系相对不足的氨基酸4、合理营养:合理营养的含义是,由食物中摄取的各种营养素与身体对这些营养素的需要达到平衡,既不缺乏,也不过多。
5、职业病:职业病是指企业、事业单位和个体经济组织等用人单位的劳动者在职业活动中,因接触粉尘、放射性物质和其他有毒、有害物质等因素而引起的疾病。
6、刺激性气体:刺激性气体(irritant gases)是指对眼、呼吸道粘膜和皮肤具有刺激作用的一类有害气体,在化学工业生产中最常见。
此类气体多具有腐蚀性,常因不遵守操作规程或容器、管道等设备被腐蚀而发生跑、冒、滴、漏而污染作业环境。
7、晚发性矽肺: 硅肺病,由于长期过量吸入含结晶型游离二氧化硅的岩尘所引起的尘肺病。
有时虽未出现矽肺征象,但在脱离工作后经若干年再出现矽肺,常称为"晚发性矽肺"8、population:population,表示考察对象的全体。
又称母体。
总体中每个成员称为个体。
population 表示考察对象的全体。
又称母体。
总体中每个成员称为个体。
9、统计推断:统计推断statistical inference 根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。
10、直线回归:线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。
二、简答1、简述大气污染对人类健康的危害。
大气是由一定比例的氮、氧、二氧化碳、水蒸气和固体杂质微粒组成的混和物。
对人体健康的危害:人需要呼吸空气以维持生命。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H0:多个总体分布相同(或者中位数相等) H1:多个总体分布不同或不全相同(或者中位数不全相等)
26
例10.5
某医院用3种方法治疗15例胰腺癌患者,每种方 法各治疗5例,治疗后生存月数如下表,问3种方法的 疗效有无差别?
当n≤50时,通过查T界值表来确定是否波动过
大
T在界值范围内,波动不大
P>α
T在界值范围外或等于界值时,波动大,P≤α
11
(4) 查表及推断结论 查T界值表T0.05(16)=29~107 由于T=28在上下界值范围外,所以P≤0.05。 按a=0.05检验水准拒绝H0,接受H1,可以 认为该厂工人尿铅含量不当地正常人有差异, 通过正负秩和的大小可以推断工人的尿铅含 量要高于正常人。
第十章 基于秩次的非参数检验
1
假设检验的方法分为两类
参数检验(parametric test)
已知总体分布类型,对未知参数(μ、π)进行统计推断 依赖于特定分布类型,比较的是参数 一般有严格的适用条件
如:样本来自正态分布、总体方差齐同等 这类方法比如:t检验、F检验等
非参数检验(nonparametric test)
Z
T n1(N 1) / 2 0.5
n1n2 (N 3 N
12N(N 1)
(t
3 j
t
j
))
2036 40(84 1) / 2 0.5
40 44 (843 84 (323 32) (323 32) (203 20)) 12 40 (84 1)
7.01
由于Z=7.01,大于Z0.05=1.96,所以P<0.05,按照α=0.05 检验水准拒绝H0,接受H1,可以认为夏冬两季居民体 内核黄素含量有差别。根据平均秩次可以知道夏季的含
秩次 4.5 9 3 8 -1.5 1.5 4.5 6 -10 7 -
T-=11.5
统计量T: T= min(T+,T-)= 11.5
查T界值表T0.05(10)=8~47 由于T=11.5在上下界值范围内,所以P>0.05。 按a=0.05检验水准不拒绝H0,因此还不能认为二者 检测结果有差异。
统计量为:
T=min(T+,T- )
T=min(T+,T-)=28
10
基本思想
如果H0成立,即差值的总体中位数为0,则理论上样本 的正负秩和应相等,即T值应为总秩和(n(n+1)/2) 的一半,即T=n(n+1)/4。由于存在抽样误差,T应在 理论值n(n+1)/4周围波动,如果T与理论值的差距太 大,超过了正常波动范围,则有理由认为假设不成立, 从而拒绝H0。
量要高于冬季的含量。
第三节 多组独立样本比较的秩和检验
多级比较的秩和检验是在两样本比较的Wilcoxon秩和 检验基础上扩展而来,称为Kruskal-Wallis H 检验。
此法的基本思想与两样本比较的Wilcoxon秩和检验相近: 如果各组总体分布相同,混合编秩号后,各组的平均秩次 应近似相等。
12
例子10.2
对11份工业污水测定氟离子浓度(mg/L),每份水样同 时采用电极法和分光光度法测定,结果如下表。问两 方法的检测结果有无差别?
表 两种方法测定 11 份工业污水中氟离子浓度
样品编号
电极法
分光光度法
差值
1
10.5
8.8
1.7
2
21.6
18.8
2.8
3
14.9
13.5
1.4
4
30.2
2
非参数检验的概念
非参数检验(nonparametric test)又称为任意分 布检验(distribution-free test),这类方法并不 依赖总体分布的具体形式,也不针对总体分布的 参数进行推断,它是对总体的分布或分布位置进 行检验
优点:对总体分布没有要求,适用范围广 缺点:会丢失部分信息;满足参数检验条件时, 非参数检验犯II类错误的可能性大于参数检验方法, 即检验效率有所降低
尿铅 (1) 3.13 3.27 3.54 4.38 4.38 5.05 6.08 11.27
差值 (2)=(1)-2.50
0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
分析步骤与基本思想:
(1)建立检验假设,确定检验水准 Ho:差值总体中位数等于0 H1:差值总体中位数不等于0 α=0.05
3
非参数检验适用的资料
总体分布为偏态或分布未知 等级资料 个别数据偏大或有不确定数据
<0.01mg, >150mg等
各总体方差不齐的样本均数的比较
4
内容提要:
➢ 单样本和配对资料的符号秩和检验 ➢ 两组独立样本比较的秩和检验 ➢ 多组独立样本比较的秩和检验 ➢ 多个独立样本间的多重比较 ➢ 随机化区组设计资料的秩和检验
表 3 种方法治疗胰腺癌患者生存月数比较
甲法
乙法
丙法
3
6
2
4
9
3
7
10
5
8
12
7
8
13
8
27
分析步骤
1.建立检验假设,确定检验水准(α)
H0:3种方法疗效的总体分布相同 H1:3种方法疗效的总体分布不全相同 α=0.05
2.混合编秩 将各组数据混合,由小到大编秩。遇有
原始数据相同时,则取它们的平均秩次。
表 某地居民夏冬两季体内核黄素含量比较
时间
缺乏
不足
适宜
合计
夏季 冬季
10
14
16
40
22
18
4
44
合计
32
32
20
84
秩次范围 1-32
33-64 65-84
平均秩次 16.5
48.5
74.5
统计量为例数较小的一组(夏季n1=40)秩和: T=16.5×10 + 48.5×14 + 74.5×16
=2036
(2)编秩:
•求差值 •编秩方法:依差值的绝对值从小到大编秩。 •编秩时注意两点:
(1)遇差值为0者,舍去不计,n相应减少; (2)差值的绝对值相等,应取平均秩次 •编秩后,按差值的正负给秩次冠上符号。
8
编秩
表 某厂 16 名工人与当地正常人尿铅含量比较
工人号
1 2 3 4 5 6 7 8
尿铅 (1) 0.62 0.78 2.13 2.48 2.54 2.68 2.73 3.01
表 两种药物杀死钉螺死亡率(%)的比较
甲药死亡率
乙药死亡率
32.5
16.0
35.5
22.5
40.5
26.0
40.5
28.5
49.0
32.5
49.5
38.0
51.5
40.5
基本步骤
1、建立假设
H0:两种药物杀灭钉螺死亡率的总体分布相同(中位数相等) H1:两种药物杀灭钉螺死亡率的总体分布不同(中位数不相等) α=0.05
表 某厂 16 名工人与当地正常人尿铅含量比较
工人号
1 2 3 4 5 6 7 8
尿铅 (1) 0.62 0.78 2.13 2.48 2.54 2.68 2.73 3.01
差值 (2)=(1)-2.50
-1.88 -1.72 -0.37 -0.02 0.04 0.18 0.23 0.51
工人号
9 10 11 12 13 14 15 16
当偏离超出给定的范围时,即P≤a,从而拒绝H0
判断准则:
T在界值范围内
P>α
T在界值范围外或等于界值时 P≤α
确定P值,推断
本例n1=7,n2=7,T=T1=71.5, 查T界值表: T0.05(n1=7,n2=7)=36~69 由于T位于界值范围之外,所以P<0.05,拒绝
H0,接受H1,可以认为两种药物杀灭钉螺的 效果有差别,由于甲药的平均秩次10.2大于 乙药的4.8,因此可以推断甲药的杀灭效果要 比乙药好。
差值 (2)=(1)-2.50
0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
秩次 (3) 7 8 9 12 12 14 15 16
T+=108, T-=28
9
分析步骤与基本思想:
(3)求秩和并确定统计量 差值为正的秩和以T+表示 差值为负的秩和以T-表示。 T++T-=n(n+1)/2
5
第一节 配对资料的符号秩和检验
Wilcoxon于1945年提出符号秩检验 (Wilcoxon singned-rank test)
主要用于推断: (1)总体中位数是否等于某个指定值 (2)配对样本差值总体中位数是否为0
6
例子10.1
已知某地正常人尿铅含量的中位数为2.50μmol/L。今在该 地随机抽取16名工人,测定尿铅含量如下表,问该厂工人 的尿铅含量是否与当地正常人有差别?
2、编秩,求统计计量
编秩原则:从小到大混合编秩,相同则取平均秩次。
统计量选择: T=样本量较小组n1的秩和(规定n1≤n2)
18
编秩
表 两种药物杀死钉螺死亡率(%)的比较
甲药死亡率 秩次
乙药死亡率
32.5
5.5
16.0
35.5
7
22.5
40.5
10
26.0
40.5
10
28.5
49.0
12
32.5
49.5
13