医学统计学第3版,02计量资料的统计描述试题
《医学统计学》计算题答案
《医学统计学》计算分析题参考答案孙振球主编. 医学统计学.第3版. 北京:人民卫生出版社,2010第二章计量资料的统计描述计算分析题(P26)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
(3)求该地正常成年女子血清甘油三酯的95%参考值范围。
(4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比?表2-1某单位116名正常成年女子的血清甘油三酯(mmol/L)测量结果组段频数0.6~ 10.7~ 30.8~ 90.9~ 131.0~ 191.1~ 251.2~ 181.3~ 131.4~ 91.5~ 51.6~1.7 1合计116(1)数据文件数值变量名:组段,频数;用Compute产生新变量“组中值”(也可直接输入组中值)。
(2)操作步骤Analyze èData èWeight Cases ;Weight Cases by 频数。
Analyze èDescriptives èDescriptives ;将“组中值”选入V ariable 框中;单击OK 。
(3)结果解释表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布,故选择均数描述集中趋势,选择标准差描述离散趋势。
某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16(mmol/L ),标准差为0.20(mmol/L );该地正常成年女子血清甘油三酯的95%参考值范围是(0.77,1.55)mmol/L 。
计算过程根据公式s x 96.1±,即1.16±1.96×0.20。
该单位正常成年女子血清甘油三酯在0.8 mmol/L 以下者估计占总人数的3.59%,1.5 mmol/L 以下者估计占总人数的95.54%。
考试题医学统计学第三版
考试题医学统计学第三版1,统计设计的基本原则有哪些?(1)对照:以排除偶然的非处理因素的干扰,如成组对照、配对对照。
(2)随机:总体中每一个体都有同等的机会被抽中,其目的是使样品有代表性,如抽签、随机数字表等。
(3)均衡:处理组与对照组的内部构成一致,如性别一致、年龄一致等。
(4)重复(样本含量):样本一般要求≧30例。
2. 怎样的数据资料属分类资料?数据不代表数值大小,只是一种编码,每个编码代表一种属性,这种资料叫分类资料,又称分类变量或定性资料。
其观察值是定性的,表现为互不相容的类别或属性。
有无序分类、有序分类两种情况。
3. 简述什么叫总体和样本,医学研究中的样本有什么要求?总体:是指根据研究目的确定的同质观察单位的全体,是同质的所有观察单位某中观察值(变量值)的集合。
样本:用随机方法从总体中抽出的、有代表性的部分观察单位的某变量值的集合。
医学研究中的样本应按随机化原则获取,即总体中每一个观察单位都有同等的机会被选入到样本中来,以避免误差和偏倚对研究结果有所影响。
4. 统计描述的基本方法有哪些,各自有何特点?(1)频数表与频数图:由组段和频数两栏组成的整理表即频数表,将频数表数据在直角坐标系上绘制成图即频数图。
特点:①.较具体、直观的描述一组数据的特征;②便于发现可疑的异常值;③有助于正确选用统计指标和便于计算。
(2)描述性统计量可以用来定量的刻画统计分布的特征,常用的有三类:描述集中趋势的有算术均数,几何均数,中位数。
描述离散趋势的有极差,四分位数间距,方差,标准差,变异系数,描述分布类型的偏度系数峰度系数。
(3)百分位数是一种位置参数既可用干描述离散趋势又可描述集中趋势可用于各种连续型分布。
5. 统计描述的意义是什么?试举例说明。
统计描述,是指用适当的统计指标、统计表、统计图等方法对资料的数量特征及其分布规律进行测定和描述,其目的是用直观、简单的形式揭示大量数据所蕴涵的内在信息。
例如随机抽取某市六十名十二岁男孩测身高面对这六十个不同的数据,无论多认真审视也无法说清这些男孩的身高情况,这就要用统计描述来解决这些问题,对数据进行整理归纳总结分析制作频数表图这样就能具体直观的描述这些数据的特征如有三组同龄男孩体重如下,其平均体重是30千克,由表面看这三组资料的均数相等,即集中趋势相同,但各组的数据参差不齐,也就是离散趋势不同,描述这组同质数值变量数据离散程度就用全距、四分位数间距、方差、标准差等6. 描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况?描述计量资料集中趋势的指标有:算术平均数、几何平均数、中位数。
医学院-医学统计学专项考核试题及答案
医学院-医学统计学专项考核试题一、最佳选择题1.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少()[单选题]*A.抽样误差B.系统误差VC.随机误差D.责任事故E.以上都不对2.为表示某地近20年来婴儿死亡率的变化情况,宜绘制()[单选题]*A普通线图√8.直方图C.直条图D.散点图E.统计地图3.比较1995年某地三种传染病白喉、乙脑、痢疾的病死率,选择的统计图是()[单选题]*A.直方图B.半对数图C.条图√D线图E.百分图4.比较甲、乙、丙三地区某年度某种疾病的发病率情况,可用()[单选题]*A.直条图√B线图C.直方图D.圆形图E.百分条图5.对某市七个区的S02年平均浓度作比较,应绘制()图()[单选题]*A.构成图B.直条图√C.直方图D.线图E.曲线图6.抽样的目的是()[单选题]*A.研究样本统计量8.研究总体统计量C.研究典型案例D.研究误差E.样本推断总体参数√7.统计学常将P≤0.05或P≤0.01的事件称()[单选题]*A.必然事件8.不可能事件D.小概率事件VE.偶然事件8.医学统计的研究内容是()[单选题]*A.研究样本B.研究个体C.研究变量之间的相关关系D.研究总体E.研究资料或信息的收集、整理和分析V9.统计中所说的总体是指()[单选题]*A.根据研究目的确定的同质的研究对象的全体VB.随意想象的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体10.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于()[单选题]*A.计数资料√B,计量资料C.总体D.个体E.样本11.某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为()[单选题]*A.所有成年男子B.该市所有成年男子C.该市所有健康成年男子D.120名该市成年男子E.120名该市健康成年男子√12.抽样调查的目的是()[单选题]*A.研究样本统计量B.研究总体统计量C.研究典型案例D.研究误差E.样本推断总体参数,13.描述计量资料的主要统计指标是()[单选题]*A.平均数√B.相对数C.t值D.标准误E概率14.一群7岁男孩身高标准差为5cm,体重标准差为3kg,则二者变异程度比较()[单选题]*A.身高变异大于体重B.身高变异小于体重C.身高变异等于体重E.身高变异不等于体重15.以下指标中那一项可用来描述计量资料离散程度。
医学统计学考题按章节第7题07分计量资料的统计描述
因此,该地正常成年男性血红蛋白的 正常值范围为(12.014,16.045 ) g/dL 。
统计描血連拾标.TJ吗lid llixiing1QQ< 0 14.030013 7500Stii. Deviati on1 0282 :偏度采数 S kewnE 弱.044Std Error of公1Km-tQsis :喔度丟数Kurtosi s-.320 211, Err ox of4T0 Percentile :百分便?ere entilesL2 0L25£ 12 250025 13 250050 13 7500 75 14 7S0D£5 15 750097.5L6 2500因男性血红蛋白过多或过少均为异常,故按双侧估计, 下限:上限: + 1.96S = 14.03 + 1.96 X 1.0282 = 12.014X 1.0282 = 16.045 取95%界限:(g/dL ) (g/dL )五、其它30分(3~5道题目,每题6~10分)提供某一素材,可能要求:选择正确的统计方法并简述理由。
对错误进行分析,并予以纠正。
对某些数据、指标的含义作出正确的判断 正交试验表头设计及结果分析可能涉及范围:计量资料的统计描述、相对数应用注意事项,秩和检验,随访资料的生存分析,正交试验设计 方差分析。
【06真题、05真题】三、某市100名正常成人男性血红蛋白值(g/dL )频数分布表如下:(7分) 组段 11.5- 12.0- 12.5- 13.0- 13.5- 14.0- 14.5- 15.0- 15.5- 16.0- 频数 2671424121810341. 选用何种指标描述其 集中位置和离散程度 较好?为什么?2. 估计该地正常成年男性血红蛋白的 正常值范围。
SPSS 软件有关分析结果:【答案】jszb1、从SPSS 软件分析结果可知:偏度系数Skewness = 0.044 ;峰度系数 Kurtosis = -0.320 ;两个系数都小于 1,可认为近似于正态分布。
医学统计学习题(计量资料)
欢迎来到医学统计学习题目简介!在这个学习题目中,我们将探索样本、总 体和估计量的概念,了解中心极限定理的重要性,以及学习如何进行假设检 验与显著性水平的判断。
我们还将研究t检验、F检验和方差分析的应用,并探讨多元线性回归和案例 分析的技巧。加入我们的学习,一起探索医学统计的精髓吧!
学知识的掌握和理解。
3
应用技巧分享
分享一些解决实际问题的技巧和策略, 帮助您更好地应用医学统计学知识。
样本、总体、估计量
了解如何选择合适的样本以及如何进行总体估计是医学统计学的基础。通过实例和练习,我们将学习如 何正确应用这些概念。
样本选择
了解如何选择具有代表性的样本,以便更准确地 推断总体参数。
总体参数估计
学习使用样本数据来估计总体参数,从而推断总 体特征。
中心极限定理
掌握中心极限定理是进行推断性统计分析的关键。了解这个重要的概念将使您能够更好地理解样 本分布和总体参数的估计。
F检验
了解如何使用F检验来比较多 个样本的方差。
方差分析
掌握如何使用方差分是医学统计学中最重要的分析方法之一。通过多元线性回归,我们可以研究多个自变量与 因变量之间的关系。
1 模型建立
2 数据解读
学习如何选择适当的自变量,并建立多元 线性回归模型。
掌握如何解读多元线性回归结果,并通过 案例分析深入理解。
案例分析与综合应用
在医学统计学中,案例分析和综合应用是将所学知识应用于真实场景的关键。通过分析真实案例,我们 可以加深对医学统计学的理解和应用。
1
实际案例分析
通过真实案例的分析和讨论,学习如
综合应用
2
何将所学知识应用于实际问题。
医学统计学第3版,02计量资料的统计描述试题
第二章 计量资料的统计描述一、教学大纲要求(一)掌握容1. 频数分布表与频数分布图 (1)频数表的编制。
(2)频数分布的类型。
(3)频数分布表的用途。
2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。
算术均数、几何均数、中位数。
3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。
极差、四分位数间距、方差、标准差、变异系数。
(二)熟悉容连续型变量的频数分布图:等距分组、不等距分组。
二、 教学容精要计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。
常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。
(一)频数分布表的编制频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日死亡0,1,2,…20个病人的天数。
如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
制作连续型数据频数表一般步骤如下:1.求数据的极差(range )。
min max X X R -=(2-1)2.根据极差选定适当“组段”数(通常8—10个)。
确定组段和组距。
每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ<U 。
3.写出组段,逐一划记。
频数表可用于揭示资料的分布特征和分布类型,在文献中常用于述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。
(二)描述频数分布中心位置的平均指标描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。
1.算术均数(对称分布)算术均数(arithmetic mean )简称均数,描述一组数据在数量上的平均水平。
医学统计学第三版习题答案
医学统计学第三版习题答案医学统计学第三版习题答案医学统计学是医学领域中的一门重要学科,它通过收集、整理和分析医学数据,为医学研究和临床实践提供科学依据。
而习题是学习医学统计学的重要方式之一,通过解答习题可以帮助我们巩固所学知识,提高分析和解决实际问题的能力。
下面将给出医学统计学第三版习题的答案,希望对大家的学习有所帮助。
第一章:医学统计学概述1. 医学统计学是什么?医学统计学是应用统计学原理和方法研究医学问题的学科,它通过收集、整理和分析医学数据,为医学研究和临床实践提供科学依据。
2. 医学统计学的应用领域有哪些?医学统计学的应用领域包括流行病学、临床试验、医学决策分析、质量控制等。
3. 为什么医学统计学对医学研究和临床实践至关重要?医学统计学通过数据的收集和分析,可以帮助医学研究者和临床医生进行科学的研究和决策。
它可以帮助我们了解疾病的发病率和死亡率,评估治疗方法的效果,预测疾病的发展趋势等。
第二章:数据的收集和整理1. 什么是数据?数据是用于描述和表示事物特征、属性或变化的信息。
在医学统计学中,数据可以是疾病患者的年龄、性别、病情等信息。
2. 数据的收集方法有哪些?数据的收集方法包括问卷调查、观察记录、实验、抽样调查等。
3. 数据的整理方法有哪些?数据的整理方法包括数据的录入、清理、编码和校验等。
第三章:描述性统计学1. 描述性统计学的主要内容是什么?描述性统计学主要研究如何对数据进行整理、总结和描述,以便更好地理解和分析数据的特征和规律。
2. 描述性统计学的常用指标有哪些?描述性统计学的常用指标包括频数、频率、平均数、中位数、众数、标准差等。
3. 描述性统计学在医学研究中的应用有哪些?描述性统计学可以帮助医学研究者对疾病的发病率、死亡率、治疗效果等进行描述和分析,为医学研究和临床实践提供科学依据。
第四章:概率与概率分布1. 什么是概率?概率是描述事件发生可能性的数值,它介于0和1之间。
2. 什么是概率分布?概率分布是描述随机变量取值可能性的分布情况,常见的概率分布有正态分布、泊松分布、二项分布等。
【孙振球第三版】医学统计学复习题(名词解释和简答)
一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
《医学统计学》考试试题及答案大全04
《医学统计学》考试试题及答案一.单选题(每题Label分)1.下列关于非参数检验的叙述错误的是()。
A.非参数检验不依赖于总体的分布类型B.非参数检验仅用于等级资料比较C.适合参数检验的资料采用非参数检验会降低检验效能D.非参数检验会损失部分样本信息E.秩和检验是一种非参数检验方法正确答案:B2.两种药物疗效(治愈、显效、好转、无效)比较,宜用()。
A.χ2检验B.方差分析C.秩和检验D.t检验E.SNK-q检验正确答案:C3.用大剂量Vit.E治疗产后缺乳,以安慰剂作对照,Vit.E 组中有效者24例,无效者6例,安慰剂组有效者4例,无效者12例。
欲分析Vit.E是否有效,应用()。
A.χ2检验B.方差分析C.秩和检验D.t检验E.SNK-q检验正确答案:A4.定量资料多组比较,满足参数检验条件,假设检验时宜采用()。
A.秩和检验B.方差分析C.t检验D.χ2检验E.McNemar检验正确答案:B5.定量资料多组比较,当分布类型不清时,宜用()。
A.秩和检验B.方差分析C.t检验D.χ2检验E.McNemar检验正确答案:A6.对于多组独立有序多分类变量资料比较,假设检验时宜采用()。
A.秩和检验B.方差分析C.t检验D.χ2检验E.McNemar检验正确答案:A7.非参数统计的应用条件为()。
A.样本数据来自正态总体B.若两组比较,要求两样本方差相等C.总体分布类型未知D.要求样本例数很大E.总体属于某种已知的分布类型正确答案:C8.设配对设计资料的变量为X和X2,则配对设计的符号秩检验,如何编秩()。
A.把X1与X2的差数绝对值从小到大编秩,排好后秩次保持原差数的正负号B.把X1与X2的差数绝对值从小到大编秩,秩次不保存正负号C.把X1和X2综合按绝对值从小到大编秩D.把X1与X2的差数从小到大编秩E.把X1和X2综合从小到大编秩正确答案:A9.用两种方法检查已确诊的乳腺癌患者120名。
甲法的检出率为60%,乙法的检出率为50%,甲、乙两法一致检出率为35%,试问两种方法何者为优,宜用()。
《医学统计学》习题及答案
病毒性肝炎患者2.36 2.15 2.52 2.28 2.31 2.53 2.19 2.34 2.31 2.41
A.两样本均数的u检验B.样本均数与总体均数的t检验
C.两样本均数的t检验D.配对设计t检验
E.增长速度=(发展速度一1)/100
32.SMR表示
A.标化组实际死亡数与预期死亡数之比
B.标化组预期死亡数与实际死亡数之比
C.被标化组实际死亡数与预期死亡数之比
D.被标化组预期死亡数与实际死亡数之比
E.标准组与被标化组预期死亡数之比
33.两个样本率差别的假设检验,其目的是
A.推断两个样本率有无差别
E.第二类错误概率小
42.等级资料比较宜用
A. t检验B. u检验C.秩和检验
D. 检验E. F检验
43.作两均数比较,已知 、 均小于30,总体方差不齐且分布呈极度偏态,宜用
A. t检验B. u检验C.秩和检验
D. F检验E. 检验
44.从文献中得到同类研究的两个率比较的四格表资料,其 检验结果为:甲文 ,乙文 ,可认为
A. A≥5 B. T≥5 C. A≥5且T≥5
D. A≥5且n≥40E. T≥5且n≥40
38.三个样本率比较得到 > ,可以为
A.三个总体率不同或不全相同B.三个总体率都不相同
C.三个样本率都不相同D.三个样本率不同或不全相同
E.三个总体率中有两个不同
39.四格表 检验的校正公式应用条件为
A. n>40且T>5 B. n<40且T>5
1 2.74 4.49
医学统计学--第二章 计量资料的统计描述
4.13 4.28 4.91 3.95 4.23 3.75 4.57 3.51
2.78 3.26 3.18 5.08 3.57 3.98 3.80 3.86
4.26 3.50 3.68 4.53 4.83 4.13 3.93 3.02
3.58 2.70 4.83 3.92 3.52 4.26 3.78 3.70
1
lg X ) lg (
n
1
ቤተ መጻሕፍቲ ባይዱ
lg10 lg 20 lg 40 lg 40 lg160 ( ) 34.8 5
(2)加权法 公式:
G lg (
1
f lg X f
)
例2-5 69例类风湿关节炎(RA)患者血清EBV-VCAlgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均 抗体滴度。
三、频数表和频数分布图用途
1.描述频数分布的 类型 (1)对称分布 :若 各组段的频数以频数 最多组段为中心左右 两侧大体对称,就认 为该资料是对称分布
25
20 15
Æ µ Ê ý
10 5
0
2.45
3.05
3.65
4.25
4.85
5.45
6.10
Ñ Ç × µ ¹ ´ £ mmol/L£ ª å Ü ¨Ì ¼ ¨ ©
G 公式: X 1 X 2 X n
n
或
G lg
1
lg X ) (
n
例2-4 某地5例微丝蚴血症患者治疗七年后用间接 荧光抗体试验测得其抗体滴度倒数分别为,10, 20,40,40,160,求几何均数。
G 10 20 40 40 160 34.8
5
G lg
《卫生统计学》考试题及答案(完整资料).doc
一、名词解释1.计量资料2.计数资料3.等级资料4.总体5.样本6.抽样误差7.频数表8.算术均数9.中位数10.极差11.方差12.标准差13.变异系数14.正态分布15.标准正态分布16.统计推断17.抽样误差18.标准误19.可信区间20.参数估计21.假设检验中P 的含义22.I 型和 II 型错误23.检验效能24.检验水准25.方差分析26.随机区组设计27.相对数28.标准化法29.二项分布30.Y ates 校正31.非参数统计32.直线回归33.直线相关34.相关系数35.回归系数36.人口总数37.老年人口系数38.围产儿死亡率39.新生儿死亡率40.婴儿死亡率41.孕产妇死亡率42.死因顺位43.人口金字塔二、单项选择题I.观察单位为研究中的( D )。
A.样本C.影响因素2.总体是由(C)。
A.个体组成C.同质个体组成3.抽样的目的是( B )。
A.研究样本统计量C.研究典型案例研究误差4.参数是指(B)。
A.参与个体数C.样本的统计指标B.全部对象D.个体B.研究对象组成D.研究指标5.关于随机抽样,下列那一项说法是正确的( A )。
A .抽样时应使得总体中的每一个个体都有同等的机会被抽取B .研究者在抽样时应精心挑选个体,以使样本更能代表总体C .随机抽样即随意抽取个体D .为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( B ) 。
A .均数不变,标准差改变 B .均数改变,标准差不变 C .两者均不变D .两者均改变7.比较身高和体重两组数据变异度大小宜采用( A ) 。
A .变异系数 C .极差8.以下指标中( D )可用来描述计量资料的离散程度。
A .算术均数 B .几何均数 C .中位数D .标准差9.血清学滴度资料最常用来表示其平均水平的指标是( C ) 。
A .算术平均数 B .中位数 C .几何均数D .平均数10.两样本均数的比较,可用( C ) 。
医学统计学习题(计量资料)
医学统计工作的基本步骤是
1. .调查、搜集资料、整理资料、分析资料 2. .统计资料收集、整理资料、统计描述、统计推断 3. .设计、搜集资料、整理资料、分析资料 4. .调查、统计描述、统计推断、统计图表 5. 设计、统计描述、统计推断、统计图表
目录 /CONTENT S
添 加 标 题 统计分析
3.调查某地145名正常人尿铅含量(µmol/L)如下:
尿铅含量 0~
0.35~ 例数
11
6
0.05~ 10
0.10~ 0.15~ 0.20~ 0.25~ 0.30~
13
26
33
24
14
尿铅含量 0.40~ 0.45~ 0.50~
例数
5
2
1
(1)求中位数; (2)求该地正常人尿铅含量95% 的正常值范围。
一二.由两样本均数的差别推断两总体均数的差别,所谓差别有显著性是指: 1. 两样本均数不等; 2. 两总体均数不等; 3. 两样本均数和两总体均数都不等; 4. 其中一个样本均数和总体均数不等; 5. 以上都不是。
要评价某市一名8岁女孩的身高是否偏高或偏矮,应选 用的统计方法是:
1. 用该市8岁女孩身高的95%或99%正常值范围来 评价;
7.为比较三种镇咳药的镇咳疗效,先以0. 2ml NH4 OH对小鼠喷雾,测 定其发生咳嗽的时间,然后分别用三种镇咳药给三组小鼠灌胃,在同样 条件下再测定发生咳嗽的时间,并以“用药前时间减去用药后时间”为 指标,计算延迟发生咳嗽的时间(秒),数据如下。试比较三种药的镇 咳作用。
可待因 60 30 100 85 20 55 45 30 105
二二.用均数与标准差可全面描述下列哪种资料的特征 二三.正偏态分布 二四.负偏态分布 二五.正态分布和近似正态分布 二六.对称分布 二七.任意分布
《医学统计学》考试试题及答案大全02
(A)95%
(B)49.5% (C)99%
(D)97%
11.两样本均数间的差别的假设检验时,查 t 界值表的自由度为 C
(A)n-1
(B)(r-1)(c-1)
(C)n1+n2-2
(D)1
12.从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A
(A)总体中个体值存在差别
(B)样本中个体值存在差别
(C)样本只含总体的一部分
(D)总体均数不等于0
13.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错
误最小 B
(A)α=0.05 (B)α=0.20
(C)α=0.01
(D)α=0.10
14.比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制 C 。
(A)线图 (B)条图 (C)半对数线图 (D)圆图
20.同一双变量资料,进行直线相关与回归分析,有 B
(A) r>0 , b<0 (B) r>0 , b>0 (C) r<0 , b>0 (D) r=b
二、填空题 12分
1、 统计资料按其性质不同,通常将资料分为 (计量、计数、等级 ) 三 种类型。 2、 统计工作步骤通常为统计设计、搜集资料、整理资料和分析资料四
答:不能,因为 P 值的大小与总体指标间差异大小不完全等同。P 值的大 小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽 样误差大小不同,所得的 P 也会不一样,抽样误差大小实际工作中主要 反映在样本量大小上。
五、计算分析题
1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。
4
33.3
4
33.3
合计 72
卫生统计学试题(含答案)
医学统计方法选择题一:医学统计方法概述l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是:DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:CA统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差B系统误差C随机误差D责任事故E以上都不对10.以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时?CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距B标准差C方差D变异系数E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S 17.标准差越大的意义,下列认识中错误的是BA观察个体之间变异越大B观察个体之间变异越小C样本的抽样误差可能越大D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是BA从未患过病的人B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人E以上都不是20.均数与标准差之间的关系是EA标准差越大,均数代表性越大B标准差越小,均数代表性越小C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是AA总体中个体之间存在变异B抽样未遵循随机化原则C被抽取的个体不同质D组成样本的个体较少E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
医学统计学试题及答案
一、选择题(每题2分,共20分)1. 以下哪种类型的数据属于计数资料?A. 体温测量值B. 血压测量值C. 血红蛋白含量D. 血小板计数答案:D2. 以下哪种统计指标可以反映数据的集中趋势?A. 标准差B. 方差C. 离散系数D. 中位数答案:D3. 以下哪种方法可以用来估计总体参数?A. 参数估计B. 非参数估计C. 概率估计D. 样本估计答案:A4. 以下哪种方法可以用来检验两个总体均值是否相等?A. t检验B. F检验C. 卡方检验答案:A5. 以下哪种统计指标可以反映数据的离散程度?A. 平均数B. 标准差C. 中位数D. 四分位数间距答案:B6. 以下哪种误差是由于抽样过程中随机因素造成的?A. 系统误差B. 随机误差C. 系统偏差D. 随机偏差答案:B7. 以下哪种统计方法可以用来比较两个分类变量的比例差异?A. t检验B. F检验C. 卡方检验D. 秩和检验答案:C8. 以下哪种统计方法可以用来检验两个独立样本的均值差异是否具有统计学意义?A. t检验B. F检验D. 秩和检验答案:A9. 以下哪种统计指标可以反映数据的分布形状?A. 标准差B. 方差C. 中位数D. 离散系数答案:D10. 以下哪种统计方法可以用来检验一个样本的均值是否与总体均值相等?A. t检验B. F检验C. 卡方检验D. 秩和检验答案:A二、填空题(每空2分,共10分)1. 样本量越大,抽样误差越小,因此,增大样本量可以提高统计推断的可靠性。
2. 两种独立样本的方差不相等时,应使用t检验中的______方法。
3. 在进行卡方检验时,如果期望频数小于5,应使用______检验。
4. 在进行t检验时,若样本量较小,应使用______检验。
5. 当总体分布未知时,可以使用______方法进行参数估计。
三、简答题(每题5分,共15分)1. 简述医学统计学的基本任务。
答案:医学统计学的基本任务包括:①描述医学现象的数据特征;②推断医学现象的规律性;③分析医学现象之间的关联性;④为医学决策提供依据。
卫生统计学试题演示文稿
第四章.假设检验 一.名词解释
1.统计推断. 2.均数的抽样误差
3.标准误
4.可信区间
5.参数估计 6.假设检验中P的含义
7.Ⅰ型和Ⅱ型错误 8.检验效能.
9. 检验水准
二.是非题
1.若两样本均数比较的假设检验结果P值远远小 于0.01,则说明差异非常大.
2.对同一参数的估计,99%可性区间比90%可信 区间好.
A. 2 B. 1 C. 2.5 D. 0.5
13.关于标准差,哪一项是错误的( ).
A.反映全部观察值离散程度 B.度量了一组数据偏离平均数的大小 C.反映了均数代表性的好坏 D.不会小于算术均数
14.中位数描述集中位置时,下面哪项是 错误的( ).
A.适合于偏态分布资料 B.适用于分布不明的资料 C.不适合等比资料 D. 分 布 末 端 无 确 定 值 , 只 能 用 中 位数
A. cv B. s C. Sx D. R
4.关于假设检验,下列哪一项说法是正 确的( )
A.单侧检验优于双侧检验 B.采用配对t检验还是成组t检验是由实验设计方 法决定的 C.检验结果若P值大于0.05,则接受H0犯错误的可 能性很小 D.用u检验进行两样本总体均数比较时,要求方差 齐性
5.统计推断的内容是( )
4.正态曲线下,横轴上,从均数-1.96倍标 准差到均数的面积为( )
A. 95% B. 45% C. 97.5% D. 47.5%
5.标准正态分布曲线下中间90%的面积 所对应的横轴尺度μ的范围是( ).
A. -1.64~1.64 B. -∞~1.64 C. -∞~1.28 D. -1.28~1.28
三.简答题
1.简述医学中参考值范围的涵义及制定参考 值范围的一般步骤.
医学统计学罗家洪案例版答案第三版第二章答案
医学统计学罗家洪案例版答案第三版第二章答案1.身体质量指标BMI是(C)A率B构成比C相对比D标准化率E以上都不是2.医学统计工作中,属于统计分析的是(D)A设计B搜集资料C整理资料D统计推断E数据录入3.比较健康人群收缩压和舒张压的变异水平,应采用的指标(C)A方差B总体标准差C变异系数D四分位数间距E中位数4.一组原始数据的分布呈偏态分布,描述该资料分布特征的最佳指标应选用(C)A均数和标准差B均数和四分位数间距C中位数和四份位数间距D中位数和标准差E均数和方差5.在研究研究白癜风病人白斑部位和正常皮肤IL-6水平的配对t检验中,要求(C)A两组的样本方差相等B数据呈双变量正态分布C差值d服从正态分布D差数d的方差等于0E两组总体方差齐6.利用SPSS软件做χ2检验前,首先要对数据进行(E)A value Btransform Cgraph Dlable E weight cases7.要评价某一地区一名儿童和身高是否偏高,其统计学方法是(D)A用均数来评价B用中位数来评价C用变异系数来评价D用参考值范围来评价E用总体均数可信区间来评价8.在两样本均数比较的假设检验中,ɑ=0.05,结果t=1.24,t0.05(v)=2.086,t0.01(v)=2.845。
正确的结论是(E)A两样本均数不同B两样本均数差异很大C两总体均数无差异D 两样本均数来自不同总体E尚不能认为两总体均数不同9.四格表的周边合计不变时,如果实际频数有变化,则理论频数(C)A增大B减小C不变D不确定E随该格子实际频数的变化而变化10.关于计量资料标准差和标准误的描述错误的是:(D)A标准差反映个体观察值的变异大小B标准误反映样本均数的变异大小C随样本量增大,标准误趋向于无限小D标准差反映抽样误差的大小E随样本量增大,标准差趋于稳定11.关于检验水准的描述不正确的是(E)A即显着性水准B用α来表示C是预先规定的D一般取α=0.05或0.01 Eα越大越容易得出无差别的结论12.比较两种药物治疗某种疾病效果时,如治疗效果用治愈、显效、无效、死亡来表示,分析两种药物治疗效果有无差异宜用(B)A卡方检验B秩和检验C t检验D t’检验E方差分析13.关于检验效能的描述正确的是(A)A用1-β表示B检验效能高,二类错误概率高C检验效能低,二类错误概率低D用1-α表示E以上都不正确14.最小二乘法是指(D)A各点到回归直线的垂直距离的和最小B各点到x轴的纵向距离的平方和最小C各点到回归直线的垂直距离的平方和最小D各点到回归直线的纵向距离的平方和最小E各点到回归直线的纵向距离的和最小15.在多个样本均数比较的方差分析中,获得P<0.05时,结论是(C)A证明各总体均数都不相等B证明各总体均数不等或不全相等C可认为各总体均数不等或不全相等D可认为各总体均数相等E可认为各样本均数不等或不全相等16.欲比较某地1970-2010年居民伤寒与结核病死亡率的变化速度,应当使用的统计图为(D)A.线图B.圆图C.直方图D.半对数线图E.百分条图17.欲了解2010年某地居民主要慢性病患病病种构成情况,应当使用的统计图为(A)A.圆图B.直条图C.直方图D.散点图E.箱式图18.欲了解2010年中国艾滋病患病率地区分布特征,应当使用的统计图为(E)A.圆图B.直条图C.直方图D.百分条图E.统计地图19.观察儿童智力与家庭收入的关系,宜选择的图形为(D)A.直方图B.直条图C.圆图D.散点图E.统计地图20.欲比较2011-2013年某地区不同性别居民糖尿病的患病率可用(C)A.直方图B.百分之条图C.复式直条图D.单式直条图E.线图21.根据某地6~12岁学生龋齿情况的调查资料,反映患者的年龄分布可用(A)A.直方图B.直条图C.普通线图D.半对数线图E.复式直条图22.关于正态分布的曲线下面积,以下说法正确的是(E)A.仅仅标准正态分布曲线下面积才为1B.在横轴上,从负无限大到1.64所对应的曲线下面积为0.975C.在横轴上,从正无限大到-1.96所对应的曲线下面积为0.95D.在横轴上,从正无限大到0所对应的曲线下面积为0.5E.以上都不对23.在制订参考值范围时,增加样本含量,可以使得(C)A.参考值范围越来越窄B.参考值范围越来越宽C.参考值范围越来越稳定D.参考值范围不变E.以上都不对24.统计中的集中趋势指标是反映资料的(D)A.变异程度B.相关性C.回归性D.平均水平E.中心25.对于同一组资料,没有考虑到每个观察值变异的指标是(C)A.方差B.标准差C.极差D.变异系数E.离差平方和26.变异系数越大,表示(A)A.相对变异程度越大B.平均数越大C.标准差越小D.样本含量越大E.标准差越大27.关于标准差,说法错误的是(D)A.反映全部观察值的离散程度B.度量了一组数据偏离均数的大小C.反映了均数代表性的好坏D.不会小于算术平均数E.其大小与样本有关28.呈偏态分布的资料应选择哪个指标描述变异情况比较恰当(C)A.极差B.百分位数C.四分位数间距D.标准差E.变异系数29.标准正态分布的5%分位数为(B)A.0B.-1.64C.-1.96D.-2.58E.与标准差有关30.对于极差的描述,以下错误的是(D)A.最大值与最小值的差值B.描述数据离散情况的指标之一C.样本量增加,极差可能增加D.极差充分利用了所有原始观察值的信息E.极差受异常值影响较大31.对相关系数r进行显着性检验,当r>r0.05/2(v),则(B)A.两变量之间关系密切B.两变量之间相关有统计学意义C.两变量之间关系不密切D.两变量之间相关无统计学意义E.以上都不是32.计算积矩相关系数要求(C)A.Y是正态变量,X可以不满足正态的要求B.X是正态变量,Y可以不满足正态的要求C.两变量都要求满足正态分布规律D.两变量只要是测量指标就行E.Y是定量指标,X可以是任何类型的数据34.由样本算得相关系数r,t检验结果为P<0.01,说明(D)A.两变量之间有高度相关性B.r来自高度相关的总体C.r来自总体相关系数为0的总体D.来自总体相关系数不为0的总体E.来自总体相关系数大于0的总体35.直线相关分析可用于研究()的数量关系(B)A.儿童的性别与体重B.儿童的身高与体重C.儿童的性别与血型D.母亲的职业与儿童的智商E.母亲的职业与血型36.在相关性研究中,相关系数的统计推断P值越小,则(C)A.两变量相关性越好B.结论可信度越大C.认为总体具有线性相关的理由越充分D.抽样误差越小E.抽样误差越大37.已知r=1,则一定有(C)A.b=1B.a=1C.SS剩=0D.SS总=SS剩E.SS剩=SS回38.设ρ为总体相关系数,根据实际资料算得样本相关系数r后,需进行显着性检验,其无效假设应为(C)A.H0∶r=0B.H0∶r≠0C.H0∶ρ=0D.H0∶ρ≠0E.H0∶ρ≤039.积矩相关系数ρ=0时,以下表述最佳的是(E)A.两变量间不存在任何关系B.两变量间存在直线关系,不排除也存在某种曲线关系C.两变量间存在曲线关系D.两变量间的关系不能确定E.两变量间不存在直线关系,但不排除存在某种曲线关系40.等比资料(或对数正态分布资料)的集中趋势指标为(C)A.算术平均数B.中位数C.几何均数D.百分位数E.变异系数41.描述一组数值变量资料的分布特征时应(D)A.同时选用算术均数和标准差B.同时选用中位数和四分位数间距C.同时选用几何均数和四分位数间距D.根据分布类型选用相应的集中趋势和离散趋势指标E.只选集中趋势和离散趋势指标中的一个即可42.测量体重、转氨酶等指标所得的资料是(B)A.计数资料B.计量资料C.等级资料D.半定量资料E.分类资料43.常用的描述数据集中趋势的指标不包括(D)A.算术平均数B.几何均数C.均数D.极差E.中位数44.血清学滴度资料最常用来表示其平均水平的指标是(C)A.算术平均数B.中位数C.几何均数D.百分位数E.众数45.常用离散趋势指标不包括(D)A.方差B.极差C.标准差D.P50E.四位数间距46.有关离散程度指标意义中,描述不正确的是(D)A.数值越大,说明个体差异越大B.数值越大,说明观察值的变异度越大C.数值越小,说明平均值的代表性越好D.数值越小,说明平均值的代表性越差E.应与平均数结合起来分析47.描述一组偏态分布资料的变异度,宜用(D)A.几何均数B.标准差C.变异系数D.四分位数间距E.方差48.对于偏态分布的资料,下列说法正确的是(A)A.左偏态分布资料的均数小于众数B.右偏态分布的长尾在左边C.正偏态分布和负偏态分布的符号判断是指资料的众数与均数之差的符号D.左偏态分布又叫正偏态分布E.负偏态分布的长尾在右边49.常用的离散程度指标包括(E)A.极差、几何均数、方差与标准差B.极差、算术平均数、方差与标准差C.极差、中位数、变异系数与标准差D.全距、中位数、变异系数与标准差E.全距、变异系数、方差与标准差50.描述变量数值分布的两个重要特征是(C)A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体51.最小组段无下限或最大组段无上限的频数分布资料,描述其集中趋势的指标是(E)A.算术平均数B.标准差C.全距D.几何均数E.中位数52.比较同一组儿童身高和体重两项指标的变异程度的大小,可选用的变异指标为(C)A.全距B.标准差C.变异系数D.四分位数间距E.方差53.统计分析的主要内容有(D)A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表54.统计资料的类型包括(E)A.频数分布资料和等级分布资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级分类资料E.数值变量资料和分类变量资料55.计量资料、计数资料和等级资料的关系是(C)A.计量资料兼有计数资料和等级分组资料的一些性质B.计数资料兼有计量资料和等级分组资料的一些性质C.等级分组资料兼有计量资料和计数资料的一些性质D.计数资料有计量资料的一些性质E.等级分组资料又称半计数资料58.P>0.05两样本均数比较,检验结果说明(D)A.两总体均数的差别较小B.两总体均数的差别较大C.支持两总体无差别的结论D.不支持两总体有差别的结论E.可以确认两总体无差别59.减少假设检验的Ⅱ类误差,应该使用的方法是(E)A.减少Ⅰ类错误B.减少测量的系统误差C.减少测量的随机误差D.提高检验界值E.增加样本含量60.以率为观察单位的资料,一般认为样本率服从二项分布,当总体率较小(<30%)或较大(>70%)时,偏离正态较为明显,要使资料接近正态分布,并达到方差齐性的要求,可选择的变换是(C)A.倒数B.平方根C.平方根反正弦D.对数E.平方61.完全随机设计方差分析中的组间均方是(D)A.仅表示随机误差作用的指标B.仅表示处理因素作用大小的指标C.总变异标准差的平方D.表示处理因素和随机误差综合作用的指标62.关于完全随机设计方差分析,错误的说法是(A)A.要求各样本来自同一总体B.要求各总体均服从正态分布C.各样本含量可以不同D.要求各总体方差相等E.查F界值表时的自由度分别为组间自由度和组内自由度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 计量资料的统计描述一、教学大纲要求(一)掌握内容1. 频数分布表与频数分布图 (1)频数表的编制。
(2)频数分布的类型。
(3)频数分布表的用途。
2. 描述数据分布集中趋势的指标 …掌握其意义、用途及计算方法。
算术均数、几何均数、中位数。
3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。
极差、四分位数间距、方差、标准差、变异系数。
(二)熟悉内容连续型变量的频数分布图:等距分组、不等距分组。
二、 教学内容精要计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。
常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。
(一)频数分布表的编制 ~频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。
如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
制作连续型数据频数表一般步骤如下:1.求数据的极差(range )。
min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。
确定组段和组距。
每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ<U 。
3.写出组段,逐一划记。
频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。
(二)描述频数分布中心位置的平均指标描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。
1.算术均数(对称分布)}算术均数(arithmetic mean )简称均数,描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X 表示,其计算方法如下:(1)直接法:直接用原始观测值计算。
nX X ∑= (2-2)(2)加权法:在频数表基础上计算,其中X 为组中值,f 为频数。
∑∑=ffX X (2-3) 2.几何均数(常用于免疫学的指标))几何均数(geometric mean )用以描述对数正态分布或数据呈倍数变化资料的水平。
记为G 。
其计算公式为:(1)直接法⎪⎭⎫ ⎝⎛∑=-n X G lg lg 1 (2-4)(2)加权法~⎪⎪⎭⎫ ⎝⎛∑∑=-f X f G lg lg 1 (2-5)3.中位数(尤其适合偏态分布资料和一端或两端无确切数值的资料)中位数(median )将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
为奇数时 ⎪⎭⎫ ⎝⎛+=21n X M (2-6)为偶数时 ()(1)2212n nM X X +⎛⎫=+ ⎪⎝⎭(2-7)2-1 常用平均数的意义及其应用场合平均数意义 应用场合(均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布几何均数 平均增(减)倍数 等比资料;对数正态分布中位数 位次居中的观察值水平 偏态分布;分布不明;分布末端无确定值-(一)反映数据变异程度大小的变异指标变异指标的应用亦根据资料的不同而选取不同指标进行描述。
常用的变异指标有极差、四分位数间距、方差、标准差和变异系数,尤其是方差和标准差更为常用。
1.极差极差(range )亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
min max X X R -=(2-1)2.百分位数与四分位数间距(1)百分位数(percentile )是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。
百分位数的另一个重要用途是确定医学正常参考值范围。
百分位数用P x 表示,0< x <100,如25%位数表示为P 25。
在频数表上,百分位数的计算公式为:()∑-⋅+=L xxx x f x n f i L P % (2-8)(2)四分位数间距(inter-quartile range )是由第3四分位数(Q 3= P 75)和第1四分位数(Q 1= P 25)相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,比极差稳定。
其计算公式:31QR Q Q =- (2-9)<3.方差方差(variance )表示一组数据的平均离散情况,其计算公式为:()122-∑-=n X S μ (2-10)4.标准差标准差(standard deviation )是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用,其计算公式为:S ==(2-11)5.变异系数变异系数(coefficient of variation )用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
用CV 表示,计算公式为:%100⨯=XS CV(2-12)平均指标和变异指标分别反映资料的不同特征,作为资料的总结性统计量,两类指标要求一起使用。
如常用S X ±或M (QR )。
《三、典型试题分析1.名词解释:平均数答案:平均数(average )是描述数据分布集中趋势的指标,在卫生领域中最常用的平均数指标:算术均数、几何均数和中位数。
[评析]本题考察平均数的概念。
平均数是一类统计指标,并不单纯指算术均数。
2.描述一组偏态分布资料的变异度,以( )指标较好。
A.全距 B.标准差 C.变异系数 D.四分位数间距答案:D,[评析]标准差和变异系数均用于描述正态分布资料的变异度,全距和四分位数间距可用于任何资料,而四分位数间距更为稳定,故选D。
3.用均数和标准差可以全面描述()资料的特征。
A.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布答案:C[评析]本题考察均数和标准差的应用条件。
4.同一资料的标准差是否一定小于均数答案:均数和标准差是两类不同性质的统计指标。
标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小。
标准差可大于均数,也可小于均数。
5.试述极差、四分位数间距、标准差及变异系数的适用范围。
答案:这三个指标均反映计量资料的离散程度。
极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较。
>四、习题(一)名词解释1.频数表2.算术均数3.几何均数4.中位数5.极差6.百分位数7.四分位数间距8.方差9.标准差10.变异系数(二)单项选择题1.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变%2.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.差C.极差D.标准差3.以下指标中()可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差4.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距(描述其变异程度)5.各观察值同乘以一个不等于0的常数后,()不变。
^A.算术均数 B.标准差C.几何均数D.中位数6.()分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态7.对数正态分布是一种()分布。
A.正态B.近似正态C.左偏态D.右偏态8.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数B.标准差/C.中位数D.四分位数间距9.()小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差10.血清学滴度资料最常用来表示其平均水平的指标是()。
A. 算术平均数B.中位数C.几何均数D. 平均数11.变异系数CV的数值()。
A. 一定大于1B.一定小于1C. 可大于1,也可小于1D.一定比标准差小-12.数列8、-3、5、0、1、4、-1的中位数是()。
A. 2B. 0C. D.13.关于标准差,那项是错误的()。
A.反映全部观察值的离散程度B.度量了一组数据偏离平均数的大小C.反映了均数代表性的好坏D.不会小于算术均数14.中位数描述集中位置时,下面那项是错误的()。
A. 适合于偏态分布资料B.适合于分布不明的资料C.不适合等比资料D.分布末端无确定值时,只能用中位数15. 5人的血清滴度为<1:20、1:40、1:80、1:160、1:320描述平均滴度,用那种指标较好()。
$A.平均数 B.几何均数C.算术均数D. 中位数16.数列0、48、49、50、52、100的标准差为()。
A.50 B.C. D.17.一组变量的标准差将()。
A.随变量值的个数n的增大而增大B.随变量值的个数n的增加而减小C.随变量值之间的变异增大而增大D.随系统误差的减小而减小>18.频数表计算中位数要求()。
A.组距相等B.原始数据分布对称C.原始数据为正态分布或近似正态分布D.没有条件限制19.一组数据中20%为3,60%为2,10%为1,10%为0,则平均数为()。
A. B.C. D. 不知道数据的总个数,不能计算平均数20.某病患者8人的潜伏期如下:2、3、3、3、4、5、6、30则平均潜伏期为()。
A.均数为7天,很好的代表了大多数的潜伏期B.中位数为3天C.中位数为4天^D.中位数为天,不受个别人潜伏期长的影响21.某地调查20岁男大学生100名,身高标准差为,体重标准差为,比较两者的变异程度,结果()。
A. 体重变异度大B.身高变异度较大C.两者变异度相同D.由单位不同,两者标准差不能直接比较(三)判断正误并简述理由1.均数总是大于中位数。
( x )2.均数总是比标准差大。
( x)3.变异系数的量纲和原量纲相同。
( x )"4.样本均数大时,标准差也一定会大。
( x )5.样本量增大时,极差会增大。
( )(四)计算题1.某卫生防疫站测得大气中的二氧化硫的浓度,用两种计量单位表示:mg/m3: 1 2 3 4 5ug/m3:1000 2000 3000 4000 5000分别计算几何均数及标准差,会发现两种不同单位得标准差相等,试解释其原因。
2.尸检中测得北方成年女子80人的肾上腺重量(g)如下,试(1)编制频数表,(2)求中位数、均数和标准差。
¥^ — ` ; - . (.3.测得某地300名正常人尿汞值,其频数表如下。
试计算均数、中位数、何者代表性较好。
表2-2 300例正常人尿汞值(μg/L )频数表尿汞值 例数 尿汞值 例数 尿汞值 例数 0- 49 ^ 24- 16 48- 3 4- 27 28- 9 52- - \ 8- 58 32- 9 56- 2 12- 50 36- 4 % 60- - 16- 45 40- 5 64- - 20- 22) 44--68-14.有5个变量值7,9,10,14,15,试计算X 及()X X -∑。