卫生统计学分类变量资料的统计描述

合集下载

国开01337实用卫生统计学任务1答案

国开01337实用卫生统计学任务1答案题目1：匹配题{1．数值变量资料; 2．分类变量资料; 3．有序分类变量资料} -> {是指用度量衡的方法测定每个观察单位的某项研究指标量的大小，所得到的数据（即测量值），就称为数值变量资料。

; 指将全体观察单位按照某种性质的不同程度分为若干组，分别清点各组中观察单位的个数所得的资料，这种资料也称为等级资料。

; 将全体观察单位按照某种性质或类别进行分组，然后分别清点各组中的例数，这样得到的数据称为分类变量资料，也称计数资料。

}答案：1．数值变量资料-> 是指用度量衡的方法测定每个观察单位的某项研究指标量的大小，所得到的数据（即测量值），就称为数值变量资料。

; 2．分类变量资料-> 将全体观察单位按照某种性质或类别进行分组，然后分别清点各组中的例数，这样得到的数据称为分类变量资料，也称计数资料。

; 3．有序分类变量资料-> 指将全体观察单位按照某种性质的不同程度分为若干组，分别清点各组中观察单位的个数所得的资料，这种资料也称为等级资料。

题目2：下面有关病人的变量中，属于分类变量的是（）。

: 血压; 性别; 脉搏; 年龄答案：性别题目3：某护士记录了50名婴儿出生体重的测定结果，小于2500克15人，介于2500克和3999克的有25人，大于4000克的有10人，此资料属于（）。

: 二分类资料; 有序分类变量资料; 分类变量资料答案：有序分类变量资料题目4：匹配题{1．变量; 2．变量值; 3．同质; 4．变异} -> {研究对象具有相同的背景、条件、属性称同质。

; 观察单位（或个体）的某种属性或标志称为变量。

; 对变量进行测量或观察的值称为变量值（或测量值、观察值）。

; 同一性质的事物，其个体观察值（变量值）之间的差异，在统计学上称为变异。

}答案：1．变量-> 观察单位（或个体）的某种属性或标志称为变量。

; 2．变量值-> 对变量进行测量或观察的值称为变量值（或测量值、观察值）。

卫生统计学试题二答案

医学统计方法选择题一:医学统计方法概述l．统计中所说的总体是指：AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2．概率P=0，则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3．抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4．测量身高、体重等指标的原始资料叫：BA计数资料B计量资料C等级资料D分类资料E有序分类资料5．某种新疗法治疗某病患者41人，治疗结果如下：治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是：DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6．样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7．将计量资料制作成频数表的过程，属于¬¬统计工作哪个基本步骤：CA统计设计B收集资料C整理资料D分析资料E以上均不对8．统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9．良好的实验设计，能减少人力、物力，提高实验效率；还有助于消除或减少：BA抽样误差B系统误差C随机误差D责任事故E以上都不对10．以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11．表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12．某计量资料的分布性质未明，要计算集中趋势指标，宜选择CA XB GC MD SE CV13．各观察值均加（或减）同一数后：BA均数不变，标准差改变B均数改变，标准差不变C两者均不变D两者均改变E以上均不对14．某厂发生食物中毒，9名患者潜伏期分别为：16、2、6、3、30、2、lO、2、24+(小时)，问该食物中毒的平均潜伏期为多少小时？CA 5B 5．5C 6D lOE 1215．比较12岁男孩和18岁男子身高变异程度大小，宜采用的指标是：DA全距B标准差C方差D变异系数E极差16．下列哪个公式可用于估计医学95％正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S17．标准差越大的意义，下列认识中错误的是BA观察个体之间变异越大B观察个体之间变异越小C样本的抽样误差可能越大D样本对总体的代表性可能越差E以上均不对18．正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19．确定正常人的某项指标的正常范围时，调查对象是BA从未患过病的人B排除影响研究指标的疾病和因素的人C只患过轻微疾病，但不影响被研究指标的人D排除了患过某病或接触过某因素的人E以上都不是20．均数与标准差之间的关系是EA标准差越大，均数代表性越大B标准差越小，均数代表性越小C均数越大，标准差越小D均数越大，标准差越大E标准差越小，均数代表性越大第九章数值变量资料的统计推断21．从一个总体中抽取样本，产生抽样误差的原因是AA总体中个体之间存在变异B抽样未遵循随机化原则C被抽取的个体不同质D组成样本的个体较少E分组不合理22．两样本均数比较的t检验中，结果为P<0.05，有统计意义。

卫生统计学知识点(笔记)

第一章绪论1.统计学（statistics）是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。

2.▲总体（population）用来表示大同小异的对象全体，例如一个国家的所有成年人；某地的所有小学生。

可分为目标总体和研究总体。

若试图对某个总体下结论，这个总体便称为目标总体（target population）；资料常来源于目标总体中的一个部分，它称为研究总体（study population）。

需要谨慎的是，就研究总体所下的结论未必适用于目标总体。

3.▲样本（sample）是指从研究总体中抽取的一部分有代表性的个体。

获取样本的过程称为抽样（sampling）。

抽样研究的目的是用样本数据推断总体的特征。

需要注意的是，统计学的结论从来就不是完全肯定或完全否定的，能不能成功地达到从样本推断总体的目的，关键是抽样的方法、样本的代表性和推断的技术。

4.▲同质（homogeneity）是指同一总体中个体的主要性质相同。

5.▲变异（variation）是指同质的个体之间存在的差异。

6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化：只能由“高级”向“低级”转化，即由信息量多的向信息量少的类型转化，如：定量有序分类二值7.▲参数（parameter）是反映总体特征的指标，参数的大小是客观存在的，是一个常数，不会发生变化，然而往往是未知的，需要通过样本资料来估计，如总体均数μ，总体标准差σ。

8.▲统计量（statistic）又称样本统计量，是反映样本特征的指标，是由观察资料计算出来的，如样本均数 X，样本标准差S。

统计学的任务就是依据样本统计量来推断总体参数。

9.▲概率与频率的区别：概率是参数，频率是统计量；频率总是围绕概率上下波动。

当某事件发生的概率≤0.05时，即P≤0.05，统计学习惯上称该事件为小概率事件。

卫生统计学名词解释

卫生统计学名词解释一、基础概念1.总体（Population）：在一定时空范围内同质的所有观察单位或个体的集合。

2.样本（Sample）：从总体中随机抽取的一部分观察单位的集合。

3.变量（Variable）：观察单位的基本特征或特性，可以分为定量变量和定性变量。

4.总体参数（Population Parameter）：描述总体特征的概括性数值，如总体均数、总体率等。

5.样本统计量（Sample Statistic）：描述样本特征的数值，如样本均数、样本率等。

二、资料类型与搜集方法1.计数资料（Count Data）：通过计数或分类得到的资料，一般用相对数（率）表示。

2.计量资料（Measure Data）：通过测量得到的数值资料，一般用均数、中位数等表示。

3.等级资料（Ordinal Data）：具有一定顺序或等级的资料，一般用等级或有序分类表示。

4.调查法（Survey Method）：通过问卷、访谈等方式收集资料的方法，常用于大样本调查。

5.实验法（Experimental Method）：通过实验设计、随机分组等方式收集资料的方法，常用于实验研究。

6.观察法（Observational Method）：通过观察记录收集资料的方法，常用于临床观察、生态学研究等。

7.纵向研究（Longitudinal Study）：对同一组观察单位在不同时间点进行重复观察的方法，可获取纵向数据。

8.横向研究（Cross-sectional Study）：在某一时间点对不同组观察单位进行同时观察的方法，可获取横截面数据。

9.随机抽样（Random Sampling）：按照随机原则从总体中抽取样本的方法，保证每个观察单位被抽中的概率相等。

10.系统抽样（Systematic Sampling）：按照某种规则或顺序从总体中抽取样本的方法，如每隔一定数量的观察单位抽取一个样本。

三、卫生统计学方法1.描述性统计（Descriptive Statistics）：通过对数据进行整理、归类、简化和表示，描述数据的基本特征和分布情况。

卫生统计学重点总结

第一章绪论1.卫生统计学的概念P1卫生统计学是应用概率论和数理统计学的基本原理和方法，研究居民卫生情况以及卫生服务领域中数据的收集、整理和分析的一门科学。

2.卫生（医学）统计学的主要步骤P3设计；收集资料；整理资料；分析资料3.（选择、判断）卫生统计学的基本概念P4同质（homogeneity）：统计学中，若某些观察对象具有相同的特征或属性，称之为同质或具有同质性。

变异（variation）：将同质个体的某项特征或属性的观察值或测量值之间的差异称为变异。

总体（population）：是根据研究目的确定的的所有观察单位某种特征或属性的观察值或测量值的集合。

样本（sample）：是从总体中随机抽取的具有代表性的部分观察单位的集合。

样本中包含的观察单位个数称为样本含量。

参数（parameter）：反映总体特征的指标称为参数，一般是未知的，常用希腊字母表示。

统计量（statistic）：根据样本观察值计算出来的指标称为统计量，常用拉丁字母表示。

变量（variable）：每个观察单位的某项特征或属性称为变量。

抽样研究（sampling research）：从总体中随机抽取样本，通过样本信息推断总体特征的研究方法称为抽样研究。

抽样误差（sampling error）：由随机抽样造成的样本统计量与总体参数之间、样本统计量之间的差异称为抽样误差。

资料（data）：变量值的集合称之为资料。

★4.资料的分类P4（1）定量资料：亦称计量资料，其变量值是定量的，表现为数值大小，一般有度、量、衡单位。

（2）定性资料：亦称分类资料，其观察值是定性的，表现为互不相容的类别或属性，一般无度、量、衡单位。

可进一步细分为两种资料：1）计数资料：指将观察单位按某种类别或属性进行分组，清点各组观察单位数所得的资料。

包括：①二项分类资料；②无序多项分类资料2）等级资料：亦称有序多分类资料，是将观察单位按某特征或属性的程度或等级顺序分组，清点各组观察单位数所得的资料。

卫生统计学试题及答案

卫生统计学试题及答案【篇一：卫生统计学考试试题及答案(附解释)】xt>1.用某地6～16岁学生近视情况的调查资料制作统计图，以反映患者的年龄分布，可用图形种类为______.a.普通线图b.半对数线图c.直方图d.直条图e.复式直条图【答案】c（6——16岁为连续变量，得到的是连续变量的频数分布）直方图（适用于数值变量，连续性资料的频数表变量）直条图（适用于彼此独立的资料）2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布，可采用______.a.直方图b.普通线图c.半对数线图d.直条图e.复式直条图(一个检测指标，两个分组变量)【答案】e? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况，可采用______.a.直方图b.普通线图（适用于随时间变化的连续性资料，用线段的升降表示某事物在时间上的发展变化趋势）c.半对数线图（适用于随时间变化的连续性资料，尤其比较数值相差悬殊的多组资料时采用，线段的升降用来表示某事物的发展速度）d.直条图e.复式直条图【答案】e4.调查某疫苗在儿童中接种后的预防效果，在某地全部1000名易感儿童中进行接种，经一定时间后从中随机抽取300名儿童做效果测定，得阳性人数228名。

若要研究该疫苗在该地儿童中的接种效果，则______.a.该研究的样本是1000名易感儿童b.该研究的样本是228名阳性儿童c.该研究的总体是300名易感儿童d.该研究的总体是1000名易感儿童e.该研究的总体是228名阳性儿童【答案】d5.若要通过样本作统计推断，样本应是__________.a.总体中典型的一部分b.总体中任一部分c.总体中随机抽取的一部分d.总体中选取的有意义的一部分e.总体中信息明确的一部分【答案】c6.下面关于均数的正确的说法是______.a.当样本含量增大时，均数也增大b.均数总大于中位数c.均数总大于标准差d.均数是所有观察值的平均值e.均数是最大和最小值的平均值【答案】d7.某地易感儿童注射乙肝疫苗后，从中随机抽取100名儿童测量其乙肝表面抗体滴度水平，欲描述其平均水平，宜采用______.a.均数b.几何均数c.中位数d.方差e.四分位数间距【答案】b几何均数（geometric mean）是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平，在医学研究中常适用于免疫学的指标。

卫生统计学

《卫生统计学》第一章绪论一、名词解释1. 参数 (parameter)2. 统计量 (statistic)3. 总体 (population)4. 样本 (sample)5. 同质 (homogeneity)6. 变异 (variation)7. 概率 (probability) 8. 抽样误差 (sampling error)二、单选题1.在实际工作中,同质是指:A.被研究指标的影响因素相同B.研究对象的有关情况一样C.被研究指标的主要影响因素相同D.研究对象的个体差异很小E.以上都对2.变异是指:A.各观察单位之间的差异B.同质基础上,各观察单位之间的差异C.各观察单位某测定值差异较大D.各观察单位有关情况不同E.以上都对3.统计中所说的总体是指:A.根据研究目的而确定的同质的个体之全部B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.随意想象的研究对象的全体E.根据人群划分的研究对象的全体4. 统计中所说的样本是指:A.从总体中随意抽取一部分B.有意识地选择总体中的典型部分C.依照研究者的要求选取有意义的一部分D.从总体中随机抽取有代表性的一部分E.以上都不是5．按随机方法抽取的样本特点是:A.能消除系统误差B.能消除随机测量误差C.能消除抽样误差D.能减少样本偏性E.以上都对6．统计学上的系统误差、测量误差、抽样误差在实际工作中:A.均不可避免B.系统误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免E.只有抽样误差不可避免7．统计工作的基本步骤是：A.设计、调查、审核、整理资料B.收集、审核、整理、分析资料C.设计、搜集、整理、分析资料D.调查、审核、整理、分析资料E.以上都不对8．统计工作的关键步骤是:A.调查或实验设计B.整理分组C.收集资料D.审核资料E.分析资料9．欲研究某种药物对高血压病的疗效,临床观察 300 名病人的血压情况,确切地说,研究总体是:A.这 300 名高血压患者B.这 300 名高血压患者的血压值C.所有的高血压患者D.所有的高血压患者的血压值E.这种药物10．抽样误差是由:A.计算引起B.测量引起C.抽样引起D.采样结果不准引起E.试剂、仪器未经校正引起11．抽样误差指的是:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.不同的总体参数之差E.以上都不是12．习惯上,下列属于小概率事件的为:A. P=0.09B. P=0. 10C. P=0.15D. P=0.03E.以上都不是13．治疗效果判定资料属于A. 计量资料B. 计数资料C. 等级资料D. 无序分类资料E. 以上都不是14．概率 P 的范围:A. -1≤P≤1B. 0<P<1C. P≥1D. -1≤P≤0E. 0≤P≤1三、简答题1、统计学的基本步骤有哪些？2、总体与样本的区别与关系？3、抽样误差产生的原因有哪些？可以避免抽样误差吗？4、何为概率及小概率事件？第二章定量资料的统计描述第三章正态分布一、名词解释1.正态分布 (normal distribution)2. 中位数 (median)3. 四分位数间距 (quartile interval)4. 方差 (variance)5. 正偏态分布 (positively skewed distribution)6. 负偏态分布 (negatively skewed distribution)7. 对数正态分布 (logarithmic normal distribution )8. 医学参考值范围 (medical reference range)二、单选题1.μ确定后,δ越大, 则正态曲线:A.越陡峭B. 形状不变C. 越平缓D.向左移动E.向右移动2. 平均数可用于分析下列哪种资料:A.统计资料B.等级资料C.计数资料D.计量资料E.调查资料3. 常用的平均数指标有:A.样本均数、总体均数、中位数B.算术均数、总体均数、几何均数C.算术均数、几何均数、中位数D.中位数、样本均数、几何均数E.以上都不对4. 描述一组正态或近似正态分布资料的平均水平用：A.算术均数B.几何均数C.中位数D.平均数E.以上均是5. 用x= ∑ x/n 公式计算均数的方法称为:A.加权法B.简捷法C.目测法D.平均法E.直接法6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原均数, 则应:A.减一个组距B.加一个组距C.减半个组距D.加半个组距E.以上均不对7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标:A.几何均数B.中位数C.平均数D.均数E.算术均数8. 用频数表法计算均数时,组中值应为:A.(本组段下限值+本组段上限值)/2B.(本组下限值+下组下限值)/2C.(本组下限值+下组上限值)/2D.本组段的上限值E.本组段的下限值9. 原始数据加上一个不为 0 的常数后:A. x不变、CV 变B. x变或 CV 变C. x不变、CV 不变D. x变、CV 不变E. x、CV 均改变10. 对于对称分布的资料来说:A.均数比中位数大B.均数比中位数小C.均数等于中位数D.均数与中位数无法确定孰大孰小E.以上说法均不准确11. 血清学滴度资料最常计算_______以表示其平均水平。

卫生统计学题库

最佳选择题1.收集资料的方法是：EA.收集各种报表B.收集各种工作记录C.进行专题调查D.进行科学实验E.以上都对2.统计工作的基本步骤是：DA.调查资料、审核资料、整理资料B.收集资料、审核资料、分析资料C.调查资料、整理资料、分析资料D.收集资料、整理资料、分析资料E.以上都对3.在抽样研究中样本是：DA.总体中的一部分B.总体中任意一部分C.总体中典型部分D.总体中有代表性的一部分E.总体中有意义的一部分4.计量资料、计数资料和等级资料的关系是：CA.计量资料兼有计数资料和等级资料的一些性质B.计数资料兼有计量资料和等级资料的一些性质C.等级资料兼有计量资料和计数资料的一些性质D.计数资料有计量资料的一些性质E.以上都不是5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制D：A.普通线图B.直方图C.构成比直条图D.半对数线图E.直条图6.直方图可用于：A.某现象的内部构成B.各现象的比较C.某现象的比较D.某现象的频数分布E.某现象的发展速度7.统计图表的要求是：A.简单明了B.层次清楚C.说明问题明确D.避免臃肿复杂E.以上都对8.在列频数表时,分组数目一般为：E.＞209.平均数作为一种统计指标是用来分析：A.计数资料B.计量资料C.等级分组资料D.调查资料E.以上都不对10.表示变量值变异情况的常用指标是：A.全距B.标准差C.方差D.变异系数E.以上均是 11.确定正常人某个指标正常值范围时,调查对象是：A.从未患过病的人B.健康达到了要求的人C.排除影响被研究指标的疾病和因素的人D.只患过小病但不影响研究指标的人E.排除了患过某病或接触过某因素的人 12.标准误：A.与标准差呈反比B.与标准差呈正比C.与标准差的平方呈反比D.与标准差平方呈正比E.以上都不对13.x σ是指：A.所有观察值对总体均数的离散程度B.某一个样本均数的离散程度C.所有样本均数对总体均数的离散程度D.某些样本均数对总体均数的离散程度E.所有含量相同的样本均数对总体均数的离散程度14.2.58XX S ±表示：%的正常值范围 %的可信区间 %的正常值范围 %的可信区间 E.以上都不对15.构成比通常以下列哪项指标为比例基数： % ‰ 万 10万 E.视具体情况而定 16.一事物各构成比部分相对数之和应为：A.大于1B.小于1C.等于1D.不一定E.以上都不对17.正态曲线下,横轴上从–∞到1.96μσ+的面积为A 、95%B 、45%C 、%D 、%E 、不能确定 18. 进行统计分析的资料必须是A 、完整、准确、及时的B 、随机取得的C 、满足条件齐同的D 、数量足够的E 、以上都对 19.指出下列变量中哪一个指标为统计量A.p B.σC.μD.πE.β20.计算样本率的抽样误差适用公式为：E.以上都不对×C 表的2χ检验的自由度为：A.1R -B.1C -C.1RC -D.(1)(1)R C --E.2R C ⨯-22.实验设计的基本原则为A.齐同原则B.随机原则C.对照原则D.重复原则E.以上都是 23.在相关分析中：A.r越接近1,散点图越集中 B.r越接近0,散点图越集中C.0r <,散点图越集中D.0r >,散点图越集中E.以上全不对24.已知1r =,则一定有：A.1b =B.1a =C. ,0Y X S = D.,Y X YS S = E.,Y X XS S =25.相关分析的主要内容包括：A.确定变量间的数量关系B.确定变量之间有无关系C.确定变量之间有无因果关系D.确定变量之间关系的密切程度E.以上都不是26.在配对法秩和检验中,共有8对数据,且差值中没出现0,27T -=,则T +=：A. -327.配对比较的秩和检验的基本思想是：如果假设检验成立,则对样本来说：A.正秩和的绝对值大于负秩和的绝对值B.正秩和的绝对值小于负秩和的绝对值C.正秩和的绝对值与负秩和的绝对值不会相差很大D.正秩和的绝对值与负秩和的绝对值相等E.正秩和的绝对值与负秩和的绝对值相差很大28.在成组设计两样本比较的秩和检验中,甲组中最小数据有2个,,乙组中最小数据也有2个,,则数据的秩次为：当第二类错误β由变到时,则第一类错误α是：A.增大B.减小C.不确定D.不变化E.以上都不对30.下列指标除了哪项均为疾病统计指标：A.治愈率B.某病病死率C.某病死亡专率D.感染率E.发病率31．计算某抗体滴度的平均水平,一般宜选择A、算术均数B、几何均数C、中位数D、百分位数E、极差32．统计推断的内容A、是用样本指标估计相应的总体指标B、是检验统计上的“假设”C、估计正常值范围D、A、B均不是E、A、B均是33．比较身高与体重的变异程度宜用的指标是A、标准差B、标准误C、四分位间距D、变异系数E、全距34．观察值 2、 5、 10、 7、 9、 8、 20、 100的平均数是A、 B、 C、 D、 20 E、1035．当n一定时,第二类错误β由变到时,第一类错误A、增大B、减小C、不确定D、不变化E、以上都不对36．两小样本计量资料比较的假设检验,应首先考虑A、用t检验 B 、用u检验 C、用秩和检验 D 、资料符合t检验还是秩和检验的条件 E、任选一种检验方法37．抽样误差指的是A、个体值与总体值之差B、样本统计量之间及样本统计量与总体参数值之差C、个体值与统计量值之差D、总体参数值与总体参数值之差E、以上都不对38．同一双变量资料进行直线相关与回归分析,有A、0,0r b><B、0,0r b>>C、0,0r b<>D、r b=E、r与b的符号无关39．用均数和标准差可全面描述下列哪项资料的特征A、正偏态分布B、负偏态分布C、正态分布D、非对称分布40．四个样本率作比较,220.01,(3)χχ>,可认为各总体率不等或不全相等 B、各总体率均不相等 C、各样本率均不相等D、各样本率不等或不全相等E、各总体率相等二、填空题1、统计工作的基本步骤是、、 ;2、统计表的结构主要由、、和组成;3、平均数主要包括、和 ;4、统计资料可分为、和三种;5、图可描述一事物随另一事物变化的趋势, 图描述一事物随另一事物变化的速度;6、用和可全面描述偏态分布的计量资料的特征7、频数分布的两个特征是和三、是非题1．比较一批儿童的身高和体重的变异程度宜用标准差;2．直方图可以用于反映一批新生儿出生体重的分布情况;3．某地区某病连续3年患病率分别为%、%、%,则该病3年总的患病率为：++/3=%;4．当抽样研究的样本含量增大时,均数的标准误会变小;5．当自由度趋向无穷大时,t分布就是标准正态分布;6．两样均数比较的t检验的目的在于检验两样本均数差别是否等于0;7．χ2检验可用于两个样本均数的比较;8．直线相关反映两变量的相互直线关系;9．相关关系一定是因果关系;10．若t检验结果为拒绝H0,则P值越小,说明两总体均数差别越大;四、简答题1．计量标准化率时,通常以什么作为标准人口2．计算参考值范围的方法有哪些3．简述非参数检验的应用条件;4．等级相关特别适用于哪些资料五、计算题1．大量研究显示,汉族足月正常产男性新生儿临产前双顶径均数为;某医生记录了某山区12名汉族足月正常产男性新生儿临产前双顶径cm资料如下：试问该山区男性新生儿临产前双顶径是否与一般新生儿相等假设检验统计量为2．某地抽样调查了360名健康成年男性的红细胞数,其均数为,标准差为,问该地男性红细胞数与标准值有无差别假设检验统计量为3．研究者为比较耳垂血和手指血的白细胞数,调查8名成年人,同时采取耳垂血和手指血,见下表;编号: 1 2 3 4 5 6 7 8耳垂血:手指血:问：1若资料服从正态分布,试比较两者的白细胞数是否相同假设检验统计量为2若资料不服从正态分布,试比较两者的白细胞数是否相同4．尿铅测定过去采用湿式热消法—双硫脲法,后改用硝酸—高锰酸钾冷消化法,资料如下, 患者号 1 2 3 4 5 6 7 8 9 10冷法热法问：1若资料服从正态分布,试比较两法所得结果有无差别假设检验统计量为2若资料不服从正态分布,试比较两法所得结果有无差别5．某医师用两种疗法治疗脑血管梗塞,结果见下表,试比较两种疗法的疗效是否相同假设检验统计量为10分两种疗法治疗脑梗塞效果疗法人数有效例数有效率%甲疗法 31 25乙疗法 32 296．欲了解甲乙两医学院卫生管理专业学生的英语水平,随机抽取108人进行达标考试,结果见下表,试比较两医学院卫生管理专业学生的英语达标率有无差别假设检验统计量为两医学院卫生管理专业学生的英语达标率医学院达标人数参加考试人数达标率%甲30 42乙32 66A．均数不变B．标准差不变C．两者均变D．两者均不变各观测值同时加或减某一常数B各观测值同时乘或除某一常数C用变异系数此较变异程度,适宜于医学统计方法概述l．统计中所说的总体是指：AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2．概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3．抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4．测量身高、体重等指标的原始资料叫：BA计数资料B计量资料C等级资料D分类资料E有序分类资料5．某种新疗法治疗某病患者41人,治疗结果如下：治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是：DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6．样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7．将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤：CA统计设计B收集资料C整理资料D分析资料E以上均不对8．统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9．良好的实验设计,能减少人力、物力,提高实验效率；还有助于消除或减少：BA抽样误差B系统误差C随机误差D责任事故E以上都不对10．以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11．表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12．某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13．各观察值均加或减同一数后：BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14．某厂发生食物中毒,9名患者潜伏期分别为：16、2、6、3、30、2、lO、2、24+小时,问该食物中毒的平均潜伏期为多少小时 CA 5B 5．5C 6D lOE 1215．比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是：DA全距B标准差C方差D变异系数E极差16．下列哪个公式可用于估计医学95％正常值范围 AA X±B X±C μ±D μ±,υSXE X±17．标准差越大的意义,下列认识中错误的是BA观察个体之间变异越大B观察个体之间变异越小C样本的抽样误差可能越大D样本对总体的代表性可能越差E以上均不对18．正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19．确定正常人的某项指标的正常范围时,调查对象是BA从未患过病的人B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人E以上都不是20．均数与标准差之间的关系是EA标准差越大,均数代表性越大B标准差越小,均数代表性越小C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21．从一个总体中抽取样本,产生抽样误差的原因是AA总体中个体之间存在变异B抽样未遵循随机化原则C被抽取的个体不同质D组成样本的个体较少E分组不合理22．两样本均数比较的t检验中,结果为P<,有统计意义;P愈小则 EA 说明两样本均数差别愈大B 说明两总体均数差别愈大C 说明样本均数与总体均数差别愈大D 愈有理由认为两样本均数不同E 愈有理由认为两总体均数不同23．由10对20个数据组成的资料作配对t检验,其自由度等于CA 10B 20C 9D 18E 1924．t检验结果,P>,可以认为 BA两总体均数差别无显着性B两样本均数差别无显着性C两总体均数差别有显着性D两样本均数差别有显着性E以上都不对25．下列哪项不是t检验的注意事项 DA资料应具备可比性B下结论切忌绝对化C根据资料选择适宜的检验方法D分母不宜过小E资料应服从正态分布26．在一项抽样研究中,当样本量逐渐增大时 BA 标准差逐渐减少B 标准误逐渐减少C 标准差逐渐增大D 标准误逐渐增大E 标准差和标准误都逐渐增大27．t＜v,统计上可认为 CA两总体均数,差别无显着性B两总体均数,差别有显着性C两样本均数,差别无显着性D两样本均数,差别有显着性E以上均不是28．两样本均数的t检验中,检验假设H0是BA μ1≠μ2B μ1=μ2C X1≠X2D X1=X2E X1=X229．同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠AA. Sx B .S C .x D .CV E S230．标准差与标准误的关系是：CA两者相等B后者大于前者C前者大于后者D不一定 E 随样本例数不同31．在同一正态总体中随机抽取含量为n的样本,理论上有95%的总体均数在何者范围内CA均数加减倍的标准差B均数加减倍的标准差C均数加减倍的标准误D均数加减倍的标准误E以上都不对32．同一自由度下,P值增大CA t值不变B t值增大C t值减小D t值与P值相等E t值增大或减小33．两样本作均数差别的t检验,要求资料分布近似正态,还要求 DA两样本均数相近,方差相等B两样本均数相近C两样本方差相等D两样本总体方差相等E两样本例数相等第十章分类变量资料的统计描述与推断34．构成比的重要特点是各组成部分的百分比之和 CA一定大于1 B一定小于l C一定等于1 D一定等于0 E随资料而异35．计算相对数的目的是CA为了进行显着性检验B为了表示绝对水平C为了便于比较D为了表示实际水平E为了表示相对水平36．某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是BA率B构成比C相对比D绝对数E标化率37．四个样本率作比较,x2>3,可以认为AA各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同E样本率与总体率均不相同38．卡方检验中自由度的计算公式是DA行数×列数 B n-1 C N-k D行数-1列数-1 E行数×列数-139．作四格表卡方检验,当N>40,且__________时,应该使用校正公式EA T<5B T>5C T<1D T>5E 1<T<540．若X2≥X2 ν则AA P≤0．05B P≥0．05C P＜0．05D P＝0．05E P＞0．05 41．相对数使用时要注意以下几点,其中哪一项是不正确的BA 比较时应做假设检验B 注意离散程度的影响C 不要把构成比当率分析D 二者之间的可比性E 分母不宜过小42．反映某一事件发生强度的指标应选用DA 构成比B 相对比C 绝对数D 率E变异系数43．反映事物内部组成部分的比重大小应选用 AA构成比 B 相对比C绝对数D率E变异系数44．计算标化率的目的是DA使大的率变小, B使小的率变大C使率能更好的代表实际水平D消除资料内部构成不同的影响,使率具有可比性E起加权平均的作用45．在两样本率比较的X2检验中,无效假设H0的正确表达应为CA μ1≠μ2B μ1=μ2 c π1=π2 D π1≠π2 E B=C46．四格表中四个格子基本数字是DA两个样本率的分子和分母B两个构成比的分子和分母C两对实测数和理论数D两对实测阳性绝对数和阴性绝对数E两对理论数第十二章统计表与统计图47．比较某地1990~1997年肝炎发病率宜绘制 CA直条图B构成图C普通线图D直方图E统计地图48．关于统计资料的列表原则,错误的是 BA．横标目是研究对象,列在表的左侧；纵题目是分析指标,列在表的右侧B．线条主要有顶线,底线及纵标目下面的横线,分析指标后有斜线和竖线C．数字右对齐,同一指标小数位数一致,表内不宜有空格D．备注用“”标出,写在表的下面E．标题在表的上端,简要说明表的内容49．比较甲、乙、丙三地区某年度某种疾病的发病率情况,可用AA直条图 B 线图 C 直方图 D 圆形图 E 百分条图50．描述某地某地210名健康成人发汞含量的分布,宜绘制BA直条图B直方图C线图D百分条图E散点图统计学试题二:一、概论l、统计中所说的总体是指：A根据研究目的确定的同质的研究对象的全体;B随意想象的研究对象的全体;C根据地区划分的研究对象的全体;D根据时间划分的研究对象的全体;E根据人群划分的研究对象的全体;2、从一个总体中抽取样本,产生抽样误差的原因是：A、总体中个体之间存在变异B、抽样未遵循随机化原则C、被抽取的个体不同质D、组成样本的个体较少E、分组不合理3、概率P=1,则表示：A、某事件必然不发生B、某事件必然发生C、某事件发生的可能性很小D、某事件发生的可能性很大E、以上均不对4、将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤：A、统计设计B、收集资料C、整理资料D、分析资料E、以上均不对5、统计学上通常认为P小于等于多少的事件,在一次观察中不会发生：A、B、C、D、E、6、抽样调查的目的是：A、研究样本统计量B、研究总体统计量C、研究典型案例D、研究误差E、样本推断总体参数7、抽签的方法属于：A、分层抽样B、系统抽样C、整群抽样D、单纯随机抽样E、二级抽样8、样本是总体中：A、任意一部分B、典型部分C、有意义的部分D、有代表性的部分E、有价值的部分9、用某种新疗法治疗某病患者41人,治疗结果如下：治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是：DA、集中型资料B、数值变量资料C、无序分类资料D、有序分类资料E、离散型资料10、某地区抽样调查1000名成年人的血压值,此资料属于：A、集中型资料B、数值变量资料C、无序分类资料D、有序分类资料E、离散型资料答案：1A 2A 3B 4C 5B 6E 7D 8D 9D 10B二、数值变量资料的统计描述11、常用平均数如下,除了：EA、均数B、几何均数C、中位数D、众数E、全距12、变异指标如下,除了：EA、全距B、标准差C、变异系数D、四分位数间距E、中位数13、某数值变量资料的分布性质未明,要计算集中趋势指标,下列适宜的指标是：CA、XB、GC、MD、SE、CV14、各观察值均加或减同一数后：BA、均数不变,标准差改变B、均数改变,标准差不变C、两者均不变D、两者均改变E、以上均不对15、某厂发生食物中毒,9名患者潜伏期分别为：16、2、6、3、30、2、lO、2、24+小时,问该食物中毒的平均潜伏期为多少小时：CA、5B、C、6D、lOE、1216、比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是：DA、全距B、标准差C、方差D、变异系数E、极差17、表示血清学滴度资料平均水平最常计算: BA、算术均数B、几何均数C、中位数D、全距E、率18、标准差越大的意义,下列认识中错误的是：BA、观察个体之间变异越大B、观察个体之间变异越小C、样本的抽样误差可能越大D、样本对总体的代表性可能越差E、以上均不对19、均数与标准差适用于：AA、正态分布的资料B、偏态分布C、正偏态分布D、负偏态分布E、不对称分布20、正态分布是以：E值为中心的频数分布 B.参数为中心的频数分布C.变量为中心的频数分布D.观察例数为中心的频数分布E.均数为中心的频数分布三、数值变量资料的统计推断21、反映均数抽样误差的统计指标是：A、标准差B、标准误C、变异系数D、全距E、方差22、下列哪个公式可用于估计总体均数95％可信区间：A、±B、±C、μ±,υSD、μ±,υSE、±,υS23、当自由度v→∞时,值：CA、≠B、<C、=D、>E、=24、α=, t>,ν,统计上可认为DA、两总体均数差别无显着意义B、两样本均数差别无显着意义C、两总体均数差别有显着意义D、两样本均数差别有显着意义E、以上均不对25、作单侧检验的前提是：DA、已知新药优于旧药B、已知新药差于旧药C、不知新药好还是旧药好D、已知新药不比旧药差E、已知新旧药差不多好26、用一种新药治疗高血脂症8例,观察治疗前后红血清成固醇的浓度变化,欲知该药是否有效,宜采用：AA、配对设计t检验B、成组设计两样本均数比较的t检验C、成组设计两样本几何均数比较t检验D、两样本均数比较u检验E、x2检验27、对两组大样本率的比较,可选用：EA、u检验B、x2检验C、四格表确切计算概率法D、以上都不对E、A,B都可以28、在两样本均数比较的t检验中,无效假设H0的正确表达应为：BA、μ1≠μ2B、μl=μ2 c、1≠ 2 D、1= 2 E、π1=π229、在t检验中,当t> v时,则结论为：CA、P>B、P≥C、P<D、P≤E、P≤30、两个作t检验,除样本都应呈正态分布以外,还应具备的条件是：BA、两数值接近B、两S2数值接近C、两相差较大D、两S2相差较大E、以上都不对31、抽样调查男生和女生各100名,并分别统计出身高与体重均数,其中同性别的身高与体重均数不可作假设检验,是因为：AA、资料不具备可比性B、身高资料不呈正态分布C、体重资料不呈正态分布D、样本含量较小32、由10对20个数据组成的资料作配对t检验,其自由度等于：CA、10B、20C、9D、1833、对两样本均数作t检验,n1=20,n2=20,其自由度等于：CA、19B、20C、38D、40E、39四、分类资料的统计描述与推断34、计算相对数的目的是：EA、为了进行显着性检验B、为了表示绝对水平C、为了便于比较D、为了表示实际水平E、为了表示相对水平35、某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是：BA、率B、构成比C、相对比D、绝对数E、标化率36、相对数使用时要注意以下几点,其中哪一项是不正确的：BA、比较时应做假设检验B、注意离散程度的影响C、不要把构成比当率分析D、二者之间的可比性E、分母不宜过小37、反映某一事件发生强度的指标应选用：DA、构成比B、相对比C、绝对数D、率E、变异系数38、反映事物内部组成部分的比重大小应选用：AA、构成比B、相对比C、绝对数D、率E、变异系数39、计算标化率的目的是：DA、使大的率变小,B、使小的率变大C、使率能更好的代表实际水平D、消除资料内部构成不同的影响,使率具有可比性E、起加权平均的作用40、在两样本率比较的X2检验中,无效假设H0的正确表达应为：CA、μ1≠μ2B、μ1=μ2 c、π1=π2 D、π1≠π2 E、B=C41、卡方检验中自由度的计算公式是：DA、行数×列数B、n-1C、N-kD、行数-1列数-1E、行数×列数-142、作四格表卡方检验,当N>40,且__________时,应该使用校正公式;EA、T<5B、T>5C、T<ID、T<5E、1<T<543、若X2≥X2 ν则：AA、P≤B、P≥C、P＜D、P＝E、P＞44、四个样本率作比较,x2>3,可以认为：AA、各总体率不同或不全相同B、各总体率均不相同C、各样本率均不相同D、各样本率不同或不全相同E、样本率与总体率均不相同45、构成比的重要特点是各构成部分的总和为BA、>100%B、=100%C、<100%D、=0E、随资料不同而变化46、从统计学的角度看,下列指标属于绝对数的是DA、甲区的急性传染病人数为乙区的倍B、甲区某年急性传染病的发病率为382/10万C、甲区占某市急性传染病的比重为18%D、某区某男身高168厘米。

方积乾《卫生统计学》1绪论和统计描述

在解释统计分析的结果以及下结论时, 务必对“因果”二字慎之又慎。
5. 设计与分析统计学方面的设计 (design)是医药卫生科研设计不可或缺的部分。设计不仅要符合统计学原则，运用统计学方法和技术，而且，在设计的时候要明确日后用什么统计方法处理数据。只有明确了设计的样式和分析的方法才得以进一步考虑数据应当如何收集、样本量应当多大。
第一节频率分布表与频率分布图
频数分布表（frequency distribution table）又称频数表
1. 离散型定量变量的频数分布例2-1 1998年某山区96名孕妇产前检查次数资料如下： 0， 3， 2， 0， 1， 5， 6， 3， 2， 4， 1， 0， 6， 5，1，3，3，…，4，7
G X 1 X 2 ... X n
n
G log
1
log X ( ) n
例2-5 7名慢性迁延性肝炎患者的HBsAg滴度资料为1:16，1:32，1:32，1:64， 1:64，1:128，1:512。试计算其几何均数。 G 7 16 32 32 64 64 128 512 64
学习目的与方法
（1）统计思维享用一生（2）理解概念是首位（3）重在理解和解释结果（4）电脑实验（5）考试 * 笔试：理论、方法不记公式，无数学推导，无复杂计算 * 上机考试：已做过的电脑实验；不编程序
第二章定量变量的统计描述
统计描述
----从数据中获取知识最直观的方法

把握数据的基本特征为统计分析打下基础统计表、统计图描述性统计量
1 * * M (X n X n ) 1 2 2 2
2
百分位数（percentile） PX

医学统计学课件：分类资料的统计描述

交叉表
交叉表是一种更为复杂的表格形式，可以展示两个或多个分类变量之间的关系，进一步分析变量之间的关联。
分层资料的统计描述
分层平均数
对于分层资料，可以使用分层平均数来描述各层内数据的平均水平，通过比较不同层的平均数，
可以了解各层之间的差异。
层间方差
层间方差是用来衡量不同层次间的变异程度，通过计算和比较层间方差，可以了解各层次之间的
辅助决策制定
准确的分类资料统计描述能够为决策制定提供有力支持，帮助决策者了解情况、制定合理方案。
分类资料统计描述的应用场景
临床研究
在临床研究中，分类资料统计描述常用于分析患者的疾病分布、治疗反应等。
流行病学
流行病学中，分类资料统计描述用于分析疾病的地区分布、人群特征等。
公共卫生
公共卫生领域中，分类资料统计描述用于监测和评估公共卫生状况、健康问题分布等。
动态数的计算与解读
动态数的计算
动态数是用来描述某一指标在不同时间点上的变化情况，通常通过将某一指标在不同时间点的数值进行对比来计算。例如，某医院某年的治愈率与前一年的治愈率之比。
动态数的解读
动态数的值越大，说明该指标的变化趋势越明显；反之，则越小。动态数可以用来预测未来的发展趋势，以及评估政策或措施的效果。
相对数与动态数的应用场景
相对数在医学研究中应用广泛，如比较不同地区、不同时间、不同人群的发病率、患病率、死亡率等指标，以了解疾病在特定人群中的分布和发生情况。
动态数在医学监测和流行病学研究中应用较多，如监测某种疾病的发病率、死亡率等指标的变化趋势，以及评估干预措施的效果等。
04
统计图表在分类资料中的应用
在制作箱线图时，应将数据按照数值大小进行排序，并使用合适的横轴和纵轴尺度。

卫生统计学试题3含答案

《医学统计方法》试题三：1.两样本均数比较，经t检验，差异有显著性时，P越小，说明：CA.两样本均数差异越大B.两总体均数差异越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E•样本均数与总体均数不同2.某自然保护区狮子的平均密度为每平方公里100只，随机抽查其中一平方公里范围内狮子的数量，假设进行100次这样的抽查，其中的95次所得数据应在以下那个范围内。

（B 为加减，为什么？）BA •5-195B •-119.6C •90-110D •95-105E •-125.83.抽样研究中，S为定值，假设逐渐增大样本含量，则样本：AA .标准误减小B .标准误增大C.标准误不改变D.标准误的变化与样本含量无关E.以上都对4.以下关于统计表的要求，表达错误的选项是：EA.标题位于表的上方中央B.不宜有竖线及斜线C.备注不必列入表内D.线条要求三线式或四线式E.无数字时可以不填5.在统计学中，参数的含义是：DA •变量B.参与研究的数目C.研究样本的统计指标D•总体的统计指标E.与统计研究有关的变量6 .某次研究进行随机抽样，测量得到该市120名健康成年男子的血红蛋白数，则本次研究总体为：CA.所有成年男子B .该市所有成年男子C .该市所有健康成年男子D •120名该市成年男子E •120名该市健康成年男子7.医学统计的研究内容是EA.研究样本B.研究个体C.研究变量之间的相关关系D•研究总体E •研究资料或信息的收集.整理和分析8.总体应该由DA.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成9.在统计学中，参数的含义是DA .变量B.参与研究的数目C.研究样本的统计指标D•总体的统计指标E.与统计研究有关的变量10.调查某单位科研人员论文发表的情况，统计每人每年的论文发表数应属于AA .计数资料B .计量资料C .总体D .个体E・样本11.统计学中的小概率事件，下面说法正确的选项是：BA.反复多次观察，绝对不发生的事件B.在一次观察中，可以认为不会发生的事件C.发生概率小于的事件D.发生概率小于的事件E.发生概率小于的事件12、统计上所说的样本是指：DA、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分E、总体中的每一个个体13、以舒张压为高血压，测量1000人，结果有990名非高血压患者，有10名高血压患者，该资料属〔〕资料。

卫生统计学第九章分类变量的检验

第二节率的比较
2 对上述2×3列联表，作检验：
（1）建立检验假设，确定检验水准
H
H
0
:
:
大骨节病区男、女性的膳食结构相同
1
大骨节病区男、女性的膳食结构不全相同
α=0.05 （2）检验统计量的选择与计算
( Aij Tij ) 2 Tij

2 i 1 j 1
R
C
=2.53
（3）确定 P 值，作出统计推断
（2）检验统计量的选择与计算
2
AT
2
T (7 8.00)2 (9 8.00)2 (24 23.00) 2 (22 23.00) 2 + 0.34 8.00 8.00 23.00 23.00
（3）确定 P 值，作出统计推断
2 2 =(2-1)×(2-1)=1， 0.025,1 = 5.02，可知 =0.34<5.02，则P >0.025，在自由度
（3）确定 P 值，作出统计推断
2 2 0.05,1 =3.84。本例 =14.82>3.84，即P<0.05。在 α=0.05水平上拒绝H ，接受H 。可
0
1
以认为两个病区大骨节病的检出率之间差别具有统计学意义，且泉水饮用区的检出率较高。
第二节率的比较
2 检验适用条件：
（1）若n ≥ 40，且任意一个格子的理论频数Tij ≥ 5，可直接使用检验公式。
第二节率的比较
2 3. 分割
多个率或多个频率分布比较的检验，当结论为拒绝 H 时，仅表示多组之间是有差别的。
2
0
若需明确究竟是哪两组之间存在差别，可做率的多重比较，将R×C表分割为若干个小的四格表进行检验。但在具体分割过程中，需根据比较的次数合理地修正检验水准α ，否则将人为地增大犯第Ⅰ类错误的概率。

卫生统计学重点笔记

医师资格考试蓝宝书预防医学之答禄夫天创作医学统计学方法第一节基本概念和基本步伐（非常重要）一、统计工作的基本步伐设计（最关键、决定成败）、搜集资料、整理资料、分析资料.总体：根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单元某一变量值的集合.总体的指标为参数.实际工作中,经常是从总体中随机抽取一定命量的个体,作为样本,用样本信息来推断总体特征.样本的指标为统计量.由于总体中存在个体变异,抽样研究中所抽取的样本,只包括总体中一部份个体,这种由抽样引起的不同称为抽样误差.抽样误差愈小,用样本推断总体的精确度愈高；反之,其精确度愈低.某事件发生的可能性年夜小称为概率,用P暗示,在0～1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件.二、变量的分类变量：观察单元的特征,分数值变量和分类变量.第二节数值变量数据的统计描述（重要考点）一、描述计量资料的集中趋势的指标有1.均数均数是算术均数的简称,适用于正态或近似正态分布.2.几何均数适用于等比资料,尤其是对数正态分布的计量资料.对数正态分布即原始数据呈偏态分布,经对数变换后（用原始数据的对数值lgX取代X）服从正态分布,观察值不能为0,同时有正和负.3.中位数一组按年夜小顺序排列的观察值中位次居中的数值.可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定命据资料的中心位置.不能求均数和几何均数,但可求中位数.百分位数是个界值,将全部观察值分为两部份,有X％比小,剩下的比年夜,可用于计算正常值范围.二、描述计量资料的离散趋势的指标1.全距和四分位数间距.2.方差和标准差最为经常使用,适于正态分布,既考虑了离均差（观察值和总体均数之差）,又考虑了观察值个数,方差使原来的单元酿成了平方,所以开方为标准差.均为数值越小,观察值的变异度越小.3.变异系数多组间单元分歧或均数相差较年夜的情况.变异系数计算公式为：CV=s/×100％,公式中s为样本标准差,为样本均数.三、标准差的应用暗示观察值的变异水平（或离散水平）.在两组（或几组）资料均数相近、怀抱单元相同的条件下,标准差年夜,暗示观察值的变异度年夜,即各观察值离均数较远,均数的代表性较差；反之,暗示各观察值多集中在均数周围,均数的代表性较好.（常考！）四、医学参考值的计算方法,单双侧问题,医学为95％医学参考值是指正凡人体或植物体的各种生理常数,由于存在变异,各种数据不单因人而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其摆荡的范围,即正常值范围.医学参考值的计算公式：①正态分布资料95％医学参考值：±1.96s（双侧）；+1.645s或 1.645s（单侧）,s为标准差.②百分位数法P2.5和P97.5（双侧）；P5或P95（单侧）.第三节数值变量数据的统计推断（重要考点）一、标准误,标准误与标准差和样本含量的关系标准差和标准误的区别.样本标准误即是样本标准差除以根号下样本含量.标准误与标准差成正比；与样本含量的平方根成反比.因此.为减少抽样误差,应尽可能保证足够年夜的样本含量.样本标准差与样本标准误是既有联系又有区另外两个统计量,二者的联系是公式：二者的区别在于：样本标准差是反映样本中各观测值X1,X2,……,Xn变异水平年夜小的一个指标,它的年夜小说明了对该样本代表性的强弱.样本标准误是样本平均数1,2,……的标准差,它是抽样误差的估计值,其年夜小说明了样本间变异水平的年夜小及精确性的高低.（掌握！）二、t分布和标准正态u分布关系均以0为中心左右两侧完全对称的分布,只是t分布曲线顶端较u分布低,两端翘.（v逐渐增年夜,t分布逐渐迫近u分布）.正态分布的特点：①以均数为中心左右两侧完全对称分布；②两个参数,均数u（位置参数）和s（变异参数）；③对称均数的两正面积相等.三、总体均数的估计样本统计量推算总体均数有两个重要方面：区间估计和假设检验.样本均数估计总体均数称点估计.总体均数区间估计（可信区间）的概念：按一定的可信度估计未知总体均数所在范围.其统计上习惯用95％（或99％）可信区间暗示总体均数μ有95％（或99％）的可能在某一范围.可信区间的两个要素,一为准确度,反映在可信度1α的年夜小,即区间包括总体均数的概率年夜小,固然愈接近1愈好；二是精度,反映在区间的长度,固然长度愈小愈好.在样本例数确定的情况下,二者是矛盾的,需要兼顾.总体均数可信区间的计算方法：1.当n小按t分布的原理用式计算可信区间为：±tα/2,vS2.当n足够年夜因n足够年夜时,t分布迫近μ分布,按正态分布原理.用式估计可信区间为：±μα/2S可信区间与医学参考值范围的区别：二者的意义和算法分歧.四、假设检验的步伐1.建立假设：H0（无效,两样本代表的总体均数相同）,H1（备择,两样原本自分歧总体）,当拒绝H0就接受H1,不拒绝就不接受H1.2.确定显著性水平：区分年夜概率和小概率事件的标准,通常取α=0.05.3.计算统计量：根据资料类型和分析目的选择适当的公式计算.4.确定概率P值：将计算获得的t值或u值查界值表获得P 值和α值比力.5.做出推断结论.｜t｜值、P值与统计结论五、两均数的假设检验（常考！）1.样本均数与总体均数比力 u检验和t检验用于样本均数与总体均数的比力.理论上要求样原本自正态分布总体实际中,只要样本例数n较年夜,或n小但总体标准差σ已知,就选用u检验.n较小且σ未知时,用于t检验.两样本均数比力时还要求两总体方差等.以算得的统计量t,按表所示关系作判断.2.配对资料的比力在医学研究中,经常使用配对设计.配对设计主要有四种情况：①同一受试对象处置前后的数据；②同一受试对象两个部位的数据；③同一样品用两种方法（仪器等）检验的结果；④配对的两个受试对象分别接受两种处置后的数据.情况①的目的是推断其处置有无作用；情况②、③、④的目的是推断两种处置（方法等）的结果有无分歧.v=对子数1；如处置前后或两法无分歧,则其差数d的总体均数应为0,可看作样本均数和总体均数0的比力.为差数的均数；为差数均数的标准误,Sd为差数的标准差；n为对子数.因计算的统计量是t,按表所示关系作判断.3.完全随机设计的两样本均数的比力亦称成组比力.目的是推断两样本各自代表的总体均数μ1与μ2是否相等.根据样本含量n的年夜小,分u检验与t检验.t检验用于两样本含量n1、n2较小时,且要求两总体方差相等,即方差齐.若被检验的两样本方差相差显著则需用t′检验.u检验：两样本量足够年夜,n>50.=v=(n11)+(n21)=n1+n22式中,为两样本均数之差的标准误,Sc2为合并估计方差（combined estimate variance）.算得的统计量为t,按表所示关系做出判断.4.Ⅰ型毛病和Ⅱ型毛病弃真,拒绝正确的H0为Ⅰ型毛病α暗示,若显著性水平α定为0.05,则犯Ⅰ型毛病的概率0.05；接受毛病的H0为Ⅱ型毛病,概率用β暗示,β值的年夜小很难确切估计.当样本含量一按时,两者反比,增年夜n,当α一按时,可减少β.1β称为检验效能或掌控度,其统计意义是若两总体确有分歧,按α水准能检出其差另外能力.客观实际拒绝H0 不拒绝H0H0成立Ⅰ型毛病（α）推断正确1αH0不成立推断正确（1β）Ⅱ型毛病（β）5.假设检验注意事项保证组间可比性；根据研究目的、资料类型和设计类型选用适当的检验方法,熟悉各种检验方法的应用条件；“显著与否”是统计学术语,为“有无统计学意义”,不能理解为“分歧是不是年夜”；结论不能绝对化.第四节分类变量资料的统计描述（一般考点）相对数是两个有关联事物数据之比.经常使用的相对数指标有构成比、率、相比较等.一、构成比暗示事物内部各个组成部份所占的比重,通常以100为例基数,故又称为百分比.其公式如下：构成比＝×100％该式可用符号表达如下：构成比＝×100％构成比有两个特点：（1）各构成部份的相对数之和为100％.（2）某一部份所占比重增年夜,其他部份会相应地减少.二、率用以说明某种现象发生的频率或强度,故又称频率指标,以100,1000,10000或100000为比例基数（K）均可,原则上以结果至少保管一位整数为宜,其计算公式为：率和构成比分歧之处：率的年夜小仅取决于某种现象的发生数和可能发生该现象的总数,不受其他指标的影响,而且各率之和一般不为1.率＝×K该式亦可用符号表达如下阳性率＝×K（若算阴性率则分子为A（））式中A（+）为阳性人数,A（）为阴性人数.三、相比较暗示有关事物指标之比较,常以百分数和倍数暗示,其公式为：相比较：甲指标/乙指标（或×100％）或用符号暗示为：A/B×K四、注意事项①构成比和率的分歧,不能以比代率；②计算相对数时,观察例数不宜过小；③率的比力注意可比性,特别是混杂因素的问题,有的话,可用标准化法和分层分析消除；④观察单元分歧的几个率的平均率不即是几个率的算术均数；⑤样本率或构成比的比力应做假设检验.第五节分类变量资料的统计推断（非常重要）一、率的抽样误差用抽样方法进行研究时,肯定存在抽样误差.率的抽样误差年夜小可用率的标准误来暗示,计算公式如下：σp=式中：σp为率的标准误,π为总体阳性率,n为样本含量.因为实际工作中很难知道总体阳性率π,故一般采纳样本率P来取代,而上式就酿成Sp=二、总体率的可信区间由于样本率与总体率之间存在着抽样误差,所以也需根据样本率来推算总体率所在的范围,根据样本含量n和样本率P的年夜小分歧,分别采纳下列两种方法：（一）正态近似法（常考！）当样本含量n足够年夜,且样本率P和（1P）均不太小,如nP 或n（1P）均≥5时,样本率的分布近似正态分布.则总体率的可信区间可由下列公式估计：总体率（π）的95％可信区间：p±1.96sp总体率（π）的99％可信区间：p±2.58sp（二）查表法当样本含量n较小,如n≤50,特别是P接近0或1时,则按二项分布原理确定总体率的可信区间,其计算较繁,读者可根据样本含量n和阳性数x参照专用统计学介绍的二项分布中95％可信限表.三、u检验（非常重要！）当样本含量n足够年夜,且样本率P和（1P）均不太小,如nP 或n（1P）均≥5时,样本率的分布近似正态分布.样本率和总体率之间、两个样本率之间差另外判断可用u检验.1.样本率和总体率的比力公式 u=｜Pπ｜/σP=｜Pπ｜/；2.两样本率比力公式u=｜P1P2｜/Sp1P2=｜P1P2｜/也可用χ2检验,两者相等.四、χ2检验（非常重要！）可用于两个及两个以上率或构成比的比力；两分类变量相关关系分析.其数据构成,一定是相互对峙的两组数据,四格表资料自由度v永远=1.四格表χ2检验各种公式适用条件,n>40且每个格子T>5,可用基本公式或专用公式,不用校正.基本公式：χ2=∑（AT）2/T专用公式：χ2=∑（adbc）2n/（a+b）（c+d）（a+c）（b+d）只要有一个格子T在1～5之间,需校正.校正公式：基本公式：χ2=∑（｜AT｜0.5）2/T专用公式：χ2=∑（｜adbc｜n/2）2n/（a+b）（c+d）（a+c）（b+d）n<40或T<1,用确切概率法.五、行×列表χ2检验当行数或列数超越2时,称为行×列表.行×列表χ2检验是对多个样本率（或构成比）的检验.适用条件：一般认为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数.1.当理论数太小可采用下列方法处置①增加样本含量以增年夜理论数；②删去上述理论数太小的行和列；③将太小理论数所在组与性质相近的组合并,使重新计算的理论数增年夜.由于后两法可能会损失信息,损害样本的随机性,分歧的合并方式有可能影响推断结论,故不宜作惯例方法.另外,不能把分歧性质的实际数合并,如研究血型时,不能把分歧的血型资料合并.2.如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说有分歧,但不能说明它们彼此之间都有分歧,或某两者间有分歧.3.关于单向有序行列表的统计处置在比力各处置组的效应有无分歧时,宜用秩和检验法,如作χ2检验只说明各处置组的效应在构成比上有无不同.六、配对计数资料的χ2检验同一样品用两种方法处置,观察阳性和阴性个数.判断两种处置方法是否相同.当b+c>40时,χ2=（bc）2/b+c；b+c<40时,校正公式：χ2=（｜bc｜1）2/b+c第六节直线相关和回归（一般考点）一、直线相关分析的用途、相关系数及其意义相关分析是研究事物或现象之间有无关系、关系的方向和密切水平.相关系数：是定量暗示两个变量（X,Y）之间线性关系的方向和密切水平的指标,用r暗示,r=lxy/,其值在1至+1间,r 没有单元.r呈正值,两变量间呈正相关,即两者的变动趋势是同向的,r=1时为完全正相关；如r呈负值,两变量呈负相关,即两者的变动趋势是反向的,r=1时为完全负相关.r的绝对值越接近1,两变量间线性相关越密切；越接近于0,相关越不密切.当r=0时,说明X和Y两个变量之间无直线关系.二、直线回归分析的作用、回归系数及其意义直线回归分析的任务在于找出两个变量有依存关系的直线方程,以确定一条最接近于各实测点的直线,使各实测点与该线的纵向距离的平方和为最小.这个方程称为直线回归方程,据此方程描绘的直线就是回归直线.直线同归方程式的一般表达式Y=a+bX式中a为回归直线在Y轴上的截距,即a>0暗示直线与Y轴的交点在原点上方,<0在原点下方,a=0过原点.b为样本回归系数,即回归直线的斜率,暗示当X变动一个单元时,Y平均变动b个单元.b>0：暗示Y随X增年夜而增年夜b<0：暗示Y随X增年夜而减少b=0：暗示Y不随X变动而变动第七节统计表和统计图（重要考点）一、统计表原则：结构简单、条理分明、内容安插合理、重点突出、数据准确.1.题目简练表达表的中心内容,位置在表的上方.2.标目有横标和纵标目,横标目通常位于表内左侧；纵标目列在表内上方,其表达结果与主辞呼应.3.线条力求简洁,一般为三线表.4.用阿拉伯数暗示,如无数据或暂缺资料,也可用“”或“…”来暗示.5.备注一般不列入表内,解释在表下.内容排列：一般按事物发生频率年夜小顺序来排列,比较鲜明,重点突出.二、统计图1.线图（line diagram）（常考！）资料性质：适用于连续变量资料.分析目的：用线段的升降表达某事物的静态（差值）变动.2.半对数线图（semilogarithmic line graph）资料性质：适用于连续变量资料.分析目的：用线段的升降表达事物的发展速度变动趋势.3.直方图（histogram）资料性质：适用于数值变量,连续性资料的频数表资料.分析目的：直方图是以直方面积表达各组段的频数或频率.4.直条图（bar chart）资料性质：适用于彼此自力的资料.分析目的：直条图是用等宽直条的和长短来暗示各统计量的年夜小,进行比力.5.百分条图（percentchart）资料性质：构成比.分析目的：用长条各段的长度（面积）表达内部构成比.6.圆形图（circulargraph）（常考！）资料性质：构成比.分析目的：用圆的扇形面积表达内部构成比.7.散点图（scatterdiagram）资料性质：双变量资料.分析目的：用点的密集度和趋势表达两变量间的相关关系.8.统计舆图（statistical map）资料性质：地区性资料.分析目的：用分歧纹线或颜色代表指标高低,说明地区分布.。

卫生统计学试题及答案

卫生统计学题库

卫生统计学题库最佳选择题1.收集资料的方法是：EA.收集各种报表B.收集各种工作记录C.进行专题调查D.进行科学实验E.以上都对2.统计工作的基本步骤是：DA.调查资料、审核资料、整理资料B.收集资料、审核资料、分析资料C.调查资料、整理资料、分析资料D.收集资料、整理资料、分析资料E.以上都对3.在抽样研究中样本是：DA.总体中的一部分B.总体中任意一部分C.总体中典型部分D.总体中有代表性的一部分E.总体中有意义的一部分4.计量资料、计数资料和等级资料的关系是：CA.计量资料兼有计数资料和等级资料的一些性质B.计数资料兼有计量资料和等级资料的一些性质C.等级资料兼有计量资料和计数资料的一些性质D.计数资料有计量资料的一些性质E.以上都不是5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度，宜绘制D：A.普通线图B.直方图C.构成比直条图D.半对数线图E.直条图6.直方图可用于：A.某现象的内部构成B.各现象的比较C.某现象的比较D.某现象的频数分布E.某现象的发展速度7.统计图表的要求是：A.简单明了B.层次清楚C.说明问题明确D.避免臃肿复杂E.以上都对8.在列频数表时，分组数目一般为：A.5-10B.8-15C.10-30D.15-20E.＞20 9.平均数作为一种统计指标是用来分析：A.计数资料B.计量资料C.等级分组资料D.调查资料E.以上都不对10.表示变量值变异情况的常用指标是：A.全距B.标准差C.方差D.变异系数E.以上均是 11.确定正常人某个指标正常值范围时，调查对象是：A.从未患过病的人B.健康达到了要求的人C.排除影响被研究指标的疾病和因素的人D.只患过小病但不影响研究指标的人E.排除了患过某病或接触过某因素的人 12.标准误：A.与标准差呈反比B.与标准差呈正比C.与标准差的平方呈反比D.与标准差平方呈正比E.以上都不对13.是指：A.所有观察值对总体均数的离散程度B.某一个样本均数的离散程度C.所有样本均数对总体均数的离散程度D.某些样本均数对总体均数的离散程度E.所有含量相同的样本均数对总体均数的离散程度14.表示：A.95%的正常值范围B.95%的可信区间C.99%的正常值范围D.99%的可信区间E.以上都不对 15.构成比通常以下列哪项指标为比例基数：A.100%B.1000‰C.10000/万D.100000/10万E.视具体情况而定 16.一事物各构成比部分相对数之和应为：A.大于1B.小于1C.等于1D.不一定E.以上都不对17.正态曲线下，横轴上从–∞到的面积为（）xσ 2.58XX S ± 1.96μσ+A 、95%B 、45%C 、97.5%D 、47.5%E 、不能确定 18. 进行统计分析的资料必须是（）A 、完整、准确、及时的B 、随机取得的C 、满足条件齐同的D 、数量足够的E 、以上都对 19.指出下列变量中哪一个指标为统计量A.B. C.μ D.π E.β20.计算样本率的抽样误差适用公式为：E.以上都不对21.R ×C 表的检验的自由度为：A. B. C. D. E.22.实验设计的基本原则为A.齐同原则B.随机原则C.对照原则D.重复原则E.以上都是 23.在相关分析中：A.越接近1，散点图越集中 B.越接近0，散点图越集中C.，散点图越集中D.，散点图越集中E.以上全不对24.已知，则一定有：A. B. C. D. E.25.相关分析的主要内容包括：A.确定变量间的数量关系B.确定变量之间有无关系C.确定变量之间有无因果关系D.确定变量之间关系的密切程度E.以上都不是26.在配对法秩和检验中，共有8对数据，且差值中没出现0，，则：p σ(1)p p n-(1)(1)p p n --(1)nππ-(1)(1)n ππ--2χ1R -1C -1RC -(1)(1)R C --2R C ⨯-rr0r <0r >1r =1b =1a =,0Y X S =,Y X YS S =,Y X XS S =27T -=T +=A. -3B.9C.-9D.-27E.3027.配对比较的秩和检验的基本思想是：如果假设检验成立，则对样本来说：A.正秩和的绝对值大于负秩和的绝对值B.正秩和的绝对值小于负秩和的绝对值C.正秩和的绝对值与负秩和的绝对值不会相差很大D.正秩和的绝对值与负秩和的绝对值相等E.正秩和的绝对值与负秩和的绝对值相差很大28.在成组设计两样本比较的秩和检验中，甲组中最小数据有2个（0.2，0.2），乙组中最小数据也有2个（0.2，0.2），则数据0.2 的秩次为：A.2B.3C.4.5D.2.5E.3.529.当第二类错误β由0.2变到0.3时，则第一类错误α是：A.增大B.减小C.不确定D.不变化E.以上都不对30.下列指标除了哪项均为疾病统计指标：A.治愈率B.某病病死率C.某病死亡专率D.感染率E.发病率31．计算某抗体滴度的平均水平，一般宜选择（）A、算术均数B、几何均数C、中位数D、百分位数E、极差32．统计推断的内容（）A、是用样本指标估计相应的总体指标B、是检验统计上的“假设”C、估计正常值范围D、A、B均不是E、A、B均是33．比较身高与体重的变异程度宜用的指标是（）A、标准差B、标准误C、四分位间距D、变异系数E、全距34．观察值 2、 5、 10、 7、 9、 8、 20、 100的平均数是（）A、20.14B、6.15C、8.5D、 20E、1035．当n一定时，第二类错误β由0.2变到0.3时，第一类错误（）A 、增大B 、减小C 、不确定D 、不变化E 、以上都不对 36．两小样本计量资料比较的假设检验，应首先考虑（）A 、用检验B 、用检验C 、用秩和检验D 、资料符合检验还是秩和检验的条件E 、任选一种检验方法37．抽样误差指的是（）A 、个体值与总体值之差B 、样本统计量之间及样本统计量与总体参数值之差C 、个体值与统计量值之差D 、总体参数值与总体参数值之差E 、以上都不对 38．同一双变量资料进行直线相关与回归分析，有（） A 、 B 、 C 、 D 、E 、与的符号无关39．用均数和标准差可全面描述下列哪项资料的特征（） A 、正偏态分布 B 、负偏态分布 C 、正态分布 D 、非对称分布40．四个样本率作比较，，可认为（）各总体率不等或不全相等 B 、各总体率均不相等 C 、各样本率均不相等 D 、各样本率不等或不全相等 E 、各总体率相等二、填空题1、统计工作的基本步骤是（）、（）、（）。

卫生统计学第01章绪论

第01章绪论第一节概述【统计学】※(statistics)：统计学是处理数据中变异性的科学与艺术，内容包括数据的收集(collection)、分析(analysis)、解释（interpretation)和表达（presentation），目的是求得可靠的结果。

第四版教材中概念：是研究数据的收集、整理、分析和推断的一门科学。

第二节医学统计资料的来源与分类基本概念：【变量及变量值】※：研究者对每个观察单位的某项特征进行观察和测量，这种特征称为变量，变量的测得值叫变量值（也叫观察值），也称为【资料】。

①定性变量分为：分类变量（无序分类变量）或名义变量包括：多分类变量、二分类变量有序变量（有序分类变量）或等效变量②定量变量分为：离散型变量（有缝隙）：只能取整数值连续型变量（无缝隙）：在实数轴上是连续的按变量值的性质可将资料分为：定性资料定量资料1.【定性资料】（分类资料、分类变量）定义：将全体观测单位按照某种性质或特征分组，然后再分别清点各组观察单位的个数。

特点：①没有度量衡单位②多为间断性资料（通过枚举或记数得来）2.【定量资料】（计量资料、数值变量）定义：通过度量衡的方法，测量每个观察单位的某项研究指标的量的大小，得到的一系列数据资料。

特点：①表现为数值大小②有度量衡单位③多为连续性资料（通过测量得到）3.【等级资料】（有序变量）定义：介于计量资料和计数资料之间的一种资料，通过半定量方法测量得到。

特点：①每一个观察单位没有确切值②各组之间有性质上的差别或程度上的不同。

第三节统计学中常用的几个基本概念1.总体与样本【总体】：根据研究目的确定的同质的、所有观察单位的某种变量值的集合。

【样本】：从总体中随机抽取的、具有代表性的部分研究对象，其实测值的集合。

2.随机抽样为了保证样本的可靠性和代表性，需要采用随机的方法抽取样本（在总体中每个个体具有相同的机会被抽到样本中）。

3. 同质与变异【同质】：研究对象具有的相同的状况或属性等共性称同质或同质性；【变异】：对于同质的各观察单位，其某变量值之间的差异，称为变异。

人群健康研究的统计学方法(四)考试答案和讲义

人群健康研究的统计学方法（四）1、率表示（）A、某现象发生的频率或强度B、事物内部各组成部分所占的比重或分布情况C、两个有联系指标之比D、某事物内部各组成部分出现的频率2、以下关于率的抽样误差代表意义描述错误的是（）A、率的抽样误差越小，说明率的标准误越小B、率的抽样误差越小，用样本推论总体时，可信程度越低C、率的抽样误差越小，用样本推论总体时，可信程度越高D、率的抽样误差越大，说明率的标准误越大3、相对比=A/B，说明（）A、A为B的若干倍或百分之几B、A、B两个指标只可以为绝对数C、性质肯定相同D、肯定是定性资料4、以下关于应用相对数时的描述正确的是（）A、分析时可以以构成比代替率B、观察单位数不等的几个率的平均率，不能将这几个率直接相加求其均值C、所比较资料的内部构成不一定相同D、样本率或构成比的比较不必进行假设检验5、（）在表的左侧，表明被研究事物的主要特征，相当于句子的主语A、备注B、标题C、纵标目D、横标目人群健康研究的统计学方法（四）北京大学公共卫生学院刘爱萍一、分类变量资料的统计分析（一）分类变量资料的统计描述1 ．相对数常用的指标及其意义相对数主要涵盖：率、构成比和相对比。

率是表示某现象发生的频率或强度，常用百分率、千分率、万分率或十万分率等表示。

它的计算公式是：（实际发生某现象的观察单位数 / 可能发生该现象的观察单位总数）×比例基数。

构成比是说明事物内部各组成部分所占的比重或分布情况，用百分数表示。

构成比 = （事物内部某一组成部分的观察单位数 / 同一事物各组成部分的观察单位总数）× 100% 。

构成比的特点有 : 它的值在 0 和 1 之间变动。

当某一部分构成比发生变化时，其他部分的构成比也相应地发生变化。

相对比是指两个有联系指标之比（ A/B ），常以百分数或者倍数表示。

它说明 A 是 B 的若干倍或百分之几，指标可以是绝对数，也可以是相对数，性质可以相同，也可以不同，可以是定性资料，也可以是定量资料。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

男
女
52.0
48.0
51.8
48.2
51.2
48.8
51.4
48.6
51.5
48.5
51.5
48.5
51.7
48.3
51.5
48.5
51.0
49.0
50.8
49.2
51.1
48.9
51.0
49.0
51.0
49.0
51.6
48.4
性比例
108.2 107.3 104.9 105.9 106.0 106.0 107.0 106.3 104.2 103.3 104.0 104.1 104.0 106.7
卫生工作好坏年龄
粗死亡率（crude mortality rate) 上海９．０‰ 深圳６．０‰
可编辑版
16
表 2 某三甲医院与某乡镇医院急性心肌梗塞治愈率比较
严重程度
轻重合计
某三甲医院
治愈人数治疗人数
16
20
48
80
64
100
治愈率(%) 80 60 64
某乡镇医院
治愈人数治疗人数
可编辑版
18
例4-4 表4-3是甲、乙两县的食管癌死亡率（1/10万），试对两
县的食管癌死亡率进行比较，得出正确的结论。
1975年
92 420
47 564
44 856
1980年
98 705
50 785
47 920
1985年
105 851
54 725
51 126
1990年
114333
58 904
55 429
1995年
121121
61808
59313
1996年
122389
62200
60189
1997年
123626
63131
60495
1998年
124810
63629
61181
1999年
125909
64189
61720
2000年
126583
65355
61228
注：本表包括大陆31个省、自治区、直辖市人口数和现役军人数字。
资料来源：《2000年中国统计年鉴》；2000年数字摘自第五次人口普查资料，以下各表同。
可编辑版
比重(％)
可编辑版
6
构成比（proportion）构成比说明事物内部各组成部分所占的比重，常用百分数表示，又称为百分比。计算公式为：
构成比＝该某事事物物内内部部某各一组组成成部部分的分观的察观单察位单总位数数 1 0 0 ％
乙市200 HIV/AIDS N2=2000,000 P2=10/10万
可编辑版
3
第一节相对数
两个有联系的指标之比，称相对数（relative number），包括
➢ 率(rate) ➢ 构成比(proportion) ➢ 相对比(ratio)
可编辑版
4
一、常用相对数
率（rate）率又称频率指标。它说明在一定条件下，某现象发生的频率或强度。
12
二、应用相对数的注意事项
计算相对数时分母不宜过小分析时不能以构成比代替率正确计算合计率或平均率注意相对数的可比性样本率或构成比的比较应作假设检验
可编辑版
13
口腔卫生状况（1）良好者中等者不好者合计
表 4-2 某中学各类口腔卫生状况者的患龋情况
调查人数（2）
患龋人数（3）
率＝可实能际发发生生某某现现象象的的观观察察单单位位总数数 K
可编辑版
5
例4-1 某市2000年年中平均人口数为 3,657,681人，白血病发病人数为98人，
则该市2000年白血病发病率为(983，657， 681)×100 000／10万＝2.67／10万。
患龋百分比（％）患龋率（％）
（4）
（5）
2056
361
24.4
17.6
2160
635
43.1
29.4
963
479
32.5
49.7
5179
1475
100.0
32.2
可编辑版
14
第三节标准化法(standardization)
可编辑版
15
为什么要进行率的标准化？
如要比较上海和深圳两地区卫生工作谁优谁劣，通常用两地人口的死亡率大小来确定
相对比＝A指标/B指标（或×100％）
可编辑版
11
人口普查中最典型的对比指标-性比例
全国人口数
实有数(万人)
总计
男
女
1949年
54 167
28 145
26 022
1957年
64 653
33 469
31 184
1965年
72 538
37 128
35
1970年
82 992
42 686
40 306
可编辑版
7
疾病（1）恶性肿瘤脑血管病呼吸系统病损伤和中毒心脏病消化系统病合计
表 4-1
某地 2001 年 6 种慢性疾病构成比（％）
病例数
构成比
（2）
（3）
2455
32.29
1792
23.57
1584
20.83
752
9.89
725
9.53
296
3.89
7604
100.00
可编辑版
8
构成比：表示事物内部构成大小的指标，某类事物所有构成比之和为100%，资料较易获得。
可编辑版
10
相对比（relative ratio）相对比是指A、B 两个有关的指标之比，简称比，用以描述两者的对比水平，说明A指标是B指标的几倍或百分之几。两个指标可以是绝对数、相对数或平均数；可以性质相同，也可以性质不同。
56
80
8
20
64
100
治愈率(%) 70 40 64
可编辑版
17
一、标准化法的意义和基本思想
标准化法: 就是指在一个指定的标准构成条件下进行率的对比的方法。两组率进行比较时，如果两组资料内部各小组的率明显不同，而且各组观察单位的构成比也存在差别，并足以影响结论时，则不能直接比较两组的总率。通常采用率的标准化法消除这种影响，再作对比。
外周血白细胞类型
中性粒细胞淋巴细胞单核细胞嗜酸粒细胞嗜碱粒细胞杆状核粒细胞
某病人外周血白细胞比例（%） 81 11 4 3 0 1
正常值范围
50~70 20-40
3-8 2~6 0~1 1~4
可编辑版
9
率与构成比概念的区别
率：分母中的每一员都有相同的可能性称为分子；表示事物发生强度或频率的指标；率的人群资料很难获得；
第四章分类资料的统计描述
可编辑版
1
在调查或实验研究中清点分类资料得到的数据被称为绝对数。绝对数是研究客观事物或现象本质的基本信息，不便于相互之间进行比较，因此，根据研究目的对分类资料计算相应的相对数指标，以便进行统计学描述和分析。
可编辑版
2
甲市100例HIV/AIDS N1=1000,000 P1=10/10万

卫生统计学分类变量资料的统计描述

国开01337实用卫生统计学任务1答案

卫生统计学试题二答案

卫生统计学知识点(笔记)

卫生统计学名词解释

卫生统计学重点总结

卫生统计学试题及答案

卫生统计学

卫生统计学题库

方积乾《卫生统计学》1绪论和统计描述

医学统计学课件：分类资料的统计描述

卫生统计学试题3含答案

卫生统计学第九章 分类变量的检验

卫生统计学重点笔记

卫生统计学试题及答案

卫生统计学题库

卫生统计学第01章 绪论

人群健康研究的统计学方法(四)考试答案和讲义

卫生统计学第九章分类变量的检验

卫生统计学第01章绪论