卫生统计学学习指导与习题集

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


1
卫生统计学学习指导与习题集 第一章 绪论 【教学要求】
了解医学统计学的发展史统计学与公共卫生的关系。
熟悉统计学习的目标与方法
掌握统计学基本概念总体与样本、同质与变异、变量的类型、参数与统计量。
【重点难点】 第一节 医学中统计思维的进化
第二节 统计学与公共卫生互动推动 一、 统计学是公共卫生专业人员的得力工具 公共卫生是群体科学应用统计探索群体规律。
统计抽样技术设计群体调查掌握人群的卫生状况和需求
统计描述反映疾病和卫生资源的分布特征
统计推断偶然性的背景中识别危险因素、评价卫生措施、进行科学决策。 二、 现代公共卫生领域对统计学的挑战 公共卫生不仅应用统计学而且不断提出新要求和新问题是现代统计学研究和发展的
巨大功力。 第三节 统计学的若干概念 一、 总体与样本 总体是根据研究目的确定的同质研究对象的全体按研究对象来源又有目标总体和研究总体。 样本是指从研究总体中抽取的一部分有代表性的个体。
抽样研究的目的是用样本推断总体。 二、 同质与变异 同质是指同一总体中个体的性质、影响条件或背景相同或非常相近。 变异是指同质的
个体之间存在的差异。 统计学的任务是在变异的背景上描述同一总体的同质性揭示不同
总体的异质性。 三、 变量的类型




定量变量可分为离散型变量和连续型变量。
变量类型可以转化定量→有序→分类→二值。注意转化方向只能由信息量多向信息量少。 四、 参数与统计量 参数是指反映总体特征的统计指标。 五、 设计与分析 统计设计是医药卫生设计科研不可或缺的部分。统计设计包括抽样方法、统计学原则、分类变量
定性变量
定量变量 {
变量 {
有序变量
2

统计方法数据如何收集、样本量多大等统计学内容。设计决定了统计分析的方法。统计设计
和统计分析是不可分割的两项内容。 六、 因果与联系 探究因果关系首先考虑是否存在联系。但存在联系未必有因果联系因为存在大量的混
杂因素。单靠统计学分析大多只能考虑变量之间的联系难于证明因果联系。 第四节 目标与方法 一、 基本概念方法与技能 正确理解基本概念、掌握常用的设计和经典的分析方法、学会用统计软件完成有关计算。 二、 教与学的方法 应用是根本目的理解概念与动手实践才是根本。要结合生活经验、医学实际来教与学。
借助统计学实验理解统计现象与理论借助案例讨论从反面吸取教训。
【补充习

题】
一、选择题
一 A1题
每一道题下面有A、B、C、D、E五个被选答案请从中选择一个最佳答案。
1. 下面的变量中属于分类变量的是B
A.脉搏 B.血型 C.肺活量 D.红细胞计数 E.血压
2. 下面的变量中属于定量变量的是B
A.性别 B.体重 C.血型 D.职业 E.民族
3.某人记录了50名病人体重的测定结果小于50kg的13人介于50kg和70kg间的
20人大于70kg的17人此种资料属于A
A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义
变量资料
4.上述资料可以转换为C
A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义
变量资料
5.若要通过样本作统计推断样本应是C
A.总体中典型的一部分 B.总体中任一部分
C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分
E.总体中信息明确的一部分
6.统计量(E)
A.是统计总体数据得到的量
B.反映总体统计特征的量
C.是根据总体中的全部数据计算出的统计指标
D.是用参数估计出来的
E.是由样本数据计算出的统计指标
7.因果关系(C)
A.就是变量间数量上的联系 B.可以用统计方法证明
C.必定表现为数量间的联系 D.可以通过单独考察两个变量间关系得出
E.可以通过变量间数量上的联系来证明
二A2型
每一道题以一个小案例出现其下面都有A、B、C、D、E五个备选答案请从中选择
3

一个最佳答案。
1. 教材中提及美国人1954年实施了旨在评价Salk疫苗预防小儿麻痹或死于脊髓灰质
炎效果的临床试验。有180万儿童参与约有1/4参与者得到了随机化。这180万
儿童是C
A.目标总体 B.研究总体 C.1份样本 D.1份随机样本
E.180万份样本
2.上述试验最终肯定了索尔克疫苗的效果。请问此结论是针对C而言。
A.180万儿童 B.每个儿童 C.所有使用索菲克疫苗的儿童 D.所有
儿童 E.180万儿童中随机化的1/4
二、是非题
1.定量变量、分类变量和有序变量可以相互转换。 ×
2.假变量可以参与计算所以假变量是定量变量。 ×
3.离散变量在数值很大时。单位为“千”或“万”时可以取小数值此时可接近地视为
连续型变量 √
4.同质的个体间不存在差异。 ×
5.如果个体间有变异则它们一定不是来自同一总体。 ×



























4
第二章 定量资料的统计描述 【重点难点】 第一节 频率分布表与频率分布图 一、离散型定量变量的频率分布 对离散型定

量变量变量值的取值是不连续的。直接清点各变量值出现的频数即为频
率分布表。离散型定量变量的频率分布图可用直方图表达以各等宽矩形直条的高度表示各
频率的多少。 二、连续型定量变量的频率分布 对连续型定量变量变量值的取值是连续的将数据适当分组清点各组的频数即为
频率分布表。连续型定量变量的频率分布图可用直方图表达。即纵坐标为频率密度即频率
/组距直方图的面积之和等于1. 三、频率分布表图的用途 频率分布表图可以揭示资料的分布类型如对称分布或偏峰分布也可以描述资料
的分布特征即集中趋势和离散趋势便于发现某些特大和特小的可疑值便于进一步计算
指标和统计分析。 第二节 描述集中趋势的统计指标 对于连续型定量变量平均数是应用最广泛、最重要的一个指标体系它常用于描述一
组同质观察值的集中趋势反映一组观察值的平均水平。常用的平均数有3种算数均数、
几何均数和中位数。 一、算术均数 意义算术均数简称均数常用μ表示总体均数

表示样本均数。反映全部数量观察
值的平均数量水平。
适用条件适用于对称分布资料尤其正态或近似正态分布资料。
计算1.直接法基于原始数据









其中n为样本含量为观察值。
2. 频率表法也叫加权法基于频率表资料



  
其中 f为组段的频数为组段的中值=组段上限+组段下限/2。 二、几何均数 意义几何均数以符号G表示常用来反映一组含多个数量级数据的集中位置。
适用条件适用于原始观察值分布不对称但经对数转换后呈对称分布的资料如对数
正态分布资料。观察值间常呈倍数关系或变化范围跨越多个数量级。
计算1.直接法基于原始数据


 或 


2.频率表法也称加权法基于频率表资料
5






三、中位数
意义中位数常用符号M表示是指将原始观察值从小到大排序后位次居中的那个
数即理论上有一半的观察值低于中位数一般都观察值高于中位数。
适用条件中位数适用于各种分布的资料特别是偏峰分布资料、分布末端无确定值的
资料等。
计算1.直接法基于原始数据
将n例观察值从小到大排列第i

个数据用
表示。
n为奇数时



n为偶数时









2.百分位数法基于频率表资料
百分位数常用符号表示是排序后的全部实测值的某百等份分割值即在全部实测值
中有x%个体观察值比它小有1-x%个体观察值比它大。中位数就是一个特定的百分位数
即M=。
=L+
(n*x%-)
其中L为欲求的百分位数所在组段的下限i为该组段的组距为截止至L的累计频数
为该组段内的频数n为总频数。 四、众 数
意义全部实测值中出现次数最多的数值即为众数。 第三节 描述离散趋势的统计指标 同一总体中不同个体存在的差异称为变异。为比较全面地把握资料的分布特征不仅需
要了解数据的集中位置而且需要了解数据的离散程度。常用的描述离散趋势的统计量包括
极差、四分位数间距、方差、标准差和变异系数。
一、极 差
意义极差也称全距。样本量接近的同类资料比较极差越大意味着数据间变异越大。
极差只考虑数据的最大值和最小值所以用极差反映数据的变异程度常常比较粗略和不稳定。
计算R=最大值—最小值
适用条件资料不限。
二、四分位数间距
意义四分位数间距表示百分位数和百分位数之差理论上与之间恰好包
括总体中间50%的个体观察值。同类资料比较Q越大意味着数据间变异越大。用四分位
数间距反映数据的变异程度比极差稳定。
计算Q=—
其中和的求法参见前述百分位数求法。
适用条件四分位数间距可用于各种分布资料特别对偏峰分布资料常把中位数和四
分位数间距结合起来描述资料的集中趋势和离散趋势。
6

三、方 差
意义方差考虑了全部观察值的变异程度。总体方差用表示定义为观察值离均差
平方和的算术均数样本方差用表示是总体方差的无偏估计。同类资料比较时方差越大意味着数据间变异度越大。
计算总体方差=
μ
样本方差=



适用条件见标准差。
四、标 准 差
意义方差的算术平方根称为标准差。总体标准差用表示样本标准差用S表示。标
准差的量纲与原变量一致故实际应用中常使用标准差。同类资料比较时标准差越大意味
着观察值间变异度越大。
计算总体标准差=

μ


样本标准差S=





其中n-1称为自由度。
适用条件方差和标准差都适用于对称分布的资料特别对正态分布或近似正态分布资
料常把均数和标准差结合起来全面描述的集中趋势和离散趋势。
五、变 异 系 数
意义变异系数用CV表示为标准差与算术均数之比是一个不带量纲的相对数。
计算

×100%
适用条件方差和标准差都适用于对称分布的资料特别对正态分布或近似正态分布资
料常把均数和标准差结合起来全面描述资料的集中趋势和离散趋势。
第四节 描述分布形态的统计指标
一、偏度系数
意义理论上总体偏度系数为0时分布是对称的取正值时分布为正偏峰取负值
时分布为负偏峰。
计算SKEW=




二、峰度系数
意义理论上正态分布的总体峰度系数为0取负值时其分布较正态分布的峰平阔取
正值时其分布较正态分布的峰尖峭。
计算KURT=




【补充练习题】
选择题
一A1型
每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1.用频率表计算平均数时各组的组中值应为E
A本组段变量值的平均数 B.本组段变量值的中位数
7

C.本组段的上限值 D.本组段的下限值
E.本组段上限值+本组段下限值/2
2.离散型定量变量的频率分布图可以用B表达。
A.直方图 B.直条图 C.百分条图 D.箱式图 E.复式条图
3.变异系数越大说明E。
A.标准差越大 B.平均数越大 C.标准差、平均数都大
D.平均数小 E.以均数为准变异程度大
4.均数和标准差的关系是D
A.均数越大标准差越小
B.均数越大标准差越大
C.标准差越大均数对各变量值的代表性越好
D.标准差越小均数对各变量值的代表性越好
E.均数和标准差都可以描述资料的离散趋势
5.把, , 标在一个数轴上则E
A. 一定在和的中间 B. 一定不在和的中间
一定靠近一些 一定靠近一些
E.以上都不是
二A2型
每一道题以一个小案例出现其下面有A、B、C、D、E五个备选答案,请从中选择一
个最佳答案。
1.已知某疾病患者10人的潜伏期天分别为6,1

3,5,9,12,10,8,11,8,>20,其潜伏期的平
均为B天。
A.9 B.9.5 C.10 D.10.2 E.11
2.已知某地一群7岁男童身高均数为100cm标准差为5cm体重均数为20kg标准差
为3kg,则身高和体重的变异程度有C
A.身高的变异程度大于体重的变异程度
B.身高的变异程度等于体重的变异程度
C.身高的变异程度小于体重的变异程度
D.身高的变异程度与体重的变异程度之比为5:3
E.因单位不同无法比较
3.测定10名正常人的脉搏次/分结果为68,79,75,74,80,79,71,75,73,84.则10名正常
人的脉搏标准差为B
A.4.73 B.22.4 C.75.8 D.75.0 E.1.50
4.测定5人的血清滴度为12,14,1:16,1:32则5人血清滴度的平均水平为D
A.1:4 B.1:8 C.1:11.6 D.1:6.96 E.1:16
5.测得200名正常成年男子的血清胆固醇值mmol/L为进行统计描述下列说法不
正确的是E
A.可用频率表法计算均数 B.可用直接法计算均数
C.可用直接法计算标准差 D.可用加权法计算标准差
E.可用直条图表示频率分布图
三A3/A4型
以下提供若干案例每个案例下设若干道题目。请根据题目所提供的信息在每一道题
下面的A、B、C、D、E五个备选答案中选择一个最佳答案。
8

第1~2题共用题干
调查测定某地107名正常人尿铅含量mg/L如下
尿铅含量0 4 8 12 16. 20 24 28 合计
例数 14 22 29 18 15 6 1 2 107
1描述该资料的集中趋势宜用 B 。
A均数 B中位数 C几何均数 D众数 E极差
2描述该资料的离散趋势宜用C。
A极差 B方差 C四分位数间距 D标准差 E变异系数
四B1型
以下提供若干组题目每一组题目前列出A、B、C、D、E五个备选答案请从中为每
一道题目选择一个最佳答案。某个备选答案可被选择一次、多次或不被选择。
(14题共用备选答案)
A.极差 B四分位数间距 C标准差
D变异系数 E中位数
1比较7岁男童与17岁青年身高的变异程度宜用D。
2描述近似正态分布资料个体观察值的离散趋势宜用C。
3描述偏峰分布资料个体观察值的变异程度宜用B。
4描述分布末端无确定值资料的离散程度宜用B。
(58题共用备选答案)
A中位数 B均数 C几何均数 D极差 E众数
5反映一组等比资料集中趋势的指标宜用C 。
6反映一组偏峰分布资料的平均水平宜用A。
7样本中出现次数最多的观察值称为E。
8

描述近似正态分布资料的集中位置宜用B。


















9
第三章 定性资料的统计描述 【教学要求】
掌握常用相对数指标相对数应用的注意事项动态数列及其指标标准化法的基
本思想直接法的计算及间接法中SMR的意义标准化法的注意事项。
熟悉医学人口统计和疾病统计中常用指标的意义。
【重点难点】
第一节 三类相对数
一、频率与频率分布
定性资料经过分类汇总整理的频数表称为频率分布表。定性资料的变量形式有多分类
变量和二分类变量均可以通过频率分布表描述其分布特征。定性资料的分布特征通常可以
描述为某一类别的频数在总频数中所占比重。
根据研究目的不同定性资料频率分布表的表达形式可以不同例如可以将某一事物的
所有类别的频率列在同一张表中也可以将某事物的其中一个类别的频率与其他事物相同类
别的频率列在同一张表中。
二、常用的相对数指标
常用相对数有三种计算公式不同其意义也不同。表3-1列出常用三种相对数的公式
和意义。
三、应用相对数应注意的事项
1理解相对数的含义不可望文生义 三种相对数的定义有明确的区别但在实际应用
中常错误解释相对数的计算结果尤其频率型指标和强度型指标常被混淆。对于相对数
的统计指标读者必须认真思考其定义辨别其性质切不可望文生义。
表3-1 常用相对数的公式和意义
相对数指标 公式 意义
频率
发生某现象的观察单位数
可能发生某现象的观察单位总数

指某现象发生的
频率或事物内部
某个组成部分所
占的比重或分布
强度
某事件发生的观察单位数

可能发生某事件的观察单位数时间

指单位时间内某
现象发生的频率
相对比



两个有关联的指
标A与B之比

2频率型指标的解释要紧扣总体与属性 本实习指导的配套教材的第三章中的表1至
表3的数据均属于频率型指标但由于表达的总体和属性不同结果的解释亦不同。 
3计算相对数时分母应有足够数量确保研究结果的稳定性。
4正确地合并估计频率或强度型指标 分别合计各组的分子和分母后再计算合计
的指标不可将分组的频率或强度取平均数作为合并的频率或速率。
5相对数间的比较要具备可比性 主要应注意观察的对象是否同质研究的方法如
检测手段、抽样方法是否相同观察的时间是否一致等在被比较的总体之间与研究指


有关的其他因素是否一致或接近。
6对相对数的统计推断从样本估计值推断总体的相对数也应当考虑抽样误差需要进
10

行参数估计和假设检验。
第二节医学人口统计常用指标
一、医学人口统计资料的来源
医学人口统计资料的主要来源为日常工作记录报告单、卡、册、统计报表和人
口调查三个方面见表3-2。
表3-2医学人口统计资料的来源
资料来源 意义和内容
日常工作记录
指人口事件发生后有关部门按常规报告制度所做的原始记录从公安部
门、卫生部门、计划生育部门和疾病控制中心均可得到。特别是对出生
死亡、胎儿死亡等生命事件的法定登记是研究人口自然变动、推算人口
数以及反映人口健康水平的基础资料

统计报表
是从原始报告单、卡、册上的数据过录整理后的一种汇总表也可以作为
较好的原始记录用于医学人口统计关系较为密切的统计报表有出生统计
报表、死因统计报表、妇幼卫生统计报表

人口调查
根据统计需要和目的做一些定期或不定期的专项调查。调查的方法通常
有普查和抽样调查。其中①人口普查为计算许多人口学指标提供了最基
本的人口数资料。②抽样调查是对人口问题进行广泛深入的研究获得内
容丰富的
资料

二、描述人口学特征的常用指标
描述人口学特征的常用指标主要指人口总数和人口构成指标常用指标及其意义列于
表3-3。
表3-3人口学特征的常用指标及其意义
常用指标 意 义
人口总数 根据资料整理的特点人口总数分为时点人口数指一个国家或地
区在某一特定时间的人口数时期人口数指某一时期或某一年
的平均人口数。平均人口数常用作计算出生率、死亡率、发病率等
指标的分母

人口金字塔 是将人口的性别和年龄资料结合起来以图形的方式表达人口的性
别和年龄构成。它以年龄为纵轴人口构成作为横轴左侧为男
右侧为女而绘制的两个相对应的直方图。人口金字塔形象直观地反
映了现有男女性别人口的年龄构成而且也可以分析过去人口的出
生死亡情况以及今后人口的发展趋势

老年人口系数 指65岁或60岁及以上人口占总人口的比重用于反映人口是
否老化及老化的程度。可作为划分人口类型的尺度

少年儿童人口系数 指14岁及以下少年儿童人口占总人口的比重从另一侧面反映人
11

口老化程度的指标。其大小主要受生育水平的影响

负担系数 指每100名劳动年龄人口所负担的非劳动年龄人口数反

映了劳动
年龄人口与非劳动年龄人口之问的关系。一般以1564岁者为劳
动人口014岁和65岁及以上者为非劳动人口或被抚养人口

老少比 指65岁及以上老年人口与14岁以下的少年儿童人口之比表示每
100名少年儿童对应多少老年人是划分人口类型的标准之一

性别比 指以女性人口为100男性人口与女性的比值。如果性别比大于100
表示男性人口多于女性人口小于100表示女性人口多于男性人口。
常用的有出生性别比、年龄别性别比及全人口性别比。出生性别比
一般在104107之间


三、生育和人口死亡的常用指标
一生育的常用指标
测量生育的指标可以分为出生率、生育率和人口再生产三类其中常用的生育率指标
有3个人口再生产指标有3个将这些常用指标及其意义列于表3
-4。
表3.4有关生育的常用指标及其意义
常用指标 意 义
粗出生率
也称普通出生率。表示某年某地平均每千人口的活产数是反映一个
国家和地区的人口自然变动的基本指标。受人口年龄性别构成的影响

总生育率
也称普通生育率表示某年某地平均每千名育龄妇女的活产数它反
映育龄妇女总的生育水平。该指标受育龄妇女内部年龄构成的影响

年龄别生育率
表示平均每千名某年龄组育龄妇女的活产数可以直接比较不同地区
的年龄别生育率但不能概括一个地区的整体生育水平

总和生育率
当年龄分组为1岁一组时将年龄别生育率从15岁累加到49岁止
得到1549岁年龄别生育率的总和即称总和生育率。若年龄分组
为5岁一组时则年龄别生育率之和再乘5即得总和生育率。表示
每1000名妇女一生平均生多少个孩子或每个妇女一生平均生多少
个孩子。总和生育率是用某年横断面的年龄别生育率资料计算的因
此消除了人口的年龄性别构成对生育水平的影响不同时间、不同地
区的总和生育率可以直接进行比较

自然增长率
表示人口自然增长的情况常被用来粗略的估计人口增长趋势。它的
计算为粗出生率(CBR)与粗死亡率(CDR)之差

粗再生育率 计算与总和生育率极为近似不同的地方是活产数特指女婴数故粗
12

再生育率实际是只计算女婴的总和生育率。表示按某时的生育模式生
育一个妇女一生平均生育的女儿数用来评价人口再生产趋势

净再生育率
在粗再生育率的基础上扣除了049岁的死亡。即扣除了母亲一代所
生的女儿中049岁的死亡数剩下的即为真正能取代母亲一代的女
儿数。NRR-1说明母亲二代所生的女儿

数恰能取代母亲数未来人
口数将保持恒定r NRR>1表示母亲一代所生的女儿敷大于母亲数
未来人口数将增加NRR<1则未来人口数将减少


二死亡统计指标
死亡统计指标有测量死亡水平及死因分析两类将一些常用指标及其意义列于表3-5.
表3-5 常用死亡统计指标及其意义
常用指标 意 义
粗死亡率
称普通死亡率、总死亡率指某地某年平均每千人口巾的死亡数说明人
群中总的死亡水平。粗死亡率的水平受人口年龄性别结构的影响。比较各
国家或地区间死亡率水平时可以用年龄别死亡率或按年龄标化计算标
准化死亡率
年龄别死亡率 指某年某年龄别平均每1000人口中的死亡数
婴儿死亡率
指某年某地每1000名活产中未满1周岁婴儿的死亡数是衡量一个国家
卫生文化水平较敏感的指标
新生儿死亡率 指某年某地每1000名活产中未满28天的新生儿死亡数
5岁以下儿童死
亡率
某年某地5岁以下儿童死亡数与同年出生活产数之比综合反映儿童健康
水平和变化的主要指标
孕产妇死亡率
指某年中由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生活
产数之比以万分率或十万分率表示。孕产妇死亡率也是一个反映国家或
地区社会经济发展、卫生保健状况的敏感指标
死因别死亡率
某年平均每10万人口中死于某病的人数说明某种疾病对居民健糜危害
程度是死因分析的重要指标。通常用标准化死因别死亡率进行各国家或
地区间比较
死因构成及死
因顺位
指死于某类死因的人数占全部死亡人数的百分比说明各种死因的相对重
要性。死因顺位是将各类死因按死因构成比的大小由高到低排列顺位可
以反映主要死因及各类死因的相对重要性

第三节疾病统计常用指标
疾病统计是从数量方面研究疾病在人群中的发生、发展和流行分布的特点与规律为
病因学研究、防治疾病和评价防治工作效果提供科学依据。
一、疾病统计资料的来源
疾病报告和报表资料包括国家规定的疾病报告和报表以及某些部门规定的一些重要
慢性病报告。这些表格规范内容标准统一。
医疗卫生工作记录包括各种医疗记录门诊病历、住院病历等。
疾病专题调查资料包括健康检查、疾病普查和疾病抽样调查等获得的资料。
二、疾病和死因分类
13

疾病命名是要对每一种法定疾病情况给以确切的名称即标准化的术语并使其对另外
的疾病具有不可混淆的、明确的位置以便于全世界的医务工作者具有共同的医学语言。
疾病分类是在

疾病命名法的基础上考虑到对疾病的认识及防治需要将一些具有共
同特性的疾病归纳在一起加以分类。
1853年国际统计学会着手编制了统一的疾病名称和死因分类先是在欧洲使用。1893
年开始建立国际疾病和死因分类(ICD)以后每10年修订一次。现在国际上使用的是ICD
的第十次修订本(简称ICD-10)共三卷自1993年1月1日起生效。
三、疾病统计指标
疾病统计的单位可以用病人也可以用病例。前者反映在观察期内一个人是否转变为
病人后者一个人每发生一次疾病就算一个病例。一个病人可以先后患数次同一种疾病或
同时患数种不同的疾病。疾病统计常用指标见教材表3-8。
发病率与患病率发病率表示一定时期内在可能发生某病的一定人群中新发生某病
的强度。分子中的新发病例数是指新发生某种疾病以第一次就诊为准。由于该病未愈继
续就诊者称为“旧病例”不再算作新病例。患病率是指某时点上受检人数中现患某种疾病
的频率其分子包括新、旧病例。通常用于描述病程较长或发病时间不易明确的疾病的患病
情况如慢性病在某一时问横断面的患病情况。因此患病率与发病率要注意分子的区别。在
一定的人群和时问内发病率(IR)、患病率PR和病程(D)的关系是PR= IR×D。
第四节粗率的标准化法
一、标准化法的意义和基本思想
标准化法只适用于两组粗率进行比较时由于某因素在两组的内部构成不同并有可能
影响到粗率的情况。标准化法的基本思想是采用统一标准构成以消除某因素的内部构成不
同对粗率的影响使通过标准化后的标准化率具有可比性。
二、标准化率的计算
主要有直接法和间接法两种现以死亡率的年龄构成标准化为例说明标准化率的计算
见表3—6。
表3-6直接标准化率与间接标准化率的计算
直接法 间接法
计算公式


或 








算法特点 实际上是的加权均数权重是标准人口
年龄的频率分布
实际上是对原粗死亡率的校
正校正系数为标准化死亡比
SMR
选择标准 年龄别人口数或年龄别人口构成比作标


年龄别死亡率作标准
适用资料 已知各年龄组死亡率 已知总死亡数和年龄别人口
数r及或各年龄组人口
数较小年龄别死亡率不稳定


三、应用标准化的注意事项
1标准化法的应用范围很广。标准化法适用于“某事件的发生率”可以是治愈率也
可以是患病率还可以是

发病率、病死率等。当某个分类变量在两组中分布不同时这个分
14

类变量就成为两组频率比较的混杂因素标准化法的目的就是消除这个混杂因素的影响。
2标准化后的标准化率已经不再反映当时当地的实际水平它只是表示相互比较的
资料间的相对水平。
3由于选择的标准人口不同算出的标准化率也不同比较的结果也未必相同因此
报告比较结果时必须说明所选用的“标准”和理由。
4两样本标准化率是样本值存在抽样误差。比较两样本的标准化率当样本含量较
小时还应作假设检验。
第五节 动态数列及其分析指标
动态数列(dynamic series)是一系列按时间顺序排列起来的统计指标可以是绝对数、相
对数或平均数用以说明事物在时间上的变化和发展趋势。动态数列分析建立在相对比基
础上采用定基比和环比两种方式不仅可分析过去某事物的发生规律而且可以为预测将
来的发生情况提供参考。
一、绝对增长量
绝对增长量是说明事物在一定时期增长的绝对值。其中累积增长量是指报告年的指标
与某一固定年基期水平指标之差逐年增长量是指报告年的指标与前一年指标之差。
二、发展速度与增长速度
意义发展速度与增长速度均可按照定基比和环比的方式进行计算。定基比发展速度
是用报告期的指标与某一时期固定为基期指标之比环比发展速度是用报告期的指标与
其上一期指标之比。
计算公式定基比发展速度= 
式中为报告期指标为基期指标。
环比发展速度=
式中为报告期指标为报告期的上一期的指标。
定基比环比增长速度=定基比环比发展速度% -100%
=定基比环比发展速度-1
应用发展速度表示报告期指标的水平相当于基期水平的百分之多少或若干倍增长
速度表示的是净增加量。
三、平均发展速度和平均增长速度
意义平均发展速度是各环比发展速度的几何平均数说明某事物在一个较长时期中
逐年平均发展变化的程度。平均增长速度是各环比增长速度的几何均数说明某事物在一个
较长的时期中逐年平均增长的程度。
计算公式平均发展速度=


式中为基期指标为第n年指标。
平均增长速度=平均发展速度-1
【思考与练习参考答案】
1名词解释与简答题
(1)频率型指标与强度型指标的主要区别指标的解释不同频率型指标是表示事物内
部某个组成部分所占的+比重

或分布或指某现象发生的频率。强度型指标是指单位时间
内某现象发生的频率。两种指标计算式的分子和分母的含义不同。
(2)人口金字塔是将人口的性别和年龄资料结合起来以图形的方式表达人口的性别
15

和年龄构成。它以年龄为纵轴人口数构成为横轴左侧为男右侧为女而绘制的两个相对
应的直方图可以分析过去人口的出生死亡情况以及今后人口的发展趋势。 
(3)婴儿死亡率是何种类型的相对数指标是频率型的指标。
(4)总和生育率假定同时出生的一代妇女按照某年的年龄别生育水平度过其一生的
生育历程各年龄别生育率之和乘以年龄组组距就是这一代妇支平均每人可能生育的子女
数。
(5)比较发病率与患病率死亡率与病死率发病率表示一定时期内在可能发生某病
的一定人群活过的总人年中新发生的某病病例数其分子是新病例数分母是总人年数
患病率又称现患率指某时点上受检人数中现患某种疾病的人数通常用于描述病程较长
或发病时间不易明确的疾病的患病情况其分子包括新旧病例数分母是受检总人数6在一
定的人群和时间内发病率和患病率有密切关系两者与病程(D)的关系是PR=IR×D粗
死亡率与发病率及粗病死率的关系是CDR=IR×CFR。
死亡率与病死率的分子是一样的均表示因某病死亡的人数但死亡率的分母是总人
年数侧重反映死亡发生的强度或单位时间内死亡的概率病死率的分母是患某病的人数
反映疾病死亡的概率。
(6)标准化法的基本思想采用统一标准构成以消除某因素的内部构成不同对总率的影
响使通过标准化后的标准化率具有可比性。
(7)动态数列按时间顺序将一系列统计指标可以为绝对效相对数或平均数排列
起来用以观察和比较该事物在时间上的变化和发展趋势。
2计算思考题
表3-8某地人口构成情况
年龄组
岁
男% 女% 性别比 年龄组
岁
男% 女% 性别比
0~ 4.2 4.0 1.05 45~ 2.4 2.7 0.89
5~ 3.2 3.1 1.03 50~ 2.1 2.4 0.78
10~ 4.4 4.2 1.05 55~ 1.2 2.2 0.55
15~ 5.5 5.3 1.04 60~ 1.3 2.4 0.54
20~ 5.1 5.2 0.98 65~ 1.1 1.4 0.79
25~ 6.0 6.1 0.98 70~ 0.8 1.2 0.67
30~ 4.3 4.5 0.96 75~ 0.5 0.9 0.56
35~ 3.2 3.3 1.00 80~ 0.2 0.5 0.40
40~ 2.3 2.5 0.92 85~ 0.1 0.2 0.50

(1)各年龄组性别比见表3-8该地19岁以前男性多于女性但从20岁以后则女性比男
性多。
(2)育龄妇女1549岁占总人口的百分比29. 6%。
(3)总负担系数42. 86%。
(4)老年人口系数6.9%。
【补充练习题】
选择题


一Al型
每一道题下面有A、B、C、D、E五个备选答案请从中选择一个最佳答案。
1某医院某年住院病人中胃癌患者占5%则B。
16

A5%是强度指标 B. 5%是颇率指标
C5%是相对比指标 D5%是绝对数
E5%说明胃癌在人群中的严重性
2计算麻疹疫苗接种后血清检查的阳转率分母为C 。
A麻疹易感人群 B.麻疹患者数
C麻疹疫苗接种人数 D麻疹疫苗接种后的阳转人数
E麻疹疫苗接种后的阴性人数
3某病患者120人其中男性114人女性6人分别占95%与5%则结论为D。
A该病男性易得 B该病女性易得
C该病男性、女性易患程度相等 D尚不能得出结论
E根据该资料可计算出男女性的患病率
4某地区某种疾病在某年的发病人数为以后历年为?则该疾病发病
人数的年平均增长速度为D。
A. B

 C.


D.

 —1 E.


5某部队夏季拉练发生中暑21例其中北方籍战士为南方籍战士的2.5倍则结论
为C。
A北方籍战士容易发生中暑
B南方籍战士容易发生中暑
C尚不能得出结论
D北方、南方籍战士都容易发生中暑
E北方籍战士中暑频率比南方籍战士高
6定基比与环比指标是E。
A构成比 B平均数 C频率
D绝对数 E相对比
7一项新的治疗方法可延长病人的生命但不能治愈该病则最有可能发生的情况是
A。
A该病的患病率增加 B该病的患病率减少 C该病的发病率增加
D该病的发病率减少 E该病的发病率与患病率均减少
8要比较甲乙两厂某工种工人某种职业病患病率的高低采取标准化法的原理是C。
A假设甲乙两厂的工人构成比相同
B假设甲乙两厂患某职业病的工人数相同
C假设甲乙两厂某工种工人的工龄构成比相同
D假设甲乙两厂某职业病的患病率相同
E假设甲乙两厂某职业病的构成相同
二A2型
每一道题以一个小案例出现其下面都有A、B、C、D、E五个备选答案请从中选
择一个最佳答案。
1某人欲计算本地人群某年某病的死亡率对分母的平均人口数的算法最好是D。
A年初的人口数
B年末的人口数
17

C调查时的人口数
D上年年终的人口数加本年年终的人口数

之和除以2
E普查时登记的人口数
2某市有30万人口2002年共发现2500名肺结核患者全年总死亡人数为3000人
其中肺结核死亡98人要说明肺结核死亡的严重程度最好应用E。
A粗死亡率 B肺结核死亡人数 C肺结核死亡率
D肺结核死亡构成 E肺结核的病死率
3在一项研究的最初检查中人们发现3044岁男女两组人群的冠心病患
病率均为4%于是认为该年龄组男女两性发生冠心病的危险相同。这个结论是B。
A正确的
B不正确的因为没有区分发病率与患病率
C不正确的因为没有可识别的队列现象
D不正确的因为用百分比代替率来支持该结论
E不正确的因为没有设立对照组
三A3/A4型
以下提供若干案例每个案例下设若干道题目。请根据题目所提供的信息在每一道题
下面的A、B、C、D、E五个备选答案中选择一个最佳答案。
第14题共用题干
某省级市抽样调查了1999年1月1日至2001年12月31日部分城乡居民脑卒中发病
与死亡情况年平均人口数为1923224人其中城镇976087人农村为947137人在城镇
的病例数为1387人死亡人数941人农村病例数为816人死亡人数为712人。
1根据该资料城镇居民脑卒中年发病率为A。
A47.37/10万 B86.15/10万 C.142/10万
D48.93/10万 E72. 1210万
2据该资料城镇居民脑卒中的病死率为B。
A87. 2596 B67. 84% C.96.41/10万
D48. 93/10万 E85. 95/10万
3据该资料农村居民脑卒中的年死亡率为D。
A75. 17/10万 B67.84% C.37.02/10万
D25. 06/10万 E48. 93/10万
4据该资料该市城乡居民脑卒中的年死亡率为E。
A67. 84% B.75.03% C.96.41/10万
D85. 95/10万 E.28.65/10万
四B1型
请从A、B、C、D、E五个备选答案中选择一个与问题关系最密切的答案。某个备选
答案可能被选择一次、多次或不被选择。
(13题共用备选答案)
A绝对数 B频率型指标 C强度型指标
D相对比指标 E率差
1环比定基比发展速度是D。
2某病期间患病率是B。
3老年负担系数是D

18
第四章 统计表与统计图 【教学要求】
掌握常用统计表简单表和复合表以及统计图直方图、圆图、线图和半对数线
图的制作方法及其各自的使用条件。
熟悉利用统计图描述定量资料的基本方法制作统计图表的基本要求和规则。
了解常见统计图表如何通过电脑来

实现。
【重点难点】
第一节 统计表
将统计数值或统计指标用表格的形式列出称为统计表。
一、统计表的结构
统计表包括标题、标目、线条、数字和备注五部分。
列表原则重点突出、简单明了、主谓分明、层次清楚。
二、统计表的种类
根据分类标记的多少统计表可分为简单表和复合表。简单表只按单一变量分组复
合表由两个或两个以上变量结合起来分组。
三、编制统计表应注意的事项
表格结果要简明重点突出使人一目了然要合理安排主语和谓语的位置表内数
据要准确可靠。
第二节 统计图
将统计数值或统计指标用图形的方式表示称为统计图。
一、绘制统计图的基本要求
1根据资料的性质和分析目的选择合适的图形。
2给予适当的位于统计图下方的标题。
3涉及坐标系的统计图如直条图、线图等横轴的方向应自左向右纵轴应自下向
上均应有标目。纵横坐标长度的比例一般为57。
4对图中不同事物用不同图案或颜色加以区别时应附上图例。
二、常用统计图形的绘制方法及注意事项
1条图 用等宽直条的长度来表示参与比较的指标的大小有单式和复式两种。所比
较的数值可以是绝对数也可以是相对数。在直条的顶端绘制一小段触须代表标准差的大小。
绘制要点表示指标数值的坐标尺度必须从0点开始等间距中间不能折断各直条
间宽度应相等间隙宽度也应一致直条所表示的类别应有图例说明。
2百分条图 用于表示事物中各部分的比重或构成。可以将多组数据排列在一起便于
比较。
绘制要点先绘制一个标尺尺度为0100绘制一直条以直条的长度大小表示数
量的百分比直条各部分用线分开各段需用不同颜色或线条表示并标出所占的百分比
并附上图例。
3圆图 圆图的用途与百分条图相同它用圆的面积表示事物的全部用各扇形的面
积来表示各个组成部分。
绘制要点先绘制一圆形由于圆周为°每1%相当于°;圆内各部分按事物自
然顺序或百分比的大小顺序排列圆中各部分用线分开各部分可注明简要文字和百分比
也可用不同颜色或线条表示并附上图例。
19

4线图 线图是用线段的升降来表示统计指标的变化趋势或某现象随另一现象的变
迁情况适用于连续型变量资料。
绘制要点普通线图的纵横轴都是算术尺度纵横的尺度可以不从0开始一般纵横
比例为5:7左右坐标内点的位置要适当不应将折线绘制成平滑的曲线

若有两条以上的
线条时要用不同颜色或线型加以区别附上图例。
5半对数线图半对数线图用于表示事物的发展速度相对比。其纵轴为对数尺度
横轴为算术尺度使线图上的数量关系变为对数关系。
6散点图 散点图用点的密集程度、趋势表示两变量间的相关关系。其绘制方法与线
图类似只是点与点之间不用直线连接。
7直方图 直方图常用于表示连续型变量资料的频数或频率分布。常用横轴表示被观
察对象用纵轴表示频数或频率。
绘制要点纵轴的刻度必须从0点开始普通直方图各矩形直条的高度代表频数或频
率宽度为组距组距应相等各直条面积等于相应组段的频率各直条之间不留空隙。
8统计地图统计地图主要用于表示某种疾病在地域空间上的分布根据不同地方某种
疾病的发病率、患病率或死亡率情况采用不同密度的线条或不同颜色绘在地图上有助于
分析疾病的地理分布特征为进一步病因学或其他研究提供线索。
9箱式图 箱式图用于描述连续型变量资料的分布特征它表现连续型变量资料的5
个百分位数即P2.5、P75、P50、P75、P97.5。由P25和P75构成箱式图的“箱”体部分
P2.5P25、P75P97.5分别构成“箱子”的上下两条“触须”。
【补充练习题】
一、选择题
Al型
每一道题下面有A、B、C、D、E五个备选答案请从中选择一个最佳答案。
1根据某地616岁学生近视情况的调查资料反映患者的年龄分布可
用C。
A普通线图 B半对数线图 C直方图
D直条图 E复式直条图
2表达某地两年几种疾病的患病率可用C。
A直方图 B单式直条图 C复式直条图
D线图 E百分直条图
3统计表中不应当出现的项目为A。
A备注 B横标目 C纵标目
D线条 E数字
4欲比较两家医疗机构近1 5年来床位数的增加速度应当使用的统计图
为D。
A复式条图 B百分条图 C线图
D半对数线图 E统计地图
二、简答题
1依次写出箱式图中涉及到的各个取值。
答由大到小的次序为极大值、P75、中位数、P25和极小值。
2直方图中各矩形的高度等于频数或频率对吗
答对于各组距相等的情形该说法是对的。若某些组段的组距与多数组段所取
组距不同时例如前者是后者的k倍则该不等距组段的高度为频数或频率除以k。确
20

切地说组段对应的面积等于频数或频率。
3统计表的列表原则是

什么
答一是重点突出简单明了二是主谓分明层次清楚符合逻辑。
4线图和半对数线图的主要区别是什么
答线图的纵轴尺度为算术尺度用以表示某指标随时间的变化趋势
半对数线图的纵轴尺度为对数尺度用以表示某指标随时间的增长或减少速度。
5绘制圆图时对应扇形的大小是如何决定的
答设总体的构成部分其构成比由大到小依次为P1P2?Pk。则第一个扇
形的圆心角为360°×P1余类推依次画出k个扇形。一般起点由钟表12点位置开始。


































21
第五章 常用概率分布 【教学要求】
掌握三个常用概率分布的概念二项分布及Poisson分布的概率函数与累计概率、正
态分布的分布函数的计算方法医学参考值的计算。
熟悉三个常用概率分布的特征。
了解质量控制的意义、原理和方法
【重点难点】
第一节 二项分布
一、二项分布的概念与特征
基本概念如果每一个观察对象阳性结果的发生概率均为π阴性结果的发生概率均
为1-π而且各个观察对象的结果是相互对独立的那么重复观察n个人发生阳性
结果的人数的概率分布为二项分布记作Bn, π
二项分布的概率函数P(X)=
ππ
二项分布的特征二项分布图的形态取决于π与n高峰在μ=nπ处。当π接近0.5时
图形是对称的π离0.5愈远对称性愈差但随着n的增大分布趋于对称。
二项分布的总体均数为μ=nπ
方差为=nπ(1-π)
标准差为σ=

ππ
如果将出现阳性结果的频率记为p=

则p的总体均数为π
标准差为σ=
ππ

二、二项分布的应用
二项分布出现阳性的次数至多为k次的概率为

P(X≥k)=


=







ππ
出现阳性的次数至少为愚次的概率为
P(X≤k)=


=







ππ
第二节 Poisson分布
一、Poisson分布的概念与特征
基本概念Poisson分布可以看作是每个观察对象阳性结果的发生概率π很小而观察
例数行很大时的二项分布。除二项分布的三个基本条件以外Poisson分布还要求π接近于
0。有些情况π和n都难以确定只能以观察单位时间、空间、面积等内某种稀有事件
的发生数X来近

似。
Poisson分布的概率函数
P(X)=

22

式中λ=nπ为Poisson分布的总体均数X为观察单位内某稀有事件的发生次数e
为自然对数的底λ为常数约等于2.71828。
自然对数的底又为常数约等于2. 71828。
Poisson分布的特征
Poisson分布当总体均数λ值小于5时为偏峰λ愈小分布愈偏随着λ增大分布趋
向对称。
Poisson分布的总体均数与总体方差相等均为A且Poisson务布的观察结果具有可加
性。
特点凡个体有传染性、聚集性均不能视为二项分布或Poisson分布。
二、Poisson分布的应用
如果某稀有事件发生次数的总体均数为A那么发生次数至多为k次的概率为
P(X≤k)=


=





发生次数至少为k次的概率为
P(X≥k)=1-P(X≤k-1)
第三节 正态分布
一、正态分布的概念
基本概念正态分布是自然界最常见的一种分布正态分布的特点是中间频数最多
两边频数渐少且对称。
正态分布的概率密度函数
f(X)=






其中μ为总体均数σ为总体标准差。
正态分布密度曲线的特点
(1)关于x=μ对称。
(2)在x=μ处取得该概率密度函数的最大值在x=μ±σ处有拐点表现为钟形曲线。
(3)曲线下面积为1。
(4) μ决定曲线在横轴上的位置μ增大曲线沿横轴向右移反之μ减小曲线沿
横轴向左移。
(5) σ决定曲线的形状当μ恒定时σ越大数据越分散曲线越“矮胖”σ越小
数据越集中曲线越“瘦高”。
二、正态曲线下面积的分布规律
标准正态分布总体均数为0、总体标准差为l的正态分布称为标准正态分布用N(0.1)
表示。
对任意一个服从正态分布N(uσ)的随机变量X经过如下的标准化变换
Z=

可以转变为标准正态分布。
正态曲线下而积的分布规律 由标准正态分布曲线下面积分布表给出。标准正态分布
的分布函数值等于标准正态曲线下Z值左侧的面积记作Φz。
按正态分布规律标准正态曲线下面积分布规律为
单侧PZ≤— 或 P(Z≥)= α
23

双侧P
Z≤—P(Z≥)= α
三、正态分布的应用
(一)确定医学参考值范围
基本概念医学参考值范围是指特定的“正常”人群排除了对所研究指标有影响的
疾病和有关因素的特定人群的解剖、生理、生化指标及组织代谢产物含量等数据中大多数
个体取值所在的范围。

人们习惯用该人群中95%的个体某项医学指标的取值范围作为该指
标的医学参考值范围。
计算方法确定医学参考值范围的方法有两种
(1)百分位数法双侧95%医学参考值范围是P2.5P97.5单侧范围是P95以下如
血铅、发汞或P5以上如肺活量。该法适用于任何分布类型的资料。
(2)正态分布法若X服从正态分布医学参考值范围还可以依正态分布规律计算。正
态分布资料双侧医学参考值范围一般按下式作近似估计


± 1. 96S
其中 

和S分别为样本的均数和标准差。
二二项分布、泊松分布的正态分布近似
1二项分布的正态近似 随着n的增大二项分布趋于对称。理论上可以证明当n
相当大时只要π不太靠近0或1特别是当n1-π都大于5时二项分布近似于正态
分布。
由于二项分布为离散型变量分布为了借用连续型变量的分布函数计算概率要对概
率函数作校正。
二项分布累计概率的正态近似计算公式为
P(X≤K)=








P(X≥k)=








2Poisson分布的正态近似 随着总体均数又的增大Poisson分布趋向对称。理论上
可以证明随着λ→∞Poisson分布也渐近正态分布。一般当λ≥20时Poisson分布资
料可按正态分布处理。
和二项分布相同Poisson分布也是离散型变量分布。为了借用连续型变量的分布函数
计算概率也要对概率函数作校正。校正后Poisson分布的正态近似计算方法为
P(X≤k)=




)
P(X≥k)=1-P(Xk)≈1- 


P(


 


【补充练习题】
一、选择题
一Al型
每一道题下面有A、B、C、D、E五个备选答案请从中选择一个最佳答案。
1随机变量X服从正态分布N (
)Y服从正态分布N()X与Y独立
则X-Y服从__C__。
24

AN+
- BN--
CN-
+ DN+
E.以上均不对
2标准正态分布的均数与标准差分别是(A)。
A. 01 B.10 C.0, 0 D.1,1 E.0.5,1
3正态分布的两个参数μ与σ__C__对应的正

相关文档
最新文档