卫生统计学学习指导与习题集
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
卫生统计学学习指导与习题集 第一章 绪论 【教学要求】
了解医学统计学的发展史统计学与公共卫生的关系。
熟悉统计学习的目标与方法
掌握统计学基本概念总体与样本、同质与变异、变量的类型、参数与统计量。
【重点难点】 第一节 医学中统计思维的进化
第二节 统计学与公共卫生互动推动 一、 统计学是公共卫生专业人员的得力工具 公共卫生是群体科学应用统计探索群体规律。
统计抽样技术设计群体调查掌握人群的卫生状况和需求
统计描述反映疾病和卫生资源的分布特征
统计推断偶然性的背景中识别危险因素、评价卫生措施、进行科学决策。 二、 现代公共卫生领域对统计学的挑战 公共卫生不仅应用统计学而且不断提出新要求和新问题是现代统计学研究和发展的
巨大功力。 第三节 统计学的若干概念 一、 总体与样本 总体是根据研究目的确定的同质研究对象的全体按研究对象来源又有目标总体和研究总体。 样本是指从研究总体中抽取的一部分有代表性的个体。
抽样研究的目的是用样本推断总体。 二、 同质与变异 同质是指同一总体中个体的性质、影响条件或背景相同或非常相近。 变异是指同质的
个体之间存在的差异。 统计学的任务是在变异的背景上描述同一总体的同质性揭示不同
总体的异质性。 三、 变量的类型
定量变量可分为离散型变量和连续型变量。
变量类型可以转化定量→有序→分类→二值。注意转化方向只能由信息量多向信息量少。 四、 参数与统计量 参数是指反映总体特征的统计指标。 五、 设计与分析 统计设计是医药卫生设计科研不可或缺的部分。统计设计包括抽样方法、统计学原则、分类变量
定性变量
定量变量 {
变量 {
有序变量
2
统计方法数据如何收集、样本量多大等统计学内容。设计决定了统计分析的方法。统计设计
和统计分析是不可分割的两项内容。 六、 因果与联系 探究因果关系首先考虑是否存在联系。但存在联系未必有因果联系因为存在大量的混
杂因素。单靠统计学分析大多只能考虑变量之间的联系难于证明因果联系。 第四节 目标与方法 一、 基本概念方法与技能 正确理解基本概念、掌握常用的设计和经典的分析方法、学会用统计软件完成有关计算。 二、 教与学的方法 应用是根本目的理解概念与动手实践才是根本。要结合生活经验、医学实际来教与学。
借助统计学实验理解统计现象与理论借助案例讨论从反面吸取教训。
【补充习
题】
一、选择题
一 A1题
每一道题下面有A、B、C、D、E五个被选答案请从中选择一个最佳答案。
1. 下面的变量中属于分类变量的是B
A.脉搏 B.血型 C.肺活量 D.红细胞计数 E.血压
2. 下面的变量中属于定量变量的是B
A.性别 B.体重 C.血型 D.职业 E.民族
3.某人记录了50名病人体重的测定结果小于50kg的13人介于50kg和70kg间的
20人大于70kg的17人此种资料属于A
A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义
变量资料
4.上述资料可以转换为C
A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义
变量资料
5.若要通过样本作统计推断样本应是C
A.总体中典型的一部分 B.总体中任一部分
C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分
E.总体中信息明确的一部分
6.统计量(E)
A.是统计总体数据得到的量
B.反映总体统计特征的量
C.是根据总体中的全部数据计算出的统计指标
D.是用参数估计出来的
E.是由样本数据计算出的统计指标
7.因果关系(C)
A.就是变量间数量上的联系 B.可以用统计方法证明
C.必定表现为数量间的联系 D.可以通过单独考察两个变量间关系得出
E.可以通过变量间数量上的联系来证明
二A2型
每一道题以一个小案例出现其下面都有A、B、C、D、E五个备选答案请从中选择
3
一个最佳答案。
1. 教材中提及美国人1954年实施了旨在评价Salk疫苗预防小儿麻痹或死于脊髓灰质
炎效果的临床试验。有180万儿童参与约有1/4参与者得到了随机化。这180万
儿童是C
A.目标总体 B.研究总体 C.1份样本 D.1份随机样本
E.180万份样本
2.上述试验最终肯定了索尔克疫苗的效果。请问此结论是针对C而言。
A.180万儿童 B.每个儿童 C.所有使用索菲克疫苗的儿童 D.所有
儿童 E.180万儿童中随机化的1/4
二、是非题
1.定量变量、分类变量和有序变量可以相互转换。 ×
2.假变量可以参与计算所以假变量是定量变量。 ×
3.离散变量在数值很大时。单位为“千”或“万”时可以取小数值此时可接近地视为
连续型变量 √
4.同质的个体间不存在差异。 ×
5.如果个体间有变异则它们一定不是来自同一总体。 ×
4
第二章 定量资料的统计描述 【重点难点】 第一节 频率分布表与频率分布图 一、离散型定量变量的频率分布 对离散型定
量变量变量值的取值是不连续的。直接清点各变量值出现的频数即为频
率分布表。离散型定量变量的频率分布图可用直方图表达以各等宽矩形直条的高度表示各
频率的多少。 二、连续型定量变量的频率分布 对连续型定量变量变量值的取值是连续的将数据适当分组清点各组的频数即为
频率分布表。连续型定量变量的频率分布图可用直方图表达。即纵坐标为频率密度即频率
/组距直方图的面积之和等于1. 三、频率分布表图的用途 频率分布表图可以揭示资料的分布类型如对称分布或偏峰分布也可以描述资料
的分布特征即集中趋势和离散趋势便于发现某些特大和特小的可疑值便于进一步计算
指标和统计分析。 第二节 描述集中趋势的统计指标 对于连续型定量变量平均数是应用最广泛、最重要的一个指标体系它常用于描述一
组同质观察值的集中趋势反映一组观察值的平均水平。常用的平均数有3种算数均数、
几何均数和中位数。 一、算术均数 意义算术均数简称均数常用μ表示总体均数
表示样本均数。反映全部数量观察
值的平均数量水平。
适用条件适用于对称分布资料尤其正态或近似正态分布资料。
计算1.直接法基于原始数据
其中n为样本含量为观察值。
2. 频率表法也叫加权法基于频率表资料
其中 f为组段的频数为组段的中值=组段上限+组段下限/2。 二、几何均数 意义几何均数以符号G表示常用来反映一组含多个数量级数据的集中位置。
适用条件适用于原始观察值分布不对称但经对数转换后呈对称分布的资料如对数
正态分布资料。观察值间常呈倍数关系或变化范围跨越多个数量级。
计算1.直接法基于原始数据
或
2.频率表法也称加权法基于频率表资料
5
三、中位数
意义中位数常用符号M表示是指将原始观察值从小到大排序后位次居中的那个
数即理论上有一半的观察值低于中位数一般都观察值高于中位数。
适用条件中位数适用于各种分布的资料特别是偏峰分布资料、分布末端无确定值的
资料等。
计算1.直接法基于原始数据
将n例观察值从小到大排列第i
个数据用
表示。
n为奇数时
n为偶数时
2.百分位数法基于频率表资料
百分位数常用符号表示是排序后的全部实测值的某百等份分割值即在全部实测值
中有x%个体观察值比它小有1-x%个体观察值比它大。中位数就是一个特定的百分位数
即M=。
=L+
(n*x%-)
其中L为欲求的百分位数所在组段的下限i为该组段的组距为截止至L的累计频数
为该组段内的频数n为总频数。 四、众 数
意义全部实测值中出现次数最多的数值即为众数。 第三节 描述离散趋势的统计指标 同一总体中不同个体存在的差异称为变异。为比较全面地把握资料的分布特征不仅需
要了解数据的集中位置而且需要了解数据的离散程度。常用的描述离散趋势的统计量包括
极差、四分位数间距、方差、标准差和变异系数。
一、极 差
意义极差也称全距。样本量接近的同类资料比较极差越大意味着数据间变异越大。
极差只考虑数据的最大值和最小值所以用极差反映数据的变异程度常常比较粗略和不稳定。
计算R=最大值—最小值
适用条件资料不限。
二、四分位数间距
意义四分位数间距表示百分位数和百分位数之差理论上与之间恰好包
括总体中间50%的个体观察值。同类资料比较Q越大意味着数据间变异越大。用四分位
数间距反映数据的变异程度比极差稳定。
计算Q=—
其中和的求法参见前述百分位数求法。
适用条件四分位数间距可用于各种分布资料特别对偏峰分布资料常把中位数和四
分位数间距结合起来描述资料的集中趋势和离散趋势。
6
三、方 差
意义方差考虑了全部观察值的变异程度。总体方差用表示定义为观察值离均差
平方和的算术均数样本方差用表示是总体方差的无偏估计。同类资料比较时方差越大意味着数据间变异度越大。
计算总体方差=
μ
样本方差=
适用条件见标准差。
四、标 准 差
意义方差的算术平方根称为标准差。总体标准差用表示样本标准差用S表示。标
准差的量纲与原变量一致故实际应用中常使用标准差。同类资料比较时标准差越大意味
着观察值间变异度越大。
计算总体标准差=
μ
样本标准差S=
其中n-1称为自由度。
适用条件方差和标准差都适用于对称分布的资料特别对正态分布或近似正态分布资
料常把均数和标准差结合起来全面描述的集中趋势和离散趋势。
五、变 异 系 数
意义变异系数用CV表示为标准差与算术均数之比是一个不带量纲的相对数。
计算
×100%
适用条件方差和标准差都适用于对称分布的资料特别对正态分布或近似正态分布资
料常把均数和标准差结合起来全面描述资料的集中趋势和离散趋势。
第四节 描述分布形态的统计指标
一、偏度系数
意义理论上总体偏度系数为0时分布是对称的取正值时分布为正偏峰取负值
时分布为负偏峰。
计算SKEW=
二、峰度系数
意义理论上正态分布的总体峰度系数为0取负值时其分布较正态分布的峰平阔取
正值时其分布较正态分布的峰尖峭。
计算KURT=
【补充练习题】
选择题
一A1型
每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1.用频率表计算平均数时各组的组中值应为E
A本组段变量值的平均数 B.本组段变量值的中位数
7
C.本组段的上限值 D.本组段的下限值
E.本组段上限值+本组段下限值/2
2.离散型定量变量的频率分布图可以用B表达。
A.直方图 B.直条图 C.百分条图 D.箱式图 E.复式条图
3.变异系数越大说明E。
A.标准差越大 B.平均数越大 C.标准差、平均数都大
D.平均数小 E.以均数为准变异程度大
4.均数和标准差的关系是D
A.均数越大标准差越小
B.均数越大标准差越大
C.标准差越大均数对各变量值的代表性越好
D.标准差越小均数对各变量值的代表性越好
E.均数和标准差都可以描述资料的离散趋势
5.把, , 标在一个数轴上则E
A. 一定在和的中间 B. 一定不在和的中间
一定靠近一些 一定靠近一些
E.以上都不是
二A2型
每一道题以一个小案例出现其下面有A、B、C、D、E五个备选答案,请从中选择一
个最佳答案。
1.已知某疾病患者10人的潜伏期天分别为6,1
3,5,9,12,10,8,11,8,>20,其潜伏期的平
均为B天。
A.9 B.9.5 C.10 D.10.2 E.11
2.已知某地一群7岁男童身高均数为100cm标准差为5cm体重均数为20kg标准差
为3kg,则身高和体重的变异程度有C
A.身高的变异程度大于体重的变异程度
B.身高的变异程度等于体重的变异程度
C.身高的变异程度小于体重的变异程度
D.身高的变异程度与体重的变异程度之比为5:3
E.因单位不同无法比较
3.测定10名正常人的脉搏次/分结果为68,79,75,74,80,79,71,75,73,84.则10名正常
人的脉搏标准差为B
A.4.73 B.22.4 C.75.8 D.75.0 E.1.50
4.测定5人的血清滴度为12,14,1:16,1:32则5人血清滴度的平均水平为D
A.1:4 B.1:8 C.1:11.6 D.1:6.96 E.1:16
5.测得200名正常成年男子的血清胆固醇值mmol/L为进行统计描述下列说法不
正确的是E
A.可用频率表法计算均数 B.可用直接法计算均数
C.可用直接法计算标准差 D.可用加权法计算标准差
E.可用直条图表示频率分布图
三A3/A4型
以下提供若干案例每个案例下设若干道题目。请根据题目所提供的信息在每一道题
下面的A、B、C、D、E五个备选答案中选择一个最佳答案。
8
第1~2题共用题干
调查测定某地107名正常人尿铅含量mg/L如下
尿铅含量0 4 8 12 16. 20 24 28 合计
例数 14 22 29 18 15 6 1 2 107
1描述该资料的集中趋势宜用 B 。
A均数 B中位数 C几何均数 D众数 E极差
2描述该资料的离散趋势宜用C。
A极差 B方差 C四分位数间距 D标准差 E变异系数
四B1型
以下提供若干组题目每一组题目前列出A、B、C、D、E五个备选答案请从中为每
一道题目选择一个最佳答案。某个备选答案可被选择一次、多次或不被选择。
(14题共用备选答案)
A.极差 B四分位数间距 C标准差
D变异系数 E中位数
1比较7岁男童与17岁青年身高的变异程度宜用D。
2描述近似正态分布资料个体观察值的离散趋势宜用C。
3描述偏峰分布资料个体观察值的变异程度宜用B。
4描述分布末端无确定值资料的离散程度宜用B。
(58题共用备选答案)
A中位数 B均数 C几何均数 D极差 E众数
5反映一组等比资料集中趋势的指标宜用C 。
6反映一组偏峰分布资料的平均水平宜用A。
7样本中出现次数最多的观察值称为E。
8
描述近似正态分布资料的集中位置宜用B。
9
第三章 定性资料的统计描述 【教学要求】
掌握常用相对数指标相对数应用的注意事项动态数列及其指标标准化法的基
本思想直接法的计算及间接法中SMR的意义标准化法的注意事项。
熟悉医学人口统计和疾病统计中常用指标的意义。
【重点难点】
第一节 三类相对数
一、频率与频率分布
定性资料经过分类汇总整理的频数表称为频率分布表。定性资料的变量形式有多分类
变量和二分类变量均可以通过频率分布表描述其分布特征。定性资料的分布特征通常可以
描述为某一类别的频数在总频数中所占比重。
根据研究目的不同定性资料频率分布表的表达形式可以不同例如可以将某一事物的
所有类别的频率列在同一张表中也可以将某事物的其中一个类别的频率与其他事物相同类
别的频率列在同一张表中。
二、常用的相对数指标
常用相对数有三种计算公式不同其意义也不同。表3-1列出常用三种相对数的公式
和意义。
三、应用相对数应注意的事项
1理解相对数的含义不可望文生义 三种相对数的定义有明确的区别但在实际应用
中常错误解释相对数的计算结果尤其频率型指标和强度型指标常被混淆。对于相对数
的统计指标读者必须认真思考其定义辨别其性质切不可望文生义。
表3-1 常用相对数的公式和意义
相对数指标 公式 意义
频率
发生某现象的观察单位数
可能发生某现象的观察单位总数
指某现象发生的
频率或事物内部
某个组成部分所
占的比重或分布
强度
某事件发生的观察单位数
可能发生某事件的观察单位数时间
指单位时间内某
现象发生的频率
相对比
两个有关联的指
标A与B之比
2频率型指标的解释要紧扣总体与属性 本实习指导的配套教材的第三章中的表1至
表3的数据均属于频率型指标但由于表达的总体和属性不同结果的解释亦不同。
3计算相对数时分母应有足够数量确保研究结果的稳定性。
4正确地合并估计频率或强度型指标 分别合计各组的分子和分母后再计算合计
的指标不可将分组的频率或强度取平均数作为合并的频率或速率。
5相对数间的比较要具备可比性 主要应注意观察的对象是否同质研究的方法如
检测手段、抽样方法是否相同观察的时间是否一致等在被比较的总体之间与研究指
标
有关的其他因素是否一致或接近。
6对相对数的统计推断从样本估计值推断总体的相对数也应当考虑抽样误差需要进
10
行参数估计和假设检验。
第二节医学人口统计常用指标
一、医学人口统计资料的来源
医学人口统计资料的主要来源为日常工作记录报告单、卡、册、统计报表和人
口调查三个方面见表3-2。
表3-2医学人口统计资料的来源
资料来源 意义和内容
日常工作记录
指人口事件发生后有关部门按常规报告制度所做的原始记录从公安部
门、卫生部门、计划生育部门和疾病控制中心均可得到。特别是对出生
死亡、胎儿死亡等生命事件的法定登记是研究人口自然变动、推算人口
数以及反映人口健康水平的基础资料
统计报表
是从原始报告单、卡、册上的数据过录整理后的一种汇总表也可以作为
较好的原始记录用于医学人口统计关系较为密切的统计报表有出生统计
报表、死因统计报表、妇幼卫生统计报表
人口调查
根据统计需要和目的做一些定期或不定期的专项调查。调查的方法通常
有普查和抽样调查。其中①人口普查为计算许多人口学指标提供了最基
本的人口数资料。②抽样调查是对人口问题进行广泛深入的研究获得内
容丰富的
资料
二、描述人口学特征的常用指标
描述人口学特征的常用指标主要指人口总数和人口构成指标常用指标及其意义列于
表3-3。
表3-3人口学特征的常用指标及其意义
常用指标 意 义
人口总数 根据资料整理的特点人口总数分为时点人口数指一个国家或地
区在某一特定时间的人口数时期人口数指某一时期或某一年
的平均人口数。平均人口数常用作计算出生率、死亡率、发病率等
指标的分母
人口金字塔 是将人口的性别和年龄资料结合起来以图形的方式表达人口的性
别和年龄构成。它以年龄为纵轴人口构成作为横轴左侧为男
右侧为女而绘制的两个相对应的直方图。人口金字塔形象直观地反
映了现有男女性别人口的年龄构成而且也可以分析过去人口的出
生死亡情况以及今后人口的发展趋势
老年人口系数 指65岁或60岁及以上人口占总人口的比重用于反映人口是
否老化及老化的程度。可作为划分人口类型的尺度
少年儿童人口系数 指14岁及以下少年儿童人口占总人口的比重从另一侧面反映人
11
口老化程度的指标。其大小主要受生育水平的影响
负担系数 指每100名劳动年龄人口所负担的非劳动年龄人口数反
映了劳动
年龄人口与非劳动年龄人口之问的关系。一般以1564岁者为劳
动人口014岁和65岁及以上者为非劳动人口或被抚养人口
老少比 指65岁及以上老年人口与14岁以下的少年儿童人口之比表示每
100名少年儿童对应多少老年人是划分人口类型的标准之一
性别比 指以女性人口为100男性人口与女性的比值。如果性别比大于100
表示男性人口多于女性人口小于100表示女性人口多于男性人口。
常用的有出生性别比、年龄别性别比及全人口性别比。出生性别比
一般在104107之间
三、生育和人口死亡的常用指标
一生育的常用指标
测量生育的指标可以分为出生率、生育率和人口再生产三类其中常用的生育率指标
有3个人口再生产指标有3个将这些常用指标及其意义列于表3
-4。
表3.4有关生育的常用指标及其意义
常用指标 意 义
粗出生率
也称普通出生率。表示某年某地平均每千人口的活产数是反映一个
国家和地区的人口自然变动的基本指标。受人口年龄性别构成的影响
总生育率
也称普通生育率表示某年某地平均每千名育龄妇女的活产数它反
映育龄妇女总的生育水平。该指标受育龄妇女内部年龄构成的影响
年龄别生育率
表示平均每千名某年龄组育龄妇女的活产数可以直接比较不同地区
的年龄别生育率但不能概括一个地区的整体生育水平
总和生育率
当年龄分组为1岁一组时将年龄别生育率从15岁累加到49岁止
得到1549岁年龄别生育率的总和即称总和生育率。若年龄分组
为5岁一组时则年龄别生育率之和再乘5即得总和生育率。表示
每1000名妇女一生平均生多少个孩子或每个妇女一生平均生多少
个孩子。总和生育率是用某年横断面的年龄别生育率资料计算的因
此消除了人口的年龄性别构成对生育水平的影响不同时间、不同地
区的总和生育率可以直接进行比较
自然增长率
表示人口自然增长的情况常被用来粗略的估计人口增长趋势。它的
计算为粗出生率(CBR)与粗死亡率(CDR)之差
粗再生育率 计算与总和生育率极为近似不同的地方是活产数特指女婴数故粗
12
再生育率实际是只计算女婴的总和生育率。表示按某时的生育模式生
育一个妇女一生平均生育的女儿数用来评价人口再生产趋势
净再生育率
在粗再生育率的基础上扣除了049岁的死亡。即扣除了母亲一代所
生的女儿中049岁的死亡数剩下的即为真正能取代母亲一代的女
儿数。NRR-1说明母亲二代所生的女儿
数恰能取代母亲数未来人
口数将保持恒定r NRR>1表示母亲一代所生的女儿敷大于母亲数
未来人口数将增加NRR<1则未来人口数将减少
二死亡统计指标
死亡统计指标有测量死亡水平及死因分析两类将一些常用指标及其意义列于表3-5.
表3-5 常用死亡统计指标及其意义
常用指标 意 义
粗死亡率
称普通死亡率、总死亡率指某地某年平均每千人口巾的死亡数说明人
群中总的死亡水平。粗死亡率的水平受人口年龄性别结构的影响。比较各
国家或地区间死亡率水平时可以用年龄别死亡率或按年龄标化计算标
准化死亡率
年龄别死亡率 指某年某年龄别平均每1000人口中的死亡数
婴儿死亡率
指某年某地每1000名活产中未满1周岁婴儿的死亡数是衡量一个国家
卫生文化水平较敏感的指标
新生儿死亡率 指某年某地每1000名活产中未满28天的新生儿死亡数
5岁以下儿童死
亡率
某年某地5岁以下儿童死亡数与同年出生活产数之比综合反映儿童健康
水平和变化的主要指标
孕产妇死亡率
指某年中由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生活
产数之比以万分率或十万分率表示。孕产妇死亡率也是一个反映国家或
地区社会经济发展、卫生保健状况的敏感指标
死因别死亡率
某年平均每10万人口中死于某病的人数说明某种疾病对居民健糜危害
程度是死因分析的重要指标。通常用标准化死因别死亡率进行各国家或
地区间比较
死因构成及死
因顺位
指死于某类死因的人数占全部死亡人数的百分比说明各种死因的相对重
要性。死因顺位是将各类死因按死因构成比的大小由高到低排列顺位可
以反映主要死因及各类死因的相对重要性
第三节疾病统计常用指标
疾病统计是从数量方面研究疾病在人群中的发生、发展和流行分布的特点与规律为
病因学研究、防治疾病和评价防治工作效果提供科学依据。
一、疾病统计资料的来源
疾病报告和报表资料包括国家规定的疾病报告和报表以及某些部门规定的一些重要
慢性病报告。这些表格规范内容标准统一。
医疗卫生工作记录包括各种医疗记录门诊病历、住院病历等。
疾病专题调查资料包括健康检查、疾病普查和疾病抽样调查等获得的资料。
二、疾病和死因分类
13
疾病命名是要对每一种法定疾病情况给以确切的名称即标准化的术语并使其对另外
的疾病具有不可混淆的、明确的位置以便于全世界的医务工作者具有共同的医学语言。
疾病分类是在
疾病命名法的基础上考虑到对疾病的认识及防治需要将一些具有共
同特性的疾病归纳在一起加以分类。
1853年国际统计学会着手编制了统一的疾病名称和死因分类先是在欧洲使用。1893
年开始建立国际疾病和死因分类(ICD)以后每10年修订一次。现在国际上使用的是ICD
的第十次修订本(简称ICD-10)共三卷自1993年1月1日起生效。
三、疾病统计指标
疾病统计的单位可以用病人也可以用病例。前者反映在观察期内一个人是否转变为
病人后者一个人每发生一次疾病就算一个病例。一个病人可以先后患数次同一种疾病或
同时患数种不同的疾病。疾病统计常用指标见教材表3-8。
发病率与患病率发病率表示一定时期内在可能发生某病的一定人群中新发生某病
的强度。分子中的新发病例数是指新发生某种疾病以第一次就诊为准。由于该病未愈继
续就诊者称为“旧病例”不再算作新病例。患病率是指某时点上受检人数中现患某种疾病
的频率其分子包括新、旧病例。通常用于描述病程较长或发病时间不易明确的疾病的患病
情况如慢性病在某一时问横断面的患病情况。因此患病率与发病率要注意分子的区别。在
一定的人群和时问内发病率(IR)、患病率PR和病程(D)的关系是PR= IR×D。
第四节粗率的标准化法
一、标准化法的意义和基本思想
标准化法只适用于两组粗率进行比较时由于某因素在两组的内部构成不同并有可能
影响到粗率的情况。标准化法的基本思想是采用统一标准构成以消除某因素的内部构成不
同对粗率的影响使通过标准化后的标准化率具有可比性。
二、标准化率的计算
主要有直接法和间接法两种现以死亡率的年龄构成标准化为例说明标准化率的计算
见表3—6。
表3-6直接标准化率与间接标准化率的计算
直接法 间接法
计算公式
或
算法特点 实际上是的加权均数权重是标准人口
年龄的频率分布
实际上是对原粗死亡率的校
正校正系数为标准化死亡比
SMR
选择标准 年龄别人口数或年龄别人口构成比作标
准
年龄别死亡率作标准
适用资料 已知各年龄组死亡率 已知总死亡数和年龄别人口
数r及或各年龄组人口
数较小年龄别死亡率不稳定
时
三、应用标准化的注意事项
1标准化法的应用范围很广。标准化法适用于“某事件的发生率”可以是治愈率也
可以是患病率还可以是
发病率、病死率等。当某个分类变量在两组中分布不同时这个分
14
类变量就成为两组频率比较的混杂因素标准化法的目的就是消除这个混杂因素的影响。
2标准化后的标准化率已经不再反映当时当地的实际水平它只是表示相互比较的
资料间的相对水平。
3由于选择的标准人口不同算出的标准化率也不同比较的结果也未必相同因此
报告比较结果时必须说明所选用的“标准”和理由。
4两样本标准化率是样本值存在抽样误差。比较两样本的标准化率当样本含量较
小时还应作假设检验。
第五节 动态数列及其分析指标
动态数列(dynamic series)是一系列按时间顺序排列起来的统计指标可以是绝对数、相
对数或平均数用以说明事物在时间上的变化和发展趋势。动态数列分析建立在相对比基
础上采用定基比和环比两种方式不仅可分析过去某事物的发生规律而且可以为预测将
来的发生情况提供参考。
一、绝对增长量
绝对增长量是说明事物在一定时期增长的绝对值。其中累积增长量是指报告年的指标
与某一固定年基期水平指标之差逐年增长量是指报告年的指标与前一年指标之差。
二、发展速度与增长速度
意义发展速度与增长速度均可按照定基比和环比的方式进行计算。定基比发展速度
是用报告期的指标与某一时期固定为基期指标之比环比发展速度是用报告期的指标与
其上一期指标之比。
计算公式定基比发展速度=
式中为报告期指标为基期指标。
环比发展速度=
式中为报告期指标为报告期的上一期的指标。
定基比环比增长速度=定基比环比发展速度% -100%
=定基比环比发展速度-1
应用发展速度表示报告期指标的水平相当于基期水平的百分之多少或若干倍增长
速度表示的是净增加量。
三、平均发展速度和平均增长速度
意义平均发展速度是各环比发展速度的几何平均数说明某事物在一个较长时期中
逐年平均发展变化的程度。平均增长速度是各环比增长速度的几何均数说明某事物在一个
较长的时期中逐年平均增长的程度。
计算公式平均发展速度=
式中为基期指标为第n年指标。
平均增长速度=平均发展速度-1
【思考与练习参考答案】
1名词解释与简答题
(1)频率型指标与强度型指标的主要区别指标的解释不同频率型指标是表示事物内
部某个组成部分所占的+比重
或分布或指某现象发生的频率。强度型指标是指单位时间
内某现象发生的频率。两种指标计算式的分子和分母的含义不同。
(2)人口金字塔是将人口的性别和年龄资料结合起来以图形的方式表达人口的性别
15
和年龄构成。它以年龄为纵轴人口数构成为横轴左侧为男右侧为女而绘制的两个相对
应的直方图可以分析过去人口的出生死亡情况以及今后人口的发展趋势。
(3)婴儿死亡率是何种类型的相对数指标是频率型的指标。
(4)总和生育率假定同时出生的一代妇女按照某年的年龄别生育水平度过其一生的
生育历程各年龄别生育率之和乘以年龄组组距就是这一代妇支平均每人可能生育的子女
数。
(5)比较发病率与患病率死亡率与病死率发病率表示一定时期内在可能发生某病
的一定人群活过的总人年中新发生的某病病例数其分子是新病例数分母是总人年数
患病率又称现患率指某时点上受检人数中现患某种疾病的人数通常用于描述病程较长
或发病时间不易明确的疾病的患病情况其分子包括新旧病例数分母是受检总人数6在一
定的人群和时间内发病率和患病率有密切关系两者与病程(D)的关系是PR=IR×D粗
死亡率与发病率及粗病死率的关系是CDR=IR×CFR。
死亡率与病死率的分子是一样的均表示因某病死亡的人数但死亡率的分母是总人
年数侧重反映死亡发生的强度或单位时间内死亡的概率病死率的分母是患某病的人数
反映疾病死亡的概率。
(6)标准化法的基本思想采用统一标准构成以消除某因素的内部构成不同对总率的影
响使通过标准化后的标准化率具有可比性。
(7)动态数列按时间顺序将一系列统计指标可以为绝对效相对数或平均数排列
起来用以观察和比较该事物在时间上的变化和发展趋势。
2计算思考题
表3-8某地人口构成情况
年龄组
岁
男% 女% 性别比 年龄组
岁
男% 女% 性别比
0~ 4.2 4.0 1.05 45~ 2.4 2.7 0.89
5~ 3.2 3.1 1.03 50~ 2.1 2.4 0.78
10~ 4.4 4.2 1.05 55~ 1.2 2.2 0.55
15~ 5.5 5.3 1.04 60~ 1.3 2.4 0.54
20~ 5.1 5.2 0.98 65~ 1.1 1.4 0.79
25~ 6.0 6.1 0.98 70~ 0.8 1.2 0.67
30~ 4.3 4.5 0.96 75~ 0.5 0.9 0.56
35~ 3.2 3.3 1.00 80~ 0.2 0.5 0.40
40~ 2.3 2.5 0.92 85~ 0.1 0.2 0.50
(1)各年龄组性别比见表3-8该地19岁以前男性多于女性但从20岁以后则女性比男
性多。
(2)育龄妇女1549岁占总人口的百分比29. 6%。
(3)总负担系数42. 86%。
(4)老年人口系数6.9%。
【补充练习题】
选择题
一Al型
每一道题下面有A、B、C、D、E五个备选答案请从中选择一个最佳答案。
1某医院某年住院病人中胃癌患者占5%则B。
16
A5%是强度指标 B. 5%是颇率指标
C5%是相对比指标 D5%是绝对数
E5%说明胃癌在人群中的严重性
2计算麻疹疫苗接种后血清检查的阳转率分母为C 。
A麻疹易感人群 B.麻疹患者数
C麻疹疫苗接种人数 D麻疹疫苗接种后的阳转人数
E麻疹疫苗接种后的阴性人数
3某病患者120人其中男性114人女性6人分别占95%与5%则结论为D。
A该病男性易得 B该病女性易得
C该病男性、女性易患程度相等 D尚不能得出结论
E根据该资料可计算出男女性的患病率
4某地区某种疾病在某年的发病人数为以后历年为?则该疾病发病
人数的年平均增长速度为D。
A. B
C.
D.
—1 E.
5某部队夏季拉练发生中暑21例其中北方籍战士为南方籍战士的2.5倍则结论
为C。
A北方籍战士容易发生中暑
B南方籍战士容易发生中暑
C尚不能得出结论
D北方、南方籍战士都容易发生中暑
E北方籍战士中暑频率比南方籍战士高
6定基比与环比指标是E。
A构成比 B平均数 C频率
D绝对数 E相对比
7一项新的治疗方法可延长病人的生命但不能治愈该病则最有可能发生的情况是
A。
A该病的患病率增加 B该病的患病率减少 C该病的发病率增加
D该病的发病率减少 E该病的发病率与患病率均减少
8要比较甲乙两厂某工种工人某种职业病患病率的高低采取标准化法的原理是C。
A假设甲乙两厂的工人构成比相同
B假设甲乙两厂患某职业病的工人数相同
C假设甲乙两厂某工种工人的工龄构成比相同
D假设甲乙两厂某职业病的患病率相同
E假设甲乙两厂某职业病的构成相同
二A2型
每一道题以一个小案例出现其下面都有A、B、C、D、E五个备选答案请从中选
择一个最佳答案。
1某人欲计算本地人群某年某病的死亡率对分母的平均人口数的算法最好是D。
A年初的人口数
B年末的人口数
17
C调查时的人口数
D上年年终的人口数加本年年终的人口数
之和除以2
E普查时登记的人口数
2某市有30万人口2002年共发现2500名肺结核患者全年总死亡人数为3000人
其中肺结核死亡98人要说明肺结核死亡的严重程度最好应用E。
A粗死亡率 B肺结核死亡人数 C肺结核死亡率
D肺结核死亡构成 E肺结核的病死率
3在一项研究的最初检查中人们发现3044岁男女两组人群的冠心病患
病率均为4%于是认为该年龄组男女两性发生冠心病的危险相同。这个结论是B。
A正确的
B不正确的因为没有区分发病率与患病率
C不正确的因为没有可识别的队列现象
D不正确的因为用百分比代替率来支持该结论
E不正确的因为没有设立对照组
三A3/A4型
以下提供若干案例每个案例下设若干道题目。请根据题目所提供的信息在每一道题
下面的A、B、C、D、E五个备选答案中选择一个最佳答案。
第14题共用题干
某省级市抽样调查了1999年1月1日至2001年12月31日部分城乡居民脑卒中发病
与死亡情况年平均人口数为1923224人其中城镇976087人农村为947137人在城镇
的病例数为1387人死亡人数941人农村病例数为816人死亡人数为712人。
1根据该资料城镇居民脑卒中年发病率为A。
A47.37/10万 B86.15/10万 C.142/10万
D48.93/10万 E72. 1210万
2据该资料城镇居民脑卒中的病死率为B。
A87. 2596 B67. 84% C.96.41/10万
D48. 93/10万 E85. 95/10万
3据该资料农村居民脑卒中的年死亡率为D。
A75. 17/10万 B67.84% C.37.02/10万
D25. 06/10万 E48. 93/10万
4据该资料该市城乡居民脑卒中的年死亡率为E。
A67. 84% B.75.03% C.96.41/10万
D85. 95/10万 E.28.65/10万
四B1型
请从A、B、C、D、E五个备选答案中选择一个与问题关系最密切的答案。某个备选
答案可能被选择一次、多次或不被选择。
(13题共用备选答案)
A绝对数 B频率型指标 C强度型指标
D相对比指标 E率差
1环比定基比发展速度是D。
2某病期间患病率是B。
3老年负担系数是D
18
第四章 统计表与统计图 【教学要求】
掌握常用统计表简单表和复合表以及统计图直方图、圆图、线图和半对数线
图的制作方法及其各自的使用条件。
熟悉利用统计图描述定量资料的基本方法制作统计图表的基本要求和规则。
了解常见统计图表如何通过电脑来
实现。
【重点难点】
第一节 统计表
将统计数值或统计指标用表格的形式列出称为统计表。
一、统计表的结构
统计表包括标题、标目、线条、数字和备注五部分。
列表原则重点突出、简单明了、主谓分明、层次清楚。
二、统计表的种类
根据分类标记的多少统计表可分为简单表和复合表。简单表只按单一变量分组复
合表由两个或两个以上变量结合起来分组。
三、编制统计表应注意的事项
表格结果要简明重点突出使人一目了然要合理安排主语和谓语的位置表内数
据要准确可靠。
第二节 统计图
将统计数值或统计指标用图形的方式表示称为统计图。
一、绘制统计图的基本要求
1根据资料的性质和分析目的选择合适的图形。
2给予适当的位于统计图下方的标题。
3涉及坐标系的统计图如直条图、线图等横轴的方向应自左向右纵轴应自下向
上均应有标目。纵横坐标长度的比例一般为57。
4对图中不同事物用不同图案或颜色加以区别时应附上图例。
二、常用统计图形的绘制方法及注意事项
1条图 用等宽直条的长度来表示参与比较的指标的大小有单式和复式两种。所比
较的数值可以是绝对数也可以是相对数。在直条的顶端绘制一小段触须代表标准差的大小。
绘制要点表示指标数值的坐标尺度必须从0点开始等间距中间不能折断各直条
间宽度应相等间隙宽度也应一致直条所表示的类别应有图例说明。
2百分条图 用于表示事物中各部分的比重或构成。可以将多组数据排列在一起便于
比较。
绘制要点先绘制一个标尺尺度为0100绘制一直条以直条的长度大小表示数
量的百分比直条各部分用线分开各段需用不同颜色或线条表示并标出所占的百分比
并附上图例。
3圆图 圆图的用途与百分条图相同它用圆的面积表示事物的全部用各扇形的面
积来表示各个组成部分。
绘制要点先绘制一圆形由于圆周为°每1%相当于°;圆内各部分按事物自
然顺序或百分比的大小顺序排列圆中各部分用线分开各部分可注明简要文字和百分比
也可用不同颜色或线条表示并附上图例。
19
4线图 线图是用线段的升降来表示统计指标的变化趋势或某现象随另一现象的变
迁情况适用于连续型变量资料。
绘制要点普通线图的纵横轴都是算术尺度纵横的尺度可以不从0开始一般纵横
比例为5:7左右坐标内点的位置要适当不应将折线绘制成平滑的曲线
若有两条以上的
线条时要用不同颜色或线型加以区别附上图例。
5半对数线图半对数线图用于表示事物的发展速度相对比。其纵轴为对数尺度
横轴为算术尺度使线图上的数量关系变为对数关系。
6散点图 散点图用点的密集程度、趋势表示两变量间的相关关系。其绘制方法与线
图类似只是点与点之间不用直线连接。
7直方图 直方图常用于表示连续型变量资料的频数或频率分布。常用横轴表示被观
察对象用纵轴表示频数或频率。
绘制要点纵轴的刻度必须从0点开始普通直方图各矩形直条的高度代表频数或频
率宽度为组距组距应相等各直条面积等于相应组段的频率各直条之间不留空隙。
8统计地图统计地图主要用于表示某种疾病在地域空间上的分布根据不同地方某种
疾病的发病率、患病率或死亡率情况采用不同密度的线条或不同颜色绘在地图上有助于
分析疾病的地理分布特征为进一步病因学或其他研究提供线索。
9箱式图 箱式图用于描述连续型变量资料的分布特征它表现连续型变量资料的5
个百分位数即P2.5、P75、P50、P75、P97.5。由P25和P75构成箱式图的“箱”体部分
P2.5P25、P75P97.5分别构成“箱子”的上下两条“触须”。
【补充练习题】
一、选择题
Al型
每一道题下面有A、B、C、D、E五个备选答案请从中选择一个最佳答案。
1根据某地616岁学生近视情况的调查资料反映患者的年龄分布可
用C。
A普通线图 B半对数线图 C直方图
D直条图 E复式直条图
2表达某地两年几种疾病的患病率可用C。
A直方图 B单式直条图 C复式直条图
D线图 E百分直条图
3统计表中不应当出现的项目为A。
A备注 B横标目 C纵标目
D线条 E数字
4欲比较两家医疗机构近1 5年来床位数的增加速度应当使用的统计图
为D。
A复式条图 B百分条图 C线图
D半对数线图 E统计地图
二、简答题
1依次写出箱式图中涉及到的各个取值。
答由大到小的次序为极大值、P75、中位数、P25和极小值。
2直方图中各矩形的高度等于频数或频率对吗
答对于各组距相等的情形该说法是对的。若某些组段的组距与多数组段所取
组距不同时例如前者是后者的k倍则该不等距组段的高度为频数或频率除以k。确
20
切地说组段对应的面积等于频数或频率。
3统计表的列表原则是
什么
答一是重点突出简单明了二是主谓分明层次清楚符合逻辑。
4线图和半对数线图的主要区别是什么
答线图的纵轴尺度为算术尺度用以表示某指标随时间的变化趋势
半对数线图的纵轴尺度为对数尺度用以表示某指标随时间的增长或减少速度。
5绘制圆图时对应扇形的大小是如何决定的
答设总体的构成部分其构成比由大到小依次为P1P2?Pk。则第一个扇
形的圆心角为360°×P1余类推依次画出k个扇形。一般起点由钟表12点位置开始。
21
第五章 常用概率分布 【教学要求】
掌握三个常用概率分布的概念二项分布及Poisson分布的概率函数与累计概率、正
态分布的分布函数的计算方法医学参考值的计算。
熟悉三个常用概率分布的特征。
了解质量控制的意义、原理和方法
【重点难点】
第一节 二项分布
一、二项分布的概念与特征
基本概念如果每一个观察对象阳性结果的发生概率均为π阴性结果的发生概率均
为1-π而且各个观察对象的结果是相互对独立的那么重复观察n个人发生阳性
结果的人数的概率分布为二项分布记作Bn, π
二项分布的概率函数P(X)=
ππ
二项分布的特征二项分布图的形态取决于π与n高峰在μ=nπ处。当π接近0.5时
图形是对称的π离0.5愈远对称性愈差但随着n的增大分布趋于对称。
二项分布的总体均数为μ=nπ
方差为=nπ(1-π)
标准差为σ=
ππ
如果将出现阳性结果的频率记为p=
则p的总体均数为π
标准差为σ=
ππ
二、二项分布的应用
二项分布出现阳性的次数至多为k次的概率为
P(X≥k)=
=
ππ
出现阳性的次数至少为愚次的概率为
P(X≤k)=
=
ππ
第二节 Poisson分布
一、Poisson分布的概念与特征
基本概念Poisson分布可以看作是每个观察对象阳性结果的发生概率π很小而观察
例数行很大时的二项分布。除二项分布的三个基本条件以外Poisson分布还要求π接近于
0。有些情况π和n都难以确定只能以观察单位时间、空间、面积等内某种稀有事件
的发生数X来近
似。
Poisson分布的概率函数
P(X)=
22
式中λ=nπ为Poisson分布的总体均数X为观察单位内某稀有事件的发生次数e
为自然对数的底λ为常数约等于2.71828。
自然对数的底又为常数约等于2. 71828。
Poisson分布的特征
Poisson分布当总体均数λ值小于5时为偏峰λ愈小分布愈偏随着λ增大分布趋
向对称。
Poisson分布的总体均数与总体方差相等均为A且Poisson务布的观察结果具有可加
性。
特点凡个体有传染性、聚集性均不能视为二项分布或Poisson分布。
二、Poisson分布的应用
如果某稀有事件发生次数的总体均数为A那么发生次数至多为k次的概率为
P(X≤k)=
=
发生次数至少为k次的概率为
P(X≥k)=1-P(X≤k-1)
第三节 正态分布
一、正态分布的概念
基本概念正态分布是自然界最常见的一种分布正态分布的特点是中间频数最多
两边频数渐少且对称。
正态分布的概率密度函数
f(X)=
其中μ为总体均数σ为总体标准差。
正态分布密度曲线的特点
(1)关于x=μ对称。
(2)在x=μ处取得该概率密度函数的最大值在x=μ±σ处有拐点表现为钟形曲线。
(3)曲线下面积为1。
(4) μ决定曲线在横轴上的位置μ增大曲线沿横轴向右移反之μ减小曲线沿
横轴向左移。
(5) σ决定曲线的形状当μ恒定时σ越大数据越分散曲线越“矮胖”σ越小
数据越集中曲线越“瘦高”。
二、正态曲线下面积的分布规律
标准正态分布总体均数为0、总体标准差为l的正态分布称为标准正态分布用N(0.1)
表示。
对任意一个服从正态分布N(uσ)的随机变量X经过如下的标准化变换
Z=
可以转变为标准正态分布。
正态曲线下而积的分布规律 由标准正态分布曲线下面积分布表给出。标准正态分布
的分布函数值等于标准正态曲线下Z值左侧的面积记作Φz。
按正态分布规律标准正态曲线下面积分布规律为
单侧PZ≤— 或 P(Z≥)= α
23
双侧P
Z≤—P(Z≥)= α
三、正态分布的应用
(一)确定医学参考值范围
基本概念医学参考值范围是指特定的“正常”人群排除了对所研究指标有影响的
疾病和有关因素的特定人群的解剖、生理、生化指标及组织代谢产物含量等数据中大多数
个体取值所在的范围。
人们习惯用该人群中95%的个体某项医学指标的取值范围作为该指
标的医学参考值范围。
计算方法确定医学参考值范围的方法有两种
(1)百分位数法双侧95%医学参考值范围是P2.5P97.5单侧范围是P95以下如
血铅、发汞或P5以上如肺活量。该法适用于任何分布类型的资料。
(2)正态分布法若X服从正态分布医学参考值范围还可以依正态分布规律计算。正
态分布资料双侧医学参考值范围一般按下式作近似估计
± 1. 96S
其中
和S分别为样本的均数和标准差。
二二项分布、泊松分布的正态分布近似
1二项分布的正态近似 随着n的增大二项分布趋于对称。理论上可以证明当n
相当大时只要π不太靠近0或1特别是当n1-π都大于5时二项分布近似于正态
分布。
由于二项分布为离散型变量分布为了借用连续型变量的分布函数计算概率要对概
率函数作校正。
二项分布累计概率的正态近似计算公式为
P(X≤K)=
P(X≥k)=
2Poisson分布的正态近似 随着总体均数又的增大Poisson分布趋向对称。理论上
可以证明随着λ→∞Poisson分布也渐近正态分布。一般当λ≥20时Poisson分布资
料可按正态分布处理。
和二项分布相同Poisson分布也是离散型变量分布。为了借用连续型变量的分布函数
计算概率也要对概率函数作校正。校正后Poisson分布的正态近似计算方法为
P(X≤k)=
)
P(X≥k)=1-P(Xk)≈1-
P(
【补充练习题】
一、选择题
一Al型
每一道题下面有A、B、C、D、E五个备选答案请从中选择一个最佳答案。
1随机变量X服从正态分布N (
)Y服从正态分布N()X与Y独立
则X-Y服从__C__。
24
AN+
- BN--
CN-
+ DN+
E.以上均不对
2标准正态分布的均数与标准差分别是(A)。
A. 01 B.10 C.0, 0 D.1,1 E.0.5,1
3正态分布的两个参数μ与σ__C__对应的正