医学统计学第五章-定性资料的统计描述
医学统计学-3-定性资料统计描述
解决办法
分层比较 率的标准化法 多元统计分析方法
相对数比较时应注意其可比性(二)
在同一地区不同时期资料的相对数比较时,还 应注意其条件有无变化。 例如,不同时期的发病率比较时,应注意不同 时期疾病的登记制度、诊断水平以及平均人口 数的变化。
5、样本率或构成比进行比较时应作假设检验 由于样本率或构成比是样本指标,同样存 在着抽样误差。 在实际工作中,不能根据样本率或构成比 等相对数的数值大小轻易作出结论,应进 行样本率或构成比差异比较的假设检验。
一、相对数的概念
Question:
通过调查得到某年甲地区的小学生中流脑 发病63例,乙地区的小学生中流脑发病35 例。能否认为甲地流脑的发病严重程度高 于乙地? 绝对数63例和35例表示甲地发病比乙地多 28例,能否说明两地发病的严重程度呢?
假设甲地有小学生50051人,乙地有小学生 14338人,求出两地的发病率: 甲地发病率: 63/50051=1.26‰ 乙地发病率: 35/14388=2.44‰ 乙地区的发病率是甲地区的两倍多。 以上两个发病率为通过绝对数求得的相对 数,用来表示事物出现的频率或强度,便 于比较。
分类资料的统计描述
用率、构成比和相对比等指标来对分类资 料进行统计描述。 由两个有联系的指标之比组成,统称为相 对数。 常用相对数包括率、构成比和相对比。
二、常用相对数
1、率(rate)
又称频率指标。 某现象实际发生数与可能发生总数之比。 说明某现象发生的频率与强度:
某时期内实际发生某现象的观察单位数 率= ×比例基数(K) 同时期可能发生该现象的观察单位总数
三、标准组的选择
标准组应选择有代表性的、较稳定的、来自数 量较大的人群的指标作为标准。
例如世界的、全国的、全省的、本地区的或本 单位历年累计的数据等;
医学研究生医学统计学定性资料的统计描述
百分比(%) 33.33 20.00 13.33 26.67 6.67 100.00
针刺合谷治疗胃痛的效果
疗效 治愈
例数 59
百分 比
(%)
60.82
有效
23
23.71
无效
15
合计
97
15.46
100.0 0
治愈 有效 无效
二、定性资料的描述指标 ——相对数(Relative number)
相对数:两个有联系的指标(数值)之比
相对比 A B
A和B可以是绝对数、平均数,也可以是相对数 A和B的量纲可以相同,也可以不同 A和B彼此分离,互不重叠或包含
如:人口出生性别比;每千人口的医生数、每千 人口的病床数、每医生的门诊工作量、变异系 数等。
人口出生性别比国际上一般以每出生100个女
性人口相对应出生的男性人口的数值来表示。 一般在102~107之间。
频率型指标
某 病 病 死 率 = 同 同 年 年 某 患 病 该 死 病 亡 总 人 数 数 100 %频率型指标
发病率(incidence rate,IR)表示一定时期 内,在可能发生某病的一定人群中新发生某病 的强度。
患病率(prevalence rate, PR)又称为现患 率,指某时点上受检人数中现患某种疾病的频 率,患病率分为时点患病率(point prevalence rate)和期间患病率(period prevalence rate)。
医学研究生医学统计学定性资 料的统计描述
相关概念
定性资料是指将观察单位按照某种属性或类
别进行分组,然后计数各组的观察单位个数 所收集的资料。
根据变量类别之间是否有顺序、等级、大小 关系,分为无序分类变量资料和有序分类变 量资料。
医学统计学(第二版)思考与练习答案
离散程度指标四分位数间距= (mmol/L)
三、最佳选择题
1.B2. E3. B4.C5. D6.E7.A8.D9. D
四、综合分析题
1.解:输出结果
图4-4尿总砷的频数分布图
由图4-4可见,该资料集中位置偏向左侧,为正偏态分布,考虑作对数变换。
输出结果
图4-5尿总砷对数的频数分布图
2.样本均数的抽样分布的特点有:①各样本均数未必等于总体均数;②样本均数之间存在差异;③样本均数服从正态分布;④样本均数的变异范围较原变量的变异范围小;⑤随着样本含量的增加,样本均数的变异范围逐渐缩小。
3.标准差与标准误的区别在于:①计算公式:标准差为 ,标准误为 ;②统计学意义:标准差越小,说明个体值相对越集中,均数对数据的代表性越好;而标准误越小,说明样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大;③用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。
COPD患者的经常吸烟率比非COPD患者高26.69%
还需进一步对 作假设检验(见第十一章),若经检验有统计学意义,可以认为经常吸烟与慢性阻塞性肺病(COPD)有一定的关系。
输出结果
2.解:
表5-4某地居民1998~2004年某病死亡率(1/10万)动态变化
年份
符号
死亡率
绝对增长量
发展速度
增长速度
累计
二、案例辨析题
该结论不正确。因为该医生所计算的指标是构成比,只能说明98例女性生殖器溃疡患者中,3种病原体感染所占的比重,不能说明女性3种病原体感染发生的频率或强度,该医生犯了以构成比代替率的错误。
三、最佳选择题
医学统计学重点总结
综合练习
三类资料
(1) 定量资料(quantitative data) 以定量值表达每个观察单位的某项观察指标, 如血脂、心率等。 特点:
① 各观察单位间只有量的差别; ② 数据间有连续性。
三类资料
(2) 定性资料(qualitative data) 以定性方式表达每个观察单位的某项观察指标, 如血型、性别等。 特点:
举例 血型(A、B、O、AB) 人群中某病发生与否(发生、不发生)
描述指标: 相对数
率 构成比 相对比
常用相对数(1)
率(rate),又称频率指标,说明某现 象发生的频率和强度。(强度相对数)
率 = 可 实 能 际 发 发 生 生 某 某 现 现 象 象 的 的 观 观 察 察 单 单 位 位 总 数 数 比 例 基 数
比 A B
四格表(fourfold table)的概念
a
b
c
d
这四个格子的频数是整个表的基本数据,其 余数据都是从这四个基本数据推算出来的,这 种资料称为四格表资料。
2检验的基本思想
如果H0假设成立,则实际频数( actual
frequency)与理论频数应该比较接近。
如果实际频数与理论频数相差较大,超出了
区别
r 没有单位,b有单位;所以,相关系数与单位无 关,回归系数与单位有关;
相关表示相互关系;回归表示依存关系; 对资料的要求不同:
当X和Y都是随机的,可以进行相关和回归分析; 当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析
;
实验研究的基本要素
处理因素:作用于受试对象,要求在实验过 程中观察其处理的因素
两样本比较的秩和检验(基本原理) Wilcoxon符号秩和检验(基本原理)
医学统计学:定性数据统计描述、统计图表
表1 某社区不同性别人群肺癌情况
性别
检查人 有病人 死亡人 死亡率 发病率
数
数
数
(%) (%)
男
1050
6
3
50.0
0.6
女
950
3
2
66.7
0.3
合计
2000
9
5
58.4 0.45
▪ 请讨论: ▪ 1)该医生所选择的统计指标正确吗? ▪ 2)该医生对指标的计算方法恰当吗? ▪ 3)应该如何作适当的统计分析?
25.73
(1.35)
172
42
(24.42)
(149.14) (6.11)
(342)
32
(9.36)
(341.48) (36.50)
715
90
12.59
(53.86)
(4.28)
▪ 根据最后三栏结果作简要分析。
▪ 由第⑸栏:40~岁组恶性肿瘤死亡占总死亡比重最高,近1/4; 20~岁组次之,占19.05%;60~岁组恶性肿瘤死亡人数虽多, 但仅占总死亡的9.36%;0~岁组恶性肿瘤死亡占总死亡比重 最低,仅占2.90%。
3.常用统计图的适用资料及实施方法
图 形 适用资料
实施方法
直条图 组间数量对比 用直条高度表示数量大小
直方图
百分条 图
饼图
线图
散点图
箱式图
定量资料的分 布 构成比
构成比
定量资料演变 水平 双变量间的关 联 定量资料取值 范围
用直条的面积表示各组段的频数或频率
用直条分段的长度表示全体中各部分的构 成比 用圆饼的扇形面积表示全体中各部分的构 成比 线条位于横、纵坐标均为算术尺度的坐标 系 点的密集程度和形成的趋势,表示两现象 间的相关关系 用箱体、线条标志四分位数间距及中位数、 全距的位置
04-医学统计学定性数据的统计描述
人年发病率(/10万) 278.36 12.34 24.23
RR=278.36/12.34=22.56,说明EB病毒抗体阳性鼻咽癌发病率是抗体 阴性发病率的22.56倍。
相对比 比数比(odds ratio,OR),用于流行病学中病例对 照研究资料。
病例组的暴露比数 a / b ad OR 对照组的暴露比数 c / d bc
概 述
标准化率(standardization rate),是为了在比较两 个不同人群的患病率、发病率、死亡率等资料时,消 除内部构成(如年龄、性别、工龄、病程长短等)不 同而不能直接比较所产生的影响。 标准化率仅用于相互比较,不代表实际水平;当标 准构成不同时,标准化率一般也不相同。
标准化直接法的计算步骤 a、标准化直接法的计算方法
治愈率(cure rate),表示接受治疗的病人中治愈的频 率。
治愈病人数 治愈率 100% 接受治疗病人数
相对数的使用注意
a、区别构成比和频率 ★频率,强度相对数;构成比,结构相对数。 b、使用相对数时分母不宜过小 ★如分母太小,用绝对数表示,如“3例中死亡1例”。 c、注意相对数的可比性 ★研究对象要同质,方法要相同,观察时期要一致等。 d、考虑存在抽样误差 ★对总体进行推断应作统计学检验。
率的标准化
构成比 构成比(constituent ratio),表示某事物内部各组成 部分在整体中所占的比重。
构成比 某一组成部分的观察单位 数 100% 同一事物各组成部分的 观察单位总数
【例】
某医院某月各科室住院病人数及死亡人数 因病死亡人 死亡构成 科室 病人数 病死率(‰) 数 (%) 内科 350 25 31.25 71.43 外科 650 30 37.50 46.15 肿瘤科 120 20 25.00 166.67 妇产科 300 5 6.25 16.67 合计 1420 80 100.00 56.34
医学统计学第3版 第5章_定性资料的统计描述讲解
1 甲县
经济困难
1 乙县
没有必要
2 甲县
经济困难
2 乙县
经济困难
3 甲县
经济困难
3 乙县
经济困难
4 甲县
没有必要
4 乙县
经济困难
5 甲县
经济困难
5 乙县
没有时间
6 甲县
Байду номын сангаас经济困难
6 乙县
经济困难
7 甲县 8 甲县 9 甲县 10 甲县
经济困难 没有时间 没有时间 其它
7 乙县 8 乙县 9 乙县 10 乙县
[0,1]
常见率的实质
• 频率(frequency)
– 发生比例,即发生某事件的对象所占的比重 – 说明某事件在群体中的发生频度
• 速率(rate)
– 是单位时间内事件的发生频率 – 说明事件在群体中某时期内的发生强度
相对数的分类
• 根据含义或用途不同可以分为:
– 构成比(Proportion) –率
333
6
306
19
639
• 将观察对象按两个定性变量的类别交叉分 组,统计相应的频数形成的频数表,也叫 R×C表
– 行变量,有R个类别,一般存放处理因素 – 列变量,有C个类别,一般存放观测指标
绝对数
• 该变量某个类别在群体中的发生次数
– 与基数有关:观察总次数(或观察对象数)
• 不便于相互比较分析
– 构成比:将事物每个部分的构成比结合在一起, 说明事物的内部构成情况
–率
• 频率(发生比例):说明事物发生频度 • 速率:说明事物单位时间的发生强度或速度
– 比:说明事物间的对比关系或密度情况
应用相对数应注意的问题
卫生统计学复习题及参考答案
卫生统计学复习题及参考答案第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查;缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标(2)确定调查对象和观察单位(3)选择调查方法和技术(4)估计样本大小(5)编制调查表(6)评价问卷的信度和效度(7)制定资料的收集计划(8)指定资料的整理与分析计划(9)制定调查的组织措施4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
医学统计学第二版高等教育出版社课后习题答案
医学统计学第二版高等教育出版社课后习题答案第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
定性资料的统计描述.
性别 频数(N) 百分比(%)
男
54
42.5
女
73
57.5
合计
127
100.00
绝对数
相对数
定性资料的统计描述
频数图 80
频数
70
60
50
40
30
20
10
0
男
女
图1 卫检班同学性别分布情况
频数表
表7 卫检班同学血型的分布情况
血型 频数(N) 百分比(%)
A型
33
26.00
B型
27
21.30
AB型
适用资料:连续型变量资料
纵轴:对数尺度;
横轴:算术尺度,连续性变量(时间、年龄 等)
表2-9 某地1975-1990年痢疾与百日咳死亡率
年度
痢疾
百日咳
1975
1.45
0.22
1980
0.82
0.05
1985
0.23
0.02
1990
0.14
0.01
1.6
死 1.4
痢疾:1.45-0.14=1.31
亡 1.2 率1
强度型指标
随访资料:如计算发病率,死亡率
发病 失访
观察开始时间
观察结束时间
相对比型指标(ratio)
指两个有关联的指标A与B之比 ,简称比。 A和B可以性质相同,也可以性质不同。 如性别比,师生比,变异系数,OR值,RR 值等。
比= A 100% B
相对数指标类型辨析
相对数指标类型辨析
图例:在图外要附图例说明。 多组比较:若要比较的事物不止一个时,
可以画几个平行的百分条图,以示比较。 各条图的排列顺序相同,图例相同。
医学统计学定性资料的统计描述
卡方检验在医学领域应用
疾病与基因型关联分析
01
通过比较不同基因型在疾病组和对照组中的分布差异,判断基
因型与疾病是否有关联。
临床试验效果评价
02
比较不同治疗方法在患者中的疗效差异,如药物疗效、手术效
果等。
医学影像学诊断准确性评估
03
通过比较影像学诊断结果与金标准诊断结果的一致性,评估影
像学诊断方法的准确性。
非数值性
定性资料不以数值形式表示,而是用 文字、符号等描述。
类别性
定性资料通常按照不同的类别或属性 进行分类。
主观性
定性资料的收集和分析往往涉及主观 判断和解释。
常见定性资料类型
分类资料
按照某种特征或属性将数据分成不同的组别,如性别、 血型等。
顺序资料
除了分类外,还具有一定程度的顺序或等级关系,如 病情严重程度、治疗效果评价等。
数分布表。
图表展示技巧与规范
选择合适的图表类型
根据数据的性质和特点,选择合适的图表类 型,如直方图、条形图等。
数据点标识
在图表中标识出重要的数据点,如最大值、 最小值、平均值等。
图表标题和坐标轴标签
为图表添加标题和坐标轴标签,以便读者理 解图表内容。
图例和颜色使用
使用图例说明不同数据系列的含义,并合理 运用颜色以增强图表的可读性。
整性。
02
Fisher确切概率法计算
根据研究目的和假设,选择合适的统计软件或编程语言实现Fisher确切
概率法的计算过程。
03
结果解读与报告
对计算结果进行解读和分析,将结果以图表或文字形式呈现,并结合专
业知识对结果进行解释和讨论。同时,需要注意结果的可靠性和可重复
第六版医学统计学答案
第六版医学统计学答案【篇一:医学统计学第二版高等教育出版社课后习题答案】例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
定量资料的统计描述
14~
16~ 18~
15
17 19
14.5
16.5 18.5
12
18 26
20~
22~ 24~ 26~ 28~ 合计
21
23 25 27 29
20.5
22.5 24.5 26.5 28.5
46
25 16 10 2 166
均数的两个重要特征
离均差的总和等于零,即各变量值与均 数之差的代数和等于零。
(x
i
( x x) 0 x) x n x x x
i i
2
i
0
各离均差的平方和小于各观察值X与任何 x 数a之差的平方(α≠ )。
( x x) ( x a) 2
均数的应用
描述呈对称分布的资料,特别是正态分布 或者近似正态分布的资料的平均水平,因 为这时均数位于分布的中心,最能反映分 布的集中趋势。
潜伏期(小时)
207例某恶性肿瘤患者年龄分布 (负偏峰分布)
60 50
40
例 病 数
30
20
10
0 5.0 15.0 25.0 35.0 45.0 55.0 65.0 75.0 85.0
年龄(岁)
频数表的用途
作为统计资料描述的一种表达方式,可以 揭示资料分布类型与特征。 便于发现资料中远离群体的某些特大或特 小的可疑值,必要时经检验后舍去。 作为正态性判断的图示法。 便于计算统计指标和进一步分析处理。
34.8 41.4 33.8 23.1 20.5 39.6 51.2 23.5 40.8 38.2 37.4 47.9
找出最大值和最小值,计算极差。
医学统计学5定性资料的统计描述--
• 乙地标准 化死亡率
p 1763 1000 17.63% 100,000 1000
表5-7 按公式(5.5)用直接法计算标准化死亡率(‰)
年龄组
(岁) (1)
0~ 5~ 20~ 40~ 60~ 合计
标准人口构成 比
(Ni/N) (2)
0.141
甲地
乙地
原死亡率pi (3)
分配死亡率 (Ni/N)pi
统计指标。
一、率
• 率(rate)又称频率指标,是某现象实 际发生的观察单位数与可能发生该现象 的观察单位总数之比,用以说明某现象 发生的频率或强度。计算公式为:
率
发生某现象的观察单位 数 可能发生某现象的观察 单位总数
K
式中:K为比例基数,常以百分率(%)、千分率(‰)、 万分率(1/万)、十万分率(1/10万)表示,原则上使计 算结果至少保留1~2位整数。但在医学资料中某些指标的 比例基数是固定的。
• 2.关系指标:指两个有关的、但非同类 事物的数量的比。
• 3.计划完成指标:说明计划完成的程度 ,常用实际数达到计划数的百分之几或 几倍表示。
表5-1 1993~1998年某地损伤与中毒病死率(%)与构成比(%)
年度 发病人数 病死人数 病死率
(1) (2) (3) (4)
1993 584
8
1.37
(4)=(2) (3)
原死亡率pi (5)
分配死亡率 (Ni/N)pi
(6)=(2) (5)
57.2
8.07
72.9
10.28
0.188
3.6
0.68
4.6
0.86
0.543
5.3
2.88
7.2
定性资料的统计描述--相对数及其应用注意事项
福建中医药大学中西医结合学院医学统计学中西医结合学院计数资料的统计描述常用相对数指标定性资料在统计分析时常用绝对数和相对数来描述。
绝对数(absolute number)是指计数资料各类别的频数,反映事物在某时某地出现的实际水平,是实际工作和科研中不可缺少的基本数据。
为了进一步更直观地表达现象间的关系,定性资料也常使用相对数(relative number)来进行统计描述。
相对数是指两个及以上有联系的指标之比,常用的相对数指标有率、构成比和相对比。
两种疗法的疗效比较组别有效无效合计有效率通塞脉方组2673378.9%活血温经汤组3623894.7%合计6297187.3%常用相对数指标一、率率(rate)表示某现象发生的频率或强度,是频率指标。
常以百分率、千分率、万分率或十万分率来表示。
计算通式为:式中k为比例基数,可取100﹪、1000‰、10000/万、100000/10万。
选择k的依据为:①习惯用法,如恶性肿瘤死亡率多选用十万分率,婴儿死亡率多选用千分率等。
②计算结果一般保留1~2位整数,便于读、写和计算。
如0.078﹪可用7.8/万表示。
发病率(incidence rate ,IR )表示某时期(如某一年)内某疾病新发生的频率。
1、发病率患病率fabinglv(prevalence rate ,PR )又称现患率,表示某一时点/时期某人群中某疾病存在的频率,分为时点患病率(point prevalence rate )和时期患病率(period prevalence rate )。
2、患病率发病率和患病率不可混淆。
发病率的基数是某时期可能患该病的人数,基数较小,k一般是%;而患病率的基数是该地的平均人口数,基数大,k一般是10000/万,甚至100000/10万。
因此,一般来说发病率的数值较小而患病率的数值较大。
病死率(cause fatality rate ,CFR )表示某时间内,某疾病患者中因该病死亡的频率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
就诊人数
50 40 0.0 4.0
6.0
16
第二节 应用相对数的注意事项
• 计算相对数分母不宜过小 。
• 正确区别构成比和率的意义 。
• 正确计算合计率 。 • 注意资料的可比性。 • 样本率(或构成比)的也存在抽样误差。 • 有些场合最好使用绝对数
问题的提出
某单位不同岗位职业疾病情况
岗位
A B
疾病人数
17 30
C
D 合计
73
27 147
C岗位的病例数最多,因此列为整改主要岗位!
问题的提出
某单位不同岗位职业疾病情况
岗位
A B
调查人数
74 64
疾病人数
17 30
患病率(%) 22.97 46.88
C
D 合计
183
43 364
73
27 147
n
平均增长速度=平均发展速度-1=
an -1 a0
第四节 率的标准化法
• 标准化法的意义和基本思想。 • 标准化率的计算。
• 应用标准化法的注意事项。
一、标准化法的意义
• 标准化法的基本思想是:采用某影响因素的统一标准构 成以消除构成不同对合计率的影响,使通过标准化后的 合计率具有可比性。
医大 性别 调查 人数 2000 2000 4000 吸烟 人数 216 5 221 吸烟率 (%) 10.80 0.25 5.53 调查 人数 1500 2500 4000 师大 吸烟 人数 180 30 210 吸烟率 (%) 12.00 1.20 5.25
直接法标准化率的计算
使用人口构成为标准直接法计算标准化治愈率(%)
病型
标准人 口构成 (Ni/N)
0.5 0.5
A疗法
原治愈率 (Pi) 85.0 65.0 分配治愈率 (Ni/N)Pi 42.5 32.5 原治愈率 (Pi) 85.0 65.0
B疗法
分配治愈率 (Ni/N)Pi 42.5 32.5
三. 平均速度指标
• 平均发展速度:各环比发展速度的几何均数,说 明某事物在一个较长时期中逐年平均发展变化的 程度。
n
平均发展速度=
an an 1 an 2 a1 …… an 1 an 2 an 3 a0
n
an a0
三. 平均速度指标
• 平均增长速度:各环比增长速度的平均数,说明 某事物在一个较长时期中逐年平均增长程度,计 算方法为各环比平均发展速度-1(注意:不可由计 算各期的环比增长速度的几何均数求得)。
轻型 重 型
合 计
1.0
—
75.0
—
75.0
直接法标准化率的计算
直接标注化法的使用
• 已知内部各组成的率(已有) • 可以计算内部各组成的率(已知率的分子与分母) • 标准人口数或人口构成的选择
• 大人群,稳定的通用标准:世界、全国、全省、某地区各组分的人口数或构成 • 比较人群的合并:将要比较的人群的各组分人口数合并,或计算多个人群各组分 的合并构成
医学统计学
Medical Statistics
第五章. 定性资料的统计描述
福建医科大学公共卫生学院 流行病学与卫生统计学系 林征 2016.2
主要内容
第一节 常用相对数指标
第二节 应用相对数的注意事项 第三节 动态数列及其应用 第四节 率的标准化法
分类资料
• 分类变量的取值为某种属性,例如: • 血型(A、B、O、AB) • 人群中某病发生与否(发生、不发生) • 性别(男性、女性) • 视力等级(差 、中、好) • 这些变量值无法直接进行统计运算,通常的做法是按照类别进行 统计汇总,分别计算每一个类别的观察单位数,即某个分类的频 数 • 将上述频数绘制成频数分布表
A疗法 病 型 病人数 轻型 重 型 合 计 80 120 200 治愈数 68 78 146 治愈率(%) 85.0 65.0 73.0 病人数 100 60 160 B疗法 治愈数 85 39 124 治愈率(%) 85.0 65.0 77.5
直接法标准化率的计算
使用人口数为标准直接法计算标准化治愈率(%)
• 任选待比较人群之一:选择待比较的任意一个人群,使用该人群的各组分的人口 数或构成
三、应用标准化法的注意事项
• 标准化法只适用于内部构成不同影响到总率(合计率) 且各组分的率“平行”变化,如果内部各组分的率存在 “交叉”,慎用标准化法。
• 由于选择的标准不同,算出的标准化率也不同,但比较 的结论趋势一致。 • 标准化后的标准化率,已经不再反映当时当地的实际水 平,它只表示两组相互比较的资料间的相对水平。 • 样本标准化率也存在抽样误差,也需要进行假设检验。
年份 2000 2001 2002 …… 2008 2009
符号 a0 a1 a2 …… a8 a9
死亡率 (1/千人) 32.2 30.0 29.2 …… 14.9 13.8
发展速度(%)
定基比
环比
? …… ……
?
2002年的定基发展速度=a2/a0=29.2/32.2=90.7%
2009年的环比发展速度=a9/a8=13.8/14.9=92.6%
男 女 合计
二、标准化率的计算
• 常用的标准化方法有直接法和间接法,二者的使用条件不同
• 直接法计算标准化率 : (1)选择年龄别人口数作标准时。
p' N i pi N
(2)选择年龄别人口构成作标准时。 Ni p ' ( ) pi N
直接法标准化率的计算
两种疗法治疗某病的治愈率比较
病型
标准 治疗人数 (Ni) 180 180 360 A疗法 原治愈率 (Pi) 85.0 65.0 预期治愈数 (NiPi) 153 117 270 原治愈率 (Pi) 85.0 65.0 B疗法 预期治愈数 (NiPi) 153 117 270
轻型 重 型 合 计
• 甲疗法标准化治愈率=270/360=75.0% 乙疗法标准化治愈率=270/360=75.0%
二. 速度
• 速度指标是说明事物发展动态的最主要指标,主要有 发展速度与增长速度。 • 定基发展速度:不同时期的发展水平与某一固定时期 水平之比,表示相对于某时期,当前水平已发展到几 倍;表明现象在一段时期内的总发展速度,因此也称 “总速度”。 • 环比发展速度:当前水平与前一时期水平之比,表明 现象逐期的发展程度;如果间隔仅为一年,该指标又 称为“年速度”。
三、相对比
三、相对比
三、相对比
1500非成年人首次吸烟情况与因气管炎症就诊的情况表
吸烟情况
吸烟 未吸烟 合计
就诊人数
50 40 90
随访人数
500 1000 1500
就诊率(%) 10.0 4.0
6.0
三、相对比
三、相对比
1500非成年人首次吸烟情况与因气管炎症就诊的情况表
吸烟情况
吸烟 未吸烟 合计
符号 a0 a1 a2 …… a8 a9
死亡率 (1/千人) 32.2 30.0 29.2 …… 14.9 13.8
增长速度(%)
定基比
环比
? …… ……
?
2002年的定基增长速度=(a2/a0)-1=90.7%-1= -9.3%
2009年的环比增长速度=(a9/a8)-1=92.6%-1= -7.4%
三. 平均速度指标
• 在分析事物动态发展时,我们使用环比速度反映 逐期的发展或增长速度;在一个较长的时期中, 其逐年的发展或增长快慢不尽相同,因此为了概 括说明事物在一段较长期间的变化速度,需要计 算各环比指标的速度平均数。
• 对应于环比发展与环比增长速度,平均速度指标 也有平均发展速度与平均增长速度。
一.绝对增长量
• 累计增长量:指定时期的指标与某一固定时期指标之 差(定基),说明一段时期内的总增长量。 • 逐期增长量:指定时期指标与之前固定(时间)间隔 指标之差(环比),说明本期比上期增长的绝对数量。 • 请注意:增长量可以是负数。 • 请注意:增长量与增长百分比含义不同,后者等于增 长量/基础水平。
体现疾病严重程度与医疗水平
1、率
二、构成比
二、构成比
某精神病医院2010与2012年精神病的住院情况比较
疾病 抑郁 精神分裂 神经质 其他 合计 2010年 病人数 20 140 20 20 200 构成比(%) 10.0 70.0 10.0 10.0 100.0 2012年 病人数 20 190 20 20 250 构成比(%) 8.0 76.0 8.0 8.0 100.0
第三节 动态数列及其应用
• 动态数列(dynamic series)是指按照一定的时间顺序, 将某事物的统计指标依次排列起来,以便于观察和比 较该事物在时间上的发展变化趋势,以及探寻现象的 发展规律 • 这些统计指标可以是绝对数、相对数或平均数 • 为了研究事物发展过程及其变化规律,我们还需要对 动态数列计算一系列指标;常用的指标有:发展水平、 绝对增长量、发展/增长速度、平均发展/增长速度
39.89
62.79 40.38
C岗位的情况不严重,但由于观测人数最多,所以相应的
病例数也最多!
第一节 常用相对数指标
• 相对数是分类资料的描述性统计指标,是两个有联系指 标之比。 • 常用相对数有率、构成比、相对比。
1、率
常用的率指标
体现病因因素的作用强度
体现疾病的负担
体现疾病对公众健康威胁 的严重程度
二. 速度
• 增长速度:即增长百分比,表明当前水平较基础水 平增长的程度;根据基础的定义,分为定基、环比 增长速度。 • 定基增长速度:定基比发展速度-1。 • 环比增长速度:环比发展速度-1。
• 如果发展速度小于1,则该指标相当于“下降速度”。