3.-定性资料的统计描述
合集下载
医学统计学-3-定性资料统计描述
解决办法
分层比较 率的标准化法 多元统计分析方法
相对数比较时应注意其可比性(二)
在同一地区不同时期资料的相对数比较时,还 应注意其条件有无变化。 例如,不同时期的发病率比较时,应注意不同 时期疾病的登记制度、诊断水平以及平均人口 数的变化。
5、样本率或构成比进行比较时应作假设检验 由于样本率或构成比是样本指标,同样存 在着抽样误差。 在实际工作中,不能根据样本率或构成比 等相对数的数值大小轻易作出结论,应进 行样本率或构成比差异比较的假设检验。
一、相对数的概念
Question:
通过调查得到某年甲地区的小学生中流脑 发病63例,乙地区的小学生中流脑发病35 例。能否认为甲地流脑的发病严重程度高 于乙地? 绝对数63例和35例表示甲地发病比乙地多 28例,能否说明两地发病的严重程度呢?
假设甲地有小学生50051人,乙地有小学生 14338人,求出两地的发病率: 甲地发病率: 63/50051=1.26‰ 乙地发病率: 35/14388=2.44‰ 乙地区的发病率是甲地区的两倍多。 以上两个发病率为通过绝对数求得的相对 数,用来表示事物出现的频率或强度,便 于比较。
分类资料的统计描述
用率、构成比和相对比等指标来对分类资 料进行统计描述。 由两个有联系的指标之比组成,统称为相 对数。 常用相对数包括率、构成比和相对比。
二、常用相对数
1、率(rate)
又称频率指标。 某现象实际发生数与可能发生总数之比。 说明某现象发生的频率与强度:
某时期内实际发生某现象的观察单位数 率= ×比例基数(K) 同时期可能发生该现象的观察单位总数
三、标准组的选择
标准组应选择有代表性的、较稳定的、来自数 量较大的人群的指标作为标准。
例如世界的、全国的、全省的、本地区的或本 单位历年累计的数据等;
定性资料的统计描述
(二)强度型指标
例:某企业2003年有2839名职工,该企业每年都对 职工进行体检,这一年新发生高血压病人5 例,2003年的高血压发病率为多少?
(三)相对比型指标
概念:任何两个相关联的指标A,B之比。 计算公式: 口学中的出生性别比例: 男性人口/女性人口= 19456/18340 = 1.06, 即每出生1个女婴,就有1.06个男婴出生。
分母的近似计算
假定当年每位去世者平均活了半年,每位出生 者也平均活了半年,则有: 当年全人口存活的总人年数=年初人口数×1年-去世 人数×0.5+出生人数×0.5 或 当年全人口存活的总人年数=年终人口数×1年 +去世人数×0.5—出生人数×0.5
上面两个等式相加,便有 当年全人口存活的总人年数=(年初人口数+年终人 口数)/2×1年=当年平均人口数×1年 或 当年全人口存活的总人年数=当年年中人口数 × 1年
构成比的特点
1、各构成部分的相对数之和为100%;
2、构成比的各构成部分之间存在着相互影响。
二、常用的相对数指标
用频率分布全面反映一个定性变量外,有时也可 用其他相对数指标从某个侧面来描述定性变量。 常用相对数指标大致有三种类型: 频率;强度;相对比
(一)频率型指标
频率型指标:最常见,表示某现象发生 的频率大小。 计算公式:
2、A、B也可以是相对数,如甲、乙两地的恶性肿瘤死亡率
分别是89.2/10万和65.1/10万,
则甲地恶性肿瘤死亡率是乙地的89.2/65.1=1.37(倍)。
3、A、B 可以是性质相同的两个指标,如上例甲、乙两地恶 性肿瘤死亡率相比,
也可以是性质不同的两个指标,如某医院每张病床配备的
医生人数: 368名医生/2800个床位=0.13
定性资料统计描述
OR P1 /(1 P1) P0 /(1 P0)
P1为病例组的暴露比例或在暴露状态下的发病率 P0为对照组的暴露比例或在非暴露状态下的发病率
Odds ratio
例4-4 母亲围孕期是否有发热或感冒病史与婴儿 神经血管畸形关系的病例对照研究的资料如下表 所示。试计算母亲围孕期是否有发热或感冒病史 引起婴儿神经血管畸形的比数比。
率某某 事事 物物 或或 现现 象 有 象 际 发 可 发 数 生 能 生 比 的 数 的 例 所实 基数
Rate
公式中的“比例基数”通常依据习惯而定。
需要注意的是,率在更多情况下是一个具有时间 概念的指标,即用于说明在某一段时间内某现象 发生的强度或频率,如出生率、死亡率、发病率 、患病率等,这些指标通常是指在1年时间内发 生的频率。
R R P1 P0
P1为暴露组的发病率;P0非暴露组的发病率。
Relative risk
例4-3 某地市区非吸烟女性饮酒者和不饮酒者 的肺癌发病资料如下表所示,试计算其相对危 险度。
表4-2 某地市区非吸烟女性饮酒者和不饮酒者的肺癌发病资料
饮酒与否
发病数 观察人年数 发病率(1/10万人年)
是
Odds ratio
四、标准化率
标准化率( standardization rate ):比较两个不 同人群的患病率、发病率、死亡率等资料时,为 消除其内部构成(如年龄、性别、工龄、病程长 短、病情轻重等)对率的影响,可以使用标准化 率。
Standardization rate
例4-5 试对下表资料计算甲乙两个医院的标准化
P0
b
b
d
1
P0
b
d
d
由OR计算公式可以得出
P1为病例组的暴露比例或在暴露状态下的发病率 P0为对照组的暴露比例或在非暴露状态下的发病率
Odds ratio
例4-4 母亲围孕期是否有发热或感冒病史与婴儿 神经血管畸形关系的病例对照研究的资料如下表 所示。试计算母亲围孕期是否有发热或感冒病史 引起婴儿神经血管畸形的比数比。
率某某 事事 物物 或或 现现 象 有 象 际 发 可 发 数 生 能 生 比 的 数 的 例 所实 基数
Rate
公式中的“比例基数”通常依据习惯而定。
需要注意的是,率在更多情况下是一个具有时间 概念的指标,即用于说明在某一段时间内某现象 发生的强度或频率,如出生率、死亡率、发病率 、患病率等,这些指标通常是指在1年时间内发 生的频率。
R R P1 P0
P1为暴露组的发病率;P0非暴露组的发病率。
Relative risk
例4-3 某地市区非吸烟女性饮酒者和不饮酒者 的肺癌发病资料如下表所示,试计算其相对危 险度。
表4-2 某地市区非吸烟女性饮酒者和不饮酒者的肺癌发病资料
饮酒与否
发病数 观察人年数 发病率(1/10万人年)
是
Odds ratio
四、标准化率
标准化率( standardization rate ):比较两个不 同人群的患病率、发病率、死亡率等资料时,为 消除其内部构成(如年龄、性别、工龄、病程长 短、病情轻重等)对率的影响,可以使用标准化 率。
Standardization rate
例4-5 试对下表资料计算甲乙两个医院的标准化
P0
b
b
d
1
P0
b
d
d
由OR计算公式可以得出
定性资料的统计描述
25
三、相对比
相对比是互不包含的两个有联系指标之比。 对比的两个指标可以性质相同,也可以性质 不同。 公式为:相对比型指标=A指标 / B指标
注意:在计算相对比中,甲、乙两个指标可 以是绝对数,也可以是相对数或平均数,可 以有不同的量纲,但是互不包含。
27
例: 某年某医院出生婴儿中,男性婴儿为 370人, 女性婴儿为358人,则出生婴儿的 性别比为多少? 性别比为:370 / 358 ×100﹪=103﹪ 说明该医院年每出生100名女婴儿,就有103 名男婴儿出生。
30
2.相对危险度(relative risk,RR)表示在两种相同 条件下某疾病发生的概率之比。即暴露组发病率 与非暴露组发病率的比值。 某地某年男性吸烟和非吸烟的冠心病死亡资料 分组 死亡人数 观察人年数 死亡率 (1/10万人年) 43248 10673 240.5 112.4
吸烟组 104 非吸烟组 12
36
某医院某年住院病人中胃癌患者占5%,则() A 5%是强度指标 B 5%是频率指标 C 5%是相对比指标 D 5%说明胃癌在住院病人 中的比重
37
2.使用相对数时分母不宜过小 某药物 甲治疗100人,50人有效,有效 率为50﹪。药物乙治疗5人,3人有效, 我们能否说乙药有效率为60 ﹪?能否说 乙药比甲药治疗效果好。
9
分娩方式 顺产 助产 顺产 顺产 顺产 剖宫产 顺产 剖宫产 顺产 顺产
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理
年龄 18 20 22 24 26 28 30 32 34 36 38 40 合计 工人 2 9 28 50 50 34 11 14 4 2 3 0 207 管理人员 0 2 7 34 43 35 14 2 2 1 1 0 141 农民 0 6 10 28 25 10 11 3 5 1 1 2 102 商业服务 0 10 24 52 45 34 22 14 3 4 0 0 208
定性资料的统计描述
同年内死亡人数 粗死亡率= 1000 0 00 当年平均人口数 1年
强度型指标(近似)
同年<1周岁死亡人数 婴儿死亡率= 1000 0 00 当年活产儿总数
频率型指标近似
同年孕产妇死亡数 孕产妇死亡率= 10万/10万 当年活产儿总数
相对比型指标
统计图表
人口统计指标
例:某医生治疗了4例支气管哮喘病患者, 其中3例有效,即报告有效率为75。
请问该说法是否正确?
某医院统计1985-1990年儿科住院病人疾病种类分 布情况见表:
表 某医院儿科住院病人疾病种类分布情况 疾病种类 先天性心脏病 病人数 250 % 23.8
风湿性心脏病
其它
750
2. 人时资料的描述—强度
流行病学随访研究中,不同个体被观察的时间长度各 不相同,常用人时总和表示被观察的人和时间的总和。 “强度”是流行病学、统计学术语。 ——单位时间内(如年、月、日等)某事件发 生的频率。
某事件发生的个体数 强度型指标 K ( 可能发生某事件的个体 数 时间)
强度型指标通常是指一段时间内的平均概率。如人 时发病率的分子是新发生的事件数,分母是人时 数(观察人数乘以时间)的总和,多用于大人群 长时间随访的资料。
常用的相对数指标大致有三种类型:
频率(relative frequency or proportion)
强度(intensity or rate) 相对比(relative ratio)
主要内容
1. 分类资料的描述—频率和频率分布
2. 人时资料的描述—强度
3. 复合指标—相对比 4. 相对数应用中需注意的问题
新发病例数 人时发病率 观察的人时总数 新发病例数 (折合的观察人数 ( )单 位 时 间 的 个 数 ) 院的院内感染调查中,5031名病 人共观察了127859人日(例均25.4日),其中 有596人在医院发生感染,请计算院内感染率。
《医学统计学》第四章定性资料的统计描述
1、不要把构成比与率相混淆。即分析时不能以构成 比代率;这是常见的错误。
某文章作者根据上述资料认为,沙眼在20~组的患病率最高,以后随年 龄增大而减少。该作者把构成比当作率进行分析,犯了以比代率的错误。
2、使用相对数时分母不宜过小。分母过小时相对数 不稳定。
3、注意资料的可比性;
不同时期、不同地区、不同条件下的资料比较时应注意具有 可比性。
12965.2
46.3
否
265
660291.4
40.1
说明该地市区非吸烟女性饮酒者的肺癌发病率是
非吸烟女性不饮酒者的1.15倍。
3.比数比
比数比( Odds ratio ,OR) : 常用于流行病学
中病例-对照研究资料,表示病例组和对照组中的 暴露比例与非暴露比例的比值之比,是反映疾病 与暴露之间关联强度的指标。其计算公式为
一般的,两个地方的出生率、死亡率、发病率、不同级别 医院某病的治愈率等不能直接比较。
无可比性的实例:
由表2-7可见,无论有无腋下淋巴结转移,省医院的5年生存 率均高于市医院,但从总生存率看,省医院的5年生存率低于市 医院。这不符合常理。因此,省医院与市医院的总生存率就不能 直接比较(标准化后再比)。
感谢聆听
率
某事物或现象发生的实 际数 某事物或现象发生的所 有可能数
比例基数
公式中的“比例基数”通常依据习惯而定。
需要注意的是,率在更多情况下是一个具有时间 概念的指标,即用于说明在某一段时间内某现象 发生的强度或频率,如出生率、死亡率、发病率 、患病率等,这些指标通常是指在1年时间内发 生的频率。
例4-1 某单位在2009年有3128名职工,该单位 每年对职工进行体检,在这一年新发生高血压 病人12例,则
定性资料的统计描述
an: 报告期指标 a0:基期指标
增长速度:表示的是净增长量。
增长速度=发展速度-1
定基增长速度=定基发展速度-1
环比增长速度=环比发展速度-1
三、平均发展速度和平均增长速度
平均发展速度:各环比发展速度的几何均数, 说明某事物在一个较长时期中逐年平均增长 的程度。
平均发展速度=
n
an a0
平均增长速度:各环比增长速度的平均数, 说明某事物在一个较长时期中逐年平均增长 的程度。
如某专业杂志发文 “252例病毒性肝炎分析”
②不能用构成比的动态分析代替率的动态分析。 表 某市1980年和1990年5种传染病情况
疾病 痢疾 肝炎 流脑 麻疹 1980年
病例数 构成比(%) 病例数
1990年
构成比(%)
3604 1203 698 890 902
49.39 16.49 9.65 12.20 12.36
1、疾病统计资料来源:p40 2、疾病与死因分类 疾病命名: 第三 是给疾病起一个特定的名字,使之可区别 节 于其它疾病。(ICD-10)
疾病 统计 常用 指标
疾病分类:疾病分类是根据疾病的某些特征,按 照一定的编码规则对疾病进行统计分类的方法。
ICD是国际疾病分类英文 (International Classification
合
计
150
100.00
1
0%
33.33
20 40%
13.33 60%
26.67 80%
循环系统疾病
6.67 100%
传染病
20%
恶性肿瘤
呼吸系统疾病
消化系统疾病
某医院2001年住院病人5类疾病的死亡情况
定性资料的统计描述
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
某地居民年龄别癌肿患病情况统计
年龄组 (岁) (1) <30 30~ 40~ 50~ 60~ 总计 人口数 (2)
633000 570000 374000 143000 30250
1750250
癌肿病 人数 (3) 19 171 486 574 242 1492
×100%
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
例:
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
例:白细胞计数和分类构成比 构成比的两个特点: ⑴ 各组成部分的相对数之和为 100%; ⑵ 某一部分所占比重增大,其它部 分会相应地减少。
实际工作中,可用某一期间的平均 人口数来代表人口总数。当人口数 在一年中是均匀变动时,可用以下 两种计算方法:
年平均人口数 = 上年12月31 日人口数 + 本年12月31 日人口数 2
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
年中(7月1日零时)人口数代表全 年的平均人口数。
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
国际统一规定的统计人口数方法: ① 实际制——只统计标准时刻某地 实际存在的人口数(包括临时在 该地的人) ② 法定制——只统计某地的常住人 口数。
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
三、人口死亡统计
死亡统计资料是反映社会卫生状况和居 民健康水平的重要基础资料,也是制订 卫生工作计划、评价卫生服务效果的重 要依据。通过描述和分析不同地区、不 同人群(包括不同性别、不同年龄、不 同职业者)的死亡水平和各种死亡原因 的动态变化,反映社会经济、文化教 育、卫生服务对于居民健康的影响。
某地居民年龄别癌肿患病情况统计
年龄组 (岁) (1) <30 30~ 40~ 50~ 60~ 总计 人口数 (2)
633000 570000 374000 143000 30250
1750250
癌肿病 人数 (3) 19 171 486 574 242 1492
×100%
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
例:
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
例:白细胞计数和分类构成比 构成比的两个特点: ⑴ 各组成部分的相对数之和为 100%; ⑵ 某一部分所占比重增大,其它部 分会相应地减少。
实际工作中,可用某一期间的平均 人口数来代表人口总数。当人口数 在一年中是均匀变动时,可用以下 两种计算方法:
年平均人口数 = 上年12月31 日人口数 + 本年12月31 日人口数 2
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
年中(7月1日零时)人口数代表全 年的平均人口数。
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
国际统一规定的统计人口数方法: ① 实际制——只统计标准时刻某地 实际存在的人口数(包括临时在 该地的人) ② 法定制——只统计某地的常住人 口数。
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
三、人口死亡统计
死亡统计资料是反映社会卫生状况和居 民健康水平的重要基础资料,也是制订 卫生工作计划、评价卫生服务效果的重 要依据。通过描述和分析不同地区、不 同人群(包括不同性别、不同年龄、不 同职业者)的死亡水平和各种死亡原因 的动态变化,反映社会经济、文化教 育、卫生服务对于居民健康的影响。
定性资料的统计描述
42.86 12.50
4
57.14 15.38
7
100.00 14.00
露露 可口可乐 百事可乐 汇源果汁
1 11 8 1
8 3 2 9
9 14 10 10
合计
24
26
50
频率指标的两个特点:
• 各组成部分之和为 1(100%); • 某一部分所占比重增大,其它部 分会相应地减少 。
第二节 相对数指标
定性资料的统计描述
二分类变量 分类变量
定性变量
顺序变量
多分类变量
定性资料的统计描述
统计学中,定性资料的统计描 述可以做频数与频数分布,还可以 用相对数(比例/百分比、比率)来 描述和比较这类变量。
中 中 国 国 人 市 口 场 统 统 计 计 年 年 鉴 鉴
第一节 频数与频数分布
频数:各类别出现的个(例)数。
如例1:百事可乐和可口可乐市场占有率之比。
10 R= 0.7143 14
2. 两个率之比(相对数)
P 1 R= P2
如例2:甲城市300户家庭住房满意度调查中 满意率与不满意率的比较。
15% R= 0.4167 36%
应用相对数时的注意事项
计算相对数时,分母不宜过小,确保研究结果的 稳定性。在例数很少的情况下,尽量使用绝对数。
正确计算合计率。对观察单位数不等的几个率, 不能直接相加求其平均。 相对数的对比应注意可比性。即除了要对比的因 素外,其余的等。
【例 2 】在一项城 市住房问题的研究 中,研究人员还在 乙城市抽样调查 300 户,其中的一 个问题是:“您对 您家庭目前的住房 状况是否满意?” 1.非常不满意; 2.不满意; 3.一般; 4.满意; 5.非常满意。
4
57.14 15.38
7
100.00 14.00
露露 可口可乐 百事可乐 汇源果汁
1 11 8 1
8 3 2 9
9 14 10 10
合计
24
26
50
频率指标的两个特点:
• 各组成部分之和为 1(100%); • 某一部分所占比重增大,其它部 分会相应地减少 。
第二节 相对数指标
定性资料的统计描述
二分类变量 分类变量
定性变量
顺序变量
多分类变量
定性资料的统计描述
统计学中,定性资料的统计描 述可以做频数与频数分布,还可以 用相对数(比例/百分比、比率)来 描述和比较这类变量。
中 中 国 国 人 市 口 场 统 统 计 计 年 年 鉴 鉴
第一节 频数与频数分布
频数:各类别出现的个(例)数。
如例1:百事可乐和可口可乐市场占有率之比。
10 R= 0.7143 14
2. 两个率之比(相对数)
P 1 R= P2
如例2:甲城市300户家庭住房满意度调查中 满意率与不满意率的比较。
15% R= 0.4167 36%
应用相对数时的注意事项
计算相对数时,分母不宜过小,确保研究结果的 稳定性。在例数很少的情况下,尽量使用绝对数。
正确计算合计率。对观察单位数不等的几个率, 不能直接相加求其平均。 相对数的对比应注意可比性。即除了要对比的因 素外,其余的等。
【例 2 】在一项城 市住房问题的研究 中,研究人员还在 乙城市抽样调查 300 户,其中的一 个问题是:“您对 您家庭目前的住房 状况是否满意?” 1.非常不满意; 2.不满意; 3.一般; 4.满意; 5.非常满意。
统计学:定性资料的统计描述
发达国家较低
老年负担系数
发达国家较高
总负担系数
14岁及以下人口数 65岁及以上人口数 100% 15 ~ 64岁人口总数
发达国家较低
(3)老少比
65岁及以上的人口数 100% 14岁及以下人口数
老少比
发达国家较高
(4)性别比
性别比
男性人口数 100 女性人口数
不同年龄时期的性别比
(1)人口系数
老年(人口)系数 65岁及以上的人口数 100% 人口总数 14岁及以下人口数 100% 人口总数
发达国家较高
少儿(人口)系数
发达国家较低
(2)负担系数
少儿负担系数 14岁及以下人口数 100% 15 ~ 64岁人口总数 65岁及以上人口数 100% 15 ~ 64岁人口总数
定性资料的统计描述
( qualitative data statistical description 要求: )
1.掌握常用相对数的适用条件及应用
2.掌握医学人口常用统计指标和疾病统计常用指标 3.了解动态数列分析指标及特点
第一节
一、定性资料的构成比
定性资料的分布特征
表3-1 某医院2001年住院病人5类疾病的死亡情况
第二节
医学人口统计常用指标
一、 医学人口资料的来源 (medical population information )
(一)人口普查
人口普查是收集资料、整理和分析一个国家或地区在某一特定时间的人口、经济和社 会资料的全过程。通常由国家政府主持,每隔5~10年进行一次。 建国以来,我国先后进 行了5次人口普查: 1953年、1964年、1982年、1990年、2000年。
1.计算相对数的分母不宜过小 2.分析时不能以构成比代替率(见表) 3.不能用构成比的动态分析代替率的动态分析(见表)
老年负担系数
发达国家较高
总负担系数
14岁及以下人口数 65岁及以上人口数 100% 15 ~ 64岁人口总数
发达国家较低
(3)老少比
65岁及以上的人口数 100% 14岁及以下人口数
老少比
发达国家较高
(4)性别比
性别比
男性人口数 100 女性人口数
不同年龄时期的性别比
(1)人口系数
老年(人口)系数 65岁及以上的人口数 100% 人口总数 14岁及以下人口数 100% 人口总数
发达国家较高
少儿(人口)系数
发达国家较低
(2)负担系数
少儿负担系数 14岁及以下人口数 100% 15 ~ 64岁人口总数 65岁及以上人口数 100% 15 ~ 64岁人口总数
定性资料的统计描述
( qualitative data statistical description 要求: )
1.掌握常用相对数的适用条件及应用
2.掌握医学人口常用统计指标和疾病统计常用指标 3.了解动态数列分析指标及特点
第一节
一、定性资料的构成比
定性资料的分布特征
表3-1 某医院2001年住院病人5类疾病的死亡情况
第二节
医学人口统计常用指标
一、 医学人口资料的来源 (medical population information )
(一)人口普查
人口普查是收集资料、整理和分析一个国家或地区在某一特定时间的人口、经济和社 会资料的全过程。通常由国家政府主持,每隔5~10年进行一次。 建国以来,我国先后进 行了5次人口普查: 1953年、1964年、1982年、1990年、2000年。
1.计算相对数的分母不宜过小 2.分析时不能以构成比代替率(见表) 3.不能用构成比的动态分析代替率的动态分析(见表)
[临床医学]3定性资料的统计描述
痢疾 肝炎 流脑 麻疹 腮腺炎 合计
3604 1203 698 890 902 7297
有人据此得出1990年和1980年相比,痢疾发病下降,肝 炎发病上升最明显的结论。
例:某班有男生50人,女生20人,男生英 语四级通过率为80%,女生四级通过率为 100%,请问该班四级通过率为多少?
答案1:90%。 答案2:85.7%
应用相对数时应注意的问题
1)分母数据一般不宜过小 2)不能以频率型指标代替强度型指标 3)正确合并估计频率(或强度)型指标 4)相对数进行比较应注意可比性 5)对相对数的统计推断
例:某医生治疗了4例支气管哮喘病患者, 其中3例有效,即报告有效率为75。
请问该说法是否正确?
某医院统计1985-1990年儿科住院病人疾病种类分 布情况见表:
例 某中学卫生科追踪了40名新生入学后吸 烟行为的情况,发现2名学生在半年时开始吸 烟,3名学生在2年时开始吸烟,其余学生在 初中三年未发生吸烟行为。问三年中吸烟的 发生率为多少?
2+3 吸烟发生率 100%=4.5%/人年 0.5 2+2 3+3 35
平均每年有4.5%的学生开始吸烟。
一、定性资料的频数分布表
表
市区 Ⅰ Ⅱ Ⅲ Ⅳ
某市某年各区急性传染病发生数及其相对数
各区与Ⅰ区 发病数之比 - 1.25 0.68 0.62 各区发生数 构成(%) 18.9 23.5 12.8 11.6 各区发病率 (1/10万) 382 779 236 458
年平均人 急性传染病 口数 发生数 636723 389540 699712 328363 2433 3033 1650 1503
表 某医院儿科住院病人疾病种类分布情况 疾病种类 病人数 % 先天性心脏病 风湿性心脏病 250 750 23.8 71.4
第三章 定性资料的统计描述
病人共观察了127859人日(例均25.4日),其中 有596人在医院发生感染,则 院内感染率=596/127859=0.0047人/人日 意味着平均每天有0.47%的病人将在医院获得感染。
(三) 相对比型指标
相对比型指标是A、B两个有联系的指标之比。
对比的两个指标可以性质相同,也可以性质不同。
公式为:相对比型指标=A指标 / B指标
30.86 37.04 24.69 6.17 0 0 1.24
71.43 46.15 166.67 16.67 0 0 10.00
合计
1621
81
100.00
49.97
第二节 死亡率的标准化 P305
一、死亡率标准化的意义和思想
比较两个总率时,若两组资料内部各小组的率有明显差
别,而且各小组内部构成也明显不同时,则不能直接比较。
动态数列的常用分析指标:
一、 绝对增长量 说明事物在一定时期所增加的绝
对数量。可分别计算累计增长量和逐年增长量。 1. 累计增长量:报告年的指标与某一固定年(基 期水平)指标之差。 2. 逐年增长量:报告年的指标与前一年指标之差。
表3-9 某大学1992~2002年本科专业招生动态变化
学生 人数 (3) 4200 4500 4800 4900 5150 5320 绝对增长量 累计 (4) 300 600 700 950 1120 逐年 (5) 300 300 100 250 170 发展速度% 定基比 (6) 100.0 107.1 114.3 116.7 122.6 126.7 环比 (7) 100.0 107.1 106.7 102.1 105.1 103.3 增长速度% 定基比 (8) 7.1 14.3 16.7 22.6 26.7 环比 (9) 7.1 6.7 2.1 5.1 3.3
医学统计学定性资料的统计描述
卡方检验在医学领域应用
疾病与基因型关联分析
01
通过比较不同基因型在疾病组和对照组中的分布差异,判断基
因型与疾病是否有关联。
临床试验效果评价
02
比较不同治疗方法在患者中的疗效差异,如药物疗效、手术效
果等。
医学影像学诊断准确性评估
03
通过比较影像学诊断结果与金标准诊断结果的一致性,评估影
像学诊断方法的准确性。
非数值性
定性资料不以数值形式表示,而是用 文字、符号等描述。
类别性
定性资料通常按照不同的类别或属性 进行分类。
主观性
定性资料的收集和分析往往涉及主观 判断和解释。
常见定性资料类型
分类资料
按照某种特征或属性将数据分成不同的组别,如性别、 血型等。
顺序资料
除了分类外,还具有一定程度的顺序或等级关系,如 病情严重程度、治疗效果评价等。
数分布表。
图表展示技巧与规范
选择合适的图表类型
根据数据的性质和特点,选择合适的图表类 型,如直方图、条形图等。
数据点标识
在图表中标识出重要的数据点,如最大值、 最小值、平均值等。
图表标题和坐标轴标签
为图表添加标题和坐标轴标签,以便读者理 解图表内容。
图例和颜色使用
使用图例说明不同数据系列的含义,并合理 运用颜色以增强图表的可读性。
整性。
02
Fisher确切概率法计算
根据研究目的和假设,选择合适的统计软件或编程语言实现Fisher确切
概率法的计算过程。
03
结果解读与报告
对计算结果进行解读和分析,将结果以图表或文字形式呈现,并结合专
业知识对结果进行解释和讨论。同时,需要注意结果的可靠性和可重复
第3章 定性资料的统计描述
某事件发生的平 均强度
二、应用相对数的注意事项
(一)计算相对数的分母不宜过小 一般来讲,观察单位数足够大时,计算的相对数 比较稳定,能够正确反映实际情况。如果观察单位太 少,直接用绝对数表示。
(二)分析时不能以构成比代替率,也不能以构成比 的动态分析代替率的动态分析。 构成比和率都是相对数,但两者又属不同的概念, 用时应注意两者的区别。
(三)计算观察单位不等的几个率的平均率时,不能将几
个率直接相加求其平均率。正确算法是将几个组的患者数
除以总检查人数。
(四)资料的对比应注意可比性 除了被研究的因素不同外,其余的因素应相同或相近, 应在相同条件下进行率和比的对比。 1. 观察对象同质、研究方法相同,观察时间等保持一 致,以保证资料的可比性。 2. 当两个总率进行比较时,如果内部构成不同,需要
第三章 定性资料的统计描述
一、相对数
相对数是两个有联系的指标之比。
常用的相对数指标:率、构成比、相对比
1、率-频率指标
定 义 公 式 常见率的计算
率的意义
(1)定义:它表示某现象发生的频率和强度。 说明某现象实际发生的例数占可能发生某现 象总数的比值。 (2)公式
率 某现象实际发生的例数 K 可能发生某现象的总数
2)人口抽样调查:与人口普查相比,人口抽样调查相对 省时省力,可以多次进行,也可以一次调查较多的项
目,或者对一个问题进行深入研究。可以在短时间内
得到调查资料和研究结果,根据样本特征推断总体的 相应特征。人口抽样调查是研究者常采用的方法之一。 3)人口登记:是指人口事件发生后随即进行登记。按照 登记人口资料的性质可以分为三类:生命事件登记、 人口迁移变动登记和户口登记。
死亡率:是指某人群在一定时间内死于某病的人
第三章定性资料的统计描述
一、强度相对数
意义:说明某现象发生的频率或强度,又称为率。常以
百分率(%)、千分率(‰)、万分率(1/万)、十 万分率(1/10万)等表示。
计算:
某时期内发生某现象的观察单位数
率=
×比例基数
同期可能发生某现象的观察单位总数
2020年4月2日星期四
比例基数的选择主要根据习惯用法和 使计算的结果能保留1~2位整数。
可用相邻两年年末(12月31日)人口数的平均值计算年平均 人口数;也可用年中(7月1日零时)人口数代表全年的平均人 口数。
2020年4月2日星期四
徐州医学院卫生事业管理教研室
12
(二) 人口构成及其统计指标
人口学的基本特征包括年龄、性别、文化、职业等,其中 最常用来描述人口构成情况的是性别和年龄。
表3-2 人口学特征指标
指标
分子
分母
基数 指标类型
老年(人口)系数 ≥65岁人口数 人口总数
100% 频率型
少儿(人口)系数 ≤14岁人口数 人口总数
100% 频率型
总负担系数 少儿负担系数
≤14岁人口数 +≥65岁人口数
≤14岁人口数
15~64岁人口数 100% 15~64岁人口数 100%
频率型 相对比型
3、年龄组生育率(age-specific fertility rate,ASFR)又称年 龄别生育率,消除了育龄妇女内部年龄构成不同对生 育水平的影响。
2020年4月2日星期四
徐州医学院卫生事业管理教研室
21
4、终生生育率(life-time fertility rate, LTFR)说明 一批经历过整个育龄期的同龄妇女一生的实际生 育水平。
徐州医学院卫生事业管理教研室
定性资料的统计描述(1)
例如 1个人患病10天,为 10个人日,10个人患病1 天也为10个人日。
例3-3 在某医院的院内感染调查中,5031个 病人共观察了127859人日(例均25.4日),其中 有596人在医院发生感染,则 院内感染率=596/127859=0.0047人/人日 意味着平均每天有0.47%的病人将在医院获得感染。
5
2022466 25 159 62.0
11
2024535 27 157 68.0
2
2025834 20 158 66.0
4
2019464 24 158 70.5
3
2025783 29 154 57.0
7
职业 无 无
管理员 无
商业 无 无 无
干部
变量 variables
文化程度 中学 小学 大学 中学 中学 小学 中学 中学 中学
定性变量 无序分类:如性别、职业、血型等;
有序变量(有序多分类 )
定量资料(计量资料)
资料的类型
计数资料(二项分类 、无序多分类)
定性资料 有序分类:如血清反应、疗效划分等。
(分类资料) 等级资料(有序多分类 )
计量资料:变量值是定量的,有单位的,表示为数值的大小。
计数资料:变量值是定性的,没有单位,表示为互不相容的类别。
率和构成比的区别(补充)
构成比
率
1。各部分可直接相加
各率不可直接相加。
2。各部分之和等于100%。 总率不一定等于各率之和。
3。某部分变化,其它部分随 某率的变化,不影响其它各
之变化。
率。
4。是说明比重和分布的,反映事 物内部各个部分之间的比例关系。
表示某现象发生的频率和强度。
(三) 相对比型指标
定性资料的统计描述
常用的相对数
构成比(proportion ) 率(rate) 比(ratio)
构成比(proportion )
概念:说明某一事物内部各组成部分所占比重 或分布,常用百分数表示。
某一组成部分的观察单位数 构成比 100% 同一事物各组成部分的观察单位总数
–总体内各组构成比的总和应为100%。
Hale Waihona Puke 与生育、妇幼保健有关的指标
婴儿死亡率infant mortality rate 新生儿死亡率neonatal mortality rate 围产儿死亡率perinatal mortality rate 5岁以下儿童死亡率mortality rate under age 5 孕产妇死亡率maternal mortality rate 出生率birth rate 自然增长率natural increase rate 总生育率general fertility rate 年龄别生育率age-specific fertility rate 人工流产率induced abortion rate
同或相近。
两比较组的内部构成应相同或相近。
例6:电子科大某班和华西医大某班比
较100米跑优秀率(不分性别均以14.5 秒为优秀),两班男女生人数及优秀率
见表5:
表5 两班人数及百米跑优秀率统计
性别 男生 女生 合计 电子科大某班 人数 60 10 70 优秀率 (%) 60.00 10.00 52.86 华西医大某班 人数 30 30 60 优秀率 (%) 70.00 20.00 45.00
患病率
检查时发现的某病现患病例总数 某病患病率 k 该时点受检人口数
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
病人编号
药物
疗效
1
新药
有效
2
安慰剂
无效
3
安慰剂
有效
4
新药
有效
5
安慰剂
无效
6
新药
有效
7
新药
无效
8
安慰剂
有效
9
安慰剂
无效
…
…..
….
200
新药
有效
分组
新药 安慰剂 合计
实验人数
50 150 200
构成比 (%) 25 75 100
分组 新药 安慰剂 合计
有效 40 50 90
无效 10 100 110
表 某市1980年和1990年五种传染病发病情况
病种
痢疾 肝炎 流脑 麻疹 腮腺炎 合计
1980年
病例数
构成比 (%)
3604
49.39
1203
16.49
698
9.56
890
12.20
902
12.36
7297
100.00
1990年
病例数
构成比 (%)
2032
37.92
1143
21.33
542
10.11
Ak
100%
构成比K
A1
AK A2
Ak
100%
K个构成比的合计为100%
汉族不同年龄组孕妇携带HBsAg情况
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
年龄(岁) 受检人数 HBsAg 阳性人数 阳性比(%) 阳性率(%)
─────────────────────────────
甲地区流脑流行比乙地区严重 如已知小学生总人数:甲地区50051人,乙地区14338 人,可算出两个发病率:
甲地区流脑发病率:63/50051×1000‰=1.26‰ 乙地区流脑发病率:35/14338 × 1000‰=2.44‰
乙地区流脑流行比甲地区严重
相对数的概念和意义
概念:相对数是两个有联系的指标之比。 两个特点:
64
100.0
绝对数的概念与意义
调查研究和实验研究得到的计数资料或等级资料经过整理, 清点数目得到的数值称为绝对数。 如某病的发病人次数、医院收容人数、治愈人数等。 绝对数反映一定条件下某种事物的规模或水平,是计划或总 结工作的依据, 绝对数是计算相对数与平均数的基础。 绝对数往往不便于比较。
例:调查得某年小学生中流脑发病:甲地区63例,乙地区35例。
≤20
36
4
3.2
11.1
21-
985
60
48.8
6.1
26-
999
52
42.3
5.2
31-
263
6
4.9
2.3
36-
44
1
0.8
2.3
──────────────────────────
Байду номын сангаас
合计
2327
123
100.0
5.3
(3) 特 点
a. 一组资料各部分构成比之和为100%;
b. 当某一部分构成比增大时,其余部分的构成 比相应减少。
强度
某事件发生的观察单数
(可能发生某事件的单位数 观察时长) K
3-2a
比例基数(K )可以是100%、1000‰、……,其选取是根据习惯用法和需要选用,主
要使算得的率至少保留1~2位整数,便于阅读。
患病率、发病率、感染率 : 百分率(%)
人口出生率与死亡率:
千分率(‰)
肿瘤死亡率:
十万分率(l/10万)
合计 50 150 300 500
2. 二分类变量的频率分布
表 3-2 调查对象是否白细胞减少症患者的分布情况
调查对象
例数
频率 (%)
(1)
(2)
(3)
患者
64
5.7
非患者
1050
94.3
合计
1114
100.0
3. 多分类变量的频率分布
例3-1 某课题组为 研究白细胞减少症 与工作环境的关系, 用随机抽样的方法 于2004年对某市企 业中的四个工种 1114名工人进行了 调查。依据白细胞 减少症的诊断标准 判断调查对象是否 患者。
例 3-2 某企业每年都对职工进行体检。2003 年有老职工 2714 名,7 月 1 日新进的职工 250 名,该企业这一年新发生高血压病人 5 例,2003 年的高 血压发病率为
767
14.31
875
16.33
5359
100.00
(4)构成比的统计学意义
事物内部某组成部分的构成比越大,说明它所占 的比重越大,它出现的观察单位数也越多。
二、 率
率是强度型指标,是指单位时间内某现象发生的频率,如人时发 病率的分子是新发生事件数,分母是人时数的总和。强度(intensity) 的计算公式为:
合计 50 150 200
关于孕妇分娩的原始资料记录
住院号 年龄 职业 文化程度 分娩方式 妊娠结局
2025655 27 无
中学
顺产
足月
2025653 22 无
小学
助产
足月
2025830 25 管理人员 大学
顺产
足月
2025677 24 知识分子 中学
顺产
早产
2025647 30 管理人员 大学
顺产
第三章 计数资料的统计描述
内容
计数资料的频率分布 常用相对数指标 粗率的标准化法
动态数列及其指标 医学上常用指标
第一节 计数资料的频率分布
一 计数资料的频数表
按类别或属性,分别清点各类别或属性的观察单位数
(频数),分类变量及相应的频数所组成的频数表,
称分类资料的频数表
某药对200例高血压患者的疗效
1、概念:说明某事物内部各组成部分所占的比 重或分布
2、计算公式:
比
某一组成部分的观察单位数 各组成部分的观察单位总数
100%
构成比
A1
100%
A1 A2 A3 A4
设某事物个体数的合计由A1,A2,…,AK个部分组成,构成比计算为:
构成比1
A1
A1 A2
Ak
100%
构成比2
A1
A2 A2
工种 (1) 苯作业 塑料作业 化学药物 放射作业 合计
表 3-1 不同工种调查对象和白细胞减少症患者的分布
调查对象
例数
频率 (%)
(2)
(3)
389
34.9
例数 (4) 29
患者 频率 (%) (5) 45.3
311
27.9
13
20.3
260
23.4
13
20.3
154
13.8
9
14.1
1114
100.0
表示事物出现的频度。 把基数化作相等,便于比较。
第二节 常用相对数指标
❖ 相对数(Relative number):是两个有关联的数据之比, 用以说明事物的相对关系,便于对比分析。
❖ 常用的相对数指标很多,按联系的性质和说明的问题不同, 主要分为:率、构成比、相对比三类。
一、构成比 proportion
足月
2025848 32 无
小学 剖宫产 足月
2019915 27 无
中学
顺产
死产
2025861 29 无
大学 剖宫产 足月
…
……
…
…
…
2000386 26 无
小学
顺产
足月
按文化程度与分娩方式整理资料
文化程度 小学 中学 大学 合计
顺产 助产 剖宫产
40 5
5
100 20
30
200 10
90
340 35 125