分类变量的统计描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节 标准化法及其应用
病型 普通型 重型 合计
病人数 300 100 400
表 5-4 甲疗法 治愈数
180 35 215
甲、乙两种疗法治疗某病的治愈率比较
乙疗法
治愈率(%) 病人数 治愈数
60.0
100
65
35.0
300
125
53.8
400
190
治愈率(%) 65.0 41.7 47.5
第二节 标准化法及其应用
4.24 100.00
患病率(%) ⑸=(3)/(2)
12.14 29.25 45.61 65.10 86.36 30.52
→计算相对数时分母应有足够数量
→正确地合并估计频率(或强度)型指标
应用相对数应注意的事项:
例:某县的3个乡上报了1994年的肠道传染病统计料,结 果如下:甲乡人口数是91960 ,肠道传染病的发病人数为 1122 例,乙乡人口数是76740,肠道传染病的发病人数为 1499例,丙乡人口数是108930,肠道传染病的发病人数为 866例。 请回答: 1.那个乡的肠道传染病发病率高? 2.3个乡肠道传染病的平均发病率是多少?
第一节 定性变量的分布特征
二、常用的相对数指标
3. 比
上海常住人口出生婴儿性别比约为107:100; 深圳市出生人口男女性别比例为120.8∶100; 北京流动人口在京出生的性别比例高达128∶100; 重庆现在的男女比例为140∶100, 海南、广东等省出生的性别比例竟然高达130:100以上;
符号 (2)
a0 a1 a2 a3 a4 a5 a6 a7 a8 a9 a10
学生 人数 (3)
4200 4500 4800 4900 5150 5320 5510 5780 5950 6000 6200
绝对增长量
累计 逐年 (4) (5)
Biblioteka Baidu
-
-
300
300
600
300
700
100
950
250
1120
全国出生人口性别比为117。
第一节 定性变量的分布特征
二、常用的相对数指标
3. 比
比是指任何两个相关联的变量A与B之
比。 相对比=A/B
A和B可以是绝对数、相对数和平均数,A和B的量纲可以不 同,也可相同,但A和B互不包含.
最常见: 体质指数(BMI)、男女性别比等
第一节 定性变量的分布特征
二、常用的相对数指标
260
400
35.0
140
41.7
167
800(N) 53.8
380
47.5
427
第二节 标准化法及其应用
2.间接标准化法 例5-6 经研究表明,女性原发性骨质疏松随年龄增长患
病率增高。1998年某省在城市和农村分别抽样调查了 50岁以上的老年妇女776例和789例,这些人中患有原 发性骨质疏松症者城市为322例,农村为335例,总患 病率分别为41.5%和42.5%。 由于本次调查的城乡老年妇女年龄构成不同,如表5-7 第2栏和第5栏,需对两个总患病率进行标准化后方可比 较。
第三章 分类变量的统计描述
主要内容:
第三章 分类变量的统计描述
分类变量的频数分布及其统计指标 标准化法及其应用 动态数列及其应用
第一节 分类变量的频数分布及其统计指标
分类变量的频数分布
表3-1 某单位高血压患病情况
年龄(岁) (1) 20~ 40~ 50-60 合计
检查人数 (2) 2000 1500 500 4000
应用相对数应注意的事项:
→防止概念混淆
应用相对数应注意的事项: 率与构成比的误用
年龄组 ⑴ 40~ 50~ 60~ 70~ ≥80 合计
受检人数 ⑵ 560 441 296 149 22 1468
白内障例数 ⑶ 68 129 135 97 19 448
患者年龄构成比(%) ⑷
15.18 28.79 30.13 21.65
776
322
41.5
789
335
患病率(%) (7) … … … …
42.5
第二节 标准化法及其应用
年龄组
(岁)
(1)
50~ 60~ 70~ 80 及以上 合计
表 5-8
标准患病率
Pi
(2)
21.3 46.1 65.5 71.7 42.1
按式(5-12 )用间接法计算标准化患病率(%)
城市
农村
人口数
预期患病人数
人口数
预期患病人数
ni
(3)
ni Pi
(4)=(2)(3)
ni
(5)
ni Pi
(6)=(2)(5)
354
75
251
116
130
85
41
29
776
305
241
51
315
145
175
115
58
42
789
353
第二节 标准化法及其应用
三、应用标准化时的注意事项
1.标准化法只适用于某因素两组内部构成不同,并有可 能影响两组总率比较的情况。
一、常用的相对数指标
三种类型:
比率 速率 比
第一节 分类变量的频数分布及其统计指标
二、常用的相对数指标 1.比率
频表示事物内部某个组成部分所占的比重,包 括:频率指标和构成比指标。
频率
发生某现象的观察单位 数 可能发生某现象的观察 单位总数
K
分子是分母的一部分;无量纲,在0~1范围内取值;K
是比例基数,可取100%,1000‰、10万/10万等,根据 习惯用法来决定。
若已知年龄别死亡率,可采用直接法;
若只有总死亡数和年龄别人口数而缺乏年龄 别死亡率时,或各年龄组人口数较小,年龄别 死亡率不稳定时,宜用间接法。
第二节 标准化法及其应用
二、标准化率的计算
选择标准构成的方法通常有三种: 1.两组资料中任选一组资料的人口数(或人口构成)作
为两者的“共同标准”。这种方法适用于直接法。 2.两组资料各部分人口之和组成的人口数(或人口构成)
第二节 标准化法及其应用
表 5-7 1998 年某省城乡女性原发性骨质疏松症患病率比较
年龄组
城市
农村
(岁) (1)
调查人数 患病人数 患病率(%)
(2)
(3)
(4)
调查人数 (5)
患病人数 (6)
50~
354
…
…
241
…
60~
251
…
…
315
…
70~
130
…
…
175
…
80 及以上
41
…
…
58
…
合计
→相对数间的比较要具备可比性:
应用相对数应注意的事项:
例 观察比较两学校在校学生的吸烟率,结果见下表
组别
男生 女 合计
表 10-2 两校学生吸烟率比较
医科大学
在校学 吸烟人 吸烟率
生数 数
(%)
1000 100 10.00
在校学 生数 9000
工业大学
吸烟人 吸烟率
数
(%)
450 5.00
9000 90
2.标准化率已不再反映当地的实际水平,它只表示相互 比较的几组资料间的相对水平。
3.两样本标准化率为样本值,若了解两样本标准化率之 间的差别是否有统计学意义,应进行假设检验。
第三节 动态数列及其分析指标
表3-9 某大学1992-2002年本科专业招生动态变化
年份 (1)
1992 1993 1994 1995 1996 1997 1998 1998 2000 2001 2002
工龄 (年) <3 ≥3 合计
人数
表 3.2 甲厂 患病人数
甲、乙两厂同工种工人某病的患病率
乙厂
患病率(%)
人数 患病人数
患病率(%)
400
12
3.0
100
18
18.0
500
30
6.0
100
2
2.0
400
40
10.0
500
42
8.4
第二节 标准化法及其应用
一、标准化法的基本思想
要正确比较两厂的合计患病率,必须先将两 组工人的工龄构成按照统一标准进行校正,然 后计算出校正后的标准化患病率再进行比较。 这种用统一的内部构成,然后计算标准化率的 方法,称为标准化法。
该年新发某病的病例数 同年内能发生某病的平 均人口数
K
第一节 定性变量的分布特征
二、常用的相对数指标 2.速率:
例 在某医院的院内感染调查中,5031个病人共 观察了127859人日(例均25.4日),其中有 596人在医院发生感染,求医院感染率。
医院感染率=596/127859=0.0047人/人日 意味着平均每天有0.47%的病人将在医院获得感染。
表 3-2 COPD病 人 与 非 病 人 的 吸 烟 情 况 资 料
有吸烟史 无吸烟史 合计
COPD病 人
231
125
356
非病人
183
296
479
合计
414
421
835
吸烟率 64.89% 38.02% 49.58%
第一节 定性变量的分布特征
二、常用的相对数指标 2.速率:
速率表示单位时间内某现象发生的频率。如人
时发病率的分子是新发生的事件数,分母是人时
数(观察人数乘以时间)的总和,多用于大人群 长时间随访的资料。
速率
某事件发生的观察单位数
(可能发生某事件的观察单位数时间)
K
第一节 定性变量的分布特征
二、常用的相对数指标 2.速率:
人年发病率
观察期间内某疾病新发病例数
(每个观察单位数 观察年数)
K
发病率
患病人数 患者构成比 患病率 (3) %(4) %(5)
140
33.3
7.0
180
42.9
12.0
100
23.8
20.0
420
100.0
10.5
第一节 定性变量的分布特征
二、常用的相对数指标
1.比率
男 81.6%
不详
女
1.5%
16.9%
中国累积报告的HIV感染者按性别分布图
1985 — 2001.6
人 数 (n) 4
183 54 53 3 13
构 成 比 (%) 1.29
59.03 17.42 17.10
0.97 4.19
人 数 (n) 23 50 27
125 2
130
构 成 比 (%) 6.44
14.01 7.56
35.01 0.56
36.42
合 计 310
100.00
357
100.00
第一节 分类变量的频数分布及其统计指标
1.00 1000
5
0.50
10000 190 1.90 10000 455 4.55
观察的对象是否同质,研究的方法(如检测手段、抽样
方法)是否相同,观察的时间是否一致等;被比较的总体
是否具有可比性。
→对相对数的统计推断
第二节 标准化法及其应用
一、标准化法的基本思想
例如表3-2两种疗法的治愈率比较。
第一节 分类变量的频数分布及其统计指标
二、常用的相对数指标 1.比率
构成比 同一某事一物组各成组部成分部的分观的观察察单位单数位总数100%
问: 结合例3.1谈谈构成比与频率的区别。
表3-1 某单位高血压患病情况
年龄(岁) (1) 20~ 40~ 50-60 合计
检查人数 (2) 2000 1500 500 4000
病型
(1) 普通型 重型 合计
表 5-5 按式(5-10)用直接法计算标准化治愈率(%)
甲疗法
乙疗法
标准治
疗人数 原治愈率 预期治愈数 原治愈率 预期治愈数
(Ni) (2)
(pi)
(Nipi)
(pi)
(3) (4)= (2)(3) (5)
(Nipi) (6) = (2)(5)
400
60.0
240
65.0
患病人数 患者构成比 患病率 (3) %(4) %(5)
140
33.3
7.0
180
42.9
12.0
100
23.8
20.0
420
100.0 10.5
第一节 分类变量的频数分布及其统计指标
表 3-1 吸 毒 与 非 吸 毒 人 群 职 业 构 成 对 比 分 析
吸毒组
非吸毒组
职业 学生 无业 个体 工人 司机 其它
170
1310
190
1580
270
1750
170
1800
50
2000
200
发展速度% 定基比 环比 (6) (7) 100.0 100.0 107.1 107.1 114.3 106.7 116.7 102.1 122.6 105.1 126.7 103.3 131.2 103.6 137.6 104.9 141.7 102.9 142.9 100.8 147.6 103.3
第二节 标准化法及其应用
一、标准化法的基本思想
标准化法的基本思想是:采用某影响因素 的统一标准构成,对内部构成不同的各人群 率进行调整,以消除人口构成不同对人群总 率的影响,使标准化率具有可比性。
常用计算方法: 直接法 间接法
第二节 标准化法及其应用
二、标准化率的计算
根据已有资料的条件,采用不同的方法计算标准化率 如:对死亡率的年龄构成标准化
作为两者的“共同标准”。这种方法适用于直接法。 3.另外选用一个通用的或便于比较的标准作为两者的
“共同标准”,如采用全国、全省或全地区的数据作为 标准。
第二节 标准化法及其应用
二、标准化率的计算
计算标准化率的步骤: 1.根据对比资料所具备的条件选用直接法或间
接法。 2.选定标准构成。 3.选择公式计算标准化率
例3-1 某医生研究了慢性阻塞性肺病(COPD)病人的吸 烟情况,自1998~2000年收治COPD病人356人,其中 231人有三十年及以上的经常吸烟史(日平均1支以上),在 本院其它科室收治的同年龄组段的非COPD病人(无其它呼 吸系统疾患)479人,其中有三十年及以上的经常吸烟史的 183人,试计算并比较两组病人的吸烟率。