chapter3定性资料的统计描述
合集下载
第3章 定性资料的统计描述
表36 测量生育水平的统计指标
指标
分子
分母
基数
指标类型
粗出生率
同年活产数
同年平均人口数×1年
1000/千 强度型(近似)
总生育率 年龄别生育率
总和生育率
同年活产数
同年15~49岁妇女数
同年某年龄组活产数
同年某年龄组平均妇女数×1 年
是1549岁年龄别生育率的总和
1000/千 1000/千
相对比型 强度型(近似)
n医学人口统计不仅是制定卫生工作计划及确定卫生政策的重要依据,也 是了解人群健康水平及评价卫生工作效果的重要依据。
2
(一)医学人口统计资料的来源
n 1、日常工作记录(报告单、卡、册) n 2、统计报表 n 3、人口调查(抽查和普查)
3
(二)描述人口学特征的常用指标
1、人口总数
一般指一个国家或地区在某一特定时间的人口数 一般采用一年的中点,即7月1日零时为标准时点进行统计 统计人口数的方法:实际制 和 法定制
4
2、人口学特征指标
人口学的基本特征包括性别、年龄、文化、职业等,其中最常用来描
述人口结构的是年龄和性别。常用人口学指标如下:
表35 人口学特征指标
指标 老年(人口)系数 少儿(人口)系数 总负担系数
少儿负担系数 老年负担系数 老少比 性别比
分子
≥65 岁人口数 ≤14 岁人口数 ≤14 岁人口数 + ≥65 岁人口数 ≤14 岁人口数 ≥65 岁人口数 ≥65 岁人口数 男性人口数
9
n 5岁以下儿童死亡率(child mortality rate under age 5)是近些年来国 际组织推荐并应用较多的综合反映儿童健康水平和变化的主要指标。
研究生统计试讲内容 定性资料的统计描述
例 如某地某年龄组男性吸烟和非吸烟的冠心病 死亡资料:
吸烟组
非吸烟组
死亡数
104
12
观察人年数
43248
10673
死亡率(1/10万人年) 240.5
19
112.4
3. 两个相对比之比
例如病例对照研究中的比值比(OR)
例 服用反应停与肢体缺陷关系病例对照研究的资料如下 所示:
表4 服用反应停与肢体缺陷关系病例对照研究
17
1. 两类个体例数之比
R=
A类发生的例数 B类发生的例数
如我国1982年人口普查的男性人口数为 519433369,女性488741919人,求人口数的男 女比例。
R=519433369 1.063 488741919
18
2. 两个率之比
R= P1 P2
RR= 240.5 2.139 112.4
1000
/1000
1.76人 /1000 人年
意味着平均每年有1.76‰的病人将新发高血压
16
(三)相对比型指标
相对比指标:任何两个相关联的变量A与B之比。 相对比型指标=A/B
表示相对于B的一个(或十个、百个、千个等) 单位,A有多少个单位。
A和B可以是绝对数、相对数和平均数。 A和B的量纲可以相同,也可以不同。 A和B互不包含。
43
表3-7 2001年我国部分市县 前五位主要疾病死亡专率及死亡原因构成
)
呼吸系统 137.42 22.46
脑血管病 112.60 18.95
恶性肿瘤 105.36 17.73
心脏病
77.72 13.08
损伤与中毒 63.69 10.72
城市 死亡专率 构成比
第三讲 定性资料的统计描述
18
习题
1.某调查显示,某病患者100人,其中男性80人,女性 20人,分别占80%和20%,则结论为:
A.该病男性易得 B.该病女性易得 C.该病男女患病程度相等 D.该资料可以计算出男女性的患病率 E.尚不能得出有关患病情况的结论
2.某诊所称称专治某疑难杂症,其宣称“本诊所收治10 名患者,治愈8名,治愈率高达80%”,对此如何评 价?
6
1.频率型:
说明某现象发生的频率。用于反映某事物或现 象发生可能性大小,常称作率。率越高,事物 发生的可能性越大。
发生某现象的观察单位数 率 K 可能发生某现象的率、病死 率、治愈率。总体率用π表示,样本率用P表示。
7
2.结构型
构成指标,说明某一事物内部各组成部分所占 的比重,常以百分数表示。也称作构成比。
第二节 率的标准化
一、标准化的意义 率的标准化是为了在比较两个不同人群的 患病率、发病率、死亡率等资料时,消除 其内部构成(如年龄、性别、工龄、病程 长短等)的影响,使之具有可比性。
13
二、标准化率的计算—直接法
1.标准人口的选取方法: 选取一个包含比较各组的有代表性的、 较稳定的、数量较大的人口为标准。如 世界的、全国的、全省的或本单位历年 积累的数据。 取比较各组的各层例数的合计为标准。 从比较的各组中任选其一为标准。
某一部分的观察单位数 构成比 100% 同一事物各组成的观察单位总数
举例:300人中,A型血40人,B型血200人,O 型血40人,AB型血20人,那么B型占66.7%。 特点:各部分构成比之和为1
8
三、速率(rate)
强度型指标,与比率的最大区别是分母中含 有时间,反映单位时间内某事件出现的可能 性大小。多用于面向人群的出生、死亡和发 病资料的统计 。
卫生统计学:第3章 定性资料的统计描述
1.单位时间内某现象发生的频率
强度
发生某现象的观察数 (可能发生该现象的观察单位数
时间)
K
式中:K为比例基数,常以百分率(%)、千分率(‰)、
万分率(1/万)、十万分率(1/10万)表示, 原则: ⑴使计算结果至少保留1~2位整数。
⑵习惯:医学资料中某些指标的比例基数是固定的。
11
例3-2 某企业2003年有2839名工人,该企业每年对 职工进行体检,这一年新发生高血压病人5例,
26
间接法
应用条件: 已知发生总数及各组观察单位数,及标准率 计算公式:
p' p r
N i Pi
27
例3-6 某地观察了吸烟者与不吸烟者各年龄组人数如下表。 同时观察期内吸烟者中有432人死于肺癌,不吸烟者中有210 人死于肺癌,试计算吸烟者与不吸烟者的标准化死亡率。
表3-6 两组肺癌死亡率(1/10万)的标化(间接法)
(3)如不计算标准化率,而分别比较各组的率, 也可得出正确结论,但不能比较总率的大小。
(4)两样本标准化率是样本值,存在抽样误差, 应作假设检验。检验方法比较麻烦。
30
4、标准化法使用注意事项
(1)标准化法是采用统一标准人口年龄构成,以 消除混杂因素的影响;
(2)标准化后的率并不表示某地实际水平,只能 表明相对水平;
100.67
不吸烟者
观察人年 数Ni2
预期死亡 人数Ni2Pi
189370
13.33
104762
26.92
60043
65.00
80%27540100% 72.69
14532
65.67
396247
243.61
28
03定性资料的统计描述
发展速度:表示报告期指标的水平相当于基 期水平的百分之多少或若干倍。可计算定 基比发展速度与环比发展速度
• 计算公式
an • 定基发展速度= a0
an • 环比发展速度= a n- 1
增长速度:表示的是净增加量。 增长速度 = 发展速度% - 100% =发展速度-1
平均发展速度 平均发展速度:是各环比发展速度的几何平均 数,说明某事物在一个较长时期中逐年平 均发展变化的程度。
• 3.计算各组的调整率或标准化率(P’)
N i PP N i i i P'' P N i N
i
5-4
**其他标准化方法不要求掌握
表3-10直接法计算标准化治愈率
N i Pi 380 P甲 ' 47.5% N i 800
427 P ' 53.4% 乙 800
动态数列及其分析指标
例: 表3-9甲乙两疗法某病治愈率%比较
• 病型 • • • 普通型 • 重型 病人 数 300 100
甲疗法 治愈 数 180 35 治愈 率 60.0 35.0 病人 数 100 300
乙疗法 治愈 数 65 125 治愈 率 65.0 41.7
• 合计
400
215
53.8
400
190
47.5
1580 1750 1800 2000
190
270 170 50 200
131.2
137.6 141.7 142.9 147.6
103.6
104.9 102.9 100.8 103.3
31.2
37.6 41.7 42.9 47.6
3.6
4.9 2.9 0.8 3.3
03定性资料统计描述
增长速度
47
某大学1992-2002年本科专业招生动态变化
绝对增长量 年份 (1) 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 符号 (2) a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 a11 学生人数 (3) 4200 4500 4800 4900 5150 5320 5510 5780 5950 6000 6200 累计 (4) - 300 600 700 950 1120 1310 1580 1750 1800 2000 逐年 (5) - 300 300 100 250 170 190 270 170 50 200 发展速度% 定基比 (6) 100.0 107.1 114.3 116.7 122.6 126.7 131.2 137.6 141.7 142.9 147.6 环比 (7) 100.0 107.1 106.7 102.1 105.1 103.3 103.6 104.9 102.9 100.8 103.3 增长速度% 定基比 (8) - 7.1 14.3 16.7 22.6 26.7 31.2 37.6 41.7 42.9 47.6 环比 (9) - 7.1 6.7 2.1 5.1 3.3 3.6 4.9 2.9 0.8 3.3
• 率的比较时应注意可比性
• 样本率或构成比比较时应作假设检验
39
案例讨论1
• 一篇名为《600例小儿烧伤休克期治疗分析 》的文章,原作者指出:“600例烧伤患儿 ,210例早期有休克症状,其中3岁以下者 110例,占52%,3岁以上者100例,占48% ,年龄越小,休克发生率越高。” 上述的结 论是否正确?为什么?
8
表 5-1 44 例埃博拉出血热的职业分布 职业 卫生保健人员 农民 家庭主妇 儿童保育员 警察 例数 16 13 8 6 1 构成比(%) 36.36 29.55 18.18 13.64 2.27
chapter3定性资料的统计描述PPT课件
24
例 某地2003-2005年不同性别新生儿数见下表, 试计算该地不同年份新生儿性别比。
表 7 某地 2003-2005 年新生儿性别比
年 份 新生儿数 男性 女性 性别比
2003
90919 48636 42283 1.15
2004
109671 58908 50763 1.16
2005
125513 66814 58699 1.14
血型
1=A型,2=B型,3=AB 型,4=O型
父亲文化程度 1=文盲,2=小学,3=初 中,4=高中或中专,5=大 专及以上
10
定性资料的统计描述
表3 2010级某班同学性别的分布情况
性别 频数(N) 百分比(%)
男
54
42.5
女
73
57.5
合计
127
100.00
11
定性资料的统计描述
频数表
表3 2010级某班同学性别的分布情况
B型
27
21.30
AB型
18
14.20
O型
49
38.50
合计127Βιβλιοθήκη 100.00绝对数
相对数 14
频数图
频数
60 50 40 30 20 10
0 A型
B型
AB型
O型
图2 2010级某班同学血型分布情况
15
表5 2010级某班同学父亲文化程度的分布情况
父亲文化程度 频数
频率
累积频数 累积频率
文盲
0
0
Statistical Inference
Statistical Inference
Statistical description
例 某地2003-2005年不同性别新生儿数见下表, 试计算该地不同年份新生儿性别比。
表 7 某地 2003-2005 年新生儿性别比
年 份 新生儿数 男性 女性 性别比
2003
90919 48636 42283 1.15
2004
109671 58908 50763 1.16
2005
125513 66814 58699 1.14
血型
1=A型,2=B型,3=AB 型,4=O型
父亲文化程度 1=文盲,2=小学,3=初 中,4=高中或中专,5=大 专及以上
10
定性资料的统计描述
表3 2010级某班同学性别的分布情况
性别 频数(N) 百分比(%)
男
54
42.5
女
73
57.5
合计
127
100.00
11
定性资料的统计描述
频数表
表3 2010级某班同学性别的分布情况
B型
27
21.30
AB型
18
14.20
O型
49
38.50
合计127Βιβλιοθήκη 100.00绝对数
相对数 14
频数图
频数
60 50 40 30 20 10
0 A型
B型
AB型
O型
图2 2010级某班同学血型分布情况
15
表5 2010级某班同学父亲文化程度的分布情况
父亲文化程度 频数
频率
累积频数 累积频率
文盲
0
0
Statistical Inference
Statistical Inference
Statistical description
3定性数据的统计描述
观察对象内部构成
观察时间
同质?
一致?
5.率的标准化
基本思想:采用统一的标准,以消除内部构成不 同对指标的影响,使得计算出来的标准化率具有可 比性。
基本思想和意义 标准化法的意义:消除内部构成的影响
标准化率 (standardized rate) :采用统一的标 准调整后的率,也称调整率(adjusted rate)
年龄别死亡率 = 某年某地某年龄组死亡人数/同年龄别平均人口数✕K
3.死因别死亡率
某病死亡率 = 因某病死亡人数/同年该地平均人口数✕K
4.发病率 发病率= 某时期某病新发病例数/同时期内平均人口数✕k 5.患病率
患病率= 某地某时间点某病患病例数/同时期内平均人口数✕k
6.病死率 病死率=某期间因某病死亡人数/同期某病的患病人数✕100% 7.治愈率 治愈率= 治愈病人数/接受治疗病人数✕100%
例数 29 13 13 9 64
“是否患白细胞减少症”是一个二分类变量。 频率分布情况:
表 3-2 调查对象是否为白细胞减少症患者的频率分布 调查对象 例数 频率(%) 患者 64 5.7 非患者 1050 94.3 合计 1114 100.0
多分类变量的频率分布
不同工种“是否患白细胞减少症”频率分布情况:
每年对职工进行体检,在这一年新发生高血压 病人12例,则:
12 高血压发病率 1000‰ =3.84‰ 3128
常用的强度指标:
死亡指标:死亡率、年龄别死亡率、病死率;
疾病指标:患病率、发病率、治愈率、感染率;
1.死亡率
死亡率= 某年死亡人口总数/同年年平均人口数✕K
2.年龄别死亡率
例如我国2010年人口普查的男性人口数为686852572,
第三章 定性资料的统计描述
病人共观察了127859人日(例均25.4日),其中 有596人在医院发生感染,则 院内感染率=596/127859=0.0047人/人日 意味着平均每天有0.47%的病人将在医院获得感染。
(三) 相对比型指标
相对比型指标是A、B两个有联系的指标之比。
对比的两个指标可以性质相同,也可以性质不同。
公式为:相对比型指标=A指标 / B指标
30.86 37.04 24.69 6.17 0 0 1.24
71.43 46.15 166.67 16.67 0 0 10.00
合计
1621
81
100.00
49.97
第二节 死亡率的标准化 P305
一、死亡率标准化的意义和思想
比较两个总率时,若两组资料内部各小组的率有明显差
别,而且各小组内部构成也明显不同时,则不能直接比较。
动态数列的常用分析指标:
一、 绝对增长量 说明事物在一定时期所增加的绝
对数量。可分别计算累计增长量和逐年增长量。 1. 累计增长量:报告年的指标与某一固定年(基 期水平)指标之差。 2. 逐年增长量:报告年的指标与前一年指标之差。
表3-9 某大学1992~2002年本科专业招生动态变化
学生 人数 (3) 4200 4500 4800 4900 5150 5320 绝对增长量 累计 (4) 300 600 700 950 1120 逐年 (5) 300 300 100 250 170 发展速度% 定基比 (6) 100.0 107.1 114.3 116.7 122.6 126.7 环比 (7) 100.0 107.1 106.7 102.1 105.1 103.3 增长速度% 定基比 (8) 7.1 14.3 16.7 22.6 26.7 环比 (9) 7.1 6.7 2.1 5.1 3.3
[临床医学]3定性资料的统计描述_OK
表 某地1990~1998年床位发展动态
年份
1990 1991 1992 1993 1994 1995 1996 1997 1998
指标 符号
a0 a1 a2 a3 a4 a5 a6 a7 a8
年末床 位数
5420 5608 5766 5886 5991 6284 6609 6955 7352
绝对增长量
疾病种类
死亡人数
百分比(%)
恶性肿瘤
50
33.33
呼吸系统疾病
30
20.00
消化系统疾病
20
13.33
循环系统疾病
40
26.67
传染病
10
6.67
合计
150
100.00
5
第一节 定性变量的分布描述
二、描述定性资料的统计指标
除了用频数分布表、图全面反映定性资 料外,也可以用若干相对数指标从某个侧面 来描述定性变量。相对数指标大致有三种类 型:相对比型指标、频率型指标、强度型指 标。
两比较组的内部构成应相同或相近。
21
例 某病两种疗法的治愈率(%)比较的资料如表
表 某病两种疗法的治愈率(%)的比较
普通型
病例数 60
西医疗法组
中西医结合疗法组
治愈数 治愈率 病例数 治愈数 治愈率
(%)
(%)
36 60
20
13
65
重型
20
8 40
60
27
45
爆发型
20
4 20
20
5
25
合计
100
年龄 组
(1)
标准人 口构成 比
(2)
原死 亡率
第三章 定性资料的统计描述 PPT课件
构成比=
某一组成部分的观察单位数
同一事物各组成部分的观察单位总数
×100%
Ak 构成比 100% A1 A2 Ak
2018年9月26日星期三
徐州医学院卫生事业管理教研室
6
表3-1 某医院90年和98年住院病人五种疾病死亡情况
1990年 疾病构成 恶性肿瘤 循环系统 呼吸系统 消化系统 死亡人数 58 44 37 19 构成比(%) 30.53 23.16 19.47 10.00 40 44 29 18 1998年 死亡人数 构成比(%) 26.85 29.53 19.46 12.08
MANAGEMENT STATISTICS
徐州医学院卫生事业管理教研室
谷玉明 第三章 定性资料的统计描述
第三章 定性资料的统计描述
[教学要求]
了解:定性资料的来源、各种人口学统计指标的应
用。
熟悉:动态数列及其分析指标的应用。 掌握:相对数常用指标、应用相对数的注意事项、
动态数列常用指标(绝对增长量、发展速度、增 长速度、定基比、环比、平均发展速度和平均增 长速度)。
了8589例60岁及以上老人,体检发现高血
压患者为2823例,高血压患病率为:
2823/8589×100%=32.87%
2018年9月26日星期三
徐州医学院卫生事业管理教研室
5
二、结构相对数 意义:表示事物内部某一部分的个体数与该事物 各部分个体总和之比,用来说明各构成部分在 总体中所占的比重或分布,又称构成比,通常 以100%为比例基数。 计算:
住人口数。
可用相邻两年年末(12月31日)人口数的平均值计算年平均 人口数;也可用年中(7月1日零时)人口数代表全年的平均人
口数。
某一组成部分的观察单位数
同一事物各组成部分的观察单位总数
×100%
Ak 构成比 100% A1 A2 Ak
2018年9月26日星期三
徐州医学院卫生事业管理教研室
6
表3-1 某医院90年和98年住院病人五种疾病死亡情况
1990年 疾病构成 恶性肿瘤 循环系统 呼吸系统 消化系统 死亡人数 58 44 37 19 构成比(%) 30.53 23.16 19.47 10.00 40 44 29 18 1998年 死亡人数 构成比(%) 26.85 29.53 19.46 12.08
MANAGEMENT STATISTICS
徐州医学院卫生事业管理教研室
谷玉明 第三章 定性资料的统计描述
第三章 定性资料的统计描述
[教学要求]
了解:定性资料的来源、各种人口学统计指标的应
用。
熟悉:动态数列及其分析指标的应用。 掌握:相对数常用指标、应用相对数的注意事项、
动态数列常用指标(绝对增长量、发展速度、增 长速度、定基比、环比、平均发展速度和平均增 长速度)。
了8589例60岁及以上老人,体检发现高血
压患者为2823例,高血压患病率为:
2823/8589×100%=32.87%
2018年9月26日星期三
徐州医学院卫生事业管理教研室
5
二、结构相对数 意义:表示事物内部某一部分的个体数与该事物 各部分个体总和之比,用来说明各构成部分在 总体中所占的比重或分布,又称构成比,通常 以100%为比例基数。 计算:
住人口数。
可用相邻两年年末(12月31日)人口数的平均值计算年平均 人口数;也可用年中(7月1日零时)人口数代表全年的平均人
口数。
定性资料的统计描述(1)
例如 1个人患病10天,为 10个人日,10个人患病1 天也为10个人日。
例3-3 在某医院的院内感染调查中,5031个 病人共观察了127859人日(例均25.4日),其中 有596人在医院发生感染,则 院内感染率=596/127859=0.0047人/人日 意味着平均每天有0.47%的病人将在医院获得感染。
5
2022466 25 159 62.0
11
2024535 27 157 68.0
2
2025834 20 158 66.0
4
2019464 24 158 70.5
3
2025783 29 154 57.0
7
职业 无 无
管理员 无
商业 无 无 无
干部
变量 variables
文化程度 中学 小学 大学 中学 中学 小学 中学 中学 中学
定性变量 无序分类:如性别、职业、血型等;
有序变量(有序多分类 )
定量资料(计量资料)
资料的类型
计数资料(二项分类 、无序多分类)
定性资料 有序分类:如血清反应、疗效划分等。
(分类资料) 等级资料(有序多分类 )
计量资料:变量值是定量的,有单位的,表示为数值的大小。
计数资料:变量值是定性的,没有单位,表示为互不相容的类别。
率和构成比的区别(补充)
构成比
率
1。各部分可直接相加
各率不可直接相加。
2。各部分之和等于100%。 总率不一定等于各率之和。
3。某部分变化,其它部分随 某率的变化,不影响其它各
之变化。
率。
4。是说明比重和分布的,反映事 物内部各个部分之间的比例关系。
表示某现象发生的频率和强度。
(三) 相对比型指标
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.76/100人 0 年
编辑课件ppt
23
相对比型指标(ratio)
指两个有关联的指标A与B之比 ,简称比。 A和B可以性质相同,也可以性质不同。 如性别比,师生比,变异系数,OR值,RR 值等。
比= A 100 % B
中学
41
32.30
57
44.90
高中或中专
53
41.70
110
86.60
大专及以上
17
13.40
127
100.00
合计
62
100.00
编辑课件ppt
16
定性资料的统计描述
频数表 频数图 常用的相对数指标*
编辑课件ppt
17
第一节 常用的相对数指标
频率型指标(proportion) 强度型指标(intensity or rate) 相对比指标(ratio)
MLmifm mn2 fL
偏态分布 开口资料 分布不清
2
表II 描述离散趋势趋势的指标
名称 极差
四分位 方差及标准差 数间距
变异系数
计算
Rmam x inQP75P25
2 X2
N
∑(XX)2
S2 n1
CV s 100% X
适用 资料
任何分布 资料
任何分布 对称分布的资料,量纲不同或
资料
尤其是正态分布资 均数相差悬
强度型指标= 某 事 件 发 生 的 观 察 单 位 数
(可 能 发 生 某 事 件 的 观 察 单 位 数 时 间 )K
K是比例基数,通常取为100%,也可取为1000‰、 1万/1万和10万/10万等,编辑根课件pp据t 习惯用法来决定。 21
强度型指标
随访资料:如计算发病率,死亡率
发病 失访
Statistical description
Statistical Inference
Statistical Inference
Statistical description
编辑课件ppt
5
主要内容
定性资料的频数分布 常用的相对数指标 医学人口统计常用指标(自学) 疾病统计常用指标(自学) 动态数列及其分析指标(自学)
料
殊的资料
编辑课均指标和变异指标分别反映资料的不同特 征,常配套使用 正态分布:均数、标准差; 偏态分布:中位数、四分位数间距
编辑课件ppt
4
Quantitative data analysis
Statistical analysis
Qualitative data analysis
观察开始时间
编辑课件ppt
观察结束时间
22
某企业2003年有2839名职工,该企业每年 都对职工进行查体,这一年新发生高血压 病人5例,2003年高血压发病率为
强度型指 ( 标 可能 某发 事生 件某 发事 生单 件 的位 数 的 观数 观 时 察察 间 单K ) 位
2835人 人 91年100/10000
编辑课件ppt
6
目的要求
掌握相对数常用指标:率、强度、相对比。 掌握应用相对数的注意事项。 掌握率的标准化的意义。 熟悉率的标准化方法。
编辑课件ppt
7
• 什么是分类变量资料(定性资料)?
• 用什么指标进行描述?
•甲、乙两地发生麻疹流行,甲地患儿100人,乙地患儿 50人,何地较为严重? •若甲地易感儿童667人,而乙地易感儿童250人。
第三章 定性资料的统计描述
潍坊医学院卫生统计学教研室
编辑课件ppt
1
小结:
表I 描述集中趋势的指标
算术均数
计算 适用
x x n
x fx n
正态分布
资料
近似正态分 布
几何均数
G n x1x2 xn lg1
lg n
x
G
lg
1
f
lg f
x
对数正态分布
等比级数资料
编辑课件ppt
中位数 直接法
工种 苯作业
调查人数 389
患者人数 29
百分比(%) 45.3
患病率(%) 7.5
塑料作业
311
13
20.3
4.2
化学药物
260
13
20.3
5
放射作业
154
9
14.1
5.8
合计
1114
64
100.0
5.7
编辑课件ppt
20
强度型指标(intensity)
表示单位时间内某现象发生的频率。 多用于随访资料。
编辑课件ppt
18
频率型指标(proportion)
也称比率或构成比 表示某事物内部各组成部分所占的比重或分
布,或指某现象发生的频率。
频率型指标= 发 生 某 现 象 的 观 察 单 位 数
可 能 发 生 某 现 象 的 观 察 单 位 总 数 k
编辑课件ppt
19
频率型指标
表6 不同工种的白细胞减少症患者的分布和患病率
1=有,2=无
test 是文科生或理科生 1=文科生,2=理科生
编辑课件ppt
9
定性变量?
多分类变量
表2 多分类变量涵义及赋值
变量
涵义
赋值
type fdegree
血型
1=A型,2=B型,3=AB 型,4=O型
父亲文化程度 1=文盲,2=小学,3=初 中,4=高中或中专,5=大 专及以上
编辑课件ppt
合计
127
100.00
绝对数
编辑课件ppt
相对数 14
频数图
频数
60 50 40 30 20 10
0 A型
B型
AB型
O型
图2 2010级某班同学血型分布情况
编辑课件ppt
15
表5 2010级某班同学父亲文化程度的分布情况
父亲文化程度 频数
频率
累积频数 累积频率
文盲
0
0
0
0
小学
16
12.60
16
12.60
10
定性资料的统计描述
表3 2010级某班同学性别的分布情况
性别 频数(N) 百分比(%)
男
54
42.5
女
73
57.5
合计
127
100.00
编辑课件ppt
11
定性资料的统计描述
频数表
表3 2010级某班同学性别的分布情况
性别 频数(N) 百分比(%)
男
54
42.5
女
73
57.5
合计
127
100.00
绝对数
编辑课件ppt
相对数
12
定性资料的统计描述
频数图 80
频数
70
60
50
40
30
20
10
0
男
女
图1 2010级某编辑班课件同ppt 学性别分布情况
13
频数表
表4 2010级某班同学血型的分布情况
血型 频数(N) 百分比(%)
A型
33
26.00
B型
27
21.30
AB型
18
14.20
O型
49
38.50
•甲地麻疹发病率为 100/667×100%=15% •乙地麻疹发病率为 50/250×100%=20%
用相对数能较好地反映分类变量资料的特征。
编辑课件ppt
8
定性变量?
二分类变量:
表1 二分类变量涵义及赋值
变量 涵义
赋值
sex 性别
1=男,2=女
Single 是否独生子女
1=是,2=否
Pc 有无个人电脑