定性资料的统计描述

合集下载

医学统计学-3-定性资料统计描述

医学统计学-3-定性资料统计描述

解决办法
分层比较 率的标准化法 多元统计分析方法
相对数比较时应注意其可比性(二)
在同一地区不同时期资料的相对数比较时,还 应注意其条件有无变化。 例如,不同时期的发病率比较时,应注意不同 时期疾病的登记制度、诊断水平以及平均人口 数的变化。
5、样本率或构成比进行比较时应作假设检验 由于样本率或构成比是样本指标,同样存 在着抽样误差。 在实际工作中,不能根据样本率或构成比 等相对数的数值大小轻易作出结论,应进 行样本率或构成比差异比较的假设检验。
一、相对数的概念
Question:
通过调查得到某年甲地区的小学生中流脑 发病63例,乙地区的小学生中流脑发病35 例。能否认为甲地流脑的发病严重程度高 于乙地? 绝对数63例和35例表示甲地发病比乙地多 28例,能否说明两地发病的严重程度呢?
假设甲地有小学生50051人,乙地有小学生 14338人,求出两地的发病率: 甲地发病率: 63/50051=1.26‰ 乙地发病率: 35/14388=2.44‰ 乙地区的发病率是甲地区的两倍多。 以上两个发病率为通过绝对数求得的相对 数,用来表示事物出现的频率或强度,便 于比较。
分类资料的统计描述
用率、构成比和相对比等指标来对分类资 料进行统计描述。 由两个有联系的指标之比组成,统称为相 对数。 常用相对数包括率、构成比和相对比。
二、常用相对数
1、率(rate)
又称频率指标。 某现象实际发生数与可能发生总数之比。 说明某现象发生的频率与强度:
某时期内实际发生某现象的观察单位数 率= ×比例基数(K) 同时期可能发生该现象的观察单位总数
三、标准组的选择
标准组应选择有代表性的、较稳定的、来自数 量较大的人群的指标作为标准。
例如世界的、全国的、全省的、本地区的或本 单位历年累计的数据等;

定性资料的统计描述

定性资料的统计描述
2)分别计算“标准人口”的预期治愈人数 。
37
3)分别计算两种疗法的标准化治愈率 对于新治疗法,标准化治愈率为:
P 预期治愈人数之和 N P N 2 P2 380 1 1 100% 100% 47.5% 标准人口数 N 800
对于传统治疗法,标准化治愈率为:
P 预期治愈人数之和 N P N 2 P2 427 1 1 100% 100% 53.4% 标准人口数 N 800
11085例被访者中吸烟与否这个二分类变量。 描述一个二分类变量的分布只需一个频率就够了。
5
二、常用相对数指标
6
Hale Waihona Puke 一、构成比构成比(proportion):构成指标,表示某一事物内部各组成部 分的比重或分布,常用百分数表示。
某一组成部分的观察单位数 构成比 100% 同一事物各组成部分的观察单位总数
2
3
表5-1的第(1)栏“职业”是一个多分类变量,第(3)
栏显示本次调查的被访者不同职业的频率分布;表5-1的第
(5)栏是本次调查得到的吸烟者在不同职业的频率分布。 频率分布的特点是,定性变量各类别的频率之和为 100%。
4
(二) 二分类变量的频率分布
表5-2是一个二分类变量频率分布,它描述的是例5-1所调查的
total
21
四、常用动态数列指标及其应用
什么是动态数列?
动态数列(dynamic series)是按时间顺序将一系列统计指标(可以是
绝对数,相对数或平均数)排列起来,用以说明事物在时间上的变化和发
展趋势。
常用动态数列分析指标:绝对增长量
发展速度与增长速度 平均发展速度与平均增长速度

定性资料的统计描述

定性资料的统计描述


(二)强度型指标
例:某企业2003年有2839名职工,该企业每年都对 职工进行体检,这一年新发生高血压病人5 例,2003年的高血压发病率为多少?
(三)相对比型指标

概念:任何两个相关联的指标A,B之比。 计算公式: 口学中的出生性别比例: 男性人口/女性人口= 19456/18340 = 1.06, 即每出生1个女婴,就有1.06个男婴出生。
分母的近似计算
假定当年每位去世者平均活了半年,每位出生 者也平均活了半年,则有: 当年全人口存活的总人年数=年初人口数×1年-去世 人数×0.5+出生人数×0.5 或 当年全人口存活的总人年数=年终人口数×1年 +去世人数×0.5—出生人数×0.5
上面两个等式相加,便有 当年全人口存活的总人年数=(年初人口数+年终人 口数)/2×1年=当年平均人口数×1年 或 当年全人口存活的总人年数=当年年中人口数 × 1年
构成比的特点
1、各构成部分的相对数之和为100%;
2、构成比的各构成部分之间存在着相互影响。
二、常用的相对数指标
用频率分布全面反映一个定性变量外,有时也可 用其他相对数指标从某个侧面来描述定性变量。 常用相对数指标大致有三种类型: 频率;强度;相对比
(一)频率型指标


频率型指标:最常见,表示某现象发生 的频率大小。 计算公式:
2、A、B也可以是相对数,如甲、乙两地的恶性肿瘤死亡率
分别是89.2/10万和65.1/10万,
则甲地恶性肿瘤死亡率是乙地的89.2/65.1=1.37(倍)。
3、A、B 可以是性质相同的两个指标,如上例甲、乙两地恶 性肿瘤死亡率相比,
也可以是性质不同的两个指标,如某医院每张病床配备的
医生人数: 368名医生/2800个床位=0.13

定性资料统计描述

定性资料统计描述
OR P1 /(1 P1) P0 /(1 P0)
P1为病例组的暴露比例或在暴露状态下的发病率 P0为对照组的暴露比例或在非暴露状态下的发病率
Odds ratio
例4-4 母亲围孕期是否有发热或感冒病史与婴儿 神经血管畸形关系的病例对照研究的资料如下表 所示。试计算母亲围孕期是否有发热或感冒病史 引起婴儿神经血管畸形的比数比。
率某某 事事 物物 或或 现现 象 有 象 际 发 可 发 数 生 能 生 比 的 数 的 例 所实 基数
Rate
公式中的“比例基数”通常依据习惯而定。
需要注意的是,率在更多情况下是一个具有时间 概念的指标,即用于说明在某一段时间内某现象 发生的强度或频率,如出生率、死亡率、发病率 、患病率等,这些指标通常是指在1年时间内发 生的频率。
R R P1 P0
P1为暴露组的发病率;P0非暴露组的发病率。
Relative risk
例4-3 某地市区非吸烟女性饮酒者和不饮酒者 的肺癌发病资料如下表所示,试计算其相对危 险度。
表4-2 某地市区非吸烟女性饮酒者和不饮酒者的肺癌发病资料
饮酒与否
发病数 观察人年数 发病率(1/10万人年)

Odds ratio
四、标准化率
标准化率( standardization rate ):比较两个不 同人群的患病率、发病率、死亡率等资料时,为 消除其内部构成(如年龄、性别、工龄、病程长 短、病情轻重等)对率的影响,可以使用标准化 率。
Standardization rate
例4-5 试对下表资料计算甲乙两个医院的标准化
P0
b
b
d
1
P0
b
d
d
由OR计算公式可以得出

定性资料的统计描述

定性资料的统计描述

适用条件:已知被标化组人群年龄别人 口数、死亡总数. 计算公式:

r p P P SMR ni Pi
标准组年龄 别死亡率
被标化组年 龄别人口数
标准化死亡比(SMR)

SMR是观察人群死亡率与总人群(参照人群)
相比较的指标。

计算: SMR=实际死亡数/期望死亡数=D/E
期望死亡数:假定研究人群的年龄别死亡
45.4
SPSS进行标准化率的计算(1)



Transform Compute… Target Variable 框:sp Numeric Expression 框:p1+p2 OK
SPSS进行标准化率的计算(2)

Transform Compute… Target Variable 框:sc1 Numeric Expression 框: sp*c1/p1 OK Transform Compute… Target Variable 框:sc2 Numeric Expression 框: sp*c2/p2 OK
两样本标化率的比较应作假设检验

标准化法注意事项


各年龄组率若出现明显交叉,或非呈平行 变化趋势时,宜比较年龄组死亡率 一般情况下,直接法计算简便,易于了解, 更为常用;如原资料中有些年龄组人口过 少,致使年龄别死亡率波动较大时,宜用 间接法。
标准化率在SPSS中的实现(直接标化法)
表1 甲、乙两院某传染病治愈率/%的比较

率与标准的年龄别死亡率一样,理论上的
死亡人数。
计算标准化率的步骤



根据现有数据的条件选用直接法或间接法 选定标准:标准组应有代表性、稳定、数 据量较大的人群 应用公式计算 必要时,做假设检验

定性资料的统计描述

定性资料的统计描述

25
三、相对比
相对比是互不包含的两个有联系指标之比。 对比的两个指标可以性质相同,也可以性质 不同。 公式为:相对比型指标=A指标 / B指标
注意:在计算相对比中,甲、乙两个指标可 以是绝对数,也可以是相对数或平均数,可 以有不同的量纲,但是互不包含。
27
例: 某年某医院出生婴儿中,男性婴儿为 370人, 女性婴儿为358人,则出生婴儿的 性别比为多少? 性别比为:370 / 358 ×100﹪=103﹪ 说明该医院年每出生100名女婴儿,就有103 名男婴儿出生。
30
2.相对危险度(relative risk,RR)表示在两种相同 条件下某疾病发生的概率之比。即暴露组发病率 与非暴露组发病率的比值。 某地某年男性吸烟和非吸烟的冠心病死亡资料 分组 死亡人数 观察人年数 死亡率 (1/10万人年) 43248 10673 240.5 112.4
吸烟组 104 非吸烟组 12
36
某医院某年住院病人中胃癌患者占5%,则() A 5%是强度指标 B 5%是频率指标 C 5%是相对比指标 D 5%说明胃癌在住院病人 中的比重
37
2.使用相对数时分母不宜过小 某药物 甲治疗100人,50人有效,有效 率为50﹪。药物乙治疗5人,3人有效, 我们能否说乙药有效率为60 ﹪?能否说 乙药比甲药治疗效果好。
9
分娩方式 顺产 助产 顺产 顺产 顺产 剖宫产 顺产 剖宫产 顺产 顺产
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理
年龄 18 20 22 24 26 28 30 32 34 36 38 40 合计 工人 2 9 28 50 50 34 11 14 4 2 3 0 207 管理人员 0 2 7 34 43 35 14 2 2 1 1 0 141 农民 0 6 10 28 25 10 11 3 5 1 1 2 102 商业服务 0 10 24 52 45 34 22 14 3 4 0 0 208

定性资料的统计描述

定性资料的统计描述
22
1. 直接法
选择人口数作标准
P' NiPi N
选择人口构成比作标准
P'
Ni N
Pi
Ni:标准年龄别 人口数
Pi:实际年龄别 ××率
N:标准人口总数
23
选择治疗人数之和作标准
直接法计算标准化治愈率(%)
病型
(1) 普通型 重型 合计
标准治 疗人数 (Ni) (2)
400 400 800(N)
38
6.已知男性的钩虫感染率高于女性。欲比较甲、乙两乡居 民的钩虫总感染率,但甲乡人口女多于男,而乙乡男多 于女,适当的比较方法是( )。
A.分性别进行比较 B.两个率比较的2检验 C.不具可比性,不能比较 D.对性别进行标准化后再比较 E.作两个总率差别的假设检验
39
7.要比较甲乙两厂某工种工人某种职业病患病率的高低, 采取标准化法的原理是( )。
p' 427 100% 53.4% 47.5% 800
24
2. 间接法(以死亡率为例)
选择年龄别死亡率作标准
P' P r P SMR n i Pi
P: 标准总死亡率 ΣniPi: 预期总死亡数
r: 实际总死亡数
r/ΣniPi (SMR) :
ni: 实际组别人口数 标准化死亡比(Standard
n i Pi
(6)=(2)(5) 51 145 115 42 353
27
原发性骨质疏松症标准化患病比SPR
城市
实际患病人数 预期患病人数
322 305
1.05
农村
实际患病人数 预期患病人数
335 353
0.95
原发性骨质疏松症标准化患病率 p’

定性资料的统计描述

定性资料的统计描述

同年内死亡人数 粗死亡率= 1000 0 00 当年平均人口数 1年
强度型指标(近似)
同年<1周岁死亡人数 婴儿死亡率= 1000 0 00 当年活产儿总数
频率型指标近似
同年孕产妇死亡数 孕产妇死亡率= 10万/10万 当年活产儿总数
相对比型指标
统计图表
人口统计指标
例:某医生治疗了4例支气管哮喘病患者, 其中3例有效,即报告有效率为75。
请问该说法是否正确?
某医院统计1985-1990年儿科住院病人疾病种类分 布情况见表:
表 某医院儿科住院病人疾病种类分布情况 疾病种类 先天性心脏病 病人数 250 % 23.8
风湿性心脏病
其它
750
2. 人时资料的描述—强度
流行病学随访研究中,不同个体被观察的时间长度各 不相同,常用人时总和表示被观察的人和时间的总和。 “强度”是流行病学、统计学术语。 ——单位时间内(如年、月、日等)某事件发 生的频率。
某事件发生的个体数 强度型指标 K ( 可能发生某事件的个体 数 时间)
强度型指标通常是指一段时间内的平均概率。如人 时发病率的分子是新发生的事件数,分母是人时 数(观察人数乘以时间)的总和,多用于大人群 长时间随访的资料。
常用的相对数指标大致有三种类型:
频率(relative frequency or proportion)
强度(intensity or rate) 相对比(relative ratio)
主要内容
1. 分类资料的描述—频率和频率分布
2. 人时资料的描述—强度
3. 复合指标—相对比 4. 相对数应用中需注意的问题
新发病例数 人时发病率 观察的人时总数 新发病例数 (折合的观察人数 ( )单 位 时 间 的 个 数 ) 院的院内感染调查中,5031名病 人共观察了127859人日(例均25.4日),其中 有596人在医院发生感染,请计算院内感染率。

定性资料的统计描述

定性资料的统计描述

an: 报告期指标 a0:基期指标
增长速度:表示的是净增长量。
增长速度=发展速度-1
定基增长速度=定基发展速度-1
环比增长速度=环比发展速度-1
三、平均发展速度和平均增长速度
平均发展速度:各环比发展速度的几何均数, 说明某事物在一个较长时期中逐年平均增长 的程度。
平均发展速度=
n
an a0
平均增长速度:各环比增长速度的平均数, 说明某事物在一个较长时期中逐年平均增长 的程度。
如某专业杂志发文 “252例病毒性肝炎分析”
②不能用构成比的动态分析代替率的动态分析。 表 某市1980年和1990年5种传染病情况
疾病 痢疾 肝炎 流脑 麻疹 1980年
病例数 构成比(%) 病例数
1990年
构成比(%)
3604 1203 698 890 902
49.39 16.49 9.65 12.20 12.36
1、疾病统计资料来源:p40 2、疾病与死因分类 疾病命名: 第三 是给疾病起一个特定的名字,使之可区别 节 于其它疾病。(ICD-10)
疾病 统计 常用 指标
疾病分类:疾病分类是根据疾病的某些特征,按 照一定的编码规则对疾病进行统计分类的方法。

ICD是国际疾病分类英文 (International Classification


150
100.00
1
0%
33.33
20 40%
13.33 60%
26.67 80%
循环系统疾病
6.67 100%
传染病
20%
恶性肿瘤
呼吸系统疾病
消化系统疾病
某医院2001年住院病人5类疾病的死亡情况

定性资料的统计描述

定性资料的统计描述
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
某地居民年龄别癌肿患病情况统计
年龄组 (岁) (1) <30 30~ 40~ 50~ 60~ 总计 人口数 (2)
633000 570000 374000 143000 30250
1750250
癌肿病 人数 (3) 19 171 486 574 242 1492
×100%
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
例:
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
例:白细胞计数和分类构成比 构成比的两个特点: ⑴ 各组成部分的相对数之和为 100%; ⑵ 某一部分所占比重增大,其它部 分会相应地减少。
实际工作中,可用某一期间的平均 人口数来代表人口总数。当人口数 在一年中是均匀变动时,可用以下 两种计算方法:
年平均人口数 = 上年12月31 日人口数 + 本年12月31 日人口数 2
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
年中(7月1日零时)人口数代表全 年的平均人口数。
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
国际统一规定的统计人口数方法: ① 实际制——只统计标准时刻某地 实际存在的人口数(包括临时在 该地的人) ② 法定制——只统计某地的常住人 口数。
QIU Yu-lan 上海交通大学医学院 QIU Yu-lan 上海交通大学医学院
三、人口死亡统计
死亡统计资料是反映社会卫生状况和居 民健康水平的重要基础资料,也是制订 卫生工作计划、评价卫生服务效果的重 要依据。通过描述和分析不同地区、不 同人群(包括不同性别、不同年龄、不 同职业者)的死亡水平和各种死亡原因 的动态变化,反映社会经济、文化教 育、卫生服务对于居民健康的影响。

定性资料的统计描述

定性资料的统计描述
42.86 12.50
4
57.14 15.38
7
100.00 14.00
露露 可口可乐 百事可乐 汇源果汁
1 11 8 1
8 3 2 9
9 14 10 10
合计
24
26
50
频率指标的两个特点:
• 各组成部分之和为 1(100%); • 某一部分所占比重增大,其它部 分会相应地减少 。
第二节 相对数指标
定性资料的统计描述
二分类变量 分类变量
定性变量
顺序变量
多分类变量
定性资料的统计描述
统计学中,定性资料的统计描 述可以做频数与频数分布,还可以 用相对数(比例/百分比、比率)来 描述和比较这类变量。
中 中 国 国 人 市 口 场 统 统 计 计 年 年 鉴 鉴
第一节 频数与频数分布
频数:各类别出现的个(例)数。
如例1:百事可乐和可口可乐市场占有率之比。
10 R= 0.7143 14
2. 两个率之比(相对数)
P 1 R= P2
如例2:甲城市300户家庭住房满意度调查中 满意率与不满意率的比较。
15% R= 0.4167 36%
应用相对数时的注意事项
计算相对数时,分母不宜过小,确保研究结果的 稳定性。在例数很少的情况下,尽量使用绝对数。
正确计算合计率。对观察单位数不等的几个率, 不能直接相加求其平均。 相对数的对比应注意可比性。即除了要对比的因 素外,其余的等。
【例 2 】在一项城 市住房问题的研究 中,研究人员还在 乙城市抽样调查 300 户,其中的一 个问题是:“您对 您家庭目前的住房 状况是否满意?” 1.非常不满意; 2.不满意; 3.一般; 4.满意; 5.非常满意。

统计学:定性资料的统计描述

统计学:定性资料的统计描述
发达国家较低
老年负担系数
发达国家较高
总负担系数
14岁及以下人口数 65岁及以上人口数 100% 15 ~ 64岁人口总数
发达国家较低
(3)老少比
65岁及以上的人口数 100% 14岁及以下人口数
老少比
发达国家较高
(4)性别比
性别比
男性人口数 100 女性人口数
不同年龄时期的性别比
(1)人口系数
老年(人口)系数 65岁及以上的人口数 100% 人口总数 14岁及以下人口数 100% 人口总数
发达国家较高
少儿(人口)系数
发达国家较低
(2)负担系数
少儿负担系数 14岁及以下人口数 100% 15 ~ 64岁人口总数 65岁及以上人口数 100% 15 ~ 64岁人口总数
定性资料的统计描述
( qualitative data statistical description 要求: )
1.掌握常用相对数的适用条件及应用
2.掌握医学人口常用统计指标和疾病统计常用指标 3.了解动态数列分析指标及特点
第一节
一、定性资料的构成比
定性资料的分布特征
表3-1 某医院2001年住院病人5类疾病的死亡情况
第二节
医学人口统计常用指标
一、 医学人口资料的来源 (medical population information )
(一)人口普查
人口普查是收集资料、整理和分析一个国家或地区在某一特定时间的人口、经济和社 会资料的全过程。通常由国家政府主持,每隔5~10年进行一次。 建国以来,我国先后进 行了5次人口普查: 1953年、1964年、1982年、1990年、2000年。
1.计算相对数的分母不宜过小 2.分析时不能以构成比代替率(见表) 3.不能用构成比的动态分析代替率的动态分析(见表)

医学统计学定性资料的统计描述

医学统计学定性资料的统计描述

卡方检验在医学领域应用
疾病与基因型关联分析
01
通过比较不同基因型在疾病组和对照组中的分布差异,判断基
因型与疾病是否有关联。
临床试验效果评价
02
比较不同治疗方法在患者中的疗效差异,如药物疗效、手术效
果等。
医学影像学诊断准确性评估
03
通过比较影像学诊断结果与金标准诊断结果的一致性,评估影
像学诊断方法的准确性。
非数值性
定性资料不以数值形式表示,而是用 文字、符号等描述。
类别性
定性资料通常按照不同的类别或属性 进行分类。
主观性
定性资料的收集和分析往往涉及主观 判断和解释。
常见定性资料类型
分类资料
按照某种特征或属性将数据分成不同的组别,如性别、 血型等。
顺序资料
除了分类外,还具有一定程度的顺序或等级关系,如 病情严重程度、治疗效果评价等。
数分布表。
图表展示技巧与规范
选择合适的图表类型
根据数据的性质和特点,选择合适的图表类 型,如直方图、条形图等。
数据点标识
在图表中标识出重要的数据点,如最大值、 最小值、平均值等。
图表标题和坐标轴标签
为图表添加标题和坐标轴标签,以便读者理 解图表内容。
图例和颜色使用
使用图例说明不同数据系列的含义,并合理 运用颜色以增强图表的可读性。
整性。
02
Fisher确切概率法计算
根据研究目的和假设,选择合适的统计软件或编程语言实现Fisher确切
概率法的计算过程。
03
结果解读与报告
对计算结果进行解读和分析,将结果以图表或文字形式呈现,并结合专
业知识对结果进行解释和讨论。同时,需要注意结果的可靠性和可重复

定性资料的统计描述

定性资料的统计描述
×K
K:比例基数 选择K的原则:使算得的率至少保留 使算得的率至少保留1—2位整数。 位整数。 使算得的率至少保留 位整数
强度型指标:指一段时间内的平均概率。 (二)强度型指标:指一段时间内的平均概率 多用于大人群、长时间随访的资料。强度是单 单 位时间段内某现象发生的频率。 位时间段内
某事件发生的个体数 强度型指标= ×K ) 数 ∑(可能发生某事件的个体 ×时间
三、标准化法的注意事项 1. 注意标准化法的适用条件 1)欲比较的两个人群内部的年龄分布不同。 )欲比较的两个人群内部的年龄分布不同。 2)每个人群内部年龄别死亡率也各不相同, )每个人群内部年龄别死亡率也各不相同, 但前提条件是总率的比较。 但前提条件是总率的比较。 2. 标化后的标准化率已不再反映当地的实际 水平,只表示相互比较的几组资料间的相对水平。 水平,只表示相互比较的几组资料间的相对水平。 相对水平
K:比例基数 选择K的原则:使算得的率至少保留 使算得的率至少保留1—2位整数。 位整数。 使算得的率至少保留 位整数
例如 1个人患病10天,为 10个人日,10个人患病1 天也为10个人日。 例3-3 在某医院的院内感染调查中, 在某医院的院内感染调查中,5031个 个
病人共观察了127859人日(例均25.4日),其中 人日(例均 病人共观察了 人日 日),其中 人在医院发生感染, 有596人在医院发生感染,则 人在医院发生感染 院内感染率=596/127859=0.0047人/人日 人 人日 院内感染率 意味着平均每天有0.47%的病人将在医院获得感染。 的病人将在医院获得感染。 意味着平均每天有 的病人将在医院获得感染
注:在进行标准化率的计算时,标准组指标用大写 在进行标准化率的计算时, 字母表示,被标化组指标用小写字母表示。 字母表示,被标化组指标用小写字母表示。

定性资料的统计分析

定性资料的统计分析
2
A T 2
检验的自由度取决于可以自由取值的格子数目, 而不是样本含量n。四格表资料只有两行两列,ν =1, 即在周边合计数固定的情况下,4个基本数据当中只 有一个可以自由取值。
2 分布图形
0.5 0.4 0.3 0.2 0.1 0 0 2 4 6
1
f ( )
2
6
10
可通过 检验的基本公式来理解。
2
卡方分布: 若k个随机变量,z1,z2,…zk,相互独立且服从标
准正态分布,则随机变量x=z12+z22+…+zK2被称 为服从自由度为k的卡方分布,记作: x 2 (k )
2
( AT ) , (行数-1)(列数 1) T
2
H1:π1≠π2 即试验组与对照组降低颅内压的总体有效率不相等
α =0.05。
(2)求检验统计量值
T11 104 174/ 200 90.48 ,T12 104 90.48 13.52
T21 174 90.48 83.52 ,T22 26 13.52 12.48 。
表7-2 两组降低颅内压有效率的比较
组 别 试验组 对照组 合 计 有 效 99(90.48) a 75(83.52) c 174(a+c) 无 效 5(13.52) b 21(12.48) d 26(b+d) 合 计 104 (a+ b) 96 (c+d) 200 (n) 有效率(%) 95.20 78.13 87.00
( b c 1) 2 bc
, =1
本例检验步骤如下:
(1)建立检验假设
H0:总体B=C,即两种方法肝癌检出率相同

第三章 2-定性资料的统计描述

第三章 2-定性资料的统计描述

二、疾病和死因分类
疾病的命名(nomenclature of diseases):标 准化的术语 疾病分类(classification of diseases):将具有 共性的疾病归纳、分类。 区别:前者为疾病名称标准化,后者是统计研究 需要。
1853年,国际统计学会着手编制了统一的疾病 名称和死因分类,先是在欧洲使用。 1893年开始建立国际疾病和死因分类 (International Classification of Diseases,简记 为ICD)
2. 计算相对数时分母应有足够数量 例 甲医院治疗某类患者100人,40人有效; 乙医院治疗同类患者5人,2人有效 有效频率均为40% !?
如果资料的总例数过少,计算得到的相对数 偏差可能会很大,直接报告原始数据更为可取: 甲医院有效率40% 乙医院有效 2/5
3. 正确地合并估计 例 甲医院治疗某类患者100人,40人有效; 乙医院治疗同类患者90人,30人有效 如果两医院总体有效率的确相等, 合并估计: 40 30 有效率 36.8% 100 90 不可将两个频率相加除以2:
(一)人口死亡资料的来源
我国人口死亡资料主要由公安部门负责收集。 国家规定居民死亡后,必须及时报告并注销户口。 死于医院者,医师应负责填写死亡报告单 ----正确填写死因 死因依据:国际统计分类第十版(International classification of diseases, ICD-10)中的死因分类。 注意杜绝婴儿死亡的漏报。
实际工作中,有时近似地 平均人口数 ≈人口总数 理论上, 平均人口 = 各时点人口数相加再除以总时点数 实际中,
平均人口≈相邻两年年末人口数相加再除以2
(二)人口构成及其统计指标

定性资料的统计描述

定性资料的统计描述

第五章 定性资料的统计描述在医学研究与实践中,大量资料都是按照事物的特征或属性进行分类的,这类资料称为定性资料,也称分类资料或计数资料。

如性别、HIV 感染情况、病情轻重等都属于分类资料。

对于这类资料,其绝对数往往不便于进行相互比较。

例如甲医院某年因某病死亡105人,同年乙医院因该病死亡185人。

但不能据此认为乙医院该病的死亡情况比甲医院严重,因为两医院因该病住院的人数不一定相等,此时需要采用相对数指标进行统计描述。

第一节 常用相对数及其应用相对数是两个有关联的数值之比,常用的相对数指标有率、构成比和相对比三种。

一、率率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。

根据计算公式中分母的观察单位总数是否引入时间因素,率包括频率和速率两类指标。

频率(frequency)计算中,分母没有引入时间因素,无时间量纲,分子是分母的一部分,其取值在0~1之间,如常见的发病率、患病率、病死率、治愈率等指标,都属于频率型指标,其实质是比例,在流行病学中也常称为累积发生率。

其计算公式可表达为:K =⨯同时期实际发生某现象的观察单位数频率某时期可能发生某现象的观察单位总数(5.1) 式中,K 为比例基数,可以是100%、1000‰、100000/10万等。

比例基数的选择主要根据习惯用法或使计算结果保留1~2位整数,以便阅读。

例5.1 为研究吸烟与肺癌的关系,某医生收集了2003~2005年286例住院肺癌患者的吸烟史,吸烟的肺癌患者有166例,而同时期同年龄段的1855名非肺癌患者中,吸烟的有407例。

试计算该资料中肺癌患者与非肺癌患者的吸烟率。

由式(5.1),肺癌患者的吸烟率=166/286100%=58.04%⨯,非肺癌患者吸烟率=407/1855100%=21.94%⨯,肺癌患者的吸烟率比非肺癌患者的吸烟率高36.1%。

速率(rate)是带有时间因素的频率,根据数理统计的定义是指随时间变化而改变的速度,此处取其某现象在单位时间内的发生频率之意。

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

比例死亡比
同年某死因死亡数
同年死亡总数
类型 强度型(近似) 强度型(近似) 比 比 强度型(近似) 频率型(近似) 频率型(近似)
粗死亡率=同年内死亡人数/当年全人o存活的总人年数
比例死亡比:死因构成比。
死因川页位:按各类死因的构成b匕大4、由高到低捐M列的位次,说明各类死 因的相对重要性。
一十〜医学相对数...疾病统计指标
(2)
(3)
(4)
1-
340
17
11.56
5.00
5-
254
30
20.41
11.81
10-
432
73
49. 66
16. 90
15-
136
27
18.37
19. 85
合计
1162
147
100. 00
12. 65
应用相对数应注意的问题 •:•计算相对数分母不宜过小:否则缺乏稳
定性 •:・随机抽样当观察总例数较小时不宜只报
♦:♦寻找一个统一混杂因素(年龄)的分布为标) 准组,每个比牧组均贝该分布标准段童而成) 的 死亡率。称为标准化死亡率
•:・采用选定的标准进行调整,统一内部构成, 使 资料具有可比性。
•:・“标准”应是要消除影响的指标(年龄)。 如
两组治愈率比较,应考虑病情严重程度、 希*呈
长£豆的标化。
I
•:•本例:要消除年龄分布不同对死亡率的影响,」
常用的相对数指标---率rate
•:•定义:说明一段时间(单位时间)内某 个事件发生的频率或强度
某事件的发牛率=某时期内发生某事件的观察对象数 ' 该时期开始时暴露的观察对象数
椅强度型指标
{
椅分子是一个时期的累计数

椅分母为人时数(观察人数乘以时间),常用 于大 人群的长时间随访资料
椅如:调查某医院的院内感染,5031个病人 共观察 了 127859人日,其中596人发生院内7 感染,一 院内感染率三596/ 127859=0.0047A/V
椅标准化、多因素分析
标准化法
比较甲乙两地某年的死亡率
年龄 组 05204060合计
人口数 9300 12200 19000 7600 1900 50,000
甲乙两地各年龄组人口数及死亡率(%。)
甲地
乙地
构成比(%) 死亡率 人口数 构成比(%)
18.6 57.2
4800
9.6
24.4 3.6
6600
椅名称为率,实质为构成比:患病率 椅务称为率,实质为相对比(孕产妇死亡率)的指 标。
•:•统计分析方法的应用
椅构成比 崎率:分子是分母的一部分,无重复
应用相对数应注意的问题
•:・选择合适的相对数:研究工龄与患病的关系
某化工厂慢性气管炎患病与专业工龄的关系
工龄
检查人数
患者数
百分比 患病率(%)
(1)
常用的相对数指标---构成比proportion
•:•定义:观察对象的某一个部分与观察总数之 比; 描述赧企事物内就痼构成触分所占的比’ 重 F 成比--观察对象总数
椅分子是分母的一部分,在0・1之间,无量

椅频如率:型20指01标年,某其医实院质死为亡频者率中或5概种率疾的病近死似亡值各自所」 6 占的比套41£临幔性皿痼患煮的血型构感一J
告相对数
•:•对相对数的统计应考虑抽样误差:需进 行参数估计和假设检验。频率分布(构 成比)的统计方法成熟
应用相对数应注意的问题 •:•相对数的比较,要注意可比性。
椅设计:观察对象、研究方法、观察时间等: 哮 喘发病率的比较,观察季节不同结果就不 一梓
椅总体构成特点:比较的总体是否具有可比性, 其他影响因素在被比较总体之间的分布或构 成 是否一致。如比较某地甲亢的发病率,性 别构 成不同不能直接比较
指标
分子
分母
发病率
时期内新发生的某病病例数 时期内平均人口数
时点(时期)患病率 时点(时期)现患疾病人数 检查人口数
类型 强度型(近似) 频率型
来源 时间 性质 对象 分子
发病率 登记报告 一个时期(一般为一年) 发展速度
定人群(可能发生某病的暴露人口) 新发病例数(以第一次诊断为准。可以 有重复病例)
医学相对数…人口死亡指标
指标
分子
分母
粗死亡率
同年内死亡人数
某年龄组死亡率 同年年龄组死亡人数
年平均人口数X1年 同年年龄组平均人口数X1年
婴儿死亡率 孕产妇死亡率 某死因死亡率 某病病死率
同年V1周岁死亡人数 同年孕产妇死亡人数 同年某死因死亡人数 同年某病死亡人数
同年活产儿总数 同年活产儿总数 同年平均人口数X1年 同年患该病总数
内某病新发病例数之比;也可以是性质不相同的两 个指标之比,如某地区两周就诊人次数与人口数之 比。
常用的相对数指标…比ratio
♦指标分类:
椅对比指标:性别比、某两年发病率比 椅关系指标:卫生服务领域,描述卫生资源配备
人均床位数二某地医院总床位数/该地总人口 医护比二某地(医院)医生人数/护士人数
椅计划完成指标:用实际数达到计划数的百分之几 或 几倍说明计划完成的程度。
13.2
38
5.3
35300
70.6
15.2 12.1
2800
5.6
3.8
40.0
500
1.0
100.0 16.19 50, 000 100.0
死亡率 72.9
4.6 7.2 14.2 46.0 13.90
这里年龄是混杂(不同年龄组死亡率不同),年龄构成不同影响 了总死 亡率的高低
14
意义和基本思想
13.33
40
26.67
10
6.67
150
100.00
口恶性肿 瘤
S呼吸系统 疾病
口消化系 统疾病
口循环系 统疾病
■传染病
某医院2001年住院病人5类疾病的死亡构成图
3
常用的相对数指标…比ratio •:•定义:任何两个相关联的变量A与B之比:
比二A/B
椅A与B可以是绝对数、相对数、平均数 椅可以是性质相同的两个指标,如两个地区相同时期
,
描述
♦统计图表 ♦频数分布
y计数资料是观察某个定性指标后清点各个结 果的频数所得。
7绝对数
•:•相对数
椅两个有关数据的比
1
计数资料的分布特征描述
❖频率分布
♦:♦相对数指

表。
01年住院萼敝密病的的屈儿(%)
恶性肿瘤 呼吸系统疾病
消化系统疾病 循环系统疾病
传染病 合计
50
33.33
30
20.00
20
患病率 现场调查 时点(尽量短,不超过一个月) 现状,静止状态 受检人群 现患人数(调查期间所有患病者,不论 新 旧病例)
分母 意义
可能发病的平均人口
发病强度,反映致病因子强弱、人群易 感性
所有受检人口
患病现状,常用于慢性病描述,或发病 时 间不明确的疾病
9
应用相对数应注意的问题
•:・防止概念混淆:
相关文档
最新文档