定性资料的统计描述
定性资料的统计描述(公式整理)
![定性资料的统计描述(公式整理)](https://img.taocdn.com/s3/m/9251fac158fb770bf68a5501.png)
频数分布表和频数分布图 直接法:均数加权法:直接法:几何均数加权法: 直接法中位数 频数表法 极差 (全距)R直接法 当nx%=INT (nx%)时百分位数 当nx%>INT(nx%)时, P x =x INT(nx%)+1四分位数间距 频数表法四分位数间距 Q u -Q L P 25 ,P 50, P 75总体方差 样本方差直接法加权法比较计量单位不同比较均数相差悬殊对称型(正态分布) 集中位置在中间,左右两侧的频数大致对称分布 类 正偏态:集中位置偏向数值小的一侧(左侧) 型 不对称型(偏态分布)负偏态:集中位置偏向数值大的一侧(右侧)方差 标准差 变异系数 主要用途 定性资料的统计描述集中趋势离散程度分布特征集中描述 适用离散趋势适用均数 单峰对称分布资料 方差和标准差 越大,越离散 单峰对称分布资料 几何均数G对数正态分布, 观察组之间等比 变异系数CV越大,越变异不同计量单位 均数相差较大 中位数M 各种分布 不对称分布, 两端无确切值 分布不明确四分位数间距①偏态分布资料 ②两端无确切值 ③分布不明确资料概念:随机变量X 取各种值的概率称为概率分布规律,简称分布 正态分布就是一种重要的连续型随机变量的分布类型形态:呈对称钟形,在均数处最高,两侧不断降低,逐渐与横轴接近,但不与横轴相交正态分布曲线 密度函数为,分布函数,表示随机变量X 取小于或等于x 的概率①正态曲线在横轴上均数处最高。
②正态分布以均数为对中心,左右对称③正态分布有两个参数,即位置参数μ和形态参数。
特征 若固定,改变μ,曲线沿x 轴平行移动,其形态不变,若固定μ,越小,曲线越陡峭 正态分布 越大,曲线越低平,但中心在x ④正态曲线下的面积分布有规律密度函数标准正态分布(Z 分布) 分布函数标准化变换 估计总体变量值的频数分布查表过高过低均异常→双侧 应用 确定取单侧或双侧参考值 过高异常→上限 过低异常→下限 制定医学参考值范围 主要目的为减少假阳性(确诊)→99%主要目的为减少假阴性(初筛)→95% 服从正态→正态分布法不服从→百分位数法参考值范围正态分布法百分位数法确定适当的百分界限选择制定医学参考值范围方法标态 正态 面积或P -1~168.27% -1.64~1.6490% -1.96~1.96 95% -2.58~2.5899%双侧单侧双侧单侧只有上限只有下限只有上限只有下限95 P2.5~P72.5P5P9599 P0.5~P99.5P1P99。
定性资料的统计描述
![定性资料的统计描述](https://img.taocdn.com/s3/m/32aa761de87101f69f31950f.png)
(二)强度型指标
例:某企业2003年有2839名职工,该企业每年都对 职工进行体检,这一年新发生高血压病人5 例,2003年的高血压发病率为多少?
(三)相对比型指标
概念:任何两个相关联的指标A,B之比。 计算公式: 口学中的出生性别比例: 男性人口/女性人口= 19456/18340 = 1.06, 即每出生1个女婴,就有1.06个男婴出生。
分母的近似计算
假定当年每位去世者平均活了半年,每位出生 者也平均活了半年,则有: 当年全人口存活的总人年数=年初人口数×1年-去世 人数×0.5+出生人数×0.5 或 当年全人口存活的总人年数=年终人口数×1年 +去世人数×0.5—出生人数×0.5
上面两个等式相加,便有 当年全人口存活的总人年数=(年初人口数+年终人 口数)/2×1年=当年平均人口数×1年 或 当年全人口存活的总人年数=当年年中人口数 × 1年
构成比的特点
1、各构成部分的相对数之和为100%;
2、构成比的各构成部分之间存在着相互影响。
二、常用的相对数指标
用频率分布全面反映一个定性变量外,有时也可 用其他相对数指标从某个侧面来描述定性变量。 常用相对数指标大致有三种类型: 频率;强度;相对比
(一)频率型指标
频率型指标:最常见,表示某现象发生 的频率大小。 计算公式:
2、A、B也可以是相对数,如甲、乙两地的恶性肿瘤死亡率
分别是89.2/10万和65.1/10万,
则甲地恶性肿瘤死亡率是乙地的89.2/65.1=1.37(倍)。
3、A、B 可以是性质相同的两个指标,如上例甲、乙两地恶 性肿瘤死亡率相比,
也可以是性质不同的两个指标,如某医院每张病床配备的
医生人数: 368名医生/2800个床位=0.13
定性资料统计描述
![定性资料统计描述](https://img.taocdn.com/s3/m/ac9ff59803d8ce2f006623b5.png)
P1为病例组的暴露比例或在暴露状态下的发病率 P0为对照组的暴露比例或在非暴露状态下的发病率
Odds ratio
例4-4 母亲围孕期是否有发热或感冒病史与婴儿 神经血管畸形关系的病例对照研究的资料如下表 所示。试计算母亲围孕期是否有发热或感冒病史 引起婴儿神经血管畸形的比数比。
率某某 事事 物物 或或 现现 象 有 象 际 发 可 发 数 生 能 生 比 的 数 的 例 所实 基数
Rate
公式中的“比例基数”通常依据习惯而定。
需要注意的是,率在更多情况下是一个具有时间 概念的指标,即用于说明在某一段时间内某现象 发生的强度或频率,如出生率、死亡率、发病率 、患病率等,这些指标通常是指在1年时间内发 生的频率。
R R P1 P0
P1为暴露组的发病率;P0非暴露组的发病率。
Relative risk
例4-3 某地市区非吸烟女性饮酒者和不饮酒者 的肺癌发病资料如下表所示,试计算其相对危 险度。
表4-2 某地市区非吸烟女性饮酒者和不饮酒者的肺癌发病资料
饮酒与否
发病数 观察人年数 发病率(1/10万人年)
是
Odds ratio
四、标准化率
标准化率( standardization rate ):比较两个不 同人群的患病率、发病率、死亡率等资料时,为 消除其内部构成(如年龄、性别、工龄、病程长 短、病情轻重等)对率的影响,可以使用标准化 率。
Standardization rate
例4-5 试对下表资料计算甲乙两个医院的标准化
P0
b
b
d
1
P0
b
d
d
由OR计算公式可以得出
定性资料的统计描述
![定性资料的统计描述](https://img.taocdn.com/s3/m/2a5b0f74a98271fe910ef96b.png)
适用条件:已知被标化组人群年龄别人 口数、死亡总数. 计算公式:
r p P P SMR ni Pi
标准组年龄 别死亡率
被标化组年 龄别人口数
标准化死亡比(SMR)
SMR是观察人群死亡率与总人群(参照人群)
相比较的指标。
计算: SMR=实际死亡数/期望死亡数=D/E
期望死亡数:假定研究人群的年龄别死亡
45.4
SPSS进行标准化率的计算(1)
Transform Compute… Target Variable 框:sp Numeric Expression 框:p1+p2 OK
SPSS进行标准化率的计算(2)
Transform Compute… Target Variable 框:sc1 Numeric Expression 框: sp*c1/p1 OK Transform Compute… Target Variable 框:sc2 Numeric Expression 框: sp*c2/p2 OK
两样本标化率的比较应作假设检验
标准化法注意事项
各年龄组率若出现明显交叉,或非呈平行 变化趋势时,宜比较年龄组死亡率 一般情况下,直接法计算简便,易于了解, 更为常用;如原资料中有些年龄组人口过 少,致使年龄别死亡率波动较大时,宜用 间接法。
标准化率在SPSS中的实现(直接标化法)
表1 甲、乙两院某传染病治愈率/%的比较
率与标准的年龄别死亡率一样,理论上的
死亡人数。
计算标准化率的步骤
根据现有数据的条件选用直接法或间接法 选定标准:标准组应有代表性、稳定、数 据量较大的人群 应用公式计算 必要时,做假设检验
定性资料的统计描述
![定性资料的统计描述](https://img.taocdn.com/s3/m/05223b01a5e9856a56126046.png)
25
三、相对比
相对比是互不包含的两个有联系指标之比。 对比的两个指标可以性质相同,也可以性质 不同。 公式为:相对比型指标=A指标 / B指标
注意:在计算相对比中,甲、乙两个指标可 以是绝对数,也可以是相对数或平均数,可 以有不同的量纲,但是互不包含。
27
例: 某年某医院出生婴儿中,男性婴儿为 370人, 女性婴儿为358人,则出生婴儿的 性别比为多少? 性别比为:370 / 358 ×100﹪=103﹪ 说明该医院年每出生100名女婴儿,就有103 名男婴儿出生。
30
2.相对危险度(relative risk,RR)表示在两种相同 条件下某疾病发生的概率之比。即暴露组发病率 与非暴露组发病率的比值。 某地某年男性吸烟和非吸烟的冠心病死亡资料 分组 死亡人数 观察人年数 死亡率 (1/10万人年) 43248 10673 240.5 112.4
吸烟组 104 非吸烟组 12
36
某医院某年住院病人中胃癌患者占5%,则() A 5%是强度指标 B 5%是频率指标 C 5%是相对比指标 D 5%说明胃癌在住院病人 中的比重
37
2.使用相对数时分母不宜过小 某药物 甲治疗100人,50人有效,有效 率为50﹪。药物乙治疗5人,3人有效, 我们能否说乙药有效率为60 ﹪?能否说 乙药比甲药治疗效果好。
9
分娩方式 顺产 助产 顺产 顺产 顺产 剖宫产 顺产 剖宫产 顺产 顺产
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理
年龄 18 20 22 24 26 28 30 32 34 36 38 40 合计 工人 2 9 28 50 50 34 11 14 4 2 3 0 207 管理人员 0 2 7 34 43 35 14 2 2 1 1 0 141 农民 0 6 10 28 25 10 11 3 5 1 1 2 102 商业服务 0 10 24 52 45 34 22 14 3 4 0 0 208
定性资料的统计描述
![定性资料的统计描述](https://img.taocdn.com/s3/m/ae3c46fdd0f34693daef5ef7ba0d4a7303766c7b.png)
1. 直接法
选择人口数作标准
P' NiPi N
选择人口构成比作标准
P'
Ni N
Pi
Ni:标准年龄别 人口数
Pi:实际年龄别 ××率
N:标准人口总数
23
选择治疗人数之和作标准
直接法计算标准化治愈率(%)
病型
(1) 普通型 重型 合计
标准治 疗人数 (Ni) (2)
400 400 800(N)
38
6.已知男性的钩虫感染率高于女性。欲比较甲、乙两乡居 民的钩虫总感染率,但甲乡人口女多于男,而乙乡男多 于女,适当的比较方法是( )。
A.分性别进行比较 B.两个率比较的2检验 C.不具可比性,不能比较 D.对性别进行标准化后再比较 E.作两个总率差别的假设检验
39
7.要比较甲乙两厂某工种工人某种职业病患病率的高低, 采取标准化法的原理是( )。
p' 427 100% 53.4% 47.5% 800
24
2. 间接法(以死亡率为例)
选择年龄别死亡率作标准
P' P r P SMR n i Pi
P: 标准总死亡率 ΣniPi: 预期总死亡数
r: 实际总死亡数
r/ΣniPi (SMR) :
ni: 实际组别人口数 标准化死亡比(Standard
n i Pi
(6)=(2)(5) 51 145 115 42 353
27
原发性骨质疏松症标准化患病比SPR
城市
实际患病人数 预期患病人数
322 305
1.05
农村
实际患病人数 预期患病人数
335 353
0.95
原发性骨质疏松症标准化患病率 p’
定性资料的统计描述
![定性资料的统计描述](https://img.taocdn.com/s3/m/c3f2bce5e009581b6bd9ebc0.png)
同年内死亡人数 粗死亡率= 1000 0 00 当年平均人口数 1年
强度型指标(近似)
同年<1周岁死亡人数 婴儿死亡率= 1000 0 00 当年活产儿总数
频率型指标近似
同年孕产妇死亡数 孕产妇死亡率= 10万/10万 当年活产儿总数
相对比型指标
统计图表
人口统计指标
例:某医生治疗了4例支气管哮喘病患者, 其中3例有效,即报告有效率为75。
请问该说法是否正确?
某医院统计1985-1990年儿科住院病人疾病种类分 布情况见表:
表 某医院儿科住院病人疾病种类分布情况 疾病种类 先天性心脏病 病人数 250 % 23.8
风湿性心脏病
其它
750
2. 人时资料的描述—强度
流行病学随访研究中,不同个体被观察的时间长度各 不相同,常用人时总和表示被观察的人和时间的总和。 “强度”是流行病学、统计学术语。 ——单位时间内(如年、月、日等)某事件发 生的频率。
某事件发生的个体数 强度型指标 K ( 可能发生某事件的个体 数 时间)
强度型指标通常是指一段时间内的平均概率。如人 时发病率的分子是新发生的事件数,分母是人时 数(观察人数乘以时间)的总和,多用于大人群 长时间随访的资料。
常用的相对数指标大致有三种类型:
频率(relative frequency or proportion)
强度(intensity or rate) 相对比(relative ratio)
主要内容
1. 分类资料的描述—频率和频率分布
2. 人时资料的描述—强度
3. 复合指标—相对比 4. 相对数应用中需注意的问题
新发病例数 人时发病率 观察的人时总数 新发病例数 (折合的观察人数 ( )单 位 时 间 的 个 数 ) 院的院内感染调查中,5031名病 人共观察了127859人日(例均25.4日),其中 有596人在医院发生感染,请计算院内感染率。
定性资料的统计描述
![定性资料的统计描述](https://img.taocdn.com/s3/m/352322ee04a1b0717fd5dde5.png)
4
57.14 15.38
7
100.00 14.00
露露 可口可乐 百事可乐 汇源果汁
1 11 8 1
8 3 2 9
9 14 10 10
合计
24
26
50
频率指标的两个特点:
• 各组成部分之和为 1(100%); • 某一部分所占比重增大,其它部 分会相应地减少 。
第二节 相对数指标
定性资料的统计描述
二分类变量 分类变量
定性变量
顺序变量
多分类变量
定性资料的统计描述
统计学中,定性资料的统计描 述可以做频数与频数分布,还可以 用相对数(比例/百分比、比率)来 描述和比较这类变量。
中 中 国 国 人 市 口 场 统 统 计 计 年 年 鉴 鉴
第一节 频数与频数分布
频数:各类别出现的个(例)数。
如例1:百事可乐和可口可乐市场占有率之比。
10 R= 0.7143 14
2. 两个率之比(相对数)
P 1 R= P2
如例2:甲城市300户家庭住房满意度调查中 满意率与不满意率的比较。
15% R= 0.4167 36%
应用相对数时的注意事项
计算相对数时,分母不宜过小,确保研究结果的 稳定性。在例数很少的情况下,尽量使用绝对数。
正确计算合计率。对观察单位数不等的几个率, 不能直接相加求其平均。 相对数的对比应注意可比性。即除了要对比的因 素外,其余的等。
【例 2 】在一项城 市住房问题的研究 中,研究人员还在 乙城市抽样调查 300 户,其中的一 个问题是:“您对 您家庭目前的住房 状况是否满意?” 1.非常不满意; 2.不满意; 3.一般; 4.满意; 5.非常满意。
第三讲 定性资料的统计描述 卫生统计学
![第三讲 定性资料的统计描述 卫生统计学](https://img.taocdn.com/s3/m/b34590ed102de2bd96058877.png)
(3)负担系数(dependency ratio):又称抚养比或抚养系数,是指 人口中非劳动年龄人数与劳动年龄人数之比。 一般以15~64岁为劳动 年龄, 14岁及以下和65岁及以上为非劳动年龄。 (4)老少比 :指65岁及以上的老年人口与14岁及以下的少年儿童人 口之比,表示每100名少年儿童对应多少老年人,是划分人口类型的标 准之一。 (5)性别比(sex ratio): 指男性人口与女性人口的比值。
指 标 分 子 分 母 基 数 类 型
粗死亡率
某年龄组死亡率 婴儿死亡率 新生儿死亡率 围生儿死亡率 5岁以下儿童死亡率 孕产妇死亡率 某死因死亡率 某病病死率 比例死亡比
同年内死亡人数
同年年龄组死亡人数 同年<1周岁死亡人数 同年<28天死亡人数 同年围生期死胎数+死产 数+<7天死亡人数 同年5岁以下儿童死亡数 同年孕产妇死亡数 同年内某原因死亡人数 同年某病死亡人数 同年某死因死亡数
率(frequency)指标、强度(intensity)指标和相对比
(relative ratio)指标。
例题:某年某市甲、乙两区麻疹发病儿童数分别为
100人和200人,已知两区的麻疹易感儿童数分别为 1000人和4000人,试比较区的麻疹发病情况。 甲、乙两区麻疹发病儿童数比为:100:200=1:2 甲区麻疹发病率为:(100÷1000)×100%=10% 乙区麻疹发病率为:(200÷4000)×100%=5% 甲、乙两区麻疹发病率的比为:10%:5%=2:1
注意: (1)死于所有原因的死亡率也称粗死亡率。 (2)死亡率也可按不同特征分别计算死亡专率,如按年 龄、性别、病种等计算年龄别死亡率、性别死亡率等。 (3)计算时应注意分母必须是与分子相应的人口。 (4)比较不同地区死亡率,人口构成不同时,需要先对 死亡率进行标化。
医学统计学定性资料的统计描述
![医学统计学定性资料的统计描述](https://img.taocdn.com/s3/m/d930bb8f9fc3d5bbfd0a79563c1ec5da50e2d62f.png)
卡方检验在医学领域应用
疾病与基因型关联分析
01
通过比较不同基因型在疾病组和对照组中的分布差异,判断基
因型与疾病是否有关联。
临床试验效果评价
02
比较不同治疗方法在患者中的疗效差异,如药物疗效、手术效
果等。
医学影像学诊断准确性评估
03
通过比较影像学诊断结果与金标准诊断结果的一致性,评估影
像学诊断方法的准确性。
非数值性
定性资料不以数值形式表示,而是用 文字、符号等描述。
类别性
定性资料通常按照不同的类别或属性 进行分类。
主观性
定性资料的收集和分析往往涉及主观 判断和解释。
常见定性资料类型
分类资料
按照某种特征或属性将数据分成不同的组别,如性别、 血型等。
顺序资料
除了分类外,还具有一定程度的顺序或等级关系,如 病情严重程度、治疗效果评价等。
数分布表。
图表展示技巧与规范
选择合适的图表类型
根据数据的性质和特点,选择合适的图表类 型,如直方图、条形图等。
数据点标识
在图表中标识出重要的数据点,如最大值、 最小值、平均值等。
图表标题和坐标轴标签
为图表添加标题和坐标轴标签,以便读者理 解图表内容。
图例和颜色使用
使用图例说明不同数据系列的含义,并合理 运用颜色以增强图表的可读性。
整性。
02
Fisher确切概率法计算
根据研究目的和假设,选择合适的统计软件或编程语言实现Fisher确切
概率法的计算过程。
03
结果解读与报告
对计算结果进行解读和分析,将结果以图表或文字形式呈现,并结合专
业知识对结果进行解释和讨论。同时,需要注意结果的可靠性和可重复
定性资料的统计描述
![定性资料的统计描述](https://img.taocdn.com/s3/m/c37bbcfc04a1b0717fd5dd9f.png)
K:比例基数 选择K的原则:使算得的率至少保留 使算得的率至少保留1—2位整数。 位整数。 使算得的率至少保留 位整数
强度型指标:指一段时间内的平均概率。 (二)强度型指标:指一段时间内的平均概率 多用于大人群、长时间随访的资料。强度是单 单 位时间段内某现象发生的频率。 位时间段内
某事件发生的个体数 强度型指标= ×K ) 数 ∑(可能发生某事件的个体 ×时间
三、标准化法的注意事项 1. 注意标准化法的适用条件 1)欲比较的两个人群内部的年龄分布不同。 )欲比较的两个人群内部的年龄分布不同。 2)每个人群内部年龄别死亡率也各不相同, )每个人群内部年龄别死亡率也各不相同, 但前提条件是总率的比较。 但前提条件是总率的比较。 2. 标化后的标准化率已不再反映当地的实际 水平,只表示相互比较的几组资料间的相对水平。 水平,只表示相互比较的几组资料间的相对水平。 相对水平
K:比例基数 选择K的原则:使算得的率至少保留 使算得的率至少保留1—2位整数。 位整数。 使算得的率至少保留 位整数
例如 1个人患病10天,为 10个人日,10个人患病1 天也为10个人日。 例3-3 在某医院的院内感染调查中, 在某医院的院内感染调查中,5031个 个
病人共观察了127859人日(例均25.4日),其中 人日(例均 病人共观察了 人日 日),其中 人在医院发生感染, 有596人在医院发生感染,则 人在医院发生感染 院内感染率=596/127859=0.0047人/人日 人 人日 院内感染率 意味着平均每天有0.47%的病人将在医院获得感染。 的病人将在医院获得感染。 意味着平均每天有 的病人将在医院获得感染
注:在进行标准化率的计算时,标准组指标用大写 在进行标准化率的计算时, 字母表示,被标化组指标用小写字母表示。 字母表示,被标化组指标用小写字母表示。
[临床医学]3定性资料的统计描述_OK
![[临床医学]3定性资料的统计描述_OK](https://img.taocdn.com/s3/m/2b5b7cd0482fb4daa58d4bf0.png)
表 某地1990~1998年床位发展动态
年份
1990 1991 1992 1993 1994 1995 1996 1997 1998
指标 符号
a0 a1 a2 a3 a4 a5 a6 a7 a8
年末床 位数
5420 5608 5766 5886 5991 6284 6609 6955 7352
绝对增长量
疾病种类
死亡人数
百分比(%)
恶性肿瘤
50
33.33
呼吸系统疾病
30
20.00
消化系统疾病
20
13.33
循环系统疾病
40
26.67
传染病
10
6.67
合计
150
100.00
5
第一节 定性变量的分布描述
二、描述定性资料的统计指标
除了用频数分布表、图全面反映定性资 料外,也可以用若干相对数指标从某个侧面 来描述定性变量。相对数指标大致有三种类 型:相对比型指标、频率型指标、强度型指 标。
两比较组的内部构成应相同或相近。
21
例 某病两种疗法的治愈率(%)比较的资料如表
表 某病两种疗法的治愈率(%)的比较
普通型
病例数 60
西医疗法组
中西医结合疗法组
治愈数 治愈率 病例数 治愈数 治愈率
(%)
(%)
36 60
20
13
65
重型
20
8 40
60
27
45
爆发型
20
4 20
20
5
25
合计
100
年龄 组
(1)
标准人 口构成 比
(2)
原死 亡率
定性资料的统计描述
![定性资料的统计描述](https://img.taocdn.com/s3/m/6e17dbdb4693daef5ef73de0.png)
第5章 定性资料的统计描述♦ 1.掌握相对数的意义、概念、分类 ♦ 2.熟悉相对数的特点和计算方法 ♦ 3.掌握相对数应注意的问题 ♦ 4.熟悉动态数列的概念和意义♦ 5.熟悉医学常用相对数指标的概念和意义 第一节 常用相对数♦ 绝对数:调查或实验研究中清点定性资料得到的实际数据被称为绝对数。
♦ 相对数:两个有联系指标之比。
♦ 医学上常用的相对数有率、构成比 、相对比等统计指标 一、率率(rate式中:K 为比例基数,常以百分率(%)、千分率(‰)万)表示,原则上使计算结果至少保留1~2位整数。
但在医学资料中某些指标的比例基数是固定的。
常见率的指标如下:⒈人口学指标:粗死亡率、出生率、人口自然增长率、婴儿死亡率、新生儿死亡率等人口学指标常用的比例基数是1000‰。
2.肿瘤指标:恶性肿瘤死亡率、发病率、患病率通用比例基数是100000/10万。
3.其他指标:生存率、病死率通用的比例基数是100%。
二、构成比构成比(proportion )又称构成指标,说明某一事物内部各组成部分所占的比重或分布。
♦ 常用来表示疾病或死亡的顺位、位次或所占比重。
由于构成比之和为100%,一部♦ 比(ratio )又称相对比,是A 、B 是B 的若干倍或百分( 或× 100%) 常用相对比指标1.对比指标:指两个同类事物某种指标(绝对数、两个率或其它同类指标)的比。
2.关系指标:指两个有关的、但非同类事物的数量的比。
3.计划完成指标:说明计划完成的程度,常用实际数达到计划数的百分之几或几倍表示。
表5-1 1993~1998年某地损伤与中毒病死率(%)与构成比(%)第二节1.计算相对数时分母一般不宜过小 ,一般不能小于30例。
2.分析时不能以构成比代替率 。
3.对观察单位数不等的几个率,不能直接相加求其总率。
4.应当注意不能用构成比的动态分析代替率的动态分析。
5.在比较相对数时应注意可比性。
6.对样本率(或构成比)的比较应随机抽样,并做假设检验。
第5章定性资料的统计描述
![第5章定性资料的统计描述](https://img.taocdn.com/s3/m/6524fbc06f1aff00bed51e54.png)
第五章定性资料的统计描述在医学研究与实践中,大量资料都是按照事物的特征或属性进行分类的,这类资料称为定性资料,也称分类资料或计数资料。
如性别、HIV感染情况、病情轻重等都属于分类资料。
分类资料按类别分类计数所得到的数叫绝对数,绝对数往往不便于进行相互比较。
例如甲医院某年因某病死亡105人,同年乙医院因该病死亡185人。
但不能据此认为乙医院该病的死亡情况比甲医院严重,因为两医院因该病住院的人数不一定相等,此时需要采用相对数指标进行统计描述。
第一节常用相对数及其应用一、定性资料的频数分布与定量资料一样,定性资料也可通过编制频数分布表描述其分布特征,并通过计算一些常用的相对数指标进行统计描述和统计推断。
定性资料频数分布表又称为列联表,是用两个分类变量对同一资料进行双向分类形成的表,可用于考察两种属性的关系。
表5.1为某中学不同性别青春期少年对自身体型感觉的构成情况的列联表。
表5.1 某中学不同性别青春期少年对自身体型感觉的构成情况性别自感偏瘦正常自感偏胖男39 186 20女25 130 54列联表的横标目一般为分组变量,纵标目为结局变量。
列联表的用途主要有:1. 列出每组中各种不同结局分类后的频数。
2. 描述频数分布的特征。
3. 便于进一步对分类资料的特征进行统计描述和统计推断。
二、常用相对数指标除了用频数分布表可以全面反映定性资料的特征外,也可计算相对数指标来描述定性资料的特征。
相对数是两个有关联的数值之比,常用的相对数指标有率、构成比和相对比三种。
(一)率率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。
根据计算公式中分母的观察单位总数是否引入时间因素,率包括频率和速率两类指标。
频率(frequency)计算中,分母没有引入时间因素,无时间量纲,分子是分母的一部分,其取值在0~1之间,如常见的发病率、患病率、病死率、治愈率等指标,都属于频率型指标,其实质是比例,在流行病学中也常称为累积发生率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相对数的概念和意义
概念:相对数是两个有联系的指标之比。 两个特点:
表示事物出现的频度。 把基数化作相等,便于比较。
第二节 常用相对数指标
❖ 相对数(Relative number):是两个有关联的数据之比, 用以说明事物的相对关系,便于对比分析。
❖ 常用的相对数指标很多,按联系的性质和说明的问题不同, 主要分为:率、构成比、相对比三类。
767
14.31
875
16.33
5359
100.00
(4)构成比的统计学意义
事物内部某组成部分的构成比越大,说明它所占 的比重越大,它出现的观察单位数也越多。
二、 率
率是强度型指标,是指单位时间内某现象发生的频率,如人时发 病率的分子是新发生事件数,分母是人时数的总和。强度(intensity) 的计算公式为:
27 无
中学
顺产
足月
22 无
小学
助产
足月
25 管理人员 大学
顺产
足月
24 知识分子 中学
顺产
早产
30 管理人员 大学
顺产
足月
32 无
小学 剖宫产 足月
27 无
中学
顺产
死产
29 无
大学 剖宫产 足月
……
…
…
…
26 无
小学
顺产
足月
按文化程度与分娩方式整理资料
文化程度 小学 中学 大学 合计
顺产 助产 剖宫产
A1 A2
Ak
100
%
构成比
2
A1
A2 A2
Ak
100
%
构成比
K
A1
AK A2
Ak
100
%
K 个构成比的合计为
100 %
汉族不同年龄组孕妇携带HBsAg情况
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
年龄(岁) 受检人数 HBsAg 阳性人数 阳性比(%) 阳性率(%)
强度
某事件发生的观察单位数 折合的可能发生某事件的观察单位数
单位时间
K
3-2b
─────────────────────────────
≤20
36
4
3.2
11.1
21-
985
60
48.8
6.1
26-
999
52
42.3
5.2
31-
263
6
4.9
2.3
36-
44
1
0.8
2.3
──────────────────────────
合计
2327
123
100.0
5.3
(3) 特 点 a. 一组资料各部分构成比之和为100%; b. 当某一部分构成比增大时,其余部分的构成 比相应减少。
40 5
5
100 20
30
200 10
90
340 35 125
合计 50 150 300 500
2. 二分类变量的频率分布
表 3-2 调查对象是否白细胞减少症患者的分布情况
调查对象
例数
频率 (%)
(1)
(2)
(3)
患者
64
5.7
非患者
1050
94.3
合计
1114
100.0
3. 多分类变量的频率分布
内容
第一节 计数资料的频率分布
一 计数资料的频数表
按类别或属性,分别清点各类别或属性的观察单位数
(频数),分类变量及相应的频数所组成的频数表,
称分类资料的频数表
某药对200例高血压患者的疗效
病人编号
药物
疗效
1
新药
有效
2
安慰剂
无效
3
安慰剂
有效
4
新药
有效
5
安慰剂
无效
6
新药
有效
7
新药
无效
8
安慰剂
有效
例3-1 某课题组为 研究白细胞减少症 与工作环境的关系, 用随机抽样的方法 于2004年对某市企 业中的四个工种 1114名工人进行了 调查。依据白细胞 减少症的诊断标准 判断调查对象是否 患者。
工种 (1) 苯作业 塑料作业 化学药物 放射作业 合计
表 3-1 不同工种调查对象和白细胞减少症患者的分布
一、构成比 proportion
1、概念:说明某事物内部各组成部分所占的比 重或分布
2、计算公式:
比
某一组成部分的观察单位数 各组成部分的观察单位总数
100%
构成 比 A 1
10 % 0
A 1A 2A 3A 4
设某事物个体数的合计由A1,A2,…,AK个部分组成,构成比计算 为:
构成比
1
A1
强度
某事件发生的观察单数
(可能发生某事件的单位数 观察时长)
K
3-2a
比例基数(K )可以是100%、1000‰、……,其选取是根据习惯用法和需要选用,主
要使算得的率至少保留1~2位整数,便于阅读。
患病率、发病率、感染率 : 百分率(%)
人口出生率与死亡率:
千分率(‰)
肿瘤死亡率:
十万分率(l/10万)
例 3-2 某企业每年都对职工进行体检。2003 年有老职工 2714 名,7 月 1 日新进的职工 250 名,该企业这一年新发生高血压病人 5 例,2003 年的高 血压发病率为
5
1000 5 1000 1.7610-3
27141 250 0.5 1000 2839 1000
=1.76 人/1000 人年
调查对象
例数
频率 (%)
(2)
(3)
389
34.9
例数 (4) 29
患者 频率 (%) (5) 45.3
311
27.9
13
20.3
260
23.4
13
20.3
154
13.8
9
14.111141 Nhomakorabea0.064
100.0
绝对数的概念与意义
调查研究和实验研究得到的计数资料或等级资料经过整理, 清点数目得到的数值称为绝对数。 如某病的发病人次数、医院收容人数、治愈人数等。 绝对数反映一定条件下某种事物的规模或水平,是计划或 总结工作的依据, 绝对数是计算相对数与平均数的基础。 绝对数往往不便于比较。
例:调查得某年小学生中流脑发病:甲地区63例,乙地区35例。
甲地区流脑流行比乙地区严重 如已知小学生总人数:甲地区50051人,乙地区14338 人,可算出两个发病率:
甲地区流脑发病率:63/50051×1000‰=1.26‰ 乙地区流脑发病率:35/14338 × 1000‰=2.44‰
乙地区流脑流行比甲地区严重
表 某市1980年和1990年五种传染病发病情况
病种
痢疾 肝炎 流脑 麻疹 腮腺炎 合计
1980年
病例数
构成比 (%)
3604
49.39
1203
16.49
698
9.56
890
12.20
902
12.36
7297
100.00
1990年
病例数
构成比 (%)
2032
37.92
1143
21.33
542
10.11
9
安慰剂
无效
…
…..
….
200
新药
有效
分组
新药 安慰剂 合计
实验人数
50 150 200
构成比 (%) 25 75 100
分组 新药 安慰剂 合计
有效 40 50 90
无效 10 100 110
合计 50 150 200
关于孕妇分娩的原始资料记录
住院号 …
年龄 职业 文化程度 分娩方式 妊娠结局