医学统计学 定性资料的统计描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用相对数时应注意的问题:
(一)防止概念混淆
不少指标命名混乱,某某率满天飞!
有的某某率实际上只是相对比! 更多的指标笼统的称为“率”,但分不清究
竟是频率,还是强度。 故实践中遇到相对比的指标,应认真思考 其定义,辩别其性质,切不可顾名思义。
(二) 频率型指标的解释要紧扣总体和属性
表3-1 不同工种调查对象和白细胞减少症患者的频率分布
【例2 】 : 比较某地有一个钢铁厂,一个棉纺 厂,两厂人数、规模近似,体检时发现,棉纺 厂的胆囊炎患者明显地高于钢铁厂,这能否说 明棉纺厂的胆囊炎患病情况比钢铁厂严重? 【分析】: 不能
性别构成是影响胆囊炎患病的因素,女性易患
胆囊炎。 两厂性别构成不同,棉纺厂女性所占比例明显 高于钢铁厂,所以不能得出该结论。
60.0
100
65
65.0
重型 合计
100 400
35 215
35.0 53.8
300 400
125 190
41.7 47.5
【分析】:
比较两疗法的治愈率,从合计率看甲法优于乙法。 该病的严重情况对治愈率有直接的影响,但在两组的
分布明显不同。 因为两组该病轻重病型构成不同,所以粗治愈率不 能直接拿来比较。
13.8% 34.9%
苯作业 塑料作业 化学药物 放射药物
14.1%
45.3%
20.3%
23.4% 调查对象所作工种 的频率分布图
27.9%
20.3% 白细胞减少症患者所 作工种的频率分布图
(2)按“是否患白细胞减少症”描述频率分布情 况:
患白细胞减少症的频率占:64/1114=5.7% 不患此病的频率占:1-5.7%=94.3%
等
小
结
⒈定性资料的变量形式有多分类和两分类。可通过频率表描 述全面的分布特征,用相对数从所侧重的方面描述某属性 的特征,通常描述某一类别的频数在总频数中占的比重。 ⒉常用的相对数有三类:频率型、强度型和相对比型。相对 数的发生取决于其分子和分母的意义,不同相对数其指标 的定义和结果解释是不同的。
指标 频率
例一:甲医院治疗100例患者,其中40例有效。 甲医院有效率是40% 例二:乙医院治疗5例患者,其中2例有效。 乙医院有效是2/5,其疗效有待于进步观察
故资料总例数过少,则计算所得相对数的偏差会 比较大,这种情况下直接报告原始数据更为可取。
(四) 正确的合并估计
举例:甲医院治疗患者100例,40例有效。乙医院治 疗同类患者90例,30例有效,计算两院的总有效率。 答:分别计算甲、乙两院的有效率,相加后除2: 1 40 30 ( + ) 有效率= 90 2 100 40+30 =36.8% 正确合并: 有效率= 100+90
答:院内感染率
新发病例数 观察人数总和 596人 127859人×1日
×K × 100%
0.47人/100人日 即每天医院内发生院内感染的频率是0.47人/100人 日,据此推测平均每天100人中有0.47个患者将在医院 内发生感染。
三、相对比 (relative ratio)
:是两个有关联的指标 A与 B,实际应用中简称比
第三章:
定性资料的统计描述
引 子:
统计学
医学统计学 定时 变量
多分类
变 量
定性 变量
两分类
研 究 方 法
统计描述
统计推断
【举例】
某年甲乙两地发生麻疹流行,甲地发病人 数为300人,乙地发病人数为250人, 甲地发病人数比乙地多50人,能否据此
认为甲地麻疹发病比乙地严重呢?
.
目的:比较甲、乙两地麻疹的发病情况。
【举例】
人中调查中使用的男女性别比例比。 某病年龄组发病率之比。 甲乙两地亩产量之比 医院管理中“医护人员与病床数”之比
【举例】 某市1977~1979年肺癌死亡率城区
为19.39/10万,郊区为9.99/10万,比较二者 的严重程度。
答: R= 19.39/9.99=1.94
即城区肺癌死亡率为郊区的1.94倍。
从样本估计总体相对数,需进行参数估计和假设检验
对频率分布进行统计推断比较成熟
理论和技术 对强度指标进行统计推断不容易 对相对比进行统计推断非常困难
第四节 粗率的标准化法
例3-3: 比较甲、乙两个疗法的治愈率
病型 普通型 甲疗法
病例 治愈数 治愈率(%)
乙疗法
病例 治愈数 治愈率(%)
300
180
16人年
∴ 观察人时的总和=单位时间×折合的观察人数
人时发病率
某事件发生的观察单位
数 单位数 时间
可能发生某事件的观察
某事件发生的观察单位 折合的观察单位数
K
数
单位时间
K
≈ 单位时间内新发病例的概率
式中的K为比例基数,可以为100%、1000‰、 10 000/万、100 000/10万等。
包括
强度 ( Intensity ) 相对比 ( Relative ratio )
第一节 三种相对数
一、频率与频率分布
定性资料
频率分布表/图 分布特征
频率型指标
相对数指标
强度型指标 相对比指标
频率分布表/图特点:能描述一个全面的分布特征,即把 所有各种可能性的机会都给描述出来。 相对数指标特点:从某个侧面来描述定性变量,尽管不 一定能全面的描写某分布,但有助于统计描述和推断。
就分别将分子(分母)相加作为合并估计的分子(分母)
(五) 相对数间的比较要具有可比性
注意以下几个方面:
观察对象、研究方法(检验手段、抽样方法)、
观察时间等;
观察对象的内部构成; 非同期资料对比时应注意客观条件的变化
(六) 对相对数的统计推断:
统计学研究特点:
抽样研究:研究的是样本,目的对总体作出推断 得到的是频率,要对概率作出推断。
常见的混杂因素:年龄、性别、病情等
二、标准化率的计算:直接法和间接法
(一)直接法
适用条件 :已知各组粗率,即实际年龄别死亡率
① ② ②
③ ④
③
P’甲=380/800×100%= 47.5% P’乙= 427/800×100% =53.4%
(二)间接法
适用条件 :各组粗率未知,仅知两比较组⑴患
问题1.甲地麻疹发病比乙地严重吗? 问题2.该怎样表示两地麻疹发病强度?
绝对数 相对数
分类资料的统计描述常用相对数
往往先统计具有某种属性的个体数,进而 用相对数来描述和比较这类变量。
相对数(Relative number)的概念:是两个
具有内在联系的指标之比。
频率 ( Frequency or Proportion)
表3-1 某课题组为研究白细胞减少症与工作环境的关 系,用随机抽样的方法对某市企业的四个工种共1114 名工人进行了调查。依白细胞减少症的诊断标准判断 调查对象是否为患者。
(1)按工种描述调查对象和患者的频率分布情况:
各百分比相当于各工种频数出现的频率,这些频 率加起来是100%;多种工种的情形就有多种频率, 这些频率就构成了一个频率分布,描述两个不同人群 各种工种的分布或说构成情况。 .
调查对象 患者 例数 (4) 29 13 频率(%) (5) 45.3 20.3
工种 (1)
例数 (2)
频率(%) (3) 34.9 27.9
苯作业 塑料作业
389 311
化学药物 放射作业 合计
260 154 1114
23.4 13.8 100.0
13 9 64
20.3 14.1 100.0
(三) 计算相对数的分母应有足够量。
“率的标准化”的意义和基本思 想
当年龄、性别、工龄、病情等因素在两组的内部 构成不同并有可能影响到粗率的情况时,则粗死 亡率、发病率、粗治愈率不能直接进行比较。
如需比较,须采用统一标准构成消除该因素的内部 构成不同对粗率的影响后,用标准化后的统一标准 化率再进行比较。
率的标准化
一、基本概念:
率的标准化法(standardization) :产用一定技术手 段,消除待比较两组率的在人口构成上的差异,从 而推算出统一人口构成的合计率,这一过程,叫率 的标准化法。 标准化率(standardized rate)或调整率(adjustment rate):消除了内部构成差异后计算得出的合计率 称为标准化率。 常需标化的指标:人口死亡率、病死率、发病率等
可能发生某事件的观察
K
特点:
分母含有时间,指单位时间内的频率; 其统计学本质为频率强度,即概率强度的近似值。
“人时”:人×观察时间(年、月) 举例:单位“人年”
1个人观察1年 1个人观察10年
10个人观察1年
1人年 10人年
有3个人,第1个人观察10年
第2个人观察 5年 第3个人观察 1年 相当于16个人观察了1年
实际死亡总数和期望死亡总数的相对比,其 意义是被标化人群和标准组人群死亡率的比较。
SMR>1 说明被标化人群的死亡率大于标准组 SMR<1 说明被标化人群的死亡率小于标准组
计算各组的间接标化率 P’。
p'
SMR ×标准死亡总率
百度文库
小结:标化死亡率的直接法和间接法
三、应用标准化法时的注意事项
1. 标准化法的应用范围很广
病/死亡总人数,⑵各组调查人口的构成情况。
年龄组别标准 患病率
① ② ②
③ ④
标准化患病率
P ’ 城市 42 . 1
③
实际患病人数之和 预期患病人数之和
335 353 40 . 0 %
P ’
322 305
标准患病率
44 . 6 % ,P ’ 农村 42 . 1
标化死亡比 (standard mortality ratio, SMR):
所以对这样一个二项分类来说,用一个5.7%就 能描述整个资料的频率分布。
(3)按“某工种调查对象中是否患白细胞减少症” 这一特征来描述频率分布情况:
二分类资料,对苯作业389个工人中,白细胞减少
症的患病的频率占7.5%,不患的占92.5%。
一、频率(Frequency)
:指某现象发生的频率,或表示事物内部某个 组成成发所占的比重或分布。
1 . 76 人 / 1000 人年
即:2003年的高血压发病率为1.76人/1000人年。
据此推测2003年观察人群发生高血压的概率是1.76‰。
【举例】:在某医院院内感染调查中,5031个病人共 观察了127859人日(人均25.4日,也相当于127859人 各观察1日),其中有596人在医院发生感染,试求其 院内感染率?
相对比
3.标准化的目的是消除重要因素的构成不同对粗率比较的影 响,关键在于选择统一的“标准”。标准化后的率已不反 映当地的实际水平,它只相互比较的资料间的相对水平。
频率
公式
发生某现象的观察单位 可能发生某现象的观察
某事件发生的观察单位
意义
数 单位总数
数 单位数 时间
k
事物内部某组成成分所占的比 重和分布,或某现象发生的频 率。 单位时间内某现象发生的频率 两个有关联的指标之比
强度 相对比
强度
可能发生某事件的观察
A B 100 %
K
(ratio),说明二者的对比水平。
计算公式: 相对比 A 100 %
B
意义:表示相对于B 的一个单位,A 有多少个单位,
或A为B的若干倍或百分之几。
注意:
1. A和B是绝对数,也可是相对数、平均数。
2. A和B可是同性质的指标,也可是不同性质的指 标,即其量纲可以相同,也可以不同。
3. 但 A 和 B应互不包含。
计算公式:
频率 发生某现象的观察单位 可能发生某现象的观察 数 单位总数 k
频率的特征:
分子是分母的一部分; 无量纲,在0~1之间取值。
麻疹患者 300人 甲地 30000人
二、强度(intensity)
:强度是流行病学、统计学术语,指单位时间内某现 象发生的频率。
计算公式:
强度 某事件发生的观察单位 数 单位数 时间
“一个重要的分类变量”:病情、年龄、性别、职业等 “某事件的发生率”:治愈率、患病率、发病率、死亡率
2. 标化后的标准化率已不再反映当地的实际水平,它只 是表示相互比较的资料间的相对水平。 3. 由于选择的标准不同,算出的标准化率也不同,比较 的结果也未必相同,因而报告结果时必须说明所选用 的“标准”及理由。 4. 两样本的标准化率是样本值,存在抽样误差。要比较 时,当样本含量较小时,还应作假设检验。
例3-2 某企业2003年有2839名职工,该企业每年都 对职工进行体检,这一年新发生高血压病人5例, 试求2003年的高血压发病率:
答:
HBP 人年发病率 新发生高血压人数 可能发生高血压的人数 观察时间 1000 / 1000
5人 2839 人 1年
1000 / 1000