第三章定性资料的统计描述(7版)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1)频率分布表
2)频率分布图——百分条图或圆图
百 分 条 图
2)频率分布图——百分条图或圆图
圆 图
二、 二分类变量的频率分布
对于例3-1中的资料,试用频率指标表示被访者 是否患病的分布,以及不同职业被访者是否患 病的分布。
1)频率分布表
2)频率分布图——直条图
单 式 直 条 图
2)频率分布图——直条图
✓A和B可以是绝对数、相对数和平均数,A和B的量纲 可以不同,也可相同,但A和B互不包含。
✓计算方法:
A 100% B
✓最常见的相对比是人口学中的男女性别比;在医疗卫生工作 中,反映卫生资源的指标如每千人口的医生数、每千人口的病 床数、每医生的门诊工作量等都是相对比。
✓流行病学中的相对危险度RR=P1/P0和优势比OR=病例组的优 势/对照组的优势=(a/b)/(c/d)=(ad)/(bc)都是相对比指标
第三章 定性变量的统计描述
郑辉烈 ncuwstj@aliyun.com
第一节 定性变量的频率分布
定性变量的资料经过分类汇总整理的 频数表称为频率分布表。
定性变量从形式上可分为多分类变量 和二分类变量。
一、 多分类变量的频率分布
例3-1 某课题组为了解城乡居民慢性病的患病 情况,于2010年对某地区城乡25个社区的居民 进行了调查。课题组对调查数据通过核查整理, 将1381例被访者和284例慢性病患者按职业分 组制成频数表(表3-1),用频率指标表示其频率 分布。
频率=可能发发生生某某事事件件的的观观察察单单位位数总数 K
✓分子是分母的一部分; ✓无量纲,在0~1范围内取值; ✓K是比例基数,通常取为100%,或1000‰、10 000/万和 100 000 /10万等,根据习惯用法来决定。
二、强度
✓强度型指标通常是指单位时间内某事件发生的频率。
强度=
发生某事件的观察单位数
EB病毒阴性人群的人时发病率为:
P0
d0 T0
54 105 437579
/105
12.34105/ 人年
EB病毒阳性人群的人时发病率为:
P1
d1 T1
57 20477
105
/105
278.36105/ 人年
三、相对比
✓相对比型指标是指两个有关联的指标A与B之比,通 常以倍数或百分数表示,简称为“比”(ratio)。它表 示相对于B的一个(或十个、百个、千个等)单位,A有 多少个单位。
如n1
n2,则:pc
x1 n1
x2 n2
如n1
n2,则:pc
p1 2
p2
5)相对数间的比较要具备可比性 主要应注意以下几个方面: (1)观察的对象是否同质,研究的方法(如检测手段、抽样方法)
是否相同,观察的时间是否一致等; (2)对比不同时期的资料时应注意客观条件是否相同; (3)观察对象重要属性的分布是否相同,如若不同,则要采用
第三节 医学人口统计常用指标
ห้องสมุดไป่ตู้一、医学人口统计资料的来源
(一)日常工作记录(报告单、卡、册) (二)统计报表 (三)人口调查:普查和抽样调查
二、描述人口学特征的常用指标
(一)人口总数(万人) 指一个国家或地区在某一特定时间的人口数,一般采用
一年的中点进行统计。
表Ⅰ 各人口普查年我国人口城乡和性别分布
发病率
新发生高血压病人数
可能发生高血压的人数
1年
1000
/
1000
5人 2839人
1年 1000
/
1000
1.76人/ 1000人年
例3-3 为探讨EB病毒与鼻咽癌发病的关系,研究者在某市进行了EB病毒抽样调查, 共检查25~70岁居民41471人,其中38550人EB病毒抗体阴性,2921人阳性。以EB 病毒抗体阴性和阳性者形成两个组,进行了为期12年的队列研究,两组分别随访 了437579人年和20477人年,EB病毒抗体阴性组共发生鼻咽癌54例,阳性组57例。 试计算两组的人时(或人年)发病率。
复 式 直 条 图
第二节 常用的相对数指标
相对数指标有三种类型: 频率型指标—频率(frequency) 强度(intensity) 相对比(relative ratio)。
相对数应与绝对数结合使用。
一、频率型指标
✓频率型指标是最常见的,通常近似地反映某一事件发生的 机会大小,即频率。如患病率、治愈率等。 ✓计算公式:
标准化法或多因素分析方法来校正比较组间观察对象属性分 布不同对研究结果的影响。
6)对相对数的统计推断
✓ 在随机抽样的情况下,从样本估计值推断总体的相对数应 当考虑抽样误差,因此原则上需要进行参数估计和假设检 验。
✓ 但是,对相对比的统计推断非常困难;对强度型指标的统 计推断也不太容易;而对频率分布作统计推断的理论和技 术却比较成熟。
例3-4 根据例3-3的计算可得:P0=12.34/10万人年,P1= 278.36/10万人年,试计算EB阳性组人群与阴性组人群鼻咽癌发 病的相对危险度?
RR=P1/P0=278.36/12.34=22.56
四、应用相对数时的注意事项
1)准确理解相对数的含义,防止概念混淆; 2)频率型指标的解释要紧扣计算指标时的总体范围(分母)
可能发生某事件的每一观察单位 其观察时长
K
或 强度=折合的可某能事发件生发某生事的件的观单察位单数位数单位时间 K
✓比例基数K同上。 ✓如人时发病率的分子是新发生的事件数,分母是人时数(观察人数乘以时 间)的总和,多用于大人群长时间随访的资料。
例3-2 某企业2003年有2839名职工,该企业每年都对 职工进行体检,这一年新发生高血压病人5例,2003 年的高血压发病率?
(二)人口学特征指标
人口学的基本特征包括性别、年龄、文化职业 等,其中最常用来描述人口结构的是年龄和性别。
将人口的性别、年龄分组数据,以年龄为纵轴, 人数或百分比为横轴,左侧为男,右侧为女绘制 而成的图形称之为人口金字塔。
及指标描述的属性(分子); 3)计算相对数时分母应有足够数量;
✓ 如果资料的总例数过少,计算的偏差可能会很大。 ✓ 在动物实验中,如果有周密的设计和严格的质量控
制,数量可相对少一些。
4)正确地合并估计频率(或强度)型指标
✓ 当分组的资料需要合并起来估计频率或强度时,应将计算 各组所用的分子相加作为合并估计的分子,将各组的分母 相加作为合并估计的分母。不可将分组的频率或强度取平 均数作为合并的频率或速率。