(优选)定性变量的统计描述.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
k
频率的特征:
➢分子是分母的一部分; ➢无量纲,在0~1之间取值。
麻疹患者 300人
甲地 30000人
二、强度(intensity)
强度是流行病学、统计学术语,指单位时间内某现 象发生的频率。
计算公式:
强度
某事件发生的观察单位数
可能发生某事件的观察单位数时间
K
特点:
➢ 分母含有时间,指单位时间内的频率; ➢ 其统计学本质为频率强度,即概率强度的近似值。
表3-1 某课题组为了解城乡居民慢性病的患病情况,于 2010年对某地区城乡25个社区的居民进行了调查。课题组 对资料进行了整理,将1381例被访者和284例慢性病患者 按职业分组制成频数表见表3-1
表3-1 2010年某地区被访者和慢性病患者按职业分组的频率分布
患者
51.4
25 12.7 10.9
问题1.甲地麻疹发病比乙地严重吗?
绝对数
问题2.该怎样表示两地麻疹发病强度?
相对数
分类资料的统计描述常用相对数
往往先统计具有某种属性的个体数,进而 用相对数来描述和比较这类变量。
相对数(Relative number)的概念:是两个
具有内在联系的指标之比。
包括
频率 ( Frequency or Proportion) 强度 ( Intensity )
表3-2 2010年某地区1381例被访者是否慢性病患者的频率分布
➢ 患慢性病的频率占:284/181=20.6% ➢ 不患病的频率占:1-20.6%=79.4%
(2)所以对这样一个二项分类来说,用一个 20.6%就能描述整个资料的频率分布。
表3-3 2010年某地区1381例被访者按职业分组的慢性病患病率
“人时”:人×观察时间(年、月)
举例:单位“人年”
➢1个人观察1年
1人年
➢1个人观察10年
10个人观察1年
Leabharlann Baidu
10人年
➢有3个人,第1个人观察10年
第2个人观察 5年 第3个人观察 1年
16人年
相当于16个人观察了1年
∴ 观察人时的总和=单位时间×折合的观察人数
强度
某事件发生的观察单位数
可能发生某事件的观察单位数 时间
【举例】 某市1977~1979年肺癌死亡率城区
为19.39/10万,郊区为9.99/10万,比较二者 的严重程度。
答: R= 19.39/9.99=1.94
定性变量的 统计描述
引 子:
统计学
卫生统计学
变量
定量 变量
定性 变量
多分类 两分类
研 统计描述 究 方 法 统计推断
【举例】
某年甲乙两地发生麻疹流行,甲地发病人 数为300人,乙地发病人数为250人, 甲地发病人数比乙地多50人,能否据此 认为甲地麻疹发病比乙地严重呢? .
目的:比较甲、乙两地麻疹的发病情况。
被访者
53.4
25.2 13.1 8.3
0%
20%
40%
60%
80% 100%
农民 事业职员 企业工人 商业人员
图3-1 2010年某地区调查的被访者和慢性病患者的职业分布
商业人员 11%
企业工人 13% 农民 51% 事业职员 25%
图3-2 2010年某地区慢性病患者的职业分布
二、二分类变量的频率分布
答:院内感染率 新发病例数 × K
观察人数总和
596人 127859人×1日
× 100%
0.47人/100人日
即每天医院内发生院内感染的频率是0.47人/100人 日,据此推测平均每天100人中有0.47个患者将在医院 内发生感染。
三、相对比 (relative ratio)
是两个有关联的指标 A与 B,实际应用中简称比 (ratio),说明二者的对比水平。
K
某事件发生的观察单位数 折合的可能发生某事件的观察单位数
单位时间
K
≈ 单位时间内新发生的概率
式中的K为比例基数,可以为100%、1000‰、 10 000/万、100 000/10万等。
例3-2 某企业2003年有2839名职工,该企业每年都对职工 进行体检,这一年新发生高血压病人5例,试求2003年的 高血压发病率:
➢ 二分类资料,对1381名被访者中,农民患病的频
率占19.8%,不患病的占80.2%。
30
25
患 20 病 15 率 10 (%) 5
0
农民
事业职员 企业工人 商业人员
图3-3 2010年某地区1381例被访者不同职业的慢性病的患病率(%)
表3-4 2010年某地区1381例被访者按职业和性别分组的慢性 病患病率
相对比 ( Relative ratio )
第一节 定性变量频率分布
一、多分类变量的频率分布
定性资料 频率分布表/图 分布特征
频率型指标
相对数指标 强度型指标
相对比指标
频率分布表/图特点:能描述一个全面的分布特征,即把 所有各种可能性的特征都给描述出来。 相对数指标特点:从某个侧面来描述定性变量,尽管不 一定能全面的描写某分布,但有助于统计描述和推断。
患病率(%)
男性 女性 30 20 10 0
农民 事业职员 企业工人 商业人员
图3-4 某地区1381例被访者按职业和性别分组的慢性病患病率(%)
第二节 常用相对数指标
一、频率型指标(Frequency)
指某现象发生的频率,或表示事物内部某个组成成 分所占的比重或分布。
计算公式:
频率
发生某现象的观察单位 数 可能发生某现象的观察 单位总数
计算公式: 相对比 A 100% B
意义:表示相对于B 的一个单位,A 有多少个单位,
或A为B的若干倍或百分之几。
注意:
1. A和B是绝对数,也可是相对数、平均数。 2. A和B可是同性质的指标,也可是不同性质的指
标,即其量纲可以相同,也可以不同。 3. 但 A 和 B应互不包含。
【举例】
➢ 人口调查中使用的男女性别比例比。 ➢ 某病年龄组发病率之比。 ➢ 甲乙两地亩产量之比 ➢ 医院管理中“医护人员与病床数”之比
答:
HBP 人年发病率
新发生高血压人数 可能发生高血压的人数 观察时间
1000
/1000
5人 2839 人 1年
1000
/1000
1.76人 /1000 人年
即:2003年的高血压发病率为1.76人/1000人年。 据此推测2003年观察人群发生高血压的概率是1.76‰。
【举例】:在某医院院内感染调查中,5031个病人共观察 了127859人日(人均25.4日,也相当于127859人各观察1 日),其中有596人在医院发生感染,试求其院内感染率?