第3讲 定性资料的统计描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
250 + 280 × 100% = 82.6%
而不是(80%+85%)/2=82.5%。
动态数列及其应用
动态数列(dynamic series)是一系列按照时间顺序排列 动态数列 是一系列按照时间顺序排列 的统计指标(包括绝对数 相对数或平均数), 包括绝对数、 的统计指标 包括绝对数、相对数或平均数 ,用以反 映事物或现象在时间上的变化和发展趋势。 映事物或现象在时间上的变化和发展趋势。常用的动 态数列分析指标有: 态数列分析指标有:
1、率 率是指某现象实际发生数与某时间点或某时间段可能 发生该现象的观察单位总数之比,用以说明该现象发生的 频率或强度。根据计算公式中分母的观察单位总数是否引 入时间因素,率包括频率和速率两类指标
频率 频率型指标是最常见的, 通常近似地反映某 频率型指标是最常见的, 一事件出现的机会大小,如发病概率、死亡概率等 一事件出现的机会大小,如发病概率、
1000‰ 1000‰ 1000‰ 1000‰ 1000‰ 1000‰ 10万/10 万 10万/10 万 100% 100%
疾病统计常用指标
指标 某病发病率 分子 时期内新发生的某病病 例数 时点现患疾病人数 分母 年平均人口数 ×1年 年 检查人口数 基数 10万/10 万 万 10万/10 万 万 10万/10 万 万 100% 100% 类型 强度型(近似 强度型 近似) 近似
暴露组发病率( p1 ) 相对危险度(RR) = 低暴露(或非暴露)组发病率( p2 )
比值比(OR) = 病例组暴露的比值 a / c ad = = 对照组暴露的比值 b / d bc
应用相对数应注意的事项 防止概念混淆, →防止概念混淆,分析时不能以构成比代替率 →计算相对数时分母应有足够数量 正确地合并估计频率(或强度) →正确地合并估计频率(或强度)型指标 相对数间的比较要具备可比性: →相对数间的比较要具备可比性:观察的对象是否同 研究的方法(如检测手段、抽样方法) 质,研究的方法(如检测手段、抽样方法)是 否相同,观察的时间是否一致等; 否相同,观察的时间是否一致等;被比较的总 体是否具有可比性: 体是否具有可比性:标准化 对相对数的统计推断:参数估计、 →对相对数的统计推断:参数估计、假设检验
• 在构成比指标中,某一组成部分构成比的 增减会影响到其他组成部分构成比的变化。 某地2000年和2005年慢性疾病的发病情况 如表5.4所示:
2000年 年 疾 病 病例数
呼吸系统疾病 循环系统疾病
2005年 年 病例数 2577 2671 1711 1964 8923 构成比(%) 构成比 28.88 29.93 19.18 22.01 100.00
指标 分子 分母 基数 类 型 强度型(近似) 强度型(近似 ) 频率型(近似) 频率型(近似 ) 频率型(近似) 相对比 相对比 强度型(近似 ) 频率型(近似 ) 频率型(近似 )
粗死亡率 某年龄组死亡率 婴儿死亡率 新生儿死亡率 围生儿死亡率 5岁以下儿童死亡 率 孕产妇死亡率 某死因死亡率 某病病死率 比例死亡比
• 例5.3 某医院2003年各科室收治住院患者的 构成情况如表5.1所示。
科 别 内 科 外 科 妇 科 儿 科 合 计 850 1133 425 418 2826 病例数 30.08 40.09 15.04 14.79 100.00 构成比(%) 构成比
相对比
之比。 相对比型指标是指任何两个相关联的变量A与B之比。它表示相对 的一个(或十个、百个、千个等)单位, 有多少个单位。 于B的一个(或十个、百个、千个等)单位,A有多少个单位。A和B可 以是绝对数、相对数和平均数, 的量纲可以不同,也可相同, 以是绝对数、相对数和平均数,A和B的量纲可以不同,也可相同,但 A和B互不包含 相对比=A/B 相对比=A/B 最常见:男女性别比;每千人口的医生数、每千人口的病床数、 最常见:男女性别比;每千人口的医生数、每千人口的病床数、每 医生的门诊工作量
构成比(%) 构成比 30.24 25.71 16.42 27.63 100.00
1685 1433 915 1540 5573
恶性肿瘤 其他 合 计
• 对分组资料计算合计率时,不能简单地把各组率 取平均数,而应分别将分子和分母合计,再求出 合计率。例如,某医院消化内科上半年收治250例 胃溃疡患者,治愈200例,治愈率为80.0%;下半 年收治280例胃溃疡患者,治愈238例,治愈率为 85.0%。则该消化内科全年对胃溃疡的治愈率应该 是 200 + 238
同年内死亡人数 同年年龄组死亡人数 同年<1周岁死亡人数 同年<28天死亡人数 同年围生期死胎数+死 产数+<7天死亡人数 同年5岁以下儿童死亡 数 同年孕产妇死亡数 同年内某原因死亡人 数 同年某病死亡人数 同年某死因死亡数
年平均人口数×1年 同年年龄组平均人口数×1年 同年活产儿总数 同年活产儿总数 同年围生期死胎数+死产数+活 产数 同年活产儿总数 同年活产儿总数 同年平均人口数×1年 同年患该病总数 同年内死亡总数
时点患病率
频率型来自百度文库
期间患病率
时期现患疾病人数
检查人口数
频率型
治愈率 生存率
治愈人数 活满特定时期的人数
接受治疗人数 期初存活的人 数 检查人数
频率型 频率型
残疾患病率
残疾患者人数
100%
频率型
• 构成比 构成比(proportion)即比例,是指事物内 部某一组成部分观察单位数与同一事物各 组成部分的观察单位总数之比,用以说明 事物内部各组成部分所占的比重,常用百 分数表示。计算公式为:
根据其分子与分母的关系,相对比也可取分为: 关系指标: 根据其分子与分母的关系,相对比也可取分为:① 关系指标:指两个有关的非 同类事物的指标,如医护人员与病床数之比,住院日数与床位数之比等。 同类事物的指标,如医护人员与病床数之比,住院日数与床位数之比等。②对 比指标:指同类事物的两个指标之比,以达到比较的目的。如2000年我国出生 比指标:指同类事物的两个指标之比,以达到比较的目的。 年我国出生 性别比为116.9,说明 年我国男性出生人数比女性高, 性别比为 ,说明2000年我国男性出生人数比女性高,男、女性别比有所失 年我国男性出生人数比女性高 又如同时期不同人群的某病发病率之比, 衡。又如同时期不同人群的某病发病率之比,以说明该时期不同人群的发病情 况。
死亡人数 疾病种类 恶性肿瘤 呼吸系统疾病 消化系统疾病 循环系统疾病 传染病 合计 50 30 20 40 10 150
百分比(%) 33.33 20.00 13.33 26.67 6.67 100.00
常用的相对数指标
相对数指标大致有三种类型: 相对数指标大致有三种类型: 频率( 频率(frequency) ) 构成比(proportion) 构成比 相对比(relative ratio) 相对比
速率 速率指标通常是指一段时间内的平均概率。 速率 强度是单位时段内某现象发生的频率。如 人时发病率的分子是新发生的事件数,分 母是人时数(观察人数乘以时间)的总和, 多用于大人群长时间随访的资料。
某事件发生的个体数 ×K 强度型指标 = ( ∑ 可能发生某事件的个体数 × 时间)
表3-4 人口死亡统计指标
某事件发生的个体数 频率型指标 = ×K 可能发生某事件的个体 数
分子是分母的一部分;无量纲,在0-1范围内 分子是分母的一部分;无量纲, 取值; 是比例基数,通常取为100% 100%, 取值;K是比例基数,通常取为100%,也可取为 1000‰、 /1万和10万/10万等 万和10 万等, 1000 、1万/1万和10万/10万等,根据习惯用法 来决定。如常见的发病率、患病率、病死率、 来决定。如常见的发病率、患病率、病死率、治 愈率等指标, 愈率等指标,都属于频率型指标
• 计算公式 • 平均发展速度= 平均发展速度=
例5.4 为了解新生儿的锌的营养状况,分别测量某 医院足月儿以及早产儿的脐血血清锌含量,结果 显示足月儿及早产儿的脐血血清锌含量的均数分 别为1.85 mg/L和1.41 mg/L,则该医院足月儿与早 产儿的脐血血清锌含量之比为1.85/1.41=1.31,即 该医院足月儿脐血血清锌含量是早产儿的1.31倍 在流行病学研究中,常用的相对危险度(RR)和比值 比(OR)都属于相对比指标。 相对危险度(relative risk, RR) 是指暴露于某种危 险因素的观察对象的发病危险度与低暴露或非暴 露的观察对象的发病危险度之间的比值:
绝对增长量 发展速度与增长速度 平均发展速度与平均增长速度
例5.7 表5.6是某地区1999~2002年住院患者数的统计数据,试 计算动态数列的分析指标。
绝对增长量 绝对增长量是说明事物在一定时期增长的 绝对值。绝对增长量可分为: 绝对值。绝对增长量可分为: 累积增长量(cumulative quantity of 累积增长量 increase) :即报告年的指标与某一固定年(基 即报告年的指标与某一固定年( 期水平)指标之差, 期水平)指标之差, 逐年增长量: 逐年增长量:即报告年的指标与前一年指标 之差, 之差,
例5.1 为研究吸烟与肺癌的关系,某医生收集 了2003~2005年286例住院肺癌患者的吸烟 史,吸烟的肺癌患者有166例,而同时期同 年龄段的1855名非肺癌患者中,吸烟的有 407例。试计算该资料中肺癌患者与非肺癌 患者的吸烟率。 • 由式(5.1),肺癌患者的吸烟率=166/286 × 100%=58.04% , 非肺癌患者吸烟率=407/1855 ×100%=21.94% ,肺癌患者 的吸烟率比非肺癌患者的吸烟率高36.1%。
发展速度与增长速度 发展速度(speed of development) :表示报 发展速度 告期指标的水平相当于基期水平的百分之 多少或若干倍; 增长速度(speed of increase) :表示的是净 增长速度 增加量。可计算定基比发展速度与环比发 展速度, 增长速度 = 发展速度% - 100% =发展速度-1。
某一组成部分的观察单位数 构成比 = × 100% 同一事物各组成部分的观察单位总数
构成比具有以下特点: 分子是分母的一部分, 构成比具有以下特点:① 分子是分母的一部分,各组成部分构成比数 值在0~1之间波动,各组成部分的构成比数值之和等于 或100%。② 之间波动, 值在 之间波动 各组成部分的构成比数值之和等于1或 。 事物内部各组成部分之间呈此消彼长, 事物内部各组成部分之间呈此消彼长,当其中某一组成部分构成比数 值增大, 值增大,其他组成部分构成比数值必然会减少
第三讲 定性资料的统计描述
杨土保 教授 博士 中南大学公共卫生学院 流行病与卫生统计学系 2009-032009-03-06
主要内容
• 常用相对数及其应用 • 应用相对数的注意事项 • 动态数列及其应用 其 • 率的标准化
定性变量的分布特征
定性资料的频数分布
表3-1 某医院2001年住院病人5类疾病的死亡情况
• 计算公式
an • 定基发展速度= a0
• 环比发展速度=
an a n−1
平均发展速度和平均增长速度 平均发展速度(average speed of development) :是各 环比发展速度的几何平均数,说明某事物 在一个较长时期中逐年平均发展变化的程 度。 平均增长速度(average speed of increase ) :是 平均增长速度 各环比增长速度的平均数,说明某事物在 一个较长的时期中逐年平均增长的程度。
• 在医学研究中这种情况也常出现,常见的 错误是采用门诊患者或住院患者的资料来 分析疾病与年龄、性别、职业等的关系, 这种资料所计算的相对数指标通常是构成 比,不能当作率来分析。例如,某医师根 据门诊资料分析慢性支气管炎与年龄的关 系,如表5.3所示:
年龄组(岁) 0~ 20~ 40~ 60~ 合计 患者人数 48 74 87 39 248 患者构成比(%) 19.4 29.8 35.1 15.7 100.0
而不是(80%+85%)/2=82.5%。
动态数列及其应用
动态数列(dynamic series)是一系列按照时间顺序排列 动态数列 是一系列按照时间顺序排列 的统计指标(包括绝对数 相对数或平均数), 包括绝对数、 的统计指标 包括绝对数、相对数或平均数 ,用以反 映事物或现象在时间上的变化和发展趋势。 映事物或现象在时间上的变化和发展趋势。常用的动 态数列分析指标有: 态数列分析指标有:
1、率 率是指某现象实际发生数与某时间点或某时间段可能 发生该现象的观察单位总数之比,用以说明该现象发生的 频率或强度。根据计算公式中分母的观察单位总数是否引 入时间因素,率包括频率和速率两类指标
频率 频率型指标是最常见的, 通常近似地反映某 频率型指标是最常见的, 一事件出现的机会大小,如发病概率、死亡概率等 一事件出现的机会大小,如发病概率、
1000‰ 1000‰ 1000‰ 1000‰ 1000‰ 1000‰ 10万/10 万 10万/10 万 100% 100%
疾病统计常用指标
指标 某病发病率 分子 时期内新发生的某病病 例数 时点现患疾病人数 分母 年平均人口数 ×1年 年 检查人口数 基数 10万/10 万 万 10万/10 万 万 10万/10 万 万 100% 100% 类型 强度型(近似 强度型 近似) 近似
暴露组发病率( p1 ) 相对危险度(RR) = 低暴露(或非暴露)组发病率( p2 )
比值比(OR) = 病例组暴露的比值 a / c ad = = 对照组暴露的比值 b / d bc
应用相对数应注意的事项 防止概念混淆, →防止概念混淆,分析时不能以构成比代替率 →计算相对数时分母应有足够数量 正确地合并估计频率(或强度) →正确地合并估计频率(或强度)型指标 相对数间的比较要具备可比性: →相对数间的比较要具备可比性:观察的对象是否同 研究的方法(如检测手段、抽样方法) 质,研究的方法(如检测手段、抽样方法)是 否相同,观察的时间是否一致等; 否相同,观察的时间是否一致等;被比较的总 体是否具有可比性: 体是否具有可比性:标准化 对相对数的统计推断:参数估计、 →对相对数的统计推断:参数估计、假设检验
• 在构成比指标中,某一组成部分构成比的 增减会影响到其他组成部分构成比的变化。 某地2000年和2005年慢性疾病的发病情况 如表5.4所示:
2000年 年 疾 病 病例数
呼吸系统疾病 循环系统疾病
2005年 年 病例数 2577 2671 1711 1964 8923 构成比(%) 构成比 28.88 29.93 19.18 22.01 100.00
指标 分子 分母 基数 类 型 强度型(近似) 强度型(近似 ) 频率型(近似) 频率型(近似 ) 频率型(近似) 相对比 相对比 强度型(近似 ) 频率型(近似 ) 频率型(近似 )
粗死亡率 某年龄组死亡率 婴儿死亡率 新生儿死亡率 围生儿死亡率 5岁以下儿童死亡 率 孕产妇死亡率 某死因死亡率 某病病死率 比例死亡比
• 例5.3 某医院2003年各科室收治住院患者的 构成情况如表5.1所示。
科 别 内 科 外 科 妇 科 儿 科 合 计 850 1133 425 418 2826 病例数 30.08 40.09 15.04 14.79 100.00 构成比(%) 构成比
相对比
之比。 相对比型指标是指任何两个相关联的变量A与B之比。它表示相对 的一个(或十个、百个、千个等)单位, 有多少个单位。 于B的一个(或十个、百个、千个等)单位,A有多少个单位。A和B可 以是绝对数、相对数和平均数, 的量纲可以不同,也可相同, 以是绝对数、相对数和平均数,A和B的量纲可以不同,也可相同,但 A和B互不包含 相对比=A/B 相对比=A/B 最常见:男女性别比;每千人口的医生数、每千人口的病床数、 最常见:男女性别比;每千人口的医生数、每千人口的病床数、每 医生的门诊工作量
构成比(%) 构成比 30.24 25.71 16.42 27.63 100.00
1685 1433 915 1540 5573
恶性肿瘤 其他 合 计
• 对分组资料计算合计率时,不能简单地把各组率 取平均数,而应分别将分子和分母合计,再求出 合计率。例如,某医院消化内科上半年收治250例 胃溃疡患者,治愈200例,治愈率为80.0%;下半 年收治280例胃溃疡患者,治愈238例,治愈率为 85.0%。则该消化内科全年对胃溃疡的治愈率应该 是 200 + 238
同年内死亡人数 同年年龄组死亡人数 同年<1周岁死亡人数 同年<28天死亡人数 同年围生期死胎数+死 产数+<7天死亡人数 同年5岁以下儿童死亡 数 同年孕产妇死亡数 同年内某原因死亡人 数 同年某病死亡人数 同年某死因死亡数
年平均人口数×1年 同年年龄组平均人口数×1年 同年活产儿总数 同年活产儿总数 同年围生期死胎数+死产数+活 产数 同年活产儿总数 同年活产儿总数 同年平均人口数×1年 同年患该病总数 同年内死亡总数
时点患病率
频率型来自百度文库
期间患病率
时期现患疾病人数
检查人口数
频率型
治愈率 生存率
治愈人数 活满特定时期的人数
接受治疗人数 期初存活的人 数 检查人数
频率型 频率型
残疾患病率
残疾患者人数
100%
频率型
• 构成比 构成比(proportion)即比例,是指事物内 部某一组成部分观察单位数与同一事物各 组成部分的观察单位总数之比,用以说明 事物内部各组成部分所占的比重,常用百 分数表示。计算公式为:
根据其分子与分母的关系,相对比也可取分为: 关系指标: 根据其分子与分母的关系,相对比也可取分为:① 关系指标:指两个有关的非 同类事物的指标,如医护人员与病床数之比,住院日数与床位数之比等。 同类事物的指标,如医护人员与病床数之比,住院日数与床位数之比等。②对 比指标:指同类事物的两个指标之比,以达到比较的目的。如2000年我国出生 比指标:指同类事物的两个指标之比,以达到比较的目的。 年我国出生 性别比为116.9,说明 年我国男性出生人数比女性高, 性别比为 ,说明2000年我国男性出生人数比女性高,男、女性别比有所失 年我国男性出生人数比女性高 又如同时期不同人群的某病发病率之比, 衡。又如同时期不同人群的某病发病率之比,以说明该时期不同人群的发病情 况。
死亡人数 疾病种类 恶性肿瘤 呼吸系统疾病 消化系统疾病 循环系统疾病 传染病 合计 50 30 20 40 10 150
百分比(%) 33.33 20.00 13.33 26.67 6.67 100.00
常用的相对数指标
相对数指标大致有三种类型: 相对数指标大致有三种类型: 频率( 频率(frequency) ) 构成比(proportion) 构成比 相对比(relative ratio) 相对比
速率 速率指标通常是指一段时间内的平均概率。 速率 强度是单位时段内某现象发生的频率。如 人时发病率的分子是新发生的事件数,分 母是人时数(观察人数乘以时间)的总和, 多用于大人群长时间随访的资料。
某事件发生的个体数 ×K 强度型指标 = ( ∑ 可能发生某事件的个体数 × 时间)
表3-4 人口死亡统计指标
某事件发生的个体数 频率型指标 = ×K 可能发生某事件的个体 数
分子是分母的一部分;无量纲,在0-1范围内 分子是分母的一部分;无量纲, 取值; 是比例基数,通常取为100% 100%, 取值;K是比例基数,通常取为100%,也可取为 1000‰、 /1万和10万/10万等 万和10 万等, 1000 、1万/1万和10万/10万等,根据习惯用法 来决定。如常见的发病率、患病率、病死率、 来决定。如常见的发病率、患病率、病死率、治 愈率等指标, 愈率等指标,都属于频率型指标
• 计算公式 • 平均发展速度= 平均发展速度=
例5.4 为了解新生儿的锌的营养状况,分别测量某 医院足月儿以及早产儿的脐血血清锌含量,结果 显示足月儿及早产儿的脐血血清锌含量的均数分 别为1.85 mg/L和1.41 mg/L,则该医院足月儿与早 产儿的脐血血清锌含量之比为1.85/1.41=1.31,即 该医院足月儿脐血血清锌含量是早产儿的1.31倍 在流行病学研究中,常用的相对危险度(RR)和比值 比(OR)都属于相对比指标。 相对危险度(relative risk, RR) 是指暴露于某种危 险因素的观察对象的发病危险度与低暴露或非暴 露的观察对象的发病危险度之间的比值:
绝对增长量 发展速度与增长速度 平均发展速度与平均增长速度
例5.7 表5.6是某地区1999~2002年住院患者数的统计数据,试 计算动态数列的分析指标。
绝对增长量 绝对增长量是说明事物在一定时期增长的 绝对值。绝对增长量可分为: 绝对值。绝对增长量可分为: 累积增长量(cumulative quantity of 累积增长量 increase) :即报告年的指标与某一固定年(基 即报告年的指标与某一固定年( 期水平)指标之差, 期水平)指标之差, 逐年增长量: 逐年增长量:即报告年的指标与前一年指标 之差, 之差,
例5.1 为研究吸烟与肺癌的关系,某医生收集 了2003~2005年286例住院肺癌患者的吸烟 史,吸烟的肺癌患者有166例,而同时期同 年龄段的1855名非肺癌患者中,吸烟的有 407例。试计算该资料中肺癌患者与非肺癌 患者的吸烟率。 • 由式(5.1),肺癌患者的吸烟率=166/286 × 100%=58.04% , 非肺癌患者吸烟率=407/1855 ×100%=21.94% ,肺癌患者 的吸烟率比非肺癌患者的吸烟率高36.1%。
发展速度与增长速度 发展速度(speed of development) :表示报 发展速度 告期指标的水平相当于基期水平的百分之 多少或若干倍; 增长速度(speed of increase) :表示的是净 增长速度 增加量。可计算定基比发展速度与环比发 展速度, 增长速度 = 发展速度% - 100% =发展速度-1。
某一组成部分的观察单位数 构成比 = × 100% 同一事物各组成部分的观察单位总数
构成比具有以下特点: 分子是分母的一部分, 构成比具有以下特点:① 分子是分母的一部分,各组成部分构成比数 值在0~1之间波动,各组成部分的构成比数值之和等于 或100%。② 之间波动, 值在 之间波动 各组成部分的构成比数值之和等于1或 。 事物内部各组成部分之间呈此消彼长, 事物内部各组成部分之间呈此消彼长,当其中某一组成部分构成比数 值增大, 值增大,其他组成部分构成比数值必然会减少
第三讲 定性资料的统计描述
杨土保 教授 博士 中南大学公共卫生学院 流行病与卫生统计学系 2009-032009-03-06
主要内容
• 常用相对数及其应用 • 应用相对数的注意事项 • 动态数列及其应用 其 • 率的标准化
定性变量的分布特征
定性资料的频数分布
表3-1 某医院2001年住院病人5类疾病的死亡情况
• 计算公式
an • 定基发展速度= a0
• 环比发展速度=
an a n−1
平均发展速度和平均增长速度 平均发展速度(average speed of development) :是各 环比发展速度的几何平均数,说明某事物 在一个较长时期中逐年平均发展变化的程 度。 平均增长速度(average speed of increase ) :是 平均增长速度 各环比增长速度的平均数,说明某事物在 一个较长的时期中逐年平均增长的程度。
• 在医学研究中这种情况也常出现,常见的 错误是采用门诊患者或住院患者的资料来 分析疾病与年龄、性别、职业等的关系, 这种资料所计算的相对数指标通常是构成 比,不能当作率来分析。例如,某医师根 据门诊资料分析慢性支气管炎与年龄的关 系,如表5.3所示:
年龄组(岁) 0~ 20~ 40~ 60~ 合计 患者人数 48 74 87 39 248 患者构成比(%) 19.4 29.8 35.1 15.7 100.0