8 第十一章 无序分类变量描述与推断
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
p(1 n
p)
作为σp 的估计值。
率标准误的应用
(一)说明率的抽样误差大小及样本率的可靠性,表示为p±Sp。 (二)率的标准误结合样本率p推断总体率π的可信区间
1、大样本——正态近似法
适用条件:n足够大,且p和(1-p)均不太小,如np或
n(1-p)均≥5,样本率p的抽样分布近似服从正态分布。 方法:
(2) 关系指标:指两个有关的、但非同类事物 的数量的比,如医护人员数与医院年平均病 床开出数之比。
(3) 计划完成指标:说明计划完成的程度,常 用实际数达到计划数的百分之几或几倍表示, 如某社区居民健康档案建档完成情况。
动态数列
(dynamic series)
动态数列是指一系列按时间顺 序排列起来的统计指标(包括绝对 数、相对数及平均数等)。它说明 事物在时间上的变化或发展趋势。 按时间特点可以分为时点动态数列 和时期动态数列;按基数特点可以 分为定基比和环比。
强度
比重
强调点 随机发生事件
资料获得 特点
较难 不一定
各部分的构成 容易
合计为100%
相对比
(relative ratio)
相对比是两个有关的数据 或指标之比,表示两者的相对 水平。样本相对比表示为R= 甲/乙。习惯上当甲>乙时用 倍数表示,当甲<乙时用百分 数表示。
常用的相对比指标
(1) 对比指标:指两个同类事物某种指标(绝对 数、两个率或其他同类指标)的比,如人口 普查的男女性别比。
动态数列的分析指标
一、绝对增长量 1、累计增长量:固定某年为基数,各年与之相减; 2、逐年增长量:以前一年为基数,相邻的后一年与 之相减。
二、发展速度和增长速度 1、定基比:固定某年为基数,各年与之相比; 2、环比:以前一年为基数,相邻的后一年与之相比。 增长速度=发展速度-1(或100%)。
三、平均发展速度和平均增长速度 1、平均发展速度(环比发展速度的几何均数)= n√an / a0 。 2、平均增长速度=平均发展速度-1(或100%)。
3、分子可以重复计算的率:计算发病率,若以开始时的 暴露人数为分母,每个人在这一段时间内只能是一个 新病例,其为真正的率。如若每个人在一段时间内可 以是多个新病例,虽然分子是分母的一部分,但进行 了重复计算,不服从二项分布,亦不能计算可信区间 和进行差别的假设检验。
率与构成比的比较
率
构成比
概念 发生的频率或 各组成部分所占的
计算标准化率的步骤
1、根据现有数据的条件选用直接 法或间接法
2、选定标准:标准组应有代表 性、稳定、数据量较大的人群
3、应用公式计算 4、必要时,做标准化率假设检验
计算标准化率的标准选择
1、选用较稳定的、有代表性的、来自较大 人群的、最好是全国标准年龄组别人口 数(或年龄构成)或年龄组别死亡率作 为需要比较的各组资料的共同标准;
2、比较两个(或多个)标准化率,应选用同一个 标准,选用的标准不同,算得的标准化率也不 同,因此,标准化率只反映对比资料间的相对 水平,不能反映某现象发生的实际水平;
3、资料分析中,各组分率大小交叉出现,则不 宜采用标准化法处理,可采用分层分析等平衡 混杂因素的影响;
4、样本标准化率的比较同样存在抽样误差,需 进行标准化率的假设检验(本教材略)。
的指标,指在一年内平均每千人口中的
死亡人数。总死亡率又称粗死亡率 (crude death rate),其大小受当地 人口、年龄、性别等因素的影响,故需 标化后才能进行比较。
某年死亡人数
死亡率=
×1000‰
同期平均人口数
病死率
(fatality rate)
病死率是衡量疾病预后的指标,
指平均每百(或千、万等)名病人中死 亡人数,即指某病患者中因该病死
无序分类变量资料的 统计推断
统计推断包括两个方面:
1、参数估计(总体率的可信区间 估计)
2、假设检验(计数资料的假设检
验:u 检验、 χ2检验)
第三节 率的抽样误差和 总体率的估计
率的抽样误差
(sampling error of rate)
从某类总体率为π的两类构 成总体中,随机抽取 n相等的若 干样本,由于组成总体的个体存 在变异(质的变异),致使样本率p 与总体率π之间或样本率与样本 率之间出现差异,这种差异称为 率的抽样误差。率的抽样误差大 小以率的标准误表示。
2、把被比较的两组(或几组)资料中,各 年龄组人口数加在一起组成一个新的人 口构成作为共同标准;
3、在相互比较的两组(或几组)资料中, 任选其中一组的年龄组别人口数或年龄 组别死亡率作为共同标准。
直接标化法
适用条件和计算公式:
已知被标化组各小组的死亡率,
已知标准组年龄别人口数时:
p N i pi
实际发生的例数与可能发生该现象的 总数之比,用以说明某现象发生的强 度或频率,故又称频率指标。根据不 同需要选用适当的比例基数。
某现象实际发生的例数
率=
× 比例基数
可能发生某现象的总数
率的特点
1、真正的率:分子是分母的一部分,其数值在0到1之间 变动,它们是概率的估计值,符合二项分布,可以计 算可信区间和进行差别的假设检验;
N
已知标准组年龄别人口构成比时:
p
(
Ni N
) pi
间接标化法
适用条件:已知被标化组人群 年龄别人口数、总死亡数,以及标 准组的年龄别死亡率。
计算公式:
p P • r P • SMR
ni Pi
标准化时应注意的问题
1、比较两个(或多个)总率或总均数时,要求内 部构成相同,若内部构成明显不同,需作标准 化处理,以使对比组之间具有可比性;
总体率的区间估计
1、查表法:百分率的可信区间
n≤50,p很小或很大,按二项分布原理,表中 x值只列出x≤n/2部分,当x>n/2时,以n-x查表,
然后100减去查表得数值即为所求可信区间。
2、正态近似法: p u S p
np和n(1-p)ቤተ መጻሕፍቲ ባይዱ5,p的抽样分布逼近正态分布。
3、注意:如果计算获得的可信区间下限小于0%, 上限大于100%,则将下限直接定为0%,上限直接 定为100%。
pc
S p1 p2
X1 X2 n1 n2
n1
pc (1 pc
p1 n2 p2
)(
1 n1
n1 n2
1 n2
)
相对数:是两个有关联的数值或指 标之比。常用的相对数有率、构 成比和相对比。
构成比
(percentage)
构成比是表示事物内部各构成部
分分别占总体的比重或分布,通常以
100为比例基数,故又称百分比,用 以说明事物内部的构成。
事物内部某构成部分个体数
构成比=
×100%
事物内部各构成部分个体数总和
构成比的特点
1、分子是分母的一部分,其数值在0到 1之间变动,它们是概率的估计值, 符合二项分布,可以计算可信区间和 进行差别的假设检验;
2、事物内部各组成部分的构成比之和 为100%或1;
3、事物内部某一组成部分的构成比发 生了变动,其它组成部分的构成比也 必然发生相应的变动。
率(rate)
率是表示某现象在一定条件下,
率的标准误
(standard error of rate)
样本率的标准差叫做率的标准误,以
p
(1 )
n
表示。它是描述率的抽样误差
大小的指标,反映含量相同的样本率的离散
趋势或变异程度。σp越大,说明样本率p的 波动范围越大或率的抽样误差越大。实际应
用中, π常属未知,无法计算σp,故常以
sp
亡所占比例,通常用于急性传染病, 较少用于慢性病。
观察期间某病死亡数
病死率=
×比例基数
同期某病患者数
应用相对数时的注意事项
1、计算相对数,应有足够的例数。例数较少时,以绝 对数表示为宜。
2、构成比是表示事物内部的构成或分布,率是表示现 象发生的频率或强度,二者不能混淆使用。
3、当各组例数不相等时,平均率(总率)不等于各组 率的算术平均数。
2、分子与分母不是同一范畴的率:例如计算婴儿死亡率, 是用当年死亡婴儿数与当年活产婴儿数之比,当年死 亡婴儿不一定是当年所生,当年活产婴儿如果在一年 中死亡也不一定死在当年。再如发病率、死亡率等指 标,一般都用年中人口数或平均人口数作为分母来代 替开始时的暴露人数进行计算。此时不服从二项分布, 不能计算可信区间和进行差别的假设检验;
总体率π的95%可信区间:p±1.96Sp 总体率π的99%可信区间:p±2.58Sp
2、小样本——查表法(参照有关书籍) 适用条件: n较小,如n≤50,特别是p接近0或1 方法:根据样本阳性数x及样本例数n,直接查二项分布参数 π的 可信区间表
(三)用率的标准误进行两个率差别的假设检验——u检验
第二节 率的标准化法
标准化率
(standardized rate)
标准化率简称标化率,又称调整率 (adjusted rate)是由于客观的和已知 的影响因素,如年龄、性别、工龄等, 可以影响率的大小。若比较两个或多个 总率时,这些因素应齐同一致。如果这 些因素不一致,应对率进行标准化,即 选取某个标准组,作为影响因素的标准 人口或标准人口构成,把被比较的率按 标准组的人口数或人口构成进行调整, 算得的率称为标准化率。
第四节 两个率差别的统计意义
(u检验)
率的假设检验
(hypothesis test of rate)
判断样本率p与总体率π之 间或样本率与样本率之间的差别 在统计上有无显著性意义,即判 断这种差别是来自于抽样误差还 是本质上存在的方法称为率的假 设检验。常用率的假设检验方法 有:u检验、 χ2检验等。
无序分类变量资料的描述方法:
1、统计指标(相对数指标) ⑴、构成比 ⑵、率 ⑶、相对比 ⑷、动态数列
2、统计表、统计图
第一节 常用相对指标的 种类及其定义
绝对数和相对数
绝对数:调查或实验研究中清点分 类变量资料得到的数据。它是研 究客观事物或现象本质的基本信 息,但不便于相互比较和寻找事 物间的联系。
发病率
(incidence rate)
发病率是衡量疾病发生的频率指标,
指在一定时期(年度、季度、月份等)内 平均每百(或千、万等)人口中,某病发 生的新病例数,常用于研究疾病发生的因 果和评价预防措施的效果。
某期新发病例数
发病率=
×比例基数
同期平均人口数
患病率
(prevalence rate)
患病率又称现患率或流行率,是指
样本率与总体率比较的计算公式
《正态近似法》使用条件:
np 和n(1- p)均大于5时
计算公式:
p
u
0
p
p 0
(1 )
0
0
n
两个样本率的比较计算公式
《正态近似法》使用条件:
n1p1 和n1(1- p1)与 n2p2 和n2(1- p2)均 >5
计算公式:
u p1 p2
p1 p2
在某一时点(或某短时期内),平均每 百(或千、万、十万等)受检查人数中 发现正患病的人数,常用于估计某病对 居民危害的严重程度。其与发病率的主 要区别在于它是从时点断面来观察疾病 的频率。
正患疾病的病例数
患病率=
× 比例基数
受检查人数
死亡率
(death rate,mortality rate)
死亡率是反映一个地区居民死亡水平
4、相对数的比较要有可比性。研究对象是否同质?对 比资料是否同期?研究方法、时间、条件等是否一致?
5、样本计算的相对数存在抽样误差,不能凭表面数据 下结论,应进行假设检验后作出判断。
6、进行总率(平均率)比较时,应注意内部构成(影 响总率大小的因素)是否相同。若内部构成不同,应 进行率的标准化,然后进行标准化率的假设检验。