循证医学中常用可信区间的研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

循证医学中常用可信区间的研究

在循证医学的研究或应用中,经常使用可信区间(confidence interval,CI)对某事件的总体进行推断。可信区间是按一定的概率去估计总体参数(均数或率)所在的范围,它是按预先给定的概率(1-a,常取 95%或99%)确定未知参数值的可能范围,这个范围被称为所估计参数值的可信区间或置信区间。如95%可信区间,就是从被估计的总体中随机抽取含量为n 的样本,由每一个样本计算一个可信区间,理论上其中有95%的可能性(概率)将包含被估计的参数。故任何一个样本所得95%可信区间用于估计总体参数时,被估计的参数不在该区间内的可能性(概率)仅有5%。可信区间是以上、下可信限为界的一个开区间(不包含界值在内)。可信限(confidence limit,CL)或置信限只是可信区间的上、下界值。可信区间的用途主要有两

个:

(1)估计总体参数,在临床科研工作,许多指标都是从样本资料获取,若要得到某个指标的总体值(参数)时,常用可信区间来估计。如率的可信区间是用于估计总体率、均数的可信区间用于估计总体均数。

(2)假设检验,可信区间也可用于假设检验,95%的可信区间与a为0.05的假设检验等价。若某研究的样本RR或OR的95%可信区间不包含1,即上下限均大于1或上下限均小于1时,有统计学意义(P<0.05);若它的RR或OR值95%可信区间包含1时,没有统计学意义(P> 0.05)。再如某研究两疗效差值的95%可信区间不包含0,即上下限均大于0或上下限均小于0时,有统计学意义(P<0.05);两疗效差值的 95%可信区间包含0时,两疗效无差别(P>0.05)。

各种指标的可信区间计算,最常采用正态近似法,其中标准误的计算是其关键。标准误是由于抽样所致的样本与总体间的误差,用以衡量样本指标估计总体参数的可靠性,标准误越大,用样本估计总体的误差也就越大,反之就越小。在数值资料(计量资料)中,标准误的大小与个体变异(s)成正比,与样本含量(n)的平方根成反比。在分类资料(计数资料)中,标准误主要受样本含量(n)和某事件发生率(p)大小的影响,样本含量愈大,抽样误差愈小;某事件发生率愈接近于 0.5,其抽样误差愈小,某事件发生率离0.5愈远(即发生率愈接近于0或1),抽样误差愈大。可信区间的范围愈窄,样本估计总体的可靠性愈好;可信区间的范围愈宽,样本估计总体的可靠性愈差。

1. 率的可信区间

总体率的可信区间可用于估计总体率、样本率与总体率比较,两样本率比较。计算总体率的可信区间时要考虑样本率(p)的大小。

正态近似法当n足够大,如n>100,且样本率p与1- p均不太小,且np与n(1-p)均大于5时,可用下式求总体率的1-a 可信区间率的标准误:SE=p(1-p)/n率的可信区间:p±uaSE = (p-uaSE ,p+uaSE)式中ua以a查u值表,若计算95%的可信区间,这时u0.05=1.96,a=0.05。

例如:采用某治疗措施治疗60例某病患者,治愈24例,其治愈率为24/60=40%,该治愈率的95%的可信区间为:

SE = p(1-p)/n = 0.4(1-0.4)/60 =0.063

p±uaSE = (p-uaSE ,p+uaSE)

= (0.4-1.96×0.063,0.4+1.96×0.063)

= (27.6%,52.4%)

该治愈率的95%的可信区间是27.6%~52.4%。

(2)当样本率p<0.30或p>0.70时,对百分数采用平方根反正弦变换,即y= sin-1p 或 sin y=p,当P从0~100%时,y从

0~90(角度,以下略去),若以弧度表示则y从0~1.57(π/2)。(Bartlett. MS建议当p=100%时,p=1-1/4n,当p=0时,

p=1/4n)。y的标准误,按角度计算sy=820.7/n ;若按弧度计算 sy=1/(4n) ,总体率的1-a的可信区间按下式计算:(y-uasy ,y+uasy ),然后再按下式变换求出百分数表示的可信区间:PL=sin2(y-uasy ); PU=sin2(y+uasy )

例如:某医师调查某厂工人高血压病的患病情况,检查4553人,257人有高血压患病率为5.6446%,求该厂高血压患病率的95%可信区间?

本例u0.05=1.96,按上式计算:

y=sin-10.056446 =0.239878,sy =1/(4×4553) =0.00741(以弧度计),则y的95%可信区间为:

(0.239878-1.96×0.007410,0.239878+1.96×0.007410)=(0.2254, 0.2544),而率的95%可信区间为:

PL=sin2(0.2254)=0.0499;

PU=sin2(0.2544)=0.0633

故该厂高血压患病率的95%可信区间为(4.99%,6.33%)。

2. RR的可信区间

相对危险度的RR(relative risk),应先计算RR,再求RR的自然对数值ln(RR),其ln(RR)的标准误SE (lnRR)按下式计算:

SE(lnRR)= 1 a + 1 c - 1a+b - 1c+d = 1 r1 + 1 r2 - 1n1 - 1n2

ln(RR)的可信区间为: ln(RR) ± ua SE(lnRR)

RR的可信区间为: exp[ ln(RR) ±ua SE(lnRR) ]

例如:某医师研究了阿斯匹林治疗心肌梗塞的效果,其资料见表1,试估计其RR的95%可信区间。

3. OR的可信区间

由于队列资料的RR的1-a可信区间与OR的1-a可信区间很相近,且后者计算简便,因而临床医学可用OR的可信区间计算法来代替RR的可信区间的计算。

OR的可信区间的计算,应先计算OR,再求OR的自然对数值ln(OR),其ln(OR)的标准误SE (lnOR)按下式计算:

SE(lnOR)= 1/a+1/b +1/c +1/d

ln(OR)的可信区间为: ln(OR) ± ua SE(lnOR)

OR的可信区间为: exp[ ln(OR) ±ua SE(lnOR) ]

例如:前述阿斯匹林治疗心肌梗塞的效果,试估计其OR的95%可信区间。

OR= 15×90 30×110 = 0.409

ln(OR)=ln(2.44)= -0.894

SE(lnOR)= 1/a+1/b +1/c +1/d = 1/30+1/90+1/15+1/110 =0.347

ln(OR)的95%可信区间为:

ln(OR)±1.96 SE(lnOR)= -0.892±1.96×0.347= ( -1.573,-0.214)

OR的95%可信区间为:

exp[ ln(OR) ±1.96SE(lnOR) ]= exp(-1.573,-0.214) = (0.207,0.807)

该例OR的95%可信区间为0.207~0.807,而该例的RR的95%可信区间为0.272~0.846,可见OR是RR的估计值。

4. RRR的可信区间

RRR可信区间的计算,由于RRR=1-RR,故RRR的可信区间可由1-RR的可信区间得到,如上例RR=0.48,其95%的可信区间为 0.272~0.846,故RRR=1-0.48=0.52,其95%的可信区间为0.154~0.728。

5. ARR的可信区间

ARR的标准误为: SE= p1 (1-p1)n1 + p2 (1-p2)n2

相关文档
最新文档