第04章可信区间

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第4章可信区间

在第3章讨论的抽样误差,主要研究从已知的总体中随机抽样,所得样本具有哪些统计性质。而实际工作中的思路恰好与之相反:即我们得到一个样本,要根据样本所提供的信息推断总体的性质。例如,想了解某降压药的疗效,随机抽取一部分高血压患者进行临床试验,对药物的疗效进行观察,这一部分参加试验的患者即为样本,样本中的每一个个体所研究指标的情况在试验中均了如指掌,但研究的目的并不限于此样本,而是通过这一样本所提供的信息进一步推断该药物是否有效,是否可以应用于临床,这个结论是针对总体的。

统计推断(statistical inference)就是根据样本所提供的信息,以一定的概率推断总体的性质。统计推断包括两方面的内容:参数估计和假设检验。本章主要阐述如何根据统计量的抽样分布性质,用样本统计量估计总体参数。

§4.1 可信区间的概念

医学研究的目的之一是希望了解有关的总体参数,即对未知的总体参数进行估计。由样本信息估计总体参数称为参数估计(parameter estimation)。参数估计的概念是Neyman在1937年提出的。参数估计包括点估计(point estimation)和区间估计(interval estimation)。

4.1.1 点估计

点估计一般是直接用样本统计量作为总体参数的估计值。这种估计方法简单方便,但未考虑抽样误差。

例如,某地区所有12岁正常男孩的身高是一个总体,但该总体的参数μ——平均身高未知。为此,随机抽取该地区120名12岁正常男孩,测得其平均身高为X=142.67cm,标准差为s=6.00cm,这是样本统计量。用样本均数X作为总体均数μ的一个估计,用样

本的标准差s作为总体标准差σ的一个估计,即认为该地区所有12岁正常男孩的平均身高为142.67cm,标准差为6.00cm。这就是点估计。思维朴素,也很直观。

在这个问题中,总体参数μ和σ是未知的,但它们是固定的值,并不是随机的。而样本统计量随样本的不同而异,是随机的。如果有另一个研究者作同样的研究,测得当地另外120名12岁男孩的平均身高为X=141.95cm,当然也可以此作为总体平均身高的另一个点估计。那么,谁的结论更可信?点估计是无法回答的,这就需要用到区间估计了。

4.1.2 区间估计

区间估计是按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度为1-α 的可信区间(confidence interval, CI ),又称置信区间。这种估计方法称为区间估计。可信区间估计的理论基础是统计量的抽样分布规律。

可信度为1-α 的可信区间的确切涵义是:每100个样本所算得的100(1-α)%可信区间,平均有100(1-α)个包含了总体参数。如取α=0.05,则在每100个样本所算得的100个95%可信区间中,平均有95个包含总体参数,有5个不包含总体参数。

可信区间通常由两个可信限(confidence limit)界定,其中较小者称为下限或下可信限,记为C L ,较大者称为上限或上可信限,记为C U 。严格地讲,可信区间并不包括上可信限和下可信限两个值,是一开区间,可表示为(C L , C U )。

4.1.3 可信区间的两个要素

可信区间的第一个要素是可靠性,常用可信度1-α 的大小表示。可靠性常根据研究目的和实际问题的背景由研究者自行决定,常用的可信度为90%、95%和99%,但并不以此为限。

可信区间的第二个要素是精确性,常用可信区间的长度C U -C L 衡量。若区间太长,虽其可靠性甚高,但可能无济于事,尤如估计一个年级大学生的平均年龄在10~60岁之间,估计某地区某病患病率在1%到99%之间,固然可信,但疏略亦甚明显。精确性与变量的变异度大小、样本含量和1-α 取值有关。当1-α 确定后,可信区间的长度受制于个体变异和样本含量:个体变异越大,区间越宽;样本含量越小,区间越宽。当抽样误差确定后,可靠性和精确性是相互牵制的:若要提高可信度,可取较小的α 值,此时势必使区间变长,致精密度下降。故不能笼统地认为99%可信区间比95%可信区间好。一般常用95%可信区间,认为它能较好地兼顾可靠性和精确性。

可靠性和精确性是相互矛盾的两个方面,估计参数的可信区间的要旨,是充分利用样本所提供的信息,作出尽可能可靠而精确的估计。

§ 4.2 均数的可信区间

4.2.1 总体均数的可信区间

根据第3章的结果,从正态分布总体N (μ,σ2)中随机抽取一个样本,则X

s X t μ-=服从自

由度为ν=n -1的t 分布,即t 值接近于0的可能性较大,远离0的可能性较小,出现太大的t 值和太小的t 值的可能性更小,根据t 分布的性质,大于t 0.05,ν者只有2.5%,小于-t 0.05,ν者亦只有2.5%。则t 有95%的可能在-t 0.05,ν 到t 0.05,ν 之间。更一般地有:

ανανα-=<<-1)(,,t t t P (4.1)

或: αμνανα-=+<<-1)(,,X X s t X s t X P (4.2)

从而总体均数的(1-α )可信区间定义为: (X s t X ⨯-να,,X s t X ⨯+να,) (4.3)

其中ν=n -1为自由度,t α,ν为自由度是ν的、两侧尾部面积各为α/2的t 界值,可查t 界值表获得。在该区间中,X s t X ⨯-να,为可信区间的下限,X s t X ⨯+να,为可信区间的上限,可信度为1-α。当α =0.05时,该可信区间的可信度为95%;当α =0.01时,该可信区间的可信度为99%。 有时将两个可信限简记为:X s t X ⨯±να,。

当样本含量较大时,例如n >100,t 分布逼近标准正态分布,此时可用标准正态分布代替t 分布,作为可信区间的近似计算。相应的100(1-α)%可信区间为: (X s u X ⨯-α,X s u X ⨯+α) (4.4)

其中,u α为标准正态离差,即两侧概率均为α/2的标准正态分布的分位数,如u 0.05=1.96,u 0.01=2.58。

例 4.1 随机抽取12名口腔癌患者,检测其发锌含量,得X =253.05μg/g ,X s =27.18μg/g ,求口腔癌患者发锌含量总体均数95%的可信区间。

本例自由度ν=12-1=11,经查表得t 0.05,11=2.201,则

μL =)/(23.19318.27201.205.25311,05.0g g s t X X μ=⨯-=⨯-

μU =)/(87.31218.27201.205.25311,05.0g g s t X X μ=⨯+=⨯+

即口腔癌患者发锌含量总体均数的95%可信区间为:193.23~321.87(μg/g)。本例193.23~312.87为可信区间,而193.23和321.87分别为其下可信限和上可信限。

例4.2 某地120名12岁正常男孩身高X =142.67cm ,X s =0.5477cm ,计算该地12岁正常男孩身高总体均数90%的可信区间。

因n =120>100,故可以用标准正态分布代替t 分布,u 0.10=1.64,

)(77.1415477.064.167.14210.0cm s u X X =⨯-=⨯-

)(57.1435477.064.167.14210.0cm s u X X =⨯+=⨯+

即该地12岁正常男孩平均身高的90%可信区间为:141.77~143.57(cm),可认为该地12岁正常男孩平均身高在141.77~143.57(cm)之间。

若按t 分布计算,结果为:141.76~143.58(cm),两结果很接近。

由上可见,均数的可信区间长度与标准差成正比,与样本含量之平方根成反比,且可信度1-α 越大,t α,v 越大,则区间越宽。

4.2.2 两均数之差的区间估计

实际工作中,我们常常需要估计两总体均数之差21μμ-。例如:冠心病患者与正常人的血清胆固醇平均相差多少?长跑运动员与一般人群的脉率之差为多少?周围神经炎

相关文档
最新文档