样本容量确定
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
第三节 样本容量的确定
在区间估计中我们发现,对于某一个总体的参数进行估计时,在样本数目一定的条件下,要提高估计结果的可靠性,就需要扩大置信区间,这就要增加估计中的误差,减少了估计的实际意义。如果要减少估计的误差,就要缩短置信区间,但这样就必须要降低估计的可靠性。可见在样本数目一定的条件下,估计的精确性和估计的可靠性不能两全其美。既要提高估计的精确性,减少误差,又要提高估计可靠性的办法就是增加样本容量。但是增加样本就要同时增加抽样调查的成本,同时又可能延误时间。因此就需要研究能够满足对估计的可靠性和精确性要求的最小样本数问题。
一、均值估计问题中,样本大小的决定
在总体均值的估计问题中,要决定必要的样本大小,必须先明确如下三个问题:
1. 要规定允许的估计误差的大小,即允许的估计值与实际值之间的最大偏离值是多少,实际上也就是估计区间的大小,
2. 规定置信度,即估计所要求达到的可靠性,也就是实际的抽样误差不超过所规定的误差的可信度。
3. 要明确总体的标准差,即要求了解总体的分布情况。总体的标准差小,只要抽较少的样本就能满足对估计精确度和可靠性的要求,若总体标准差大,就必须抽取较多的样本才能达到对估计精确度和可靠性的要求。
设总体标准差为σ,样本均值的标准差为x σ。估计的置信度为1-α,于是可以
相应地得到置信系数Z α/2。于是对总体均值的估计可由下式得到:
()P X Z x -<⋅=-μσαα/21
上式中的X -μ实际上就表示估计所允许的最大误差,我们用Δ表示,于是根据上式有
n Z σα⋅
≤∆2/ 则 2
2
22/∆⋅≥σαZ n 由此只要规定了允许误差的大小Δ和总体的标准差σ,由置信度1-α查表得到相应的Z α/2,代入公式,求得满足要求的最小整数就是满足估计误差不大于Δ和置信度为1-α的要求的最少样本数。
上述公式适用于重复抽样或无限总体不放回抽样时的情形。但对于有限总体不放回抽样的情形,公式变为如下的形式:
1
2/--⋅⋅≥∆N n N n Z σ
α 由此可求得满足上式要求的最小的整数为
()n N Z N Z 022222
221=⋅⋅-+⋅αασσ//∆。 其中:Δ为允许最大误差,
12
N 为有限总体的个体数,
α为置信度水平,
Z α/2为根据置信度水平α查表得到的置信系数。
二、比例估计问题中,样本大小的决定
关于总体比例的估计问题中,要决定样本大小首先也要明确关于均值的估计问题中同样的三个问题:
1. 允许误差的大小,即规定估计值与实际值的最大偏离值。
2. 规定置信度,即估计所要求达到的可信度。
3. 对总体比例的事先估计值,即大致的或估计的总体比例是多少。 与均值的估计问题完全平行地,我们可以得到以下的结果。
对于重复抽样或无限总体不重复(放回)抽样时的情形为
()
n Z p p p 0222
1=⋅-α/∆
但对于有限总体不放回抽样的情形,公式变为如下的形式:
()()()n N Z p p N Z p p p 0222
22111=⋅⋅--+⋅-αα//∆
第四节 假设检验
一、假设检验的基本原理
假设总体的均值为某一个值,为了检验这一假设的正确性,我们收集样本的数据,计算出假设值与样本均值之间的差异,然后根据差异的大小来判断所作假设的正确性,这就是假设检验。直观地,我们知道差异越小,对于总体均值的假设正确的可能性就愈大。差异越大,对总体均值的假设正确的可能性就愈小。
然而在多数情况下,对总体参数的假设值与样本统计量之间的差异既不至于大到显而易见,应该拒绝假设,也不至于小到可以完全肯定,应该接受假设的程度。于是就不能简单地决定接受或拒绝所作的假设,而需要判断所作的假设在多大的程度上是正确的。于是就需要研究假设和判断假设是否正确的程度。
(一)假设检验中的假设
假设检验中通常把所要检验的假设称作原假设或零假设,记作H 0。例如要检验总体均值μ=100这个假设是否正确,就表示为H 0:μ=100。如果样本所提供的信息无法证明原假设成立,则我们就拒绝原假设。此时,我们只能接受另外备选的假设了,称之为备择假设,我们以H 1表示备择假设。备择假设可以有三种形式,例如,在原假设H 0:μ=100的条件下,备择假设可以是:
H 1:μ≠100。这表示备择假设是总体的均值不等于100。或者是
H 1:μ>100。这表示备择假设是总体的均值大于100。或者是
H 1:μ<100。这表示备择假设是总体的均值小于100。
上述备择假设的选择与检验的要求是密切相关的。我们根据假设检验的目的要求不同又把假设检验分为双侧检验和单侧检验。
13
如果样本均值高于或低于假设的总体均值很显著时都拒绝原假设,我们称作双侧检验。在双侧检验时有左右两个拒绝区域。当原假设是:H 0:μ=100,备择假设是:H 1:μ≠100时就必须使用双侧检验。
若只有在样本的均值高于(或低于)假设的总体均值很显著时才拒绝原假设,这就称作单侧检验。单侧检验只有一个拒绝区域。若假设检验只有在样本均值高于假设的总体均值很显著时才拒绝原假设,这种假设检验称作右侧检验。此时,原假设实际上变为H 0:μ≤100,备择假设为H 1:μ>100。反之,如果只有在样本均值低于假设的总体均值很显著时才拒绝原假设,则称作左侧检验。此时,原假设实际上变为H 0:μ≥100,备择假设为H 1:μ<100。由此可见,原假设和备择假设总是排他性的。
(二)检验的显著性水平
假设检验需要确定一个是接受还是拒绝原假设的标准,这个标准就是显著性水平。所谓检验的显著性水平α就表示,在假设正确的条件下落在某个界限以外的样本均值所占的百分比。具体地说,“在5%的显著性水平下检验假设”就是说,假定对总体参数所作的假设正确,那么样本均值同假设的总体均值差异过大的,在每100个样本中不应超过5个。如果样本均值与总体均值差异过大的超过这一数目就认为这个样本不可能抽自所假设的总体,所以拒绝零假设。
我们可以用图5-4来直观地解释假设检验的原理。假如设检验的显著性水平α=5%,我们已知在概率密度曲线下包括在假设的均值μσH X 0196±.两侧直线间的
面积是95%,两边每一个尾端的面积各为2.5%。于是若样本的均值落在95%的区域内,我们就认为样本统计量与假设的总体参数的差异是不显著的。结果就接受原假设。若样本统计量落在左右尾端的各为 2.5%的区域内,则差异就是显著的。我们就拒绝原假设。接受备择假设。
图5-4 假设检验的接受区域和拒绝区域
不过应该强调指出,在假设检验中“接受原假设”的意思仅仅是意味着没有充分的统计证据拒绝原假设。在假设检验中“接受原假设”的特定含义就是不拒绝原假设。但实际上,即使样本统计量落在95%的面积内,也并不能证明原假设H 0就是正确的。因为只有在知道了总体参数的真实值与假设值完全相同才能证明假设正确。但我们无法知道总体参数的真实值。
在给定了检验的显著性水平α后,我们可以根据假设来确定接受还是拒绝原假设的区域或范围。如果样本均值X 落在某一区域内我们就接受原假设,则就称这一区域为接受区域。如果样本均值X 落在某一区域内就拒绝原假设,我们就称这一区域为拒绝区域。
对于显著性水平的选择没有一个唯一的或通用的标准。实际上在任何显著性水平下检验某个假设都是可能的,但是必须注意不管选择什么样的显著性水平,都存在假设为真而被拒绝的可能性。另一方面,在检验同一个假设时,使用的显著性水平愈高,原假设为真时而被拒绝的概率也就愈高。这就需要研究假设检验中的错误,我们在以