抽样调查的样本数目要有
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样调查的样本数目要有
篇一:抽样调查的样本容量的确定方法
抽样调查的样本容量的确定方法
摘要:确定样本容量是抽样调查中重要的环节,影响到抽样估计的精确度和调查的成本和效益。单位标志变异程度、抽样极限误差、抽样推断的可靠度、抽样类型和方法等影响到样本容量地确定。样本容量的确定可以根据由抽样误差、抽样极限误差和概率度推算出来的公式计算,也可以根据建立在过去抽取满足统计方法要求的样本量所累积下来的经验法则来确定。
关键词:样本容量;抽样调查;抽样误差;极限误差
抽样调查是根据随机原则,从总体中抽取部分实际数据构成样本,同时运用概率估计方法,依据样本信息推断总体数量特征的一种非全面统计调查。根据抽选样本的方法,抽样调查可以分为等概率抽样和非概率抽样两类。等概率抽样又称为随机抽样,是按照概率论和数理统计的原理,从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征做出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。样本是从总体中抽出的部分单位的
1
集合,样本中所包含的单位数被称为样本容量,一般用n表示。确定样本容量是制定抽样调查方案中的一个非常重要的环节。
1(确定样本容量的必要性
1.1样本容量大小影响抽样估计的精确度
抽样估计的精确度是指样本的统计量与其所代表的总体值的接近程度。调查结果相对于总体真实值的精确度与样本容量直接相关。样本容量越大,抽样误差相对
就会减少,估计精度就会提高;若样本容量太小,抽样误差就会增大,从而影响抽样估计的精确度。
1.2样本容量大小影响抽样调查的成本和效益
样本量的设计通常受到研究经费及调查时间的限制。根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。若样本容量过大,调查单位增多,不仅增加人力、财力和物力的耗费,增加调查费用,而且还影响到抽样调查的时效性,从而不能充分发挥抽样调查的优越性。
因此,为节省调查费用,体现出抽样调查的优越性,在确定样本容量时,应在满足抽样调查对估计数据的精确度的前提下,尽量减少调查单位数,确保必要的抽样数目。
2(影响必要样本容量的主要因素
2
影响样本容量的因素是多方面的,在抽样调查总体、调查费用和调查时间既定的情况下,为确定最佳的样本容量,应首先分析影响样本容量的因素。从理论上说,影响样本容量的因素有以下几个方面:
2.1单位标志变异程度
单位标志变异程度一般用方差?2或成数方差P(1,P)的大小来表示。在其他条件不变的情况下,为了达到同样的研究目的,总体单位标志的变异程度大,样本容量应越大;反之,总体单位标志的变异程度越小,则样本容量就应越少。二者成正比关系。
2.2抽样极限误差
抽样极限误差又叫允许误差,是指在一定的把握程度下保证样本指标与总体指标之间的抽样误差不超过某一给定的最大可能范围。在抽样推断中,需要把这个误
差控制在一定的范围之内。抽样平均数极限误差一般用?表示,抽样成数极限误差用?P表示。在其他条件不变的前提下,所允许的抽样极限误差越小,即抽样估计的精确度要求越高,样本容量应越大;所允许的抽样极限误差越大,所需的样本容量就越小。二者成反比关系。
2.3抽样推断的可靠度
抽样推断的可靠度是指总体所有可能样本的指标落在一定区间的概率度,即允许误差范围的概率保证程度。概率度
3
用Z?2表示,即置信水平1??的统计量,一般简写为t。在其他条件不变的情况下,抽样估计所要求的可靠程度越高,即概率保证程度越高,要求样本含有的总体信息就越多,只有增加样本容量才能满足高精确度的要求;反之,概率保证程度越低,所需的样本容量就越小。二者成正比关系。
2.4抽样类型和方法
概率抽样的主要类型有简单随机抽样、系统随机抽样、分层随机抽样、整群随机抽样、多阶段随机抽样等。在简单随机抽样中,根据同一单位是否允许重复抽取方式的不同,抽样方法可分为重复抽样和不重复抽样。由于在同样的条件下,不同的抽样方式会产生不同的抽样误差,因此,样本容量也应有所不同。
一般来说,分层随机抽样和系统随机抽样的样本容量可定得小些,若用简单随机抽样和整群随机抽样方式,抽样的样本容量就要定得大些。至于抽样方法,由于不重复抽样的误差小于重复抽样的误差,因此,不重复抽样的样本容量可比重复抽样的样本容量小些。
3(不同抽样方式下的样本容量确定
从上述分析中可以看出,影响样本容量的因素是多方面的,但必要样本容量是根据抽样误差、抽样极限误差和概率度推算出来的,在不同抽样方式下,计算公式有所差异。
3.1简单随机抽样的样本容量
4
简单随机抽样是指按照随机原则从总体单位中直接抽取若干单位组成样本。简单随机抽样中分为重复简单抽样和简单不重复抽样,因此,简单随机抽样的样本容量计算公式包括两种。
3.1.1重复抽样时的样本容量
在重复抽样条件下,样本容量的计算公式为:
n?t2?2?2或n?t2P(1?P)?2。
在以上公式中,n代表样本容量,t代表概率度Z?2,?代表极限误差,?2代表总体方差,P(1,P)表示成数方差。
3.1.2不重复抽样时的样本容量
在不重复抽样条件下,样本容量的计算公式为:
n?Nt2?2N?2?t2?2或n?Nt2P(1?P)N?2?t2P(1?P)
上式中,N代表样本总数。
3.2分层随机抽样的样本容量
分层随机抽样,也称类型随机抽样,是指首先将调查对象的总体单位按照一定的标准分成各种不同的类别(或组),然后根据各类别(或组)的单位数与总体单位数的比例确定从各类别(或组)中抽取样本的数量,最后按照随机原则从各类(或组)中抽取样本。
对于分层抽样,在总的样本量一定时,一个重要的问题是各层应该分配多少样本量。实际工作中有不同的分配方法,可以按对各层进行常数分配,也可以按各层单位数占总体单
5
位数的比例分配,还可以采用在总费用一定条件下使估计量方差达到最小的最优分配等,其中等比例分配是较为常用的方法。
分层抽样是对每一组抽样,不存在样本组间误差,抽样平均误差取决于各组内方差的平均水平,即以各组样本单位数为权数,计算各组内方差的平均数。因此可用组内方差平均数计算出抽样平均误差。
3.2.1重复抽样时的样本容量
在重复抽样条件下,样本容量的计算公式为:
n?t2?2?2或n?t2P(1?P)?2 在以上公式中,?2是组内平均方差,P(1?P)代表成数的平均组内方差。?2??ni?i2n,其中ni代表各组样本单位数,?i2代表各组的组内方差,n代表样本总数。
3.2.2不重复抽样时的样本容量
在不重复抽样条件下,样本容量的计算公式为:
n?Nt2?2N?2?t2?2或n?Nt2P(1?P)N?2?t2P(1?P)
3.2.3各层样本量的确定
当样本容量n确定之后,各层应抽取的样本单位数可采用等比例法进行分nN 配,计算公式为:ni?i N
上式中,ni为第i层应抽取的样本数,n为样本容量,Ni为第i层样本数,N 为总体单位数。
3.3整群随机抽样的样本容量
6