抽样误差和样本规模

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、 抽样误差的含义
当总体指标未知时,往往要组织一次抽样调查,然后用 抽样调查所获得的抽样指标的观察值作为总体指标的估计值, 这种处理方法是存在一定误差的。抽样指标与所要估计的总 体指标之间的差值称为抽样误差。抽样误差的大小能够说明 抽样指标估计总体指标是否可行,抽样效果是否理想等问题。 常见的抽样误差有抽样平均数与总体平均数的差(-μ),抽 样成数与总体成数的差(p-π)。
统计上把这种根据数理统计的相关理论以一定的可靠 程度保证抽样误差不超过某一给定的最大可能范围称为抽
Δ。在实际工作中,抽样极限误差也 叫作允许误差。其计算公式为
(9-1) (9-2) 其中:ΔX、Δp分别为抽样平均数和抽样成数的极限误 差(即允许误差),zα2为根据给定的估计可靠程度(即置 信水平)查标准正态分布表得到的概率度,σ为总体的标 准差,π为总体的成数(比率),n
要想更为清晰地理解抽样误差的含义,就需要从前述统计误 差产生的来源入手进行分析。回顾前面的介绍,统计误差分为登 记误差和代表性误差两类。登记误差是指由于主客观原因在登记、 汇总、计算过程中所产生的差错。不论是全面调查还是非全面调 查都可能产生登记误差。代表性误差又分为系统性误差和随机误 差。系统性误差是指由于没有遵循随机原则而产生的误差,如抽 选到一个单位后,调查者认为它偏低或偏高,把它剔除掉而产生 的偏差或是在抽取调查单位时调查者有意识地选择一部分较好单 位或较差单位进行调查而产生的偏差。
2. 样本单位数
在其他条件不变的情况下,抽取的样本单位 越多,抽样误差就越小;抽取的样本单位数越少, 抽样误差就越大。之所以如此,是因为抽样单位 数越多,样本单位数在全及总体中的比例越高, 抽样总体就越接近全及总体的基本特征,从而总 体特征就越能在抽样总体中得到真实的反映。
3. 抽样方法
对于一个既定的研究总体, 在样本容量相同的情况下,重 复抽样的抽样误差大于不重复 抽样的抽样误差。
(二) 影响样本规模的因素
根据上述允许误差的公式可 以看出,通常情况下,影响样本 规模的因素主要有以下5点:
1. 总体的变异程度
总体的变异程度由总体方差或 标准差的大小来反映。在其他条件 相同的情况下,总体的方差或标准 差越大,所需的样本规模就越大; 反之,所需的样本规模就越小。
2. 允许误差
4. 抽样方法
在相同条件下,重复抽样的抽样平 均误差比不重复抽样的抽样平均误差大, 因此,为达到一样的估计精度,不重复 抽样条件下确定的样本规模一般小于重 复抽样条件下的样本规模。
随机误差是指按随机原则抽样而产生的样本指标值(抽样估 计值)与总体相应指标的离差。按随机原则抽样时,由于抽到的 样本不同,会得到不同的抽样指标,具有随机性和偶然性,这种 误差是抽样调查本身所固有的、无法避免的误差,只是这部分误 差数值大小不同而已。但我们可以利用数理统计的原理对它进行 计算,并能通过抽样设计程序设法加以控制。
四、 抽样极限误差
用样本指标来估计总体指标,要达到完全准 确、没有误差是不可能的。所以在用样本指标估 计总体指标时,必须同时估计误差的大小。抽样 误差越大,样本的价值就越小。但是,减少抽样 误差势必会增加更多的费用。因此,在进行抽样 估计时,应根据研究对象的变异程度及分析任务 的要求确定一个最大可以允许的误差范围。
允许误差说明了估计的精度,因此, 在其他条件不变的情况下,所要求的允 许误差越小(即所要求的精度越高), 所需的样本规模就要越大;反之,所要 求的允许误差越大(即所要求的精度越 低),所需的样本规模就越小。
wenku.baidu.com 3. 概率保证度
概率保证度说明了估计的可靠 程度。所以,在其他条件不变的情 况下,推断所要求的可靠程度越高, 所需的样本规模就要越大;反之, 所需的样本规模就越小。
准确地说,抽样误差仅是指不包括登记误差和系统性误差在 内的随机误差。换言之,抽样误差是指在遵循随机原则的条件下, 用抽样指标代表总体指标不可避免的随机误差。
二、 影响抽样误差的因素
1. 总体各单位标志值的变异程度
在其他条件不变的情况下,总体各单 位标志值的变异程度越大则抽样误差就越 大,总体各单位标志值的变异程度越小则 抽样误差就越小。如果总体各单位标志值 相等,则变异程度为零,抽样指标就完全 等于总体指标,抽样误差也就不存在了。
五、 样本规模
(一) 样本规模的含义
样本规模就是样本容量,即样本中含有的单位个数。 在抽取样本时考虑样本规模的大小是一个很实际的问题。 若确定的样本容量过大,虽然收集的信息较多从而估计精 度会更高,但投入的费用也会多;若样本容量过小,虽然 投入的费用较少,但由于收集的信息较少而会降低估计的 精度。因此,样本规模的确定必须要同时考虑估计的精度 和费用的限制。抽样设计时,通常是以尽可能小的样本容 量同时满足这两方面的要求。
4. 抽样的组织方式
不同的抽样组织方式会使其样本单 位在总体中的分布不同并影响对总体的 代表性,由此抽样误差也就不同。
三、 抽样平均误差
由于样本是按随机原则抽取的,故在同一总体中,按相 同的抽样数目可以抽出许多不同的样本,因而样本指标(即 样本统计量,如样本均值、样本比例等)有不同的数值,它 们与总体指标(即总体参数,如总体均值、总体比例等)的 离差(即抽样误差)也就不同。抽样平均误差就是反映抽样 误差一般水平的指标,通常用样本平均数的标准差(σX)或 样本成数的标准差(σp)来表示。在抽样调查中,总是以抽
抽样误差和样本规模
正如抽样程序的介绍中所描述的那样,在选定了抽样方法后 就需要确定样本规模。所谓样本规模就是指样本容量,即样本中 所含的单位数目。虽然一些社会调查研究专家认为社会调查研究 中的样本规模至少不能少于100个单位,但这主要是为了保证总 体每个类别中都有一定数量的单位,从而方便分析不同类别之间 的差别和不同变量之间的关系。从根据样本指标来估计总体指标 的角度看,样本规模的确定受到估计的精度、可靠程度的影响及 费用的限制。为了更科学地确定样本规模的大小,必须先要了解 抽样误差的含义、影响抽样误差的因素、抽样平均误差和抽样极 限误差,然后再学习确定必要样本容量的计算方法。
相关文档
最新文档