抽样误差和样本规模
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、 抽样误差的含义
当总体指标未知时,往往要组织一次抽样调查,然后用 抽样调查所获得的抽样指标的观察值作为总体指标的估计值, 这种处理方法是存在一定误差的。抽样指标与所要估计的总 体指标之间的差值称为抽样误差。抽样误差的大小能够说明 抽样指标估计总体指标是否可行,抽样效果是否理想等问题。 常见的抽样误差有抽样平均数与总体平均数的差(-μ),抽 样成数与总体成数的差(p-π)。
统计上把这种根据数理统计的相关理论以一定的可靠 程度保证抽样误差不超过某一给定的最大可能范围称为抽
Δ。在实际工作中,抽样极限误差也 叫作允许误差。其计算公式为
(9-1) (9-2) 其中:ΔX、Δp分别为抽样平均数和抽样成数的极限误 差(即允许误差),zα2为根据给定的估计可靠程度(即置 信水平)查标准正态分布表得到的概率度,σ为总体的标 准差,π为总体的成数(比率),n
要想更为清晰地理解抽样误差的含义,就需要从前述统计误 差产生的来源入手进行分析。回顾前面的介绍,统计误差分为登 记误差和代表性误差两类。登记误差是指由于主客观原因在登记、 汇总、计算过程中所产生的差错。不论是全面调查还是非全面调 查都可能产生登记误差。代表性误差又分为系统性误差和随机误 差。系统性误差是指由于没有遵循随机原则而产生的误差,如抽 选到一个单位后,调查者认为它偏低或偏高,把它剔除掉而产生 的偏差或是在抽取调查单位时调查者有意识地选择一部分较好单 位或较差单位进行调查而产生的偏差。
2. 样本单位数
在其他条件不变的情况下,抽取的样本单位 越多,抽样误差就越小;抽取的样本单位数越少, 抽样误差就越大。之所以如此,是因为抽样单位 数越多,样本单位数在全及总体中的比例越高, 抽样总体就越接近全及总体的基本特征,从而总 体特征就越能在抽样总体中得到真实的反映。
3. 抽样方法
对于一个既定的研究总体, 在样本容量相同的情况下,重 复抽样的抽样误差大于不重复 抽样的抽样误差。
(二) 影响样本规模的因素
根据上述允许误差的公式可 以看出,通常情况下,影响样本 规模的因素主要有以下5点:
1. 总体的变异程度
总体的变异程度由总体方差或 标准差的大小来反映。在其他条件 相同的情况下,总体的方差或标准 差越大,所需的样本规模就越大; 反之,所需的样本规模就越小。
2. 允许误差
4. 抽样方法
在相同条件下,重复抽样的抽样平 均误差比不重复抽样的抽样平均误差大, 因此,为达到一样的估计精度,不重复 抽样条件下确定的样本规模一般小于重 复抽样条件下的样本规模。
随机误差是指按随机原则抽样而产生的样本指标值(抽样估 计值)与总体相应指标的离差。按随机原则抽样时,由于抽到的 样本不同,会得到不同的抽样指标,具有随机性和偶然性,这种 误差是抽样调查本身所固有的、无法避免的误差,只是这部分误 差数值大小不同而已。但我们可以利用数理统计的原理对它进行 计算,并能通过抽样设计程序设法加以控制。
四、 抽样极限误差
用样本指标来估计总体指标,要达到完全准 确、没有误差是不可能的。所以在用样本指标估 计总体指标时,必须同时估计误差的大小。抽样 误差越大,样本的价值就越小。但是,减少抽样 误差势必会增加更多的费用。因此,在进行抽样 估计时,应根据研究对象的变异程度及分析任务 的要求确定一个最大可以允许的误差范围。
允许误差说明了估计的精度,因此, 在其他条件不变的情况下,所要求的允 许误差越小(即所要求的精度越高), 所需的样本规模就要越大;反之,所要 求的允许误差越大(即所要求的精度越 低),所需的样本规模就越小。
wenku.baidu.com 3. 概率保证度
概率保证度说明了估计的可靠 程度。所以,在其他条件不变的情 况下,推断所要求的可靠程度越高, 所需的样本规模就要越大;反之, 所需的样本规模就越小。
准确地说,抽样误差仅是指不包括登记误差和系统性误差在 内的随机误差。换言之,抽样误差是指在遵循随机原则的条件下, 用抽样指标代表总体指标不可避免的随机误差。
二、 影响抽样误差的因素
1. 总体各单位标志值的变异程度
在其他条件不变的情况下,总体各单 位标志值的变异程度越大则抽样误差就越 大,总体各单位标志值的变异程度越小则 抽样误差就越小。如果总体各单位标志值 相等,则变异程度为零,抽样指标就完全 等于总体指标,抽样误差也就不存在了。
五、 样本规模
(一) 样本规模的含义
样本规模就是样本容量,即样本中含有的单位个数。 在抽取样本时考虑样本规模的大小是一个很实际的问题。 若确定的样本容量过大,虽然收集的信息较多从而估计精 度会更高,但投入的费用也会多;若样本容量过小,虽然 投入的费用较少,但由于收集的信息较少而会降低估计的 精度。因此,样本规模的确定必须要同时考虑估计的精度 和费用的限制。抽样设计时,通常是以尽可能小的样本容 量同时满足这两方面的要求。
4. 抽样的组织方式
不同的抽样组织方式会使其样本单 位在总体中的分布不同并影响对总体的 代表性,由此抽样误差也就不同。
三、 抽样平均误差
由于样本是按随机原则抽取的,故在同一总体中,按相 同的抽样数目可以抽出许多不同的样本,因而样本指标(即 样本统计量,如样本均值、样本比例等)有不同的数值,它 们与总体指标(即总体参数,如总体均值、总体比例等)的 离差(即抽样误差)也就不同。抽样平均误差就是反映抽样 误差一般水平的指标,通常用样本平均数的标准差(σX)或 样本成数的标准差(σp)来表示。在抽样调查中,总是以抽
抽样误差和样本规模
正如抽样程序的介绍中所描述的那样,在选定了抽样方法后 就需要确定样本规模。所谓样本规模就是指样本容量,即样本中 所含的单位数目。虽然一些社会调查研究专家认为社会调查研究 中的样本规模至少不能少于100个单位,但这主要是为了保证总 体每个类别中都有一定数量的单位,从而方便分析不同类别之间 的差别和不同变量之间的关系。从根据样本指标来估计总体指标 的角度看,样本规模的确定受到估计的精度、可靠程度的影响及 费用的限制。为了更科学地确定样本规模的大小,必须先要了解 抽样误差的含义、影响抽样误差的因素、抽样平均误差和抽样极 限误差,然后再学习确定必要样本容量的计算方法。