定量访问中抽样误差与样本量的关系

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

抽样误差与样本量的关系

什么是抽样误差

调查是通过对少量个体的分析推断整体表现的一个过程。我们无法开展面对所有用户的调查,只能选取其中一小部分,这个选取的过程即称为抽样。

抽样样本数的大小对调查结果有很大影响,中国有句成语叫“以偏概全”,值得是用片面概括全部,抽样误差就是用来描述“以偏概全”程度的一个量,误差越大,以偏概全越严重。

如果样本量不足,使得抽样误差较大,那么在同一时间点对同一批人群开展相同的调查,也可能会得到截然不同的调查结果。

样本量与抽样误差的关系以及适用场景

调查目的不同,对抽样误差的需求也会完全不同,下面的表格是在95%的置信度下,样本量与抽样误差的关系以及这样的抽样误差适用于哪些场景。

图解抽样值与真实值的差异

数据过于抽象,让我们来看一组示例:

有一个数据库,记录了总计20000个用户对品牌A-G的认知度情况。

我们以这个数据库为总体,分别抽取15-300个样本,计算品牌知名度的抽样值,再与实际值对比。用最直观的方式来表现样本量与抽样误差的关系:

15个样本:每次抽样结果的波动很大,与真实值之间的差距也很大,基本无法判别各品牌的知名度之间的大小趋势

30个样本:调查结果已经基本能区分出各品牌知名度的高、中、低差异,但与真实值之间还存在不小差距

50个样本:调查结果能区分出各品牌知名度的高、中、低差异,但会有2-3个品牌的知名度与真实值之间存在较大差异。

100个样本:调查结果与真实值比较接近了,但每次抽样值之间的稳定性还不够。不能作为两次测量对比的依据

300个样本:调查结果与真实值相当接近,只是偶尔会出现数值排名上的误差。

相关文档
最新文档