抽样调查第11章调查中的非抽样误差

合集下载

市场调查中非抽样误差的产生和控制

市场调查中非抽样误差的产生和控制

市场调查中非抽样误差的产生和控制作者:戢运丽来源:《中国市场》2008年第09期摘要:非抽样误差直接与市场调查的准备阶段、抽样阶段、问卷设计阶段、实地访问阶段、统计处理阶段等各阶段的工作质量好坏存在密切的关联。

本文在具体分析这些阶段导致非抽样误差产生的工作情形后,提出了科学设计调查方案、重视对调查员的培训和管理、减少被调查者误差和做好调查资料的汇总工作等几方面控制非抽样误差的对策。

关键词:非抽样误差;调查方案;调查员;被调查者一、非抽样误差的产生非抽样误差产生的原因多种多样,尤其在实施调查过程中最为常见。

非抽样误差直接与调查的准备阶段、抽样阶段、问卷设计阶段、实地访问阶段、统计处理阶段等各阶段的工作质量好坏存在密切的关联。

1.准备阶段准备阶段是整个调查的起始阶段,准备阶段的主要任务是:确定调查任务,设计调查方案,组织调查队伍。

调查设计者首先要列出具体研究目标,从而确定所要研究的问题和识别研究的总体,最后明确调查任务并给整个调查活动一个纲领。

具体说来,设计调查方案包括调查指标的设计、调查总体方案的设计和调查方案可行性研究三方面的内容。

在本阶段可能产生误差的工作主要有:(1)调查设计者可能误解了主办者的目的意图,制定了错误方针,误导研究方向。

(2)目标总体与实际的调查总体不一致。

例如,进行电话访谈时,社区周边的居民用户电话号码可能没有列到电话号码簿中,另一些用户可能已经搬迁而导致电话为空号,因此目标总体和被调查总体出现一定的差异。

(3)调查设计者没有事先预先设定好调查的具体步骤和时间表、可能出现的问题以及未事先培训和挑选恰当的调查员,因而导致计量质量的下降。

(4)预算的限定。

任何调查都有费用,市场调查也同样。

并且由于市场调查的主办者一般都是企业,因此费用上的限制就更为明显。

如果资金短缺,只能缩小研究范围或进一步寻求资金。

上述第一点是调查设计者误解调查主办者的目的,这必然导致系统误差,使调查信度和效度下降。

抽样调查-调查中的非抽样误差培训课件PPT课件

抽样调查-调查中的非抽样误差培训课件PPT课件

根据非抽样误差的来源、性质 可分为以下三类:
(1)抽样框误差,即由不完善的抽样框引起的
误差; (2)无回答误差,即由于种种原因没有从被调 查单元获得调查结果,造成调查数据的缺失; (3)计量误差,即所获得的调查数据与其真值 之间不一致造成的误差。
§11.2 抽样框误差
一、概念
抽样调查中的总体有两个: 目标总体—调查研究对象的全体。 抽样总体—从中抽取样本的总体。 (即抽样框) 理想抽样框的标志是目标总体和抽样总 体完全重合。否则抽样框就是不完善的。
●抽样框存在的问题,有些是不容易解决的。 因此抽样框的维护、抽样框使用情况的不断 总结与研讨,对于经常性的调查项目来说是 十分必要的。
●抽样框的不完善并不是不能使用。可以进 行修补、调整。
N1
(3)抽样框误差的影响
设目标总体单元:N
抽样框中单元:N1 抽样框中丢失的单元:N0
N=N1+N0 ■ 总体总量的估计 总体总量的真值是:
W0 (Y1 Y0 ) W0 (1 r)
Y
rW0 (1 W0 )
由上式可以看出,如果丢失单元的均值与
抽样单元的均值相同,即
r
1
,则估计量
Y
是目标变量 Y 的无偏估计。
r 反之,如果 r 1 ,偏倚状况则随着
的变化而变化。
Y
三、不完善抽样框的使用
抽样框不完善并不是不能使用,因为构造一个完 善的抽样框有时是非常困难的。使用不完善抽样框时 若能采用一些补救措施,有助于减小抽样框误差。主 要采用以下三项补救措施:
ቤተ መጻሕፍቲ ባይዱ
N N1 N0
R1
N1 N
, R0
N0 N
则总体均值为: Y R1Y 1 R0Y 0

抽样技术-课件全-抽样技术-第11章全文

抽样技术-课件全-抽样技术-第11章全文
CPS的样本轮换采用的是4—8—4模式,即一个 住户单位在连续的4个月内接受调查,在接下来 的8个月中退出样本,然后再接受连续4个月的调 查,最终退出样本。轮换方案的设计使得具有相 同特征的住户单位替换退出的住户单位。
CPS的样本轮换具有如下主要特征
1.在任何一个月内,都有八分之一的住户单位第一次接受 调查,八分之一的住户单位第二次接受调查,如此下去
2.每个月都有新的样本组代替从样本中永久退出的老样本 组
3.每个月都有一个样本组在8个月的闲置后重新接受调查。 重新接受调查的样本组代替了刚刚退出,进入闲置期的 样本组
4.设计保证了每个样本单元在两个年份的4个相同月份中 接受调查
5.在连续的两个月内,有四分之三的样本是相同的;在连 续的两年中,有二分之一的样本是相同的。
劳动力特征
3. 抽样时以州为总体,因而设计也是以州为总体的设 计
4. 样本量由变异系数CV及可靠性要求所决定 5. 在失业率为6%的自定义下,各州对变异系数的要求 在8%—9%之间。这样就能保证进行全国估计的变异系 数控制在1.8%之内
11.2.2第一阶段的抽样
第一阶段的抽样涉及三个方面的工作。这些工 作是:初级抽样单元(PSU)的界定;将初级抽 样单元PSU分层;PSU的抽选
11.4.5 广义方差(Generalized Variance)
广义方差函数GVF用于产生人口总量x估计值的估计方差。 函数形式为
Var( Xˆ ) aX 2 bX 式中,a和b是用最小二乘法得到的估计参数。该模型的原理是假定x的方差可以表示为简 单随机样本的方差与设计效应(deff)的乘积。设计效应deff是指某一复杂抽样设计相对于
第11章 设计与方法-美国CPS案例
美国人口现状调查(Current Population Survey,简称CPS)被认为是全国性大规模居 民住户抽样调查的典范。

抽样调查多选题(附答案)

抽样调查多选题(附答案)

1 下列关于抽样的说法正确的是( ABDE)A、抽样框应该尽量与目的总体尽可能一致;B、偏倚是指按照某一抽样方案反复进行抽样,估计值的数学期望与待估参数之间的离差;C、抽样总体是指从总体中所抽取的调查单位;D、抽样单元是构成抽样框的基本要素,抽样单元可以只包含一个个体;E、随机误差不可避免但是可以控制;2.数据采集方法包括(ABCDE )A、自填式B、计算机辅助方式C、面访式D、网络调查E、直接观测3 抽样调查是(ABCD)A、典型调查方法B、搜集统计资料的方法C、非全面调查方法D、对总体进行科学估计和推断的方法E、全面调查方法4 抽样估计的特点是ABCEA、在逻辑上运用归纳推理B、在方法上运用不确定的概率估计法C、在方法上运用确定的数学分析法D、在逻辑上运用演绎推理E、必须存在抽样误差5 比率估计的基本性质有哪些?(BCD )A、无偏性B、一致性C、有偏性D、高效性6 在区间估计中,保证程度与准确程度之间的关系是CDA、保证程度高,准确程度亦高B、保证程度低,准确程度亦低C、保证程度低,准确程度高D、保证程度高,准确程度低E、不能确定7 下列属于非抽样误差的是(ADEF )A、不完整抽样框引起的误差B、偏倚C、均方误差D、填写或录入数据错误产生的误差E、不回答误差F、调查误差8 抽样调查的全及指标包括ADEA、总体数量标志标准及方差B、样本数量标志标准差及方差C、样本平均数和成数D、总体是非标志标准差及方差E、全及平均数和成数9 影响必要样本容易的因素ABCDEA、允许的极限误差大小B、概率保证程度C、抽样组织方式D、抽样方法E、总体各单位标志变异程度10 抽样调查适用于ABCEA、对某些总体的假设进行检验B、检查和修正全面调查资料C、工业产品的质量检验和控制D、适用于任何调查E、无法进行全面调查而又要了解全面情况11 区间估计的三个基本要素是ABEA、点估计值(样本平均数或成数)B、抽样极限误差C、估计标准误差D、显著水平E、概率度12 简单随机抽样的样本性质有( )A、对于不放回抽样,总体各单元的入样概率之和等于样本量n。

第十章(非抽样误差)

第十章(非抽样误差)

西蒙斯随机化回答模型
沃纳模型中随机化回答的两个问题是同一敏感问题的两个方面,有些被 调查者仍可能有疑虑不肯合作,而且从精度方面考虑,当P与0.5很接近 时,方差大,而太远,增加了疑虑。所以西蒙斯(W.R.Simmons)进行了 改进,将第二个问题改为与所要调查的敏感性问题完全无关的另一个 非敏感性问题。西蒙斯随机化回答模型中两个问题一般表述为: I 你具有特征A吗? II 你具有特征B吗? 其中特征A为敏感性问题,特征B为无关问题。需要估计的是特征A的比例, 特征B的比例为在设计时要求已知。两个问题在随机化过程中出现的比例 仍假设为P: (1-P),其中P为已知。 仍以调查考试作弊为例,两问题的设置
• 例:某电影公司调查学生每月看电影的次 数,随机抽取了1000人, • 进行问卷调查,其中800人作了回答,回答 的均值为2.5;若对无回答 • 的200人中,又随机抽取了50人进行面访, 结果这50人的平均每月看 • 电影次数为1.2次,求偏倚的估计值。
此例指出了调整无回答误差的一个途径。即可通过多次访问。
2.
3.
根据非抽样误差的来源、性质和处理方法不 同常分为以下三类: (1)抽样框误差 (2)无回答误差 (3)计量误差
抽样框误差
抽样框:一份包含全部抽样单元的清单或图示 ( 抽样框是用来抽取抽样单元的依据。) 目标总体:希望从中获取信息的总体 调查总体(抽样总体):实际调查所覆盖的总体。
理想状态下,两个总体应该完全一致。调查总体与目标总体 一般不完全相同。因此就产生了抽样框误差。主要如下
若用Ny1估计总体总和,偏倚为 E ( Ny1 ) Y NR0 (Y1 Y0 ) 以上两种估计量的相对偏倚都是 R0 (Y1 Y0 ) / Y
根据以上分析,无回答的偏倚大小由两方面决定。一为回答率,二为 回答层与无回答层均值的差异。无论何种情况,降低无回答率对于减 少估计量的偏倚是重要的。

市场调查中非抽样误差的产生和控制

市场调查中非抽样误差的产生和控制

市场调查中非抽样误差的产生和控制摘要:非抽样误差直接与市场调查的准备阶段、抽样阶段、问卷设计阶段、实地访问阶段、统计处理阶段等各阶段的工作质量好坏存在密切的关联。

本文在具体分析这些阶段导致非抽样误差产生的工作情形后,提出了科学设计调查方案、重视对调查员的培训和管理、减少被调查者误差和做好调查资料的汇总工作等几方面控制非抽样误差的对策。

关键词:非抽样误差;调查方案;调查员;被调查者一、非抽样误差的产生非抽样误差产生的原因多种多样,尤其在实施调查过程中最为常见。

非抽样误差直接与调查的准备阶段、抽样阶段、问卷设计阶段、实地访问阶段、统计处理阶段等各阶段的工作质量好坏存在密切的关联。

1.准备阶段准备阶段是整个调查的起始阶段,准备阶段的主要任务是:确定调查任务,设计调查方案,组织调查队伍。

调查设计者首先要列出具体研究目标,从而确定所要研究的问题和识别研究的总体,最后明确调查任务并给整个调查活动一个纲领。

具体说来,设计调查方案包括调查指标的设计、调查总体方案的设计和调查方案可行性研究三方面的内容。

在本阶段可能产生误差的工作主要有:(1)调查设计者可能误解了主办者的目的意图,制定了错误方针,误导研究方向。

(2)目标总体与实际的调查总体不一致。

例如,进行电话访谈时,社区周边的居民用户电话号码可能没有列到电话号码簿中,另一些用户可能已经搬迁而导致电话为空号,因此目标总体和被调查总体出现一定的差异。

(3)调查设计者没有事先预先设定好调查的具体步骤和时间表、可能出现的问题以及未事先培训和挑选恰当的调查员,因而导致计量质量的下降。

(4)预算的限定。

任何调查都有费用,市场调查也同样。

并且由于市场调查的主办者一般都是企业,因此费用上的限制就更为明显。

如果资金短缺,只能缩小研究范围或进一步寻求资金。

上述第一点是调查设计者误解调查主办者的目的,这必然导致系统误差,使调查信度和效度下降。

第二点由于空号的原因,造成缺失值误差。

第三点由于没有预先设定调查步骤和很好的培训访问员,即没有制定标准化的市场调查结构,这样也会降低信度。

第十章 非抽样误差(抽样理论与方法,河南财政学院)

第十章 非抽样误差(抽样理论与方法,河南财政学院)

费用函数为
c 0n 0 cn c1n1 k c是进行第一次调查,每个样本单元的平均费用 c1 是对第一次调查作出回答的问卷进行数据处理的费用 c 0 是进行第二次调查并对问卷进行数据处理的费用
c 0 W0n 则平均总费用 C T cn c1 W1n k c 0 W0n (c c1 W1 )n k
10.4 敏感性问题调查 与随机化回答技术
一、 敏感性问题: 指所调查的内容涉及私人机密而不愿或不便于公开 表态或陈述的问题。
河南财经学院
二、沃纳随机化回答模型 例:某大学欲调查本科生考试作弊现象。从本科生中抽取 100个学生进行调查。在一个密闭容器中有完全相同的 三个球,其中有2个红球,1个白球。抽中红球就回答问 题1,抽中白球就回答问题2。设计的问题为:
1 ' ' Y (n 1 y 1 n 0 y 0 ) w 1 y 1 w 0 y 0 n

V( Y) V1 ( y ) E1 ( w 0
S0
2

k 1 2 1 f 2 k 1 2 s0 ) S W0 S0 n n n
为总体中无回答层的方差
n0 k m
河南财经学院
2
2
给定V,使C达到最小值,得 n opt 河南财经学院
例:第一个样本用邮寄方式取得,预计回答率为50%。希望 达到的精度月容量为1000的简单随机样本(全部回答) 所达到的精度一样。邮寄一张问卷的费用是0.1美元。派 人作一次上门调查的费用为4.10美元。应当寄出多少份 问卷?对不回答者派人上门调查 的百分比试多少?(假 定 S 2 S 0 2 ,且N很大) 解: c 0.1,c 0.4,c 4.5,S 2 S 2
河南财经学院

统计学中的抽样误差与非抽样误差

统计学中的抽样误差与非抽样误差

统计学中的抽样误差与非抽样误差【统计学中的抽样误差与非抽样误差】统计学作为一门重要的科学方法,广泛应用于各个领域。

在进行数据分析和研究过程中,抽样误差和非抽样误差是其中关键的概念。

本文将从定义、影响因素、测量方法以及减少误差的策略等方面,深入探讨统计学中的抽样误差与非抽样误差。

1. 抽样误差的定义和影响因素抽样误差指的是从总体中选取样本所导致的估计误差。

在真实总体很大的情况下,由于实际调查的限制,我们很难直接获得全体数据,因此需要采用抽样方法。

抽样误差的大小直接关系到样本数据的代表性和准确性,主要受以下因素影响:(1) 样本容量:样本容量越大,抽样误差越小。

(2) 抽样方法:合理的抽样方法可降低抽样误差。

(3) 抽样框的准确性:抽样框是指包含总体的框架,若抽样框不准确,则会增加抽样误差。

2. 非抽样误差的定义和影响因素非抽样误差指的是除抽样误差以外的其他误差来源,主要包括调查设计、数据采集过程中的操作和测量等误差。

非抽样误差的大小直接影响着最终统计结果的准确性,以下是一些常见的非抽样误差来源:(1) 调查设计偏差:调查设计的不完善或缺陷会引入误差。

(2) 非回应误差:调查对象拒绝参与或无法联系到的情况。

(3) 数据处理误差:包括数据录入、清洗和分析过程中的误差。

3. 抽样误差和非抽样误差的测量方法对于抽样误差,一种常用的测量方法是计算标准误差。

标准误差是样本观测值与总体参数估计值之间的差异度量,可以用来评估样本数据的准确性和稳定性。

同时,还可以利用置信区间来估计总体参数的范围和可信度。

对于非抽样误差,常用的测量方法是检查数据质量和进行误差分析。

数据质量的检查包括对数据的完整性、准确性和一致性等方面进行评估,并采取纠正措施。

误差分析可以通过对调查过程的审查和再次检测等方式,发现和纠正非抽样误差。

4. 减少抽样误差和非抽样误差的策略在实际研究和调查中,减少抽样误差和非抽样误差是提高数据分析效果和可信度的关键。

非抽样误差产生的原因及控制.

非抽样误差产生的原因及控制.

非抽样误差产生的原因及控制抽样调查是目前我国搜集统计资料的一种主要方法,但抽样调查的结果始终要受到抽样误差和非抽样误差的影响。

抽样误差是由于样本随机性引起的,根据样本数据计算的对总体目标量的估计是随样本而异的,由此产生的误差即是抽样误差。

抽样误差是不可避免的,其大小可以通过调查样本容量,改变抽样方式等加以控制。

非抽样误差是指除抽样误差以外。

由于各种原因引起的。

非抽样误差由于其产生的原因及其复杂且具有不易观测和非随机性等特点而难以控制。

两种误差构成了总方差,两者之间呈此消彼长的关系。

一般情况下同时减少两类误差是很困难的。

非抽样误差占据了很大的一部分,怎样通过降低非抽样误差,从而降低总方差,有着非常重要的现实意义。

一、非抽样误差分类自1902年K?皮尔逊首次讨论非抽样误差这个概念以来,在非抽样误差的分类上。

主要有以下几种:(一)希里1957年把非抽样误差分为3类:1、范围误差:指由于样本单位的遗漏或重复产生的误差。

2、确定误差:指在资料收集、编辑、编码和计算输入阶段所产生的样本单位特征值的测量误差和回答偏差。

3、替代误差:由于对缺失数据进行替代和(或)在最后估计阶段对缺失数据进行替代所产生的误差。

(二)科克伦把非抽样误差分为3类:1、对被抽选出的样本中的一些单位未能进行计量而产生的误差。

2、一个单位的计量误差。

3、对调查结果进行编辑、编码和汇总过程中产生的误差。

(三)戴伦纽斯1988年把非抽样误差按调查活动分为3类:1、资料搜集过程中产生的误差。

2、测量过程中产生的误差。

3、资料加工过程中产生的误差。

在我国比较常见的分类方式有两种:第一,按性质和处理方法不同分为抽样框误差、无回答误差和计量误差。

第二,按产生的环节不同分为设计误差、调查误差和汇总误差。

二、各类非抽样误差产生的原因1、调查设计过程中引起的误差设计阶段误差是由于这一阶段某些失误而导致调查结果产生的偏误,调查设计有两个主要环节,即调查设计和抽样设计。

第11章调查中的非抽样误差

第11章调查中的非抽样误差
(四)插补调整
是指在数据整理阶段利用调查结果,采用一定的方式 为无回答的缺失值确定一个合理的估计值,插补到 原缺失数据的位置上。
实际中一般涌均值插补。
补充:敏感性问题调查与随机化回答技术
1、敏感性问题(sensitive question)是指所调查的 内容涉及私人机密而不愿意或不便于公开表态或 陈述的问题,如:社会上的卖淫嫖娼、赌博吸毒、 偷税漏税、婚前性行为等等。
(3)相对偏倚为:
W0(Y1 Y0) W0(1 r)
Y
rW0 (1W0)
分析
1、r=1,丢失单元均值和抽样单元均值相同 时,估计量是目标变量的无偏估计;
2、 r 1 偏倚状况随着r的变化而变化。
r>1估计偏低,r<1估计偏高。
三、不完善抽样框的使用
(一)实行连接
在调查方案设计阶段制定一定的规则,使没有包 含在抽样框中的目标单元与包含在抽样框中的 单元相连接。
二、无回答产生的原因及影响
在数据收集过程中都可能产生无回答误差: 1、查找阶段由于地址不详或已经搬迁而无法找到被
调查者,调查者不熟悉地址等等; 2、接触阶段被调查者由于客观原因无法接受调查或
由于主观原因不愿意接受调查; 3、采访阶段,被调查者对于某些问题不愿意提供答
案或调查人员粗心遗漏一些项目或调查中断等等。
如:对不在抽样框中的学生与被抽中的学生实行 连接
(二)惟一连接 对于抽样框中存在的复合连接,在方案设计中规
定只有唯一的单元被抽中。
(三)使用多个抽样框
设样本来自A、B两个抽样框,两个抽样框的单元总 数分别为NA,NB,目标总体被分成三个部分:区域a、 区域b、区域ab
1、利用抽样框A的样本对区域a、区域ab进行事后分 层的总和估计为:

论抽样调查中非抽样误差及其控制1

论抽样调查中非抽样误差及其控制1

论抽样调查中非抽样误差及其控制论抽样调查中非抽样误差及其控制2009-08-24 19:31[摘要] 在抽样调查中,非抽样误差产生的原因十分复杂,且种类繁多,其对整个抽样调查的影响是不容忽视的。

本文对各种非抽样误差产生的原因进行了全面、深入的分析,并提出了防范非抽样误差的具体措施。

[关键字] 抽样调查;非抽样误差;抽样误差;控制措施[中途分类号] F222.1 [文献标识码] A [文章编号] 1008—9306(2001)05—0056—03抽样调查是目前我国收集统计资料的一种主要方法,但抽样调查的结果始终要受到抽样误差和非抽样误差的影响。

其中抽样误差是不可避免的,它是由样本的结构与总体结构的随机差异导致产生的,其大小可以通过调整样本容量、改变抽样方式等加以控制;非抽样误差由于其产生的原因复杂而且又不易预测和非随机性等特点而难以控制,成为影响抽样调查结果准确性的重要原因。

因此,如何控制和减少抽样调查中的非抽样误差,确保抽样调查资料的质量,是我国统计界普遍关注的一个问题。

非抽样调查误差的产生及分解非抽样误差产生的原因很多,从抽样设计,调查问卷的制定,调查人员的素质,到调查数据的处理,每一个环节都可能出现误差。

根据非抽样误差产生的方式和出现的阶段不同,可以将非抽样误差分解为以下几类:非抽样误差按其产生的方式不同,可以分为登记性误差和系统性误差登记性误差是指在调查过程中,由于工作出现失误而造成的误差。

产生登记性误差的主要原因可以归纳为两类:一类是由于计量手段的局限性所带来的难以绝对符合实际而出现的误差;另一类是由于登录、计算、抄报、汇总错误及被调查者所报不实或调查者有意虚报满报等所带来的误差。

系统性误差,是指在抽取样本单位时,由于加入主观意愿,破坏了随机抽样原则使样本不足以代表总体而造成的误差。

非抽样误差按其产生的环节不同,可以分为设计误差、调查误差和汇总误差设计误差是指在抽样设计阶段产生的误差。

产生设计误差的主要原因是由于采用了有缺陷的抽样框或者是调查问卷设计不科学所造成的。

商业调查中非抽样误差来源及控制研究

商业调查中非抽样误差来源及控制研究

因素,不可以通 过增大样本量来控制 ,它可 以避免。非抽样误 差 委会的比例严重扩大 ,这必 然引起最终 收视率数据的偏差。 包括 :抽样框误差 ;无 回答误 差 计量误 差。
() 3 抽样框老化。 统计数据调查具有很强的时效性 随着时间
市 场 灞 研
商业调查 中非抽样 误差来源及控 制研 究
I I I王爱珍
[ 摘
山东泰 安高 新区 经济发 展局 时

泰 山医学 院管 理学 院
要]商业调查大部 分都是抽 样调 查,调查过程中天然存 在的抽样误 差和调查执 行 中的非抽 样误差是影响数据质 量
的 两 大误 差 类 型 。 确 定 合 理 的抽 样 方 案后 ,调 查数 据 质 量控 制 的重 点 就放 在 了减 少 非抽 样 误 差 上 。 本 文 即 针对 抽 样 调 查 两
般 来 说 .抽 样 框 误 差 有 以 下 几 种 类 型 :
() 1 不能覆盖 目标 总体单位 。 不能覆盖 目标 总体单位 , 目标 指
被抽 中的概率为零 .数据丢失 。例如 :在某城市 的抽样方案 .目
标 总体 同 上 。 由于 该 城 市 进 行 行政 区划 的改 变 .原来 的 四个 城 区
大误 差 类 型 展 开 分析 讨 论 ,重 点 分析 非 抽 样 误 差 来 源 , 并 发掘 其 有 效控 制 的 可 行 性 方 法 。 [ 词 】商 业 调 查 非 抽 样 误 差 质 量控 制 关键

引子
实际情况之 间的差异 ,决定 了我们在 控制 非抽样误差上的努力永
在商业调 查的质量管理实践 中.通过组织专家评审会的方式 不断完善 抽样方案 尽可能地减少抽样误差。其抽样方案经过 专

抽样调查答案

抽样调查答案

抽样调查答案本页仅作为文档封面,使用时可以删除This document is for reference only-rar21year.March抽样技术第1、2章试题一、单选题1.非概率抽样的优点(D)A.能计算抽样误差B.能从概率的意义上控制误差C.样本数据能对总体情况进行推断D.操作简单,不需要抽样框,经济、快速,调查数据的处理也容易2.概率抽样与非概率抽样的根本区别是(B)A、是否能保证总体中每个单位都有完全相同的概率被抽中B、是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中C、是否能减少调查误差D、是否能计算和控制抽样误差3.以下哪种抽样不属于非概率抽样(C)A、判断抽样B、方便抽样C、不等概率抽样D、配额抽样3.抽样调查的根本功能是(C)A、获取样本资料B.、计算样本资料C、推断总体数量特征D、节约费用4.下列不属于概率抽样的是(B)A、不等概率抽样B、滚雪球抽样C、系统抽样D、整群抽样5.下列抽样框中不属于名录框的是(A)A、时间B、学生名单C、公司名录册D、电话号码簿6.用样本统计量对总体参数进行估计时产生的误差是(C)A、总体方差B、样本方差C、估计量方差D、偏倚7.以下抽样方法不属于非概率抽样的是(C)A、目的抽样B、随意抽样C、随机抽样D、判断抽样8.下列说法错误的是(C)A、对于无偏估计量,均方误差等于方差B、抽样误差是抽样方法本身所引起的误差,是由于样本不能完全代替总体而导致的误差C、抽样方差是依据样本方差计算,而方差估计量是依据总体方差计算D、抽样标准误差是抽样方差的平方根9.下列关于非概率抽样和概率抽样说法正确的是(A)A、非概率抽样的一个重要应用是充当预调查角色,作为开发概率抽样的厨师步骤。

B、概率抽样是指按照一定的概率以随机原则抽取样本,也称为等概率抽样。

C、随机与随便的本质区别就在于,是否按照给定的抽样概率,通过一定的随机化程序抽取样本单元。

D、非概率抽样的偏倚较小,有利于评价样本的代表性。

统计学中的抽样调查方法及误差分析

统计学中的抽样调查方法及误差分析

统计学中的抽样调查方法及误差分析随着社会的发展,数据的重要性日益凸显,统计学的应用也变得越来越广泛。

而抽样调查作为采集数据的一种方法得到了广泛的应用。

本文将重点介绍抽样调查方法和误差分析。

一、抽样调查方法抽样调查是指在总体中选择部分个体进行观察和分析,以推断总体的情况的方法。

抽样调查在社会调查、政策制定、市场调研等领域得到了广泛应用。

下面将介绍几种常见的抽样调查方法。

1.简单随机抽样简单随机抽样是以等概率的方法从总体中随机选择一定数量的样本。

简单随机抽样的好处是样本的代表性好,容易进行统计分析。

缺点是劳动力成本高,在实践中较难完全避免抽样偏差。

2.分层抽样分层抽样是在将总体划分为几层之后,按各层人口比例抽取样本。

分层抽样的好处在于可以对总体进行有针对性的抽样,更能体现各层的特点。

但是分层抽样需要对总体进行划分,且划分要准确避免误差。

3.整群抽样整群抽样是在将总体划分为若干群组之后,从群组中随机抽取若干样本。

整群抽样的好处在于可以减少抽样误差,但是需要群组之间差异较小才能有效。

二、误差分析无论采取何种调查方法,都难免出现误差。

下面将介绍抽样调查误差和误差的来源。

1.抽样误差抽样误差是指由于抽样过程不完全随机、样本数量、样本选取不正确等造成的误差。

抽样误差分为偏差和方差两类。

(1)偏差偏差是指样本的特征与总体真实特征相差的程度。

常见的偏差有选择偏差、非响应偏差、采访偏差等。

选择偏差是指由于样本选取不恰当、样本大小不合适等原因引起的偏差。

非响应偏差是指样本中部分受访者不愿回答、不方便回答引起的偏差。

采访偏差是指由于采访员的态度、行为等因素引起的偏差。

(2)方差方差是指样本与样本平均数之间的差异,主要受样本大小影响。

2.非抽样误差非抽样误差是指调查设计、调查方法等引起的误差。

常见的非抽样误差包括测量误差、处理误差、调查方法误差等。

(1)测量误差测量误差是指采用的测量方法引起的误差,如仪器精度、人为失误等。

第十一章 抽样

第十一章    抽样

总体参数和样本统计量

总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。 样本统计量:根据样本分布计算的指标。是随机变量。
总体
样本

参数

统计量 平均数 标准差、方差
X
、2
p
S、 S2
( x x )2 s2 n 1 ( x x )2 f s2 f 1
小故事:一次失败的二战士兵调查



二战期间,美国军方委托社会学家对军队士兵进行一项抽样调查。 在进行抽样之前,研究者对军方提供的总体名单未作认真考察, 他们在不知道该单位名册是按照十个士兵组成的一个班内的军队 军衔级别进行排序的(如上士、中士和下士)的情况下,就确定 将名单混在一起作为抽样框。 具体调查过程中,研究者按照等距抽样的规则计算出抽样间距是 10,于是在每十个士兵选择出一个作为样本,这个抽样间距正好 与班内的军衔级别重合,结果导致样本中的士兵全部是上士,中 士和下士一个都没有。 显然,这个抽样没有实现具有代表性的样本,而是一个上士士兵 调查的样本,最后的调查结果不是说明所有士兵的情况,最多只 能说明军衔是上士的那些士兵的情况。调查宣告失败。
63 32 79 72 43 93
74 50 07 45 51 25
71 37 78 93 09 23
47 71 44 09 03 93
62 32 53 15 90 78
67 75 38 62 74 47

要从94家上市公司中抽取12家作为调查样本,可 先将94空公司由1至94编号N=94,然后在乱数表上 任意上一点一行(或一列)中一个数字作为起点 数,从这个数字按上下或左右顺序读起,每出现 两个数字,即为被抽中的单位码号。假定本例是 从第四行左边第五个数字向右顺序读起,则所抽 取单位是:68 27 31 05 03 72 93 15 55 59 56 35 ,此过程中的96因大于94,舍 去不用是因为在顺序抽取的过程中,遇到比编号 大的数字,应该舍去。

抽样调查误差中非抽样误差分析

抽样调查误差中非抽样误差分析
又 难 以 控 制 。比 如 即 使 采 用 全 面 调 查 , 有 抽 样 误 差 , 非 抽 没 而
样 误 差 足 够 大 时 ,也 会 使 全 部 的 调 查 结 果 被 歪 曲 ,因 而 在 大 样 本 的 抽 样 调 查 中 , 抽 样 误 差 成 为 影 响 调 查 结 果 可 靠 程 度 非
维普资讯
工 作 研 究
【 章 编 号 】0 一5 8 (0 2 0 文 1W 9 8 2 0 )8—0 2 O 0 1一 1
山 西统 计 2 0 第 8 02年 期
抽 样 调查 中的误差 分 为抽 样误差 和 非抽样 误差 , 性质 其
有 所 不 同 。 样 误 差 是 一 种 随 机 误 差 , 有 系 统 性 的偏 差 , 抽 没 误
的主要 问题 。
引 起 非 抽 样 误 差 的 原 因 很 多 , 抽 样 设 计 ,调 查 问 卷 的 从 制 定 , 查 人 员 的 素 质 , 至 数 据 的 处 理 , 一 个 环 节 都 可 能 调 直 每
些 敏 感 性 问 题 ,如 涉 及 被 调
出现 误 差 , 围非 常广 , 范 尤其 是 当被调 查者 是人时 , 与心理 它
作 疏 忽 所 产 生 的错 误 和 漏 报 , 没 有 按 规 定 对 现 场 的 实 物 进 行 观 察 ,只听信 被调查 对 象的 口 头 回 答 等 等 。( ) 意 舞 弊 。 2故 主 要 表 现 为 调 查 员 根 本 没 有 按 规 定 进 行 调 查 ,而 是 擅 自编 造 和 篡 改 调 查 资 料 ,以 达 到 自 己 省
理 较 强 , 调 查 问 题 总 是 回答 “ ” 有 的 态 度 淡 漠 , 调 查 问 对 否 , 对 题 的 回 答 是 “ 所 谓 ” “ 可 以 ” 由个 人 态 度 引 起 误 差 。 无 、还 等 3 、实 施 调 查 主 管 工 作 失 职 造 成 的 误 差 ,它 主 要 表 现 在 :
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十一章 调查中的非抽样误差
§11.1 引言
非抽样误差是指除抽样误差以外的,由于 各种原因引起的误差。
在概率抽样、非概率抽样、其他全面调 查和非全面调查已及普查中,非抽样误差都 有可能存在。
同抽样误差相比,非抽样误差有如下特点:
1、非抽样误差不是由于抽样的随机性带来的,所以在 抽样调查中,它不可能随着样本量的增大而减小;
从无回答的内容来看可分为:
单元无回答 (被调查单元没有参入或拒绝受调查,他 们交的是一份白卷) 项目无回答
(被调查单元虽然接受了调查,但对其 中的一些项目没有回答)
从无回答的性质来看可分为:
有意无回答 (有意无回答常常与调查内容有关,如对调 查内容反感,或涉及个人隐私不愿意回答)
无意无回答 (无意无回答常常与调查内容无关,之所以 无回答是因为被调查者生病或很忙,无法接 受调查)
●抽样框存在的问题,有些是不容易解决的。 因此抽样框的维护、抽样框使用情况的不断 总结与研讨,对于经常性的调查项目来说是 十分必要的。
●抽样框的不完善并不是不能使用。可以进 行修补、调整。
N1
(3)抽样框误差的影响
设目标总体单元:N
抽样框中单元:N1 抽样框中丢失的单元:N0
N=N1+N0 ■ 总体总量的估计 总体总量的真值是:
二、ቤተ መጻሕፍቲ ባይዱ样框误差的类型及影响 (1) 抽样框误差的类型
● 丢失目标总体单元。 ● 包含非目标总体单元。 ● 抽样框中的单元与目标总体单元不一一对
应。(存在一对多或多对一的情况) ●不正确的辅助信息。(如分层抽样、不等 概抽样、比率估计和回归估计等所需的辅助 信息)
(2)对抽样框误差的基本认识
●有些误差来自构成抽样框资料本身,而不 是由于抽样设计的问题。
1、查找阶段 调查人员无法找到被调查者, 主要原因有地址不详、被调查者搬迁、调查人 员不熟悉地址; 2、接触阶段 被调查生病、对调查不感兴趣 或别的原因拒访; 3、采访阶段 调查开始后被调查者对某些问题 不愿提供答案、调查员由于粗心遗漏某些项目等
无回答的影响:
回答层(N1) 总体(N)
无回答层(N0)
●利用核查,掌握误差情况,对不完善抽样框 进行调整;
●事先制定一些规则,对发现的抽样框问题进 行现场处理;
●使用多个抽样框进行抽样。
§11.3 无回答误差
一、概念
无回答误差是指在调查中由于各种原因, 调查人员没能够从入选样本的单元处获得所 需要的信息,由于数据缺失造成估计量的偏 差。
无回答误差是一种重要的非抽样误差,这 种现象十分普遍,对估计量的危害也比较大, 所以国际上对这方面的讨论一直比较热烈, 目前这种讨论还在继续。
N1
N1
N0
Y Yi Yi Y1 Y0
i 1
i 1
现从抽样框中的N1个单元中采用简单随机 抽样抽出容量为n的一个样本,由于n取自于N1 对总体总量的估计为:
Y
N1 n
n i 1
yi
显然此时的估计是有偏的,偏倚为:
E(Y ) Y Y1 Y Y0
这表明估计量低估了总体总量,令
r
Y0 Y1
2、在抽样调查中,由于非抽样误差的影响,往往造成 估计量的有偏;
3、有些非抽样误差难以识别和测定。如抽样框是不完 善的,而调查设计人员并没有意识到;
4、有些非抽样误差成因复杂,对其研究不够,因此, 在很多时候非抽样误差比抽样误差造成的影响更严重, 对此必须引起高度重视。
根据非抽样误差的来源、性质 可分为以下三类:
R0
相对偏倚
( y1 )
R0 (Y 1 Y Y
0)
由上式可以看出:无回答偏倚主要来自两
个方面:一个是回答层与无回答层之间的数量
差异 (Y 1 Y 0 ) ;一个是无回答率 R0 。
三、降低无回答的措施
主要措施是预防,预防措施有: ●问卷设计得具有吸引力; ●注意适当的长度; ●充分利用调查组织单位的权威性和影响力; ●注意调查员的挑选; ●做好调查员的培训; ●注意调查过程的监控; ●奖励措施; ●再次调查。
(1)抽样框误差,即由不完善的抽样框引起的
误差; (2)无回答误差,即由于种种原因没有从被调 查单元获得调查结果,造成调查数据的缺失; (3)计量误差,即所获得的调查数据与其真值 之间不一致造成的误差。
§11.2 抽样框误差
一、概念
抽样调查中的总体有两个: 目标总体—调查研究对象的全体。 抽样总体—从中抽取样本的总体。 (即抽样框) 理想抽样框的标志是目标总体和抽样总 体完全重合。否则抽样框就是不完善的。
N N1 N0
R1
N1 N
, R0
N0 N
则总体均值为: Y R1Y 1 R0 Y 0
回答层样本(n1 ) 总体样本(n)
无回答层样本(n0 )
根据回答层单元计算出的样本均值为 y1
用 y1作为总体真值 Y 得估计量,其偏倚
为:
偏倚( y1) E( y1) Y Y 1 (R1Y 1 R0Y 0 ) R0 (Y 1 Y 0 )
有意无回答对数据质量的影响很大,回答 者和不回答者之间往往存在系统性差异。这 种不回答不仅减少了有效样本量,造成估计 量方差增大,而且会带来估计偏倚。
无意无回答可以看成是随机的,这种不回 答虽然会造成估计量方差增大,但通常认为 不会带来估计偏倚。
二、无回答产生的原因及影响
如果把采集数据的过程划分为查找、接触和采 访三个阶段,三个阶段都有可能出现无回答。
W0 (Y1 Y0 ) W0 (1 r)
Y
rW0 (1 W0 )
由上式可以看出,如果丢失单元的均值与
抽样单元的均值相同,即
r
1
,则估计量
Y
是目标变量 Y 的无偏估计。
r 反之,如果 r 1 ,偏倚状况则随着
的变化而变化。
Y
三、不完善抽样框的使用
抽样框不完善并不是不能使用,因为构造一个完 善的抽样框有时是非常困难的。使用不完善抽样框时 若能采用一些补救措施,有助于减小抽样框误差。主 要采用以下三项补救措施:
,W0
N0 N
Y的相对偏倚可以写为
Y0
W0 r
Y
rW0 (1 W0 )
r
由上式可知,总体总和的相对偏倚取决于
r 和 W0
■ 总体均值的估计
在抽样框存在丢失单元情况下,均值估计量为:
r
Y
Y
1 n
n i 1
yi
此时估计量的偏倚为:E(Y ) Y W0 (Y 1 Y 0 )
Y 的相对偏倚可以写为:
相关文档
最新文档