抽样调查的基本概念和基本过程
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样误差(sampling error) 抽样误差
样本统计值与所要推论的总体参数值之间的均 差值就称为抽样误差。这是由抽样本身产生的 误差,它反映的是样本对总体的表性程度,故 又称代表性误差。我们在下面将结合样本数的 确定再做具体讨论。
置信水平与置信区间(confidence 1evel 置信水平与置信区间 and interval)
总体的划分有时比较容易,如要估计一批灯泡 的寿命,总体就是这批待检验的灯泡,似乎没 有什么问题。但有时候却并不容易,如要在全 国的电视观众中进行对电视节目意见的调查, 就必须对电视观众下一个定义,一些难以划分 的情况就会发生,这需要根据研究的目的和进 行调查的可能来划分。
总体根据总体单位的数目可以分为有限总体和 无限总体两类。有限总体是指总体单位数是有 限的,在理论上是可以进行全面调查的,但由 于上述种种原因而往往采用抽样调查方法,社 会经济调查中多数是这种情况。无限总体是指 总体单位数是无限的,例如在自然科学中的试 验,它可以无限次地进行下去,因此也只能是 通过抽样来取得数据。
抽样类型: 根据概率论原理常用的抽样形式主要分为随机 抽样和非随机抽样两大类。二者的区别在于: 前者按照随机原则来抽取样本,而后者不按随 机原则抽取样本。
(一)随机抽样 随机抽样又称概率抽样,是指严格按照随机原则来抽 取样本,要求总体中每个单位都有被抽取的同等机会。 由随机抽样所抽取的样本称为随机样本,这类样本具 有较高的代表性。随机抽样法又分为下列五种不同的 抽样方法: 1、简单随机抽样 2、等距随机抽样 3、分层随机抽样 4、整群随机抽样 5、分段随机抽样
思考题
2. 什么是抽样误差,影响抽样误差大小的因素主要有哪些? 抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以 代表总体各单位的结构,而引起抽样指标和总体参数之间的绝对 离差 (1)总体各单位标志值的差异程度。差异程度愈大则抽样误差也愈 大,反之则小。 (2)样本的单位数。在其他条件相同的情况下,样本的单位数愈多, 则抽样误差愈小。(3)抽样方法。抽样方法不同,抽样误差也 不同。一般地说重复抽样的抽样误差比不重复抽样的抽样误差要 大些。(4)抽样调查的组织形式。不同的抽样组织形式就有不 同的抽样误差。而且同一种组织形式的合理程度也影响抽样误差。
抽样框(sampling frame) 抽样框
抽样框又称做抽样范围,它指的是抽样过程中 所使用的所有抽样单位的名单。比如,从一所 中学的全体学生中,直接抽取200名学生作为 样本。那么,这所中学全体学生的名单就是这 次抽样的抽样框;如果是从这所中学的所有班 级中抽取部分班级的学生作为调查的样本,那 么,此时的抽样框就不再是全校学生的名单, 而是全校所有班级的名单了。
(二)非随机抽样 在实际的调查过程中,还有一类抽样方法, 称之为非随机抽样,即它不是严格按照随机原 则抽取样本,而是根据调查者的主观经验和主 观判断选择样本的。
与随机抽样相比,虽然这类非随机动抽样的代表性差,提供的资 料信息较零散,难以从样本调查的结论中对总体做出准确的推断。 但是,由于它非常简便易行,并能通过对样本的调查而大致了解 总体的某些情况,对调查研究工作很有启发性。因此,它适用于 那种调查对象的总体难以具体界定,以及不需要准确推断总体情 况的调查。常用非随机抽样的方法主要有以下几种: 1、偶遇抽样 2、立意抽样 3、配额抽样 4、滚雪球抽样
抽样
抽样就是从研究总体中选取一部分代表性样本的方法。 抽样 例如我们要研究某城市居民的生活方式问题,那么整 个城市居民都是我们的研究对象。但限于研究条件等 原因,我们难以对每一个居民进行调查研究,而只能 采用一定的方法选取其中的部分居民作为调查研究的 对象,这种选择调查研究对象的过程就是抽样。采用 抽样法进行的调查就称为抽样调查。抽样调查是最常 用的调查研究方法之一,它已被广泛应用到社会调查、 市场调查和舆论调查等多个领域。
抽样对调查研究来说至关重要。社会科学研究的对象 通常是非常复杂的,涉及到社会生活的方方面面,既 包括个体行动者,也包括群体甚至整个社区或社会。 但在大多数情况下,我们难以对全部的对象做研究, 而只能研究其中的一部分。对这部分研究对象的选择 就要依靠抽样来完成,如此可以节省研究的成本和时 间。但我们的研究又不是停留在所选取的样本本身, 而是通过对有代表性的样本的分析来研究总体。故抽 样的目的,就是从研究对象总体中抽选一部分作为代 表进行调查分析,并根据这一部分样本去推论总体情 况。
总体的特征: ①同质性。构成总体的各个单位必须具有某一 方面的共性,这个共性是我们确定总体范围的 标准 ②大量性。总体是由许多单位所组成的,而不 是只有个别单位。 ③差异性。总体单位之间,除了必须在某一方 面有共性之外,在其他方面必然存在差异。
样本(sample) 样本
抽样调查时从总体中抽取的那部分单位所组成 的集合体,就称作样本,样本是总体的一个缩 影。 抽样调查是从样本中获取信息来对总体的有关 特征作出估计。由于抽样方式不同,抽样单位 可以是总体单位,也可以不是总体单位。样本 中包括的单位数称作样本容量,但当抽样单位 和总体单位不一致时样本容量是指抽样单位数 还是总体单位数应加以说明。
思考题
1、抽样调查、重点调查和典型调查有哪些相同点和不同点? 区别:(1)选取调查单位的方式不同。抽样调查是按照随机原则从总体中抽取部分调查单位进 行观察用以推断总体数量特征的一种调查方式;重点调查是在所要调查的现象总体的全部单 位中选择部分重点单位进行调查,要求选取的重点单位的某一主要标志的标志总量在总体标 志总量中占有很大比重;典型调查是根据调查的目的任务,在对所研究的现象总体进行初步 分析的基础上,有意识的选取若干具有代表性的单位进行调查和研究,借以认识事物发展变 化的规律。根据三者的定义可以看出抽样调查序曲调查单位是按照随机原则而重点调查和典 型调查不是按照随机原则,而重点调查和典型调查在选取调查单位上前者着重于数量特征, 所选单位是在所要调查的数量特征上占较大比重的单位,而典型调查主要是定性的,着眼点 在代表性上。 (2)调查目的的不同。重点调查的目的是通过对重点单位的调查,掌握总体的基本情况;抽样 调查的目的则是通过对部分单位的调查结果来推算总体的数量特征;作为统计意义的典型调 查,其目的类似于抽样调查。 (3)推算总体指法标的准确性和可靠程度不同。抽样调查和典型调查都要以部分单位调查的结 果推算总体指法标,由于二者调查单位选择的方法不同,其推算结果的准确性、可靠性也不 同。抽样调查按随机原则抽选调查单位,因而在给定概率和误差范围条件下,可保证推断的 准确性和可靠性;而典型调查单位的选择完全由人们有意识的选择,因而难以保证推断结果 的准确性和可靠性,推断误差既无法计算也不能控制. 相同点:(1)三者都是非全面调查,都是选取总体中的一部分单位进行观察和研究; (2)都是专门组织的一次性调查。
抽样单位(sampling unit) 抽样单位
抽样单位是指收集信息的基本单位和进行分析 的元素。在社会科学研究中,常用的抽样单位 是个体的人,它也可以是一定类型的群体或组 织,如家庭、公司、居委会、社区等。抽样单 位与抽样元素有时是一致的,有时是不一致的。 如在简单抽样中,它们是一致的,但在整群或 多阶段抽样中,抽样单位是群体,而每个群体 单位中又包含许多抽样元素。
置信水平和置信区间是与抽样误差密切相关的 两个概念。置信水平,又称置信度,是指总体 参数值落在某一区间内的概率。 而置信区间是指在某一置信水平下,用样本统 计值推论总体参数值的范围。其大小与误差密 切相关,置信区间越大,误差也越大。
在置信水平固定的情况下,样本量越多,置信区间越窄。 举例说明: 美国Gallup(盖洛普)公司就消费者对美国产品质量的看法,对 美国、德国和日本三国共计3,500名消费者(每个国家约1,200名) 分别进行了调查,调查结果:有55%的美国人认为美国产品质量 好,而只有26%的德国人和17%的日本人持同样看法。抽样误差 为±3%,置信水平为95%。则这三个国家消费者的置信区间分 别为: 置信区间 美国 55%±3%=52%-58% 德国 26%±3%=23%-29% 日本 17%±3%=14%-20%
பைடு நூலகம்
抽样调查的基本过程
五个步骤:
确定 调查 总体
确 定 抽 样 框
选择 抽样 技术
确定 样本 容量
执行 抽样 过程
抽样调查的基本过程
抽样设计的五个步骤
1) 定义目标总体(如上述案例中正在上学的年龄在8-17
岁的年轻人) 2) 确定抽样框架(例如上述案例中的所有县及县内的城市和城 镇) 3) 选择一种抽样技术(如上述案例中的三阶段分层概率 抽样) 4) 确定样本量(1000名) 5) 执行抽样过程(步骤1、2、3和对调查员的指令)
思考题
3.抽样调查中是否一定存在抽样误差,能否控制? 抽样调查中是否一定存在抽样误差,能否控制? 抽样调查中是否一定存在抽样误差 抽样误差是客观存在和不可避免的, 抽样误差是客观存在和不可避免的,但误差的大 小是可以控制的。 小是可以控制的。 可通过选定不同的抽样方法及样本数目来控制误 差; 或加强对抽样调查的组织领导, 或加强对抽样调查的组织领导,也可提高抽样调 查的工作质量。 查的工作质量。
抽样调查的基本过程
案例:民意调查 该调查由全国范围内1000名在校的年龄在8-17岁的年轻人组 成。该样本代表了所有8-17岁正在上学的人口总体。研究内容包括 他们的愿望和烦恼,他们的家庭和学校,以及他们对涉及范围很广 的各种论题的观点。 调查中采用了一个三阶段分层概率抽样技术来选择访谈地点。 第一阶段:将国内所有县根据每个地理区域内的人口规模进行 分层后,按照大体人口比例随机定出100个县。 第二阶段:按照大体人口比例随机抽出样本县内的城市和城镇 第三阶段:在城市或城镇内可以利用普查小区统计资料的地 方,根据大体人口比例随机选择普查小区;在没有 统计资料的地方,随机抽出农村的路段。 在每个人口普查小区或农村路段内都要给访谈人员指定地点。
思考题
4.概率抽样的特点有哪些?
① ② ③
抽样本时遵循随机原则; 抽样本时遵循随机原则; 由样本从数量上去认识总体; 由样本从数量上去认识总体; 抽样估计的准确度和可靠程度可以测定 并控制。 并控制。
思考题
在置信水平固定的情况下,样本量越多,置信区间越窄。 在置信水平固定的情况下,样本量越多,置信区间越窄。 固定的情况下 举例说明: 举例说明: 美国Gallup(盖洛普)公司就消费者对美国产品质量的看法, 美国 (盖洛普)公司就消费者对美国产品质量的看法, 对美国、德国和日本三国共计3,500名消费者(每个国家约 名消费者( 对美国、德国和日本三国共计 名消费者 每个国家约1,200 分别进行了调查,调查结果 调查结果: 名)分别进行了调查 调查结果:有55%的美国人认为美国产品 的美国人认为美国产品 质量好,而只有 而只有26%的德国人和 的德国人和17%的日本人持同样看法。抽样 的日本人持同样看法。 质量好 而只有 的德国人和 的日本人持同样看法 误差为± %,置信水平为95%。 %,置信水平为 %。则这三个国家消费者的置信区 误差为±3%,置信水平为 %。则这三个国家消费者的置信区 间分别为: 间分别为: 置信区间 美国 55%±3%= %-58% ± %=52%- % %= %- 德国 26%±3%= %-29% ± %=23%- % %= %- 日本 17%±3%= %-20% ± %=14%- % %= %-
抽样调查的基本概念和基本过程
小组成员: 丁巍巍 王自力 史媛媛 田亚龙
总体(population) 总体
总体是指统计研究对象的全体,它是由许多元 素(通常叫总体单位)所构成的。 总体的特点是各个总体单位都有某种相同的性 质把它们联系在一起,但是各个个体的某个标 志之间却又存在着差异,这种统一和差异就构 成了一个总体分布。抽样调查的目的往往是对 总体分布的一些特征作出估计。因此在进行一 项抽样调查时首先遇到的是确定总体的问题。