抽样方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5. 修正的概率抽样
修正的概率抽样是概率抽样与非概 率抽样的结合。主要用于多阶段抽 样,前几个阶段用概率抽样,最后 用非概率抽样,一般是配额抽样。
实用文档
21
二、概率抽样
在需要根据样本的结果对总体进行推断时 应使用概率抽样。
最简单的概率抽样设计是等概率抽样,包 括简单随机抽样和系统抽样。
不等概率抽样比较复杂且大多需要辅助抽 样框信息。不等概率抽样有:概率与大小 成比例的抽样,整群抽样,分层抽样,多 阶段抽样和多相抽样。不等概率抽样通常 用来提高抽样设计方案的效率,或降低抽 样费用。
简单随机抽样的缺点是:
抽样框中即使有现成的辅助信息也不 加利用,使得估计的统计效率较其他 利用辅助信息的样本设计低;
由于样本在总体中的地理分布范围比 较广,如果采用面访,费用较高;有 可能抽到一个“差的”样本;
如果不用计算机,而用随机数表抽一 个大样本将十分单调劳神。
实用文档
31
系统抽样(SYS)
能计算出各个单元的入样概率。从而
无法得到总体目标量的可靠估计值及
其抽样误差估计值。
实用文档
4
非概率抽样能用在下面几个方面的研 究中:
用来形成一种想法; 作为设计开发概率抽样调查的初始步骤; 在后续步骤中帮助理解概率抽样调查结
果。 有时,非概率抽样是唯一可行的选择。
例如,在医学实验中,采用志愿者抽样 可能是取得数据的唯一途径。
其抽样单元是从总体中等距抽出的。 它需要一个抽样间距和一个随机起点。
抽样间距是k=N/n,随机起点r是介 于1到k之间的一个随机数。 被抽中的单元是:r,r十k,r+2k, r+3k,…,r+(n-1)k。
实用文档
32
系统样本(图示)
实用文档
33
在系统抽样中,样本单元是从总体 中按一定的(抽样)间距抽出的。
实用文档
5
非概率抽样常被用于抽选参加焦点 座谈和深入访问的个人。
另一个能较好发挥非概率抽样作用 的例子是预研究。
实用文档
6
非概率抽样的优点是:
快速简便; 费用相对较低; 不需要抽样框; 对探索性研究和调查的设计开发很有用。
实用文档
7
非概率抽样的缺点是:
为了对总体进行推断,需要对样本的 代表性做很强的假定。
实用文档
2
一、非概率抽样
非概率抽样是用主观的(非随机 的)方法从总体中抽选单元,是一种 快速、简易且节省的从总体中选取 样本单元的方法。
要对总体进行推断需要对样本 进行一些假定,即要求样本对总体 具有代表性。在这点上非概率抽样 一般不具备。
实用文档
3
由于非概率抽样抽取样本有倾
向性与偏差且没有一个抽样框,不可
实用文档
45
所有可能的n=1的PPS样本
样本(抽 农场的如样
罗斯福 兰登
60.2 39.8
43.0 57.0
54.0 46.0
合计
100.0
100.0
100.0
那么,《文摘》杂志失败,盖洛普成功的原因究竟何在呢?
实用文档
14
盖洛普采用的是一种叫作“分配法’的方法。 这种方法力求使调查对象在州,市,镇,村的 大小,年龄,性别、社会阶层,人种等方面, 能准确地代表美国的所有选民。例如,如果二 十几岁的人占全体选民的27%,那么在3000 人的调查对象中,二十几岁的人也应占27%, 即810人。为确保所分配的比率不致出错,务 必要求调查员直接面见调查对象,以便确认。 因此,调查的实施多采取访问调查的方法。
第七章 抽样方法
抽样是通过抽取总体中的部分单元, 收集这些单元的信息,用来对作为整体 的总体进行统计推断的一种手段。本章 讨论了抽样的基本问题。
抽样的两种主要类型是概率抽样与 非概率抽样。
实用文档
1
非概率抽样的用途是有限的, 因为抽选单元的倾向性不允许对调 查总体进行推断。然而非概率抽样 快速简便,对探索性研究很有用, 特别是在市场调查中应用非常广 泛。。
实用文档
10
2.志愿者抽样
被调查者都是志愿者。 例如具有特定病情的人参加某些医疗
实验;打电话参与广播或电视节目的 人;抽选参加焦点座谈或深入访问的 人。
实用文档
11
3.判断抽样
由专家有目的地抽选有代表性的样本。 它适用于探索性研究,
如:抽选参加焦点座谈或深入访谈的 人,但不宜用在试调查中。
实用文档
19
盖洛普后来的成功—采用概率抽样
年份 样本容量 获胜后选人 盖洛普 选举结果 预测值
1952 5385 艾森豪威尔 51% 55.4%
1956 8144 艾森豪威尔 59.5% 57.8%
1960 1964 1968 1972 1976 1980
8015 6625 4414 3689 3439 3500
杜威 50% 50% 53% 45%
实用文档
16
从此,盖洛普失去了在民意调查界神话般的 地位。不仅如此,其它调查机构也都出现了同 样的失败。人们开始向民意调查投来了怀疑的 目光。于是,由许多学者和专家组成了一个委 员会,对失败的原因进行了研究。结果指出分 配法的下列缺点:
实用文档
17
因此,不可避免调查员的爱好,调查对象对 访问的配合程度等因素的影响。即使在年龄, 社会阶层等分配调查对象时考虑到了的几个特 征上,调查对象能完全代表全体选民,但其他 特征还是可能出现偏差。研究结果,随机抽样 方法作为消除分配法主观因素影响的手段开始 受到重视。
实用文档
15
盖洛普应用分配法进行总统选举颅测调查获得极 大成功以后,该方法开始被广泛应用于民意调 查和市场调查。可是在1948年的总统选举中, 采用同样方法预言杜威将当选,结果与预测恰 恰相反,杜鲁门当选了。
预测
实际
候选人 Crossley Gallup Roper 结果
杜鲁门 45% 44% 38% 50%
实用文档
29
与其他抽样技术相比,简单随机抽样 有以下优点:
是最简单的抽样技术;
抽样框不需要其他(辅助)信息,唯一 需要的只是一个关于调查总体所有单元 的一个完全的清单和与其如何联系的信 息;
关于样本量的确定、总体估计与方差估 计都有现成的标准公式可以利用,因此 技术发展已经成熟。
实用文档
30
实用文档
35
系统抽样的另一个优点是,在事先没有 总体单元名录的情况下,也可以用。此 时,我们可以使用并构造一个概念抽样 框(只需要单元的排列顺序),每隔k 个抽一个单元直到总体的末尾。这种方 法的一个缺点是,只有抽样完成后才知 道实际样本量n。
实用文档
36
系统抽样的缺点有:
如果抽样间距正好碰上总体变化的某种未知的 周期性,就会得到一个“差的”系统样本;
抽样可以是放回的,也可以是不放回 的。
实用文档
27
简单随机样本(图示)
实用文档
28
简单随机抽样在实际抽样中应用很 少,常被用作评估其他抽样方法的 效率的标准。
抽样的误差是通过其抽样方差来测 量的,如果一种抽样方法的抽样方 差比另一种抽样方法的抽样方差小, 我们就称这种抽样方法更有效率 (统计效率)。
如果N不能被n整除,则可以使用 圆形系统抽样法来避免出现可能样 本量不一致的情况。
实用文档
34
系统抽样有以下优点:
在没有抽样框时,可代替简单随机抽样; 与简单随机抽样一样,系统抽样不需要辅
助的抽样框信息; 与简单随机抽样相比,系统抽样样本的分
布较好(这还取决于抽样间隔及名录是如 何排列的); 与简单随机抽样一样,估计值容易计算; 系统抽样比简单随机抽样简单。
如果单元大小的度量是准确的,而且所 研 究 的 变 量 与 单 元 的 大 小 相 关 , PPS 抽 样能极大地提高精度。
PPS抽样的一个很好的例子是商业调查。 单元大小度量可用雇员数、年销售额、 经营场所数等。
实用文档
38
在PPS抽样中,单元的大小决定 入样概率的大小。这就是说,以农场 作为例子,一个面积为200公顷的农 场被抽入样本的概率,是面积为100 公顷的农场的二倍。
实用文档
22
概率抽样有两条基本准则:
1) 单元是随机抽取的; 2) 调查总体中的每个单元都有一个
非零的入样概率,并且能计算出这些 概率。
实用文档
23
概率抽样的主要优点有:
能得到总体的可靠估计值并能计算每 个估计值的抽样误差,因而能对总体 进行推断。
实用文档
24
概率抽样的主要缺点有:
与非概率抽样相比,概率抽样比较复 杂,更费时,通常也更费钱。但总的 说来,其利远大于弊。
由于不使用抽样框中的辅助信息,抽样策略的 效率不高;
在使用概念框时,不能预先知道最终样本量; 抽样方差没有一个无偏的估计量; 在总体大小N不能被样本量n整除且不使用圆
形抽样法时,会得到样本量不同的样本。
实用文档
37
与大小(或规模)成比例的概率(PPS)抽样
PPS抽样是一种使用辅助信息从而使入 样概率不相等的抽样技术。
肯尼迪 约翰逊 尼克松 尼克松 卡特 里根
51% 64% 43% 62% 49.5% 55.3%
50.1% 61.3% 43.5% 61.8% 51.1% 51.6%
1984 3456
里根
59.0% 59.2%
1988 4089
布什 实用文档56.0% 53.9%
误差
+4.4% -1.7% 0.1% -2.7% 0.5% -0.2% 1.6% -3.7% 0.2% -2.12%0
实用文档
39
假定一个总体有六个农场,我们 要估计这个农场总体的总支 出。假定我们已知每个农场的规模 (以公顷计的农场大小),为便于说明, 进一步假定我们已知它们的支出。
实用文档
40
考虑下面的农场名录(总体值):
抽样单元:农场
1 2 3 4 5 6 总计
抽样框辅助信息:以 公顷计的农场规模 50 1000 125 300 500 25 2000
实用文档
25
概率抽样的种类
概率抽样有七种:
简单随机抽样, 系统抽样, 等比例抽样, 整群抽样, 分层抽样, 多阶抽样, 多相抽样。
实用文档
26
简单随机抽样(SRS)
是所有概率抽样的出发点和理论基础。 简单随机抽样是一种一步抽样法,它 保证样本量为n的每个可能的样本都 有相同的被抽中的概率p=n/N。
实用文档
12
4.配额抽样
这是最常见的一种非概率抽样。抽样要 从各个子总体中选取特定数量的单元(配 额)。
总样本量:900人
18-25 26-30 31-35 36-40 41-45 男
女
比例 28% 17% 17% 19% 19% 50- 5055% 45%
实用文档
13
1936年总统选举预测得票率 单 候 选 人 实际得票率 《文摘》杂志预测 盖洛普预测
样本1
1/6
6
26000
156000
样本2
1/6
6
470000
2820000
样本3
1/6
6
63800
382800
样本4
1/6
6
145000
870000
样本5
1/6
6
230000
1380000
样本6
1/6
6
12500
75000
估计总值的平均数947300实用文档44用简单随机抽样时,总体的 估计值随样本的不同而不同,其变 化 范 围 从 75,000 元 到 2,800,000 元 。 PPS抽样能得到抽样变异性较小的 估计值。
不可能得到可靠的估计值以及抽样误 差估计值。
实用文档
8
非概率抽样的种类
非概率抽样方法有五种:
随意抽样 自愿抽样 判断抽样 配额抽样 修正的概率抽样。
实用文档
9
1.随意抽样
随意抽样的样本单元的抽选以无目 标、随意的方式进行,几乎没有或 完全没有计划。
它假定总体是同质的,即总体单元 都相似。比如“街道拦截”访问法。
实用文档
42
下面我们来分析简单随机抽样的 结果。对大小为1的样本,总体总支 出的估计值,由抽中样本的单元的 支出乘以该单元的权数1/6(权数是样 本单元所代表的总体单元个数)得到。
实用文档
43
所 有 可 能 的 n=1 的 简 单 随 机 样 本 。
样本(抽 农场的如 农场的样 农场的支 总体总支出的 中的农场) 样概率 本权数 出(元) 估计值(元)
调查变量:支出 (元) 26000 470000 63800 145000 230000 12500 947300
实用文档
41
对这个六个农场的总体,真正的总支出 为 947,300 元 。 假 定 我 们 没 有 对 这六个农场进行普查的经费,预算只够对 一个农场的样本进行调查(把样本 量取为1,只是为了说明方便,在实际调查 中,只抽一个单元的情况极少), 我们可以抽简单随机样本,每个样本只含 一个单元、每个单元入选的概率为 1/6、大小为n=1的样本有六种可能。