社会调查方法chapter3 sampling
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当总体不能被样本整除时(即抽样 间隔不为整数时),使用简单随机 抽样方法,剔除余数,再使用系统 抽样的方法。
3、分层抽样(Stratified Sampling)
★ 合一随型按概 起个机,某念 来子抽然种: 构样样后特是 成本或再征先 总,系在或将 体最统各标总 的后抽类志体 一将样型划中 个这的中分的 样些方采为所 例
这是个狗食品制造商的案例,这个厂商在超级市场里对狗的 主人进行了广泛的访问调查,他们调查并估计顾客们对包装 式样和型号的要求,并试探顾客们对广告设计方案的反应。 产品投入市场的初期,经历了一个高销售额的阶段。但数月 后,销售额却停滞不前。这家公司讨论研究后,把自己生产 的狗食带到当地的流浪狗收容所,然后把狗食放到狗的面前, 但他们碰也不碰!
(二)抽样的作用 (1)用于不可能进行全面调查的总体数量
特征的推断。 (2)用于某些不必要进行全面调查的总体
数量特征的推断。
任务二 抽样的程序
界定总体
制作抽样框 选择抽样方法,抽样的精确性,样本规模
实际抽取样本 评估样本质量
一、界定总体
即在具体抽样前,对从中抽取样本的总体范围作出明确的界定。
﹠为什么要对总体进行界定? 原因之一:是由抽样调查的目的决定的,其目的是调查部分以反
3.定额抽样(Quota Sampling) 是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在 各层中按比例抽样。抽样时不要求遵守随机原则。
4.滚雪球抽样(Snowball Sampling)
是先从几个适合的个体开始,然后通过他们得到更多的个体, 这样一步步地扩大样本规模的抽样方法。此法常用于去寻找 具有相同性质的个体,就象滚雪球一样。(如下图)
映总体。
原因之二:界定总体是达到良好的抽样效果的前提条件。 例如:
1936年美国总统大选前《文学文摘》杂志的抽样
思考
美国的《文学文摘》是一本1890年—1938年间在美国发行颇 为流行的新闻杂志。1920年、1924、1928、1932年的美国 总统大选前都作出了准确的预测。1936,《文学文摘》进行了 一次最具雄心的民意测验活动:选票寄给了从电话薄与车牌登 记单中挑选出来的1000万人。收到了200万人以上的回应;结 果显示,有57%人支持共产党候选人阿尔夫·兰登,而当时在 任的美国总统富兰克林·罗斯福的支持率为43%.
﹠评估样本的基本方法
﹠例如:
从我院10000名学生中抽取600名学生作为样本。同时, 我们从学院教务处或学生处得到下列统计资料:全院男生 占学生总数的53%,女生占47%;本市学生占40%,外 省学生占60%。那么,我们可以对抽出的600名学生进行 这两方面分布情况的统计。假定样本统计得到的结果是: 男生占52%,女生占48%;本市学生占41%,外省学生占 59%。两相对比,可以发现二者之间的差距很小,这就在 一定程度上说明,样本的质量较高,代表性较好,从这样 的样本中得到的结果往往能较好地反映和体现总体的情况。
两个星期以后全民选举的结果出来了,罗斯福以历史上最大的 优势61%的得票率获得第二届任期。
思考:为什么《文学文摘》的预测会失败?
二、制作抽样框
依据已经明确界定的总体范围,收集总体中全部 抽样单位的名单,并对名单按随机原则进行统一 编号,建立起供抽样使用的抽样框。 ﹠注意:当采取多级抽样时,需制作多个抽样框。
例:重庆城市管理职业学院在校学生对食堂满意度的调查
8.抽样误差(Sampling Error) 是指在用样本统计值去推估总体参数值时所存在的偏差。 它是由抽样本身的随机性引起的,是不可避免的。但是抽 样误差的大小是控制的。
﹠抽样误差的意义:是衡量样本代表性好坏的标准,抽样误 差越小,说明样本的代表性越好,反之,则越不好。
开篇案例
我们知道,近几十年来,美国总统大选前夕,总有一些民意测验机 构喜欢对总统选择投票的结果进行预测。1936年美国总统选举前 夕,盖洛普民意测验所仅仅调查了3000人,就成功地预测了民主 党人罗斯福将当选为美国的新一任总统。
1984年这家民意测验机构又一次成功地预测了罗纳得•里根将以 59%比41%的优势战胜蒙代尔而当选为美国的新一任总统。这一 预测结果与实际投票结果(59%:41%)相一致。而当时盖洛普民 意测验所在将近1亿美国选民中,调查的对象还不到2000人。
﹠参数值与统计值之间的区别与联系: (1)参数值是确定不变的、唯一的,并且通常是未知的。 (2)统计值则是变化的,即对于同一个总体来说,不同样本所得到的 统计值常常是有差别的;对于某一个特定的样本来说,统计值是已知 的,是可以通过计算得到的。 (3)联系:通过样本统计值可以推算总体参数值,从而达到调查部分 以认识总体的目的。这就是抽样调查的作用所在。
﹠根据抽取调查对象的具体方式的不同,又可分将概率抽样与非概率抽样分
为若干小类,具体分类如下图所示。
偶遇抽样(Convenience sampling )
判断抽样(Purposive Sampling )
非概率抽样 定额抽样(Quota Sampling )
抽样方法
p雪rob球ab抽ilit样y (Snowball sampling )
项目三 抽样方案的制作
任务一 认识抽样 任务二 抽样的程序 任务三 抽样方案的制作
四、样本规模与抽样误差
任务一 认识抽样
一、抽样的概念和作用
例:重庆城市管理职业学院在校学生对食堂满意度的调查
(一)抽样的概念及相关术语
1、总体(Population)(在社会调查中用N表示) 通常与构成的元素共同定义,总体是构成它的所有元素的集合, 而元素则是构成总体的基本单位。
越低,置信区间越小。对抽样的可靠性程度要求越高,抽样的精确性 程度将越低;对抽样的可靠性程度要求越低,则抽样的精确性程度将 越高。
11.异质性
社会中由不同的个人所组成的各种群体、组织等构成了社会调 查的研究总体。它们所包含的个体相互之间总是存在着或大 或小的差异,这种差异就用异质性来表示。
12.同质性
★概念:是把总体中的个体进行随机编号并排序,再计算出某种间隔,然后 按这一固定的间隔抽取个体的号码来组成样本的方法。
★具体步骤 ★注意:一般不选用系统抽样方法的情况。 (1)在总体的名单中,个体的排列具有次序上的先后和等级上的高低的时
候。例如: (2)在总体名单中,个体的排列上有与抽样间隔相对应的周期性分布的情
任务三 抽样方案的制作
﹠ 概率抽样─是依据概率论的原理,按照等概率原则进
行的抽样,因而它能够避免抽样过程中的人为误差,保证 样本的代表性。此法在社会调查最常用。
﹠ 非概率抽样─主要是依据研究者的主观意愿、主观判
断或是否方便等因素来抽取调查对象,它不考虑抽样中是 否等概率,因而往往产生较大的误差,难以保证样本的代 表性。此法在社会调查中用得较少。
★分层比例 (1)按比例分层 (2)不按比例分层 如:某厂有工人600人,按照性别分层有男工500人,女工100
A
B
二、概率抽样
1、简单随机抽样(Simple Random Sampling) ★概念:它是按等概率原则直接从含有N个个体的总体中抽取n
个个体组成样本(N > n)。 ★方法:一是抽签;
二是利用随机数表来抽样 ★利用随机数表进行抽样的具体步骤
★适用范围:总体单位数目和所需样本数目都比较少。
2、系统抽样(Systematic Sampling)
(2)在不增加样本规模的前提下,减少抽样误差,提高抽 样的精确性。
总体的同质性程度越高,样本就越容易反映和代表总体 的特征和面貌;而总体的异质性程度越高,样本对总体 的反映和代表就越困难。采用分成抽样的目的就是将异 质性较强的总体划分为一个个同质性较强的子总体,再 从每一个同质性较强的子总体中抽取子样本。
况。例如:
★适用范围:总体数量不大,个体排列无次序性和周期性。
例如: 某大学共有3000名学生,要抽取一个容量为100的大学生样本, 使用系统抽样的方法如何抽取。
课堂练习: 现要对某一产品的口味进行测试,需要从调查总体的150人中 抽取12人进行测试,请使用系统抽样的方法抽取样本。
?思考:如果总体的个体数不能被样本容量整除时,如何处理?
sample
一、非概率抽样
1.偶遇抽样(Accidental or Convenience Sampling) 是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对 象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。
2.判断抽样(Judgmental or Purposive Sampling) 是调查者根据研究目标和自己的主观分析来选择和确定调查对象的方法(对 调查者的要求比较高)。
﹠准确的抽样框原则:
1、完整性 2、不重复性
例如: 在城市居民户的抽样中,会经常出现一户有多处住房的情况,
这样很容易把一户重复列入抽样框,使得他们在抽样中的中 选概率高于其他居民,相反,许多城市居民居住条件比较差, 很多居民同住在一个门牌号中,因此很容易遗漏。两种情况 均违背了随机抽样的等概率原则。
sample
sample
简单随机(Simple random sample )
系统抽样(Systematic sampling )
分层抽样(Stratified Sampling )
概率抽样 整群抽样(Cluster Sampling ) Non-多pro段ba抽bil样ity(Multi-stage sampling)
2、样本(Sample)(社会调查中用n表示) 是从调查总体中按一定方式抽取出来的那一部分代表的集合体。
例:重庆城市管理职业学院在校学生对食堂满意度的调查
3.抽样(Sampling) 是一种选择调查对象的程序与方法,即从总体中选取一部分代 表的过程,也即从总体中按一定方式选择或抽取样本的过程。
4.抽样单位(Sampling Unit) 一次直接的抽样所使用的基本单位。 抽样单位和构成总体的元素有时相同,有时不同。
一个总体中的各元素之所以会归为这个总体中,总是存在着一 些相似点或共同特征。同质性就是指总体中个体相互之间的 相似程度,它与异质性相对应。
13.放回抽样 是指每次从总体中抽取一个单位进行观察后再把这个单位重 新放回总体,使之继续参加下次抽选。
14.不放回抽样 是指每次从总体中抽取一个单位进行观察后,不再把这个单 位重新放回总体,这个总体单位不再继续参加下次抽选。
﹠问题:为什么产品在经历了一个高销售阶段后会停滞不前?
三、决定抽样方案
选择恰当的抽样方法,确定抽样的精确性、把握性及样本规模.
四、实际抽取样本
即在前进几个步骤的基础上,严格按照所选定的抽样方法,从抽样框中抽 取一个个抽样单位,构成调查样本。
五、评估样本质量
所谓样本评估,就是对样本的质量、代表性、偏差等进行初步的检验和衡 量,其目的是防止由于前面步骤中的失误而使样本偏差太大,进而导致 整个调查的失误。
5.抽样框(Sampling Frame) 也称抽样范围,指抽取样本时总体所有抽样单位的名单。
第四章 抽样
例:重庆城市管理职业学院在校学生对食堂满意度的调查
6.参数值(Parameter) 也称总体值,是关于总体中某一变量的综合描述。
7.统计值(Statistic) 也称样本值,是关于样本中某一变量的综合描述。
例:重庆城市管理职业学院在校学生对食堂满意度的调查
9.置信水平(Confidence Level) 也称置信度,指的是总体参数值落在样本统计值某一区间内的概率。
10.置信区间(Confidence Interval) 是指在一定范围的置信水平下,样本统计值与总体参数值之间的误差 范围
置信水平与置信区间的关系 ﹠在其他条件不变的情况下,置信水平越高,置信区间越大;置信水平
本取单类体
N
N1
N2
N3
n1
n2
n3
n
其中,N为总体,Ni为子总体,n为样本,ni为子样本
★课堂练习:
某地共有居民20000户,其中高收入居民4000户, 中等收入居民12000户,低收入居民4000户,现要 从中抽取500户做购买力调查,如何运用分层抽样 抽取样本?
★优点
(1)便于不同子总体之间的比较研究。