社会调查研究方法

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

❖ 从上例可以看出,多段随机抽样方法的优 点:
❖ 把各种抽样方法的优点综合起来,达到以 最小的人财物力消耗和最短时间获得最佳 效果的目的。
❖ 特别适合于调查总体范围大、单位多、情 况复杂的调查对象。
❖ 四段抽样,从自然村抽到户。为了简便易行,可 采取简单随机抽样方法。其具体做法是:
❖ 首先,编制抽样框,就是编制第3级样本10个群 体、20个自然村、1000户的名单,并按照一定标 准确定每户的编号。
❖ 其次,抽取第4级样本,即按照简单随机抽样方法 从每个群体(即相近的两个自然村100户)中抽取50 户、10个群体中抽出500户作为第4级样本.即最 后实施调查的具体对象。
作为分层变量;
(2)分层的比例问题。
❖按比例分层抽样是指按各种类型或 层次中的单位数目同总体单位数目 间的比例来抽取样本。
❖例:某地区有百货商店1000个, 其中大型百货商店100个,中型百 货商店300个,小型百货商店600 个。如果总样本数定为20个,则各 层应抽取的样本数为多少?
四、整群抽样
❖ 二段抽样,从乡镇抽到行政村。为了使样本分布 比较均匀,可考虑采用等距抽样。具体做法是:
❖ 首先,编制抽样框。把第1级样本5个乡镇的50个 行政村编号l~50。
❖ 其次,计算抽样间隔。假定从第2级单位中抽取 20%的单位即10个行政村作为第2级样本,这样 抽样间隔就应该是50÷10=5。
❖ 再次,抽取第2级样本。就是先在第1抽样问隔内 随机抽取第1个样本,假定是编号为2的行政村, 然后按照抽样间隔就可确定编号为2,7,12,17 ,22,27,32,37,42,47的10个行政村为第2 级样本。
❖ 把总体的单位进行编号排序后,再计算出某种间 隔,然后按这一固定的间隔抽取个体的号码来组 成样本的方法。
1、具体步骤
• (1) 制定出抽样框。 • (2)计算抽样间距K=N / n • (3)在最前面的K个个体中,采用简单随机抽样的方
法抽取一个个体,记下个体编号(A)。 • (4)在抽样框中,自A开始,每隔K个个体抽取一个
809 66561 56130 30356 54034 53996 98874 78001
810 50670 13172 31460 20224 34293 59458 24410
811 53971 08701 38356 36149 10891 05178 55653
812 47177 03085 37432 94053 87057 61859 96943
❖ 例如:某市共有6万名员工,他们分布在全国20个 城市的400个单位中。现在要抽取一个由1200名员 工组成样本。
❖ 如果按照三阶段抽样的方法,我们就可以有下列各 种不同的抽样选择(见表)。
如何选择方案?
考 虑 因 素 2、研究者所拥有的人力和财力
大的类别较少,每 一类别的个体较多
调查方 案例子
❖ 三段抽样,从行政村抽到自然村。为了便于 集中调查,节约人财物力和时间,可考虑采 取整群抽样方法。其具体做法是:
首先,划分群体,即将第2级样本10个行政村 所属的100个自然村,按照地理位置把每两个 相近自然村划为一个群体,共分为50个群体。 其次,抽取第3级样本,即按照随机原则从50 个群体中抽出10个群体作为第3级样本。
个体,编号分别为A,A+K,A+2K,…,A+(n- 1)K。
2、课堂作业
❖ 要在某大学总共3 000名学生中,抽取一个容量为 100的大学生样本。
❖ 我们先将3 000名学生的名单依次编上号码; ❖ 然后按上述公式可求得抽样间距为:30; ❖ 在1~30的数码中,采用简单随机抽样的方法抽取一
个数字,假如抽到12,就以12为第一个号码; ❖ 每隔30名再抽一个。这样,我们便可得到12,42,
顺序号码相符的号码与个数; ❖ (6)依据从随机数表中选出的数码,到抽
样框中去找出它所对应的元素。
•例:在某个5000人的企业中抽取 1000人进行问卷调查,如何操作?
优点:简单易行
如果是10人如何抽取?
缺点:只适用于总体数量不大,而且抽样框 容易定位的调查; 样本代表性差,误差大。
二、系统抽样
第一节 抽样与抽样调查
❖ 抽样 是一种选择调查对象的程序和方法;即由总 体中选取一部分代表的过程。
❖ 选取样本的方法分为两大类: 一类是非概率抽样。 另一类概率抽样。
❖ 抽样调查的成功首先要求所选取的样本能够代表 总体。
❖ 所谓代表,也就是抽取出来的样本从调查所要研 究的总体特征来看,能够再现总体的结构。
❖ 其具体做法如下:首先,确定抽样单位。 根据该县社会组织的4个层次,即乡镇、 行政村、自然村和户,应采取4段随机抽 样方法抽取样本,并确定乡镇为第1级单 位,行政村为第2级单位,自然村为第3级 单位,户为第4级单位然后,采取不同抽 样方法,分4段逐步抽取样本:
❖ 一段抽样,从县抽到乡镇。由于该县乡镇之间经 济发展状况差异较大,因而应采用宜于这类抽样 单位的类型分层抽样。
813 41494 89270 48063 12253 00383 96010 41457
814 07409 32874 03514 84843 74421 86708 43267
具体步骤
❖ (1)先取得 抽样框; ❖ (2)将总体中所有元素按顺序编号; ❖ (3)确定随机数表中选取得数码位数; ❖ (4) 用随机方法抽取第一个号码; ❖ (5) 按照任意规则逐个抽取与样本单位
805 74998 53337 13860 89430 9582S 65893 96572
806 59572 95893 697e5 43597 90570 60909 06479
807 74645 13940 28640 00127 04261 17650 34050
808 42765 23855 38451 11482 32671 52126 23800
课堂练习:
❖ 例如,假定某山区县有20个乡镇(该县20 个乡镇经济发展状况较好的、一般的和较 差的3类分别为4个、12个和4个),平均 每个乡镇有10个行政村,每个行政村有10 个自然村,每个自然村有50户。这样,全 县共有200个行政村、2000个自然村、10 万户。现决定采用多段随机抽样方法对该 县计划生育状况按户做5‰的抽样调查, 共抽取样本500户.
❖总体单位数量较多,单位之间差异 较大的对象。样本代表性大,误差 较小。
❖缺点:必须充分了解总体,否则无 法分类;
3.分层抽样的运用
❖ (1)分层的标准。 ❖ 第一,以所要分析和研究的主要变量或
相关的变量作为分层的标准。 ❖ 第二,以保证各层内部同质性强、各层
之间异质性强的变量作为分层变量。 ❖ 第三,以那些已有明显层次区分的变量
❖多段抽样是按抽样元素的隶属关系 或层次关系,把抽样过程分为两个 或以上阶段进行。
在社会研究中,当总体 的规模特别大,或者总体 分布的范围特别广时,研 究者一般采取多段抽样的 方法来抽取样本。
具体步骤
❖ 先从总体中随机抽取若干大群(组),再从这几个大 群(组)内抽取几个小群(组),这样一层层抽下来,直 至抽到最基本的抽样元素为止。
例如:
• 了解某市800个企业的生产经营,第一产业80个,第二产 业320个,第三产业400个,需选择100个调查,如何做?
• 计算比率:第一产业:10%,第二产业:40%,第三产业: 50%;下一步是多少?
• 相应的个数:第一产业:10,第二产业:40,第三产业: 50
• 然后抽取具体的样本
2.分层抽样的优点
就是对样本的质量、代表性、偏差等进行初步 的检验和衡量。
第三节 概率抽样
一、简单随机抽样 二、等距抽样 三、分层随机抽样 四、整群抽样 五、多阶段抽样
❖ 一、简单随机抽样
❖ 按等概率原则直接从 含有N个元素的总体 中随机抽取n个元素 组成样本(N>n)。
❖ 1、抽签法
❖ 2、随机数码法
随机数字表一部分
行1
2
34 5 6
7
801 33993 41249 76123 16507 57399 77922 36198
802 39041 05779 74278 75301 01779 60768 22023
803 56011 26839 38501 03321 43259 73148 43615
004 07397 95853 4S764 43803 76659 57736 44801
和以上几种相比较,在样本 数量相同的情况下抽样误差 较大
课堂练习
❖ 假设总体是全国所有城市的集合(600), 我们要抽取一个规模为40的样本,按照前 面所介绍的方法如何抽取?
❖ 1、简单随机抽样或系统抽样? ❖ 2、分层抽样(特大、大、中等、小城市) ❖ 3、整群抽样(以省为抽样单位)
五、多段抽样
第4讲抽 样
❖ 抽样与抽样调查 ❖ 抽样的术语与程序 ❖ 概率抽样 ❖ 非概率抽样 ❖ 样本大小
年份 1936 1940 1944 1848 1952
1956
1960 1964
总统竞选人 罗斯福、蓝敦 罗斯福、威尔基 罗斯福、杜威 杜鲁门、杜威 艾森豪威尔、史蒂文
森 艾森豪威尔、史蒂文
森 肯尼迪、尼克松 约翰逊、戈德华特
❖ 概率抽样最具科学性。
第二节 抽样的术语与程序
一、抽样的术语
1.总体
是指调查研究对象全体所构成的集合;
2.样本
是指按照一定方法从总体中抽取出来进行调查的那部 分对象的集合;
3.抽样
指的是从某个总体的集合中,按一定的方式选择或抽 取一部分元素的过程。
4.抽样单位
是指抽样过程中使用的基本单位。
5.样本框
盖洛普预测 55.7:44.3 52:48 51.5:48.5 44.5:49.5 51:49
59.5:40.5
51:49 64:36
实际选举结果 60.8:36.5 54.7:44.8 53.4:45.9 49.5:45.1 55.1:44.4
57.4:42.0
49.7:49.6 61.1:38.5
❖ 先将总体各单位按一定标准分成若干群体,并将每 一个群体看作一个抽样单位,然后按照随机原则从 这些群体中抽取若干群体作为样本。
❖ 例如,某大学共有100个班级,每班都是30名学生, 总共有3000名学生,抽300名学生作为样本,如何 抽取?
❖ 从全校100个班级中,采取简单随机抽样的方法(或 是系统抽样,分层抽样的方法)抽取10个班级,然后 由这10个班级的全部学生(300名)构成样本;
❖ 其具体做法是:首先,编制抽样框。以经济发展 状况为标准,将该县20个乡镇分为经济发展状况 较好的、一般的和较差的3类(即3个群体),它们分 别为4个、12个和4个。
❖ 其次,确定样本数量。假定在第1级单位中抽取25 %的单位即5个乡镇作为样本。
❖ 再次,简单随机抽取和上述比例,在经济发展状 况较好的4个乡镇中抽1个乡镇,一般的几个乡镇 中抽3个乡镇,较差的4个乡镇中抽1个乡镇,共5 个乡镇组成第1级样本。
间内的概率;
10.置信区间 是指在某一置信水平下,样本统计值与总体
参数值间的误差范围。
二、抽样的基本程序
1.界定总体
是对从中抽取样本的总体范围和界限作明确的界 定。
2.制定抽样框
在确定了总体范围和抽样单位以后,收集总体中 全部抽样单位的名单,并通过对名单进行统一编 号来建立起供抽样使用的抽样框。
3.设计和抽取样本 4.对样本进行评估。
是指抽样过程中抽取样本的所有抽样单位的名单。
6.参数值
也称总体值,是关于总体中某一变量的综合描述。
7.统计值
也称样本值,样本值是从样本的所有元素中计算出来的, 它是相应的总体值的估计量。
8. 抽样误差
在用样本的统计值去推论总体的参数值时,总会存在着 偏差,这种偏差就是抽样误差。
9.置信水平 是指总体参数值落在样本统计值某一正负区
72,…,2972总共100个号码。 ❖ 再根据这100个号码,从总体中对应地找出100名学
生,这100名学生就构成本次的一个样本。
❖3、注意两种情况
4、评价
❖优点:样本的分布比较均匀, 抽样误差小于简单随机抽ห้องสมุดไป่ตู้。
❖缺点:总体不能太多,要有 完整的登记册;
三、分层抽样
❖ 分层抽样:将总体按某种特征划分成若干类型,然 后再根据各类型所包含的抽样单位数与总体单位数 的比例,确定从各类型中抽取样本单位的数量。然 后按照简单随机和等距抽样的方法抽取样本。
相关文档
最新文档