社会调查研究方法

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

❖ 从上例可以看出，多段随机抽样方法的优点：
❖ 把各种抽样方法的优点综合起来，达到以最小的人财物力消耗和最短时间获得最佳效果的目的。
❖ 特别适合于调查总体范围大、单位多、情况复杂的调查对象。
❖ 四段抽样，从自然村抽到户。为了简便易行，可采取简单随机抽样方法。其具体做法是：
❖ 首先，编制抽样框，就是编制第3级样本10个群体、20个自然村、1000户的名单，并按照一定标准确定每户的编号。
❖ 其次，抽取第4级样本，即按照简单随机抽样方法从每个群体(即相近的两个自然村100户)中抽取50 户、10个群体中抽出500户作为第4级样本．即最后实施调查的具体对象。
作为分层变量；
(2)分层的比例问题。
❖按比例分层抽样是指按各种类型或层次中的单位数目同总体单位数目间的比例来抽取样本。
❖例：某地区有百货商店1000个，其中大型百货商店100个，中型百货商店300个，小型百货商店600 个。如果总样本数定为20个，则各层应抽取的样本数为多少？
四、整群抽样
❖ 二段抽样，从乡镇抽到行政村。为了使样本分布比较均匀，可考虑采用等距抽样。具体做法是：
❖ 首先，编制抽样框。把第1级样本5个乡镇的50个行政村编号l～50。
❖ 其次，计算抽样间隔。假定从第2级单位中抽取 20％的单位即10个行政村作为第2级样本，这样抽样间隔就应该是50÷10=5。
❖ 再次，抽取第2级样本。就是先在第1抽样问隔内随机抽取第1个样本，假定是编号为2的行政村，然后按照抽样间隔就可确定编号为2，7，12，17 ，22，27，32，37，42，47的10个行政村为第2 级样本。
❖ 把总体的单位进行编号排序后，再计算出某种间隔，然后按这一固定的间隔抽取个体的号码来组成样本的方法。
1、具体步骤
• (1) 制定出抽样框。 • (2)计算抽样间距K=N / n • (3)在最前面的K个个体中，采用简单随机抽样的方
法抽取一个个体，记下个体编号(A)。 • (4)在抽样框中，自A开始，每隔K个个体抽取一个
809 66561 56130 30356 54034 53996 98874 78001
810 50670 13172 31460 20224 34293 59458 24410
811 53971 08701 38356 36149 10891 05178 55653
812 47177 03085 37432 94053 87057 61859 96943
❖ 例如：某市共有6万名员工，他们分布在全国20个城市的400个单位中。现在要抽取一个由1200名员工组成样本。
❖ 如果按照三阶段抽样的方法，我们就可以有下列各种不同的抽样选择(见表)。
如何选择方案？
考虑因素 2、研究者所拥有的人力和财力
大的类别较少，每一类别的个体较多
调查方案例子
❖ 三段抽样，从行政村抽到自然村。为了便于集中调查，节约人财物力和时间，可考虑采取整群抽样方法。其具体做法是：
首先，划分群体，即将第2级样本10个行政村所属的100个自然村，按照地理位置把每两个相近自然村划为一个群体，共分为50个群体。其次，抽取第3级样本，即按照随机原则从50 个群体中抽出10个群体作为第3级样本。
个体，编号分别为A，A+K，A+2K，…，A+(n－ 1)K。
2、课堂作业
❖ 要在某大学总共3 000名学生中，抽取一个容量为 100的大学生样本。
❖ 我们先将3 000名学生的名单依次编上号码； ❖ 然后按上述公式可求得抽样间距为：30； ❖ 在1～30的数码中，采用简单随机抽样的方法抽取一
个数字，假如抽到12，就以12为第一个号码； ❖ 每隔30名再抽一个。这样，我们便可得到12，42，
顺序号码相符的号码与个数； ❖ (6)依据从随机数表中选出的数码，到抽
样框中去找出它所对应的元素。
•例：在某个5000人的企业中抽取 1000人进行问卷调查，如何操作？
优点：简单易行
如果是10人如何抽取？
缺点：只适用于总体数量不大，而且抽样框容易定位的调查；样本代表性差，误差大。
二、系统抽样
第一节抽样与抽样调查
❖ 抽样是一种选择调查对象的程序和方法；即由总体中选取一部分代表的过程。
❖ 选取样本的方法分为两大类：一类是非概率抽样。另一类概率抽样。
❖ 抽样调查的成功首先要求所选取的样本能够代表总体。
❖ 所谓代表，也就是抽取出来的样本从调查所要研究的总体特征来看，能够再现总体的结构。
❖ 其具体做法如下：首先，确定抽样单位。根据该县社会组织的4个层次，即乡镇、行政村、自然村和户，应采取4段随机抽样方法抽取样本，并确定乡镇为第1级单位，行政村为第2级单位，自然村为第3级单位，户为第4级单位然后，采取不同抽样方法，分4段逐步抽取样本：
❖ 一段抽样，从县抽到乡镇。由于该县乡镇之间经济发展状况差异较大，因而应采用宜于这类抽样单位的类型分层抽样。
813 41494 89270 48063 12253 00383 96010 41457
814 07409 32874 03514 84843 74421 86708 43267
具体步骤
❖ (1)先取得抽样框； ❖ (2)将总体中所有元素按顺序编号； ❖ (3)确定随机数表中选取得数码位数； ❖ (4) 用随机方法抽取第一个号码； ❖ (5) 按照任意规则逐个抽取与样本单位
805 74998 53337 13860 89430 9582S 65893 96572
806 59572 95893 697e5 43597 90570 60909 06479
807 74645 13940 28640 00127 04261 17650 34050
808 42765 23855 38451 11482 32671 52126 23800
课堂练习：
❖ 例如，假定某山区县有20个乡镇（该县20 个乡镇经济发展状况较好的、一般的和较差的3类分别为4个、12个和4个），平均每个乡镇有10个行政村，每个行政村有10 个自然村，每个自然村有50户。这样，全县共有200个行政村、2000个自然村、10 万户。现决定采用多段随机抽样方法对该县计划生育状况按户做5‰的抽样调查，共抽取样本500户.
❖总体单位数量较多，单位之间差异较大的对象。样本代表性大，误差较小。
❖缺点：必须充分了解总体，否则无法分类；
3．分层抽样的运用
❖ (1)分层的标准。 ❖ 第一，以所要分析和研究的主要变量或
相关的变量作为分层的标准。 ❖ 第二，以保证各层内部同质性强、各层
之间异质性强的变量作为分层变量。 ❖ 第三，以那些已有明显层次区分的变量
❖多段抽样是按抽样元素的隶属关系或层次关系，把抽样过程分为两个或以上阶段进行。
在社会研究中，当总体的规模特别大，或者总体分布的范围特别广时，研究者一般采取多段抽样的方法来抽取样本。
具体步骤
❖ 先从总体中随机抽取若干大群(组)，再从这几个大群(组)内抽取几个小群(组)，这样一层层抽下来，直至抽到最基本的抽样元素为止。
例如：
• 了解某市800个企业的生产经营，第一产业80个，第二产业320个，第三产业400个，需选择100个调查，如何做？
• 计算比率：第一产业：10%，第二产业：40%，第三产业： 50%；下一步是多少？
• 相应的个数：第一产业：10，第二产业：40，第三产业： 50
• 然后抽取具体的样本
2．分层抽样的优点
就是对样本的质量、代表性、偏差等进行初步的检验和衡量。
第三节概率抽样
一、简单随机抽样二、等距抽样三、分层随机抽样四、整群抽样五、多阶段抽样
❖ 一、简单随机抽样
❖ 按等概率原则直接从含有N个元素的总体中随机抽取n个元素组成样本(N>n)。
❖ 1、抽签法
❖ 2、随机数码法
随机数字表一部分
行1
2
34 5 6
7
801 33993 41249 76123 16507 57399 77922 36198
802 39041 05779 74278 75301 01779 60768 22023
803 56011 26839 38501 03321 43259 73148 43615
004 07397 95853 4S764 43803 76659 57736 44801
和以上几种相比较，在样本数量相同的情况下抽样误差较大
课堂练习
❖ 假设总体是全国所有城市的集合（600），我们要抽取一个规模为40的样本，按照前面所介绍的方法如何抽取？
❖ 1、简单随机抽样或系统抽样？ ❖ 2、分层抽样（特大、大、中等、小城市） ❖ 3、整群抽样（以省为抽样单位）
五、多段抽样
第4讲抽样
❖ 抽样与抽样调查 ❖ 抽样的术语与程序 ❖ 概率抽样 ❖ 非概率抽样 ❖ 样本大小
年份 1936 1940 1944 1848 1952
1956
1960 1964
总统竞选人罗斯福、蓝敦罗斯福、威尔基罗斯福、杜威杜鲁门、杜威艾森豪威尔、史蒂文
森艾森豪威尔、史蒂文
森肯尼迪、尼克松约翰逊、戈德华特
❖ 概率抽样最具科学性。
第二节抽样的术语与程序
一、抽样的术语
1.总体
是指调查研究对象全体所构成的集合；
2.样本
是指按照一定方法从总体中抽取出来进行调查的那部分对象的集合；
3.抽样
指的是从某个总体的集合中，按一定的方式选择或抽取一部分元素的过程。
4.抽样单位
是指抽样过程中使用的基本单位。
5.样本框
盖洛普预测 55.7:44.3 52:48 51.5:48.5 44.5:49.5 51:49
59.5:40.5
51:49 64:36
实际选举结果 60.8:36.5 54.7:44.8 53.4:45.9 49.5:45.1 55.1:44.4
57.4:42.0
49.7:49.6 61.1:38.5
❖ 先将总体各单位按一定标准分成若干群体，并将每一个群体看作一个抽样单位，然后按照随机原则从这些群体中抽取若干群体作为样本。
❖ 例如，某大学共有100个班级，每班都是30名学生，总共有3000名学生，抽300名学生作为样本，如何抽取？
❖ 从全校100个班级中，采取简单随机抽样的方法（或是系统抽样，分层抽样的方法)抽取10个班级，然后由这10个班级的全部学生(300名)构成样本；
❖ 其具体做法是：首先，编制抽样框。以经济发展状况为标准，将该县20个乡镇分为经济发展状况较好的、一般的和较差的3类(即3个群体)，它们分别为4个、12个和4个。
❖ 其次，确定样本数量。假定在第1级单位中抽取25 ％的单位即5个乡镇作为样本。
❖ 再次，简单随机抽取和上述比例，在经济发展状况较好的4个乡镇中抽1个乡镇，一般的几个乡镇中抽3个乡镇，较差的4个乡镇中抽1个乡镇，共5 个乡镇组成第1级样本。
间内的概率；
10.置信区间是指在某一置信水平下，样本统计值与总体
参数值间的误差范围。
二、抽样的基本程序
1.界定总体
是对从中抽取样本的总体范围和界限作明确的界定。
2.制定抽样框
在确定了总体范围和抽样单位以后，收集总体中全部抽样单位的名单，并通过对名单进行统一编号来建立起供抽样使用的抽样框。
3.设计和抽取样本 4.对样本进行评估。
是指抽样过程中抽取样本的所有抽样单位的名单。
6.参数值
也称总体值，是关于总体中某一变量的综合描述。
7.统计值
也称样本值，样本值是从样本的所有元素中计算出来的，它是相应的总体值的估计量。
8. 抽样误差
在用样本的统计值去推论总体的参数值时，总会存在着偏差，这种偏差就是抽样误差。
9.置信水平是指总体参数值落在样本统计值某一正负区
72，…，2972总共100个号码。 ❖ 再根据这100个号码，从总体中对应地找出100名学
生，这100名学生就构成本次的一个样本。
❖3、注意两种情况
4、评价
❖优点：样本的分布比较均匀，抽样误差小于简单随机抽ห้องสมุดไป่ตู้。
❖缺点：总体不能太多，要有完整的登记册；
三、分层抽样
❖ 分层抽样：将总体按某种特征划分成若干类型，然后再根据各类型所包含的抽样单位数与总体单位数的比例，确定从各类型中抽取样本单位的数量。然后按照简单随机和等距抽样的方法抽取样本。