ch7_抽样
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浙江工业大学
社会定量研究方法
假设要从全市100家企业,总共20万名职工中,抽取 1000名职工进行调查。已知最大的企业多达16000名 职工,而最小的企业则只有200名职工。 如果我们采取多段抽样的方法,先从100家企业中随机 抽取若干家企业,比如说抽取20家;然后再从这20家 企业中分别抽取50名职工(50×20=1000)构成样本。 第一阶段:入选概率是相同的,即都为20÷100=20% 第二阶段:规模大的企业中每个职工被抽中的概率则 为20%×(50÷16000)=0.0625%;规模小的企业中 每个职工被抽中的概率为20%×(50÷200)=5%
浙江工业大学
社会定量研究方法
第一阶段 方案1 方案2 方案3 方案4 方案5 方案6 方案7 方案8 方案9 抽10区 抽2区 抽10区 抽8区 抽5区 抽4区 抽3区 抽2区 抽1区
第二阶段 抽4所学校 抽20所学校 抽20所学校 抽15所学校 抽12所学校 抽10所学校 抽10所学校 抽10所学校 抽12所学校
05,15,25,….,95
浙江工业大学
社会定量研究方法
001
002
011
012
021
022
031
032
…
091
092
003
004
013
014
023
024
033
034
093
094
√ 005
006
007 008
√ 015
016
017 018
√ 025
026
027 028
√ 035
…..
√ 095
096
(二)抽样的一般程序
1.界定总体 2.制定抽样框
3.决定抽样方案(准备采用哪种抽样方法)
4.实际抽取样本
——先抽好样本再调查
——边抽部分样本边调查
5.评估样本质量
浙江工业大学
四、概率抽样方法
社会定量研究方法
一、简单随机抽样simple random
sampling
(一)——从含有N个元素的总体中直接随
(二)具体步骤:
1.将总体的所有个体按顺序编号
2.计算抽样间距K
K=
N(总体规模)
n(样本规模)
浙江工业大学
社会定量研究方法
3.在头K个个体中随机确定起点(A)
e.g.如果K=10,就从01-10号中抽签决定 一个号码作为起点,假定为05 4.从A开始,七天连锁酒店每隔K个个体抽 取一个个体,组成样本: A,A+K,A+2K…..,A+(n-1)K
第七章 抽样
社会定量研究方法
抽样的概念和类型 非概率抽样方法 概率抽样的原理与程序 概率抽样方法 户内抽样 样本规模与抽样误差
浙江工业大学
一、抽样的概念和类型
社会定量研究方法
一、抽样概念 1.总体population:调查研究的全部事物, 是构成它的所有元素的集合。 人口普查——全国人口 2.样本sample:从总体中按一定方式抽取
(五)多级抽样
社会定量研究方法
1、含义:按抽样元素的隶属关系或层次
关系,把抽样分为几个阶段进行。
e.g.大学——院系——班级——学生
浙江工业大学
社会定量研究方法
2、多级抽样的步骤
以大群为单位编制抽样框 抽取若干大群 以小群为单位给每个大群编制抽样框 分别从每个大群中抽取小群 根据需要重复3、4步骤 得到基本元素,构成研究样本
定抽取100个企业作为样本调查,请问:
1、采取简单随机还是分层随机,为什么?如果是后者, 分层标准是什么? 2、如按产业分为三个类型后发现,该市第一产业80个、第二 产业320个,第三产业400个。七天连锁酒店请问,从中抽取100个 样本的话,各产业层次你各抽取多少个? 3、第一产业占总体10%,所以按比例抽10个;第二产业40 个;第三产业50个。这具体的10个、40个、50个又该如何 抽取?
所选号码 012
入样元素 元素1
048、095
元素2、3
133 148 171 … 995
元素4 元素5 元素6 … 元素20
浙江工业大学
社会定量研究方法
由于规模大的企业其所对应的选择号码范围也 大,而选样号码范围大时,被抽中的概率也大 (有些特别大的企业还可能抽到不止一个号码, 比如企业3就抽到两个号码。那么在第二阶段 抽样中,就要从企业3中抽取50×2=100名职 工)。由于规模大的企业在第一阶段抽样时被抽 中的概率大于规模小的企业,这样就补偿了第 二阶段抽样时规模大的企业中每个职工被抽中 的概率小的情况,使得无论规模大还是规模小 的企业中,每个职工总的被抽中的概率都是相 等的。所以,这种方法最终抽出的样本对总体 的代表性也大。
很小,因而抽样调查成为最常用的研究
方法之一。
浙江工业大学
二、非概率抽样方法
社会定量研究方法
非概率抽样: ——依据研究者的主观意愿、判断或是
否方便等因素来抽取对象的方法。
浙江工业大学
社会定量研究方法
一、偶遇抽样 accidental sampling/方便抽 样 ——按调查者的方便任意抽取样本。 二、判断抽样judgemental/立意抽样
所占比例 1.5% 1% 8% 0.1% 0.6% 3% 0.4% 0.3% 0.7% 2.1% … 0.2% 0.9% 0.3%
累计 1.5% 2.5% 10.5% 10.6% 11.2% 14.2% 14.6% 14.9% 15.6% 17.7% … 98.8% 99.7% 100%
选择号码范 围 000-014 015-024 025-104 105 106-111 112-141 142-145 146-148 149-155 156-176 … 978-987 988-996 997-999
浙江工业大学
(四)整群抽样cluster sampling
社会定量研究方法
1、含义:将总体按某种标准划分为一些子群 体,每个子群为一个抽样单位,用随机方 法从中抽若干子群,将抽出的子群中的所 有个体结合起来构成样本。
划分 子群 随机 抽样
浙江工业大学
社会定量研究方法
2、整群抽样的步骤
(1)将总体分成若干小群体(可以按照 自然地理、社会组织结构等分) (2)在若干小群体中随机抽取一定数量 的小群体 (3)对抽取的小群体中每一个单位逐个 进行调查
浙江工业大学
社会定量研究方法
3、整群抽样的特点
优点:1.简化抽样过程,降低费用
2.可扩大抽样规模 3.更容易取得抽样框
缺点:样本分布面不广,代表性较差,尤其
是当子群间异质性较强时,影响代表性更 明显。
浙江工业大学
几种抽样方法的比较
社会定量研究方法
假设我们的总体是全国所有城市的集合,我们要 抽取一个规模为40个城市的样本。 若按简单随机抽样或系统抽样的方法,则首先需 要弄到一份全国城市的名单,然后根据随机数表 或通过计算抽样间距直接从抽样框中抽取城市; 若按分层抽样的方法,则可以先按城市规模将总 体分为特大城市、大城市、中等城市和小城市四 类,然后分别从每一类中抽取若干城市,并将这 些城市合起来构成样本; 如果采用整群抽样的方法,则可以以省(自治区, 直辖市)为抽样单位,从全国31个省(自治区、 直辖市)中随机抽取三至五个省(自治区、直辖市) 浙江工业大学
——研究者依据研究目标和自己主观
分析来选择和确定研究对象。
三、定额抽样quota/配额抽样
四、雪球抽样snowball
浙江工业大学
三、概率抽样的原理与程序
社会定量研究方法
(一)概率抽样的原理
保证总体中每一个个体都有相等的机 会入选样本。
当总体情况不明时,无法做到随机抽样。
浙江工业大学
社会定量研究方法
浙江工业大学
社会定量研究方法
采用PPS的方法:先将各个元素(即企业) 排列起来,然后写出它们的规模、计算它 们的规模在总体规模中所占的比例;将 它们的比例累计起来,并根据比例的累 计数依次写出每一元素所对应的选择号 码范围,然后采用随机数表的方法或系 统抽样的方法选择号码,号码所对应的 元素入选第一阶段样本,最后再从所选 样本中进行第二阶段抽样(即从每个被抽 中的元素中抽取50名职工)。
097 098
009
010
019
020
029
030
099
100
浙江工业大学
练习
社会定量研究方法
练习:从某乡3000户农民中抽取150户作为样本调查农
民收入情况,按照等距抽样方法,如何操作?
浙江工业大学
(三)分层抽样
社会定量研究方法
1、含义:先将总体中所有单位按某种特征或 标志划分为若干类型或层次,然后再在各 个类型或层次中采用简单随机抽样或系统 抽样的方法抽取一个子样本,将其合成样 本。
浙江工业大学
社会定量研究方法
6.参数值/总体值
——是对总体元素特征的综合数量表现。
7.统计值/样本值
——是根据样本计算出来的关于样本变
量的数量表现。
浙江工业大学
社会定量研究方法
(二)抽样的作用
基本作用:是人们从部分认识整体的关 键环节 必要性:研究人员难以做到任何研究都 进行全面调查,而抽样误差可以控制到
(1)优点:既可了解总体也可以了解类别;
不同层可再采取不同方法;样本数相同 时,误差比简单随机法小,误差要求相 同时,抽取样本比简单随机少
(2)缺点:对分层准确性要求高
(3)适用范围:个体数目较多,内部差异
较大,既要了解总体也要了解类别时
浙江工业大学
练习
社会定量研究方法
练习:要了解某市800个私营企业的生产经营状况,决
出来的一部分元素的集合,是总体的一
个子集。
浙江工业大学
社会定量研究方法
3.抽样sampling:从总体中按一定方式抽 取样本的过程。 4.抽样单位sampling unit:一次直接的抽 样所使用的基本单位。 从全班50人中抽取10人构成小样本, 个人(学生)是抽样单位 5.抽样框sampling frame:指一次直接抽样 时总体所有抽样单位的名单。 。
机抽取n个元素组成样本,类似于抽签。
(二)方法。
A 总体元素较少时,类似于抽签方法。 B 总体元素较多时,随机数表法
浙江工业大学
(二)系统抽样/等距抽样
社会定量研究方法
(一)含义:把总体的单位进行编号排序后,
再计算出某种间隔,然后按这一固定的间 隔抽取个体的号码组成样本的方法。P134
第三阶段 每所抽30名教师 每所抽30名教师 每所抽6名教师 每所抽10名教师 每所抽20名教师 每所抽30名教师 每所抽40名教师 每所抽60名教师 每所抽100名教师
浙江工业大学
社会定量研究方法
究竟该选择哪一种抽样方案呢?或者说,如何确定
每一阶段抽样的单位数目呢?主要考虑的因素有
两方面:
(1)各个抽样阶段中的子总体同质性程度。同质性 程度越高的子总体,所抽的规模就应相对小一点; 反之,则应大一点。 (2)要考虑研究者所拥有的人力和经费。
浙江工业大学
用PPS方法抽取第一阶段样本举例
社会定量研究方法
序号 企业1 企业2 企业3 企业4 企业5 企业6 企业7 企业8 企业9 企业10 … 企业98 企业99 企业100
规模 3000 2000 16000 200 1200 6000 800 600 1400 4200 … 400 1800 600
浙江工业大学
社会定量研究方法
在运用多段抽样方法时,有一点需要注意
,就是要在类别和个体之间保持平衡。或
者说,保持合适的比例。
举例来说,假设某市七天连锁酒店共有
2.4万名教师,他们分布在全市10个区的
200所学校中。现在要抽取一个由1200名
教师组成的样本。如果按照三阶段抽样的
方法,我们就可以有下列各种不同的抽样
分类 随机 抽样
总体
子群
样本
浙江工业大学
社会定量研究方法
2、与定额抽样的区别
(1)目的不同:定额抽样要保证样本与总
体在结构比例表面上一致;分层抽样则 包括比例分层和非比例分层。
(2)方法不同:定额抽样中各层样本是非
随机抽取的;而分层抽样中各层样本是 随机抽取的。
浙江工业大学
社会定量研究在其他条件不变的情况下,样本所覆
盖的面越大,样本的代表性也越大。
浙江工业大学
社会定量研究方法
3、多级抽样的特点
优点:不需要总体全部名单,抽样较容易;
节约人力物力
缺点:每级抽样都会有误差,故误差较大
浙江工业大学
(六)PPS抽样
社会定量研究方法
当元素的大小不同,或者元素在总体中的地位不同 时,我们需要采用不等概率抽样的方法。比如,从全 市几百家企业中抽取20家企业进行调查时,一个有着 数万职工的大型企业与一个只有一二百人的小企业所 占的地位,显然是很不一样的。如果此时仍然采用等 概率抽样的方法,则样本的代表性和精度都会比较差 。而如果采用不等概率抽样的方法,使大的企业入选 样本的概率大一些,小企业入选样本的概率小一些, 这样就可以大大提高估计的精度。 社会研究中最重要、也最常用的一种不等概率抽样 叫做“概率与元素的规模大小成比例的抽样” (sampling with probability proportionate to size ), 简称PPS抽样。
社会定量研究方法
假设要从全市100家企业,总共20万名职工中,抽取 1000名职工进行调查。已知最大的企业多达16000名 职工,而最小的企业则只有200名职工。 如果我们采取多段抽样的方法,先从100家企业中随机 抽取若干家企业,比如说抽取20家;然后再从这20家 企业中分别抽取50名职工(50×20=1000)构成样本。 第一阶段:入选概率是相同的,即都为20÷100=20% 第二阶段:规模大的企业中每个职工被抽中的概率则 为20%×(50÷16000)=0.0625%;规模小的企业中 每个职工被抽中的概率为20%×(50÷200)=5%
浙江工业大学
社会定量研究方法
第一阶段 方案1 方案2 方案3 方案4 方案5 方案6 方案7 方案8 方案9 抽10区 抽2区 抽10区 抽8区 抽5区 抽4区 抽3区 抽2区 抽1区
第二阶段 抽4所学校 抽20所学校 抽20所学校 抽15所学校 抽12所学校 抽10所学校 抽10所学校 抽10所学校 抽12所学校
05,15,25,….,95
浙江工业大学
社会定量研究方法
001
002
011
012
021
022
031
032
…
091
092
003
004
013
014
023
024
033
034
093
094
√ 005
006
007 008
√ 015
016
017 018
√ 025
026
027 028
√ 035
…..
√ 095
096
(二)抽样的一般程序
1.界定总体 2.制定抽样框
3.决定抽样方案(准备采用哪种抽样方法)
4.实际抽取样本
——先抽好样本再调查
——边抽部分样本边调查
5.评估样本质量
浙江工业大学
四、概率抽样方法
社会定量研究方法
一、简单随机抽样simple random
sampling
(一)——从含有N个元素的总体中直接随
(二)具体步骤:
1.将总体的所有个体按顺序编号
2.计算抽样间距K
K=
N(总体规模)
n(样本规模)
浙江工业大学
社会定量研究方法
3.在头K个个体中随机确定起点(A)
e.g.如果K=10,就从01-10号中抽签决定 一个号码作为起点,假定为05 4.从A开始,七天连锁酒店每隔K个个体抽 取一个个体,组成样本: A,A+K,A+2K…..,A+(n-1)K
第七章 抽样
社会定量研究方法
抽样的概念和类型 非概率抽样方法 概率抽样的原理与程序 概率抽样方法 户内抽样 样本规模与抽样误差
浙江工业大学
一、抽样的概念和类型
社会定量研究方法
一、抽样概念 1.总体population:调查研究的全部事物, 是构成它的所有元素的集合。 人口普查——全国人口 2.样本sample:从总体中按一定方式抽取
(五)多级抽样
社会定量研究方法
1、含义:按抽样元素的隶属关系或层次
关系,把抽样分为几个阶段进行。
e.g.大学——院系——班级——学生
浙江工业大学
社会定量研究方法
2、多级抽样的步骤
以大群为单位编制抽样框 抽取若干大群 以小群为单位给每个大群编制抽样框 分别从每个大群中抽取小群 根据需要重复3、4步骤 得到基本元素,构成研究样本
定抽取100个企业作为样本调查,请问:
1、采取简单随机还是分层随机,为什么?如果是后者, 分层标准是什么? 2、如按产业分为三个类型后发现,该市第一产业80个、第二 产业320个,第三产业400个。七天连锁酒店请问,从中抽取100个 样本的话,各产业层次你各抽取多少个? 3、第一产业占总体10%,所以按比例抽10个;第二产业40 个;第三产业50个。这具体的10个、40个、50个又该如何 抽取?
所选号码 012
入样元素 元素1
048、095
元素2、3
133 148 171 … 995
元素4 元素5 元素6 … 元素20
浙江工业大学
社会定量研究方法
由于规模大的企业其所对应的选择号码范围也 大,而选样号码范围大时,被抽中的概率也大 (有些特别大的企业还可能抽到不止一个号码, 比如企业3就抽到两个号码。那么在第二阶段 抽样中,就要从企业3中抽取50×2=100名职 工)。由于规模大的企业在第一阶段抽样时被抽 中的概率大于规模小的企业,这样就补偿了第 二阶段抽样时规模大的企业中每个职工被抽中 的概率小的情况,使得无论规模大还是规模小 的企业中,每个职工总的被抽中的概率都是相 等的。所以,这种方法最终抽出的样本对总体 的代表性也大。
很小,因而抽样调查成为最常用的研究
方法之一。
浙江工业大学
二、非概率抽样方法
社会定量研究方法
非概率抽样: ——依据研究者的主观意愿、判断或是
否方便等因素来抽取对象的方法。
浙江工业大学
社会定量研究方法
一、偶遇抽样 accidental sampling/方便抽 样 ——按调查者的方便任意抽取样本。 二、判断抽样judgemental/立意抽样
所占比例 1.5% 1% 8% 0.1% 0.6% 3% 0.4% 0.3% 0.7% 2.1% … 0.2% 0.9% 0.3%
累计 1.5% 2.5% 10.5% 10.6% 11.2% 14.2% 14.6% 14.9% 15.6% 17.7% … 98.8% 99.7% 100%
选择号码范 围 000-014 015-024 025-104 105 106-111 112-141 142-145 146-148 149-155 156-176 … 978-987 988-996 997-999
浙江工业大学
(四)整群抽样cluster sampling
社会定量研究方法
1、含义:将总体按某种标准划分为一些子群 体,每个子群为一个抽样单位,用随机方 法从中抽若干子群,将抽出的子群中的所 有个体结合起来构成样本。
划分 子群 随机 抽样
浙江工业大学
社会定量研究方法
2、整群抽样的步骤
(1)将总体分成若干小群体(可以按照 自然地理、社会组织结构等分) (2)在若干小群体中随机抽取一定数量 的小群体 (3)对抽取的小群体中每一个单位逐个 进行调查
浙江工业大学
社会定量研究方法
3、整群抽样的特点
优点:1.简化抽样过程,降低费用
2.可扩大抽样规模 3.更容易取得抽样框
缺点:样本分布面不广,代表性较差,尤其
是当子群间异质性较强时,影响代表性更 明显。
浙江工业大学
几种抽样方法的比较
社会定量研究方法
假设我们的总体是全国所有城市的集合,我们要 抽取一个规模为40个城市的样本。 若按简单随机抽样或系统抽样的方法,则首先需 要弄到一份全国城市的名单,然后根据随机数表 或通过计算抽样间距直接从抽样框中抽取城市; 若按分层抽样的方法,则可以先按城市规模将总 体分为特大城市、大城市、中等城市和小城市四 类,然后分别从每一类中抽取若干城市,并将这 些城市合起来构成样本; 如果采用整群抽样的方法,则可以以省(自治区, 直辖市)为抽样单位,从全国31个省(自治区、 直辖市)中随机抽取三至五个省(自治区、直辖市) 浙江工业大学
——研究者依据研究目标和自己主观
分析来选择和确定研究对象。
三、定额抽样quota/配额抽样
四、雪球抽样snowball
浙江工业大学
三、概率抽样的原理与程序
社会定量研究方法
(一)概率抽样的原理
保证总体中每一个个体都有相等的机 会入选样本。
当总体情况不明时,无法做到随机抽样。
浙江工业大学
社会定量研究方法
浙江工业大学
社会定量研究方法
采用PPS的方法:先将各个元素(即企业) 排列起来,然后写出它们的规模、计算它 们的规模在总体规模中所占的比例;将 它们的比例累计起来,并根据比例的累 计数依次写出每一元素所对应的选择号 码范围,然后采用随机数表的方法或系 统抽样的方法选择号码,号码所对应的 元素入选第一阶段样本,最后再从所选 样本中进行第二阶段抽样(即从每个被抽 中的元素中抽取50名职工)。
097 098
009
010
019
020
029
030
099
100
浙江工业大学
练习
社会定量研究方法
练习:从某乡3000户农民中抽取150户作为样本调查农
民收入情况,按照等距抽样方法,如何操作?
浙江工业大学
(三)分层抽样
社会定量研究方法
1、含义:先将总体中所有单位按某种特征或 标志划分为若干类型或层次,然后再在各 个类型或层次中采用简单随机抽样或系统 抽样的方法抽取一个子样本,将其合成样 本。
浙江工业大学
社会定量研究方法
6.参数值/总体值
——是对总体元素特征的综合数量表现。
7.统计值/样本值
——是根据样本计算出来的关于样本变
量的数量表现。
浙江工业大学
社会定量研究方法
(二)抽样的作用
基本作用:是人们从部分认识整体的关 键环节 必要性:研究人员难以做到任何研究都 进行全面调查,而抽样误差可以控制到
(1)优点:既可了解总体也可以了解类别;
不同层可再采取不同方法;样本数相同 时,误差比简单随机法小,误差要求相 同时,抽取样本比简单随机少
(2)缺点:对分层准确性要求高
(3)适用范围:个体数目较多,内部差异
较大,既要了解总体也要了解类别时
浙江工业大学
练习
社会定量研究方法
练习:要了解某市800个私营企业的生产经营状况,决
出来的一部分元素的集合,是总体的一
个子集。
浙江工业大学
社会定量研究方法
3.抽样sampling:从总体中按一定方式抽 取样本的过程。 4.抽样单位sampling unit:一次直接的抽 样所使用的基本单位。 从全班50人中抽取10人构成小样本, 个人(学生)是抽样单位 5.抽样框sampling frame:指一次直接抽样 时总体所有抽样单位的名单。 。
机抽取n个元素组成样本,类似于抽签。
(二)方法。
A 总体元素较少时,类似于抽签方法。 B 总体元素较多时,随机数表法
浙江工业大学
(二)系统抽样/等距抽样
社会定量研究方法
(一)含义:把总体的单位进行编号排序后,
再计算出某种间隔,然后按这一固定的间 隔抽取个体的号码组成样本的方法。P134
第三阶段 每所抽30名教师 每所抽30名教师 每所抽6名教师 每所抽10名教师 每所抽20名教师 每所抽30名教师 每所抽40名教师 每所抽60名教师 每所抽100名教师
浙江工业大学
社会定量研究方法
究竟该选择哪一种抽样方案呢?或者说,如何确定
每一阶段抽样的单位数目呢?主要考虑的因素有
两方面:
(1)各个抽样阶段中的子总体同质性程度。同质性 程度越高的子总体,所抽的规模就应相对小一点; 反之,则应大一点。 (2)要考虑研究者所拥有的人力和经费。
浙江工业大学
用PPS方法抽取第一阶段样本举例
社会定量研究方法
序号 企业1 企业2 企业3 企业4 企业5 企业6 企业7 企业8 企业9 企业10 … 企业98 企业99 企业100
规模 3000 2000 16000 200 1200 6000 800 600 1400 4200 … 400 1800 600
浙江工业大学
社会定量研究方法
在运用多段抽样方法时,有一点需要注意
,就是要在类别和个体之间保持平衡。或
者说,保持合适的比例。
举例来说,假设某市七天连锁酒店共有
2.4万名教师,他们分布在全市10个区的
200所学校中。现在要抽取一个由1200名
教师组成的样本。如果按照三阶段抽样的
方法,我们就可以有下列各种不同的抽样
分类 随机 抽样
总体
子群
样本
浙江工业大学
社会定量研究方法
2、与定额抽样的区别
(1)目的不同:定额抽样要保证样本与总
体在结构比例表面上一致;分层抽样则 包括比例分层和非比例分层。
(2)方法不同:定额抽样中各层样本是非
随机抽取的;而分层抽样中各层样本是 随机抽取的。
浙江工业大学
社会定量研究在其他条件不变的情况下,样本所覆
盖的面越大,样本的代表性也越大。
浙江工业大学
社会定量研究方法
3、多级抽样的特点
优点:不需要总体全部名单,抽样较容易;
节约人力物力
缺点:每级抽样都会有误差,故误差较大
浙江工业大学
(六)PPS抽样
社会定量研究方法
当元素的大小不同,或者元素在总体中的地位不同 时,我们需要采用不等概率抽样的方法。比如,从全 市几百家企业中抽取20家企业进行调查时,一个有着 数万职工的大型企业与一个只有一二百人的小企业所 占的地位,显然是很不一样的。如果此时仍然采用等 概率抽样的方法,则样本的代表性和精度都会比较差 。而如果采用不等概率抽样的方法,使大的企业入选 样本的概率大一些,小企业入选样本的概率小一些, 这样就可以大大提高估计的精度。 社会研究中最重要、也最常用的一种不等概率抽样 叫做“概率与元素的规模大小成比例的抽样” (sampling with probability proportionate to size ), 简称PPS抽样。