第四讲研究对象的选择
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在不增加样本规模的前提下降低抽样误差,提高 抽样精度。通过分层,使各层内不同元素间的差 异变小,因而在样本规模相同时,分层抽样的误 差往往比简单随机抽样的误差小。
便于了解总体内不同层次的情况,以及对总体种 不同层次仅此行单独研究,或进行比较研究。
15
(3)分层抽样的类型
定比分层抽样:定比分层抽样指按各种类型或层次中的单 位数目同总体单位数目间的比例来抽取子样本的方法。按 比例分层抽样,可以得到一个与总体结构完全相同的样本。
22
三、非概率抽样
偶遇抽样,又叫方便抽样与自然抽样,是研究者根据现实情况,以 自己方便的形式抽取偶然遇到的人作为对象,或仅仅选取那些离得 最近、最容易找到的人作为对象。
判断抽样,研究者根据研究的目标和自己的主观分析来确定研究对 象的方法。
定额抽样,又叫配额抽样,研究者首先根据某种标准对总体进行分 层,并找出具有各种特征的成员在总体中所占的比例,然后根据这 种划分以及各类成员的比例去选择对象,使样本中的成员在各种特 征方面的构成及其在样本中的比例都尽量接近总体。
16
4。整群抽样
整群抽样的概念:整群抽样的抽样单位不是个体, 而是群体。他是从总体中随机抽取一些小群体, 然后由所抽取的小群体内所有元素构成样本。整 群抽样中对小群体的抽样可以采用简单随机抽样、 系统抽样或分层抽样的方法。
整群抽样的优点:整群抽样,不仅可以简化抽样 的过程,更重要的是它可以降低收集资料的费用, 同时还能相对地扩大抽样的应用范围。
19
20
(2)多阶段抽样应注意的问题
运用多阶段抽样时,要在类别和个体之间保持平 衡,即保持合适的比例。确定每一阶段抽样的单 位数目时,应注意两个问题: 各抽样阶段中的子总体同质性程度。同质性高的 子总体,所抽的规模相对小一点;反之,则大一 点。 要考虑研究者所拥有的人力和经费。在其他条件 不变的情况下,样本的覆盖面越大,则其代表性 越大,但样本的覆盖面越大,收集资料时所用的 时间和经费往往也越多。
(3)抽样:从组成总体的所有元素的集合中,按一定方 式选择或抽取一部分元素的过程。
(4)抽样单位:一次直接抽样所使用的单位
(5)抽样框:又叫抽样范围,一次直接抽样时总体中所 有抽样单位名单。
(6)参数值:关于总体中某一变量的综合描述,或总体 中所有元素某种特征的综合数量表现。
3
(7)统计值:关于样本中某一变量的综合描述,是样本 中所有元素的某种特征的综合数量表现。
21
多阶段抽样的优缺点
优点:多阶段抽样适用于总体范围特别大对象 的层次特别多的研究。由于这种抽样不需要全 部研究对象的名单,各阶段抽样单位数一般较 少,因而抽样比较容易进行;
缺点:每级抽样时都会产生误差,所以这种抽 样方法误差较大。
减少误差的方法:相对增大开头阶段的样本数 而适当减少最后阶段的样本数。
6
3。抽样的类型
抽样方法
概率抽样
非概率抽样
7
简单随机抽样 系统抽样 分层抽样 整群抽样 多阶段抽样
偶遇抽样 判断抽样 定额抽样 雪球抽样
4。抽样的一般程序
(1)界定总体 (2)制定抽样框 (3)决定抽样方案 (4)实际抽取样本 (5)评估样本质量
8
5.抽样的原则
目的性原则:以研究的问题为出发点,从最有利 于研究资料的获取,以及最符合研究的目的等因 素来考虑抽样的方案和方法的设计。 可测性原则:能够从样本自身计算出有效的估计 值或者抽样变动的近似值。 可行性原则:所涉及的抽样方案必须在实践上切 实可行。 经济性原则:抽样方案的选择要考虑经费、人力、 时间等因素的限制。
第四讲 抽样
主讲教师:王怀明 山东大学管理学院人力资源研究所
1
本讲主要内容
一、抽样的意义与作用 二、非概率抽样方法 三、概率抽样方法 四、样本规模与抽样误差
2
一、抽样的意义与作用
1。抽样的概念
(1)总体:构成它的所有元素的集合,元素是总体的基 本单位。
(2)样本:从wenku.baidu.com体中按一定方式抽取的一部分元素的集 合。
位数码; (4)对随即数码表中的数码逐一进行衡量并决定取舍; (5)根据样本规模的要求选择出足够的数码个数; (6)依据从随机数码表中选出的数码,到抽样框中去找
出它对应的元素。
10
11
2。系统抽样
系统抽样又叫等距抽样或机械抽样。把总体的单位进行编 码和排序后,计算出某种间隔,然后按这一固定间隔抽取 个体的号码来组成样本的方法。其具体步骤是: (1)给总体中的每一个个体按顺序编号,制定出抽样框; (2)计算出抽样间距。K=N/n (3)在最前面的K个个体中,采用简单随机抽样的方法, 抽取第一个个体,记下这个个体的编号,它作为随机的起 点。 (4)在抽样框中,每隔K个个体抽取一个个体; (5)将这n个个体合起来,就构成了该总体的一个样本。
4
经典案例
案例1:1936年美国总统大选,《文摘》杂志寄 出1000万张询问投票倾向的明信片,回收200万 份,结果预测兰登以领先罗斯福15%选票获胜, 结果罗斯福以领先兰登20%的选票当选。
5
案例2:1968年盖洛普和哈里斯民意测验 公司从7300万登记选民中抽取2000人做 样本,分别预测尼克松将获得43%和41% 的选票,选举结果是尼克松实际得票 42.9%。
2。抽样的作用
抽样是由部分认识总体的手段。在社会科学研究中,最 好的方式是对研究总体进行普遍调查,但在实际研究过程 中,有时候这种方法非常困难,有时甚至不可能,因此, 抽样调查就成为一种常用的方法。 抽取的样本之所以能代表总体,是由建立在概率论基础 上的大数法则和中心极限定理所严格证明的。 能否达到由部分认识总体,关键在于从总体中抽取的样 本对于总体来说具有多大代表性。
(1)对于较小的样本来说,样本规模上的很小一 点增加,都可以带来精确性方面的明显增加。
(2)对于较大的样本来说,同样增加这么多个案, 却收效甚微。许多公司通常将他们的样本规模 限制在2000以内,因为当样本规模超过这一点 时,增加样本规模所带来的精确性的提高,相 对于因为增加样本量造成的人力、物力的增加 来说,得不偿失。
9
三、概率抽样
1。简单随机抽样:按照概率原则直接从含有N个元素的总 体中随机抽取n个元素组成样本,常用的办法类似于抽 签。当总体元素较多时,常用随机数码表来抽样。其步 骤是:
(1)先取得一份总体所有元素的名单; (2)将总体中的所有元素一一按顺序编码; (3)根据总体规模是几位数来确定从随即数码表中选几
n
t2×σ2
e2
n
t2×p(1-p)
e2
24
2。影响样本规模确定的因素
总体规模 抽样的精确性 总体的异质性程度 研究人员拥有的经费、人力和时间
25
3。样本规模与抽样误差
抽样误差指用样本值去估计总体值时所出现的 误差。抽样误差取决于总体的方差分布和抽样 规模。
抽样误差与样本规模之间的关系
雪球抽样,当我们无法了解总体情况时,可以从总体中少数成员入 手,对他们进行调查,然后向他们询问还知道哪些符合条件的人, 再去找那些人并询问他们知道的人。
23
四、样本规模与抽样误差
1。样本规模 样本规模又叫样本容量,指样本中所包含个案的 多少。一般的统计学中常以30为界,但社会研究 中的样本规模至少不能少于100个个案。 简单随机抽样中样本规模的计算公式
异比分层抽样:当总体中有的类型或层次的单位数目太少 时,如果以定比分层抽样的方法抽取样本,有的层次在样 本中个案太少,不便于了解各层次的情况,这时往往采取 异比分层抽样的方法。
异比分层抽样主要目的是对不同层次进行专门研究或进行 比较研究,但用样本资料推断总体时,需要对各层的数据 资料进行加权处理。
当总体是由不同类型的子群体组成,同时,不同 子群体间差别较大,子群体内部差别不大时,适 合于分层抽样;当不同子群体间差别不大,但每 个子群内部差别较大时,则适合于采取整群抽样。
18
5。多阶段抽样
(1)多阶段抽样的概念
多阶段抽样又叫多级抽样或分段抽样,是按 抽样元素的隶属关系或层次关系,把抽样过 程分成几个阶段进行。当总体的规模特别大 或总体分布的范围特别广时,一般采用多阶 段抽样的方法抽取样本。多阶段抽样的具体 做法:先从总体中抽取若干大群,然后再从 这几个大群内抽取几个小群,这样一层层抽 下来,直到抽到最基本的抽样元素为止。
26
整群抽样的缺点:样本的分布范围不广,样本对 总体的代表性较差。
17
整群抽样与分层抽样的比较
相同点:都不是直接抽取样本,而是先把总体进 行分类,然后再抽取样本。
不同点:分层抽样中每个层次都被抽到,但每层 内的个体是随机抽取的;整群抽样种不同的层或 类型是随机抽取的,但被抽取的层或类型内的个 体则全部进入样本中。
12
3。分层抽样
(1)分层抽样的概念。分层抽样又叫类型抽样, 将总体中所有单位按某种特征或标志划分成若干 类型或层次,然后再在各个类型或层次中采用简 单随机抽样或系统抽样的方法抽取一个字样本, 最后将这些子样本合起来构成总体的样本。
13
技术人员
员工总体 一般员工
管理人员
14
(2)分层抽样的优点
便于了解总体内不同层次的情况,以及对总体种 不同层次仅此行单独研究,或进行比较研究。
15
(3)分层抽样的类型
定比分层抽样:定比分层抽样指按各种类型或层次中的单 位数目同总体单位数目间的比例来抽取子样本的方法。按 比例分层抽样,可以得到一个与总体结构完全相同的样本。
22
三、非概率抽样
偶遇抽样,又叫方便抽样与自然抽样,是研究者根据现实情况,以 自己方便的形式抽取偶然遇到的人作为对象,或仅仅选取那些离得 最近、最容易找到的人作为对象。
判断抽样,研究者根据研究的目标和自己的主观分析来确定研究对 象的方法。
定额抽样,又叫配额抽样,研究者首先根据某种标准对总体进行分 层,并找出具有各种特征的成员在总体中所占的比例,然后根据这 种划分以及各类成员的比例去选择对象,使样本中的成员在各种特 征方面的构成及其在样本中的比例都尽量接近总体。
16
4。整群抽样
整群抽样的概念:整群抽样的抽样单位不是个体, 而是群体。他是从总体中随机抽取一些小群体, 然后由所抽取的小群体内所有元素构成样本。整 群抽样中对小群体的抽样可以采用简单随机抽样、 系统抽样或分层抽样的方法。
整群抽样的优点:整群抽样,不仅可以简化抽样 的过程,更重要的是它可以降低收集资料的费用, 同时还能相对地扩大抽样的应用范围。
19
20
(2)多阶段抽样应注意的问题
运用多阶段抽样时,要在类别和个体之间保持平 衡,即保持合适的比例。确定每一阶段抽样的单 位数目时,应注意两个问题: 各抽样阶段中的子总体同质性程度。同质性高的 子总体,所抽的规模相对小一点;反之,则大一 点。 要考虑研究者所拥有的人力和经费。在其他条件 不变的情况下,样本的覆盖面越大,则其代表性 越大,但样本的覆盖面越大,收集资料时所用的 时间和经费往往也越多。
(3)抽样:从组成总体的所有元素的集合中,按一定方 式选择或抽取一部分元素的过程。
(4)抽样单位:一次直接抽样所使用的单位
(5)抽样框:又叫抽样范围,一次直接抽样时总体中所 有抽样单位名单。
(6)参数值:关于总体中某一变量的综合描述,或总体 中所有元素某种特征的综合数量表现。
3
(7)统计值:关于样本中某一变量的综合描述,是样本 中所有元素的某种特征的综合数量表现。
21
多阶段抽样的优缺点
优点:多阶段抽样适用于总体范围特别大对象 的层次特别多的研究。由于这种抽样不需要全 部研究对象的名单,各阶段抽样单位数一般较 少,因而抽样比较容易进行;
缺点:每级抽样时都会产生误差,所以这种抽 样方法误差较大。
减少误差的方法:相对增大开头阶段的样本数 而适当减少最后阶段的样本数。
6
3。抽样的类型
抽样方法
概率抽样
非概率抽样
7
简单随机抽样 系统抽样 分层抽样 整群抽样 多阶段抽样
偶遇抽样 判断抽样 定额抽样 雪球抽样
4。抽样的一般程序
(1)界定总体 (2)制定抽样框 (3)决定抽样方案 (4)实际抽取样本 (5)评估样本质量
8
5.抽样的原则
目的性原则:以研究的问题为出发点,从最有利 于研究资料的获取,以及最符合研究的目的等因 素来考虑抽样的方案和方法的设计。 可测性原则:能够从样本自身计算出有效的估计 值或者抽样变动的近似值。 可行性原则:所涉及的抽样方案必须在实践上切 实可行。 经济性原则:抽样方案的选择要考虑经费、人力、 时间等因素的限制。
第四讲 抽样
主讲教师:王怀明 山东大学管理学院人力资源研究所
1
本讲主要内容
一、抽样的意义与作用 二、非概率抽样方法 三、概率抽样方法 四、样本规模与抽样误差
2
一、抽样的意义与作用
1。抽样的概念
(1)总体:构成它的所有元素的集合,元素是总体的基 本单位。
(2)样本:从wenku.baidu.com体中按一定方式抽取的一部分元素的集 合。
位数码; (4)对随即数码表中的数码逐一进行衡量并决定取舍; (5)根据样本规模的要求选择出足够的数码个数; (6)依据从随机数码表中选出的数码,到抽样框中去找
出它对应的元素。
10
11
2。系统抽样
系统抽样又叫等距抽样或机械抽样。把总体的单位进行编 码和排序后,计算出某种间隔,然后按这一固定间隔抽取 个体的号码来组成样本的方法。其具体步骤是: (1)给总体中的每一个个体按顺序编号,制定出抽样框; (2)计算出抽样间距。K=N/n (3)在最前面的K个个体中,采用简单随机抽样的方法, 抽取第一个个体,记下这个个体的编号,它作为随机的起 点。 (4)在抽样框中,每隔K个个体抽取一个个体; (5)将这n个个体合起来,就构成了该总体的一个样本。
4
经典案例
案例1:1936年美国总统大选,《文摘》杂志寄 出1000万张询问投票倾向的明信片,回收200万 份,结果预测兰登以领先罗斯福15%选票获胜, 结果罗斯福以领先兰登20%的选票当选。
5
案例2:1968年盖洛普和哈里斯民意测验 公司从7300万登记选民中抽取2000人做 样本,分别预测尼克松将获得43%和41% 的选票,选举结果是尼克松实际得票 42.9%。
2。抽样的作用
抽样是由部分认识总体的手段。在社会科学研究中,最 好的方式是对研究总体进行普遍调查,但在实际研究过程 中,有时候这种方法非常困难,有时甚至不可能,因此, 抽样调查就成为一种常用的方法。 抽取的样本之所以能代表总体,是由建立在概率论基础 上的大数法则和中心极限定理所严格证明的。 能否达到由部分认识总体,关键在于从总体中抽取的样 本对于总体来说具有多大代表性。
(1)对于较小的样本来说,样本规模上的很小一 点增加,都可以带来精确性方面的明显增加。
(2)对于较大的样本来说,同样增加这么多个案, 却收效甚微。许多公司通常将他们的样本规模 限制在2000以内,因为当样本规模超过这一点 时,增加样本规模所带来的精确性的提高,相 对于因为增加样本量造成的人力、物力的增加 来说,得不偿失。
9
三、概率抽样
1。简单随机抽样:按照概率原则直接从含有N个元素的总 体中随机抽取n个元素组成样本,常用的办法类似于抽 签。当总体元素较多时,常用随机数码表来抽样。其步 骤是:
(1)先取得一份总体所有元素的名单; (2)将总体中的所有元素一一按顺序编码; (3)根据总体规模是几位数来确定从随即数码表中选几
n
t2×σ2
e2
n
t2×p(1-p)
e2
24
2。影响样本规模确定的因素
总体规模 抽样的精确性 总体的异质性程度 研究人员拥有的经费、人力和时间
25
3。样本规模与抽样误差
抽样误差指用样本值去估计总体值时所出现的 误差。抽样误差取决于总体的方差分布和抽样 规模。
抽样误差与样本规模之间的关系
雪球抽样,当我们无法了解总体情况时,可以从总体中少数成员入 手,对他们进行调查,然后向他们询问还知道哪些符合条件的人, 再去找那些人并询问他们知道的人。
23
四、样本规模与抽样误差
1。样本规模 样本规模又叫样本容量,指样本中所包含个案的 多少。一般的统计学中常以30为界,但社会研究 中的样本规模至少不能少于100个个案。 简单随机抽样中样本规模的计算公式
异比分层抽样:当总体中有的类型或层次的单位数目太少 时,如果以定比分层抽样的方法抽取样本,有的层次在样 本中个案太少,不便于了解各层次的情况,这时往往采取 异比分层抽样的方法。
异比分层抽样主要目的是对不同层次进行专门研究或进行 比较研究,但用样本资料推断总体时,需要对各层的数据 资料进行加权处理。
当总体是由不同类型的子群体组成,同时,不同 子群体间差别较大,子群体内部差别不大时,适 合于分层抽样;当不同子群体间差别不大,但每 个子群内部差别较大时,则适合于采取整群抽样。
18
5。多阶段抽样
(1)多阶段抽样的概念
多阶段抽样又叫多级抽样或分段抽样,是按 抽样元素的隶属关系或层次关系,把抽样过 程分成几个阶段进行。当总体的规模特别大 或总体分布的范围特别广时,一般采用多阶 段抽样的方法抽取样本。多阶段抽样的具体 做法:先从总体中抽取若干大群,然后再从 这几个大群内抽取几个小群,这样一层层抽 下来,直到抽到最基本的抽样元素为止。
26
整群抽样的缺点:样本的分布范围不广,样本对 总体的代表性较差。
17
整群抽样与分层抽样的比较
相同点:都不是直接抽取样本,而是先把总体进 行分类,然后再抽取样本。
不同点:分层抽样中每个层次都被抽到,但每层 内的个体是随机抽取的;整群抽样种不同的层或 类型是随机抽取的,但被抽取的层或类型内的个 体则全部进入样本中。
12
3。分层抽样
(1)分层抽样的概念。分层抽样又叫类型抽样, 将总体中所有单位按某种特征或标志划分成若干 类型或层次,然后再在各个类型或层次中采用简 单随机抽样或系统抽样的方法抽取一个字样本, 最后将这些子样本合起来构成总体的样本。
13
技术人员
员工总体 一般员工
管理人员
14
(2)分层抽样的优点