第四章 抽样技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 抽样技术
STAT
§4.1 抽样调查的一般理论 §4.2 随机抽样技术 §4.3 非随机抽样技术
§4.1 抽样调查的一般理论
一、基本概念 二、基本准则 三、基本方法 四、抽样误差的确定 五、样本容量的确定
STAT
一、基本概念
STAT
1.全及总体 1.全及总体 简称总体或母体, 简称总体或母体,是指所要调查认识的研究对 象的全体,它由具有某种共同性质或特征的单 象的全体, 位组成。用字母N表示。 位组成。用字母N表示。 2.样本总体 2.样本总体 简称样本, 简称样本,指在全及总体中抽取部分单位所构 成的小总体。用字母n表示。 成的小总体。用字母n表示。
STAT
完全代表总体而导致的误差。 完全代表总体而导致的误差。
原 因
记 差 登 误 误差 统 误 系 性 差 表 误 代 性 差 机 差 随 误
三种误差的区别: 三种误差的区别:
STAT
• 登记误差:由于人的主观失误在观察、登 登记误差:由于人的主观失误在观察、 主观失误在观察
抽样调查的一般步骤
STAT
设 计 抽 样 方 案
抽 取 样 本 单 位
收 集 样 本 数 据
计 算 样 本 统 计 量
推 断 总 体 参 数
二、基本准则
STAT
1.随机原则 1.随机原则 ——抽取样本单位时,应确保每个总体单位都 抽取样本单位时, 抽取样本单位时 有被抽取的可能. 有被抽取的可能 2.抽样误差最小 2.抽样误差最小 ——在其他条件相同的情况下,选抽样误差 在其他条件相同的情况下, 在其他条件相同的情况下 设计抽样方案时, 设计抽样方案时,通常是 最小的方案. 最小的方案 在误差达到一定要求的条 3.费用最少 3.费用最少 件下,选择费用最少的方案 件下, —在其他条件相同的情况下,选费用最少的 在其他条件相同的情况下, 在其他条件相同的情况下 方案. 方案
STAT
抽出 个体 特点
登记 特征
继续 抽取
同一总体中每个单位被抽中的机会并 不均等,在连续抽取时,每次抽取都 不均等,在连续抽取时, 不是独立进行。 不是独立进行。
是最常用的抽样方法,用于无限总体和许多 是最常用的抽样方法, 有限总体样本单位的抽样。 有限总体样本单位的抽样。
四、抽样误差
----指所选取的样本的结果不能
2. 分层最佳抽样: 分层最佳抽样:
•指不仅按各层单位数占总体单位数的 指不仅按各层单位数占总体单位数的 指不仅按 比例分配各层的样本数 分配各层的样本数, 比例分配各层的样本数,还根据各层 标准差的大小来调整各层样本数目的 的大小来调整 标准差的大小来调整各层样本数目的 抽样方法。 抽样方法。 每层抽取的样本数计算公式 计算公式为 每层抽取的样本数计算公式为: N iσ i ni = ×n ∑ N iσ i
全及总体指标: 全及总体指标:
参数(未知量) 参数(未知量) 统计推断
STAT
样本总体指标: 样本总体指标:统
计量(已知量) 计量(已知量)
注意
全及总体是唯一确定 的,样本总体不唯一
3.抽样调查 3.抽样调查
又称为抽样推断或抽样估计,指从总体中抽 取一部分单位作为样本进行调查, 取一部分单位作为样本进行调查,然后根据 样本调查结果对总体情况作出推断和估计的 一种统计方法,是一种非全面调查 一种统计方法,是一种非全面调查 。 类别
式 中: ni为第i层抽出的样本数 ni为第 为第i
Ni为第i Ni为第i层的总单位数 为第 σ i 为第i层的标准差 为第i n 为总体样本数
STAT
STAT
例 如( 2): 仍用上例资料, 仍用上例资料,假设各类型书店图书销 售额的标准差估计值为:大型20000 标准差估计值为 20000元 售额的标准差估计值为:大型20000元;中 8000元 小型5000 5000元 按照最佳抽样法 最佳抽样法应 型8000元;小型5000元。按照最佳抽样法应 从各层中抽取多少家书店进行调查? 从各层中抽取多少家书店进行调查?
STAT
一般来讲:当 n ≥ 30,称为大样本; 30,称为大样本 大样本; 一般来讲:
30,称为小样本。 小样本。 30,称为小样本
确定适当样本容量的意义: 确定适当样本容量的意义:
若n过大,调查工作量增大,体现不出抽样 过大,调查工作量增大, 调查的优越性; 调查的优越性; 若n 过小,抽样误差会增大,抽样推断就 过小,抽样误差会增大, 会失去价值。 会失去价值。
方 法 先将总体各单位进行编码,然后按照随 先将总体各单位进行编码, 机原则, 抽签法或随机数法抽取若干 机原则,用抽签法或随机数法抽取若干 数码, 数码,所有中选的数码对应的单位即构 成样本。 成样本。 给总体各单位编号后,把 给总体各单位编号后, 号码写在结构均匀的字签 上,将字签混合均匀后即 可从中抽取。 可从中抽取。
产生的误差,无法避免但可以控制。 产生的误差,无法避免但可以控制。
因 此:抽样误差一般指随机误差,而不包括登记 抽样误差一般指随机误差 而不包括登记 随机误差, 性误差和系统性偏差。 性误差和系统性偏差。
影响抽样误差的因素
标准差) 越大,抽样误差越大; σ(标准差) 越大,抽样误差越大;
STAT
总体各单位的差异程度: 总体各单位的差异程度: 样本单位数的多少: 样本单位数的多少:
确定样本容量的意义
小样本容量 节省费用但 调查误差大 调查误差 样本容量 调查费用 找出在限定费用 范围内的最大样 本容量
找出在规定误差 范围内的最小样 STAT 本容量
大样本容量 调查精度高 但费用较大
样本的可能数目 指从总体N中随机抽取n 指从总体N中随机抽取n个样本单 位,共有多少种可能的抽选结果 ⒈ 重复抽样的可能样本数目: 重复抽样的可能样本数目:
按被抽取机会是否相等,可以分为: 按被抽取机会是否相等,可以分为:
随机抽样 非随机抽样 按照随机原则 随机原则抽取样本 按照随机原则抽取样本 根据调查者主观意愿和判断选取样本 根据调查者主观意愿和判断选取样本 主观
抽样调查的特点 由部分推断总体 抽样推断的结果具有一定的可靠程度, 抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
——对总体单位不做任何分类排队, ——对总体单位不做任何分类排队,完 对总体单位不做任何分类排队 全按照随机原则直接从总体中随机抽取一 部分单位组成样本的抽样组织方式。 部分单位组成样本的抽样组织方式。 应用 仅适用于规模不大、内部各单位 仅适用于规模不大、 标志值差异较小的总体
是最简单、最基本、最符合随机原则, 是最简单、最基本、最符合随机原则,但同 时也是抽样误差最大的抽样组织形式
n
越大,抽样误差越小; 越大,抽样误差越小; 抽样方法:不重复抽样比重复抽样小; 抽样方法:不重复抽样比重复抽样小; 抽样组织方式:简单随机抽样最大。 抽样组织方式:简单随机抽样最大。
五、样本容量的确定
样本容量 指样本中含有的总体单位的 数目,通常用n 来表示。 数目,通常用 来表示。 当 n <
STAT
二、 分层抽样(类型抽样) 分层抽样(类型抽样)
—将总体按某个主要标志进行分组,再 将总体按某个主要标志进行分组, 按随机原则采用简单随机抽样方式从各组 中抽取一定数目的总体单位组成样本的抽 样组织方式。 样组织方式。
N
1
n
1
等额抽取
样本
总体 N
N
N
2
n
n
2
等比例抽取 不等比例抽取
nபைடு நூலகம்
能使样本结构更接近于总体结构, 能使样本结构更接近于总体结构,提高样本的代表 性;能同时推断总体指标和各子总体的指标
思 考:
STAT
• 假定某大学的商学院想对今年的毕业生 进行一次调查, 进行一次调查,以便了解他们的就业意 该学院共有5个专业:会计、金融、 向。该学院共有5个专业:会计、金融、 市场营销、经营管理、信息系统。 市场营销、经营管理、信息系统。今年 共有1500名毕业生,其中, 1500名毕业生 共有1500名毕业生,其中,会计专业有 500名 金融专业300 300名 市场营销300 300名 500名,金融专业300名,市场营销300名, 经营管理250 250名 信息系统150 150名 经营管理250名,信息系统150名。 • 请 问:假定要抽取的样本数为180人, 假定要抽取的样本数为180 180人 各专业按比例分别应抽取多少人? 各专业按比例分别应抽取多少人?
STAT
P
n N
= N ⋅N L N = N
共n个 个
n
⒉ 不重复抽样的可能样本数目: 不重复抽样的可能样本数目:
C
n N
= N
(N
− 1 )L
(N
− n + 1)
例如: 例如:
• 假设 N=4 n=2 (1)重复抽样时 : )重复抽样时 样本个数=4 × 样本个数 2=4×4=16 • 若改变样本单位数,取n=3 , 若改变样本单位数, 样本个数=4× × = 样本个数 ×4×4=64 (2)不重复抽样时 : )不重复抽样时 样本个数=4×3=12 样本个数 × • 若改变样本单位数,取n=3 , 若改变样本单位数, 样本个数=4× × = 样本个数 ×3×2=24
因此,抽样调查具有以下优越性: 因此,抽样调查具有以下优越性:
(1)经济性; 经济性; 准确性; (3)准确性; (2)时效性; 时效性; 灵活性。 (4)灵活性。
抽样调查的应用 不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时 用于工业生产过程中的产品质量控 制和管理
Ni ni = × n N 式 中: ni为第i层抽出的样本数 ni为第 为第i Ni为第 为第i Ni为第i层的总单位数 N为总体单位数 n为总体样本数
STAT
• 例1:某市有各类型书店500家,其中大型 某市有各类型书店500 500家 50家 中型150 150家 小型300 300家 50家,中型150家,小型300家。为了调查 该市图书销售情况,先计划从中抽取30 STAT 30家书 该市图书销售情况,先计划从中抽取30家书 店进行调查, 店进行调查,采用分层比例抽样法应从各层 中抽取多少家书店调查? 中抽取多少家书店调查? • 解:根据分层比例抽样公式,则 根据分层比例抽样公式, 大型书店应抽取的样本数为: (1)大型书店应抽取的样本数为: =50家/500家 30家 n大=50家/500家*30家=3家 中型书店应抽取的样本数为: (2)中型书店应抽取的样本数为: n中=150家/500家*30家=9家 =150家/500家 30家 小型书店应抽取的样本数为: (3)小型书店应抽取的样本数为: =300家/500家 30家 18家 n小=300家/500家*30家=18家
三、抽样方法
STAT
1.重复抽样 又称作重置抽样、 1.重复抽样 又称作重置抽样、有放回抽样
抽出 个体 特点 登记 特征 放回 总体 继续 抽取
同一总体单位有可能被重复抽中, 同一总体单位有可能被重复抽中, 而且每次抽取都是独立 独立进行 而且每次抽取都是独立进行
又被称作不重置抽样、不放 又被称作不重置抽样、 2.不重复抽样 2.不重复抽样 回抽样
···
k
···
k
1. 分层比例抽样: 分层比例抽样:
•指分层后,按随机原则根据各层中单 指分层后,按随机原则根据各层中单 指分层后 位数量占总体单位数量的比例抽取各 位数量占总体单位数量的比例抽取各 层的样本数量。 层的样本数量。 每层抽取的样本数计算公式为: 每层抽取的样本数计算公式为 计算公式
记、计算时造成的误差,可以避免。 计算时造成的误差,可以避免。 成的系统偏差,理论上可以避免。 成的系统偏差,理论上可以避免。
• 系统性误差:由于有意识选取调查单位造 系统性误差:由于有意识 有意识选取调查单位造 • 随机误差:由于按照随机原则抽取样本而 随机误差:由于按照随机原则 随机原则抽取样本而
STAT
必要样本容量的影响因素
STAT
允许误差范围的大小; 允许误差范围的大小; 抽样调查的组织方式和方法; 抽样调查的组织方式和方法; 人力、财力和物力的允许条件。 人力、财力和物力的允许条件。
§4.2
随机抽样技术
STAT
一、简单随机抽样 二、分层抽样 三、系统抽样 四、整群抽样
一、简单随机抽样(纯随机抽样) 简单随机抽样(纯随机抽样)
相关文档
最新文档