第六章抽样技术-1130
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 抽样技术
STAT
§7.1 §7.2 §7.3
抽样调查的一般理论 随机抽样技术 非随机抽样技术
§6.1 抽样调查的一般理论 STAT
一、基本概念 二、基本准则 三、基本方法 四、抽样误差的确定 五、样本容量的确定
一、基本概念
STAT
1.总体 简称总体或母体,是指所要调查认识的研究对 象的全体,它由具有某种共同性质或特征的单 位组成。用字母N表示。
二、 分层抽样(类型抽样)
—将总体按某个主要标志进行分组,再 按随机原则采用简单随机抽样方式从各组中 抽取一定数目的总体单位组成样本的抽样组 织方式。
总体 N
··· ···
N1 N2
Nk
n1
n2
nk
等额抽取
样本 等比例抽取 n 不等比例抽取
能使样本结构更接近于总体结构,提高样本的代表 性;能同时推断总体指标和各子总体的指标
本容量
STAT
大样本容量 调查精度高 但费用较大
必要样本容量的影响因素
STAT
允许误差范围的大小; 抽样调查的组织方式和方法; 人力、财力和物力的允许条件。
§6.2 随机抽样技术 STAT
一、简单随机抽样 二、分层抽样 三、系统抽样 四、整群抽样
一、简单随机抽样(纯随机抽样)
——对总体单位不做任何分类排队,完 全按照随机原则直接从总体中随机抽取一 部分单位组成样本的抽样组织方式。
影响抽样误差的因素
STAT
总体各单位的差异程度:
(标准差) 越大,抽样误差越大;
样本单位数的多少:
n 越大,抽样误差越小;
抽样方法:不重复抽样比重复抽样小;
抽样组织方式:简单随机抽样最大。
五、样本容量的确定
样本容量
指样本中含有的总体单位的STAT 数目,通常用n 来表示。
一般来讲:当 n ≥ 30,称为大样本;
2.样本总体
简称样本,指在全及总体中抽取部分单位所构 成的小总体。用字母n表示。
总体指标:参数
(未知量) STAT
统计推断
注意
样本总体指标:统
计量(已知量)
总体是唯一确定 的,样本总体不唯一
3.抽样调查
又称为抽样推断或抽样估计,指从总体中抽
取一部分单位作为样本进行调查,然后根据 样本调查结果对总体情况作出推断和估计的 一种统计方法,是一种非全面调查 。
2.不重复抽样
又被称作不重置抽样、不放 回抽样
STAT
抽出 个体
登记 特征
继续 抽取
同一总体中每个单位被抽中的机会并 特点 不均等,在连续抽取时,每次抽取都
不是独立进行。
是最常用的抽样方法,用于无限总体和许多 有限总体样本单位的抽样。
四、抽样误差
----指所选取的样本的结果不能 STAT 完全代表总体而导致的误差。
——在其他条件相同的设情计况抽下样,方选案抽时样,误通差常是
最小的方案.
在误差达到一定要求的条
3.费用最少
件下,选择费用最少的方案
—在其他条件相同的情况下,选费用最少的 方案.
三、抽样方法
STAT
1.重复抽样 又称作重置抽样、有放回抽样
抽出 个体
登记 特征
放回 总体
继续 抽取
特点
同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行
原 因 登记误差
误差
代表性误差
系统性误差 随机误差
三种误差的区别:
STAT
• 登记误差:由于人的主观失误在观察、登
记、计算时造成的误差,可以避免。
• 系统性误差:由于有意识选取调查单位造
成的系统偏差,理论上可以避免。
• 随机误差:由于按照随机原则抽取样本而
产生的误差,无法避免但可以控制。
因 此:抽样误差一般指随机误差,而不包括登记 性误差和系统性偏差。
• 解:根据分层比例抽样公式,则
(1)大型书店应抽取的样本数为:
n大=50家/500家*30家=3家 (2)中型书店应抽取的样本数为:
n中=150家/500家*30家=9家 (3)小型书店应抽取的样本数为:
n小=300Βιβλιοθήκη Baidu/500家*30家=18家
思 考:
STAT
• 假定漓江学院想对今年的毕业生进行一 次调查,以便了解他们的就业意向。该 学院共有5个专业:会计、金融、市场营 销、经济学、国际贸易。今年共有500 名毕业生,其中,会计专业有100名, 金融专业80名,市场营销50名,经济 120名,国际贸易150名。
类别
按被抽取机会是否相等,可以分为:
随机抽样
按照随机原则抽取样本
非随机抽样 根据调查者主观意愿和判断选取样本
抽样调查的特点
由部分推断总体 抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
因此,抽样调查具有以下优越性:
(1)经济性; (2)时效性; (3)准确性; (4)灵活性。
抽样调查的应用
应用
仅适用于规模不大、内部各单位 标志值差异较小的总体
是最简单、最基本、最符合随机原则,但同 时也是抽样误差最大的抽样组织形式
方法
先将总体各单位进行编码,然后按照随 STAT 机原则,用抽签法或随机数法抽取若干 数码,所有中选的数码对应的单位即构 成样本。
给总体各单位编号后,把 号码写在结构均匀的字签 上,将字签混合均匀后即 可从中抽取。
1. 分层比例抽样:
STAT
•指分层后,按随机原则根据各层中单 位数量占总体单位数量的比例抽取各 层的样本数量。
每层抽取的样本数计算公式为:
ni
Ni N
n
式 中: ni为第i层抽出的样本数
Ni为第i层的总单位数
N为总体单位数
n为总体样本数
• 例1:某市有各类型书店500家,其中大型 50家,中型150家,小型300家。为了调查 该书市店图进书行销调售查情,况采,用先分计层划比从例中抽抽样取法应30从家S各TAT 层中抽取多少家书店调查?
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时 用于工业生产过程中的产品质量控 制和管理
抽样调查的一般步骤
STAT
设
抽
收
计
推
计
取
集
算
断
抽
样
样
本
样 本
样 本 统
总 体
方
单
数
计
参
案
位
据
量
数
二、基本准则
STAT
1.随机原则
——抽取样本单位时,应确保每个总体单位都 有被抽取的可能. 2.抽样误差最小
当 n < 30,称为小样本。
确定适当样本容量的意义:
若n过大,调查工作量增大,体现不出抽样
调查的优越性;
若n 过小,抽样误差会增大,抽样推断就
会失去价值。
确定样本容量的意义
小样本容量 节省费用但 调查误差大
调查误差
样本容量
调查费用
找出在限定费用 范围内的最大样 本容量
找出在规定误差
范围内的最小样
STAT
§7.1 §7.2 §7.3
抽样调查的一般理论 随机抽样技术 非随机抽样技术
§6.1 抽样调查的一般理论 STAT
一、基本概念 二、基本准则 三、基本方法 四、抽样误差的确定 五、样本容量的确定
一、基本概念
STAT
1.总体 简称总体或母体,是指所要调查认识的研究对 象的全体,它由具有某种共同性质或特征的单 位组成。用字母N表示。
二、 分层抽样(类型抽样)
—将总体按某个主要标志进行分组,再 按随机原则采用简单随机抽样方式从各组中 抽取一定数目的总体单位组成样本的抽样组 织方式。
总体 N
··· ···
N1 N2
Nk
n1
n2
nk
等额抽取
样本 等比例抽取 n 不等比例抽取
能使样本结构更接近于总体结构,提高样本的代表 性;能同时推断总体指标和各子总体的指标
本容量
STAT
大样本容量 调查精度高 但费用较大
必要样本容量的影响因素
STAT
允许误差范围的大小; 抽样调查的组织方式和方法; 人力、财力和物力的允许条件。
§6.2 随机抽样技术 STAT
一、简单随机抽样 二、分层抽样 三、系统抽样 四、整群抽样
一、简单随机抽样(纯随机抽样)
——对总体单位不做任何分类排队,完 全按照随机原则直接从总体中随机抽取一 部分单位组成样本的抽样组织方式。
影响抽样误差的因素
STAT
总体各单位的差异程度:
(标准差) 越大,抽样误差越大;
样本单位数的多少:
n 越大,抽样误差越小;
抽样方法:不重复抽样比重复抽样小;
抽样组织方式:简单随机抽样最大。
五、样本容量的确定
样本容量
指样本中含有的总体单位的STAT 数目,通常用n 来表示。
一般来讲:当 n ≥ 30,称为大样本;
2.样本总体
简称样本,指在全及总体中抽取部分单位所构 成的小总体。用字母n表示。
总体指标:参数
(未知量) STAT
统计推断
注意
样本总体指标:统
计量(已知量)
总体是唯一确定 的,样本总体不唯一
3.抽样调查
又称为抽样推断或抽样估计,指从总体中抽
取一部分单位作为样本进行调查,然后根据 样本调查结果对总体情况作出推断和估计的 一种统计方法,是一种非全面调查 。
2.不重复抽样
又被称作不重置抽样、不放 回抽样
STAT
抽出 个体
登记 特征
继续 抽取
同一总体中每个单位被抽中的机会并 特点 不均等,在连续抽取时,每次抽取都
不是独立进行。
是最常用的抽样方法,用于无限总体和许多 有限总体样本单位的抽样。
四、抽样误差
----指所选取的样本的结果不能 STAT 完全代表总体而导致的误差。
——在其他条件相同的设情计况抽下样,方选案抽时样,误通差常是
最小的方案.
在误差达到一定要求的条
3.费用最少
件下,选择费用最少的方案
—在其他条件相同的情况下,选费用最少的 方案.
三、抽样方法
STAT
1.重复抽样 又称作重置抽样、有放回抽样
抽出 个体
登记 特征
放回 总体
继续 抽取
特点
同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行
原 因 登记误差
误差
代表性误差
系统性误差 随机误差
三种误差的区别:
STAT
• 登记误差:由于人的主观失误在观察、登
记、计算时造成的误差,可以避免。
• 系统性误差:由于有意识选取调查单位造
成的系统偏差,理论上可以避免。
• 随机误差:由于按照随机原则抽取样本而
产生的误差,无法避免但可以控制。
因 此:抽样误差一般指随机误差,而不包括登记 性误差和系统性偏差。
• 解:根据分层比例抽样公式,则
(1)大型书店应抽取的样本数为:
n大=50家/500家*30家=3家 (2)中型书店应抽取的样本数为:
n中=150家/500家*30家=9家 (3)小型书店应抽取的样本数为:
n小=300Βιβλιοθήκη Baidu/500家*30家=18家
思 考:
STAT
• 假定漓江学院想对今年的毕业生进行一 次调查,以便了解他们的就业意向。该 学院共有5个专业:会计、金融、市场营 销、经济学、国际贸易。今年共有500 名毕业生,其中,会计专业有100名, 金融专业80名,市场营销50名,经济 120名,国际贸易150名。
类别
按被抽取机会是否相等,可以分为:
随机抽样
按照随机原则抽取样本
非随机抽样 根据调查者主观意愿和判断选取样本
抽样调查的特点
由部分推断总体 抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
因此,抽样调查具有以下优越性:
(1)经济性; (2)时效性; (3)准确性; (4)灵活性。
抽样调查的应用
应用
仅适用于规模不大、内部各单位 标志值差异较小的总体
是最简单、最基本、最符合随机原则,但同 时也是抽样误差最大的抽样组织形式
方法
先将总体各单位进行编码,然后按照随 STAT 机原则,用抽签法或随机数法抽取若干 数码,所有中选的数码对应的单位即构 成样本。
给总体各单位编号后,把 号码写在结构均匀的字签 上,将字签混合均匀后即 可从中抽取。
1. 分层比例抽样:
STAT
•指分层后,按随机原则根据各层中单 位数量占总体单位数量的比例抽取各 层的样本数量。
每层抽取的样本数计算公式为:
ni
Ni N
n
式 中: ni为第i层抽出的样本数
Ni为第i层的总单位数
N为总体单位数
n为总体样本数
• 例1:某市有各类型书店500家,其中大型 50家,中型150家,小型300家。为了调查 该书市店图进书行销调售查情,况采,用先分计层划比从例中抽抽样取法应30从家S各TAT 层中抽取多少家书店调查?
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时 用于工业生产过程中的产品质量控 制和管理
抽样调查的一般步骤
STAT
设
抽
收
计
推
计
取
集
算
断
抽
样
样
本
样 本
样 本 统
总 体
方
单
数
计
参
案
位
据
量
数
二、基本准则
STAT
1.随机原则
——抽取样本单位时,应确保每个总体单位都 有被抽取的可能. 2.抽样误差最小
当 n < 30,称为小样本。
确定适当样本容量的意义:
若n过大,调查工作量增大,体现不出抽样
调查的优越性;
若n 过小,抽样误差会增大,抽样推断就
会失去价值。
确定样本容量的意义
小样本容量 节省费用但 调查误差大
调查误差
样本容量
调查费用
找出在限定费用 范围内的最大样 本容量
找出在规定误差
范围内的最小样