第7章抽样与估计1
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学
STATISTICS
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 体的均值、方差及分布如下
总体分布
.3 .2 .1 0
12
6 - 26
均值和方差
N
xi
i1 2.5
N
1. 相对于概率抽样而言
2. 抽取样本时不是依据随机原则,而是根据研 究目的对数据的要求,采用某种方式从总体 中抽出部分单位对其实施调查
3. 有方便抽样、判断抽样、自愿样本、滚雪球 抽样、配额抽样等方式
6 - 11
西北工业大学管理学院
统计学
STATISTICS
方便抽样
1. 调查过程中由调查员依据方便的原则,自行 确定入抽样本的单位
6-2
西北工业大学管理学院
统计学
STATISTICS
7.1 概率抽样方法
7.1.1 简单随机抽样 7.1.2 分层抽样 7.1.3 系统抽样 7.1.4 整群抽样
6-3
西北工业大学管理学院
统计学
STATISTICS
抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样
多阶段抽样
6-4
分层抽样 系统抽样
2. 适合于对稀少群体和特定群体研究
3. 优点:容易找到那些属于特定群体的被调查 者,调查的成本也比较低
6 - 15
西北工业大学管理学院
统计学
STATISTICS
配额抽样
1. 先将体中的所有单位按一定的标志(变量) 分为若干类,然后在每个类中采用方便 抽样或判断抽样的方式选取样本单位
2. 操作简单,可以保证总体中不同类别的 单位都能包括在所抽的样本之中,使得 样本的结构和总体的结构类似
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
西北工业大学管理学院
统计学
STATISTICS
样本均值的抽样分布
(例题分析)
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
16个样本的均值(x)
第一个
第二个观察值
观察值 1
2. 具有整群抽样的优点,保证样本相对集中,节约调 查费用
3. 需要包含所有低阶段抽样单位的抽样框;同时由于 实行了再抽样,使调查单位在更广泛的范围内展开
4. 在大规模的抽样调查中,经常被采用的方法
6 - 10
西北工业大学管理学院
统计学
STATISTICS
非概率抽样
(non-probability sampling)
缺点是估计的精度较差
6-9
西北工业大学管理学院
统计学
STATISTICS
多阶段抽样
(multi-stage sampling)
1. 先抽取群,但并不是调查群内的所有单位,而是再 进行一步抽样,从选中的群中抽取出若干个单位进 行调查
群是初级抽样单位,第二阶段抽取的是最终抽样单位。 将该方法推广,使抽样的段数增多,就称为多阶段抽样
6-5
当用样本对总体目标量进行估计
时,要考虑到每个样本单位被抽 中的概率
西北工业大学管理学院
统计学
STATISTICS
简单随机抽样
(simple random sampling)
1. 从总体N个单位中随机地抽取n个单位作为样本,使 得每一个容量为样本都有相同的机会(概率)被抽中
2. 抽取元素的具体方法有重复抽样和不重复抽样
总体
6 - 19
西北工业大学管理学院
统计学
STATISTICS
样本分布
(sample distribution)
1. 一个样本中各观察值的分布
2. 也称经验分布
3. 当样本容量n逐渐增大时,样本分布逐渐 接近总体的分布
6 - 20
样 本
西北工业大学管理学院
统计学
STATISTICS
抽样分布
(sampling distribution)
例如,参与报刊上和互联网上刊登的调查 问卷活动,向某类节目拨打热线电话等, 都属于自愿样本
2. 自愿样本与抽样的随机性无关
样本是有偏的
不能依据样本的信息推断总体
6 - 14
西北工业大学管理学院
统计学
STATISTICS
滚雪球抽样
1. 先选择一组调查单位,对其实施调查之后, 再请他们提供另外一些属于研究总体的调查 对象,调查人员根据所提供的线索,进行此 后的调查。这个过程持续下去,就会形成滚 雪球效应
6 - 17
西北工业大学管理学院
统计学 7.2 三种不同性质的分布
STATISTICS
7.2.1 总体分布 7.2.2 样本分布 7.2.3 抽样分布
6 - 18
西北工业大学管理学院
统计学
STATISTICS
总体分布
(population distribution)
1. 总体中各元素的观察值所形成的分布 2. 分布通常是未知的 3. 可以假定它服从某种分布
STATISTICS
中心极限定理
(central limit theorem)
中心极限定理:设从均值为,方差为 2的一个任意总
体中抽取容量为n的样本,当n充分大时,样本均值的抽 样分布近似服从均值为μ、方差为σ2/n的正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
方便抽样 自愿样本 配额抽样
西北工业大学管理学院
判断抽样 滚雪球抽样
统计学
STATISTICS
概率抽样
(probability sampling)
1. 根据一个已知的概率来抽取样本 单位,也称随机抽样
2. 特点
按一定的概率以随机原则抽取样 本
抽取样本时使每个单位都有一定的机 会被抽中
每个单位被抽中的概率是已知的 ,或是可以计算出来的
2
3
4
1 1.0 1.5 2.0 2.5
2 1.5 2.0 2.5 3.0
3 2.0 2.5 3.0 3.5
4 2.5 3.0 3.5 4.0
P(x) 0.3
0.2
0.1
0 1.0 1.5 2.0 2.5 3.0 3.5 4.0 x
样本均值的抽样分布
6 - 28
西北工业大学管理学院
统计学
STATISTICS
统计学
STATISTICS
第 7 章 抽样与估计 (1)
7.1 概率抽样方法 7.2 三种不同性质的分布 7.3 一个总体参数推断时样本统计量分布 7.4 两个总体参数推断时样本统计量分布
6-1
西北工业大学管理学院
统计学
STATISTICS
学习目标
1. 了解抽样的概率抽样方法 2. 区分总体分布、样本分布、抽样分布 3. 理解抽样分布与总体分布的关系 4. 掌握单总体参数推断时样本统计量的分布 5. 掌握双总体参数推断时样本统计量的分布
依据
6 - 21
西北工业大学管理学院
统计学
STATISTICS
抽样分布的形成过程
(sampling distribution)
总体
6 - 22
计算样本统计
样
量
本
如:样本均值
、比例、方差
西北工业大学管理学院
统计学 7.3 样本统计量的抽样分布
STATISTICS
(一个总体参数推断时)
7.3.1 样本均值的抽样分布 7.3.2 样本比例的抽样分布 7.3.3 抽样方差的抽样分布
有重点抽样,典型抽样,代表抽样等方式
2. 判断抽样是主观的,样本选择的好坏取决于 调研者的判断、经验、专业程度和创造性
3. 抽样成本比较低,容易操作
4. 样本是人为确定的,没有依据随机的原则, 调查结果不能用于对推断总体
6 - 13
西北工业大学管理学院
统计学
STATISTICS
自愿样本
1. 被调查者自愿参加,成为样本中的一分 子,向调查人员提供有关信息
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)
=10
n=4
x 5
n =16
x 2.5
= 50 X
总体分布
x 50
x
抽样分布
6 - 30
西北工业大学管理学院
统计学
1. 样本统计量的概率分布,是一种理论分布
在重复选取容量为n的样本时,由该统计量的所有 可能取值形成的相对频数分布
2. 样本统计量是随机变量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4. 提供了样本统计量长远而稳定的信息,是进行 推断的理论基础,也是抽样推断科学性的重要
3. 抽取具体样本单位时,不是依据随机原 则,属于非概率抽样
6 - 16
西北工业大学管理学院
统计学 概率抽样与非概率抽样的比较
STATISTICS
1. 概率抽样
依据随机原则抽选样本 样本统计量的理论分布存在 可根据调查的结果推断总体
2. 非概率抽样
不是依据随机原则抽选样本 样本统计量的分布是不确定的 无法使用样本的结果推断总体
3. 缺点:对估计量方差的估计比较困难
6-8
西北工业大学管理学院
统计学
STATISTICS
整群抽样
(cluster sampling)
1. 将总体中若干个单位合并为组(群),抽样时 直接抽取群,然后对中选群中的所有单位 全部实施调查
2. 特点
抽样时只需群的抽样框,可简化工作量
调查的地点相对集中,节省调查费用,方便 调查的实施
N
(xi )2
34
2 i1
N
1.25
西北工业大学管理学院
统计学
STATISTICS
样本均值的抽样分布
(例题分析)
现从总体中抽取n=2的简单随机样本,在重复抽 样条件下,共有42=16个样本。所有样本的结果为
6 - 27
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
样本均值的分布与总体分布的比较
(例题分析)
总体分布
.3
.2
.1 0
1
23
= 2.5
σ2 =1.25
6 - 29
.3 P ( x )
抽样分布
.2
.1
0
4
1.0 1.5 2.0 2.5 3.0 3.5 4.0
x
x 2.5
2 x
0.625
西北工业大学管理学院
统计学
STATISTICS
样本均值的抽样分布 与中心极限定理
6 - 31
西北工业大学x管理学院
x
统计学
STATISTICS
x 的分布趋 于正态分布 的过程
中心极限定理
(central limit theorem)
6 - 32
西北工业大学管理学院
统计学
STATISTICS
抽样均值的抽样分布与 总体分布的关系
总体分布
正态分布
非正态分布
大样本
小样本
6 - 23
西北工业大学管理学院
统计学
STATISTICS
样本均值的抽样分布
6 - 24
西北工业大学管理学院
统计学
STATISTICS
样本均值的抽样分布
1. 在重复选取容量为n的样本时,由样本均 值的所有可能取值形成的相对频数分布
2. 一种理论概率分布
3. 推断总体均值的理论基础
6 - 25
西北工业大学管理学院
调查员在街头、公园、商店等公共场所进行拦 截调查
厂家在出售产品柜台前对路过顾客进行的调查
2. 优点:容易实施,调查的成本低
3. 缺点:样本单位的确定带有随意性,样本无 法代表有明确定义的总体,调查结果不宜推 断总体
6 - 12
西北工业大学管理学院
统计学
STATISTICS
判断抽样
1. 研究人员根据经验、判断和对研究对象的了 解,有目的选择一些单位作为样本
1. 将总体单位按某种特征或某种规则划分为 不同的层,然后从不同的层中独立、随机 地抽取样本
2. 优点
保证样本的结构与总体的结构比较相近,从 而提高估计的精度
组织实施调查方便
既可以对总体参数进行估计,也可以对各层
的目标量进行估计
6-7
西北工业大学管理学院
统计学
STATISTICS
系统抽样
正态分布
正态分布 非正态分布
6 - 33
西北工业大学管理学院
统计学
STATISTICS
样本均值的抽样分布
(数学期望与方差)
1. 样本均值的数学期望
E(x)
2. 样本均值的方差
重复抽样
2 x
2
n
3. 特点
简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便
4. 局限性
当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难 没有利用其他辅助信息以提高估计的效率
6-6
西北工业大学管理学院
ຫໍສະໝຸດ Baidu
统计学
STATISTICS
分层抽样
(stratified sampling)
(systematic sampling)
1. 将总体中的所有单位(抽样单位)按一定顺 序排列,在规定的范围内随机地抽取一个 单位作为初始单位,然后按事先规定好的 规则确定其他样本单位
先从数字1到k之间随机抽取一个数字r作为 初始单位,以后依次取r+k,r+2k…等单位
2. 优点:操作简便,可提高估计的精度