统计抽样培训课件PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2/56
第七章 统计抽样
7.1 统计抽样基本概念
在抽样之前,应将总体划分为抽样单位。抽样单 位既可以是一个简单的个体,也可以是一组个体。
对某一个特殊研究,抽样单位的名册称为抽样框。
3/56
第七章 统计抽样
7.2 抽样调查种类和抽样方法
邮寄调查
调
查 方
电话调查
法
个人采访调查
4/56
第七章 统计抽样
此时总体均值的区间估计为
x / 2sx
在抽样调查中,当构造置信区间时,通常取μ= 2。因此,在使用简单随机样本时,总体均值的近似 95%的置信区间的表达式为:
x 2sx
9/56
第七章 统计抽样
7.4.1 总体均值
[例7.1]《摄影》是一本推介摄影作品、报道摄影发 展状况、介绍摄影器材的杂志,它目前拥有8000个订 户。根据一个484个订户的简单随机样本,得出订户 的年平均收入为30500元,标准差为7040元。因此, 所有订户的年平均收入的无偏估计为x 30500 元。
x / 2 x
式中,
为均x值的标准差。
1-α称为置信度, 为与/ 2之对应的临界值。例如,
若置信度为95%,则
。 0.025 1.96
8/56
第七章 统计抽样
7.4.1 总体均值
当从一个容量为N的有限总体中,抽取一个容量 为n的简单随机样本时,均值的标准差的估计值为
sx
N N
n 1
s n
统计抽样培训课件PPT课件
第七章 统计抽样
➢统计抽样主要研究什么内容,解决什么问题? ➢抽样方法主要有哪几种方法? ➢如何确定样本容量?
统计抽样培训课件PPT课件
1/52
第七章 统计抽样
7.1 统计抽样基本概念
➢ 总体由研究对象的全体所组成。 ➢ 样本是总体中的部分元素所组成的集合。 ➢ 目标总体是我们要推断的总体 ➢ 抽样总体是实际抽取样本的总体
n 5000 3000 2 139.97
500 2 5000
3000 2
4
16/56
第七章 统计抽样
7.4.3 样本容量的确定
在估计总体比率时,选择样本容量的公式,与估计 总体均值的公式类似。我们只需要将估计总体均值的公
式中 s替2 换为 p(1 ,p即)
Np(1 p)
n
(N
1)
B2 4
因此,
sp
N n p(1 p) N 1 n
总体比率的近似95%的置信区间的表达式如下:
p 2s p
12/56
第七章 统计抽样
7.4.2 总体比率
例如,在大宇国际咨询公司的抽样调查中,大宇国 际咨询公司也想估计在它服务范围内的500所学校 中,使用天然气作为取暖燃料的学校比率。如果在 抽出的50所学校中,有35所学校使用天然气作为取 暖燃料,则总体500所学校中使用天然气比率的点 估计值p 35 / 50 。0.7比0 率的标准差的估计值为
sx
8
000 484 8 000 1
wenku.baidu.com
7
040 484
310
因此,这本杂志订户的年平均收入的近似95%的置信
区间为
30 500 2 310=30 500 620
即(29880,31120)。
10/56
第七章 统计抽样
7.4.1 总体均值
上述过程也可用于对诸如总体总量或总体比率等 其他总体参数的区间估计。对点估计的抽样分布近 似服从正态概率分布的所有情形,其近似95%的置 信区间为
p(1
p)
使用上式时,我们必须规定允许误差B和给出 p
的一个估计值。如果没有合适的估计值,我们可以使
用 p 0代.5替,这样将保证近似置信区间的允许误差比
希望的要小的多。
17/56
第七章 统计抽样
7.5 分层简单随机抽样
分层简单随机抽样的步骤:
建立抽样框
抽样总体中所 有个体的名册
根据随机数表进行抽样
使用随机数表,可 以保证抽样总体中 的每个个体都有相 同的概率被抽中
6/56
第七章 统计抽样
7.4 简单随机抽样 总体均值 总体比率 样本容量的确定
7/56
第七章 统计抽样
7.4.1 总体均值
如果选择大样本(n≥30),则中心极限定理 可以保x 证 x的抽样分布近似服从正态概率分布,μ的 区间估计为
因此,
500 50 0.7 (1-0.7)
sp
500 1
50
0.0621
总体比率的近似95%置信区间为0.7 2 0.0621 0.7 0.1242
即(0.5758,0.8242 )。 13/56
第七章 统计抽样
7.4.3 样本容量的确定
均值的标准差的估计值:sx / 2
N N
n 1
s n
回忆前面提到的允许误差为“点估计的标准差估计值 的2倍”,因此:
B2
N N
n 1
s n
n
Ns2
(N
1)
B2 4
s2
14/56
第七章 统计抽样
7.4.3 样本容量的确定
两步抽样 估
计
s2 的 方
用试点调查或事先 检验的结果估计s2
法
根据以往的资料估计s2
由第一步抽取的部分 单位,得到的s2的估 计值,将此值代入上 式,确定出全部样本 容量n;然后对第一 步确定的全部样本容 量,再抽取第二步所 需要的其余单位数。
15/56
第七章 统计抽样
7.4.3 样本容量的确定
[例7.3]某大学有5000名毕业生,我们想构造宽度在 1000元之内的近似95%的置信区间。
对这样规定的置信区间,B=500。在确定n之 前,需要估计s 2。
假设根据去年所做的同样研究,得知s=3000元。 我们可以用这个值来估计 s。2 根据B=500、 s=300 0 及N=5000,则样本容量为
7.3 调查误差
非抽样误差
调 查 误 差
进行一次抽样调查 可能出现的如测量 误差、采访者误差 及数据处理误差等。
抽样误差
由于没有对总体的 所有单位进行调查 而产生的误差
5/56
第七章 统计抽样
7.4 简单随机抽样
从一个容量为N的有限总体中抽取得到一个容量为 n的简单随机样本,使每一个容量为n的可能样本,都 有相同的概率被抽中。
点估计值 2点估计量标准误差估计值
例如,在《摄影》的抽样调查中,点估计量的标准 误差的估计值为 sx 310元 ,允许误差为2×310元 =620元。
11/56
第七章 统计抽样
7.4.2 总体比率
总体比率p是总体中具有某些感兴趣特征的个体的比 重。
[例7.2]在市场调查研究中,人们想了解喜欢某一品 牌的消费者比重。样本比率 p是总体比率的无偏点估 计。总体比率的标准差的估计值为
第七章 统计抽样
7.1 统计抽样基本概念
在抽样之前,应将总体划分为抽样单位。抽样单 位既可以是一个简单的个体,也可以是一组个体。
对某一个特殊研究,抽样单位的名册称为抽样框。
3/56
第七章 统计抽样
7.2 抽样调查种类和抽样方法
邮寄调查
调
查 方
电话调查
法
个人采访调查
4/56
第七章 统计抽样
此时总体均值的区间估计为
x / 2sx
在抽样调查中,当构造置信区间时,通常取μ= 2。因此,在使用简单随机样本时,总体均值的近似 95%的置信区间的表达式为:
x 2sx
9/56
第七章 统计抽样
7.4.1 总体均值
[例7.1]《摄影》是一本推介摄影作品、报道摄影发 展状况、介绍摄影器材的杂志,它目前拥有8000个订 户。根据一个484个订户的简单随机样本,得出订户 的年平均收入为30500元,标准差为7040元。因此, 所有订户的年平均收入的无偏估计为x 30500 元。
x / 2 x
式中,
为均x值的标准差。
1-α称为置信度, 为与/ 2之对应的临界值。例如,
若置信度为95%,则
。 0.025 1.96
8/56
第七章 统计抽样
7.4.1 总体均值
当从一个容量为N的有限总体中,抽取一个容量 为n的简单随机样本时,均值的标准差的估计值为
sx
N N
n 1
s n
统计抽样培训课件PPT课件
第七章 统计抽样
➢统计抽样主要研究什么内容,解决什么问题? ➢抽样方法主要有哪几种方法? ➢如何确定样本容量?
统计抽样培训课件PPT课件
1/52
第七章 统计抽样
7.1 统计抽样基本概念
➢ 总体由研究对象的全体所组成。 ➢ 样本是总体中的部分元素所组成的集合。 ➢ 目标总体是我们要推断的总体 ➢ 抽样总体是实际抽取样本的总体
n 5000 3000 2 139.97
500 2 5000
3000 2
4
16/56
第七章 统计抽样
7.4.3 样本容量的确定
在估计总体比率时,选择样本容量的公式,与估计 总体均值的公式类似。我们只需要将估计总体均值的公
式中 s替2 换为 p(1 ,p即)
Np(1 p)
n
(N
1)
B2 4
因此,
sp
N n p(1 p) N 1 n
总体比率的近似95%的置信区间的表达式如下:
p 2s p
12/56
第七章 统计抽样
7.4.2 总体比率
例如,在大宇国际咨询公司的抽样调查中,大宇国 际咨询公司也想估计在它服务范围内的500所学校 中,使用天然气作为取暖燃料的学校比率。如果在 抽出的50所学校中,有35所学校使用天然气作为取 暖燃料,则总体500所学校中使用天然气比率的点 估计值p 35 / 50 。0.7比0 率的标准差的估计值为
sx
8
000 484 8 000 1
wenku.baidu.com
7
040 484
310
因此,这本杂志订户的年平均收入的近似95%的置信
区间为
30 500 2 310=30 500 620
即(29880,31120)。
10/56
第七章 统计抽样
7.4.1 总体均值
上述过程也可用于对诸如总体总量或总体比率等 其他总体参数的区间估计。对点估计的抽样分布近 似服从正态概率分布的所有情形,其近似95%的置 信区间为
p(1
p)
使用上式时,我们必须规定允许误差B和给出 p
的一个估计值。如果没有合适的估计值,我们可以使
用 p 0代.5替,这样将保证近似置信区间的允许误差比
希望的要小的多。
17/56
第七章 统计抽样
7.5 分层简单随机抽样
分层简单随机抽样的步骤:
建立抽样框
抽样总体中所 有个体的名册
根据随机数表进行抽样
使用随机数表,可 以保证抽样总体中 的每个个体都有相 同的概率被抽中
6/56
第七章 统计抽样
7.4 简单随机抽样 总体均值 总体比率 样本容量的确定
7/56
第七章 统计抽样
7.4.1 总体均值
如果选择大样本(n≥30),则中心极限定理 可以保x 证 x的抽样分布近似服从正态概率分布,μ的 区间估计为
因此,
500 50 0.7 (1-0.7)
sp
500 1
50
0.0621
总体比率的近似95%置信区间为0.7 2 0.0621 0.7 0.1242
即(0.5758,0.8242 )。 13/56
第七章 统计抽样
7.4.3 样本容量的确定
均值的标准差的估计值:sx / 2
N N
n 1
s n
回忆前面提到的允许误差为“点估计的标准差估计值 的2倍”,因此:
B2
N N
n 1
s n
n
Ns2
(N
1)
B2 4
s2
14/56
第七章 统计抽样
7.4.3 样本容量的确定
两步抽样 估
计
s2 的 方
用试点调查或事先 检验的结果估计s2
法
根据以往的资料估计s2
由第一步抽取的部分 单位,得到的s2的估 计值,将此值代入上 式,确定出全部样本 容量n;然后对第一 步确定的全部样本容 量,再抽取第二步所 需要的其余单位数。
15/56
第七章 统计抽样
7.4.3 样本容量的确定
[例7.3]某大学有5000名毕业生,我们想构造宽度在 1000元之内的近似95%的置信区间。
对这样规定的置信区间,B=500。在确定n之 前,需要估计s 2。
假设根据去年所做的同样研究,得知s=3000元。 我们可以用这个值来估计 s。2 根据B=500、 s=300 0 及N=5000,则样本容量为
7.3 调查误差
非抽样误差
调 查 误 差
进行一次抽样调查 可能出现的如测量 误差、采访者误差 及数据处理误差等。
抽样误差
由于没有对总体的 所有单位进行调查 而产生的误差
5/56
第七章 统计抽样
7.4 简单随机抽样
从一个容量为N的有限总体中抽取得到一个容量为 n的简单随机样本,使每一个容量为n的可能样本,都 有相同的概率被抽中。
点估计值 2点估计量标准误差估计值
例如,在《摄影》的抽样调查中,点估计量的标准 误差的估计值为 sx 310元 ,允许误差为2×310元 =620元。
11/56
第七章 统计抽样
7.4.2 总体比率
总体比率p是总体中具有某些感兴趣特征的个体的比 重。
[例7.2]在市场调查研究中,人们想了解喜欢某一品 牌的消费者比重。样本比率 p是总体比率的无偏点估 计。总体比率的标准差的估计值为