《统计学》样本容量的确定
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学
STATISTICS
5.7 样本容量的确定
5 -1
统计学
STATISTICS
样本容量确定的两难
样本容量取得较大,收集的信息 就相对多,从而估计精度较高,但 进行观测所投入的费用、人力及时 间就比较多;
样本容量取得较小,则投入的费 用、人力及时间就相对节约,但收 集的信息也较少,从而估计精度较 低;
5 - 10
解 : 已 知 p=90% , 1-=95% ,
Z/2=1.96, d =5%
应抽取的样本容量为:
n
(
z
2
)2
p(1 d2
p
)
(1.96 )2 0.9(1 0.9 ) 0.052
138.3 139
应抽取139个产品作为样本。
统计学
STATISTICS
本节结束,谢谢!
5 - 11
其中: d z 2
p(1 p ) n
3. π未知,以样本比例p替代
4. π或p都未知时,可取0.5,这是一种谨慎估计
5 -9
统计学 估计总体比例时样本容量的确定
STATISTICS
(例题分析)
【例】根据以往 的生产统计,某 种产品的合格率 约 为 90% , 现 要 求允许误差为5% , 在 求 95% 的 置 信区间时,应抽 取多少个产品作 为样本?
STATISTICS
估计总体比例时样本容量的确定
5 -8
统计学 估计总体比例时样本容量的确定
STATISTICS
1. 根据比例区间估计公式可得样本容量n为:
重复抽样
n ( z 2 )2 (1 )
d2
不重复抽样
n
(
N
N( z 2 )2 (1 ) 1)d2 ( z 2 )2 (1
)
2. d的取值一般小于0.1
在费用有预算限制的时候,寻 求费用预算范围内使精度达到最 高的样本量。
5 -3
统计学
STATISTICS
估计总体均值时样本容量的确定
5 -4
统计学 估计总体均值时样本容量的确定
STATISTICS
1. 估计总体均值时样本容量n为:
重复抽样
n
(
z
2 )2
d2
2
不重复抽样
n
(N
N( z 2 )2 2 1)d2 ( z 2 )2 2
5 -6
统计学 估计总体均值时样本容量的确定
STATISTICS
(例题分析)
解: 已知=2000,d=400, 1-=95%, z/2=1.96
置信度为95%的置信区间为:
n ( z 2 )2 2 (1.96 )2 20002
d2
4002
96.04 97
即应抽取97人作为样本。
5 -7
统计学
所以,精度和费用对样本量的影 响和要求是矛盾的,不存在既使精 度最高又使费用最省的样本量 。
5 -2
统计学
STATISTICS
Βιβλιοθήκη Baidu
样本容量确定的准则
在对精度有要求时,寻求能够 保证精度要求的费用最省的样本 量;
由于费用通常是关于样本量的 正向线性函数,故使费用最省的 样本量也就是使精度得到保证的 最小样本量;
其中:d
Z
2
•
n
2. 样本容量n与总体方差成正比,与绝对误差成
反比,与概率度成正比。
5 -5
统计学 估计总体均值时样本容量的确定
STATISTICS
(例题分析)
【例】拥有工商管理学士学位的大学毕业生年 薪的标准差大约为2000元,假定想要估计年薪 95%的置信区间,希望允许误差为400元,应抽 取多大的样本容量?
STATISTICS
5.7 样本容量的确定
5 -1
统计学
STATISTICS
样本容量确定的两难
样本容量取得较大,收集的信息 就相对多,从而估计精度较高,但 进行观测所投入的费用、人力及时 间就比较多;
样本容量取得较小,则投入的费 用、人力及时间就相对节约,但收 集的信息也较少,从而估计精度较 低;
5 - 10
解 : 已 知 p=90% , 1-=95% ,
Z/2=1.96, d =5%
应抽取的样本容量为:
n
(
z
2
)2
p(1 d2
p
)
(1.96 )2 0.9(1 0.9 ) 0.052
138.3 139
应抽取139个产品作为样本。
统计学
STATISTICS
本节结束,谢谢!
5 - 11
其中: d z 2
p(1 p ) n
3. π未知,以样本比例p替代
4. π或p都未知时,可取0.5,这是一种谨慎估计
5 -9
统计学 估计总体比例时样本容量的确定
STATISTICS
(例题分析)
【例】根据以往 的生产统计,某 种产品的合格率 约 为 90% , 现 要 求允许误差为5% , 在 求 95% 的 置 信区间时,应抽 取多少个产品作 为样本?
STATISTICS
估计总体比例时样本容量的确定
5 -8
统计学 估计总体比例时样本容量的确定
STATISTICS
1. 根据比例区间估计公式可得样本容量n为:
重复抽样
n ( z 2 )2 (1 )
d2
不重复抽样
n
(
N
N( z 2 )2 (1 ) 1)d2 ( z 2 )2 (1
)
2. d的取值一般小于0.1
在费用有预算限制的时候,寻 求费用预算范围内使精度达到最 高的样本量。
5 -3
统计学
STATISTICS
估计总体均值时样本容量的确定
5 -4
统计学 估计总体均值时样本容量的确定
STATISTICS
1. 估计总体均值时样本容量n为:
重复抽样
n
(
z
2 )2
d2
2
不重复抽样
n
(N
N( z 2 )2 2 1)d2 ( z 2 )2 2
5 -6
统计学 估计总体均值时样本容量的确定
STATISTICS
(例题分析)
解: 已知=2000,d=400, 1-=95%, z/2=1.96
置信度为95%的置信区间为:
n ( z 2 )2 2 (1.96 )2 20002
d2
4002
96.04 97
即应抽取97人作为样本。
5 -7
统计学
所以,精度和费用对样本量的影 响和要求是矛盾的,不存在既使精 度最高又使费用最省的样本量 。
5 -2
统计学
STATISTICS
Βιβλιοθήκη Baidu
样本容量确定的准则
在对精度有要求时,寻求能够 保证精度要求的费用最省的样本 量;
由于费用通常是关于样本量的 正向线性函数,故使费用最省的 样本量也就是使精度得到保证的 最小样本量;
其中:d
Z
2
•
n
2. 样本容量n与总体方差成正比,与绝对误差成
反比,与概率度成正比。
5 -5
统计学 估计总体均值时样本容量的确定
STATISTICS
(例题分析)
【例】拥有工商管理学士学位的大学毕业生年 薪的标准差大约为2000元,假定想要估计年薪 95%的置信区间,希望允许误差为400元,应抽 取多大的样本容量?