抽样PPT题目
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t PQ (1.96) 0.5 0.5 n0 2 96 2 d (0.1)
2 2
如果相对误差在10%以内呢?
t Q (1.96) 0.5 n0 2 384 2 r P (0.1) 0.5
2 2
n0 384 n 340 n 1 384 1 1 1 0 3000 N
序号1 yi 4 2 5 3 2 简单随机样本的指标值 4 5 6 7 2 3 4 5 8 4 9 13 10 6
【例2.4】
• 续例2.3。估计总体总量,并给出在置信度95%的条件下, 估计的极限相对误差。
ˆ 100 5 500 Y
ˆ 的极限相对误差为: • 在置信度95%下,Y
1 0.1 2 ˆ v Y 100 19.1111 17200 10
1 2 1 3 3 4 5 5 8 6 10 平均值 4.5
Xi
0
Yi
1
3
11
18
29
46
18
注意:这里Yi是要研究的变量,Xi是已知的辅助变量。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
样本 1,2 1,3 1,4 1,5 1,6 2,3 2,4 2,5 2,6 3,4 3,5 3,6 4,5 4,6 5,6
2 2 2 1 fh 2 8 ˆ v Y N Wh v yh N h sh 5.93 10 nh h 1 h 1
209650
4
4
ˆ v Y ˆ 23208 s Y
ˆ ts Y
ˆ 209650 2 23208 Y
ˆ N y Y h h
t 1.96 2 n0 ( ) 2 C 2 ( ) (0.68) 2 177 .6 178 r 0.1
n
n0 178 63.9 64 n0 1 1.78 1 N
例子
• 某公司要了解全部3000家客户的满意度信息。 要求以95%的把握保证绝对误差在10%以内。 应该调查多少个样本?
n
ˆ v(Y ˆ ) 458930 s Y R R
• 用简单估计对货运量进行估计
ˆ Ny 2860 1123.2 3212352 Y
N 2 (1 f ) 2 ˆ v Y s y 3.43303 1011 n
ˆ) v ( Y R ˆ deff 0.6135 ˆ) v(Y
s32 8205.556
2 s4 193.333
W4
N 4 1500 0.52632 N 2850
f4
n4 10 0.0067 N4 1500
ˆ N y Y h h
h 1
4
200 39.5 400 105 750 165 1500 24
【例3】某县在对船舶调查月完成的货运量进行调查时,对运管部门 登记的船舶台帐进行整理后获得注册船舶 2860艘,载重吨位 i 154626吨,从2860艘船舶中抽取了一个的简单随机样本,调查得 到样本船舶调查月完成的货运量及其载重吨位如下表(单位: 吨),要推算该县船舶调查月完成的货运量。 Xi Yi Yi Xi i 1 780 100 6 2170 120
例子
• 要对一个稀有事件进行调查,根据经验P应 该在万分之一左右,要求在95%的置信度 下,在相对误差为40%下,确定抽到m等于 多少时停止抽样,并且请估计平均样本量 会是多少?
r Cv( p) 0.2 t
m Cv( p) m 1
所以m=26
m E (n) 260000 P
y yR X x
y x
i i
X
1 15 E ( yR ) yRi 17.686 15 i 1
1 15 2 V ( yR ) yRi E ( yR ) 2.82 15 i 1
1 15 E ( y ) yi 18 15 i 1
1 15 2 V ( y ) yi E ( y ) 97.87 15 i 1
4, 2
4, 3 4, 4 4, 5
5, 2
5, 3 5, 4 5, 5
【例2.2】 • 设总体有5个单元(1、2、3、4、5),按 不放回简单随机抽样的方式抽取2个单元, 则所有可能的样本为个:
1, 2
1, 3 1, 4 1, 5
2, 3
2, 4 2, 5
3, 4
3, 5
4, 5
【例2.3】
• 我们从某个=100的总体中抽出一个大小为 =10的简单随机样本,要估计总体平均水平 并给出置信度为95%的区间估计。
B( yR ) E( yR ) Y 0.31356
MSE( yR ) V ( yR ) B2 ( yR ) 2.92
• 简单估计是无偏的,而比估计是有偏的。 • 简单估计量的方差远远大于比估计量的方差,比估计的偏差不大,其 均方误差也比简单估计的小得多。
• 因此对这个总体,比估计比简单估计的效率高。
序号
i
1 4
2 5
3 2
4 0
5 4
6 6
7 6
8 15
9 0
10 8
yi
1 n 50 y yi 5 n i 1 10
1 n 172 2 s ( y y ) 19.1111 i n 1 i 1 9
2
1 f 2 1 0.1 ˆ vY s 19.1111 1.72 n 10
实际中对于样本量较小的情形, 使用比率估计量时不能忽视其偏倚。
ˆ v(Y ˆ ) 585921 s Y
例子
• 我们从某个N=100的总体中抽出一个大小 为n=10的简单随机样本,要估计总体平均 水平并给出置信度为95%的区间估计。如 果要求以95%的把握保证绝对误差不超过1, 样本量为多少?
ˆ vY ˆ 1.3115 sY
ˆ Y y 5
• 由置信度95%对应的t 1.96 ,因此,可95% 的把握说总体平均水平大约在 5 1.96 1.3115 之间,即2.4295和7.5705之间。
例子
• 我们从某个N=100的总体中抽出一个大小 为n=10的简单随机样本,要估计总体平均 水平并给出置信度为95%的区间估计。如 表:
简单估计 2 6 9.5 15 23.5 7 10.5 16 24.5 14.5 20 28.5 23.5 32 37.5
比估计 18 18 17.1 16.875 21.15 15.75 15.75 16 20 16.3 16.36 19.73 16.27 19.2 18.75
2 样本总数为 C6 15
1 f 1 v p pq 0.65 0.35 0.001143 n 1 200 1
a 130 p 65% n 200
s p v p 0.0338
0.65 1.96 0.0338
• 95%近似置信区间为〔 58.37%,71.63% 〕
序号1 yi 4 2 5 3 2 简单随机样本的指标值 4 5 6 7 2 3 4 5 8 4 9 13 10 6
y 4.8
10 1 2 2 s ( yi y ) 9.96 10 i 1
1 f 2 s ( y ) v( y ) s 0.95 n
d u s( y) 1.96 0.95 1.86
1 2 1 3 3 3 11 4 4 18 5 8 29 6 10 46 平均值 4.5 18
Xi
1 1
Yi
yi y 18 Rr xi x 4.5
yi 1 Rr ? n xi
【例2】对以下假设总体(N=6),用简单随机抽样抽取
n=2的样本,比较简单随机抽样比估计及简单估计的性质。
如果估计满意度会在90%左右呢?
t 2 PQ (1.96) 2 0.9 0.1 n0 2 35 2 d (0.1)
t 2Q (1.96) 2 0.1 n0 2 427 2 r P (0.1) 0.9
n0 427 n 374 n0 1 427 1 1 1 3000 N
i
2
1500
50
7
1823
150
3
4 5
1005
376 600
50
10 20
8
9 10
1450
158 1370
80
20 50
• 该县船舶在调查月完成货运量的比率估计为
ˆ y X 1123.2 154626 2671937 Y R x 65
11 ˆ N 2 (1 f ) s 2 R ˆ 2 2 ˆ v Y 2 Rs 2.10617 10 s R y x yx
例3.1
• 调查某地区的居民奶制品年消费支出,以居民户为抽样单 元,根据经济及收入水平将居民户划分为 4层,每层按简 单随机抽样抽取10户,调查获得如下数据(单位:元), 要估计该地区居民奶制品年消费总支出及估计的标准差。
层 居民户 总数 1 1 2 200 400 10 50 2 40 130 3 0 60 样本户奶制品年消费支出 4 110 80 5 15 100 6 10 55 7 40 160 8 80 85 9 90 160 10 0 170
1
N 400 W2 2 0.14035 N 2850
f2
f3
n2 10 0.025 N 2 400
y2 105
2 s2 2166.667
N 750 W3 3 0.26316 N 2850
n3 10 0.0133 N3 750
y3 165
y4 24
例子
• 从杭州市中随机抽取200人,调查这些人对 杭州市环境的满意度,有130人表示满意。 要估计市民满意度在95%置信度下的置信 区间和绝对误差。
1、比率估计量
【例1】对浙江省居民的人均月消费进行调查,用简单随机 抽样抽取n=6户的样本,Xi表示每户的人口,Yi表示户每月
消费,请估百度文库浙江省居民的人均月消费。
【例2.1】 • 设总体有5个单元(1、2、3、 4 、5),按 放回简单随机抽样的方式抽取 2个单元,则 所有可能的样本为 25 个(考虑样本单元的 顺序):
1, 1 2, 1 3, 1 4, 1 5, 1
1, 2
1, 3 1, 4 1, 5
2, 2
2, 3 2, 4 2, 5
3, 2
3, 3 3, 4 3, 5
所以置信区间为( 2.94, 6.66 )
t 2 s 2 (1.96) 2 9.96 n0 2 38.3 39 d 1 n 39 n 0 28.1 29 n0 1 0.39 1 N
如果要求以95%的把握保证绝对误差不超过 10%,样本量为多少?
C s 9.96 0.68 y 4.8
ˆ vY ˆ 131 .1488 sY
ˆ sY 131.1488 t 1.96 0.5141 51.41% ˆ 500 Y
【例2.5】 • 某超市新开张一段时间之后,为改进销售服务环 境,欲调查附近几个小区居民到该超市购物的满 意度,该超市与附近几个小区的居委会取得联系, 在总体中按简单随机抽样抽取了一个大小为=200 人的样本,调查发现对该超市购物环境表示满意 或基本满意的居民有 130 位,要估计对该超市购 物环境持肯定态度居民的比例,并在置信度 95% 下,给出估计的近似置信区间、极限绝对误差。 假定这时的抽样比可以忽略。
3
4
750
1500
180
50
260
35
110
15
0
0
140
20
60
30
200
25
180
10
300
30
220
25
N1 200 N 2850 W1 0.07018 N 2850 n1 10 f1 0.05 nh 10 N1 200 n1 n1 1 2 2 1 y1i y1 1624.722 y1 y1i 39.5 s1 n1 1 i 1 n i 1
h 1
4
200 39.5 400 105 750 165 1500 24
2 2 2 1 fh 2 8 ˆ v Y N Wh v yh N h sh 5.93 10 nh h 1 h 1