第三章 简单随机抽样
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
N N 1 N n 1 n 1 n 1 2 2 2 (Yi Y ) (Yi Y )(Y j Y ) (Yi Y ) (Yi Y ) nN i 1 N 1 i j N 1 i 1 N 1 i 1
2 N N N 1 n 1 n 1 1 N n 2 2 ( Y Y ) ( Y Y ) (Yi Y ) 1 i i nN N 1 N 1 nN N 1 i 1 i 1 i 1
23390 (2) y 649.722 36 1 n 2 2 s ( yi ny 2 ) 304803 n 1 i 1
ˆ Y y 649.722 1 f s s( y ) s 91.71 n n
Y 的置信度95%的近似置信区间为: s s y u10.05 / 2 n , y u10.05 / 2 n 469.97,829.47
例:为调查某城镇成年居民的服装消费水平,在全 体N=5443个成年人中,用简单随机抽样抽得一 个n=36的样本。对每个抽中的成年人调查上一 年中购买的件数与支出金额,数据见cha3.xls 。 试估计该城镇居民成衣平均消费水平。(忽略f) (置信度为95%) 试估计该城镇居民成衣消费总额。(忽略f)
说明:总体方差
N 1 2 2 2 E (Yi Y ) (Yi Y ) N i 1
但为了使大多数情形下公式表达更简练,定义总体方差为:
N 1 N 2 2 2 S (Yi Y ) N 1 i 1 N 1
3.估计量的方差估计:
性质:E(s ) S
2
N n E[ ( yi Y ) 2 ] [ (Yi Y ) 2 ] N i 1 i 1
n
n(n 1) E[ ( y i Y )( y j Y )] (Yi Y )(Y j Y ) N ( N 1) i j i j
1 n 1 2 V ( y ) 2 E[ ( yi Y ) ] 2 E[ ( yi Y )( y j Y )] n i 1 n i j 1 n N 1 n(n 1) 2 2 (Yi Y ) 2 (Yi Y )(Y j Y ) n N i 1 n N ( N 1) i j
(1)计算样本均值与样本方差;
y
y
i 1
n
i
n
,s
2
( y y)
i 1 i
n
2 n 1 ( yi2 ny 2 ) n 1 i 1
n 1
(2)若用 y 估计总体均值μ,按数理统计结果, 是否无偏,并写出它的方差表达式。
ˆ y, Y
V ( y)
2
n
(3)根据上述样本数据,如何估计?
Y的置信度为 1 的近似置信区间为: 1 f 1 f s),N(y u s) N(y u1 1 n n 2 2
3.3 总体比例(成数)的简单估计
3.3.1总体: 总体 {Y1,Y2 ,YN }
征时 1,总体单元具有某种特 其中Yi 0,否则 (Yi的总和) 征的单元数) Yi A(总体中具有所考虑特
第三章 简单随机抽样
例:从某个总体抽取一个n=50的独立同分布样本,样本数据 如下: 567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476 (1)计算样本均值与样本方差; (2)若用 y 估计总体均值μ,按数理统计结果,是否无偏, 并写出它的方差表达式。 (3)根据上述样本数据,如何估计? (4)假定的分布是近似正态的,试分别给出总体均值μ的 置信度为95%的近似置信区间。
1 N n 1 N N n 2 1 f 2 2 (Yi Y ) S S n N N 1 i 1 nN n
3.估计量的方差估计:
性质3:v(y) 1 f 2 1 f 2 s 是V(y) S 的无偏估计。 n n
2 2
证明:只需证
E(s ) S
n
n n 1 1 2 2 2 2 ( yi y ) ( yi Y ) n( y Y ) 由定义s n 1 i 1 n 1 i 1
y
i 1
n
iΒιβλιοθήκη Baidu
n
n
y
2
s2
1 n ( y y ) pq i n 1 i 1 n 1
3.3.2 估计量及其性质: 性质1.p为P的简单估计,且为无偏估计,即E(p)=P。 性质2. 1 f N
V ( p)
n
N 1
PQ
性质3.
1 f 2 1 f n v( p) s pq为V(p)的无偏估计 n n n 1
Y 的置信度为 1 的近似置信区间为: 1 f 1 f s,y u y u1 1 n n 2 2 s
简单估计及其无偏性:
ˆ Y y
性质 1 :E ( y ) Y
证明:(定义法)
y E( y)
n CN
1 1 n1 N y ( y1 yn ) CN 1 Yi n n i 1
1 n1 N C N 1 Yi N y 1 n i 1 E( y) n Yi Y n CN CN N i 1
证明:(对称性论证法)
1 n y yi n i 1
1 1 n E ( y ) E ( yi ) Yi n i 1 n N i 1 1 Yi Y N i 1
s s y u10.05 / 2 n , y u10.05 / 2 n 379.43,449.13
例: 某专业杂志目前拥有8000家订户,从中按简单随机抽样 抽取了484户,这484户的年均收入为30500元,标准差为 7040元。试求该杂志订户的年均收入 的置信度为95%的 近似置信区间。
解:
y 30500 s( y ) v( y ) 1 f s n 484 1 8000 7040 310 484
y u1 s(y),y u1 s(y) 2 2 即30500 1.96 310 , 30500 1.96 310
N
n
N
N n 2 1 f 2 性质 2:对 s.r.s,V(y) S S nN n
证明:(对称论性论证法)由定义
n 1 V ( y ) E ( y Y ) 2 E ( yi Y ) 2 n i 1 n 1 2 E[ ( yi Y )]2 n i 1 n n 1 1 2 E[ ( yi Y ) 2 ] 2 E[ ( yi Y )( y j Y )] n n i 1 i j
i 1 N
总体中具有所考虑特征 的单元在总体中所占的 比例 A i 1 i 即总体比例:P Y N N 1 N N 2 2 总体方差:S (Yi Y ) PQ N 1 i 1 N 1
Y
N
样本: 简单随机样本{y1……yn}
a 样本比例 p n
样本方差
29892 ,31108
二、总体总和的估计:
ˆ Ny 总体总和Y Yi,则Y的简单估计为 Y
i 1
N
ˆ) Y 性质 1 :E (Y
2 N n 2 2 1 f ˆ 性质 2:对 s.r.s,V (Y ) V(Ny) N S N S2 nN n
2 1 f ˆ 性质3:v(Y) v(Ny) N s 2, n ˆ)是V(Y ˆ) 且v(Y V(Ny)的无偏估计。
n N 由对称论证法 E[ ( yi Y ) ] (Yi Y ) 2 n( N 1) S 2 N i 1 N i 1
2
1 f 2 N n 2 E( y Y ) S S n nN
2
2 1 n ( N 1 ) N n S 2 2 2 2 E(s ) S n S n ( N 1 ) ( N n ) S n 1 N nN N (n 1)
解:(1)
n 198 1 x 5.5, s 2 ( xi2 nx 2 ) 15.8 36 n 1 i 1
ˆ x 5.5 X 1 f 2 s s( x ) s 0.66 n n
X的置信度95%的近似置信区间为: s s , x u10.05 / 2 x u10.05 / 2 n n 即5.5 1.96 0.66,5.5 1.96 0.66 即[ 4.21件,6.79件]
性质:E(s 2) 2,
s2 v( y ) n
(4)假定的分布是近似正态的,试分别给出总体 均值μ的置信度为95%的近似置信区间。
设y1,y 2, ..., yn是独立同分布样本, 假定y是近似正态分布 ,则 y y ~ t (n 1),即 ~ t (n 1) 2 s(y) s /n
解:(1)y 165712 414.28
400 1 n 2 2 s ( yi ny 2 ) 126465 .58, s 355.62 n 1 i 1
ˆ Y y 414.28 1 f s s( y ) s 17.78 n n
(2) Y 的置信度95%的近似置信区间为:
y t1 s(y),y t1 s(y) 2 2
3.1 概述
3.1.1 简单随机抽样(或单纯随机抽样): 本书一般局限于不放回随机抽样 3.1.2 实施方法: 3.1.3 地位、作用: 是其他抽样方法基础
3.2 总体均值与总量的简单估计
一、总体均值的估计: 1.简单估计及其无偏性:
在没有其他总体信息的 条件下, 1 n 1 用y yi 估计Y n i 1 N
Y
i 1
N
i
这种估计即是简单估计
性质 1 :E ( y ) Y
2.估计量的方差: 一般定义,有限总体的方差为:
N n 2 1 f 2 性质 2:对 s.r.s,V(y) S S nN n
例:在某地区10000户家庭中,按简单随机抽样 抽取400户,调查一个月的伙食费(单位: 元)。经计算:
y
i 1
400
i
165712 , y 119110251 .39
i 1 2 i
400
(1)试估计该地区平均每户每月的伙食费,并 估计其标准差。(忽略f) (2)给出置信度为95%时该地区平均每户每月伙 食费的近似置信区间。
2
n n 1 1 2 2 2 2 其中s (yi y) ( yi ny ) n 1 i 1 n 1 i 1
1 f 2 性质3:v(y) s 是V(y)的无偏估计。 n
4.区间估计:
ˆ~ ˆ)) 当n很大时, N ( , V ( ˆ ~ 1 ) N(0, ˆ) V( ˆ 则P( u )=1- 1- /2 ˆ) V( ˆ) ˆ) 因此,d u1 / 2 V( u1 / 2S(
2 N N N 1 n 1 n 1 1 N n 2 2 ( Y Y ) ( Y Y ) (Yi Y ) 1 i i nN N 1 N 1 nN N 1 i 1 i 1 i 1
23390 (2) y 649.722 36 1 n 2 2 s ( yi ny 2 ) 304803 n 1 i 1
ˆ Y y 649.722 1 f s s( y ) s 91.71 n n
Y 的置信度95%的近似置信区间为: s s y u10.05 / 2 n , y u10.05 / 2 n 469.97,829.47
例:为调查某城镇成年居民的服装消费水平,在全 体N=5443个成年人中,用简单随机抽样抽得一 个n=36的样本。对每个抽中的成年人调查上一 年中购买的件数与支出金额,数据见cha3.xls 。 试估计该城镇居民成衣平均消费水平。(忽略f) (置信度为95%) 试估计该城镇居民成衣消费总额。(忽略f)
说明:总体方差
N 1 2 2 2 E (Yi Y ) (Yi Y ) N i 1
但为了使大多数情形下公式表达更简练,定义总体方差为:
N 1 N 2 2 2 S (Yi Y ) N 1 i 1 N 1
3.估计量的方差估计:
性质:E(s ) S
2
N n E[ ( yi Y ) 2 ] [ (Yi Y ) 2 ] N i 1 i 1
n
n(n 1) E[ ( y i Y )( y j Y )] (Yi Y )(Y j Y ) N ( N 1) i j i j
1 n 1 2 V ( y ) 2 E[ ( yi Y ) ] 2 E[ ( yi Y )( y j Y )] n i 1 n i j 1 n N 1 n(n 1) 2 2 (Yi Y ) 2 (Yi Y )(Y j Y ) n N i 1 n N ( N 1) i j
(1)计算样本均值与样本方差;
y
y
i 1
n
i
n
,s
2
( y y)
i 1 i
n
2 n 1 ( yi2 ny 2 ) n 1 i 1
n 1
(2)若用 y 估计总体均值μ,按数理统计结果, 是否无偏,并写出它的方差表达式。
ˆ y, Y
V ( y)
2
n
(3)根据上述样本数据,如何估计?
Y的置信度为 1 的近似置信区间为: 1 f 1 f s),N(y u s) N(y u1 1 n n 2 2
3.3 总体比例(成数)的简单估计
3.3.1总体: 总体 {Y1,Y2 ,YN }
征时 1,总体单元具有某种特 其中Yi 0,否则 (Yi的总和) 征的单元数) Yi A(总体中具有所考虑特
第三章 简单随机抽样
例:从某个总体抽取一个n=50的独立同分布样本,样本数据 如下: 567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476 (1)计算样本均值与样本方差; (2)若用 y 估计总体均值μ,按数理统计结果,是否无偏, 并写出它的方差表达式。 (3)根据上述样本数据,如何估计? (4)假定的分布是近似正态的,试分别给出总体均值μ的 置信度为95%的近似置信区间。
1 N n 1 N N n 2 1 f 2 2 (Yi Y ) S S n N N 1 i 1 nN n
3.估计量的方差估计:
性质3:v(y) 1 f 2 1 f 2 s 是V(y) S 的无偏估计。 n n
2 2
证明:只需证
E(s ) S
n
n n 1 1 2 2 2 2 ( yi y ) ( yi Y ) n( y Y ) 由定义s n 1 i 1 n 1 i 1
y
i 1
n
iΒιβλιοθήκη Baidu
n
n
y
2
s2
1 n ( y y ) pq i n 1 i 1 n 1
3.3.2 估计量及其性质: 性质1.p为P的简单估计,且为无偏估计,即E(p)=P。 性质2. 1 f N
V ( p)
n
N 1
PQ
性质3.
1 f 2 1 f n v( p) s pq为V(p)的无偏估计 n n n 1
Y 的置信度为 1 的近似置信区间为: 1 f 1 f s,y u y u1 1 n n 2 2 s
简单估计及其无偏性:
ˆ Y y
性质 1 :E ( y ) Y
证明:(定义法)
y E( y)
n CN
1 1 n1 N y ( y1 yn ) CN 1 Yi n n i 1
1 n1 N C N 1 Yi N y 1 n i 1 E( y) n Yi Y n CN CN N i 1
证明:(对称性论证法)
1 n y yi n i 1
1 1 n E ( y ) E ( yi ) Yi n i 1 n N i 1 1 Yi Y N i 1
s s y u10.05 / 2 n , y u10.05 / 2 n 379.43,449.13
例: 某专业杂志目前拥有8000家订户,从中按简单随机抽样 抽取了484户,这484户的年均收入为30500元,标准差为 7040元。试求该杂志订户的年均收入 的置信度为95%的 近似置信区间。
解:
y 30500 s( y ) v( y ) 1 f s n 484 1 8000 7040 310 484
y u1 s(y),y u1 s(y) 2 2 即30500 1.96 310 , 30500 1.96 310
N
n
N
N n 2 1 f 2 性质 2:对 s.r.s,V(y) S S nN n
证明:(对称论性论证法)由定义
n 1 V ( y ) E ( y Y ) 2 E ( yi Y ) 2 n i 1 n 1 2 E[ ( yi Y )]2 n i 1 n n 1 1 2 E[ ( yi Y ) 2 ] 2 E[ ( yi Y )( y j Y )] n n i 1 i j
i 1 N
总体中具有所考虑特征 的单元在总体中所占的 比例 A i 1 i 即总体比例:P Y N N 1 N N 2 2 总体方差:S (Yi Y ) PQ N 1 i 1 N 1
Y
N
样本: 简单随机样本{y1……yn}
a 样本比例 p n
样本方差
29892 ,31108
二、总体总和的估计:
ˆ Ny 总体总和Y Yi,则Y的简单估计为 Y
i 1
N
ˆ) Y 性质 1 :E (Y
2 N n 2 2 1 f ˆ 性质 2:对 s.r.s,V (Y ) V(Ny) N S N S2 nN n
2 1 f ˆ 性质3:v(Y) v(Ny) N s 2, n ˆ)是V(Y ˆ) 且v(Y V(Ny)的无偏估计。
n N 由对称论证法 E[ ( yi Y ) ] (Yi Y ) 2 n( N 1) S 2 N i 1 N i 1
2
1 f 2 N n 2 E( y Y ) S S n nN
2
2 1 n ( N 1 ) N n S 2 2 2 2 E(s ) S n S n ( N 1 ) ( N n ) S n 1 N nN N (n 1)
解:(1)
n 198 1 x 5.5, s 2 ( xi2 nx 2 ) 15.8 36 n 1 i 1
ˆ x 5.5 X 1 f 2 s s( x ) s 0.66 n n
X的置信度95%的近似置信区间为: s s , x u10.05 / 2 x u10.05 / 2 n n 即5.5 1.96 0.66,5.5 1.96 0.66 即[ 4.21件,6.79件]
性质:E(s 2) 2,
s2 v( y ) n
(4)假定的分布是近似正态的,试分别给出总体 均值μ的置信度为95%的近似置信区间。
设y1,y 2, ..., yn是独立同分布样本, 假定y是近似正态分布 ,则 y y ~ t (n 1),即 ~ t (n 1) 2 s(y) s /n
解:(1)y 165712 414.28
400 1 n 2 2 s ( yi ny 2 ) 126465 .58, s 355.62 n 1 i 1
ˆ Y y 414.28 1 f s s( y ) s 17.78 n n
(2) Y 的置信度95%的近似置信区间为:
y t1 s(y),y t1 s(y) 2 2
3.1 概述
3.1.1 简单随机抽样(或单纯随机抽样): 本书一般局限于不放回随机抽样 3.1.2 实施方法: 3.1.3 地位、作用: 是其他抽样方法基础
3.2 总体均值与总量的简单估计
一、总体均值的估计: 1.简单估计及其无偏性:
在没有其他总体信息的 条件下, 1 n 1 用y yi 估计Y n i 1 N
Y
i 1
N
i
这种估计即是简单估计
性质 1 :E ( y ) Y
2.估计量的方差: 一般定义,有限总体的方差为:
N n 2 1 f 2 性质 2:对 s.r.s,V(y) S S nN n
例:在某地区10000户家庭中,按简单随机抽样 抽取400户,调查一个月的伙食费(单位: 元)。经计算:
y
i 1
400
i
165712 , y 119110251 .39
i 1 2 i
400
(1)试估计该地区平均每户每月的伙食费,并 估计其标准差。(忽略f) (2)给出置信度为95%时该地区平均每户每月伙 食费的近似置信区间。
2
n n 1 1 2 2 2 2 其中s (yi y) ( yi ny ) n 1 i 1 n 1 i 1
1 f 2 性质3:v(y) s 是V(y)的无偏估计。 n
4.区间估计:
ˆ~ ˆ)) 当n很大时, N ( , V ( ˆ ~ 1 ) N(0, ˆ) V( ˆ 则P( u )=1- 1- /2 ˆ) V( ˆ) ˆ) 因此,d u1 / 2 V( u1 / 2S(