比估计和回归估计(抽样)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)若调查指标为Y , X为辅助变量 X X i 或X X / N已知。 则Y 及Y的比(比率)估计量分别定义为: y ˆX YR y R X R x y ˆ ˆX R ˆX Y R X Ny R NR x ˆ ˆ ˆ 通称为比估计量。 我们将R、Y 、Y
—
x
3.75 4.25 4.50 4.25 4.50 5.00 4.75 5.00 5.50 5.50 5.00 5.25 5.75 5.75 6.25
y
8.25 9.25 10.00 9.50 10.25 11.25 10.25 11.00 12.00 12.25 10.75 11.5 12.5 12.75 13.50
样本号j
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
样本包含单元号 1, 2, 3, 4 1, 2, 3, 5 1, 2, 3, 6 1, 2, 4, 5 1, 2, 4, 6 1, 2, 5, 6 1, 3, 4, 5 1, 3, 4, 6 1, 3, 5, 6 1, 4, 5, 6 2, 3, 4, 5 2, 3, 4, 6 2, 3, 5, 6 2, 4, 5, 6 3, 4, 5, 6
2.估计量方差
N N 1 1 2 2 2 2 其中,S y ( Y Y ) , S ( X X ) i x i N 1 i 1 N 1 i 1
S yx
1 N (Yi Y )( X i X ) S x S y N 1 i 1 S yx SySx
2.估计量方差 (1)估计量方差
ˆ ) V (R ˆ) MSE ( R 1 f nX
(Y
i 1
N
i
RX i )
2
N 1
2.估计量方差
1 2 (Yi RX i ) N 1 i 1 S R S 2 RS yx
2 y 2 y 2 2 2 x 2 x
N
第二节 比估计
• 一、定义及基本性质 • (一)定义 • 1.比估计,也叫比估计量,是指以 下三个估计量。
( 1 )对简单随机抽样,若y、x 是样 本两个指标的均值,则总体这两个 指标总量或均值的比值(率)为: Y Y R 可以用: X X y ˆ ˆ 是比值估计量。 R 进行估计。R x
二、方差估计及置信限 (一)方差估计
1 n 2 ˆ 用 ( y R x ) 来估计 i i n 1 i 1 1 2 (Yi RX i ) , N 1 i 1 ˆ )的估计量可采用: 则,V ( R
N
(一)方差估计 n 1 f 1 2 ˆ ˆ v1 ( R) ( y i Rxi ) 2 nX n 1 i 1
第七章
比估计与回归估计
第一节 概述
一、问题的提出
• 本章主要讨论: • 1.估计比值 R: • 2.利用辅助信息:
二、比估计与回归估计的作用 及使用条件 • 1. 比估计与回归估计的作用 • (1)提高精度 • (2)充分利用辅助信息
2. 比估计与回归估计的使用 条件 • (1)调查主要指标与辅助变量 之间有良好的线性正相关关系 • (2)辅助变量的总体总量或均 值已知。
(二)基本性质
• 1.对于简单随机抽样,样本量n 足够大,比估计量为近似无偏估 计。
(二)基本性质
1. 对于简单随机抽样,样本量 n 足 够大,比估计量为近似无偏估计。
ˆ E ( R) R
证明
:
y y R x ˆR R R x x n大时,x X , 则: 1 ˆ E ( R R) [ E ( y ) RE ( x )] X 1 (Y RX ) 0 X ˆ) n大时,E ( R R
n 1 2 2 sx ( x x ) i n 1 i 1
1 n s yx ( y i y )( xi x ) n 1 i 1 分别是y i 与xi的样本方差及样本协方差。
(一)方差估计
ˆ )的另一个估计量: 若用x 代替X则,V ( R
n 1 f 1 2 ˆ) ˆ v2 ( R ( y R x ) i i 2 nx n 1 i 1 n 1 f n 2 ˆ 2 n 2 ˆ 2 y i R xi 2 R y i xi x n(n 1) i 1 i 1 i 1
Σ
75.00
165.00
33.0206
165.1029
(1)根据总体单元值标值可得:
X X i 30, X 5; Y Yi 66, Y 11; Y 11 R 2.2 X 5
(2)根据全部可能样本资料计算 估计量的均方误差、方差和偏倚
15 1 33 . 0206 ˆ) R ˆ E(R j 15 j 1 15
ˆ R
2.2000 2.1765 2.2222 2.2353 2.2778 2.2500 2.1579 2.2000 2.1818 2.2273 2.1500 2.1905 2.1739 2.2174 2.1600
yR
11.0000 10.8824 11.1111 11.1765 11.3889 11.2500 10.7895 11.0000 10.9091 11.1364 10.7500 10.9524 10.8696 11.0870 10.8000
R R
2.比估计是有偏的
• 例:一个N=6的人为总体,X为辅 助变量,总量X=30已知,Y为调 查指标,有关数据如总体数据表。 用简单随机抽样抽取n=4的样本, 其全部可能样本数据及比估计数 据如全部可能样本及比估计表。
N=6人为总体数据表
i Xi Yi
1 2 5
2
3
4 5 11
5
6
3 5 7 10
S R S 2 RS x S y Y (C C 2C yx )
2 2 y 2 x
2.估计量方差
1 f 2 2 2 ˆ ˆ V ( R) MSE ( R) ( S R S x 2 RS yx ) y 2 nX 1 f 2 2 2 ( S R S x 2 RS x S y ) y 2 nX 1 f 2 2 2 R (C y C x 2C yx ) n ˆ) 1 f V (R 2 2 ( C C y x 2C yx ). 2 n R
R 2.2, X 2 5 2 25, n 4 1 f 2 2 2 ( S R S x 2 RS yx ) y 2 nX 64 1 (23.6 2.2 2 5.2 2 2.2 11.0) 0.012667 4 6 25 ˆ ) 0.0012556,MSE ( R ˆ ) 0.0012575 而:V ( R
(Y
i 1 N i 1
N
i
Y )( X i X )
N
.
2 2 ( Y Y ) ( X X ) i i i 1
2.估计量方差
S C 2 ,C , Y X S yx SySx C yx YX YX 分别是Yi 及X i的相对方差
2 y 2 x
S
2 y
2 x 2
(变异系数的平方)和 相对协方差。
• (3)将比值估计量和方差分别 乘以适当的常数倍,由此得到相 应的总体均值和总体总量的比估 计量及估计量的方差。
பைடு நூலகம்
2.估计量方差
ˆ ) MSE ( y ) V ( y R ) X V ( R R
2
1 f n 1 f n 1 f n V ( yR ) Y2
1 f 2 ˆ 2 2 ˆs ) ( s R s 2 R y x yx 2 nx
(二)置信区间估计 在一定条件下,可用正态分布构造
若同时满足: n 30, cv ( x ) 0.1, cv ( y ) 0.1 用正态分布构造置信区间 ˆ V (R ˆ), R ˆ V (R ˆ)] [R
2 (S y R 2 S x2 2 RS yx ) 2 (S y R 2 S x2 2 RS x S y )
Y (C C 2C yx )
2 2 y 2 x
1 f 2 (C y C x2 2C yx ). n
ˆ ) N 2 X 2V ( R ˆ ) MSE (Y ˆ ) V (Y R R N (1 f ) 2 2 2 ( S y R S x 2 RS yx ) n N 2 (1 f ) 2 ( S y R 2 S x2 2 RS x S y ) n 1 f 2 2 Y (C y C x2 2C yx ) n ˆ ) 1 f V (Y 2 2 R ( C C y x 2C yx ). 2 n Y
7 8 15 18
全部可能样本及比估计表
样本号j
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
样本包含单元号
1, 2, 3, 4 1, 2, 3, 5 1, 2, 3, 6 1, 2, 4, 5 1, 2, 4, 6 1, 2, 5, 6 1, 3, 4, 5 1, 3, 4, 6 1, 3, 5, 6 1, 4, 5, 6 2, 3, 4, 5 2, 3, 4, 6 2, 3, 5, 6 2, 4, 5, 6 3, 4, 5, 6
n 1 f n 2 ˆ2 n 2 ˆ 2 y i R xi 2 R y i xi X n(n 1) i 1 i 1 i 1
(一)方差估计
1 f 2 ˆ 2 2 ˆ ˆs ) v1 ( R) ( s R s 2 R y x yx 2 nX n 1 2 2 其中,s y ( y y ) , i n 1 i 1
ˆ R
2.2000 2.1765 2.2222 2.2353 2.2778 2.2500 2.1579 2.2000 2.1818 2.2273 2.1500 2.1905 2.1739 2.2174 2.1600
yR
11.0000 10.8824 11.1111 11.1765 11.3889 11.2500 10.7895 11.0000 10.9091 11.1364 10.7500 10.9524 10.8696 11.0870 10.8000
x
3.75 4.25 4.50 4.25 4.50 5.00 4.75 5.00 5.50 5.50 5.00 5.25 5.75 5.75 6.25
y
8.25 9.25 10.00 9.50 10.25 11.25 10.25 11.00 12.00 12.25 10.75 11.5 12.5 12.75 13.50
2
ˆ ˆ V ( Y ) V ( y ) V ( R ) 2 R R (cv ) 2 2 2 Y Y R 1 f 2 2 (C y C x 2C yx ). n
2.估计量方差
例:对上例中的人为总体,计算 得:
2 2 Sy 23.6, S x 5.2, S yx 11.0, N 6
2.20137 ˆ ) E(R ˆ) R B( R 2.20137 2.2 0.00137
2 ˆ ˆ MSE ( R) E ( R R) 1 2 2 ˆ ˆ [ R j 2 R R j 15 R ] 15 0.0012575 2 ˆ ˆ ˆ V ( R) MSE ( R) [ B( R)]
0.0012556
(3)总体均值的比估计量的均 方误差、方差和偏倚
ˆ ) 5 0.00685 B( y R ) B( R ˆ ) 25 0.03144 MSE ( y ) MSE ( R
R
ˆ ) 25 0.03139 V ( yR ) V (R
ˆ 和y 都是有偏的, 可见,R R 但是偏倚不大,均方误差 和方差的值相差很小。