喀什师范学院笔记抽样调查的原理与方法第五章比率估计与回归估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

xi2 =533, 33
yi xi =3595.5 代入得
i 1
i 1
i 1
v2 (Rˆ) =0.285156,
se ( Rˆ )= v(Rˆ) =0.534
1- =0.95, u =1.96,[ Rˆ - u se ( Rˆ ), Rˆ + u se ( Rˆ )]=[6.28,8.38]
2
1。类似可得 Y 、Y的置信区间。
6
案例一
在某地区抽取由 33 个住户组成的简单随机样本,对每户调查两个指标:
xi ——第 i 户人口数,
经计算得
33
i1 xi =123
yi ——第 i 户一天用于食品支出的费用,
33
yi
i1 =907.2
33
xi2
i1 =533
33
i1 yi2 =28224
比率估计量除了使用调查变量样本信息外,还要使用辅助变量
总体信息与样本信息,而且是非线性估计量。这类估计量称为复杂
估计量。由于比率估计量使用的信息比简单估计量多,因而有可能
比简单估计量有更高的精度。同时由于比率估计量是非线性估计量,
因而对其性质的研究比对简单估计量要复杂得多。
4
二、比率估计量的偏倚与均方误差
3456789
10 11 12
xi
764 1642 957 1324 2131 1176 1618 1532 834 1432 1728 1214
yi 853 1835 1028 1512 2286 1354 1826 1721 958 1648 1904 1534
试估计今年总产值,并给出标准差的估计。
33
i1 yi xi =3595.5
试估计该地区平均每人一天用于食品的支出,并求其置信水平 95% 的置信区间。
7
解 答过程
N
设该地区共有
N
户,要估计的是 R
Yi
i 1 N

Xi
i 1
33
= = Rˆ
i 1 33
yi xi

907.2 123
7.33
i 1
N 很大, f n ≈0,
N
v2
( Rˆ )

1

f
2
n x
n
( yi Rˆxi )2
n
i 1

n
n 1
(n 1)(
n
n
n
( yi2 Rˆ 2 xi2 2Rˆ yi xi )
wenku.baidu.com
xi )2 i1
i 1
i 1
i 1
将 n=33,
33
Rˆ =7.33 及
33
yi2 =28224,
X = 18459 ×86436=97573.52(万元) 16352
v(YˆR )
N 2 (1 n
f)
n
( yi Rˆxi )2
i 1
n 1
Rˆ 56(2 1-12) 12
=
56 ( yi2 +
12 11
i 1
2 12 xi2 -2 Rˆ
12
yi xi )=909860.5376
9
解答过程
以去年产值变量为辅助变量构造比率估计量计算可得
12

xi
=16352,
12

xi2
=24043730,
x
=1362.67,
12
yi =18459,
i 1
i 1
i 1
12
yi2 =30405031,
i 1
y =1538.25,
12
yi xi =27016552
i 1
YˆR = Rˆ
比率估计量是有偏估计量,但当样本量增大时其偏倚 将趋于零 。
理论上可以证明,Rˆ, yR,YˆR 分别为 R,Y ,Y 的近似无
偏估计量,而且对于比率估计量,其方差主要取决于 Yi 与 RX i 之间的差异,当 Yi RXi 时,估计量方差将很小。 换言之,比率估计量将有很高的精度。这告诉我们,只 有当两个变量大致成正比例关系时,应用比率 估计量才能使估计精度有较大改进。
i 1
i 1
se (Yˆ )=953.87 R
10
四、 比率估计量优于简单估计量的条件
定量分析计算表明,并非任何情况下比率估计量都优于简单估计量,
只有当调查变量与辅助变量有较高的正相关性时比率估计量才能使估计
精度有较大提高。若 CY
2
第一节 问题的提出
在许多实际问题中常常涉及两个调查变量(指标)Y 和X 。 对于包含个抽样单元的总体除了对总体信息进行估计外,常 常要估计总体比率R。总体比率在形式上总是表现为两个变 量总值或均值之比。 在涉及两个变量的抽样调查中,有两种情况需要应用比率 估计量。一种情况是利用双变量样本对总体比率进行估计需 应用比率估计量,此时两个变量均为调查变量。另一种情况 是一个变量为调查变量,另一个变量表现为与调查变量有密 切关系的辅助变量,在对调查变量总体总值、总体均值等目 标量进行估计时,利用已知的辅助变量信息构造比率估计量 可以改进估计的精度。
18
35%
16
30%
14
12
25%
10
20%
8
`
15%
6
10%
4
2
5%
0
0%
50-60
70-80
90-100
第五章
比率估计与回归估计
本章要点
本章讨论了简单随机抽样和分层随机抽样下比率估计量 和回归估计量的构造及性质。要求:
①掌握总体比率、比率估计量及回归估计量的概念。 ②了解比率估计量、回归估计量的偏倚、方差及方差的 估计量。 ③掌握应用比率估计量及回归估计量的条件。
2
2
2
故该地区人均每天食品支出 7.33 元,区间估计为[6.28,8.38]元。
8
案例二

某系统有 56 个企业,去年全系统总产值 86436 万元。为估计今年总产值,
当年年底在所辖全部企业中随机抽取 12 个企业进行调查得如下资料,其中 xi ,
yi 分别为去年和当年产值。
企业 1 2
表 5-3 12 个企业两年产值
基于这种考虑利用已知的辅助变量信息构造比率估计量就 可使估计精度加以改进。
3
第二节 比率估计

一、比率估计量
设对有两个调查变量Y 和X 的总体进行简单随机抽样 ,分别以y,
x表示样本总值 ,以 y, x表示样本均值,以 Rˆ y y 为样 xx
本比率 ,用 作Rˆ 为总体比率R的估计称为的比率估计 。
5
三、 比率估计量方差的估计与置信区间
对于一般的n,比率估计量呈右偏分布,只有
当n>30, C <0.1, C <0.1这些条件同时满足时才
x
y
能直接用正态分布构造置信区间。R的置信区间为
[Rˆ[ u se(Rˆ), Rˆ u se(Rˆ)] ]
2
2
其中 u 是标准正态分布的上α /2分位点,0<α <
相关文档
最新文档