回归估计量
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、分别回归估计量
二、组合回归估计量
一、分别回归估计量
Y WhYh
h 1 L
Yh 的回归估计量 ylrh yh bh X h xh
的分别回归估计量为
Y
ylrs Wh ylrh Wh yh bh X h xh
h 1 h 1
§5.5 与比率估计量及单元均值的 大样本比较
当n很大时,
1 f 2 2 V ylr S y 1 n 1 f 2 2 2 V yR S R S x 2R S y S x y n 1 f 2 V y Sy n
显然, V ylr V y
2 b B S S 由定理2知,当 h h yxh xh 时, V ylrh min, h 1, , L
从而
Vmin ylrs Wh2Vmin ylrh
h 1 L
L
W 1 f h 2 2 S yh 1 h nh h 1
是无偏的,它的方差是
1 f i 1 V ylr n N 1 1 f 2 2 2 S 2 b S b y 0 yx 0 Sx n 注 对有限总体中y与x的关系不要求作任何假设。
i 0 i
Y Y b X
N
X
2
推论1 V ylr 的一个无偏估计是
其中
h 1
L Wh2 1 f h 2 ah S xh , Bc ah Bh nh h 1 L
L
2
a
h 1
h
这一结果表明,除非各层的Bh相同,否则最佳选取 的分别估计量比组合估计量有更小的方差。当然, 2 要事先知道 Syxh和S xh 才能作出这些最佳的选择。
§5.7 从样本估计回归系数
L
§5.8 两类回归估计量的比较
分别估计量的缺点是个别层的样本较小时它易受偏 差的影响,组合估计量的缺点是当总体回归系数在 各层不同时,它的方差就会被夸大。 如果我们相信回归是线性的,且各层的Bh看来大致 相同,则采用组合估计量较好。若回归看来是线性 的,但Bh在各层似乎有明显的不同,则采用分别估 计量较为合适。若回归是有些曲线性质,而采用的 是线性回归估计量时,则除了各层样本都较大的情 形以外,采用组合估计量大概会更安全些。
n
i 0 i 1 f 2 i 1 s ylr n n 1 1 f 2 2 2 s 2 b s b y 0 yx 0 sx n
y y b x x
2
定理2 使V ylr 达到最小值的b0是
b0 B
S yx S
2 x
Y Y X
i 1 i
N
i
X
2
X
i 1
N
i
X
称为有限总体中y 对x的线性回归系数。
§5.3 从样本算出b时的回归估计量
B的最小二乘估计是 n
b
y y x x
i 1 i i
x x
i 1 i
n
2
定理3 设b是B的最小二乘估计,且有 ylr y b X x 则对容量为n的简单随机样本,当n很大时, 1 f 2 V ylr S y 1 2 n 其中 S yx S y S x 是y与x的总体相关系数。
Bh的最小二乘估计为
bh
y
i 1
n
hi n
yh xhi xh
hi
x
i 1
xh
2wk.baidu.com
当nh都很大时,将定理3用于每一层,有
Wh2 1 f h 2 2 V ylrs S yh 1 h nh h 1
L
用
2 y . xh
L
使 V ylrc min 的b值是 L W 2 1 f h h S yxh Bc nh h 1 可以证明
2 Wh2 1 f h S xh nh h 1 L
Vmin ylrc Vmin ylrs ah Bh Bc
§5.1 线性回归估计量
当n=N时,ylr Y b X X Y ,所以 ylr 是 Y 的一 致估计量。 若 b=0,则 ylr y 。 y y y X yR 。 若 b ,则 ylr y X x x x x
Y 的线性回归估计量是 ylr y b X x
n 1 n 2 2 2 s yhi yh bh xhi xh nh 2 i 1 i 1 2 2 代替 S yh 1 h ,即可得到 V ylrs 的样本估计量。
Bc的一个估计量为
Wh2 1 f h s yxh nh h 1 bc L 2 Wh 1 f h 2 sxh nh h 1 V ylrc 的一个估计量为 2 nh L W 1 f 2 2 h h s ylrc yhi yh bc xhi xh h 1 nh nh 1 i 1
1 f 2 2 2 2 V yR V ylr R S 2 R S S S x y x y n 2 1 f RS x S y 0 n 在小样本情况下,无法对 ylr , yR , y 的精度作出比较 。
§5.6 分层抽样中的回归估计量
L
L
当bh是事先给定时, ylrs 是Y 的无偏估计,且
L L 2 V ylrs V Wh ylrh Wh V ylrh h1 h1 L Wh2 1 f h 2 2 2 S yh 2bh S yxh bh S xh nh h 1
§5.2 b已预先确定情况下的回归估计量
在大部分的应用中,b是从样本的结果中估计得出的 ,这时b可视为一随机变量。但有时也有理由要事先 选好b的值,如有良好的经验和资料能较好地事先确 定好b ,这时b可视为一常数。 定理1 在简单随机抽样中,当b0是预先确定的常数 时,线性回归估计量 ylr y b0 X x
经典的线性回归的理论的一些标准结果对抽样调查 并不都是适用的,因为它要假定y对x 的总体的回归 是线性的,y对这条回归线的剩余方差是常数,并且 总体是无限的。若前两个假定完全是错的,则线性 回归估计量可能就不能用了。然而在y对x的回归被 认为是近似线性的调查中,不必假定确切的线性关 系或常值的剩余方差就能用ylr 。
2 h
图中如何分层对精度更有利
二、组合回归估计量
分别对Y 和 X 作出估计
yst Wh yh , xst Wh xh
h 1 h 1
L
L
Y 的组合回归估计量为 ylrc yst b X xst ylrc 是Y 的无偏估计,且 当b是事先给定时,
Wh2 1 f h 2 2 2 V ylrc S 2 bS b S xh yh yxh nh h 1
§5.4 方差的样本估计
V ylr 的一个大样本估计量
n 1 f 2 2 s ylr yi y b xi x n n 2 i 1 2 n yi y xi x n 1 f 2 i 1 yi y n 2 n n 2 i 1 xi x i 1
《抽样技术》第五章
王学民 编
第五章 回归估计量
§5.1 §5.2 §5.3 §5.4 §5.5 §5.6 §5.7 §5.8
线性回归估计量 b已预先确定情况下的回归估计量 从样本算出b时的回归估计量 方差的样本估计 与比率估计量及单元均值的大样本比较 分层抽样中的回归估计量 从样本估计回归系数 两类回归估计量的比较
二、组合回归估计量
一、分别回归估计量
Y WhYh
h 1 L
Yh 的回归估计量 ylrh yh bh X h xh
的分别回归估计量为
Y
ylrs Wh ylrh Wh yh bh X h xh
h 1 h 1
§5.5 与比率估计量及单元均值的 大样本比较
当n很大时,
1 f 2 2 V ylr S y 1 n 1 f 2 2 2 V yR S R S x 2R S y S x y n 1 f 2 V y Sy n
显然, V ylr V y
2 b B S S 由定理2知,当 h h yxh xh 时, V ylrh min, h 1, , L
从而
Vmin ylrs Wh2Vmin ylrh
h 1 L
L
W 1 f h 2 2 S yh 1 h nh h 1
是无偏的,它的方差是
1 f i 1 V ylr n N 1 1 f 2 2 2 S 2 b S b y 0 yx 0 Sx n 注 对有限总体中y与x的关系不要求作任何假设。
i 0 i
Y Y b X
N
X
2
推论1 V ylr 的一个无偏估计是
其中
h 1
L Wh2 1 f h 2 ah S xh , Bc ah Bh nh h 1 L
L
2
a
h 1
h
这一结果表明,除非各层的Bh相同,否则最佳选取 的分别估计量比组合估计量有更小的方差。当然, 2 要事先知道 Syxh和S xh 才能作出这些最佳的选择。
§5.7 从样本估计回归系数
L
§5.8 两类回归估计量的比较
分别估计量的缺点是个别层的样本较小时它易受偏 差的影响,组合估计量的缺点是当总体回归系数在 各层不同时,它的方差就会被夸大。 如果我们相信回归是线性的,且各层的Bh看来大致 相同,则采用组合估计量较好。若回归看来是线性 的,但Bh在各层似乎有明显的不同,则采用分别估 计量较为合适。若回归是有些曲线性质,而采用的 是线性回归估计量时,则除了各层样本都较大的情 形以外,采用组合估计量大概会更安全些。
n
i 0 i 1 f 2 i 1 s ylr n n 1 1 f 2 2 2 s 2 b s b y 0 yx 0 sx n
y y b x x
2
定理2 使V ylr 达到最小值的b0是
b0 B
S yx S
2 x
Y Y X
i 1 i
N
i
X
2
X
i 1
N
i
X
称为有限总体中y 对x的线性回归系数。
§5.3 从样本算出b时的回归估计量
B的最小二乘估计是 n
b
y y x x
i 1 i i
x x
i 1 i
n
2
定理3 设b是B的最小二乘估计,且有 ylr y b X x 则对容量为n的简单随机样本,当n很大时, 1 f 2 V ylr S y 1 2 n 其中 S yx S y S x 是y与x的总体相关系数。
Bh的最小二乘估计为
bh
y
i 1
n
hi n
yh xhi xh
hi
x
i 1
xh
2wk.baidu.com
当nh都很大时,将定理3用于每一层,有
Wh2 1 f h 2 2 V ylrs S yh 1 h nh h 1
L
用
2 y . xh
L
使 V ylrc min 的b值是 L W 2 1 f h h S yxh Bc nh h 1 可以证明
2 Wh2 1 f h S xh nh h 1 L
Vmin ylrc Vmin ylrs ah Bh Bc
§5.1 线性回归估计量
当n=N时,ylr Y b X X Y ,所以 ylr 是 Y 的一 致估计量。 若 b=0,则 ylr y 。 y y y X yR 。 若 b ,则 ylr y X x x x x
Y 的线性回归估计量是 ylr y b X x
n 1 n 2 2 2 s yhi yh bh xhi xh nh 2 i 1 i 1 2 2 代替 S yh 1 h ,即可得到 V ylrs 的样本估计量。
Bc的一个估计量为
Wh2 1 f h s yxh nh h 1 bc L 2 Wh 1 f h 2 sxh nh h 1 V ylrc 的一个估计量为 2 nh L W 1 f 2 2 h h s ylrc yhi yh bc xhi xh h 1 nh nh 1 i 1
1 f 2 2 2 2 V yR V ylr R S 2 R S S S x y x y n 2 1 f RS x S y 0 n 在小样本情况下,无法对 ylr , yR , y 的精度作出比较 。
§5.6 分层抽样中的回归估计量
L
L
当bh是事先给定时, ylrs 是Y 的无偏估计,且
L L 2 V ylrs V Wh ylrh Wh V ylrh h1 h1 L Wh2 1 f h 2 2 2 S yh 2bh S yxh bh S xh nh h 1
§5.2 b已预先确定情况下的回归估计量
在大部分的应用中,b是从样本的结果中估计得出的 ,这时b可视为一随机变量。但有时也有理由要事先 选好b的值,如有良好的经验和资料能较好地事先确 定好b ,这时b可视为一常数。 定理1 在简单随机抽样中,当b0是预先确定的常数 时,线性回归估计量 ylr y b0 X x
经典的线性回归的理论的一些标准结果对抽样调查 并不都是适用的,因为它要假定y对x 的总体的回归 是线性的,y对这条回归线的剩余方差是常数,并且 总体是无限的。若前两个假定完全是错的,则线性 回归估计量可能就不能用了。然而在y对x的回归被 认为是近似线性的调查中,不必假定确切的线性关 系或常值的剩余方差就能用ylr 。
2 h
图中如何分层对精度更有利
二、组合回归估计量
分别对Y 和 X 作出估计
yst Wh yh , xst Wh xh
h 1 h 1
L
L
Y 的组合回归估计量为 ylrc yst b X xst ylrc 是Y 的无偏估计,且 当b是事先给定时,
Wh2 1 f h 2 2 2 V ylrc S 2 bS b S xh yh yxh nh h 1
§5.4 方差的样本估计
V ylr 的一个大样本估计量
n 1 f 2 2 s ylr yi y b xi x n n 2 i 1 2 n yi y xi x n 1 f 2 i 1 yi y n 2 n n 2 i 1 xi x i 1
《抽样技术》第五章
王学民 编
第五章 回归估计量
§5.1 §5.2 §5.3 §5.4 §5.5 §5.6 §5.7 §5.8
线性回归估计量 b已预先确定情况下的回归估计量 从样本算出b时的回归估计量 方差的样本估计 与比率估计量及单元均值的大样本比较 分层抽样中的回归估计量 从样本估计回归系数 两类回归估计量的比较