第八讲离散因变量模型LPM,Probit,Logit
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
LPM的估计方法:OLS
➢ 线性概率模型存在的问题及适用性
随机误差项是异方差:Var(i)pi(1pi)
办法:可用WLS估计。 ❖拟合值可能不在0-1之间,有可能大于1或小于0:
办法:强令预测值相应等于0或1 进行约束估计。
1
X iB 1
y y *
i
i 0 XiB1
0
XiB 0
LPM在实际的回归当中应用很少,用于理论模型的比较。
10
1
371
0
35
0
332
1
60
0
287
1
85
0
232
0
11
1
362
0
36
0
332
1
61
0
286
1
86
0
228
1
12
1
362
1
37
0
331
1
62
0
286
0
87ห้องสมุดไป่ตู้
0
219
1
13
1
361
1
38
0
330
1
63
0
282
1
88
0
219
1
14
0
359
1
39
0
328
1
64
0
282
1
89
0
214
1
15
0
358
1
40
0
第九章 离散因变量模型
❖ 实际经济分析当中的离散变量问题 对于单个方案的取舍购买决策、职业的选择、贷 款决策; 对于两个方案的选择。例如,两种出行方式的选 择,两种商品的选择。由决策者的属性和备选方 案的属性共同决定。
❖ 农业经济分析当中的离散因变量问题 农民技术采用、农村选举等等
内容
❖ 二元选择模型的三类模型介绍 ❖ 二元选择模型的估计: ❖ 二元选择模型的检验: ❖ 二元选择模型的应用
E (y i X i) E (X iB i) X iByi E(yi Xi)i
P(yi 1Xi)pi
P(yi 0Xi)1pi
E(yi Xi) 1*P(yi 1 Xi)0*P(yi 0 Xi) 1pi 0(1pi)pi
yi E(yi Xi)i pi i XiBi
x j 对响应概率(p)的偏效应: j
2、 Logit 模型
(1) Logit 模型的分布函数 如果选择 F(Z)1 eZ eZ11 1 eZ11 eZ
1
0.8
0.6
0.4
0.2
0
0
5
10
15
20
25
30
Logistic分布函数
具有以上分布函数的二元选择模型称为Logit模型。
(2) Logit 模型的设定
yi F(XiB)i
F(Z)1eZeZ (Z)
V a r (i) E (i2 ) 1 F (X iB )2 F (X iB ) F (X iB )2 1 F (X iB )
F (X iB )1 F (X iB )
斜率:
r E(yi Xi ) P F(XiB)
xj
xj
xj
dF( Xi B) d( Xi B)
( Xi B) xj
数据表
obs
Y SCORE D1
obs
Y SCORE D1 obs
Y SCORE D1
obs
Y SCORE D1
1
1
401
1
26
0
347
1
51
0
303
1
76
0
256
0
2
1
401
0
27
0
347
1
52
0
299
1
77
0
252
0
3
1
392
1
28
0
344
1
53
0
297
1
78
0
252
1
4
1
387
0
29
0
339
U i 1 U i0 X i( 1 0 ) (i1 i0 )
yi* Xi i
y
i
yi
1(
y
i
0)
0(
y
i
0)
选择1
不选择1 (选择0)
(二) 二元选择的经济计量一般模型
P(yi 1 Xi)P(yi*0)P(i*Xi)
1P(i* Xi)
1F(Xi)F(Xi)
F ( t) 1 F (t)
一、 二元选择模型
❖ 二元选择模型的理论模型 ❖ 二元选择模型经济计量的一般模型 ❖ 线性概率模型(LPM) ❖ Logit 模型 ❖ Probit 模型
(一) 二元选择模型的理论模型
选择理论:效用是不可观测的,只能观测到选择行为
Ui1Xi1
1 i
第i个个体选择1的效用
Ui0Xi0
0 i
第i个个体不选择1(选择0)的效用
328
1
65
0
282
0
90
0
210
1
16
1
356
1
41
0
328
1
66
0
278
0
91
0
204
1
17
0
356
1
42
0
321
1
67
0
275
0
92
0
(3) Logit 模型的边际分析
1、自变量的变化对响应概率(p)的影响:
dp dZ
f
(Z)
(1eeZZ)2
d ln( p )
dZ dx j
1 p dx j
j
xpj ddZ pxZj f(Z)j (1eeZZ)2j ( z) (1-(z))j
2、对Logit模型系数的解释:
ln( p )
odds
f
( Xi B) j
(四) 分布函数F的选取
选取分布函数F的原则:
0F(XiB)1
XiB F(XiB)1
XiB F(XiB)0
F是单调函数
按照上述原则F取作累计分布函数。 下面介绍三种不同分布函数下的计量模型:
LPM, Probit, Logit
1、 线性概率模型(LPM)
如果选择 F(XiB)XiB yi XiBi
1
54
0
294
0
79
0
245
1
5
1
384
1
30
0
338
0
55
0
293
1
80
0
243
1
6
1
379
0
31
0
338
1
56
0
293
1
81
0
242
0
7
1
378
0
32
0
336
1
57
0
292
0
82
0
241
0
8
1
378
0
33
0
334
0
58
0
291
1
83
0
239
1
9
1
376
1
34
0
332
1
59
0
291
1
84
0
235
0
E ( y i X i) 1 P 0 ( 1 P ) F ( X i )
YE(YX)
总体回归模型
样本回归模
YF(XB) y 型i F (X iB )i( i 1 ,2 ......n )
(三) 二元选择模型随机误差项及斜率
对于回归模型: yi F(XiB)i
E ( i ) 1 F ( X i B ) F ( X i B ) F ( X i B ) 1 F ( X i B ) 0
L xj
1p xj
ln(odds)odds
xj
xj
j
当 xj 增加一个单位时机会比率的增长率为 j
例1: 南开大学国际经济研究所1999级研究生考试分 数及录取情况见数据表(N = 95)。
定义变量: Y :考生录取为1,未录取为0;
SCORE :考生考试分数; D1:应届生为1,非应届生为0。
模型 yi (XiB) i
f(Z)F'(Z) eZ (Z)(1 (Z)) (1eZ)2
线性化 pi (XiB)
∵
(
Z
)
1
e
Z
e
Z
pi (XiB) eXiB 1pi 1(XiB)
得到:
其中
LiLlni(1lnpXi1piiB)pipXi iiB机会取比值P率范为o围dyd取s yL1pi ii时 取的10,或 概1,0率
➢ 线性概率模型存在的问题及适用性
随机误差项是异方差:Var(i)pi(1pi)
办法:可用WLS估计。 ❖拟合值可能不在0-1之间,有可能大于1或小于0:
办法:强令预测值相应等于0或1 进行约束估计。
1
X iB 1
y y *
i
i 0 XiB1
0
XiB 0
LPM在实际的回归当中应用很少,用于理论模型的比较。
10
1
371
0
35
0
332
1
60
0
287
1
85
0
232
0
11
1
362
0
36
0
332
1
61
0
286
1
86
0
228
1
12
1
362
1
37
0
331
1
62
0
286
0
87ห้องสมุดไป่ตู้
0
219
1
13
1
361
1
38
0
330
1
63
0
282
1
88
0
219
1
14
0
359
1
39
0
328
1
64
0
282
1
89
0
214
1
15
0
358
1
40
0
第九章 离散因变量模型
❖ 实际经济分析当中的离散变量问题 对于单个方案的取舍购买决策、职业的选择、贷 款决策; 对于两个方案的选择。例如,两种出行方式的选 择,两种商品的选择。由决策者的属性和备选方 案的属性共同决定。
❖ 农业经济分析当中的离散因变量问题 农民技术采用、农村选举等等
内容
❖ 二元选择模型的三类模型介绍 ❖ 二元选择模型的估计: ❖ 二元选择模型的检验: ❖ 二元选择模型的应用
E (y i X i) E (X iB i) X iByi E(yi Xi)i
P(yi 1Xi)pi
P(yi 0Xi)1pi
E(yi Xi) 1*P(yi 1 Xi)0*P(yi 0 Xi) 1pi 0(1pi)pi
yi E(yi Xi)i pi i XiBi
x j 对响应概率(p)的偏效应: j
2、 Logit 模型
(1) Logit 模型的分布函数 如果选择 F(Z)1 eZ eZ11 1 eZ11 eZ
1
0.8
0.6
0.4
0.2
0
0
5
10
15
20
25
30
Logistic分布函数
具有以上分布函数的二元选择模型称为Logit模型。
(2) Logit 模型的设定
yi F(XiB)i
F(Z)1eZeZ (Z)
V a r (i) E (i2 ) 1 F (X iB )2 F (X iB ) F (X iB )2 1 F (X iB )
F (X iB )1 F (X iB )
斜率:
r E(yi Xi ) P F(XiB)
xj
xj
xj
dF( Xi B) d( Xi B)
( Xi B) xj
数据表
obs
Y SCORE D1
obs
Y SCORE D1 obs
Y SCORE D1
obs
Y SCORE D1
1
1
401
1
26
0
347
1
51
0
303
1
76
0
256
0
2
1
401
0
27
0
347
1
52
0
299
1
77
0
252
0
3
1
392
1
28
0
344
1
53
0
297
1
78
0
252
1
4
1
387
0
29
0
339
U i 1 U i0 X i( 1 0 ) (i1 i0 )
yi* Xi i
y
i
yi
1(
y
i
0)
0(
y
i
0)
选择1
不选择1 (选择0)
(二) 二元选择的经济计量一般模型
P(yi 1 Xi)P(yi*0)P(i*Xi)
1P(i* Xi)
1F(Xi)F(Xi)
F ( t) 1 F (t)
一、 二元选择模型
❖ 二元选择模型的理论模型 ❖ 二元选择模型经济计量的一般模型 ❖ 线性概率模型(LPM) ❖ Logit 模型 ❖ Probit 模型
(一) 二元选择模型的理论模型
选择理论:效用是不可观测的,只能观测到选择行为
Ui1Xi1
1 i
第i个个体选择1的效用
Ui0Xi0
0 i
第i个个体不选择1(选择0)的效用
328
1
65
0
282
0
90
0
210
1
16
1
356
1
41
0
328
1
66
0
278
0
91
0
204
1
17
0
356
1
42
0
321
1
67
0
275
0
92
0
(3) Logit 模型的边际分析
1、自变量的变化对响应概率(p)的影响:
dp dZ
f
(Z)
(1eeZZ)2
d ln( p )
dZ dx j
1 p dx j
j
xpj ddZ pxZj f(Z)j (1eeZZ)2j ( z) (1-(z))j
2、对Logit模型系数的解释:
ln( p )
odds
f
( Xi B) j
(四) 分布函数F的选取
选取分布函数F的原则:
0F(XiB)1
XiB F(XiB)1
XiB F(XiB)0
F是单调函数
按照上述原则F取作累计分布函数。 下面介绍三种不同分布函数下的计量模型:
LPM, Probit, Logit
1、 线性概率模型(LPM)
如果选择 F(XiB)XiB yi XiBi
1
54
0
294
0
79
0
245
1
5
1
384
1
30
0
338
0
55
0
293
1
80
0
243
1
6
1
379
0
31
0
338
1
56
0
293
1
81
0
242
0
7
1
378
0
32
0
336
1
57
0
292
0
82
0
241
0
8
1
378
0
33
0
334
0
58
0
291
1
83
0
239
1
9
1
376
1
34
0
332
1
59
0
291
1
84
0
235
0
E ( y i X i) 1 P 0 ( 1 P ) F ( X i )
YE(YX)
总体回归模型
样本回归模
YF(XB) y 型i F (X iB )i( i 1 ,2 ......n )
(三) 二元选择模型随机误差项及斜率
对于回归模型: yi F(XiB)i
E ( i ) 1 F ( X i B ) F ( X i B ) F ( X i B ) 1 F ( X i B ) 0
L xj
1p xj
ln(odds)odds
xj
xj
j
当 xj 增加一个单位时机会比率的增长率为 j
例1: 南开大学国际经济研究所1999级研究生考试分 数及录取情况见数据表(N = 95)。
定义变量: Y :考生录取为1,未录取为0;
SCORE :考生考试分数; D1:应届生为1,非应届生为0。
模型 yi (XiB) i
f(Z)F'(Z) eZ (Z)(1 (Z)) (1eZ)2
线性化 pi (XiB)
∵
(
Z
)
1
e
Z
e
Z
pi (XiB) eXiB 1pi 1(XiB)
得到:
其中
LiLlni(1lnpXi1piiB)pipXi iiB机会取比值P率范为o围dyd取s yL1pi ii时 取的10,或 概1,0率