计量虚拟被解释变量模型.ppt

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
离散被解释变量模型——二元选择模型
Models with Discrete Dependent Variables—Binary Choice Model
一、二元离散选择模型的经济背景 二、线性概率模型(LPM) 三、Logit离散选择模型及其参数估计 四、Probit离散选择模型及其参数估计
一、二元离散选择模型的经济背景
(1)重复观测值不可以得到 情况下(个体数据)
Pi

1 1 e(0 1Xi )
• 关于参数的非线性函数,不能直接 求解,需采用极大似然法(ML) 估计。
• 应用计量经济学软件。
• “重复观测值不可以得到”,是指 对每个决策者只有一个观测值。即 使有多个观测值,也将其看成为多 个不同决策者。
以表示决策结果的离散数据作为被解释变量而建立的模型 称为离散被解释变量模型,或离散选择模型。
如果被解释变量只存在两种选择,称二元选择模型。
(Binary Choice Model)
如果被解释变量存在多种选择,称为多元选择模型。
(Multiple Choice Model)
一、二元离散选择模型的经济背景 实际经济生活中的二元选择问题:
(4)每单位解释变量变化的概率变化率是一个常数(由斜 率值1给出),与实际不太符合
LPM中:Pi E(Yi | Xi ) 0 1Xi Yˆ i 0.9457 0.1021 Xi
即Xi每变化一个单位,概率Pi的 变化量保持不变,而不论Xi的变 化发生在什么水平上。
二、线性概率模型(LPM——Linear Probability Model)
P
S型曲线
1
0
X
S曲线与随机变量的分布函数非常 相似。故对随机变量Yi[0,1],可 选用分布函数作为模型的设定形 式。如选逻辑(logistic)分布的概率 分布函数,对应Logit模型;选标
准正态分布的概率分布函数,对
应Probit模型。
三、Logit离散选择模型及其参数估计
逻辑分布的概 率分布函数
Probit模拟结果
JG
XY
SC
0
1500 -2
0
96.00
0
1 -8.000
0
0
375.0 -2
0
42.00 -1
1
5.000
2
0
172.0 -2
1 -8.000
0
0
89.00 -2
0
128.0 -2
1
6.000
0
0 150.0 -1
1 54.00 2
0 28.00 -2
1 25.00 0
1 23.00 0
例:求收L入i 水平ln每变1 化Pi一Pi个单位0,
1Xi
ln
Pi
拥有商品的概率变化为多少?
1 Pi

1.5932 0.0787Xi
ln Pi 1 Pi
0
1Xi
两边求 微分:
dPi Pi (1
Pi )

1dXi
当X=20时,求得P=0.4952,概率的 变化率dP/dX=0.01967,即1.967%
二、线性概率模型(LPM——Linear Probability Model)
2、 LPM的估计 Yi 0 1Xi i
直接运用OLS会遇到几个问题:
(1)随机扰动项 i 的非正态性
i

1 0 1Xi 0 1Xi
当Yi 1 当Yi 0
对于一定的Xi ,Yi 只能取两个值, i 也只能有两个可能值出现,所以 i服从二项分布
• 研究选择结果与影响因素之间的因果关系。 • 影响因素包括两部分:决策者的属性和选择对
象的属性。
• 如购买某商品与否,取决于两类因素:一类是该商品本 身所具有的属性,如性能、价格等;另一类决策者的属 性,如收入、偏好等。揭示选择结果与影响因素之间的 因果关系并应用于预测,对企业意义重大。
• 如求职者对某种职业的选择问题,取决于两类因素:一 类是该职业本身所具有的属性,如工作环境、工资水平、 职业要求等;另一类是求职者所具有的属性,如年龄、 文化水平,对职业的偏好、期望等。揭示选择结果与影 响因素之间的因果关系并用于预测,对如何适应就业市 场十分有益。
在经典计量模型中,被解释变量一般被假定为连续变量。
但常面临在可供选择的几个方案中作出决策(选择)问题, 对方案的选择结果可用离散数据表示。
如是否购买某种产品,是否参加保险,是否选择某种职业, 是否能按期偿还贷款,选择公共或私人交通工具等等。
如某一事件发生与否,分别用1和0表示;
对某一建议持强烈反对、反对、中立、支持、强烈支持5 种态度,可用0、1、2、3和4表示。
OLS法本身并不要求 i 具备正态 性,而是t检验、F检验中须假设 i具有正态性
根据中心极限定理,在大样本情 况下,二项分布趋于正态分布。
(2)随机扰动项 i 的异方差性
Var (i ) (0 1Xi)(1 0 1Xi) 常数
OLS估计量不具有最小方差性,可通过模型 变化法或加权最小二乘法(WLS)修正
1、基本形式
Pi E(Yi
|
Xi )

1
1 e(0 1Xi )
1 F(t) 1 et
逻辑分布的概
Pi 1 Pi

1/(1 e(01Xi ) )
e /(1 e ) (01Xi )
(0 1Xi )
率密度函数
e(0 1Xi )
f (t)
ln Pi 1 Pi
ˆ 0
ˆ1Xi
1.76
Pi

1

1 e(0 1Xi )

1

1 e1.76
1 1.172
0.8532
即该消费者在既定收入水平下购买汽车的概率为85.32%。
三、Logit离散选择模型及其参数估计
1、基本形式
1
Pi E(Yi | Xi ) 1 e(01Xi )
二、线性概率模型(LPM——Linear Probability Model)
2、 LPM的估计 Yi 0 1Xi i
直接运用OLS会遇到几个问题:
(3)0 E(Yi | Xi ) 1不一定成立
E(Yi|Xi)度量的是事件“Y=1”发生的概率,理论上E(Yi|Xi) 的不当值一Yˆ i应定<0介在时0于,和0视和1之同1间之Yˆ。间i=作,0。如但下实处际理上:,E当(YYˆii|>X1i)时的,估视计同值Yˆ Yiˆ=i并1;
• 模型的估计方法主要发展于20世纪80年代初期。
• (美)丹尼尔·麦克法登(Daniel ·McFadden)因为 在离散选择模型领域的贡献而获2000年诺经奖。
二、线性概率模型(LPM——Linear Probability Model)
1、基本形式 ——将二分变量Y表示为解释变量X的线性函数。
一、二元离散选择模型的经济背景
• 离散选择模型起源于Fechner于1860年进行的动物 条件二元反射研究。
• 1962年,Warner首次将它应用于经济研究领域, 用以研究公共交通工具和私人交通工具的选择问 题。
• 20世纪70、80年代,离散选择模型被普遍应用于 经济布局、企业定点、交通问题、就业问题、购 买决策等经济决策领域的研究。
0 72.00 0
0 120.0 -1
1 40.00 1
1 35.00 1
1 26.00 1
1 15.00 -1
0 69.00 -1
0 107.0 1
1 29.00 1
1 2.000 1
1 37.00 1
0 53.00 -1
0
194.0
0
JGF 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.9979 0.0000 0.0000 1.0000 0.0000 0.0000 0.0000 0.9998 0.9999 1.0000 0.4472 0.0000 0.0000 1.0000 1.0000 0.9999 0.0000 0.0000
当X=40时,求得P=0.8256,概率的
dPi dXi
1(1 Pi )Pi
变化率dP/dX=0.01133,即1.133%
表明:当收入X每变化一个单位,拥有商品概率的变化不仅与1
有关,而且与不同收入水平拥有商品的概率有关。(与LPM不同)
三、Logit离散选择模型及其参数估计
2、估计
Yi 0 1Xi i () E(Yi | Xi ) 0 1Xi
Xi为收入,Yi

1 0
购买某商品 不购买某商品
Yi 1 0 概率 Pi 1 Pi
Pi为购买某商品 (Y=1)的概率
Pi E(Yi | Xi ) 0 1Xi
E(Yi | Xi ) 0 (1 Pi ) 1 Pi Pi
1 Pi “不发生”的概率之比。
三、Logit离散选择模型及其参数估计
1、基本形式
Pi E(Yi
|
Xi )

1
1 e(0 1Xi )
Li
ln Pi 1 Pi
0 1Xi
Pi F(0 1Xi )
例:以逻辑模型描述消费者在既定收入水平下购买汽车的决
策行为。若已估计出模型的参数 ˆ 0 和ˆ1 ,并根据某消费者 的收入水平Xi ,计算出 ˆ0 ˆ1Xi 1.76
e t
(1 e t ) 2
P
1
Li ln
S型曲线
1
Pi Pi
0 1Xi
(1)L是X的线性函数,1度量的是:X每
变动一个单位,机会比率的平均变化率
(2) Pi[0,1],Li(-∞, ∞)
0 (0 1Xi )
Pi
称为机会比率(机会差异比), 即所研究的事件“发生”与
式()中被解释变量的条件期望 可解释为第i个决策者购买某商 品的概率
概率解释要求E(Yi|Xi)满足:
0 E(Yi | Xi ) 1
由于Yi的条件期望具有概率的含 义,故式()称为线性概率模型
即当收入为X时,其购买商品的 概率可表示成X的线性函数
斜率系数 1 表示:当解释变量 增加一个单位时,购买某商品 的概率增加 1 。
0
1.0000
0 131.0 -2
1 18.00
2
6.5E-13
0 80.00
1
1.0000
1 -5.000
0
0.0000
0 326.0
2
1.0000
0 261.0
1
0.0000
1 -2.000 -1
0.0000
0 14.00 -2
1.0000
1 22.00
0
0.0000
0 113.0
1
1.0000
1 42.00
1
0.00001 57.00来自YˆLPM(无约束) 1

LPM(有约束) 1
0
X
P
S型曲线
1
0
X
0
X
三、Logit离散选择模型及其参数估计
1、基本形式
一种符合实际的假设应是: (1)Pi与Xi间的关系呈现非线性关系,即Pi随着Xi的减 小,趋近于0的速度变得越来越慢;随着Xi的增大,趋近 于1的速度也变得越来越慢。 (2)Pi E(Yi | Xi ) 随Xi的变化而变化,其大小维持在0 和1之间。
2
0.9906
0 146.0
0
0.9979
1 15.00
0
1.0000
0 26.00 -2
0.0000
0 89.00 -2
0.5498
1 5.000
1
2.1E-12
1 -9.000 -1
1.0000
1 4.000
1
0.0000
0 54.00 -2
0.0000
1 32.00
1
0.0000
0 54.00
1 14.00 0
0 49.00 -1
0 14.00 -1
0 61.00 0
1 40.00 2
0 30.00 -2
0 112.0 -1
0 78.00 -2
1 0.000 0
0
131.0 -2
JGF
JG
XY
SC
0.0000
0 54.00 -1
0.0000
1 42.00
2
1.0000
0 42.00
0
0.0000
•样 本 观 测 值
CC=XY CM=SC
JG
XY
SC
0
125.0 -2
0 599.0 -2
0 100.0 -2
0 160.0 -2
0 46.00 -2
0 80.00 -2
0 133.0 -2
0 350.0 -1
1
23.00
0
0 60.00 -2
0 70.00 -1
1 -8.000 0
0 400.0 -2
ln
Pi 1 Pi
0
1X
例:贷款决策模型
• 分析与建模:某商业银行从历史贷款客户中随机 抽取78个样本,根据设计的指标体系分别计算它 们的“商业信用支持度”(CC)和“市场竞争地 位等级”(CM),对它们贷款的结果(JG)采 用二元离散变量,1表示贷款成功,0表示贷款失 败。目的是研究JG与CC、CM之间的关系,并为 正确贷款决策提供支持。
相关文档
最新文档