多元选择模型
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 调查样本,有效样本303份。 • 首先将定义的全部变量放进模型中进行估计,并通过比较 各个变量的P值来考虑具体剔除哪些变量以及对哪些变量 考虑将其交互影响的效应放进模型中去。 • 小城镇、县级市、地级市、省级城市和超大城市依次取值 1、2、3、4、5。
迁移目标 小城镇 县级市 地级市 省级城市 超大城市
ik
k 0
J
exp(X i j Z j )
多元logit(ML)估计
对数似然函数的形式:
ln L( y, X , ) yij ln pij
i 1 j 1 J J yij ( X i j Z j ) ln[ exp(X i k Z k )] i 1 j 1 k 0 n n J
现有收入 -0.00144* -0.00032** -0.00028**
log(2/5) -0.2800*** log(3/5) log(4/5) -0.1136* -0.0856
-0.1578*** -0.00030**
• 从教育程度来看,所有系数都是负值,教育程度越高的农 村劳动力越愿意进入规模较大的城市;从显著性水平来看, 相对于超大城市来说,县级市被选择的可能性最小,其次 是小城镇,然后是地级城市,而教育程度相似的农村劳动 力在省级城市与超大城市之间的选择没有明显的差异。 • 从家庭情况来看,所有系数都是负值,也就是说家庭情况 越好的农村劳动力越愿意进入规模较大的城市;从显著性 水平来看,相对于超大城市来说,省级城市最不容易被选 中,其次是县级市,而小城镇与地级市之间没有明显区 别。 • 从现有收入来看,所有系数都是负值,也就是说目前收入 越高的农村劳动力越愿意进入规模较大的城市;再从显著 性水平来看,所有系数都是显著的,这说明相对于任何级 别的城市而言,农村劳动力都更倾向于超大城市。
(d
i
ij
Pij ) X i
j 1,2, , J
n 2 ln L Pij (1( j l ) Pil ) X i X i j l i 1
1 1( j l ) 0
如果j l 如果j l
由对数似然函数最大化的一阶条件,利用Newton 迭代方法可以迅速地得到方程组的解,得到模型 的参数估计量。
, ,, n; j 012 , , ,, J ) 的联合概率函 能存在 1 个 d ij 1。于是,可以写出 yij (i 12
数,由联合概率函数导出似然函数,进而得到对数似然函数为:
ln L
d
i 1 j 0
n
J
ij ln
P( y i j )
ln L j
Conditional Logit Model 条件Logit模型
Nested Logit模型 嵌套模型
⒉多元名义Logit离散选择模型及其参数估计 (multinomial logit model,也叫纯logit模 型)
P( y i j ) e
Xi j
j 0
J
e
Xi j
X中未包含备选方案所具有的 属性变量,而参数向量B对不 同的选择方案(即不同的方程) 是不同的。
ij
的独立性不仅要求消费者之间的随机扰动 项互相独立,同时,同一个消费者对于不 同选项的随机扰动项也是相互独立的,即 ij 独立于个人和选项。
极值分布有一个很好的积分性质,即
exp( ). exp( exp( c))d exp(c) 2、选择概率 pij Pr(yij 1) Pr( U ij U ik , j k )
Pr( ik ij Vij ) Pr( ik ij Vij Vik ) exp( exp( ij Vij Vik ))
可以证明:
pij exp( Vij )
k j
exp(V
k 0
J
)
exp(X i j Z j )
ij 的分布形式将决定后面选择概率的形式
Zj
和结果。 表示选项j的性能指标,其变化影 响消费者选择j的效用,而不影响他选择其 是固定参数,不随选项而变化 他的效用。 。
4、选择概率
Pij Pr(yi j | X i , Z j ) Pr(yij 1 | X i , Z j ) Pr( U ij U ik , j k ) Pr( ik ij Vij Vik )
*代表的是10 %的显著性水 平, **代表的是5 %的显著性水 平, ***代表的是1 %的显著性水 平。
• 将模型的结果整理出来,并对每个解释变量进行分析。 • 例如:教育程度、家庭情况及现有收入对迁移目标的影响:
因变量 log(1/5)
教育程度 -0.2475**
家庭情况 -0.1299 -0.0943* -0.0337
一、多元离散选择模型的经济背景
1、经济生活中的多元选择问题
• 一般的多元选择问题
• 排序选择问题 – 将选择对象按照某个准则排队,由决策者从中 选择。 – 决策者对同一个选择对象的偏好程度。
• 嵌套选择问题
因变量的取值由理性消费者基于效用最大化来考虑, 因此称为多元选择模型。
2、社会生活中的多元选择问题
1.参数解释 把B0标准化为零, 则有 : ln Pij / Pi 0 xi j ln(Pij / Pi 0 ) j X i 表示相对于选项0(参照),Xi 变化对选择J 和0的概率比 对数的边际影响, j 0, 当X增加时,i选择j的概率会上升.
j 0, i选择j的概率会下降.
其中,根据效用最大化假设,
yi j,当且仅当 Uij Uik , j k
或者可以表示为: y
ij
1, 当且仅当U ij U ik 0, 其他
5、估计方法:极大似然估计 对数似然函数为:
ln L yij ln Pr(yi j | X i , Z j )
i 1 j 0 n J
• 实用的一般多元Logit选择模型又分3种情况。
• 一是研究选择某种方案的概率与决策者的特征变 量之间的关系;
• 二是研究选择某种方案的概率与决策者的特征变 量以及方案的特征变量之间的关系; • 三是考虑到不同方案之间的相关性的情况。
Multinomial Logit Model 多项式Logit模型 名义Logit模型
频数 15 62 84 72 70
百分比 4.95 20.46 27.72 23.76 23.10
累计频数 15 77 161 233 303
累计百分比 4.95 25.41 53.14 76.90 100.00
• 由于得到了频数,可以采用“对数概率模型”进行估计。
• 最终模型的估计结果(部分)
变量 常数项 模型序号 系数估计 1 2** 3** 4*** 教育程度 1** 2*** 3* 4 家庭情况 1 2* 3 4*** 1.2137 2.7685 2.3962 3.6742 -0.2475 -0.2800 -0.1136 -0.0856 -0.1299 -0.0943 -0.0337 -0.1578 标准差 1.4518 1.0998 0.9351 1.0665 0.1050 0.0727 0.0660 0.0696 0.1084 0.0552 0.0452 0.0586 P值 0.4032 0.0118 0.0104 0.0006 0.0184 0.0001 0.0852 0.2184 0.2310 0.0877 0.4556 0.0071
2、边际影响 J Pij Pij ( j Pk k ) Pij ( j ), X i k 0 X i 对Pij的影响不仅取决于j , 而且取决于所有选项的参数.
例题
• 农村异地转移劳动力的迁移目标研究。 • 被解释变量:迁移目标,即小城镇、县级市、地级市、省 级城市和超大城市,依次取值1、2、3、4、5。 • 解释变量:个人特征和目前所在地属性。连续变量包括受 教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、 原有收入、现有收入,目前所在地属性中的所在地农村人 口、国内生产总值、城乡居民储蓄余额、粮食产量、中学 生在校人数、小学生在校人数等。离散变量包括性别、婚 姻状况、收入稳定与否,目前所在地所属级别与家乡所在 地所属级别等。 • 虽然作为被解释变量的城市规模本身是有序的,但是对于 农村劳动力来说,选择进入哪一个级别的城市,本身是无 序的,因此对于城市化迁移目标构造多元名义logit离散选 择模型。
pik
i
j
j
exp(X i k Z j )
这个假设成立的条件是随机效用函数中的随 机项相互独立,被称为无关选项独立性假 设(independence of irrelevant alternatives)。
IIA假设要求在控制可观测变量的基础上,任 何两个选项的效用是独立的。当IIA成立时 ,即使J很大,我们也可以利用所观察到的 消费者对其子集中的部分选项的选择结果 ,对模型的参数进行估计。 红绿公交车的选择与IIA
d
i 1 j 1
n
J
ij ( X ij
Xi )
Xi
P X
j 1 ij
J
ij
n 2 ln L i 1
P (X
P( y i j ) 1eXi jk 1J
P( y i 0) 1
1
e X i k
k 1
J
e X i k
令B0=0,j=1,2,…,J
多元名义 Logit 离散选择模型的参数估计并不复杂。对于第 i 个决策者,如果 选择了第 j 个备选方案,令 d ij 1 ;如果没有选择第 j 个备选方案,令 dij 0 。 同时,对于第 i 个决策者,在(J+1)个备选方案中,只能选择其中之一,即只
⒊多元条件Logit离散选择模型及其参数估计
• 选择某种方案的概率不仅与决策者的特征变量有 关,而且也与方案的特征变量有关,模型为:
P( yi j )
e
J j 1
X ij X ij
e
区别在于 X的下标
ln L
d
i 1 j 1
n
J
ij ln
P( y i j )
ln L
6、估计选择概率:可以为每个决策者对每个 选项的选择概率Pij 进行估计
多元logit模型
1、对 ij 的分布假设 在多元logit模型中,我们假设 ij 独立同分布于 极值分布,其密度函数和分布函数分别为
f ( ) exp( ).exp( exp( )) F ( ) exp( exp( )) E ( ) 0, D( ) 2 / 6
据此得出一阶条件
ln L ln L 0, 0, j
多元Logit模型中的重要假设IIA
个人i选择j和k的机会比只与j和k两个选项有关 ,与其他选项无关。这意味着如果从选择 集中去掉或加入其他选项,都不影响个人i 选择j和k的机会比。 p exp(X Z )
ij
离散被解释变量数据计量经济学模型— 多元选择模型 Models with Discrete Dependent Variables—Multiple Choice Model
一、多元离散选择模型的经济背景 二、一般多元离散选择Logit模型 三、嵌套多元离散选择模型 四、排序多元离散选择模型
McFadden的论文“the measurement of urban travel demand”奠定了多元选择模型的基础 ,也因此荣膺2000年的诺奖。
• 一般的多元选择问题:穷尽\互斥
• 排序选择问题 • 嵌套选择问题
二、一般多元离散选择Logit模型
多元选择模型的基本框架
1、所观察到的因变量的取值都是理性个人的 选择结果。 2、选项是穷尽互斥的。 3、随机效用函数与效用最大化假设
Uij X i j Z j ij Vij ij