第十讲多元离散选择模型2
离散选择模型
![离散选择模型](https://img.taocdn.com/s3/m/c20ac10ebed5b9f3f90f1c1b.png)
二元选择模型
解释变量与因变量的关系
解释变量与因变量的关系
在二元选择模型中,解释变量与因变量之间的关系
如何描述呢? 首先,我们可以将模型写成如下形式:
P Y 1 F x
但是由于 F x 不一定是线性函数,因此x对于Y的 影响不能简单的用 表示。
二元选择模型
二元选择模型的一个例子
分析劳动力就业情况,Y=1表示就业,Y=0表示失
业,若x为影响因素,β为参数向量,则劳动力就业 的概率与影响因素的关系就可以表示为:
P Y 1 F x, P Y 0 1 F x,
其中,F (x, β)是与x和β有关的分布函数。
解释变量与因变量的关系
由于有
P Y 1 E Y F x
所以x对于事件Y 1 发生的概率,即 P Y 1 的影响
为:
E Y dF x f x x d x
解释变量与因变量的关系
由于变量Y是一个二元变量,因此有:
N1 E Y P Y 1 E Y F x, N
二元选择模型
分布函数的几种不同形式
线性概率模型
线性概率模型即假设分布函数为线性形式: 因此有:
F x, x
Y E Y Y E Y
Pij P Yi j P U ij U i j
Logit模型
与二元选择模型的思路一样,我们使用一种特定的
分布函数来描述这一概率,假设 ij 独立同分布,且 服从Weibull分布,分布函数的形式为:
F t exp e t
离散选择模型
![离散选择模型](https://img.taocdn.com/s3/m/85d2d628482fb4daa58d4b96.png)
Yi 0 1GPAi 2 INCOMEi ui
其中:
1 Yi 0
第i个学生拿到学士学位后三年内去读研 该生三年内未去读研
GPA=第i个学生本科平均成绩 INCOME=第i个学生家庭年收入(单位:千美元)
设回归结果如下(所有系数值均在10%水平统计上显著):
ˆ Yi 0.7 0.4GPAi 0.002 INCOMEi
yi 0 yi 1
函数可以简化为:
L (1 F ( X ))1 yi F ( X ) yi
yi 1
对方程左右取对数我们便得到:
ln L [ yi ln F ( X ) (1 yi ) ln(1 F ( X ))]
i 1
n
似然函数为
fi ln L n yi fi [ (1 yi ) ]xi 0 Fi 1 Fi i 1
Pr ob(Y 1 X ) X F ( X ) f ( X ) X
因此我们在遇到二元响应模型时,估计出参数我们不能盲目的 将其解释为:解释变量变动一个单位,相对应的因变量变化参 数个单位。
为了解决偏效应的问题我们引入调整因子的概念。 在上式中的 f ( X ) 我们 便称为比例因子或调整因子,它与全部 的解释变量有关,为了方便起见,我们要找一个适用于模型所有 斜率的调整因子。有两种方法可以解决: (1)用解释变量的观测值计算偏效应的表达式,调整因子为:
四、二元选择模型的估计
1.除了LPM模型以外,二元选择模型的估计都是以极大似然法为基础 的 。由前面的讨论我们知道:
P(Y 1 X ) F ( X )
由此我们可以得到模型的似然函数为:
P(Y1 y1 ,Yn yn X ) (1 F ( X )) F ( X )
《离散选择模型》课件
![《离散选择模型》课件](https://img.taocdn.com/s3/m/dd019fb14793daef5ef7ba0d4a7302768e996fbc.png)
极大似然估计法
通过最大化似然函数,估计模型 的参数值。
差分法估计法
通过对变量的差分进行估计,减 少了共线性问题的影响。
一般化估计方程法
通过建立一般化估计方程,对参 数进行估计。
离散选择模型的应用
公共交通出行方式选择
分析人们在选择公共交通出行方式时的决策行为,为政府制定交通政策提供依据。
食品品牌选择
确定性
选择结果是确定的,参与者 不受随机因素的影响。
离散选择模型的数学模型
1Байду номын сангаас
多项式Logit模型
通过对选择概率进行建模,预测参与者选择各个选项的概率。
2
二项式Logit模型
基于二项分布,预测参与者是否选择某个选项。
3
线性概率模型
使用线性回归方法,预测选择某个选项的概率。
离散选择模型的参数估计方法
离散选择模型是一种描述人们在面临离散选择时决策行为的数学模型。
2 离散选择模型的应用领域
离散选择模型被广泛应用于诸多领域,如公共交通、市场营销和行为经济学等。
离散选择模型的基本假设
可比性
各个选择项之间可以进行比 较,存在客观标准用于决策。
独立性
参与者之间的选择行为是独 立的,不受其他参与者的影 响。
《离散选择模型》PPT课 件
离散选择模型是一种用于分析人们在面临离散选择时的决策行为的统计模型。 本课件将介绍离散选择模型的定义、基本假设、数学模型、参数估计方法、 应用、不足及未来发展方向。
什么是离散选择模型
离散选择模型是一种用于研究人们在面临可选项时所作出的离散决策行为的统计模型。
1 离散选择模型的定义
将离散选择模型与其他决策模 型进行结合,以提高模型的准 确性和解释能力。
离散选择模型
![离散选择模型](https://img.taocdn.com/s3/m/9759d745b307e87101f6967c.png)
六、二元选择模型的参数检验 6.1 单个系数的显著性检验
一个解释变量(对二元决策的概率)是否有显著性影响的检验,如同正态
线性回归分析的单个系数的检验类似,根据模型中的待估系数与其方差计算 z 统计量,并检验假设 H0 : βi = 0 。
6.2 总体显著性检验 由于 Logit 模型、Probit 模型是非线性的,在同时检验多个系数是否为 0 时,
33潜回归我们假设存在一个不可观察的潜在变量称为决策倾向是指标变量的连续性函数记为iy它与指标变量ix之间具有如下线性关系i1kkiiiyxxu该方程称为潜回归方程其中iu是随机扰动项1ikixx??????????1k??????????34量变临界值选取量变到多少时个体才进行选择呢
离散选择模型
郑安
是估计系数的协方差
矩阵, βˆ 是无约束模型得到的估计值。可以证明,W 渐进服从 χ 2 (k −1) 分布。
所以 W 检验只需要估计无约束模型 (2)对数似然比检验(只适用于线性约束) H0 : β2 = β3 = " = βk = 0
检验统计量: LR = −2[ln L(βˆR ) − ln L(βˆ)]
其中,ln L(βˆR ) 是约束模型的最大对数似然函数值,ln L(βˆ) 是非约束模型的最大
对数似然函数值。可以证明,在零假设下,LR 渐进服从 χ 2 (k −1) 分布。所以 LR
检验既需要估计有约束模型,又需要估计无约束模型 (3)拉格朗日乘子检验(适用于线性和非线性约束) H0 : β2 = β3 = " = βk = 0
离散选择模型起源于 Fechner 于 1860 年进行的动物条件二元反射研究。1962 年,Warner 首次应用于经济领域。20 世纪 70 和 80 年代,离散选择模型普遍应 用于经济布局、交通问题、就业问题、购买决策问题等经济决策领域的研究。 模型的估计方法主要发展于 20 世纪 80 年代初期,远远滞后于模型的应用,并 且至今还在不断改进,它属于微观计量经济学——即研究大量个人、家庭或企 业的经济信息,McFadden 因为在微观计量经济学领域的贡献而获得 2000 年诺 贝尔经济学奖。
离散选择模型和连续选择模型的比较分析
![离散选择模型和连续选择模型的比较分析](https://img.taocdn.com/s3/m/90330e4dba68a98271fe910ef12d2af90342a846.png)
离散选择模型和连续选择模型的比较分析一、引言选择模型是指通过研究个体选择行为来预测市场需求的一种模型。
根据选择的属性是否可测,选择模型可以分为离散选择模型和连续选择模型。
离散选择模型是指选择行为的结果是分类的,例如选择是A、B还是C。
而连续选择模型是指选择行为的结果是连续的,例如选择的数量是多少。
本文将对离散选择模型和连续选择模型进行比较分析。
二、离散选择模型离散选择模型常用于解释市场需求中的离散选择行为,包括二项选择模型、多项选择模型、有序多项选择模型等。
1、二项选择模型二项选择模型常用来解释个体在两个选项之间进行选择的概率。
其模型设定为,在两个选项中,个体选择第一个选项1的概率为P,选择第二个选项2的概率为1-P,二者之和为1。
该模型假设个体根据其效用(utility)差异进行选择,即个体会选择能够获得最大效用的选项。
2、多项选择模型多项选择模型常用来解释个体在多个选项之间进行选择的概率。
其模型设定为,对于N个选项,个体选择第i个选项的概率为Pi,所有选项的概率之和为1。
该模型假设个体会选择能够获得最大效用的项,效用函数通常采用对数线性模型(Logit Model)。
3、有序多项选择模型有序多项选择模型常用来解释个体在多个选项之间进行有序选择的概率。
例如,当个体面对三个不同价格的产品时,个体有可能在选择第一价格区间的产品、第二价格区间的产品或者第三价格区间的产品。
该模型假设选择的概率是对价值的一次函数,因此需要先对选项进行排序以确定选择的顺序,然后再推导选择的概率。
三、连续选择模型连续选择模型常用于解释市场需求中的连续选择行为,包括对数线性模型、线性规划模型等。
1、对数线性模型对数线性模型是一种常用的连续选择模型。
它假设个体的效用函数是一个对数线性函数,其中因变量是一个连续变量,例如价格、数量等。
对数函数可以将效用函数转化为线性形式,从而便于分析。
2、线性规划模型线性规划模型是一种常用的数学优化模型,用于解决连续选择问题。
离散选择模型ppt课件
![离散选择模型ppt课件](https://img.taocdn.com/s3/m/653a98b471fe910ef12df88c.png)
PYi 1 / X i
6
例如,我们对一个是否拥有自有住房的案例进行回归,
结果如下: Yi 1.2009 0.1056X i (0.1483 ) (0.0087) R 0.8078
2
回归拟合的很好,经济学意义也非常明确,收入Xi每增加1单位 (1万元人民币),平均拥有住房的概率将增加10.56%:
11
2.解释变量同样为定性变量的情况
ቤተ መጻሕፍቲ ባይዱ
Pi Li ln 1 P 0 1 X i ui i P 1 ˆ Xi=1时: L1 ln 1 P 0 1 (1) 1 P0 ˆ Xi=0时: L0 ln 1 P 0 (2) 0 P 1 1 P 1 如果定义: OR P0 1 P 0 1 ˆ L ˆ 那么就有: lnOR L OR e 1 0 1
15
回归的结果如下:
. logit y x Iteration Iteration Iteration Iteration 0: 1: 2: 3: log log log log likelihood likelihood likelihood likelihood = = = = -253.69187 -242.36572 -242.32729 -242.32729 Number of obs LR chi2(1) Prob > chi2 Pseudo R2 Std. Err. .2910729 .1179409 z 4.50 -2.10 P>|z| 0.000 0.036 = = = = 366 22.73 0.0000 0.0448
这意味着在其他条件都相同的情况下,抽烟人士患食道癌的 可能性是不抽烟人士的3.7倍还要多。
多元离散选择模型
![多元离散选择模型](https://img.taocdn.com/s3/m/743bd29f10661ed9ad51f3ba.png)
nJ
lnL
dijlnP(yi j)
i1 j0
Ex1. Binary Logistic Model Result
Dependent variable: honcomp
Stata Output
Multinomial Logistic Model Result
Dependent variable: prog
多元离散选择模型
二○一一年十月
本讲内容
多元离散选择模型 定序选择模型
一、多元离散选择模型
与上次讲的有何不同?
问题:农村异地转移劳动力的迁移目的地
被解释变量:迁移目的地,即小城镇、县级市、地级市、 省级城市和超大城市,依次取值1、2、3、4、5。
解释变量:个人特征、家庭特征和目前所在地属性。连续 变量包括受教育程度、家庭规模、家庭内其他劳动力人数、 家庭负担、原有收入、现有收入,目前所在地属性中的所 在地农村人口、国内生产总值、城乡居民储蓄余额、粮食 产量、中学生在校人数、小学生在校人数等。离散变量包 括性别、婚姻状况、收入稳定与否,目前所在地所属级别 与家乡所在地所属级别等。
Multinomial Logistic Model
Multinomial logistic regression involves nominal response variables more than two categories
Multinomial logit models are multi-equation models
小城镇、县级市、地级市、省级城市和超大城市依 次取值1、2、3、4、5。
最终模型的估计结果(部分)
变量 常数项
教育程度
家庭情况
模型序号 系数估计 标准差
离散选择模型
![离散选择模型](https://img.taocdn.com/s3/m/dfc02120a7c30c22590102020740be1e650eccac.png)
离散选择模型第五章离散选择模型在初级计量经济学里,我们已经学习了解释变量是虚拟变量的情况,除此之外,在实际问题中,存在需要人们对决策与选择行为的分析与研究,这就是被解释变量为虚拟变量的情况。
我们把被解释变量是虚拟变量的线性回归模型称为离散选择模型,本章主要介绍这一类模型的估计与应用。
本章主要介绍以下内容:1、为什么会有离散选择模型。
2、二元离散选择模型的表示。
3、线性概率模型估计的缺陷。
4、Logit模型和Probit模型的建立与应用。
第一节模型的基础与对应的现象一、问题的提出在研究社会经济现象时,常常遇见一些特殊的被解释变量,其表现是选择与决策问题,是定性的,没有观测数据所对应;或者其观测到的是受某种限制的数据。
1、被解释变量是定性的选择与决策问题,可以用离散数据表示,即取值是不连续的。
例如,某一事件发生与否,分别用1和0表示;对某一建议持反对、中立和赞成5种观点,分别用0、1、2表示。
由离散数据建立的模型称为离散选择模型。
2、被解释变量取值是连续的,但取值的范围受到限制,或者将连续数据转化为类型数据。
例如,消费者购买某种商品,当消费者愿意支付的货币数量超过该商品的最低价值时,则表示为购买价格;当消费者愿意支付的货币数量低于该商品的最低价值时,则购买价格为0。
这种类型的数据成为审查数据。
再例如,在研究居民储蓄时,调查数据只有存款一万元以上的帐户,这时就不能以此代表所有居民储蓄的情况,这种数据称为截断数据。
这两种数据所建立的模型称为受限被解释变量模型。
有的时候,人们甚至更愿意将连续数据转化为上述类型数据来度量,例如,高考分数线的设置,就把高出分数线和低于分数线划分为了两类。
下面是几个离散数据的例子。
例5.1 研究家庭是否购买住房。
由于,购买住房行为要受到许多因素的影响,不仅有家庭收入、房屋价格,还有房屋的所在环境、人们的购买心理等,所以人们购买住房的心理价位很难观测到,但我们可以观察到是否购买了住房,即我们希望研究买房的可能性,即概率(1)P Y =的大小。
离散选择模型步骤
![离散选择模型步骤](https://img.taocdn.com/s3/m/2cd534ef77eeaeaad1f34693daef5ef7ba0d1234.png)
离散选择模型步骤离散选择模型是一种决策分析方法,用于在给定的有限选项中选择最佳决策。
它在经济学、管理学、工程学等领域得到广泛应用。
本文将介绍离散选择模型的主要步骤。
1. 确定决策问题:首先,需要明确决策问题的目标和限制条件。
决策问题可以是各种各样的,比如选择投资项目、确定市场定价策略等。
明确问题是为了确保模型的设计和应用是有针对性的。
2. 收集决策信息:在进行决策分析之前,需要收集相关的信息和数据。
这些信息可以来自于市场调研、历史数据、专家意见等。
信息的准确性和全面性对于模型的建立和分析至关重要。
3. 确定决策变量:决策变量是指影响决策结果的因素。
在离散选择模型中,决策变量通常是一组有限的选项。
例如,在选择投资项目时,决策变量可以是不同的项目选项。
4. 制定决策准则:决策准则是指用于评估和比较不同选项的标准。
决策准则可以是单一的,也可以是多个综合考虑的因素。
常见的决策准则包括效益、成本、风险等。
5. 构建数学模型:离散选择模型可以使用多种数学方法进行建模,例如概率论、决策树、多属性决策等。
根据具体情况选择合适的方法,并建立相应的数学模型。
6. 分析决策结果:通过对模型进行求解,得到不同选项的决策结果。
分析决策结果可以包括对每个选项的评估、比较不同选项的优劣等。
还可以进行灵敏度分析,研究模型对参数变化的敏感性。
7. 做出最佳决策:根据分析结果,选择最佳决策。
最佳决策应该是在给定目标和限制条件下,使得决策准则达到最优的选项。
8. 验证和调整模型:一旦做出决策,需要验证模型的有效性,并根据实际情况对模型进行调整。
如果模型的预测结果和实际结果存在较大差异,可能需要重新收集数据或重新制定决策准则。
总结起来,离散选择模型的步骤包括确定决策问题、收集决策信息、确定决策变量、制定决策准则、构建数学模型、分析决策结果、做出最佳决策以及验证和调整模型。
通过这些步骤,可以帮助决策者更好地理解问题、分析选项,并做出科学合理的决策。
多元选择模型概述
![多元选择模型概述](https://img.taocdn.com/s3/m/e3de235931b765ce050814f5.png)
组成的方程组。 打OK后,EVIEWS计算出每个观察值落入任一类别的可 能性,并将其储存在与因变量同名但附加上类别识别码 和模拟方案(Scenario)码的变量下。
17
举例:有序因变量模型估计
某政策出台后对居民收入有影响,由此对市民的政策支 持情况进行调查。通过调查取得了市民收入 (X) 、支持与否 (Y)的数据,其中如果选民支持则 Yi 取0,中立取1,不支持 取2。获得了24组数据,进行排序选择模型估计分析。
0 Yi* 1 * Y 1 Y 待估计的三元选择模型: i 1 i 2 * 2 Y i 2 待源自计的潜回归模型:1.模型的估计
Y * X u
待估计参数:
1 2
18
收入 X
550 600 650 700 750 800 900 1000
4
二、无序多元选择模型
无序的Probit计算复杂,故考虑有三种选择的Logit模型
P log 2 21 21 X P 1 P log 3 31 31 X P 1 P log 3 32 32 X P2
这意味着以下限制条件:
32 31 21 32 31 21
即只需要估计系统中的两个方程便可以得到所有参 数。
7
无序多元选择模型
如果样本属于重复试验,那么可以计算出与每 个组相联系的概率 rij/ni,然后计算出机会比的对 数,与X做回归。 式中 rij 表示组 i 中选择 j 的次数占该组观察对象 总数ni的比例 如果没有足够多的重复,则需要利用最大似然 法进行估计。
22
23
4、预测
因为排序选择模型的因变量代表种类或等级数据,所以 不能从估计排序模型中直接预测。 选择Procs/ Make Model,打开一个包含方程系统的没有标 题的模型窗口,单击模型窗口方程栏的Solve按钮。例中因变 量y*的拟合线性指标,拟和值落在第一类中的拟合概率被命 名为Y_0_0的序列,落在第二类中的拟合概率命名为Y_1_0的 序列中,落在第三类中的拟合概率命名为 Y_2_0 的序列中, 等等。注意对每一个观察值,落在每个种类中的拟合概率相 加值为 1 。 Y_0_0 , Y_1_0 , Y_2_0 分别是支持、中立、不支 持的概率,Y,INC是实际样本。
多元选择模型
![多元选择模型](https://img.taocdn.com/s3/m/7e2fd8036bd97f192279e93a.png)
• 调查样本,有效样本303份。 • 首先将定义的全部变量放进模型中进行估计,并通过比较 各个变量的P值来考虑具体剔除哪些变量以及对哪些变量 考虑将其交互影响的效应放进模型中去。 • 小城镇、县级市、地级市、省级城市和超大城市依次取值 1、2、3、4、5。
迁移目标 小城镇 县级市 地级市 省级城市 超大城市
ik
k 0
J
exp(X i j Z j )
多元logit(ML)估计
对数似然函数的形式:
ln L( y, X , ) yij ln pij
i 1 j 1 J J yij ( X i j Z j ) ln[ exp(X i k Z k )] i 1 j 1 k 0 n n J
现有收入 -0.00144* -0.00032** -0.00028**
log(2/5) -0.2800*** log(3/5) log(4/5) -0.1136* -0.0856
-0.1578*** -0.00030**
• 从教育程度来看,所有系数都是负值,教育程度越高的农 村劳动力越愿意进入规模较大的城市;从显著性水平来看, 相对于超大城市来说,县级市被选择的可能性最小,其次 是小城镇,然后是地级城市,而教育程度相似的农村劳动 力在省级城市与超大城市之间的选择没有明显的差异。 • 从家庭情况来看,所有系数都是负值,也就是说家庭情况 越好的农村劳动力越愿意进入规模较大的城市;从显著性 水平来看,相对于超大城市来说,省级城市最不容易被选 中,其次是县级市,而小城镇与地级市之间没有明显区 别。 • 从现有收入来看,所有系数都是负值,也就是说目前收入 越高的农村劳动力越愿意进入规模较大的城市;再从显著 性水平来看,所有系数都是显著的,这说明相对于任何级 别的城市而言,农村劳动力都更倾向于超大城市。
《多元选择模型》课件
![《多元选择模型》课件](https://img.taocdn.com/s3/m/64b3d885db38376baf1ffc4ffe4733687f21fc4d.png)
感谢您的观看
THANKS
《多元选择模型》ppt课件
目 录
• 多元选择模型概述 • 多元选择模型的原理 • 多元选择模型的应用实例 • 多元选择模型的优缺点 • 多元选择模型与其他模型的比较 • 多元选择模型的前沿研究与展望
01
多元选择模型概述
定义与特点
定义
多元选择模型是一种统计模型, 用于处理分类结果或有序分类结 果,例如选择题或评分等级。
多元选择模型的发展历程
早期发展
多元选择模型起源于20世纪50年代, 最初用于心理学和医学领域的分类问 题。
广泛应用
最新进展
近年来,随着大数据和机器学习技术 的兴起,多元选择模型在处理大规模 数据集和复杂分类问题方面取得了新 的进展。
随着计算机技术的发展,多元选择模 型在20世纪80年代开始广泛应用于社 会科学和市场营销领域。
应用领域
多元选择模型适用于多级选择问 题,如高考成绩影响因素分析; 而Probit模型适用于二元选择问 题,如是否购买某商品。
与神经网络模型的比较
总结词
参数估计方法、假设条件、应用领域
参数估计方法
多元选择模型采用最大似然估计法,而神经网络模型采用 反向传播算法进行参数调整。
假设条件
多元选择模型假设因变量是二元的或多级的,且自变量与 因变量之间的关系是线性的;而神经网络模型不作此假设 ,能够处理复杂的非线性关系。
参数估计方法、假设条件、应 用领域
02 参数估计方法
多元选择模型采用最大似然估 计法,而Probit模型采用最大 似然估计法或最小二乘法。
03
假设条件
04
多元选择模型假设因变量是二元 的或多级的,且自变量与因变量 之间的关系是线性的;而Probit 模型假设因变量是二元且自变量 与因变量之间的关系是线性的。
离散选择模型的原理与应用
![离散选择模型的原理与应用](https://img.taocdn.com/s3/m/1249d869905f804d2b160b4e767f5acfa1c7839c.png)
离散选择模型的原理与应用1. 引言离散选择模型是一种常用的决策分析方法,广泛应用于市场调研、运输规划、投资决策等领域。
本文将介绍离散选择模型的基本原理和几种常用的模型,并探讨其在实际应用中的作用和局限性。
2. 离散选择模型的原理离散选择模型基于个体对不同选择项的偏好和决策方式进行建模,通过建立数学模型来分析个体的选择行为,并预测不同选择条件下个体的选择概率。
其基本原理可以概括为以下几个要素:2.1 选择集合离散选择模型的第一个要素是选择集合,即个体面临的可供选择的项。
选择集合可以是商品、服务、出行方式等,根据具体情况确定。
2.2 受益函数受益函数描述了个体对于每个选择项的效用或满意度。
受益函数可以使用线性函数或非线性函数来表示。
线性函数常用于描述简单选择问题,而非线性函数则更适用于复杂的选择问题。
2.3 随机效用个体的选择行为除了受益函数之外,还受到一些随机因素的影响。
离散选择模型通过引入随机效用来模拟这种随机性,通常使用正态分布或其他概率分布来表示随机效用。
2.4 选择概率选择概率是离散选择模型中的核心要素,用于预测个体做出某个选择的概率。
选择概率可以通过最大似然估计等方法来估计。
3. 常用的离散选择模型离散选择模型有多种类型,常见的包括二项式模型、多项式模型和概率模型。
以下将介绍其中几种典型的模型:3.1 二项式模型二项式模型是最简单的离散选择模型,适用于只有两个选择项的情况。
该模型基于个体对两个选择项的效用进行比较,假设个体根据效用差异做出选择。
3.2 多项式模型多项式模型适用于有多个选择项的情况。
该模型基于个体对每个选择项的效用进行比较,采用多项式对效用进行建模。
3.3 概率模型概率模型是离散选择模型的一种扩展形式,考虑了个体在做出选择时的不确定性。
该模型基于概率论的基本原理,将选择概率建模为个体特征和选择项属性之间的函数关系。
4. 离散选择模型的应用离散选择模型在实际应用中具有广泛的应用价值,以下将介绍几个常见的应用场景:4.1 市场调研离散选择模型可用于市场调研中,帮助企业了解消费者的偏好和选择行为,从而优化产品设计、定价策略等,并进行市场预测。
多元选择模型
![多元选择模型](https://img.taocdn.com/s3/m/1150e2583c1ec5da50e2706c.png)
在有序因变量模型中,因变量的值仅仅反映排序, 因而对其数值及间隔并无特殊要求。
例:序列(1,2,3,4)等同于序列(1,10,30,100)
因变量必须是整数,可以利用EVIEWS的函数功能 做转换(@Round, @Floor, @Ceil)
假设残差项u服从标准正态分布或logit分布,则可得 排序选择模型的概率形式。每个Y的概率为:
3
(二)有序模型:观察到的因变量Y表示出按数值大 小(ordered)或重要性 (ranked)排序的分类结果:
例1:个人达到的教育水平分文盲、小学、初中、高中、
大学、研究生等 例2:考试成绩分优秀、良好、及格和不及格等;学生奖 学金等级; 例3:评价意见调查分非常不满意、不满意、一般、满意、 非常满意等 例4:住房选择:租房、小户型、大户型、别墅 例5:银行信誉等级
Pr(Yi 0 X i , i , ) Pr(Yi 1 ) Pr(X u 1 ) F ( 1 X i ) Pr(Yi 1 X i , i , ) Pr( 1 Yi 2 ) Pr( 1 X u 2 ) F ( 2 X i ) F ( 1 X i ) Pr(Yi M X i , i , ) Pr(Y M ) Pr(X u M ) 1 F ( M X i )
第十章 多元选择模型
(Multiple-choice models)
1
本章内容
一、无序多元选择模型 二、有序因变量模型(Ordered data) 三、计数模型(Count data)
2
一、基本概念
对于多元选择模型,可以根据因变量的性质分为有序选择模 型和无序选择模型两种类型。
浅谈排序多元离散选择模型(非参数统计,西南财大)
![浅谈排序多元离散选择模型(非参数统计,西南财大)](https://img.taocdn.com/s3/m/28419213fc4ffe473368ab33.png)
浅谈离散选择模型第一节引言在实际经济问题的分析中,除可以利用连续变量表示居民消费或企业投资规模,还会遇到一些表示研究对象的数量或状态的离散变量。
例如,不仅可以用离散变量0,1,2,3,4,…说明企业每年的专利申请数,而且也可以用离散变量0和1说明企业每年是否申请专利的事项。
在专利申请数的问题中,离散变量0,1,2,3和4等数字具有具体的经济含义,不能随意更改;而在是否申请专利的两个备择对象的选择问题中,数字0和1只是用于区别两种不同的选择,是表示一种状态,将它们更换成数字3和4也未尝不可。
于是,在将离散变量理解成仅表示选择状态的基础上,可以进一步地利用离散变量讨论类似家庭是否购房或某人是否有工作等问题。
即结合离散变量的具体含义,可以通过以前介绍的虚拟变量描述和分析家庭是否购买住房或某人是否有工作等具体经济问题。
在讨论某人是否有工作的问题中,可以将某人有工作的状态用数字l表示,而将没有工作的状态用数字0表示。
同样地,在讨论家庭是否购房的问题中,可将家庭购买住房的决策用数字1 表示,而将家庭不购买住房的决策用数字0表示。
如果某个家庭是否购买住房或某人是否有工作的状态仅是作为用于说明某种具体经济问题的自变量,则应用以前介绍的虚拟变量的知识就足够了。
如果现在考虑某个家庭在一定的条件下是否购买住房或某人在一定的条件下是否有工作等问题时,则表示状态的虚拟变量就不再是自变量,而是作为一个被说明对象的因变量出现在经济模型中。
因此,需要对以前讨论虚拟变量的分析方法进行扩展,以便使其能够适应分析类似家庭是否购房或某人是否有工作等虚拟因变量的问题。
因为在家庭是否购房或某人是否有工作等选择问题中,虚拟因变量的具体取值仅是为了区别不同的状态,所以将通过虚拟因变量讨论备择对象选择的回归模型称为选择模型。
作为最简单的选择模型,可以考虑只具有两个备择对象的两项选择模型。
实际上,两项选择模型具有广泛的应用性,它不仅可以用于讨论家庭购房等问题,还可以用于讨论家庭购房是否申请银行贷款、家庭成员是否利用公共交通设施等两者择一的问题。
10离散选择模型
![10离散选择模型](https://img.taocdn.com/s3/m/8e58c0905acfa1c7ab00cc03.png)
• 在大多数调查中,行为回答都是分类型的: 如人们在选举时投支持支持或否决票,乘地 铁、公共汽车、或轿车,在业或失业等。
•
二元离散选择模型假设每一个个体都
面临二者挑一的选择,并且其选择依赖于
可分辨的特征。
5
• 选择结果与影响因素之间的关系: • 影响因素包括两部分:决策者的属性和备
选方案的属性。 • 对于两个方案的选择。例如,两种出行方
不是决定是否录取的重要因素。剔除D1。得Logit模型估计
结果如下:
•
pi
=
F(yi)
=
1 1e(24.73360.2 67x9i)4
32
1.2 1.0
YFLOGI
0.8
0.6
0.4
0.2
0.0
-0. 2 100
SC OR E
200
300
Logit模型预测值
400
33
• 在估计Probit模型过程中,D1的系数也没有显著性。剔除 D1,Probit模型最终估计结果是
等于0或1(见图)。
15
• 由于线性概率模型的上述缺点,希望能找到一种变换方法, (1)使解释变量xi所对应的所有预测值(概率值)都落在 (0,1)之间。
• (2)同时对于所有的xi,当xi增加时,希望yi也单调增加或 单调减少。显然累积概率分布函数F(zi) 能满足这样的要求。 采用累积正态概率分布函数的模型称作Probit模型。用正 态分布的累积概率作为Probit模型的预测概率。另外 logistic函数也能满足这样的要求。采用logistic函数的模型 称作logit模型。
Probit模型
Y -3.44
pi 0.0003
-1.43
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ho: Odds are independent of other alternatives.
Hausman tests of IIA assumption
Small-Hsiao tests of IIA assumption
Omitted Chi2 P>chi2 evidence Omitted lnL
案例2钓鱼方式的选择
钓鱼方式的选择 钓鱼方式有:海滩、码头、私人船只或租船 解释变量:收入(income)、成本(price)和捕获率(crate) 收入、成本、捕鱼率对选择钓鱼方式的影响
use mus15data, clear table mode, contents (N income mean income sd income) 平均来看,从码头捕鱼的人收入最低,而在私人船只上捕鱼的
2
-2
-1 0.02238 0.210896 0.766724
0.999937
0
14
-2 0.996548 0.003439 1.34E-05
0.989208
2
22
0 5.19E-05 0.096051 0.903897
0.000223
1
113
1 0.000226 0.998511 0.001263
2
|
XY | -.213066 .0641945 -3.32 0.001 -.3388849 -.0872471
SC | 11.34417 3.821957
2.97 0.003
3.853272 18.83507
_cons | 14.45198 4.921404
2.94 0.003
4.80621 24.09776
案例2钓鱼方式的选择
多项logit 模型应用时需要指定基准类别。 mlogit mode income , baseoutcome (1)
案例2 钓鱼方式选择
1、这个模型拟合较差,但income 变量的影响是联合显著的。 2、通过下面的命令可以报告相对风险比
mlogit mode income , rrr baseoutcome (1) 结果说明,income增加一个单位,即1000美元,会选择码头捕
SC | 6.859179 3.167102
2.17 0.030
.6517724 13.06658
_cons | 8.970724 4.500354
1.99 0.046
.1501914 17.79126
-------------+----------------------------------------------------------------
lnL
Chi2 p>chi2
1
0.000 1.000 for H0
(full) (omit)
1
0.000 0.000 0.000 1.000
2
0.109 0.991 for H0
2
-0.000 -0.000 0.000 1.000
tests for combining outcome categories
0
112
-1 0.994833 0.005167 9.63E-10
6.89E-06
0
78
-2 0.999949 5.11E-05 1.60E-11
0.998719
2
0
0 5.27E-07 0.004147 0.995853
0
0
131
-2 0.999999 1.56E-06 2.00E-16
0.005853
JG
XY
SC
0
125
-2
0
599
-2
0
100
-2
0
160
-2
0
46
-2
0
80
-2
0
133
-2
0
350
-1
2
23
0
0
60
-2
0
70
-1
2
-8
0
0
400
-2
1
72
0
0
120
-1
2
40
1
2
35
1
2
26
1
2
15
-1
0
69
-1
1
107
1
2
29
1
2
2
1
2
37
1
0
53
-1
0
194
0
0
1500
-2
1
96
0
2
-8
0
0
0
26
-2 0.998435 0.001564 1.04E-06
0.001908
0
89
-2 0.999975 2.48E-05 1.54E-12
0.999999
2
5
1 1.82E-11 0.000098 0.999902
3.22E-20
1
-9
-1 0.005946 0.088828 0.905226
案例2 钓鱼方式选择
计算结果j在均值处的边际效应 margins, dydx(*) predict (outcome(j)) atmean 变量income一个单位变化,使得私人船只捕鱼的概
率增加了0.033. 变量income增加一个单位,所有结果边际效应的和
为多少?
3、例题
将§4.1例中某商业银行从历史贷款客户中随 机抽取的78个样本进一步细分,贷款结果2表 示贷款成功,1表示延滞还款,0表示呆坏账。 目的是研究贷款结果(JG)与“商业信用支 持度”(XY)和“市场竞争地位等级”(SC) 之间的关系。为此建立三元选择多项Logit模 型。
2.07E-12
2
42
1 4.72E-08 0.022272 0.977728
0
2
57
2 1.39E-11 0.002333 0.997667
0.000163
1
146
0 0.654503 0.345497 3.82E-08
0.998719
2
15
0 1.25E-05 0.036524 0.963463
0 0.933987 0.001281 1.65E-13 0.341691 1.11E-06 1.05E-07 0.001281 2.48E-05 1.90E-06 0.009974 0.000426 0.001501
JG2
JG
XY
SC
JG0
JG1
JG2
7.18E-16
0
28
பைடு நூலகம்
-2 0.998628 0.001371 6.78E-07
人收入最高。
table mode, contents (mean pbeach mean ppier mean pprivate mean pcharter)
平均而言,个人倾向于选择对他们而言最便宜或次便宜的钓鱼 方式。例如,哪些选择私人船只的人,私人船只捕鱼的平均价 格是42,相比较租船71,码头或海滩捕鱼价格是138。
鱼而不是沙滩捕鱼的相对比值是变化前的0.866,说明相对比 值降低了。 3、预测概率值 predict pmlogit1 pmlogit2 pmlogit3 pmlogit4, pr 计算正确预测百分比
egen modep=rmax(pmlogit1 pmlogit2 pmlogit3 pmlogit4) gen pclass=. foreach i of numlist 1/4 { replace pclass = `i' if pmlogit`i' ==modep } tab mode pclass
------------------------------------------------------------------------------
(JG==0 is the base outcome)
模型有较高 的拟合优度 和总体显著 性;解释变 量在5%的显 著性水平下 显著。
利用估计结果 对样本客户贷 款结果分别取0 、1和2的概率 进行预测,除 了个别样本客 户外,预测结 果和实际结果 具有一致性 。
0
54
-1 0.808724 0.191093 0.000182
1.76E-10
2
42
2 5.71E-13 0.000257 0.999743
0.983314
1
42
0 0.001347 0.667974 0.330679
0.991939
2
18
2 3.43E-15 7.50E-06 0.999993
0.997845
0.998719
2
4
1 1.47E-11 8.46E-05 0.999915
1.54E-12
0
54
-2 0.999752 0.000248 2.67E-09
3.79E-16
2
32
1 5.70E-09 0.005198 0.994803
0.990024
1
54
0 0.00408 0.918255 0.077666
JG |
Coef. Std. Err.
z P>|z|
[95% Conf. Interval]
-------------+----------------------------------------------------------------
1
|