6.2 二元离散选择模型
离散选择模型ppt课件

因为通常情况下,我们考虑被解释变量为二元变
量的模型,这种模型也因此被称为二元选择模型或者离
散选择模型,如果为多元,则称之为多元选择模型。 离散选择模型起源于Fechner于1860年所进行的动
物条件二元反射研究,1962年Warner首次将这一方法
应用与经济研究领域。Mcfadden因为在离散选择模型
但问题是,当收入10万元,或者更少的情况下,平均拥有住房的
概率为负值,而当收入为20万元,或者更多的情况下,平均拥有 住房的概率大于1,因此,我们必须考虑相应的方法对这一问题 进行处理。
7
对同样的问题,我们采用如下的模型形式:
E (Yi / X i ) PYi 1 / X i
1
( 0 1 X i )
那么: 从而:
1 e Pi Li ln 1 P 0 1 X i ui i
1 ห้องสมุดไป่ตู้ Pi
1
0 1 X i
1 e e 0 1 X i 1 e 0 1 X i
参数的含义是什么?
这样的事件发生比Li,不仅对Xi是线性的,对参数也是线性的,而 且发生概率将永远落在0和1之间, Li就被称为logit,像*这样的模 型也就被称为logit模型。
Std. Err. .0041431 .0957771
[95% Conf. Interval] .069612 -1.879533 .0887202 -1.437808
e 1 e0.0792 1.082
这就意味着,当收入增加1万元时,根据该样本回归的结果认为, 拥有自有住房的发生比将增加8.2%
PYi 1 / X i
6
二元选择模型

二元选择摸型如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。
在实际经济问题中,被解释变量也可能是定性变量。
如通过一系列解释变量的观测值观察人们对某项动议的态度,某件事情的成功和失败等。
当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型,统称离散选择模型。
这里主要介绍Tobit (线性概率)模型,Probit (概率单位)模型和Logit 模型。
1.Tobit (线性概率)模型 Tobit 模型的形式如下,y i = α + β x i + u i (1) 其中u i 为随机误差项,x i 为定量解释变量。
y i 为二元选择变量。
此模型由James Tobin 1958年提出,因此得名。
如利息税、机动车的费改税问题等。
设 1 (若是第一种选择) y i =0 (若是第二种选择)-0.20.00.20.40.60.81.01.2330340350360370380XY对y i 取期望,E (y i ) = α + β x i (2) 下面研究y i 的分布。
因为y i 只能取两个值,0和1,所以y i 服从两点分布。
把y i 的分布记为, P ( y i = 1) = p i P ( y i = 0) = 1 — p i 则E(y i ) = 1 (p i ) + 0 (1 - p i ) = p i(3)由(2)和(3)式有p i = α + β x i (y i 的样本值是0或1,而预测值是概率。
) (4) 以p i = - 0。
2 + 0.05 x i 为例,说明x i 每增加一个单位,则采用第一种选择的概率增加0.05。
现在分析Tobit 模型误差的分布。
由Tobit 模型(1)有,u i = y i — α - β x i =⎩⎨⎧=--=--0,1,1i i i i y x y x βαβαE(u i) = (1—α - β x i)p i + (—α - β x i) (1 - p i) = p i—α - β x i由(4)式,有E(u i) = p i - α—β x i = 0因为y i只能取0, 1两个值,所以,E(u i2) = (1—α - β x i)2p i + (- α - β x i)2(1 —p i)= (1- α - β x i)2(α + β x i)+ (α +β x i)2(1 - α—β x i), (依据(4)式)= (1—α - β x i) (α + β x i)= p i (1 - p i),(依据(4)式)= E(y i)[1- E(y i)]上两式说明,误差项的期望为零,方差具有异方差。
二元选择模型

二元选择摸型如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。
在实际经济问题中,被解释变量也可能是定性变量。
如通过一系列解释变量的观测值观察人们对某项动议的态度,某件事情的成功和失败等。
当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型,统称离散选择模型。
这里主要介绍Tobit (线性概率)模型,Probit (概率单位)模型和Logit 模型。
1.Tobit (线性概率)模型 Tobit 模型的形式如下,y i = α + β x i + u i (1) 其中u i 为随机误差项,x i 为定量解释变量。
y i 为二元选择变量。
此模型由James Tobin 1958年提出,因此得名。
如利息税、机动车的费改税问题等。
设 1 (若是第一种选择) y i =0 (若是第二种选择)-0.20.00.20.40.60.81.01.2330340350360370380XY对y i 取期望,E(y i ) = α + β x i (2) 下面研究y i 的分布。
因为y i 只能取两个值,0和1,所以y i 服从两点分布。
把y i 的分布记为, P ( y i = 1) = p i P ( y i = 0) = 1 - p i 则E(y i ) = 1 (p i ) + 0 (1 - p i ) = p i (3) 由(2)和(3)式有p i = α + β x i (y i 的样本值是0或1,而预测值是概率。
) (4)以p i = - 0.2 + 0.05 x i 为例,说明x i 每增加一个单位,则采用第一种选择的概率增加0.05。
现在分析Tobit 模型误差的分布。
由Tobit 模型(1)有,u i = y i - α - β x i =⎩⎨⎧=--=--0,1,1i i i i y x y x βαβαE(u i ) = (1- α - β x i ) p i + (- α - β x i ) (1 - p i ) = p i - α - β x i 由(4)式,有E(u i ) = p i - α - β x i = 0因为y i 只能取0, 1两个值,所以,E(u i 2) = (1- α - β x i )2 p i + (- α - β x i )2 (1 - p i )= (1- α - β x i )2 (α + β x i ) + (α +β x i )2 (1 - α - β x i ), (依据(4)式) = (1- α - β x i ) (α + β x i ) = p i (1 - p i ) , (依据(4)式) = E(y i ) [1- E(y i ) ]上两式说明,误差项的期望为零,方差具有异方差。
离散选择模型

Yi 0 1GPAi 2 INCOMEi ui
其中:
1 Yi 0
第i个学生拿到学士学位后三年内去读研 该生三年内未去读研
GPA=第i个学生本科平均成绩 INCOME=第i个学生家庭年收入(单位:千美元)
设回归结果如下(所有系数值均在10%水平统计上显著):
ˆ Yi 0.7 0.4GPAi 0.002 INCOMEi
yi 0 yi 1
函数可以简化为:
L (1 F ( X ))1 yi F ( X ) yi
yi 1
对方程左右取对数我们便得到:
ln L [ yi ln F ( X ) (1 yi ) ln(1 F ( X ))]
i 1
n
似然函数为
fi ln L n yi fi [ (1 yi ) ]xi 0 Fi 1 Fi i 1
Pr ob(Y 1 X ) X F ( X ) f ( X ) X
因此我们在遇到二元响应模型时,估计出参数我们不能盲目的 将其解释为:解释变量变动一个单位,相对应的因变量变化参 数个单位。
为了解决偏效应的问题我们引入调整因子的概念。 在上式中的 f ( X ) 我们 便称为比例因子或调整因子,它与全部 的解释变量有关,为了方便起见,我们要找一个适用于模型所有 斜率的调整因子。有两种方法可以解决: (1)用解释变量的观测值计算偏效应的表达式,调整因子为:
四、二元选择模型的估计
1.除了LPM模型以外,二元选择模型的估计都是以极大似然法为基础 的 。由前面的讨论我们知道:
P(Y 1 X ) F ( X )
由此我们可以得到模型的似然函数为:
P(Y1 y1 ,Yn yn X ) (1 F ( X )) F ( X )
离散选择模型完整版

离散选择模型HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】第五章离散选择模型在初级计量经济学里,我们已经学习了解释变量是虚拟变量的情况,除此之外,在实际问题中,存在需要人们对决策与选择行为的分析与研究,这就是被解释变量为虚拟变量的情况。
我们把被解释变量是虚拟变量的线性回归模型称为离散选择模型,本章主要介绍这一类模型的估计与应用。
本章主要介绍以下内容:1、为什么会有离散选择模型。
2、二元离散选择模型的表示。
3、线性概率模型估计的缺陷。
4、Logit模型和Probit模型的建立与应用。
第一节模型的基础与对应的现象一、问题的提出在研究社会经济现象时,常常遇见一些特殊的被解释变量,其表现是选择与决策问题,是定性的,没有观测数据所对应;或者其观测到的是受某种限制的数据。
1、被解释变量是定性的选择与决策问题,可以用离散数据表示,即取值是不连续的。
例如,某一事件发生与否,分别用1和0表示;对某一建议持反对、中立和赞成5种观点,分别用0、1、2表示。
由离散数据建立的模型称为离散选择模型。
2、被解释变量取值是连续的,但取值的范围受到限制,或者将连续数据转化为类型数据。
例如,消费者购买某种商品,当消费者愿意支付的货币数量超过该商品的最低价值时,则表示为购买价格;当消费者愿意支付的货币数量低于该商品的最低价值时,则购买价格为0。
这种类型的数据成为审查数据。
再例如,在研究居民储蓄时,调查数据只有存款一万元以上的帐户,这时就不能以此代表所有居民储蓄的情况,这种数据称为截断数据。
这两种数据所建立的模型称为受限被解释变量模型。
有的时候,人们甚至更愿意将连续数据转化为上述类型数据来度量,例如,高考分数线的设置,就把高出分数线和低于分数线划分为了两类。
下面是几个离散数据的例子。
例研究家庭是否购买住房。
由于,购买住房行为要受到许多因素的影响,不仅有家庭收入、房屋价格,还有房屋的所在环境、人们的购买心理等,所以人们购买住房的心理价位很难观测到,但我们可以观察到是否购买了住房,即我们希望研究买房的可能性,即概率(1)P Y =的大小。
离散选择模型

六、二元选择模型的参数检验 6.1 单个系数的显著性检验
一个解释变量(对二元决策的概率)是否有显著性影响的检验,如同正态
线性回归分析的单个系数的检验类似,根据模型中的待估系数与其方差计算 z 统计量,并检验假设 H0 : βi = 0 。
6.2 总体显著性检验 由于 Logit 模型、Probit 模型是非线性的,在同时检验多个系数是否为 0 时,
33潜回归我们假设存在一个不可观察的潜在变量称为决策倾向是指标变量的连续性函数记为iy它与指标变量ix之间具有如下线性关系i1kkiiiyxxu该方程称为潜回归方程其中iu是随机扰动项1ikixx??????????1k??????????34量变临界值选取量变到多少时个体才进行选择呢
离散选择模型
郑安
是估计系数的协方差
矩阵, βˆ 是无约束模型得到的估计值。可以证明,W 渐进服从 χ 2 (k −1) 分布。
所以 W 检验只需要估计无约束模型 (2)对数似然比检验(只适用于线性约束) H0 : β2 = β3 = " = βk = 0
检验统计量: LR = −2[ln L(βˆR ) − ln L(βˆ)]
其中,ln L(βˆR ) 是约束模型的最大对数似然函数值,ln L(βˆ) 是非约束模型的最大
对数似然函数值。可以证明,在零假设下,LR 渐进服从 χ 2 (k −1) 分布。所以 LR
检验既需要估计有约束模型,又需要估计无约束模型 (3)拉格朗日乘子检验(适用于线性和非线性约束) H0 : β2 = β3 = " = βk = 0
离散选择模型起源于 Fechner 于 1860 年进行的动物条件二元反射研究。1962 年,Warner 首次应用于经济领域。20 世纪 70 和 80 年代,离散选择模型普遍应 用于经济布局、交通问题、就业问题、购买决策问题等经济决策领域的研究。 模型的估计方法主要发展于 20 世纪 80 年代初期,远远滞后于模型的应用,并 且至今还在不断改进,它属于微观计量经济学——即研究大量个人、家庭或企 业的经济信息,McFadden 因为在微观计量经济学领域的贡献而获得 2000 年诺 贝尔经济学奖。
6.2 二元离散选择模型

2、重复观测值不可以得到情况下二元Probit 离散选择模型的参数估计
ln L
fi fi Xi Xi 1 Fi F y 0 y 1 i
i
i
q i f (q i X i ) Xi F (q i X i ) i 1
n i 1
n
ln L
n i 1
yi f i fi (1 yi ) X i F (1 Fi ) i 1 i
i
n
(y
( X i )) X i 0
SC -2 0 0 -2 -1 2 -2 0 -2 -2 0 -1 2 -2 0 0 0 -1 -1 0 2 -2 -1 -2 0 -2
JGF 0.0000 0.0000 1.0000 0.0000 6.5E-13 1.0000 0.0000 1.0000 0.0000 0.0000 1.0000 0.0000 1.0000 0.0000 0.9906 0.9979 1.0000 0.0000 0.5498 2.1E-12 1.0000 0.0000 0.0000 0.0000 1.0000 0.0000
§6.2
二元离散选择模型
一、二元离散选择模型的经济背景 二、二元离散选择模型 三、二元Probit模型及其参数估计 四、二元Logit模型及其参数估计 五、二元离散选择模型的检验
说明
• 离散被解释变量数据计量经济学模型(Models with Discrete Dependent Variables)和离散选择 模型(DCM, Discrete Choice Model)的区别。
n
• 在样本数据的支持下,如果知道概率分布函数 和概率密度函数,求解该方程组,可以得到模 型参数估计量。
第七章(下) 二元离散选择模型

我们考虑对线性概率模型进行一些变换,来克服 这些缺点。
效用模型
用
U
1 i
表示第
i个个体选择1的效用,U
0 i
表示第
i个
个体选择0的效用。其效用均为随机变量,于是有
UUi0i1
X i X i
1 0
Yi* X i ui*
中,假定ui*的分布为极值分布,则该模型称为 Extreme模型。
第二节 二元离散选择模型最大似然估计
下面我们来构造二元离散选择模型的似然函数。这 是二元离散选择模型最关键的问题。
我们假设有以Y 轴为对称的概率密度函数f(.),则
P(Yi 1 ) P(Yi* 0 ) P( u*i X i ) 1 F ( X i ) F ( X i )
Yi f ( Xi ) F ( Xi )
X
i
(*)
于是我们选择F不同的形式得到不同的经验模型
ln L
N i 1
(1
Yi
)
1
f ( Xi ) F ( Xi )
Yi f ( Xi ) F ( Xi )
X
i
(*)
一、 Logit模型的最大似然估计
标Yi准* 正X态i分布ui*
x
F ( x)
Yi
10e(xYYxpii**()
0 x)0
1
e
z2 2
dz
2 则
逻辑分布
F(x)
Λ( x)
P(Yi 1) P(Yi* 标0准) 正态P概1(u率i* 分ex布p曲(X线xi) )logi1stic分F布(曲X线i )
离散选择模型举例-二元离散选择模型

一.二元离散选择模型1.二元响应模型(Binary response model)我们往往关心响应概率()()()()z G x x G x y x y k k =+++=E ==P βββ...1110,其中x 表示各种影响因素(各种解释变量,包括虚拟变量)。
根据不同的函数形式可以分为下面三类模型:线性概率模型(Linear probability model ,LPM )、对数单位模型(logit )、概率单位模型(probit):三种模型估计的系数大约有以下的关系:L PM probit probit it ββββ5.2,6.1log ==2.偏效应(1)如果解释变量是一个连续型变量,那么他对p(x)=p(y=1|x)的偏效应可以通过求下面的偏导数得出来:()()()()dzz dG z g x g x x p j j =+=∂∂,0βββ,偏效应的符号和该解释变量对应的系数的符号一致;两个解释变量偏效应之比等于它们各自的估计系数之比。
(2)如果解释变量是一个离散性变量,则k x 从k c 变化到k c +1时对概率的影响大小为:()()()k k k k c x G c x G ββββββ+++-++++...1 (110110)上面的其他解释变量的取值往往取其平均值。
3.估计方法与约束检验极大似然估计;三种常见的大样本检验:拉格朗日乘数检验、wald 检验、似然比检验。
4.Stata 程序语法(以Probit 为例)probit depvar [indepvars] [weight] [if exp] [in range] [, level(#) nocoef noconstant robust cluster(varname) score(newvar) asis offset(varname) maximize_options ] predict [type] newvarname [if exp] [in range] [, statistic rules asif nooffset ] where statistic isp predicted probability of a positive outcome; the default xb linear predictionstdp standard error of the prediction二.具体的例子1.数据:美国1988年的CPS 数据2.模型:估计成为工会成员的可能性,模型形式如下:参加工会的概率=F(潜在经验potexp 、经验的平方项potexp2、受教育年限grade 、婚否married 、工会化程度high);解释变量:Potexp=年龄-受教育年限-5;grade=完成的受教育年限;married :1表示婚,0未婚;high :1表示高度工会化的行业,否则为0。
第七章(下) 二元离散选择模型

对于Logit模型,我 们有: 分布函数 F ( x) exp( x) Λ( x)
1 exp( x)
exp( x) 密度函数 f ( x) (1 exp( x))2 Λ( x)(1 Λ( x))
带入(*)式,我们得到: ln L
N
Yi
i 1
Λ( X i )X i
1 X i
(PXi i
)2
(1
Pi
)
Pi
(1
Pi
)
随机误差项ui非正态且存在异方差性
Yi 0 1 X1i k X ki ui X i ui
0 Pi E (Y i ) X i 1
可能不成立
当用线性概率模型进行预测,预测值 X i 落在区间 [0,1]之内时,则没有什么问题;但当预测值 X i 落
0 Pi E (Y i ) X i 1
可能不成立
所以此时必须强令预测值(概率值)相应等于0或1。
因此,线性概率模型常常写成下面的形式
Pi
X i
1
0
0 X i 1 X i 1 X i 0
1.2 Y
1.0
0.8
0.6
0.4
0.2
0.0
Yi 0 没有购买住房
Yi 0 1 X i ui i 1,2, , N
令 Pi P(Yi 1) 那么 1 Pi P(Yi 0)
家被庭解选释择变购量买Yi 住的房分的布概为率是解释变量-家庭收入的一
个线性函数。我们称这一关系式为线性概率函数。
Yi
0
1
二元离散选择模型案例

第七章 二元离散选择模型案例1、在一次选举中,由于候选人对高收入者有利,所以收入成为每个投票者表示同意或者反对的最主要影响因素。
以投票者的态度(y )作为被解释变量,以投票者的月收入(x )作为解释变量建立模型,同意者其观测值为1,反对者其观测值为0,样本数据见表7.1。
原始模型为:i i i y x αβμ=++。
利用Probit 二元离散选择模型估计参数。
表7.1 样本观测值输入变量名,选择Probit 参数估计。
得到如下输出结果:但是作为估计对象的不是原始模型,而是如下结果:=---+1@[( 4.75390.003067*)]YF CONRM X可以得到不同X值下的Y选择1的概率。
例如,当X=600时,查标准正态分布表,对应于2.9137的累积正态分布为0.9982;于是,Y的预测值YF=1-0.9982=0.0018,即对应于该个人,投赞成票的概率为0.0018。
2、某商业银行从历史贷款客户中随机抽取78个样本,根据涉及的指标体系分别计算它们的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。
样本观测值见表8.2。
目的是研究JG与XY、SC之间的关系,并为正确贷款决策提供支持。
估计过程如下:输入变量名,选择Logit参数估计。
得到如下输出结果:用回归方程表示如下:JGF CONRM XY SC=---+1@[(16.110.465035*9.379903*)]该方程表示,当XY和SC已知时,带入方程,可以计算贷款成功的概率JGF。
3、某研究所1999年50名硕士考生的入学考试总分数(SCORE)及录取情况见表5。
考生考试总分数用SCORE表示,Y为录取状态,D1为表示应届生与往届生的虚拟变量。
表7.3 50名硕士考生的入学考试总分数(SCORE)及录取状况数据表定义如下:1,0,Y ⎧=⎨⎩录取未录取, 1,10,D ⎧=⎨⎩应届生非应届生 加入D1变量的目的是想考察考生为应届生或往届生是否也对录取产生影响。
离散选择模型的原理与应用

离散选择模型的原理与应用1. 引言离散选择模型是一种常用的决策分析方法,广泛应用于市场调研、运输规划、投资决策等领域。
本文将介绍离散选择模型的基本原理和几种常用的模型,并探讨其在实际应用中的作用和局限性。
2. 离散选择模型的原理离散选择模型基于个体对不同选择项的偏好和决策方式进行建模,通过建立数学模型来分析个体的选择行为,并预测不同选择条件下个体的选择概率。
其基本原理可以概括为以下几个要素:2.1 选择集合离散选择模型的第一个要素是选择集合,即个体面临的可供选择的项。
选择集合可以是商品、服务、出行方式等,根据具体情况确定。
2.2 受益函数受益函数描述了个体对于每个选择项的效用或满意度。
受益函数可以使用线性函数或非线性函数来表示。
线性函数常用于描述简单选择问题,而非线性函数则更适用于复杂的选择问题。
2.3 随机效用个体的选择行为除了受益函数之外,还受到一些随机因素的影响。
离散选择模型通过引入随机效用来模拟这种随机性,通常使用正态分布或其他概率分布来表示随机效用。
2.4 选择概率选择概率是离散选择模型中的核心要素,用于预测个体做出某个选择的概率。
选择概率可以通过最大似然估计等方法来估计。
3. 常用的离散选择模型离散选择模型有多种类型,常见的包括二项式模型、多项式模型和概率模型。
以下将介绍其中几种典型的模型:3.1 二项式模型二项式模型是最简单的离散选择模型,适用于只有两个选择项的情况。
该模型基于个体对两个选择项的效用进行比较,假设个体根据效用差异做出选择。
3.2 多项式模型多项式模型适用于有多个选择项的情况。
该模型基于个体对每个选择项的效用进行比较,采用多项式对效用进行建模。
3.3 概率模型概率模型是离散选择模型的一种扩展形式,考虑了个体在做出选择时的不确定性。
该模型基于概率论的基本原理,将选择概率建模为个体特征和选择项属性之间的函数关系。
4. 离散选择模型的应用离散选择模型在实际应用中具有广泛的应用价值,以下将介绍几个常见的应用场景:4.1 市场调研离散选择模型可用于市场调研中,帮助企业了解消费者的偏好和选择行为,从而优化产品设计、定价策略等,并进行市场预测。
二元选择模型-方匡南的个人网站

方匡南 朱建平 姜叶飞前面我们探讨了连续型的因变量建模分析,但实际中,并非所有的变量都是连续型的数据,有时因变量是离散型的数据,这时候我们需要用广义线性模型(generalized l inear m odel, G LM)。
离散因变量(Discrete D ependent V ariable)是指取值为0、1、2….等离散值的变量。
在多数情况下,这些取值一般没有实际的意义,仅代表某一事件的发生,或者是用于描述某一事件发生的次数。
根据取值的特点,离散因变量可以分为二元变量(binary v ariable)、多分变量和计数变量(count v ariable)。
二元变量的取值一般为1和0,当取值为1时表示某件事情的发生,取值为0则表示不发生,比如信用卡客户发生违约的记为1,不违约的记为0。
因变量为二元变量的模型称为二元选择模型(Binary C hoice M odel)。
例13-1。
为了考察一种新的经济学教学方法对学生成绩的影响,进行了调查,共得到了32个样本数据。
数据见表13-1。
GRADE取1表示新近学习成绩提高,0表示其他;GPA是平均积分点;TUCE是以往经济学成绩;PSI取1表示受到新的经济学教学方法的指导,0表示其他。
假如想要了解GPA,TUCE和PSI因素对学生成绩是否有影响?以及根据学生的GPA,TUCE和PSI预测学生成绩是否会提高?该如何建模分析? obs GRADE GPA TUCE PSI 10 2.66200 20 2.89220 30 3.28240 40 2.92120 51 4.00210 60 2.86170 70 2.76170 80 2.87210 90 3.03250 101 3.92290 110 2.63200 120 3.32230 130 3.57230 141 3.26250 150 3.53260 160 2.74190obs GRADE GPA TUCE PSI 170 2.75250 180 2.83190 190 3.12231 201 3.16251 210 2.06221 221 3.62281 230 2.89141 240 3.51261 251 3.54241 261 2.83271 271 3.39171 280 2.67241 291 3.65211 301 4.00231 310 3.10211 321 2.39191表13-1 新教学方法对成绩的影响数据 本例及例中的数据引自Greene(2000)第19章例19.1。
二元离散选择模型特点

二元离散选择模型特点
二元离散选择模型是一种统计模型,用于研究在给定条件下,个体或群体做出某种选择决策的概率。
这种模型通常用于分析二元因变量,即只有两个选项或两种属性的情况。
二元离散选择模型的特点包括:
1.因变量为二元变量,通常以“1”表示具备某种属性或做出某种选择,以“0”表示不具备某种属性或未做出某种选择。
2.自变量可以是定性的或定量的,用于描述影响个体或群体做出选择的各种因素。
3.二元离散选择模型可以用于研究各种二元决策问题,如是否购买某种商品、是否参加某个活动、是否选择某项服务等。
4.模型的参数通常可以通过最大似然估计等方法进行估计,以得到每个自变量对应的发生概率。
二元离散选择模型可以用于预测个体或群体的选择行为,以及分析各种因素对选择行为的影响。
在应用二元离散选择模型时,需要注意以下几点:
1.因变量中的“0”和“1”只是对应属性的标注或符号,不具备任何数值上的意义,不能进行直接数学运算。
2.二元离散选择模型通常假定个体做出选择的行为是理性的,即个体是根据自己的偏好和利益最大化原则进行选
择的。
3.在分析数据时,需要注意数据的分布和样本的代表性,以避免模型估计的偏差。
4.二元离散选择模型的结果可以用于指导实践,如预测市场趋势、制定营销策略等。
二元离散选择模型

二元离散选择模型1.在一次选举中,由于候选人对高收入者有力,所以收入成为每个投票者表示同意或者反对的最主要影响因素。
以投票者的态度(y )作为被解释变量,以投票者的月收入(x )作为解释变量建立模型,同意者其观测值为1,反对者其观测值为0,样本数据见表7.1。
原始模型为:i i i y x αβµ=++。
利用Probit 二元离散选择模型估计参数。
表8.1样本观测值序号X Y 序号X Y 序号X Y 11000111100021210012200012120002222001330001313001232300144000141400024240015500015150012525001660001616000262600177000171700127270018800018180002828001990001919001292900110100020200013030001估计过程如下:输入变量名,选择Probit 参数估计。
得到如下输出结果:但是作为估计对象的不是原是模型,而是如下结果:1@[( 4.75390.003067*)]YF CONRM X =−−−+可以得到不通X 值下的Y 选择1的概率。
例如,当X=600时,查标准正态分布表,对应于2.9137的累积正态分布为0.9982;于是,Y 的预测值YF=1-0.9982=0.0018,即对应于该个人,投赞成票的概率为0.0018。
1.某商业银行从历史贷款客户中随机抽取78个样本,根据涉及的指标体系分别计算它们的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。
样本观测值见表8.2。
目的是研究JG与XY、SC之间的关系,并为正确贷款决策提供支持。
表8.2样本观测值JG XY SC JGF JG XY SC JGF JG XY SC JGF 0125-2001500-20054-10 0599-200960014221 0100-201-80104200.0209 0160-200375-2011821 046-20042-1 6.50E-130801 6.40E-12 080-2015211-501 0133-200172-20032620 0350-101-801026110 12300.9979089-201-2-10.9999 060-200128-20014-2 3.90E-07 070-10160112200.9991 1-8010150-10011310 0400-201542114210.9987 07200028-2015720.9999 0120-1012500.9906014600 14010.999812300.997911501 13510.999911401026-2 4.40E-16 12611049-10089-20 115-10.4472014-10.54981511 069-100610 2.10E-121-9-11 010710140211411 12911030-20054-20 12110112-1013211 13710.9999078-200540 1.40E-07 053-1010010131-20 0194000131-2011501估计过程如下:输入变量名,选择Logit参数估计。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
似然函数
L
i 1
( F ( X i )) yi (1 F ( X i )) 1 yi
ln L
(y
i 1
n
i
ln F ( X i ) (1 yi ) ln(1 F ( X i )))
1阶极值条件
ln L
yi f i fi (1 yi ) X i 0 Fi (1 Fi ) i 1
JG 0 1 0 1 0 1 0 0 1 0 1 0 1 1 0 1 0 0 1 1 1 0 1 0 0 1
XY 54.00 42.00 42.00 18.00 80.00 -5.000 326.0 261.0 -2.000 14.00 22.00 113.0 42.00 57.00 146.0 15.00 26.00 89.00 5.000 -9.000 4.000 54.00 32.00 54.00 131.0 15.00
SC -1 2 0 2 1 0 2 1 -1 -2 0 1 1 2 0 0 -2 -2 1 -1 1 -2 1 0 -2 0
JGF 0.0000 1.0000 0.0209 1.0000 6.4E-12 1.0000 0.0000 0.0000 0.9999 3.9E-07 0.9991 0.0000 0.9987 0.9999 0.0000 1.0000 4.4E-16 0.0000 1.0000 1.0000 1.0000 0.0000 1.0000 1.4E-07 0.0000 1.0000
3、最大似然估计
• 欲使得效用模型可以采用ML估计,就必须为随机 误差项选择一种特定的概率分布。
• 两种最常用的分布是标准正态分布和逻辑 (logistic)分布,于是形成了两种最常用的二元 选择模型—Probit模型和Logit模型。 • 最大似然函数及其估计过程如下:
F ( t ) 1 F (t )
具有异 方差性
• 由于存在这两方面的问题,主要是模型左右端矛 盾问题,导致:
– 原始模型不能作为实际研究二元选择问题的模型。 – 需要将原始模型变换为效用模型。一般教科书称为潜 变量模型(Latent Variable Model)。 – 这是离散选择模型的关键。
2、效用模型
U i1 X i 1 i1 U i0 X i 0 i0
四、二元Logit离散选择模型及其参数 估计
1、逻辑分布的概率分布函数
F (t )
f (t )
1 1 e
(1 e
t
F (t )
et
et 1 e
t
(t )
e t
t
)
2
f (t )
(1 e )
t 2
(t )(1 (t ))
2、重复观测值不可以得到情况下二元logit 离散选择模型的参数估计
二、二元离散选择模型
1、原始模型
• 对于二元选择问题,可以建立如下计量经济学模 型。其中Y为观测值为1和0的决策被解释变量;X 为解释变量,包括选择对象所具有的属性和选择 主体所具有的属性。
Y X yi X i i
E( i ) 0 E ( yi ) X i
一、社会经济生活中的二元选择问题
• 研究选择结果与影响因素之间的关系。
–选择结果:0、1 –影响选择结果的因素包括两部分:决策者的属性和备 选方案的属性。
• 两种方案的选择
–由决策者的属性和备选方案的属性共同决定。 – 例如,选择利用公共交通工具还是私人交通工具,取 决于两类因素。一类是公共交通工具和私人交通工具 所具有的属性,诸如速度、耗费时间、成本等;一类 是决策个体所具有的属性,诸如职业、年龄、收入水 平、健康状况等。
2、重复观测值不可以得到情况下二元Probit 离散选择模型的参数估计
ln L
fi fi Xi Xi 1 Fi F y 0 y 1 i
i
i
q i f (q i X i ) Xi F (q i X i ) i 1
n i 1
n
n
• 在样本数据的支持下,如果知道概率分布函数 和概率密度函数,求解该方程组,可以得到模 型参数估计量。
三、二元Probit模型及其参数估计
1、标准正态分布的概率分布函数
F (t )
t
(2 )
12
exp( x 2 2)dx
f ( x) (2 )
1
2
exp( x 2 2)
JG 0 0 1 0 0 1 0 1 0 0 1 0 1 0 1 1 1 0 0 0 1 0 0 0 1 0
XY 1500 96.00 -8.000 375.0 42.00 5.000 172.0 -8.000 89.00 128.0 6.000 150.0 54.00 28.00 25.00 23.00 14.00 49.00 14.00 61.00 40.00 30.00 112.0 78.00 0.000 131.0
第i个个体 选择1的效用 第i个个体 选择0的效用
U i1 U i0 X i (1 0 ) (i1 i0 )
yi* X i i*
作为研究对象的二元选择模型
P( yi 1) P( yi* 0) P(i* X i )
• 注意:
– 在效应模型中,被解释变量是不可观测的潜变量,人 们能够得到的观测值仍然是选择结果,即1和0。 – 很显然,如果不可观测的U1>U0,即对应于观测值为1, 因为该个体选择公共交通工具的效用大于选择私人交 通工具的效用,他当然要选择公共交通工具; – 相反,如果不可观测的U1≤U0,即对应于观测值为0, 因为该个体选择公共交通工具的效用小于选择私人交 通工具的效用,他当然要选择私人交通工具。 – OLS不能用于效用模型的估计。
pi P( yi 1) 1 pi P( yi 0)
E( yi ) 1 P( yi 1) 0 P( yi 0) pi
E ( yi ) P( yi 1) X i
左右端矛盾
1 X i 当yi 1,其概率为X i i X i 当yi 0,其概率为1 X i
§6.2
二元离散选择模型
一、二元离散选择模型的经济背景 二、二元离散选择模型 三、二元Probit模型及其参数估计 四、二元Logit模型及其参数估计 五、二元离散选择模型的检验
说明
• 离散被解释变量数据计量经济学模型(Models with Discrete Dependent Variables)和离散选择 模型(DCM, Discrete Choice Model)的区别。
SC -2 -2 -2 -2 -2 -2 -2 -1 0 -2 -1 0 -2 0 -1 1 1 1 -1 -1 1 1 1 1 -1 0
JGF 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.9979 0.0000 0.0000 1.0000 0.0000 0.0000 0.0000 0.9998 0.9999 1.0000 0.4472 0.0000 0.0000 1.0000 1.0000 0.9999 0.0000 0.0000
• 二元选择模型(Binary Choice Model)和多元选择 模型(Multiple Choice Model)。 • 本节只介绍二元选择模型。
• 离散选择模型起源于Fechner于1860年进行的动物 条件二元反射研究。 • 1962年,Warner首次将它应用于经济研究领域, 用以研究公共交通工具和私人交通工具的选择问 题。 • 70、80年代,离散选择模型被普遍应用于经济布 局、企业定点、交通问题、就业问题、购买决策 等经济决策领域的研究。 • 模型的估计方法主要发展于80年代初期。
ln L
n i 1
yi f i fi (1 yi ) X i F (1 Fi ) i 1 i
i
n
(y
( X i )) X i 0
i
Xi
0
qi 2 yi 1
• 关于参数的非线性函数,不能直接求解,需采用 完全信息最大似然法中所采用的迭代方法。
• 应用计量经济学软件。
• 这里所谓“重复观测值不可以得到”,是指对每 个决策者只有一个观测值。如果有多个观测值, 也将其看成为多个不同的决策者。
3、例题:贷款决策模型
• 分析与建模:
标准正态分布或逻 辑分布的对称性
P( y i 1) P( y i* 0) P( i* X i ) 1 P( i* X i ) 1 F ( X i ) F ( X i )
P( y1 , y2 , , yn )
n
(1 F( X )) F( X )
– 从大量的统计中,可以发现选择结果与影响因素之间 具有一定的因果关系。
• 单个方案的取舍
–一般由决策者的属性决定。 – 例如,对某种商品的购买决策问题。决定购买与否, 取决于两类因素。一类是该商品本身所具有的属性, 诸如性能、价格等;一类是消费者个体所具有的属性, 诸如收入水平、对该商品的偏好程度等。 – 对于所有的决策者,商品本身所具有的属性是相同的, 在模型中一般不予体现。
– 某商业银行从历史贷款客户中随机抽取78个样本,根 据设计的指标体系分别计算它们的“商业信用支持度” (XY)和“市场竞争地位等级”(SC),对它们贷款 的结果(JG)采用二元离散变量,1表示贷款成功,0 表示贷款失败。目的是研究JG与XY、SC之间的关系, 并为正确贷款决策提供支持。