二元离散选择模型案例

合集下载

计量经济学72二元选择模型

计量经济学72二元选择模型
§7.2 二元选择模型 Binary Choice Model
一、二元离散选择模型的经济背景 二、二元离散选择模型 三、二元Probit离散选择模型及其参数估计 四、二元Logit离散选择模型及其参数估计 五、二元离散选择模型的检验
说明
• 在经典计量经济学模型中,被解释变量通常被假 定为连续变量。
• 需要将原始模型变换为效用模型。
• 这是离散选择模型的关键。
2、效用模型
U
1 i
X i 1
i1
第i个个体 选择1的效用
U
0 i
X i 0
i0
第i个个体 选择0的效用
U
1 i
U
0 i
Xi
(1
0 ) (i1
i0 )
yi* X i i*
作为研究对象的二元选择模型
P( yi 1) P( yi* 0) P(i* X i )
• 模型的估计方法主要发展于80年代初期。
一、二元离散选择模型的经济背景
实际经济生活中的二元选择问题
• 研究选择结果与影响因素之间的关系。 • 影响因素包括两部分:决策者的属性和备选方案
的属性。 • 对于单个方案的取舍。例如,购买者对某种商品
的购买决策问题 ,求职者对某种职业的选择问题, 投票人对某候选人的投票决策,银行对某客户的 贷款决策。由决策者的属性决定。 • 对于两个方案的选择。例如,两种出行方式的选 择,两种商品的选择。由决策者的属性和备选方 案的属性共同决定。
0
1.0000
0 26.00 -2
0.0000
0 89.00 -2
0.5498
1 5.000
1
2.1E-12
1 -9.000 -1

二元logit和多元logit

二元logit和多元logit

二元logit和多元logit引言二元logit和多元logit是经济学和统计学领域经常使用的两种统计模型。

它们用于分析离散型、有序类变量以及多分类问题。

本文将详细介绍二元logit和多元logit模型的原理、应用领域以及在实际中的应用案例。

二元logit模型原理二元logit模型是一种用于估计和解释两种可能结果的离散型因变量的统计模型。

典型的应用包括预测个体选择两个互斥选项之一的行为,如是否参与劳动力市场、是否购买某个商品等。

二元logit模型的核心思想是通过最大似然估计法估计模型参数。

应用领域二元logit模型在经济学和社会科学的研究中广泛应用。

它可以用于分析个体在选择两个互斥选项之一时的决策过程,从而帮助我们了解个体的行为模式。

例如,研究者可以利用二元logit模型分析个体的劳动力市场参与决策,研究个体特征对参与决策的影响。

应用案例下面通过一个简单的案例来解释二元logit模型的应用。

假设我们想研究个体的购车决策,即个体是否购买一辆新车。

我们收集了一些相关数据,包括个体的年龄、收入、家庭状况等变量。

我们可以使用二元logit模型来分析这个问题。

模型的结果可以告诉我们不同变量对购车决策的影响,并估计它们的影响程度。

多元logit模型原理多元logit模型是一种用于估计和解释多个离散型结果的统计模型。

与二元logit模型相比,多元logit模型可以处理具有三个或更多互斥选项的离散型因变量。

多元logit模型的核心思想是将多个二元logit模型扩展到多个互斥选项之间,并通过最大似然估计法估计模型参数。

应用领域多元logit模型在市场调研、消费者行为研究等领域得到广泛应用。

研究者可以借助多元logit模型分析消费者对多个产品或品牌的选择行为,从而了解消费者的偏好和购买决策。

多元logit模型还可以用于分析投票行为、市场份额预测等问题。

应用案例下面通过一个简单的案例来解释多元logit模型的应用。

假设我们想研究消费者对三个不同品牌的冰淇淋的选择行为。

二元选择模型

二元选择模型

Λ ( β1 + β 2 ( q + 10) + β3v )
Λ ( β1 + β 2 q + β3v )
结论:数量分析成绩相对平均成绩增加 分可提高 分可提高20%被录取的可能性 结论:数量分析成绩相对平均成绩增加10分可提高 被录取的可能性
计算词汇能力成绩相对平均分增加10分时被录取概率增加值 计算词汇能力成绩相对平均分增加 分时被录取概率增加值
线性概率模型
修正
转换函数 Probit模型 模型
yt = F ( xt β ) + ut
Logit模型 模型
例题
讨论GRE考试成绩与研究生入学情况的关系 考试成绩与研究生入学情况的关系 讨论 成绩( 将GRE成绩(数量分析成绩和词汇能力成绩)与取得研究生入学资格的概率作为 成绩 数量分析成绩和词汇能力成绩) 二元选择模型的研究对象
β1 + β 2 q + β3v
'数量分析成绩相对平均分高出 分时被录取的概率 数量分析成绩相对平均分高出10分时被录取的概率 数量分析成绩相对平均分高出 分时被录取的概率' series xqplus2=@cnorm(common2+eq2.@coefs(2)*(@mean(q)+10-@mean(q))) '数量分析成绩达到平均分时被录取的概率 数量分析成绩达到平均分时被录取的概率' 数量分析成绩达到平均分时被录取的概率 series xq2=@cnorm(common2) '计算数量分析成绩相对平均分增加 分时被录取概率增加值 计算数量分析成绩相对平均分增加10分时被录取概率增加值 计算数量分析成绩相对平均分增加 分时被录取概率增加值' series var12=xqplus2-xq2

计量经济学72二元选择模型

计量经济学72二元选择模型
• 原理相同
PPT文档演模板
计量经济学72二元选择模型
2、拟合检验
• P:样本观测值中被解释变量等于1的比例。 L0:模型中所有解释变量的系数都为0时的似然函 数值。
• LRI=1,即L=1,完全拟合。 LRI=0,所有解释变量完全不显著,完全不拟合。
PPT文档演模板
计量经济学72二元选择模型
PPT文档演模板
PPT文档演模板
计量经济学72二元选择模型源自1、标准正态分布的概率分布函数
PPT文档演模板
计量经济学72二元选择模型
2、重复观测值不可以得到情况下二元Probit 离散选择模型的参数估计
PPT文档演模板
计量经济学72二元选择模型
• 关于参数的非线性函数,不能直接求解,需采用 完全信息最大似然法中所采用的迭代方法。
3、重复观测值可以得到情况下二元Probit离 散选择模型的参数估计
• 思路
– 对每个决策者有多个重复(例如10次左右)观测值。 – 对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,
那么可以将pi作为真实概率Pi的一个估计量。 – 建立 “概率单位模型” ,采用广义最小二乘法估计 。 – 实际中并不常用。
PPT文档演模板
计量经济学72二元选择模型
二、二元离散选择模型
PPT文档演模板
计量经济学72二元选择模型
1、原始模型
• 对于二元选择问题,可以建立如下计量经济学模 型。其中Y为观测值为1和0的决策被解释变量;X 为解释变量,包括选择对象所具有的属性和选择 主体所具有的属性。
PPT文档演模板
•左右端矛盾
– 对每个决策者有多个重复(例如10次左右)观测值。 – 对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,

第七章(下) 二元离散选择模型

第七章(下) 二元离散选择模型
基于上述LPM的缺点,在现实应用中,原始 模型一般不能作为实际研究二元选择问题的模型。
我们考虑对线性概率模型进行一些变换,来克服 这些缺点。
效用模型

U
1 i
表示第
i个个体选择1的效用,U
0 i
表示第
i个
个体选择0的效用。其效用均为随机变量,于是有
UUi0i1

X i X i
1 0
Yi* X i ui*
中,假定ui*的分布为极值分布,则该模型称为 Extreme模型。
第二节 二元离散选择模型最大似然估计
下面我们来构造二元离散选择模型的似然函数。这 是二元离散选择模型最关键的问题。
我们假设有以Y 轴为对称的概率密度函数f(.),则
P(Yi 1 ) P(Yi* 0 ) P( u*i X i ) 1 F ( X i ) F ( X i )
Yi f ( Xi ) F ( Xi )

X
i
(*)
于是我们选择F不同的形式得到不同的经验模型
ln L


N i 1

(1

Yi
)
1
f ( Xi ) F ( Xi )

Yi f ( Xi ) F ( Xi )

X
i
(*)
一、 Logit模型的最大似然估计
标Yi准* 正X态i分布ui*
x
F ( x)
Yi
10e(xYYxpii**()
0 x)0
1
e

z2 2
dz
2 则
逻辑分布
F(x)
Λ( x)
P(Yi 1) P(Yi* 标0准) 正态P概1(u率i* 分ex布p曲(X线xi) )logi1stic分F布(曲X线i )

离散因变量模型演示文稿

离散因变量模型演示文稿

P(
* i
Xi)
1
P(
* i
Xi)
1 F (Xi) F (Xi)
F(t) 1 F(t)
E( yi Xi ) 1 P 0 (1 P) F (Xi)
Y E(Y X )
总体回归模型
样本回归模
Y F ( XB) y型i F ( Xi B) i (i 1, 2......n)
(三) 二元选择模型随机误差项及斜率
E( yi X i ) 1* P( yi 1 Xi ) 0 * P( yi 0 Xi ) 1 pi 0 (1 pi ) pi
yi E( yi Xi ) i pi i Xi B i
x j 对响应概率(p)的偏效应: j
LPM的估计方法:OLS
➢ 线性概率模型存在的问题及适用性
离散因变量模型 演示文稿
(优选)离散因 变量模型
一、 二元选择模型
❖ 二元选择模型的理论模型 ❖ 二元选择模型经济计量的一般模型 ❖ 线性概率模型(LPM) ❖ Logit 模型 ❖ Probit 模型
(一) 二元选择模型的理论模型
选择理论:效用是不可观测的,只能观测到选择行为
U
1 i
Xi 1
0
189
1
19
0
354
(1) Logit 模型的分布函数
如果选择
eZ
1
1
F(Z) 1 eZ 1 1 eZ 1 eZ
1
0.8 0.6 0.4
0.2 0 0
5
10
15
20
25
30
Logistic分布函数
具有以上分布函数的二元选择模型称为Logit模型。
(2) Logit 模型的设定

离散选择模型举例-二元离散选择模型

离散选择模型举例-二元离散选择模型

一.二元离散选择模型1.二元响应模型(Binary response model)我们往往关心响应概率()()()()z G x x G x y x y k k =+++=E ==P βββ...1110,其中x 表示各种影响因素(各种解释变量,包括虚拟变量)。

根据不同的函数形式可以分为下面三类模型:线性概率模型(Linear probability model ,LPM )、对数单位模型(logit )、概率单位模型(probit):三种模型估计的系数大约有以下的关系:L PM probit probit it ββββ5.2,6.1log ==2.偏效应(1)如果解释变量是一个连续型变量,那么他对p(x)=p(y=1|x)的偏效应可以通过求下面的偏导数得出来:()()()()dzz dG z g x g x x p j j =+=∂∂,0βββ,偏效应的符号和该解释变量对应的系数的符号一致;两个解释变量偏效应之比等于它们各自的估计系数之比。

(2)如果解释变量是一个离散性变量,则k x 从k c 变化到k c +1时对概率的影响大小为:()()()k k k k c x G c x G ββββββ+++-++++...1 (110110)上面的其他解释变量的取值往往取其平均值。

3.估计方法与约束检验极大似然估计;三种常见的大样本检验:拉格朗日乘数检验、wald 检验、似然比检验。

4.Stata 程序语法(以Probit 为例)probit depvar [indepvars] [weight] [if exp] [in range] [, level(#) nocoef noconstant robust cluster(varname) score(newvar) asis offset(varname) maximize_options ] predict [type] newvarname [if exp] [in range] [, statistic rules asif nooffset ] where statistic isp predicted probability of a positive outcome; the default xb linear predictionstdp standard error of the prediction二.具体的例子1.数据:美国1988年的CPS 数据2.模型:估计成为工会成员的可能性,模型形式如下:参加工会的概率=F(潜在经验potexp 、经验的平方项potexp2、受教育年限grade 、婚否married 、工会化程度high);解释变量:Potexp=年龄-受教育年限-5;grade=完成的受教育年限;married :1表示婚,0未婚;high :1表示高度工会化的行业,否则为0。

7.2 二元选择模型

7.2 二元选择模型

标准正态分布或逻 辑分布的对称性
P( y i 1) P( y i* 0) P( i* X i ) 1 P( i* X i ) 1 F ( X i ) F ( X i )
P ( y1 , y 2 , , y n )
n
(1 F ( X )) F ( X )
3、最大似然估计
• 欲使得效用模型可以估计,就必须为随机误差项 选择一种特定的概率分布。
• 两种最常用的分布是标准正态分布和逻辑 (logistic)分布,于是形成了两种最常用的二元 选择模型—Probit模型和Logit模型。 • 最大似然函数及其估计过程如下:
F (t ) 1 F (t )
2
exp( x 2 2)
2、重复观测值不可以得到情况下二元Probit 离散选择模型的参数估计
ln L
fi fi Xi Xi 1 Fi F y 0 y 1 i

i

i
q i f ( q i X i ) Xi F ( q i X i ) i 1
§7.2 二元选择模型 Binary Choice Model
一、二元离散选择模型的经济背景 二、二元离散选择模型 三、二元Probit离散选择模型及其参数估计 四、二元Logit离散选择模型及其参数估计 五、二元离散选择模型的检验
说明
• 在经典计量经济学模型中,被解释变量通常被假 定为连续变量。
左右端矛盾
1 X i 当y i 1,其概率为X i i X i 当y i 0,其概率为1 X i
具有异 方差性
• 由于存在这两方面的问题,所以原始模型不能作 为实际研究二元选择问题的模型。 • 需要将原始模型变换为效用模型。 • 这是离散选择模型的关键。

第七章(下) 二元离散选择模型

第七章(下) 二元离散选择模型

对于Logit模型,我 们有: 分布函数 F ( x) exp( x) Λ( x)
1 exp( x)
exp( x) 密度函数 f ( x) (1 exp( x))2 Λ( x)(1 Λ( x))
带入(*)式,我们得到: ln L


N
Yi
i 1
Λ( X i )X i
1 X i
(PXi i
)2
(1

Pi
)

Pi
(1

Pi
)
随机误差项ui非正态且存在异方差性
Yi 0 1 X1i k X ki ui X i ui
0 Pi E (Y i ) X i 1
可能不成立
当用线性概率模型进行预测,预测值 X i 落在区间 [0,1]之内时,则没有什么问题;但当预测值 X i 落
0 Pi E (Y i ) X i 1
可能不成立
所以此时必须强令预测值(概率值)相应等于0或1。
因此,线性概率模型常常写成下面的形式
Pi


X i
1
0
0 X i 1 X i 1 X i 0
1.2 Y
1.0
0.8
0.6
0.4
0.2
0.0
Yi 0 没有购买住房
Yi 0 1 X i ui i 1,2, , N
令 Pi P(Yi 1) 那么 1 Pi P(Yi 0)
家被庭解选释择变购量买Yi 住的房分的布概为率是解释变量-家庭收入的一
个线性函数。我们称这一关系式为线性概率函数。
Yi
0
1

二元离散选择模型案例

二元离散选择模型案例

第七章 二元离散选择模型案例1、在一次选举中,由于候选人对高收入者有利,所以收入成为每个投票者表示同意或者反对的最主要影响因素。

以投票者的态度(y )作为被解释变量,以投票者的月收入(x )作为解释变量建立模型,同意者其观测值为1,反对者其观测值为0,样本数据见表7.1。

原始模型为:i i i y x αβμ=++。

利用Probit 二元离散选择模型估计参数。

表7.1 样本观测值输入变量名,选择Probit 参数估计。

得到如下输出结果:但是作为估计对象的不是原始模型,而是如下结果:=---+1@[( 4.75390.003067*)]YF CONRM X可以得到不同X值下的Y选择1的概率。

例如,当X=600时,查标准正态分布表,对应于2.9137的累积正态分布为0.9982;于是,Y的预测值YF=1-0.9982=0.0018,即对应于该个人,投赞成票的概率为0.0018。

2、某商业银行从历史贷款客户中随机抽取78个样本,根据涉及的指标体系分别计算它们的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。

样本观测值见表8.2。

目的是研究JG与XY、SC之间的关系,并为正确贷款决策提供支持。

估计过程如下:输入变量名,选择Logit参数估计。

得到如下输出结果:用回归方程表示如下:JGF CONRM XY SC=---+1@[(16.110.465035*9.379903*)]该方程表示,当XY和SC已知时,带入方程,可以计算贷款成功的概率JGF。

3、某研究所1999年50名硕士考生的入学考试总分数(SCORE)及录取情况见表5。

考生考试总分数用SCORE表示,Y为录取状态,D1为表示应届生与往届生的虚拟变量。

表7.3 50名硕士考生的入学考试总分数(SCORE)及录取状况数据表定义如下:1,0,Y ⎧=⎨⎩录取未录取, 1,10,D ⎧=⎨⎩应届生非应届生 加入D1变量的目的是想考察考生为应届生或往届生是否也对录取产生影响。

第四部分其他离散因变量和受限因变量模型

第四部分其他离散因变量和受限因变量模型
L为无约束似然值,L0为参数为0约束下的似然值。
– 概率的正确预测率
检查Y=1或0的概率的正确性,判断拟合的好坏
– 预测值与真实值的相关系数
相关系数高,表明拟合越好
15
4、模型的选择
• 直接比较三种概率模型的系数是没有意义 的
– 线性概率模型可用于问题的初步分析 – Logit模型,系数含义可以通过机会比得以jiesh
根 据 分 布 函 数 F(x) 的 不 同 可 以 有 有 序 Probit 模 型 、 有 序
Logit模型。
采用极大似然方法估计参数
需要指出的是,M个临界值c1, c2, …, cM 事先也是不确定
的,所以也作为参数和回归系数一起估计。
23
计数模型(Count Model)
• 被解释变量表示次数时,离散模型变为计 数模型
3
(一)线性概率模型 • 1、线性概率模型: 例如,研究居民的收入与购买住房决策的关系
yi a bxi i
其中 1 购买住房
yi 0 不买住房 看上去和OLS回归一样,区别是Y只取0和1两个值。
2、线性概率模型的特点
E( yi | x) 1 p 0 (1 p) pi P( yi 1) E( yi | x) a bxi P( yi 1) a bxi

32 32
Ordered probit估计
– use panel184extract.dta,clear – oprobit rating83c ia83 dia,nolog 预测每个公司的评级概率 – predict p2 p3 p4 p5 – list p2 p3 p4 p5 in 1/1
33 33
27
• Probit回归

二元选择(logistics )模型

二元选择(logistics )模型

• 注意,在模型中,效用是不可观测的,人们能够 得到的观测值仍然是选择结果,即1和0。
• 很显然,如果不可观测的U1>U0,即对应于观测 值为1,因为该个体选择公共交通工具的效用大于 选择私人交通工具的效用,他当然要选择公共交 通工具; • 相反,如果不可观测的U1≤U0,即对应于观测值 为0,因为该个体选择公共交通工具的效用小于选 择私人交通工具的效用,他当然要选择私人交通 工具。
JG
XY 125.0 599.0 100.0 160.0 46.00 80.00 133.0 350.0 23.00 60.00 70.00 -8.000 400.0 72.00 120.0 40.00 35.00 26.00 15.00 69.00 107.0 29.00 2.000 37.00 53.00 194.0
( X 1 X ) 1 X 1V
V的观测值通过求解标准正态分布的概率分布函数的反函数 得到
vi
Pi F (Xi ) i
pi


(2 )
12
exp( t 2 2)dt
实际观测得到的
四、二元Logit离散选择模型及其参数 估计
标准正态分布或逻 辑分布的对称性
P ( y i 1) P ( y i* 0) P ( i* X i ) 1 P ( i* X i ) 1 F ( X i ) F ( X i )
P( y1 , y2 , , yn )
n
(1 F( X )) F( X )
§7.2 二元选择模型 Binary Choice Model
一、二元离散选择模型的经济背景 二、二元离散选择模型 三、二元Probit离散选择模型及其参数估计 四、二元Logit离散选择模型及其参数估计 五、二元离散选择模型的检验

4.2 二元选择模型-高级应用计量经济学课件

4.2 二元选择模型-高级应用计量经济学课件

ln L
fi yi 0 1 Fi
Xi
yi 1
fi Fi
Xi
n i 1
qi
f
(qi
Xi) Βιβλιοθήκη F (qi X i ) Xi
n
i X i
i 1
0
qi 2yi 1
• 关于参数的非线性函数,不能直接求解,需采用 完全信息最大似然法中所采用的迭代方法。
• 应用计量经济学软件。
• 这里所谓“重复观测值不可以得到”,是指对每 个决策者只有一个观测值。如果有多个观测值, 也将其看成为多个不同的决策者。
4、重复观测值可以得到情况下二元Probit离 散选择模型的参数估计
• 思路
– 对每个决策者有多个重复(例如10次左右)观测值。 – 对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,
那么可以将pi作为真实概率Pi的一个估计量。 – 建立 “概率单位模型” ,采用广义最小二乘法估计 。 – 实际中并不常用。
1 -5.000
0
0.0000
0 326.0
2
1.0000
0 261.0
1
0.0000
1 -2.000 -1
0.0000
0 14.00 -2
1.0000
1 22.00
0
0.0000
0 113.0
1
1.0000
1 42.00
1
0.0000
1 57.00
2
0.9906
0 146.0
0
0.9979
1 15.00
• 本节只介绍二元选择模型。
• 离散选择模型起源于Fechner于1860年进行的动物 条件二元反射研究。

二元离散选择模型

二元离散选择模型

二元离散选择模型1.在一次选举中,由于候选人对高收入者有力,所以收入成为每个投票者表示同意或者反对的最主要影响因素。

以投票者的态度(y )作为被解释变量,以投票者的月收入(x )作为解释变量建立模型,同意者其观测值为1,反对者其观测值为0,样本数据见表7.1。

原始模型为:i i i y x αβµ=++。

利用Probit 二元离散选择模型估计参数。

表8.1样本观测值序号X Y 序号X Y 序号X Y 11000111100021210012200012120002222001330001313001232300144000141400024240015500015150012525001660001616000262600177000171700127270018800018180002828001990001919001292900110100020200013030001估计过程如下:输入变量名,选择Probit 参数估计。

得到如下输出结果:但是作为估计对象的不是原是模型,而是如下结果:1@[( 4.75390.003067*)]YF CONRM X =−−−+可以得到不通X 值下的Y 选择1的概率。

例如,当X=600时,查标准正态分布表,对应于2.9137的累积正态分布为0.9982;于是,Y 的预测值YF=1-0.9982=0.0018,即对应于该个人,投赞成票的概率为0.0018。

1.某商业银行从历史贷款客户中随机抽取78个样本,根据涉及的指标体系分别计算它们的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。

样本观测值见表8.2。

目的是研究JG与XY、SC之间的关系,并为正确贷款决策提供支持。

表8.2样本观测值JG XY SC JGF JG XY SC JGF JG XY SC JGF 0125-2001500-20054-10 0599-200960014221 0100-201-80104200.0209 0160-200375-2011821 046-20042-1 6.50E-130801 6.40E-12 080-2015211-501 0133-200172-20032620 0350-101-801026110 12300.9979089-201-2-10.9999 060-200128-20014-2 3.90E-07 070-10160112200.9991 1-8010150-10011310 0400-201542114210.9987 07200028-2015720.9999 0120-1012500.9906014600 14010.999812300.997911501 13510.999911401026-2 4.40E-16 12611049-10089-20 115-10.4472014-10.54981511 069-100610 2.10E-121-9-11 010710140211411 12911030-20054-20 12110112-1013211 13710.9999078-200540 1.40E-07 053-1010010131-20 0194000131-2011501估计过程如下:输入变量名,选择Logit参数估计。

第十三章二元选择模型教学案例

第十三章二元选择模型教学案例
⑥ McFadden R-squared是计算似然比率指标,正 像它的名字所表示的,它同线性回归模型中的R2是类似 的。它具有总是介于0和1之间的性质。
18
利用式(7.1.10),分布函数采用标准正态分布,即Probit模型, 例7.1计算结果为
y ˆ i * 7 .4 5 1 .6 2 G 2 3 i 5 0 P .0 8 T 5 Ai U 1 1 .4 7 C P 2 i (6 E S 7.1.153 I )
16
在回归结果中还提供几种似然函数: ① log likelihood是对数似然函数的最大值L(b),b是
未知参数 的估计值。
② Avg. log likelihood 是用观察值的个数N去除以对 数似然函数L(b) ,即对数似然函数的平均值。
③ Restr. Log likelihood是除了常数以外所有系数被 限制为0时的极大似然函数L(b) 。
z = (-2.93) (2.34)
(0.62)
(2.39)
利用式(7.1.15)的Probit模型的系数,本例按如下公式给出新 教学法对学习成绩影响的概率,
当PSI = 0时:
P G r 1 o ) r ( b 7 a . 4 ( d 1 5 . 6 G e 2 2 0 . 0 3 5 P 2 5 . 8 9 A ) 1 (1 7.3 1.19)7 8
y i 1 F x iβ u i
即yi关于它的条件均值的一个回归。
(7.1.10)
8
分布函数的类型决定了二元选择模型的类型,根据分布函 数F的不同,二元选择模型可以有不同的类型,常用的二元选择 模型如表7.1所示:
表7.1 常用的二元选择模型
ui*对应的分布
标准正态分布 逻辑分布 极值分布

第9讲 二元结果模型

第9讲 二元结果模型

第9讲离散选择模型之二元结果模型参考书目:1.Long, J. S., and J. Freese. 2006. Regression Models for Categorical Dependent Variables Using Stata. 2nd ed. College Station, TX: Stata Press教学视频:Logistic regression, part 1: Binary predictorsLogistic regression, part 2: Continuous predictorsLogistic regression, part 3: Factor variables一、离散被解释变量的例子二元结果模型:考研或不考研;就业或待业;买房或不买房;买保险或不买保险;贷款申请被批准或拒绝;出国或不出国;回国或不回国;战争或和平;医药实验中的生或死。

多元结果模型:对不同交通方式的选择(走路、骑车、坐车上班);对不同职业的选择。

这类模型被称为“离散选择模型”(discrete choice model) 。

考虑到离散被解释变量的特点,通常不宜用OLS进行回归。

假设个体只有两种选择,比如y=1 (考研)或y=0 (不考研)。

是否考研,取决于研究生毕业后的预期收入、个人兴趣、本科毕业后直接就业的收入前景等。

所有解释变量都包括在向量x中。

二、二元结果模型的微观基础对于二元选择行为,可通过“潜变量”(latent variable)概括该行为的净收益(收益减去成本)。

如果净收益大于0,则选择做;否则,选择不做。

y*=x′β + ε其中,净收益y*为潜变量,不可观测。

选择规则为y=1,若y*>0y=0,若y*≤0如果ε为正态分布,则为Probit;如果ε为逻辑分布,则为Logit。

logistic — Logistic regression, reporting odds ratios (Logistic回归,报告优势比/比值比)对于Logit模型,记p= P(y =1|x ) ,则1-P= P(y =0|x )。

离散选择模型文稿演示

离散选择模型文稿演示

1 1
eZi
1 eZi
pi 1 pi
1eZi 1 eZi
eZi
ln( pi 1 pi
)
Zi
1
2 Xi
(*)
• 其中 p i 为机会概率比(简称机会比,下同),即事件发
1 pi
生与不发生所对应的概率之比。称(*)式为Logit模型
• 3、Logit模型的特点
(1)随着
P

0
变到
1(亦即
pi2(1 pi)(1 pi)2 pi pi(1 pi)[pi 1 pi] pi(1 pi)
问题: 如何修正?
• (3)、 0E(Yi Xi)pi 1 可能不成立
5.2 Logit模型
• 一、Logit模型的产生 • 1、产生Logit模型的背景 • 对于线性概率模型来说,存在一些问题 • (1)古典假定不再成立
• (1)随机误差项的非正态性表现
ui Yi 12Xi Yi 1, ui 112Xi
Yi 0, ui 12Xi
• 给定解释变量, 随机扰动项仅取两个值.
• (2)u i 的异方差性
Var(ui | Xi) E(ui E(ui))2 E(ui2)
(1 2XiHale Waihona Puke 2(1 pi)(11 2Xi)2 pi
本章内容
8.1 线性概率模型(LPM) 8.2 Logit模型 8.3 Probit模型
• 二、线性概率模型
• 1、线性概率模型的概念。
• 设家庭购买住房的选择主要受到家庭的收入水平,则用如
下模型表示
Yi 12Xiui
• 其中 X i为家庭的收入水平,Y i 为家庭购买住房的选择,即
1 家庭已购买住房 Y0 家庭无购买住房
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章 二元离散选择模型案例
1、在一次选举中,由于候选人对高收入者有利,所以收入成为每个投票者表示同意或者反对的最主要影响因素。

以投票者的态度(y )作为被解释变量,以投票者的月收入(x )作为解释变量建立模型,同意者其观测值为1,反对者其观测值为0,样本数据见表7.1。

原始模型为:i i i y x αβμ=++。

利用Probit 二元离散选择模型估计参数。

表7.1 样本观测值
输入变量名,选择Probit 参数估计。

得到如下输出结果:
但是作为估计对象的不是原始模型,而是如下结果:
=---+
1@[( 4.75390.003067*)]
YF CONRM X
可以得到不同X值下的Y选择1的概率。

例如,当X=600时,查标准正态分布表,对应于2.9137的累积正态分布为0.9982;于是,Y的预测值YF=1-0.9982=0.0018,即对应于该个人,投赞成票的概率为0.0018。

2、某商业银行从历史贷款客户中随机抽取78个样本,根据涉及的指标体系分别计算它们的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。

样本观测值见表8.2。

目的是研究JG与XY、SC之间的关系,并为正确贷款决策提供支持。

估计过程如下:
输入变量名,选择Logit参数估计。

得到如下输出结果:
用回归方程表示如下:
JGF CONRM XY SC
=---+
1@[(16.110.465035*9.379903*)]
该方程表示,当XY和SC已知时,带入方程,可以计算贷款成功的概率JGF。

3、某研究所1999年50名硕士考生的入学考试总分数(SCORE)及录取情况见表5。

考生考试总分数用SCORE表示,Y为录取状态,D1为表示应届生与往届生的虚拟变量。

表7.3 50名硕士考生的入学考试总分数(SCORE)及录取状况数据表
定义如下:
1,0,Y ⎧=⎨⎩录取
未录取, 1,10,D ⎧=⎨⎩
应届生非应届生
加入D1变量的目的是想考察考生为应届生或往届生是否也对录取产生影响。

考生录取状态(Y )与考试总分数(SCORE )的散点图如下图所示:
由于变量Y 只有两种状态,所以应该建立二元选择模型 过程如下:
选择BINARY(二元)估计方法,选择logit 模型
得到如下输出结果:
由D1的相伴概率可以看出,D1的参数没有显著性,说明考生的应届、非应届特征对录取与否无显著性影响。

从模型中剔除D1,重新估计。

结果如下:
对比上述两个结果的赤池信息准则和施瓦茨准则也可以发现,应该剔除D1。

最终的回归方程可以表示如下:
=---+
y CNORM SCORE 1@[(243.73620.6794*)]。

相关文档
最新文档