第八讲 离散因变量模型(LPM,Probit,Logit).
第八章 离散因变量模型

第八章离散因变量模型离散(分类)因变量模型(Models with Discrete /Categorical Dependent Variables)分为二元选择模型(Binary Choice Models)和多类别选择(反应)模型(Multicategory Choice /Polytomous Response Models)。
在多类别选择模型中,根据因变量的反应类别(response category)是否排序,又分为无序选择模型(Multinominal Choice Models)和有序选择模型(Ordered Choice Models)(也称有序因变量模型Ordered Dependent Variable Models、有序类别模型Ordered Category Models等)一、二元选择模型设因变量1、线性概率模型(LPM模型)如果采用线性模型,给定,设某事件发生的概率为P i,则有所以称之为线性概率模型。
不足之处:1、不能满足对自变量的任意取值都有。
2、3、所以线性概率模型不是标准线性模型。
给定,为使,可对建立某个分布函数,使的取值在(0,1)。
2、Logit模型(Dichotomous/ Binary Logit Model)Logit模型是离散(分类)因变量模型的常用形式,它采用的是逻辑概率分布函数(Cumulative Logistic Probability Function)(e为自然对数的底),逻辑曲线如图4-1所示。
其中,二元Logit模型是掌握多类别Logit模型的基础。
图4-1 逻辑曲线(Logit Curve)以二元选择问题为例,设因变量有0和1两个选择,由自变量来决定选择的结果。
为了使二元选择问题的研究成为可能,首先建立随机效用模型:令表示个体i选择=1的效用,表示个体i选择=0的效用,显然当时,选择结果为1,反之为0。
将两个效用相减,即得随机效用模型:,记为(4-1)当时,,则个体i选择=1的概率为:若的概率分布为Logistic分布,则有即(4-2)式(4-2)即为最常用的二元选择模型——Logit模型。
logit 和probit模型的系数解释 -回复

logit 和probit模型的系数解释-回复Logit和Probit模型是常用的二元选择模型,用于分析二元变量的选择行为。
它们通常用于解释个体在做出选择时的决策,可以帮助我们理解各种影响因素对选择行为的影响。
在这篇文章中,我将逐步回答有关Logit和Probit模型的系数解释的问题,介绍这两个模型的基本原理、模型形式、系数解释和使用注意事项,以及如何解读模型中的系数。
首先,让我们从基本原理开始,了解Logit和Probit模型的背后逻辑。
Logit 和Probit模型都属于广义线性模型(Generalized Linear Models),它们基于一个相似的假设:选择行为是一个概率事件,可以由一组解释变量进行解释。
这些解释变量可以是个体特征(如年龄、性别、教育水平等),也可以是一些特定的因素(如收入水平、市场利率等)。
模型的目的是通过对这些解释变量的分析,预测和解释个体做出选择的概率。
接下来,让我们详细了解Logit和Probit模型的模型形式。
Logit模型使用的是逻辑函数(Logistic Function),而Probit模型使用的是标准正态分布的累积分布函数。
具体来说,Logit模型的形式为:p(y=1 x) = F(xβ) = 1 / (1 + e^(-xβ))其中,p(y=1 x)表示个体在给定解释变量x的情况下选择y=1的概率,F(x β)表示Logistic函数,x是解释变量的值,β是模型的系数。
相比之下,Probit模型的形式稍有不同:p(y=1 x) = Φ(xβ)其中,Φ(xβ)表示标准正态分布的累积分布函数,其他符号的含义与Logit 模型相同。
两个模型的模型形式不同,但它们都具有类似的特点:在x 趋近于正无穷时,概率趋近于1,而在x 趋近于负无穷时,概率趋近于0。
这种形式可以帮助我们理解个体选择行为的变化趋势。
现在让我们转向系数解释的问题。
模型的系数代表着解释变量对选择行为的影响程度。
probit模型与logit模型

probit模型与lo git模型2013-03-30 16:10:17probit模型是一种广义的线性模型。
服从正态分布。
最简单的pr obit模型就是指被解释变量Y是一个0,1变量,事件发生地概率是依赖于解释变量,即P(Y=1)=f(X),也就是说,Y=1的概率是一个关于X的函数,其中f(.)服从标准正态分布。
若f(.)是累积分布函数,则其为Log istic模型Logit模型(Logitmodel,也译作“评定模型”,“分类评定模型”,又作Logi sticregres sion,“逻辑回归”)是离散选择法模型之一,属于多重变量分析范畴,是社会学、生物统计学、临床、数量心理学、市场营销等统计实证分析的常用方法。
逻辑分布(Logist ic distri butio n)公式P(Y=1│X=x)=exp(x’β)/1+exp(x’β)其中参数β常用极大似然估计。
Logit模型是最早的离散选择模型,也是目前应用最广的模型。
Logit模型是Luc e(1959)根据IIA特性首次导出的;Marsch ark(1960)证明了Log it模型与最大效用理论的一致性;Marley (1965)研究了模型的形式和效用非确定项的分布之间的关系,证明了极值分布可以推导出Logi t 形式的模型;McFadd en(1974)反过来证明了具有Log it形式的模型效用非确定项一定服从极值分布。
此后Logi t模型在心理学、社会学、经济学及交通领域得到了广泛的应用,并衍生发展出了其他离散选择模型,形成了完整的离散选择模型体系,如Probi t模型、NL模型(Nest Logitmodel)、MixedLogit模型等。
模型假设个人n对选择枝j的效用由效用确定项和随机项两部分构成:Logit模型的应用广泛性的原因主要是因为其概率表达式的显性特点,模型的求解速度快,应用方便。
第八讲 离散因变量模型(LPM,Probit,Logit)

= F ( X i B) [1 − F ( X i B)]
∂E ( yi X i ) ∂F ( X i B ) ∂P r= = = 斜率: 斜率: ∂x j ∂x j ∂x j dF ( X i B ) ∂ ( X i B ) = = f ( X i B)β j d ( X iB) ∂x j
分布函数F的选取 (四) 分布函数 的选取
选取分布函数F的原则: 选取分布函数 的原则: 的原则
0 ≤ F ( X i B) ≤ 1
X iB → +∞
F ( X i B) → 1
X i B → −∞
F是单调函数 是单调函数
F ( X i B) → 0
按照上述原则F取作累计分布函数。 按照上述原则 取作累计分布函数。 取作累计分布函数 下面介绍三种不同分布函数下的计量模型: 下面介绍三种不同分布函数下的计量模型: LPM, Probit, Logit
注:括号里是p值。 括号里是 值
p ln( ) = −242.4576 + 0.6771Score − 0.4766 D1 1− p
(0.052) (0.052) (0.873) 值进行判断, (4)检验:可以直接根据括弧里的 p 值进行判断,也可以 )检验: 利用正态分布表查临界值进行检验。 利用正态分布表查临界值进行检验。
E ( yi X i )
P( yi = 0 X i ) = 1 − pi
= 1* P( yi = 1 X i ) + 0 * P( yi = 0 X i ) = 1 ∗ pi + 0 ∗ (1 − pi ) = pi
yi = E ( yi X i ) + ε i = pi + ε i = X i B + ε i
离散选择模型

Yi 0 1GPAi 2 INCOMEi ui
其中:
1 Yi 0
第i个学生拿到学士学位后三年内去读研 该生三年内未去读研
GPA=第i个学生本科平均成绩 INCOME=第i个学生家庭年收入(单位:千美元)
设回归结果如下(所有系数值均在10%水平统计上显著):
ˆ Yi 0.7 0.4GPAi 0.002 INCOMEi
yi 0 yi 1
函数可以简化为:
L (1 F ( X ))1 yi F ( X ) yi
yi 1
对方程左右取对数我们便得到:
ln L [ yi ln F ( X ) (1 yi ) ln(1 F ( X ))]
i 1
n
似然函数为
fi ln L n yi fi [ (1 yi ) ]xi 0 Fi 1 Fi i 1
Pr ob(Y 1 X ) X F ( X ) f ( X ) X
因此我们在遇到二元响应模型时,估计出参数我们不能盲目的 将其解释为:解释变量变动一个单位,相对应的因变量变化参 数个单位。
为了解决偏效应的问题我们引入调整因子的概念。 在上式中的 f ( X ) 我们 便称为比例因子或调整因子,它与全部 的解释变量有关,为了方便起见,我们要找一个适用于模型所有 斜率的调整因子。有两种方法可以解决: (1)用解释变量的观测值计算偏效应的表达式,调整因子为:
四、二元选择模型的估计
1.除了LPM模型以外,二元选择模型的估计都是以极大似然法为基础 的 。由前面的讨论我们知道:
P(Y 1 X ) F ( X )
由此我们可以得到模型的似然函数为:
P(Y1 y1 ,Yn yn X ) (1 F ( X )) F ( X )
离散因变量模型

0.4
0.2
0.0 X
-0.2 280 300 320 340 360 380 400 420
第10章 离散因变量模型
ቤተ መጻሕፍቲ ባይዱ
对 yi = + xi + ui 取期望,
E(yi) = + xi
(2)
下面研究 yi 的分布。因为 yi 只能取两个值,0 和 1,所以 yi 服从两点分布。 把 yi 的分布记为,
1.0
CNORM
CLOGISTIC
(依据(4)式)
= (1- - xi) ( + xi) = (1 - pi) pi = pi - pi2, (抛物线,依据(4)式)
上两式说明,误差项的期望为零,方差具有异方差。当 pi 接近 0 或 1 时,ui 具有较
小的方差,当 pi 接近 0.5 时,ui 具有最大方差(如图)。所以线性概率模型(1)回
10.1 线性概率模型 线性概率模型的形式如下,
yi = + xi + ui
(1)
其中 ui 为随机误差项,xi 为定量解释变量。yi 为二元选择变量。如利息税、 机动车的费改税(燃油税)问题等。设
1, 若 是 第 一 种 选 择 yi 0, 若 是 第 二 种 选 择
1.2 Y
1.0
0.8
归系数的 OLS 估计量具有无偏性和一致性,但不具有有效性。
y
0.25 0.2
1.4 Y
1.2
1.0
0.8
0.15
0.6
0.1
0.4
0.05
x
0.2 0.4 0.6 0.8
1
Var(ui2) = pi - pi2当pi = 0.5时最大
第八章 离散因变量模型

第八章离散因变量模型离散(分类)因变量模型(Models with Discrete /Categorical Dependent Variables)分为二元选择模型(Binary Choice Models)和多类别选择(反应)模型(Multicategory Choice /Polytomous Response Models)。
在多类别选择模型中,根据因变量的反应类别(response category)是否排序,又分为无序选择模型(Multinominal Choice Models)和有序选择模型(Ordered Choice Models)(也称有序因变量模型Ordered Dependent Variable Models、有序类别模型Ordered Category Models等)一、二元选择模型设因变量1、线性概率模型(LPM模型)如果采用线性模型,给定,设某事件发生的概率为P i,则有所以称之为线性概率模型。
不足之处:1、不能满足对自变量的任意取值都有。
2、3、所以线性概率模型不是标准线性模型。
给定,为使,可对建立某个分布函数,使的取值在(0,1)。
2、Logit模型(Dichotomous/ Binary Logit Model)Logit模型是离散(分类)因变量模型的常用形式,它采用的是逻辑概率分布函数(Cumulative Logistic Probability Function)(e为自然对数的底),逻辑曲线如图4-1所示。
其中,二元Logit模型是掌握多类别Logit模型的基础。
图4-1 逻辑曲线(Logit Curve)以二元选择问题为例,设因变量有0和1两个选择,由自变量来决定选择的结果。
为了使二元选择问题的研究成为可能,首先建立随机效用模型:令表示个体i选择=1的效用,表示个体i选择=0的效用,显然当时,选择结果为1,反之为0。
将两个效用相减,即得随机效用模型:,记为(4-1)当时,,则个体i选择=1的概率为:若的概率分布为Logistic分布,则有即(4-2)式(4-2)即为最常用的二元选择模型——Logit模型。
离散因变量模型课件

离散因变量模型可以处理分类数据,如性别、婚姻状况、学历等;可以分析不 同类别之间的比较和关系;通常采用概率论和统计学方法进行建模和分析。
离散因变量模型的应用场景
市场分析
用于分析市场细分、消费者行 为、品牌选择等,如消费者偏 好分析、市场占有率预测等。
人口学研究
用于分析人口统计数据,如婚 姻状况、生育率、教育程度等 ,可以揭示人口变化趋势和影 响因素。
自变量选择
根据研究目的和理论,选 择与因变量相关的自变量 ,可以是连续或离散变量 。
数据收集和处理
数据来源
确定数据来源,如调查、 数据库等。
数据清洗
对数据进行预处理,如缺 失值填充、异常值处理等 。
数据转换
对数据进行必要的转换, 以满足模型要求。
模型选择与拟合
模型选择
根据研究目的和数据特点,选择合适 的离散因变量模型,如Logit模型、 Probit模型等。
案例三:信用评分模型
总结词
信用评分模型是离散因变量模型在金融领域的典型应用,用于评估个人或企业的信用风 险。
详细描述
信用评分模型是一种常见的离散因变量模型应用,用于评估个人或企业的信用风险。通 过收集个人或企业的信用记录、历史表现和其他相关信息,可以建立信用评分模型,对 个人或企业的信用等级进行评估。这种模型可以帮助金融机构更准确地评估贷款申请人
社会学研究
用于分析社会现象和人类行为 ,如犯罪率、社会阶层、文化 差异等,可以揭示社会规律和 影响因素。
生物学研究
用于分析生物分类、物种分布 、生态平衡等,如物种多样性
分析、生态平衡评估等。
离散因变量模型与其他模型的比较
与连续因变量模型比较
离散因变量模型处理的是分类数据,而连续因变量模型处理 的是连续数据;离散因变量模型通常采用概率论和统计学方 法进行建模和分析,而连续因变量模型可以采用回归分析、 时间序列分析等方法。
logit 和probit模型的系数解释

logit 和probit模型的系数解释Logit和Probit模型是通常在二分类问题中使用的统计模型,这些模型的系数表示了解释变量对于被解释变量的影响程度。
在本文中,我将解释Logit和Probit模型的系数含义,并探讨它们在实际应用中的解释。
首先,我们先来了解一下Logit和Probit模型。
这两种模型都属于广义线性模型(Generalized Linear Models,简称GLM),使用类似的数学形式来描述被解释变量与解释变量之间的关系。
对于一个二分类问题,我们希望找到一个函数f(x)来预测被解释变量y=1的概率P(y=1|x),其中x表示解释变量。
Logit模型将被解释变量与解释变量的关系建模为一个logistic函数,它的数学形式是:P(y=1|x) = 1 / (1 + exp(-z))其中,z = β0 + β1*x1 + β2*x2 + ... + βn*xn表示线性预测器,β0,β1,...,βn表示系数。
这些系数可以表示是模型的"回归系数",它们衡量了解释变量在对被解释变量的影响程度上的贡献。
Logit模型中的系数解释是基于"对数几率比"(log odds ratio)的改变来描述的。
具体来说,系数β1的解释是:当其他解释变量保持不变时,若解释变量x1的值增加一个单位,则被解释变量y=1的对数几率(即log odds)将增加β1个单位。
换句话说,系数β1表示了解释变量x1对于预测y=1的概率的影响程度。
如果β1是正的,表示x1的增加会增加预测y=1的概率,而如果β1是负的,则表示x1的增加会减少预测y=1的概率。
Probit模型的数学表达形式与Logit模型略有不同,它使用了标准正态分布的累积分布函数(CDF)来建模被解释变量与解释变量之间的关系:P(y=1|x) = Φ(z)其中,Φ(z)表示标准正态分布的累积分布函数,z的计算方式与Logit模型相同。
logit 和probit模型的系数解释 -回复

logit 和probit模型的系数解释-回复【logit 和probit 模型的系数解释】1. 引言在统计学和经济学中,logit模型和probit模型是两种常见的二元选择模型,它们被广泛应用于解释和预测离散选择的行为。
本文将详细介绍logit 和probit模型的系数解释步骤,并对其应用领域和优缺点进行讨论。
2. 模型背景logit模型和probit模型是建立在二元选择数据上的概率模型。
在这两种模型中,我们假设个体i选择某个选项的概率是一个关于自变量X的非线性函数F(X)的模型,其中F(X)是一个累积分布函数(CDF)。
logit模型和probit模型是两种常见的CDF函数选择,分别使用逻辑函数(logistic function)和正态分布函数(normal distribution function)进行建模。
3. logit模型的系数解释logit模型的系数解释可以通过观察变量系数的大小、正负以及显著性水平来进行。
首先,系数的大小可以表示预测变量在选择行为中的影响程度。
一个正的系数表示该变量与选择行为正相关,即该变量的增加会增加选择某个选项的概率。
一个负的系数表示该变量与选择行为负相关,即该变量的增加会降低选择某个选项的概率。
其次,系数的正负可以表明变量对选择行为的方向性影响。
最后,统计显著性测试可以帮助我们确定该系数是否显著不等于零,即该变量对选择行为的影响是否存在。
4. probit模型的系数解释probit模型的系数解释与logit模型类似。
同样,我们可以通过观察变量系数的大小、正负以及显著性水平来解释系数。
不同的是,probit模型中的系数解释基于正态分布函数的特性。
具体而言,一个正的系数表示该变量的增加会使选择某个选项的概率上升,并且该上升符合正态分布函数的曲线形状。
一个负的系数则说明选择行为概率会下降。
同样,系数的正负可以揭示变量对选择行为的方向性影响。
最后,显著性测试也可以用来确认系数的显著性。
离散因变量和受限因变量模型共71页文档

▪
28、知之者不如好之者,好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
▪
30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!
71
▪
26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应化为上进的力量,才是成功的保证。——罗曼·罗兰
33、如果惧怕前面跌宕的山岩,生命 就永远 只能是 死水一 潭。 34、当你眼泪忍不住要流出来的时候 ,睁大 眼睛, 千万别 眨眼!你会看到 世界由 清晰变 模糊的 全过程 ,心会 在你泪 水落下 的那一 刻变得 清澈明 晰。盐 。注定 要融化 的,也 许是用 眼泪的 方式。
35、不要以为自己成功一次就可以了 ,也不 要以为 过去的 光荣可 以被永 远肯定 。
离散因变量和受限因变量模 型
31、别人笑我太疯癫,我笑他人看不 穿。(名 言网) 32、我不想听失意者的哭泣,抱怨者 的牢骚 ,这是 羊群中 的瘟疫 ,我不 能被它 传染。 我要尽 量避免 绝望, 辛勤耕 耘,忍 受苦楚 。我一 试再试 ,争取 每天的 成功, 避免以 失败收 常在别 人停滞 不前时 ,我继 续拼搏 。
第八章离散选择模型

Yi 0, ui 12Xi
• 给定解释变量, 随机扰动项仅取两个值.
• (2)u i 的异方差性
Var(ui | Xi) E(ui E(ui))2 E(ui2)
(1 2Xi)2(1 pi)(11 2Xi)2 pi
pi2(1 pi)(1 pi)2 pi pi(1 pi)[pi 1 pi] pi(1 pi)
一、问题的提出
• 例8.1 研究家庭是否购买住房。由于,购买住房行为要受
到许多因素的影响,不仅有家庭收入、房屋价格,还有房
屋的所在环境、人们的购买心理等,所以人们购买住房的
心理价位很难观测到,但我们可以观察到是否购买了住房,
即 •
1购 买 住 房
Y
0不
购
买
住
房
• 例8.2 分析公司员工的跳槽行为。员工是否愿意跳槽到另 一家公司,取决于薪资、发展潜力等诸多因素的权衡。员 工跳槽的成本与收益是多少,我们无法知道,但我们可以 观察到员工是否跳槽,即
(2)
ln( 1
p
p
)
对
X
i
为线性函数。
(3)当
ln( 1
p
p
)
为正的时候,意味着随着
X
i
的增加,选择
1
的可能性也增大了。
当
ln( 1
p
p
)
为负的时候,随着
X
i
的增加,选择
1
的可能性将减小。换言之,当机
会比由 1 变到 0 时,ln( p ) 会变负并且在幅度上越来越大;当机会比由 1 变到 1 p
的参数估计值将比较接近参数的真值。 • (2)参数估计为渐近有效,即当样本观测增大时,参数
计量经济学(probit,logit,异方差问题)

• 联合概率:
n
f ( yi , xi , )
i 1
• 那样的参数beta是合理的?最大化上面这个 联合概率的。
. #;
• 最大化联合概率实际上就是最大化它的对 数(增函数)
n
L [ yi log G( Xi ) (1 yi ) log(1 G( Xi ))] i 1
. #;
系数估计值的含义
• 但logit和probit不是。
• 应该这样比:
n
n
LPM [n1 glogit ( XB)] [n1 g probit ( XB)]
i 1
log it
i 1
probit
• 对probit来说,g(0)=0.4,对logit来说, g(0)=0.25。
0.4 * probit 0.25* logit
var(u | x1, x2...xk ) E(u2 ) 2
. #;
• 看下面的思路
– 估计原模型,得到残差平方和 uˆi2
– 作下面的回归:
uˆi2 0 1x1 2 x2 ...k xk vi
– 去检验这个回归的系数是不是显著?
1 0,2 0,...,k 0
– 现在再使用普通的F检验或者LM检验。
. #;
异方差问题
• (一)异方差的定义 • (二)异方差的影响 • (三)如何在异方差下求OLS估计值的方
差 • (四)如何检验异方差 • (五)如何估计系数?
– 知道h(x) – 不知道h(x)
. #r(u | x1, x2...xk ) 2
同方差假定意味着条件于解释变量,不可观测误差的方差为常数
rˆ
2 ij
uˆ
2 i
S
离散因变量

O
i
逻辑曲线
0 1xi
离散因变量模型应用
逻辑模型的估计,由于
Байду номын сангаас
1 P iP i e(0 1 /1 1xi )/e1 (0 e (1 xi0)1xi) e01xi
ln Pi 1Pi
0
1xi
Pi
式中, 1 P i 称为机会差异比,即所研究事件“发生”与“ 不发生”的概率之比。
离散因变量模型应用
离散因变量
通常的经济计量模型都假定因变量是连续 的,但是在现实的经济决策中经常面临许
多选择问题。人们需要在可供选择的有限
多个方案中作出选择,与通常被解释变量
是连续变量的假设相反,此时因变量只取
有限多个离散的值作为被解释变量建立的
计量经济模型,称为离散被解释变量数据 计量经济学模型(models with discrete dependent variables),或者称为离散选 择模型(discrete choice model, DCM)。
离散因变量模型应用
离散因变量模型应用
对于离散型因变量,使用普通最小二乘模型是不适宜 的,建议对于此类因变量使用非线性函数。事件发生 的条件概率 P(yi 1 xi )与 x i 之间的非线性通常单调函数 ,即随着 的x i 增加 P(yi 1单xi )调增加,或者随着的 减x i 少 P(yi 1 x单i ) 调减少。一个自然的选择便是在值域(0 ,1)之间存在着一条S形曲线。这样,在 在x趋i 向负
1 Pi E(yi xi)e(01xi)
这一函数表达的是一条SP曲1 线。 事少这 L这这一在对当通L这对这这一由只将通这这通对一这这这这人被离 一在在P事少当 通L三这这ooor件。样样样、E于我常样于样一个于能其常一样常于、一样样样们解散个E设件。我常、样样ogggbiiiqqsss发 的, 的 l离 们 的 的 离 的 函 自 L从 转 的 函 的 的 离 l函 的 , 的 需 释 选自 定 发 们的 离 的 的iuuootttto模iiigagaccc生曲 在曲散用经曲散曲数然符化经数曲经散数曲在曲要变择 然模生用 经散曲曲giitt模模模ssii型ioot的线 线型逻济线型线表的号为济表线济型表线线在量模 的型的逻 济因线线tt模ii型型型nncc的在在条类 类因辑计类因类达选上线计达类计因达类类可建型 选之条辑 计变类类模模型EE,,,具趋趋ss件似 似变分量似变似的择判性量的似量变的似似供立择后件分 量量似似(型型或dtt即即即体ii向向mmi概于 于量布模于量于是便断模模是于模量是于于选的便,概布 模模于于sP逻逻逻c形aar负负率一 一,函型一,一一是解型型一一型,一一一择计是我率函 型型一一rott辑辑辑eii式boo无无t个 个使数都个使个条在释,都条个都使条个个的量在们数 都的个个einn模模模t为模穷穷对对随随用去假随用随值变则假随假用随随有经值要去假随随SSSEc型型型h:v曲曲曲型时时话话机 机普拟定机普机域量为定机定普机机限济域对拟 定机机oie是是是线线线i实有有框框wc变 变通合因变通变(增:因变因通变变多模(模合 因变变由由由es。。。际内内与与量 量最变量最量加变量变最量量个型型变量量S00S实mVVV,,曲曲上,,的 的小量的小的引量的量小的的方,的量的的eeeo现11rrrd线线都提提hhh累 累二是累二累起是累是二累累案称参是累累之之趋趋))euuu时时l是供供,积 积乘连积乘积的连积连乘积积中为数连积积lll间间向向之之sssD,,ttt非了了分 分模续分模分相续分续模分分作离续分分在在在的的于于间间C得得线进BBM布 布型的布型布应的布的型布布出散的布布111非非00存存ii999,,到到nn性)行曲 曲是,曲是曲变,曲,是曲曲选被,曲曲线线444在在。aa在在555LL回估rr线 线不但线不线量但线但不线线择解但线线性性着着年年年yyoo估估归gg计。 。适是。适。的是。是适。。,释是。。通通一一提提提ii在在tt计计模模模。宜在宜出在在宜与变在常常条条出出出趋趋方方型型型的现的现现现的通量现单单SS,,,向向法法,形形,,,实,某实实,常数实调调最最最正正,,因曲曲而而建的建种的的建被据的函函早早早无无即即此线线当当议经议结经经议解计经数数被被被穷穷PP回。。我我对济对果济济对释量济,,i用用用rr时时oo归们们于决于的决决于变经决即即来来来bb有有模ii用用此策此概策策此量济策tt随随描描描、、型正正类中类率中中类是学中着着述述述LL的态态oo因经因增经经因连模经生生生gg趋趋系分分的的ii变常变减常常变续型常tt物物物向向和和数布布增增量面量。面面量变(面生生生于于EE不函函加加使临使临临使量临mxx长长长11tt能数数orr用许用许许用的许。。规规规eed像mm去去e非多非多多非假多律律律lees普拟拟线选线选选线设选(((vvw通合合aa性择性择择性相择i逻逻逻tll单单huu线SS函问函问问函反问辑辑辑ee曲曲d调调性((数题数题题数,题i极极成成成s线线增增回c。。。。。。此。值值长长长r时时加 加e归时))t率率率e三三,,,,那因)))d种种而而或或样e变。。。p估估得得者者理e量计计到到n随随解只d方方PP着着e为取rrn式式oo的的t对有bbv。。iia因tt限模模减减ri变a多型型少少b量l个。。es的离)解散,释的或程值单单者度作调调称,为减减为而
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、对Logit模型系数的解释:
p odds ln( ) L ln(odds) 1 p odds j x j x j x j x j
如果选择 F ( X i B) X i B
yi X i B i
yi E( yi X i ) i
E( yi X i ) E( X i B i ) X i B
P( yi 1 X i ) pi
E ( yi X i )
P( yi 0 X i ) 1 pi
1* P( yi 1 X i ) 0* P( yi 0 X i ) 1 pi 0 (1 pi ) pi
yi E ( yi X i ) i pi i X i B i
xj
对响应概率(p)的偏效应: j LPM的估计方法:OLS
2 2
F ( X i B) 1 F ( X i B)
E ( yi X i ) P F ( X i B) r 斜率: x j x j x j dF ( X i B) ( X i B) f ( X i B) j d ( X i B) x j
(四) 分布函数F的选取
一、 二元选择模型
二元选择模型的理论模型 二元选择模型经济计量的一般模型 线性概率模型(LPM) Logit 模型 Probit 模型Βιβλιοθήκη (一) 二元选择模型的理论模型
选择理论:效用是不可观测的,只能观测到选择行为
U i1 X i 1 i1
第i个个体选择1的效用
U i0 X i 0 i0 第i个个体不选择1(选择0)的效用
'
eZ ∵ ( Z ) 1 eZ pi ln( ) XiB 1 pi
得到:
pi ( X i B) e Xi B 1 pi 1 ( X i B)
yi 取1或0
取值范围
Li X i B i
pi 0,1
pi 其中 Li ln 1 pi
机会比率odds
第九章 离散因变量模型
实际经济分析当中的离散变量问题 对于单个方案的取舍购买决策、职业的选择、贷 款决策; 对于两个方案的选择。例如,两种出行方式的选 择,两种商品的选择。由决策者的属性和备选方 案的属性共同决定。 农业经济分析当中的离散因变量问题 农民技术采用、农村选举等等
内容
二元选择模型的三类模型介绍 二元选择模型的估计: 二元选择模型的检验: 二元选择模型的应用
U i1 U i0 X i (1 0 ) (i1 i0 )
y Xi
* i
i
yi 1( yi 0) y 0( y i 0) i
选择1
不选择1 (选择0)
(二) 二元选择的经济计量一般模型
P ( yi 1 X i ) P ( yi* 0) P ( i* Xi ) 1 P ( i* Xi ) 1 F ( X i ) F ( X i )
选取分布函数F的原则:
0 F ( X i B) 1
X i B
F ( X i B) 1
X i B
F是单调函数
F ( X i B) 0
按照上述原则F取作累计分布函数。 下面介绍三种不同分布函数下的计量模型: LPM, Probit, Logit
1、 线性概率模型(LPM)
E( yi X i ) 1 P 0 (1 P) F (Xi )
F ( t ) 1 F (t )
Y E (Y X )
总体回归模型
Y F ( XB)
样本回归模 型 F(X y
i
i
B) i (i 1, 2......n)
(三) 二元选择模型随机误差项及斜率
Li ,
P为y取1时的概率
(3) Logit 模型的边际分析 1、自变量的变化对响应概率(p)的影响:
dp e f (Z ) dZ (1 e Z )2
Z
p d ln( ) dZ 1 p j dx j dx j
p dp Z eZ f (Z ) j j (z)(1-(z)) j Z 2 x j dZ x j (1 e )
线性概率模型存在的问题及适用性
随机误差项是异方差:Var ( i ) pi (1 pi )
办法:可用WLS估计。 拟合值可能不在0-1之间,有可能大于1或小于0: 办法:强令预测值相应等于0或1 进行约束估计。
1
y
* i
y
0
i
Xi B 1 0 Xi B 1 Xi B 0
具有以上分布函数的二元选择模型称为Logit模型。
(2) Logit 模型的设定 Z e yi F ( X i B) i F (Z ) ( Z ) Z
1 e
模型 yi ( X i B) i 线性化 pi ( X i B)
eZ f (Z ) F (Z ) ( Z )(1 ( Z )) Z 2 (1 e )
对于回归模型: yi F ( X i B) i
E(i ) 1 F ( X i B) F ( X i B) F ( X i B) 1 F ( X i B) 0
Var ( i ) E ( i2 ) 1 F ( X i B) F ( X i B) F ( X i B) 1 F ( X i B)
LPM在实际的回归当中应用很少,用于理论模型的比较。
2、 Logit 模型
(1) Logit 模型的分布函数 如果选择
1 0.8 0.6 0.4 0.2 0 0 5 10 15 20 25 30
eZ 1 1 F (Z ) 1 1 eZ 1 eZ 1 e Z
Logistic分布函数