第八章 (1) 离散和受限被解释变量模型

合集下载

第八章 离散因变量模型

第八章 离散因变量模型

第八章离散因变量模型离散(分类)因变量模型(Models with Discrete /Categorical Dependent Variables)分为二元选择模型(Binary Choice Models)和多类别选择(反应)模型(Multicategory Choice /Polytomous Response Models)。

在多类别选择模型中,根据因变量的反应类别(response category)是否排序,又分为无序选择模型(Multinominal Choice Models)和有序选择模型(Ordered Choice Models)(也称有序因变量模型Ordered Dependent Variable Models、有序类别模型Ordered Category Models等)一、二元选择模型设因变量1、线性概率模型(LPM模型)如果采用线性模型,给定,设某事件发生的概率为P i,则有所以称之为线性概率模型。

不足之处:1、不能满足对自变量的任意取值都有。

2、3、所以线性概率模型不是标准线性模型。

给定,为使,可对建立某个分布函数,使的取值在(0,1)。

2、Logit模型(Dichotomous/ Binary Logit Model)Logit模型是离散(分类)因变量模型的常用形式,它采用的是逻辑概率分布函数(Cumulative Logistic Probability Function)(e为自然对数的底),逻辑曲线如图4-1所示。

其中,二元Logit模型是掌握多类别Logit模型的基础。

图4-1 逻辑曲线(Logit Curve)以二元选择问题为例,设因变量有0和1两个选择,由自变量来决定选择的结果。

为了使二元选择问题的研究成为可能,首先建立随机效用模型:令表示个体i选择=1的效用,表示个体i选择=0的效用,显然当时,选择结果为1,反之为0。

将两个效用相减,即得随机效用模型:,记为(4-1)当时,,则个体i选择=1的概率为:若的概率分布为Logistic分布,则有即(4-2)式(4-2)即为最常用的二元选择模型——Logit模型。

计量经济学课后习题答案第八章_答案

计量经济学课后习题答案第八章_答案

第八章虚拟变量模型1. 回归模型中引入虚拟变量的作用是什么?答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。

加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。

除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。

2. 虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况?答:在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。

除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。

3.什么是虚拟变量陷阱?答:根据虚拟变量的设置原则,一般情况下,如果定性变量有m个类别,则需在模型中引入m-1个变量。

如果引入了m个变量,就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计。

这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题,称为“虚拟变量陷阱”。

4.在一项对北京某大学学生月消费支出的研究中,认为学生的消费支出除受其家庭的每月收入水平外,还受在学校中是否得到奖学金,来自农村还是城市,是经济发达地区还是欠发达地区,以及性别等因素的影响。

试设定适当的模型,并导出如下情形下学生消费支出的平均水平:(1) 来自欠发达农村地区的女生,未得到奖学金;(2) 来自欠发达城市地区的男生,得到奖学金;(3) 来自发达地区的农村女生,得到奖学金;(4) 来自发达地区的城市男生,未得到奖学金。

解答: 记学生月消费支出为Y,其家庭月收入水平为X,则在不考虑其他因素的影响时,有如下基本回归模型:Y i=β0+β1X i+μi有奖学金1 来自城市无奖学金0 来自农村来自发达地区 1 男性0 来自欠发达地区0 女性Y i=β0+β1X i+α1D1i+α2D2i+α3D3i+α4D4i+μi由此回归模型,可得如下各种情形下学生的平均消费支出:(1) 来自欠发达农村地区的女生,未得到奖学金时的月消费支出:E(Y i|= X i, D1i=D2i=D3i=D4i=0)=β0+β1X i(2) 来自欠发达城市地区的男生,得到奖学金时的月消费支出:E(Y i|= X i, D1i=D4i=1,D2i=D3i=0)=(β0+α1+α4)+β1X i(3) 来自发达地区的农村女生,得到奖学金时的月消费支出:E(Y i |= X i , D 1i =D 3i =1,D 2i =D 4i =0)=(β0+α1+α3)+β1X i (4) 来自发达地区的城市男生,未得到奖学金时的月消费支出: E(Y i |= X i ,D 2i =D 3i =D 4i =1, D 1i =0)= (β0+α2+α3+α4)+β1X i5. 研究进口消费品的数量Y 与国民收入X 的模型关系时,由数据散点图显示1979年前后Y 对X 的回归关系明显不同,进口消费函数发生了结构性变化:基本消费部分下降了,而边际消费倾向变大了。

第八章离散因变量模型

第八章离散因变量模型

第⼋章离散因变量模型第⼋章离散因变量模型离散(分类)因变量模型(Models with Discrete /Categorical Dependent Variables)分为⼆元选择模型(Binary Choice Models)和多类别选择(反应)模型(Multicategory Choice /Polytomous Response Models)。

在多类别选择模型中,根据因变量的反应类别(response category)是否排序,⼜分为⽆序选择模型(Multinominal Choice Models)和有序选择模型(Ordered Choice Models)(也称有序因变量模型Ordered Dependent Variable Models、有序类别模型Ordered Category Models等)⼀、⼆元选择模型设因变量1、线性概率模型(LPM模型)如果采⽤线性模型,给定,设某事件发⽣的概率为P i,则有所以称之为线性概率模型。

不⾜之处:1、不能满⾜对⾃变量的任意取值都有。

2、3、所以线性概率模型不是标准线性模型。

给定,为使,可对建⽴某个分布函数,使的取值在(0,1)。

2、Logit模型(Dichotomous/ Binary Logit Model)Logit模型是离散(分类)因变量模型的常⽤形式,它采⽤的是逻辑概率分布函数(Cumulative Logistic Probability Function)(e为⾃然对数的底),逻辑曲线如图4-1所⽰。

其中,⼆元Logit模型是掌握多类别Logit模型的基础。

图4-1 逻辑曲线(Logit Curve)以⼆元选择问题为例,设因变量有0和1两个选择,由⾃变量来决定选择的结果。

为了使⼆元选择问题的研究成为可能,⾸先建⽴随机效⽤模型:令表⽰个体i选择=1的效⽤,表⽰个体i选择=0的效⽤,显然当时,选择结果为1,反之为0。

将两个效⽤相减,即得随机效⽤模型:,记为(4-1)当时,,则个体i选择=1的概率为:若的概率分布为Logistic分布,则有即(4-2)式(4-2)即为最常⽤的⼆元选择模型——Logit模型。

第八讲 离散因变量模型(LPM,Probit,Logit)

第八讲 离散因变量模型(LPM,Probit,Logit)
2 2
= F ( X i B) [1 − F ( X i B)]
∂E ( yi X i ) ∂F ( X i B ) ∂P r= = = 斜率: 斜率: ∂x j ∂x j ∂x j dF ( X i B ) ∂ ( X i B ) = = f ( X i B)β j d ( X iB) ∂x j
分布函数F的选取 (四) 分布函数 的选取
选取分布函数F的原则: 选取分布函数 的原则: 的原则
0 ≤ F ( X i B) ≤ 1
X iB → +∞
F ( X i B) → 1
X i B → −∞
F是单调函数 是单调函数
F ( X i B) → 0
按照上述原则F取作累计分布函数。 按照上述原则 取作累计分布函数。 取作累计分布函数 下面介绍三种不同分布函数下的计量模型: 下面介绍三种不同分布函数下的计量模型: LPM, Probit, Logit
注:括号里是p值。 括号里是 值
p ln( ) = −242.4576 + 0.6771Score − 0.4766 D1 1− p
(0.052) (0.052) (0.873) 值进行判断, (4)检验:可以直接根据括弧里的 p 值进行判断,也可以 )检验: 利用正态分布表查临界值进行检验。 利用正态分布表查临界值进行检验。
E ( yi X i )
P( yi = 0 X i ) = 1 − pi
= 1* P( yi = 1 X i ) + 0 * P( yi = 0 X i ) = 1 ∗ pi + 0 ∗ (1 − pi ) = pi
yi = E ( yi X i ) + ε i = pi + ε i = X i B + ε i

受限被解释变量数据模型

受限被解释变量数据模型
受限被解释变量数据模型 ——选择性样本
Model with Limited Dependent Variable ——Selective Samples Model 一、经济生活中的受限被解释变量问题 二、“截断”问题的计量经济学模型
三、“归并”问题的计量经济学模型
一、经济生活中的受限被解释变量问题
cons
5759.210 4948.980 6023.560 8045.340 5666.540 5298.910 5400.240 5330.340 5540.610
incom
7041.87 6569.23 7643.57 8765.45 6806.35 6657.24 6745.32 6530.48 7173.54
二、“截断”问题的计量经济学模型
1、思路
• 如果一个单方程计量经济学模型,只能从“掐头” 或者“去尾”的连续区间随机抽取被解释变量的 样本观测值,那么很显然,抽取每一个样本观测 值的概率以及抽取一组样本观测值的联合概率, 与被解释变量的样本观测值不受限制的情况是不 同的。
• 如果能够知道在这种情况下抽取一组样本观测值 的联合概率函数,那么就可以通过该函数极大化 求得模型的参数估计量。

i 1
n
( yi X i ) 2
a X i ln1 i 1

n
yi X i i Xi n 2 ln L 2 ( yi X i ) i i 1 i 1 2 2 4 2 2 2 2
1、“截断”(truncation)问题
• 由于条件限制,样本不能随机抽取,即不能从全 部个体,而只能从一部分个体中随机抽取被解释 变量的样本观测值,而这部分个体的观测值都大 于或者小于某个确定值。 “掐头”或者“去尾”。

8第八章 多重共线性:解释变量相关会有什么后果

8第八章 多重共线性:解释变量相关会有什么后果

H0 : B4 B5 0
作业 做在书上:8.1~8.12; 自行思考、上机操作:8.14~8.18、
P95:4.18
Variable C GPA GMAT EMPGRAD TUITION RECRUITER R-squared Adjusted Rsquared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
418通常物流需求是指一定时期内社会经济活动对生产流通消费领域的原材料成品和半成品商品以及废旧物品废旧材料等的配置作用而产生的对物品在空间时间作业量和费用方面的要求涉及运输库存包装装卸搬运流通加工以及与之相关的信息需求等物流活动的诸方面
第二部分
实践中的回归分析
基本假定违背:不满足基本假定的情况。
(1)模型设定有偏误;所选模型是正确设定的 基本假定 所选模型是正确设定的
5、OLS估计量及其标准误对数据的微小变化非常敏感。 6、回归系数的符号有误。 不能通过经济意义的检验。 7、难以评估各个解释变量对ESS或R2的贡献。
5、OLS估计量及其标准误对数据的微小变化非常敏感。
7、难以评估各个解释变量对ESS或R2的贡献。
补充:产生多重共线性的主要原因(了解)
(1)经济变量相关的共同趋势
Y:饰品需求 X2:价格 X3:消费者收入 X4:消费者工资
Yi A1 A2 X 2i A3 X 3i ui Yi B1 B2 X 2i B4 X 4i ui
Yi A1 A2 X 2i A3 X 3i ui X 3i 300 2 X 2i ; R2 1
Rj•2:第j个解释变量对其他解释变量的回归方程的判定系数

第八章离散选择模型Logist回归

第八章离散选择模型Logist回归

第八章离散选择模型—Logistic回归基于logistic回归模型的企业信用评价——以材料和机械制造行业上市公司为例一、引言中国市场经济制度的日益健全与完善以及证券债券等金融市场的逐步建立与发展,信用成为经济交往、债务形成的一个重要的基础,信用风险越来越受到市场交易者的关注。

信用风险是指借款人、证券发行人或交易方由于各种原因不愿或无能力履行商业合同而违约,致使债权人、投资者或交易方遭受损失的可能性。

对于上市公司而言,这种违约行为经常表现为拖欠账款、资不抵债以及以发行证券或债券进行圈钱等失信行为。

对这种违约失信的可能性的度量显得十分重要。

怎样分析公司的信用状况,对信贷管理者如何分析企业的信用,对证券投资者如何衡量投资项目的风险和价值以及企业家如何评价自己管理的公司,都有极大的价值。

自上世纪中期以来,国内外以计算违约率(本文计算守信率,守信率=1-违约率)对信用风险进行评价和度量的方法和模型得到了迅速发展。

对企业的信用评价主要是基于综合财务指标特征计算违约风险并用来划分等级。

以综合财务指标为解释变量,运用计量统计方法建立模型,分析信用在金融和学术界成为主流,并且评价效果显著。

特别对于logistic回归模型效果更好,因为该模型没有关于变量分布的假设,也不要求假设指标存在多元正态分布。

最早有Martin(1977)建立logistic回归模型预测公司的破产以及违约的概率。

Madalla(1983)建立logistic回归模型来区分违约和非违约贷款申请人,并确认0.551为两者的分界线。

比如在我国,张后启等(2002),杨朝军等(2002),应用Logistic模型研究上市公司财务危机,得出有效结论等等。

面对我国在深沪两家证券市场上市的一千多家上市公司,由于公司体制和管理机制缺陷,或者自身利益最大化利益驱使,或者多部分有国企改制而来等各种原因,信用风险程度变的更大。

若能够应用一个较简单的计量模型对他们的信用状况进行评价,对债权人选择贷款对象,投资者投资和交易方的选取都有较大帮助。

第八章随机解释变量和滞后变量模型

第八章随机解释变量和滞后变量模型
但是在单方程计量经济学模型中,凡是外 生变量都被认为是确定性的。 于是随机解释变量问题主要表现于:用滞 后被解释变量作为模型的解释变量的情况。
例如:
(1)耐用品存量调整模型:
耐用品的存量Qt由前一个时期的存量Qt-1和当 期收入It共同决定: Qt=0+1It+2Qt-1+t t=1,T
可以用Xt-1作为原解释变量Xt的工具变量。
Eviews实现
Quick ——estimimate equation ——method(TSLS) ——equation specification
8.2 滞后变量模型
在经济运行过程中,广泛存在时间滞后效应。某 些经济变量不仅受到同期各种因素的影响,而且也 受到过去某些时期的各种因素甚至自身的过去值的 影响。
ˆ 1
x y x
i 2 i
i
成立,即OLS估计量具有一致性。 然而,如果Xi与i相关,即使在大样本下,也 不存在 (xii)/n0 ,则
ˆ 1
x y x
i 2 i
i
在大样本下也不成立,OLS估计量不具有一致性。
如果选择Z为X的工具变量,那么在上述估计 过程可改为:
z y
这是一个滞后被解释变量作为解释变量的模型。 但是,如果模型不存在随机误差项的序列相关 性,那么随机解释变量Qt-1只与t-1相关,与t不相 关,属于上述的第2种情况。
(2)合理预期的消费函数模型
合理预期理论认为消费Ct是由对收入的预期Yte 所决定的:
Ct 0 1Yt e t
如果工具变量Z选取恰当,即有
P lim 1 z i i cov( Z i , i ) 0 n
P lim
1 z i xi cov( Z i , X i ) 0 n

高考数学必背知识手册-第八章-成对数据的统计分析(公式、定理、结论图表)

高考数学必背知识手册-第八章-成对数据的统计分析(公式、定理、结论图表)

第八章成对数据的统计分析(公式、定理、结论图表)一、成对数据的统计相关性1.变量的相关关系(1)函数关系函数关系是一种确定性关系,常用解析式来表示.(2)相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.与函数关系不同,相关关系是一种非确定性关系.2.散点图(1)散点图成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图. (2)正相关和负相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.3.线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.4.样本相关系数(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(,),(,),,(,),利用相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式:(其中,,,和,,,的均值分别为和).①当r >0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.②当r <0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.二、一元线性回归模型及其应用1.线性回归方程:(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:()()()1122,,,,,,n n x y x y x y ,其回归方程为a bx y +=∧,则1221,.ni i i nii x y nx y b x nx a y bx ==⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑注意:线性回归直线经过定点(),x y .(3)相关系数:()()()()12211nii i nni i i i xx y y rx x y y ===--=--∑∑∑1222211ni ii n ni i i i x y nxyx nx y ny ===-=⎛⎫⎛⎫-- ⎪⎪⎝⎭⎝⎭∑∑∑.【方法归纳】(1)利用散点图判断两个变量是否有相关关系是比较直观简便的方法.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.(2)利用相关系数判定,当r 越趋近于1相关性越强.当残差平方和越小,相关指数2R 越大,相关性越强.(3)在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,也可计算相关系数r 进行判断.若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.(4)正确运用计算 ,ba 的公式和准确的计算,是求线性回归方程的关键.并充分利用回归直线 y bxa =+ 过样本点的中心(),x y 进行求值.2、回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。

第八章离散选择模型

第八章离散选择模型
Q ui Yi 12Xi Yi 1, ui 112Xi
Yi 0, ui 12Xi
• 给定解释变量, 随机扰动项仅取两个值.
• (2)u i 的异方差性
Var(ui | Xi) E(ui E(ui))2 E(ui2)
(1 2Xi)2(1 pi)(11 2Xi)2 pi
pi2(1 pi)(1 pi)2 pi pi(1 pi)[pi 1 pi] pi(1 pi)
一、问题的提出
• 例8.1 研究家庭是否购买住房。由于,购买住房行为要受
到许多因素的影响,不仅有家庭收入、房屋价格,还有房
屋的所在环境、人们的购买心理等,所以人们购买住房的
心理价位很难观测到,但我们可以观察到是否购买了住房,
即 •
1购 买 住 房
Y
0不




• 例8.2 分析公司员工的跳槽行为。员工是否愿意跳槽到另 一家公司,取决于薪资、发展潜力等诸多因素的权衡。员 工跳槽的成本与收益是多少,我们无法知道,但我们可以 观察到员工是否跳槽,即
(2)
ln( 1
p
p
)

X
i
为线性函数。
(3)当
ln( 1
p
p
)
为正的时候,意味着随着
X
i
的增加,选择
1
的可能性也增大了。

ln( 1
p
p
)
为负的时候,随着
X
i
的增加,选择
1
的可能性将减小。换言之,当机
会比由 1 变到 0 时,ln( p ) 会变负并且在幅度上越来越大;当机会比由 1 变到 1 p
的参数估计值将比较接近参数的真值。 • (2)参数估计为渐近有效,即当样本观测增大时,参数

第八讲 离散因变量模型(LPM,Probit,Logit)

第八讲 离散因变量模型(LPM,Probit,Logit)
1 0.8 0.6

(2 )
t
12
eห้องสมุดไป่ตู้
( x2 2)
dx
0.4 0.2 0 -4 -2 0 2 4
累积正态概率分布曲线
Probit曲线和logit曲线很相似。两条曲线都是在pi = 0.5处有拐点, 但logit曲线在两个尾部要比Probit曲线厚。
(1) Probit 模型的设定
yi F ( X i B) i
Interval] 1.359199 5.373068 1.593967
score .6770611 d1 -.4766044 _cons -242.4575
(3)得到估计式:
注:括号里是p值。
p ln( ) 242.4576 0.6771Score 0.4766 D1 1 p
(0.052) (0.052)
定义变量: Y :考生录取为1,未录取为0; SCORE :考生考试分数; D1:应届生为1,非应届生为0。
数据表
obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Y 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 0 0 0 0 0 0 0 0 0 SCORE 401 401 392 387 384 379 378 378 376 371 362 362 361 359 358 356 356 355 354 354 353 350 349 349 348 D1 1 0 1 0 1 0 0 0 1 0 0 1 1 1 1 1 1 1 1 0 1 0 0 0 1 obs 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Y 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 SCORE 347 347 344 339 338 338 336 334 332 332 332 331 330 328 328 328 321 321 318 318 316 308 308 304 303 D1 1 1 1 1 0 1 1 0 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 0 1 obs 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 Y 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 SCORE 303 299 297 294 293 293 292 291 291 287 286 286 282 282 282 278 275 273 273 272 267 266 263 261 260 D1 1 1 1 0 1 1 0 1 1 1 1 0 1 1 0 0 0 0 1 1 0 1 1 1 0 obs 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 Y 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 SCORE 256 252 252 245 243 242 241 239 235 232 228 219 219 214 210 204 198 189 188 182 166 123 D1 0 0 1 1 1 0 0 1 0 0 1 1 1 1 1 1 0 1 1 1 1 0

第八章 模型中的特殊解释变量

第八章  模型中的特殊解释变量
第八章 模型中的特殊解释变量
一、随机解释变量 二、滞后变量问题 三、虚拟变量问题 四、时间变量
第一节
随机解释变量问题
一、估计量的渐近特征
1.渐进无偏性(P202) 所谓渐进分布是指,当样本容量N→∞时, 随机变量序列将收敛到某个特定的分布。 所谓渐进无偏性是指,如果当N→∞时, 参数估计量的数学期望值将趋向于总体参数 的真实值。这时,将参数估计量称为总体参 数的渐近无偏估计。
第三节 虚拟变量
一、虚拟变量的基本含义 许多经济变量(定量变量)是可以定量度量 的,如:商品需求量、价格、收入、产量等; 但是,经济中有一些影响经济变量的因素无 法定量度量(定性变量),如:职业、性别对收 入的影响,战争、自然灾害对GDP的影响,季节 对某些产品(如冷饮)销售的影响等等。 为了在模型中能够反映这些因素的影响,并 提高模型的精度,需要将它们“量化”,这种 “量化”通常是通过引入“虚拟变量”来完成的。
一元回归中,工具变量法估计量为
1
~ z ( x ) z z x z x
i 1 i i i i 1 i i i
i
两边取概率极限得:
P lim(1 ) 1
~
P lim 1 n zi i P lim 1 n z i xi
如果工具变量Z选取恰当,即有
根据定性变量的属性类型,构造只取“0”或 “1”的人工变量,这些人工变量通常称为虚拟变量 (dummy variables),记为D。 • 例如,反映文程度的虚拟变量可取为: • 1, 本科学历 • D= • 0, 非本科学历 一般地,在虚拟变量的设置中: • 基础类型、肯定类型取值为1;
• 比较类型、否定类型取值为0。
四、工具变量法
模型中出现随机解释变量且它(们) 与随机误差项相关时,OLS估计量是有偏的。 此时,为了得到参数的无偏估计量,最常 用的估计方法是工具变量法(Instrument variables)。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SC -2 -2 -2 -2 -2 -2 -2 -1 0 -2 -1 0 -2 0 -1 1 1 1 -1 -1 1 1 1 1 -1 0
JGF 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.9979 0.0000 0.0000 1.0000 0.0000 0.0000 0.0000 0.9998 0.9999 1.0000 0.4472 0.0000 0.0000 1.0000 1.0000 0.9999 0.0000 0.0000
• 对于两个方案的选择。例如,两种出行方式的选 择,两种商品的选择。由决策者的属性和备选方 案的属性共同决定。
二、二元离散选择模型
1、原始模型
• 对于二元选择问题,可以建立如下计量经济学模 型。其中Y为观测值为1和0的决策被解释变量;X 为解释变量,包括选择对象所具有的属性和选择 主体所具有的属性。
2、重复观测值不可以得到情况下二元Probit 离散选择模型的参数估计
ln L
fi fi Xi Xi 1 Fi F y 0 y 1 i

i

i
q i f (q i X i ) Xi F (q i X i ) i 1

n i 1
n


n
• 在样本数据的支持下,如果知道概率分布函数 和概率密度函数,求解该方程组,可以得到模 型参数估计量。
三、二元Probit离散选择模型及其参数 估计
1、标准正态分布的概率分布函数
F (t )


t
(2 )
12
exp( x 2 2)dx
f ( x) (2 )
1
2
exp( x 2 2)
0.8
0.6 .15 0.4 .10 .05 .00 5 10 15 20 F 25 30 35 40 0.2
0.0 5 10 15 20 DF 25 30 35 40
Börsch-Supan于1987年指出:
• 如果选择是按照效用最大化而进行的,具有极限 值的逻辑分布是较好的选择,这种情况下的二元 选择模型应该采用Logit模型。
§8.1 二元选择模型 Binary Choice Model
一、二元离散选择模型的经济背景 二、二元离散选择模型 三、二元Probit离散选择模型及其参数估计 四、二元Logit离散选择模型及其参数估计 五、二元离散选择模型的检验
说明
• 在经典计量经济学模型中,被解释变量通常被假 定为连续变量。
一、二元离散选择模型的经济背景
实际经济生活中的二元选择问题
• 研究选择结果与影响因素之间的关系。
• 影响因素包括两部分:决策者的属性和备选方案 的属性。 • 对于单个方案的取舍。例如,购买者对某种商品 的购买决策问题 ,求职者对某种职业的选择问题, 投票人对某候选人的投票决策,银行对某客户的 贷款决策。由决策者的属性决定。
• 注意,在模型中,效用是不可观测的,人们能够 得到的观测值仍然是选择结果,即1和0。
• 很显然,如果不可观测的U1>U0,即对应于观测 值为1,因为该个体选择公共交通工具的效用大于 选择私人交通工具的效用,他当然要选择公共交 通工具; • 相反,如果不可观测的U1≤U0,即对应于观测值 为0,因为该个体选择公共交通工具的效用小于选 择私人交通工具的效用,他当然要选择私人交通 工具。
i
Xi
0
qi 2 yi 1
• 关于参数的非线性函数,不能直接求解,需采用 完全信息最大似然法中所采用的迭代方法。
• 应用计量经济学软件。
• 这里所谓“重复观测值不可以得到”,是指对每 个决策者只有一个观测值。如果有多个观测值, 也将其看成为多个不同的决策者。
例8.1.1贷款决策模型
• 分析与建模:某商业银行从历史贷款客户中随机 抽取78个样本,根据设计的指标体系分别计算它 们的“商业信用支持度”(CC)和“市场竞争地 位等级”(CM),对它们贷款的结果(JG)采 用二元离散变量,1表示贷款成功,0表示贷款失 败。目的是研究JG与CC、CM之间的关系,并为 正确贷款决策提供支持。
JG
XY 125.0 599.0 100.0 160.0 46.00 80.00 133.0 350.0 23.00 60.00 70.00 -8.000 400.0 72.00 120.0 40.00 35.00 26.00 15.00 69.00 107.0 29.00 2.000 37.00 53.00 194.0
第8章 离散和受限被解释变量模型
§8.1 二元离散选择模型 §8.2 选择性样本模型
• 这些模型与方法,无论在计量经济学理论方面还是在实际 应用方面,都具有重要意义。但是,这些模型都形成了各 自丰富的内容体系,甚至是计量经济学的新分支学科,模 型方法的数学过程较为复杂。 • 本章只介绍其中最简单的模型,以了解这些模型理论与方 法的概念与思路。
JG 0 1 0 1 0 1 0 0 1 0 1 0 1 1 0 1 0 0 1 1 1 0 1 0 0 1
XY 54.00 42.00 42.00 18.00 80.00 -5.000 326.0 261.0 -2.000 14.00 22.00 113.0 42.00 57.00 146.0 15.00 26.00 89.00 5.000 -9.000 4.000 54.00 32.00 54.00 131.0 15.00
左右端矛盾
1 X i 当yi 1,其概率为X i i X i 当yi 0,其概率为1 X i
具有异 方差性
• 由于存在这两方面的问题,所以原始模型不能作 为实际研究二元选择问题的模型。 • 需要将原始模型变换为效用模型。 • 这是离散选择模型的关键。
JG 0 0 1 0 0 1 0 1 0 0 1 0 1 0 1 1 1 0 0 0 1 0 0 0 1 0
XY 1500 96.00 -8.000 375.0 42.00 5.000 172.0 -8.000 89.00 128.0 6.000 150.0 54.00 28.00 25.00 23.00 14.00 49.00 14.00 61.00 40.00 30.00 112.0 78.00 0.000 131.0
SC -2 0 0 -2 -1 2 -2 0 -2 -2 0 -1 2 -2 0 0 0 -1 -1 0 2 -2 -1 -2 0 -2
JGF 0.0000 0.0000 1.0000 0.0000 6.5E-13 1.0000 0.0000 1.0000 0.0000 0.0000 1.0000 0.0000 1.0000 0.0000 0.9906 0.9979 1.0000 0.0000 0.5498 2.1E-12 1.0000 0.0000 0.0000 0.0000 1.0000 0.0000
标准正态分布或逻 辑分布的对称性
P( y i 1) P( y源自i* 0) P( i* X i ) 1 P( i* X i ) 1 F ( X i ) F ( X i )
P( y1 , y2 , , yn )
n
(1 F( X )) F( X )
yi 0 i yi 1 i
似然函数
L

i 1
( F ( X i )) yi (1 F ( X i )) 1 yi
ln L
(y
i 1
n
i
ln F ( X i ) (1 yi ) ln(1 F ( X i )))
1阶极值条件
ln L

yi f i fi (1 yi ) X i 0 Fi (1 Fi ) i 1
SC -1 2 0 2 1 0 2 1 -1 -2 0 1 1 2 0 0 -2 -2 1 -1 1 -2 1 0 -2 0
JGF 0.0000 1.0000 0.0209 1.0000 6.4E-12 1.0000 0.0000 0.0000 0.9999 3.9E-07 0.9991 0.0000 0.9987 0.9999 0.0000 1.0000 4.4E-16 0.0000 1.0000 1.0000 1.0000 0.0000 1.0000 1.4E-07 0.0000 1.0000
模拟预测
• 预测:如果有一个新客户,根据客户资料,计算 的“商业信用支持度”(XY)和“市场竞争地位 等级”(SC),代入模型,就可以得到贷款成功 的概率,以此决定是否给予贷款。
3、重复观测值可以得到情况下二元Probit离 散选择模型的参数估计
• 思路
– 对每个决策者有多个重复(例如10次左右)观测值。 – 对第i个决策者重复观测ni次,选择yi=1的次数比例为pi, 那么可以将pi作为真实概率Pi的一个估计量。 – 建立 “概率单位模型” ,采用广义最小二乘法估计 。 – 实际中并不常用。
• 离散选择模型起源于Fechner于1860年进行的动物 条件二元反射研究。 • 1962年,Warner首次将它应用于经济研究领域, 用以研究公共交通工具和私人交通工具的选择问 题。 • 70、80年代,离散选择模型被普遍应用于经济布 局、企业定点、交通问题、就业问题、购买决策 等经济决策领域的研究。 • 模型的估计方法主要发展于80年代初期。
2、效用模型
U i1 X i 1 i1 U i0 X i 0 i0
第i个个体 选择1的效用 第i个个体 选择0的效用
U i1 U i0 X i (1 0 ) (i1 i0 )
yi* X i i*
作为研究对象的二元选择模型
P( yi 1) P( yi* 0) P(i* X i )
• 离散被解释变量数据计量经济学模型(Models with Discrete Dependent Variables )和离散 选择模型(DCM, Discrete Choice Model) 。 • 二元选择模型(Binary Choice Model) 和多元选择 模型(Multiple Choice Model)。 • 本节只介绍二元选择模型。
相关文档
最新文档