Chapter9-受限因变量模型
受限因变量模型共66页
3、法律是最保险的头盔。——爱·科 克 4、一个国家如果纲纪不正,其国风一 定颓败 。—— 塞内加 5、法律不能使人人平等,但是在法律 面前人 人是平 等的。 ——波 洛克
谢谢
11、越是没有本领的就越加自命不凡。——邓拓 12、越是无能的人,越喜欢挑剔别人的错儿。——爱尔兰 13、知人者智,自知者明。胜人者有力,自胜者强。——老子 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。——歌德 15、最具挑战性的挑战莫过于提升自我。——迈克尔·F·斯特利
离散因变量和受限因变量模型课件
离散因变量模型的建立与实现
离散因变量模型的建立过程
确定研究问题
明确研究目的,确定因变量和自变量, 并了解相关背景知识。
数据收集
收集适合研究问题的数据,确保数据 质量和完整性。
变量选择
根据研究目的和背景知识,选择合适 的自变量和因变量。
模型构建
根据离散因变量的特点,选择合适的 模型进行拟合,如逻辑回归、多项式 逻辑回归等。
THANKS
感谢观看
离散因变量与受限因变量模型的适用范围
离散因变量模型
适用于分析分类数据或计数数据,如性别、婚姻状况、职业等。这类模型可以帮 助我们了解不同类别之间的差异和关联。
受限因变量模型
适用于分析连续变量,但在特定情境下取值受到限制的数据。这类模型可以帮助 我们预测变量的取值范围和了解变量之间的关系。例如,在经济学中常用的截尾 回归模型就属于受限因变量模型。
离散因变量和受 限因变量模型课 件
• 离散因变量模型概述 • 受限因变量模型概述 • 离散因变量模型的建立与实现 • 受限因变量模型的建立与实现 • 离散因变量与受限因变量模型的比较与选
择 • 案例分析
01
CATALOGUE
离散因变量模型概述
离散因变量的定义
离散因变量
在回归分析中,因变量(即被解释变 量)的值只能取有限个离散值,而不 能取连续值。这些离散值通常是整数 或分类数据。
05
CATALOGUE
离散因变量与受限因变量模型的比较与选 择
离散因变量与受限因变量的比较
定义
离散因变量是指因变量的取值是离散的,通常只有有限个可 能的值;而受限因变量是指因变量的取值受到某些限制,例 如在某个范围内取值。
Eviews:离散因变量和受限因变量模型
DCM)。
1
在实际中,还会经常遇到因变量受到某种限制的情况, 这种情况下,取得的样本数据来自总体的一个子集,可能 不能完全反映总体。这时需要建立的经济计量模型称为受 限因变量模型(limited dependent variable model)。这两
类模型经常用于调查数据的分析中。
2
一
二元选择模型
令pi = P ( yi =1) ,那么 1 - pi = P ( yi =0) ,于是
E ( yi ) 1 P( yi 1) 0 P( yi 0) pi
(7.1.2)
又因为E(ui ) = 0 ,所以 E(yi ) = xi,xi =(x1i , x2i ,…, xki ), =(1 , 2 ,…, k ),从而有下面的等式:
(7.1.4)
此时就可以把因变量看成是一个概率。
那么扰动项的方差为:
E (ui2 ) (1 x i β ) 2 pi ( x i β ) 2 (1 pi ) pi (1 pi ) (7.1.5)
或
i2 E (ui2 ) E ( yi )[1 E ( yi )]
临界值选为0,但事实上只要xi包含有常数项,临界值的选择 就是无关的,所以不妨设为0。这样
P( yi 1 | x i , β ) P( yi* 0) P(ui* x i β ) 1 F ( x i β ) P( yi 0 | x i , β ) P( y 0) P(u x i β ) F ( x i β )
离散因变量和受限因变量模型
通常的经济计量模型都假定因变量是连续的,但是在
现实的经济决策中经常面临许多选择问题。人们需要在可
受限因变量模型
用计量经济模型反映选择行为
行为主体从事的每项活动都可以看作是一种选择; 行为主体有其偏好; 人们的行为有其规则; 在经济分析中,通常认为选择基于效用最大化标准。 研究中需要考虑:
行为理论基础 计量经济学模型方法
模型设定 统计理论和数据 估计方法
应用分析
行为假定
就可以选择的活动而言,行为主体的偏好具有传递 性和完备性。 每项选择都有其相应的效用水平Uijt 每个行为主体都试图获得最大效用,当Ui1t > Ui2t 时, 行为主体会选择第一项活动。 然而我们无法观测效用本身,我们只有通过观察行 为主体做出的选来揭示其偏好
LR = -2(Lr– Lur )~ c2q 如果未受约束似然值与受约束似然值相等,说明模型效果差,未通过 检验;相反,如果未约束似然值远大于约束似然值,说明所设自变 量通过检验,模型总体效果较好。它对应于线性模型中的F值。
拟合优度
对于线性概率模型,可以直接用得到R2来判断拟合优度; Probit 模型和Logit模型没有R2,因而需要利用其他方法来反 映拟合优度。 一种方法是利用对数似然值计算伪R2(pseudo R2)或 McFadden R2,该值也被称作似然值比值指数,定义为1 – Lur/Lr
必要时给出选项 得到估计结果
用EVIEWS估计有限因变量模型
得到结果后可以在VIEW子菜单下调用:
Coefficient tests各种对系数的统计检验 Residual tests对残差的统计检验 Expectation-Prediction Table 可以得到正确和错 误推断的比例 Goodness-of-Fit Tests检验拟合优劣
得到的参数不会相同 但分析结论不会有大的差别 因而通常基于模型的统计表现和经验来决定取舍
受限因变量模型颜莹
Chapter 6 受限因变量模型本章讨论的一类模型是被关注的因变量的取值受到限制.有时候这种限制不需要特别的处理,但有时候这种限制却是实质性的.从条件期望的角度看,如果限制的信息是确定的,例如,y 只取有限个离散值,如1y =(表示赞成),0y =(表示反对).于是,()E Y X 用线性回归模型的方式来表示就不合适了.我们将依据y 受不同限制的情况处理几类不同的非线性模型,并给出非线性模型的常用估计检验方法—极大似然方法.按理,非线性模型是下篇的内容,之所以要介绍受限因变量模型是因为它的背景与多元回归模型有关. 另外,本章的附录部分简单的介绍非线性理论,这是伍书的第12章. §1.离散响应模型有时,我们只能观察到y 处于某种状态,用1表示,用0表示不处于该状态.如1y =(就业),0y =(失业),或y 仅有几种很少的状态可供选择,我们把y 仅取有限的离散值情况称为离散响应模型.特别,y 仅取0、1为值称为二元响应模型.同样,影响y 的状态的因素称为解释变量或相关变量,X 可能包括有关个体的各种情况,如教育程度,年龄,性别…等,它们都有可能影响y 的就业状态.关注的问题:X 中j X 多大程度上影响了y 的状态? 这个问题准确的表达是,设1()(1)(1)k p x P y X P y X X ====,是一个条件概率.解释变量j X 可以是连续型的也可以是离散型的.那么对连续变量j X ,就用边际效应(1)()j jP y X p x X X ∂=∂=∂∂反映j X 对y 状态的影响,对二元变量k X ,(取0,1为值.)就用差分效应 1111(.......,1)(.......,0)k k p x x p x x ---反映K X 对y 状态的影响.以上两式,如果()p x 已知就没有问题了.问题是如何确定()p x ? (1)二元响应的线性概率模型最简单的是认为()(1)p x P y X ==仍是X 的线性函数,改写成:01122(1)k k P y X X X X X βββββ==++++=.∵(1)()P y X p x ==,则(0)1()P y X p x ==-.y 是一个二元分布. ∴()()E y X p x =,且()()[1()]Var y X p x p x =-. ∴()E y X X β=,且()(1)Var y X X X ββ=-.这说明,如果用线性投影来拟合()E y X ,则存在条件异方差.(方差与样本X 有关)注意:采用线性概率模型,未知参数β的含义,当j X 取连续值(1)j jP y X X β∂==∂;当jX 取离散值,(1,(0,j j j P X P X β==-=其余不变)其余不变). 由()E y X X β=,利用y X βε=+,给定样本y ,1k X X .可得β的一致估计OLS β∧.又由()Var y X 存在条件异方差,故OLS β∧不是有效的,再改用加权最小二乘(WLS )加以修正,做法是,对所有满足条件ˆ01i y <<的样本,定义标准差ˆi σ=然后ˆ/i i y σ对ˆ1/i σ,1ˆˆ, 1i i ik i x x i N σσ=.做回归,得WLS β∧,可增加有效性.关于检验,所有关于β的t 检验、F 检验以及部分参数为0的检验,用稳健的异方差协差矩阵和标准差都是有效的.但是线性概率模型在理论上是有欠缺的,因为拟合值有可能不在[0,1]区间内,即使都在[0,1]中,但预测值y 随着其解释变量i X 不断增加或减少,终将导致y 不在[0,1]区间内,这与概率的意义是不相符的.尽管如此,如果主要目的是估计X 中每个解释变量对y 影响的平均概率,那么一些预测值不在[0,1]中影响不大,线性概率模型不必对X 取极端值给出一个好的估计. (2) 二元响应的指数(Index )模型(probit 和 logit 模型)考虑二元响应的概率有形式:(1)()()P y X G X p x β===. 这里z R ∀∈,0()1G z <<.1(1,)k X X X =,0()K βββ'=.特别()G Z Z =就是线性概率模型.因为先把X β理解成一个指数(Index ),函数G 再把指数X β映射成一个响应函数()p x .故称模型为指数模型,在实践中G 一般取累积分布函数的形式.如果G 是某一随机变量的分布函数,那么二元响应的指数模型可以从存在潜在变量的线性模型中得到解释:设*y X e β=+,且*1(0)y y =>.*y 不可观测,但如果*0y >则可观测1y =,e 是关于原点对称与X 不相关的连续型随机变量.如果G 是e 的分布函数,那么()()G z P e z =<, 且1()(),G z G z z R --=∀∈.因此,*(1)(0)()()1()()P y X P y X P e X X G X G X p x βββ==>=>-==--=.注:没有特别的理由要求e 是关于原点对称的.但为了方便,对二元响应模型已作为一种习惯限制.没有此限制二元响应模型就不能看成是存在潜在变量的模型.二元响应不采用存在潜在变量的说法是因为无法准确定义潜在变量的含义和测量单位,从而参数i β的大小也没有特定的意义.另外,一般对G 的要求也不非要是分布函数,只要满足()G z 在[0,1]区间即可,但在实际应用时,有两个常用的选择,一个是e 服从标准正态分布,称Probit 模型;另一个是e 服从标准Logistic 分布,称为Logit 模型.1.当e 服从标准正态分布,则G 的分布函数形式为()()()zG z z v dv φ-∞=Φ=⎰2.当e 服从Logistic 的分布,则exp()()()1exp()z G z z z λ==+,有性质()()[1()]Z Z Z λλλ'=-.于是,在指数模型中,i β的含义就不如线性概率模型那样明显. 因为当i X 连续时,()()i ip x g X x ββ∂=∂,且()()dG Z g Z dZ =. ∴如果G 是分布函数,则()0g z >,z ∀.故i β的符号给出了对y 的正影响和负影响,而i β的大小则没有太大的增量意义.另外,当G 的密度g 关于原点对称时,0X β=,g 取得最大值,从而i X 在0X β=时对y 有最大影响.其次当K X 是二元解释变量,那么当0K X =改变到1,其他变量不变,对y 产生的偏效应就是011220112211(.......)(.......)k k k k G X X X G X X X ββββββββ--++++-++++该值是依赖于其他解释变量i X 取值,不过k β的符号同样能决定k X 对y 产生的偏效应是正还是负.一般的,当1K k X c =改变到2k c ,其他变量不变,那么对y 产生的偏效应就是011221011222(.......)(.......)k k k k G X X c G X X c ββββββββ++++-++++. 由()()i ip x g X x ββ∂=∂,有时也常用()/100i g X ββ表示i X 改变百分之一对y 产生的偏效应.偏效应比:()()ii j jp x p x x x ββ∂∂=∂∂,当i X 和j X 是连续型时,则不依赖G 的分布函数. (3)二元响应的极大似然估计和检验给定样本观测值,1,t t X x t n ==(0 1)t t t Y y y or ==,要求极值:11max (,,, 1.....)n n t P Y y Y y X t n β===. ∵1111{0}{1}(,1)[1()][()]n n t i i y y Prob Y y Y y X t n G X G X ββ======∏-∏,∴11()()[1()]i inyy i i i L G X G X βββ-==∏-.11ln ()ln ()(1)ln[1()]nni i i i i i L y G X y G X βββ===+--∑∑.由一阶条件,()0L ββ∂=∂,即ln ()0jL ββ∂=∂ 1j K =.得,1()1[]0()1()ni i ii j i i G X y y G X G X ββββ=∂--=∂-∑ 1j K =.这是一个关于β的非线性方程组,采用非线性方程算法可求得β的极大似然估计量ˆβ. 注:一般情况下,上述方程要有解,要求样本容量是n 和自变量个数k 及y 的均值y 满足条件min{,(1)}ny n y k -≥.含义是,y 取1的个数和取0的个数都必须大于k .例如t y 都取1,则方程无解.∴当G 取标准正态公布,()()t tj t jG X X X βφββ∂=∂ 1j K =,2(2)()x x φ-=.∴一阶条件就是表示成11[]()0()1()nt ttj t t t t y y X X X X φβββ=--=Φ-Φ∑ 1j K =.又当G 取Logistic 分布,exp()()()1exp()z G z z z λ==+,()()[1()]t tj t t jX X X X λβλβλββ∂∴=-∂1j K =.∴一阶条件就是表示成11[1()](1)()0nntjt t tj t t t t Xy X X y X λβλβ==---=∑∑ 1j K =.简化成1[()]0ntjt t t Xy X λβ=-=∑ 1j K =.故Logit 模型在算法上要方便些.进一步可以求得,极大似然估计ˆβ的协方差矩阵的估计为: 121ˆ[()]ˆ()ˆˆ()[1()]n i i i t i i g X X X Avar G X G X ββββ-=⎛⎫'= ⎪ ⎪-⎝⎭∑. 有了估计、渐近方差和标准差,我们就可以做各种假设检验.特别,部分系数为零的检验,在有极大似然函数的前提下,又可以方便的增加似然比检验LR.考察(1,)()(,)P y X Z G X Z p x z βγ==+=. 欲检验0:0H γ=.除了用Wald 检验和LM 检验外,用似然比检验LR.2ˆˆ2[ln ()ln ()]ur r QLR L L ββχ=-.ˆur β是无约束下的极大似然估计,ˆrβ是带约束的极大似然估计,Q 是0γ=的个数. 又当Z 的维数很大,用Wald 检验和LR 检验计算量很大,采用LM 方法更为可取.记ˆˆ()i i G G X β=,ˆˆ()i i g g X β=,ˆˆi i i u y G =-.已从极大似然估计中获得.i i on X ,得非中心决定系数2u R .0:0H γ=真下,22u QLM NR χ=.(该方法还可以推广到检验00:H γγ=.) 接下来讨论Probit 、Logit 和线性概率LP 结果的比较.因为Probit 、Logit 和LP 施加不同的变换()G X β,所以得到的极大似然估计ˆβ不能简单的进行比较.因为对j X 的一个微小变化而言,ˆˆˆ(1)[()]j j P y X g X X ββ∆=≈∆,所以,为了比较j X 增加一个单位的偏效应,我们调整ˆ()g X β归“1”.因此,如果Probit 、Logit 、LP 而言,ˆX β接近于0,那么,对Probit ,(0)0.4g ≈;对Logit ,(0)0.25g ≈;对LP ,(0)1g =.所以,0.250.40.625=,用log ˆ0.625it β与ˆprobit β相比.同理,ˆ2.5LP β与ˆprobit β相比;ˆ4LP β与log ˆitβ相比.一般的,j X 连续,用11ˆˆ[()]Nj i i N g X ββ-=∑作为总体上的平均值代替(0)g ,然后再调整,进行比较.另外,二元响应模型也存在解释变量X 有内生性的问题,以及类似二阶段极大似然估计方法.也可以把二元响应模型扩大到面板数据模型上,(1,)()it it i i i P y X c G X c β==+. 这涉及到更多非线性估计和检验的理论,这是下学期的内容,不再深入讨论下去了. (参见伍书第15章) §2.截取回归模型简介因变量y 可能受到客观条件的限制,使其在某一范围外的数据无法得到,或是有意不取.由于结果的数据受到限制,且解释变量是在结果受限条件下获得的数据,此意味着样本i X 和i y 不再独立.从条件期望的角度看,即使()E Y X X β=是正确设定,但如果要限制0y >,本质上会产生(,0)E y X y >对模型中未知参数β的非线性依赖.导致OLS 方法一致性不成立,不再是一个好的估计,只能改用极大似然方法保证大样本下估计的一致性.因变量受限的截取回归模型通俗的说法是,因变量“掐头”或“去尾”.例如,调查个人收入只能在一定范围内得到;又例如调查寿命大于80岁以上的一般用80岁代替.另一种说法是所谓角点解,问题不再是因变量部分不可观测,而是结果依赖于最优选择,且最优选择的特征是y 以正的概率取0值.因为(0)0P y X =>,从而我们关注0y >时的()E y X 就不再是线性的了.例如,慈善捐赠,关注的是捐赠了0y >的那部分.我们把截取Tobit 模型写成:设*i i i y X u β=+是正确设定,且*i y 不能完全观测.但可观测的i y ,*max(,)i i i y y c =为“去尾”或*min(,)i i i y y c =为“掐头”.且i u 在给定i X 、i c 条件下,2,(0,)i i i u X c N σ.特别0i c =,则*max(,0)i i y y =表示非负观测限制.也称为标准截取Tobit 模型.所以,()(0)0(0)(,0)(0)(,0)E y X P y X P y X E y X y P y X E y X y ==+>>=>>*(0)(0)()([/][/])(/)P y X P y X P u X X P u X X X βσβσβσ>=>=>-=>-=Φ (/)(,0)(,0)(/)u u X X E y X y E X u X y X E X X βφβσβββσσσσβσ⎡⎤⎛⎫>=+>=+>-=+ ⎪⎢⎥Φ⎝⎭⎣⎦注:(0,1)zN ,那么,()()1(). E z z c c c c R φ>=-Φ∀∈.()()() c c c c R λφ=Φ∀∈称为逆米尔斯比.所以,(/)()(/)()(/)(/)(/)X E y X X X X X X X φβσβσβσβσβσφβσβσ⎡⎤=Φ+=Φ+⎢⎥Φ⎣⎦.()(0)(,0)(,0)(0)(/)j jjjE y X P y X E y X y E y X y P y X X X X X βσβ∂>>=>+>=Φ∂∂∂.称(/)X βσΦ为标度因子.ˆˆˆ(/)(0)X P y X βσΦ=>,它是给定X 和ˆβ时正响应的概率.ˆˆ(/)X βσ∴Φ接近于1,截取Tobit 模型与多元回归就没有太多区别. 截取Tobit 模型的估计与检验涉及到麻烦的非线性计算,这是下学期的内容,略.需要提出的是,截取Tobit 模型有二种变形.我们知道,截取Tobit 模型对解释变量X 是没有任何限制的.一种变形是,因变量y 的受限导致了X 的样本i X 受限,甚至是有意不取.我们将此处理成Probit 的响应形式. 模型:1111y X u β=+,且2221[0]y X u δ=+>.假定:2y 是一个二元选择变量,当220X u δ+>时等于1.1y 受限于2y ,只有21y =时才是可观测的.1X 是X 的子集,且2y 和X 可观测.又,X 与1u 、2u 不相关,2(0,1)u N ,且1212()E u u u γ=.注:这里关注的模型尽管是线性多元回归,1111y X u β=+,但样本1i y 和1i X 都受到限制. 另一种变形是Tobit 的响应形式.模型:1111y X u β=+,且222max[,0]y X u δ=+.假定:2y 是一个截取选择变量,1y 受限于2y ,只有当2220y X u δ=+>时才是可观测的.1X 是X 的子集,且2y 和X 可观测.又,X 与1u 、2u 不相关,但222(0,)u N τ,且1212()E u u u γ=. 关于模型的背景、估计和检验都是下学期的内容,不再讨论下去了.要提醒的是,这些非线性模型都是多元回归模型受到约束变形而来.。
受限因变量模型Tobit
.041528 .0694553
0.60 0.550
6.7 -.094602 .177658
1.175016 1.027919
1.14 0.253 .707161 -.839669 3.1897
-2.016226 .7049826 -2.86 0.004 .321513 -3.39797 -.634486
-1.36 0.175 1.19687 -.780973 .142184
0.36 0.718
1 -5.52778 8.02184
第15页/共19页
Marginal Effects: Unconditional Expected Value
variable
dF/dx Std. Err.
z P>z
X_at [ 95% C.I. ]
yi
yi* 0,
xi
i ,
yi* 0 yi* 0
1)E[ yi* | x] xi
2)E[ yi
|
yi
0, x]
xi
fi Fi
3)E[ yi | x] Fi E[ yi | yi 0, x] Fi ( xi ) fi
第9页/共19页
解释变量的边际效应
逆米尔斯比率 Inverse Mills ratio
scaler303100 agehh
eduhh labper offlab pculti
passet roaddistant
_cons
.2968965 .1135174
2.62 0.009 1.35208 .074407 .519386
-.0540888 .0233183 -2.32 0.020 44.8083 -.099792 -.008386
计量经济学经典eviews离散和受限因变量模型
离散和受限因变量模型前面所描述的回归方法要求能在连续和无限制的规模上观察到因变量。
然而,也经常出现违背上述条件的情形,即产生非连续或受限因变量。
我们将会识别三种类型的变量:1.定性(在离散或排序的规模上);2.审查或截断;3.整数估值(计数数据)。
在这章里我们讨论这几种定性和受限因变量模型的估计方法。
EViews提供了二元或排序(普罗比特probit、逻辑logit、威布尔gompit),审查或截断(托比特tobit等),和计数数据模型的估计程序。
§17.1二元因变量模型二元因变量模型(Binary Dependent Variable Models)估计方法主要发展与20世纪80年代初期。
普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策领域的研究。
例如,公共交通工具和私人交通工具的选择问题。
选择利用公共交通工具还是私人交通工具,取决于两类因素:一类是诸如速度、耗费时间、成本等两种交通工具所具有的属性;一类是决策个体所具有的属性,诸如职业、年龄、收入水平、健康状况等。
从大量的统计中,可以发现选择结果与影响因素之间具有一定的因果关系。
研究这一关系对制定交通工具发展规划无疑是十分重要的。
在本节介绍的模型中,因变量只具有两个值:1或者0。
可能是代表某一事件出现的虚拟变量,或者是两种选择中的一种。
例如,可能是每个人(被雇佣或不被雇佣)雇用状况的模型,每一人在年龄、教育程度、种族、婚姻状况和其它可观测的特征方面存在差异,我们将其设为。
目标是将个体特征和被雇用的概率之间的关系量化。
假定一个二元因变量,具有0和1两个值。
对简单的线性回归是不合适的。
而且从简单的线性回归中得到的的拟合值也不局限于0和1之间。
替代地,我们采用一种设定用于处理二元因变量的特殊需要。
假定我们用以下模型刻画观察值为1的概率为:Pr这里是一个连续、严格单调递增的函数,它采用实际值并返回一个介于0和1之间的数。
函数的选择决定了二元模型的类型。
第十讲 受限因变量模型(Tobit)
与Tobit模型相关的三个回归函数 模型相关的三个回归函数
y i* = x i β + ε i y i* = x i β + ε i , yi = 0,
1) E[ yi* | x ] = xi β fi 2) E[ yi | yi > 0, x ] = xi β + σ ⋅ Fi 3) E[ yi | x ] = Fi ⋅ E [ yi | yi > 0, x ] = Fi ⋅ ( xi β ) + σ ⋅ f i
[95% Conf. .187246 -.2533721 -.2407998 -2.142552 -8.626323 -.9080753 -.0000152 -.7821601 -5.545201
Interval] 1.318625 -0.0209686 0.4514313 8.102282 -1.600061 0.5065954 0.0001876 0.1433702 8.039255
-40
-30
-20
− xi β
-10
0
0
10
20
30
40
εi
E(ε i | ε i > − xi β ) ≠ 0
例如: 例如:
Y* = -40 + 1.2X + u Y = Y*
u ~ N (0,10)
if Y* > 0
Y=0 if Y* ≤ 0
Y* > 0 if u > 40 - 1.2X
TOBIT模型的估计 模型的估计 Y*
.2968965 .1135174 2.62 0.009 1.35208 .074407 .519386 -.0540888 .0233183 -2.32 0.020 44.8083 -.099792 -.008386 .041528 .0694553 0.60 0.550 6.7 -.094602 .177658 1.175016 1.027919 1.14 0.253 .707161 -.839669 3.1897 -2.016226 .7049826 -2.86 0.004 .321513 -3.39797 -.634486 -.0791555 .1419415 -0.56 0.577 2.04953 -.357356 .199045 .000034 .0000203 1.67 0.095 10122.9 -5.9e-06 .000074 -.1259433 .0928634 -1.36 0.175 1.19687 -.307952 .056066 0.36 .4917258 1.363001 0.718 1 -2.17971 3.16316
离散因变量和受限因变量模型
目录
• 引言 • 离散因变量模型 • 受限因变量模型 • 模型估计与检验 • 实证分析与应用举例 • 研究结论与展望
01
引言
目的和背景
1
探究离散因变量和受限因变量的模型选择和应用
2
分析离散因变量和受限因变量模型的优缺点
3
为实际数据分析提供理论支持和指导
离散因变量和受限因变量的定义与特点
步骤
首先,根据模型设定和观测数据构建似然函数;然后,通过对似然函数求导并令其等于零,得到 参数的最大似然估计值;最后,利用数值优化算法求解最大似然估计值。
优点
最大似然估计法具有一致性、有效性和渐近正态性等优良性质,且适用于多种类型的离散因变量 和受限因变量模型。
拟合优度检验
1
目的
拟合优度检验用于评估模型对数据的拟 合程度,即检验模型是否能够充分解释 观测数据的变异。
研究不足与局限性分析
当前研究主要集中在模型的应用和比较方面, 对模型的理论性质和统计推断的深入研究相对 较少。
在处理复杂数据和实际问题时,现有模型可能 存在局限性,如无法处理高维数据、非线性关 系等。
在实际应用中,模型的假设条件可能难以满足, 如随机抽样、误差项独立同分布等,这可能影 响模型的估计结果和解释力度。
03
适用于因变量为有序分类的情况,如评级、满意度等。
计数模型
Poisson回归
适用于计数数据,假设事件发生的次数服从泊松分布。
负二项回归
当计数数据的方差大于均值时,使用负二项回归,考虑了数据的 过度分散。
零膨胀模型
适用于存在过多零计数的情况,通过零膨胀参数对零计数进行建 模。
03
受限因变量模型
第四部分其他离散因变量和受限因变量模型
– 概率的正确预测率
检查Y=1或0的概率的正确性,判断拟合的好坏
– 预测值与真实值的相关系数
相关系数高,表明拟合越好
15
4、模型的选择
• 直接比较三种概率模型的系数是没有意义 的
– 线性概率模型可用于问题的初步分析 – Logit模型,系数含义可以通过机会比得以jiesh
根 据 分 布 函 数 F(x) 的 不 同 可 以 有 有 序 Probit 模 型 、 有 序
Logit模型。
采用极大似然方法估计参数
需要指出的是,M个临界值c1, c2, …, cM 事先也是不确定
的,所以也作为参数和回归系数一起估计。
23
计数模型(Count Model)
• 被解释变量表示次数时,离散模型变为计 数模型
3
(一)线性概率模型 • 1、线性概率模型: 例如,研究居民的收入与购买住房决策的关系
yi a bxi i
其中 1 购买住房
yi 0 不买住房 看上去和OLS回归一样,区别是Y只取0和1两个值。
2、线性概率模型的特点
E( yi | x) 1 p 0 (1 p) pi P( yi 1) E( yi | x) a bxi P( yi 1) a bxi
)
32 32
Ordered probit估计
– use panel184extract.dta,clear – oprobit rating83c ia83 dia,nolog 预测每个公司的评级概率 – predict p2 p3 p4 p5 – list p2 p3 p4 p5 in 1/1
33 33
27
• Probit回归
受限因变量模型在金融中的应用
受限因变量模型在金融中的应用第19章受限因变量模型在金融中的应用?G .S. Maddala1. 引言本文的目的在于回顾受限因变量(Limited Dependent Variable )模型在金融中的一些应用,并对模型应用中存在的缺陷提出一些改进建议。
这一领域的一些问题Maddala (1991)已经讨论过,本文将根据最新研究再度探讨这些问题。
为求简洁,本文不讨论持续时间模型。
讨论的具体领域包括:(1)贷款歧视和违约的研究,(2)债券评级的研究,(3)事件研究,(4)储蓄、贷款和银行倒闭,(5)其他各种应用:公司兼并,公司债务选择,市场微观结构和期货市场。
2.贷款歧视和违约的研究发放贷款的歧视模型通常使用logit 分析或判别函数。
这两者是有关联的(参阅Maddala ,1983和1991,第Ⅱ部分)。
潜变量?t R 定义为t t t t t M C L R εββββ++++=?3210 其中?t R 是表示贷方决定拒绝发放贷款的不可观测指标,t L 是贷款期限向量,t C 是衡量信誉的变量向量,t M 表示借方的人口统计学特征(包括种族、性别、年龄等)。
t M 中用于识别保护组变量的系数,被看成是表示存在或者不存在歧视待遇(或反歧视)的指标。
为了使保护组在样本中具有足够的代表性,通常以不同比例对拒绝和接受的申请进行抽样。
例如,被拒绝申请的比例是5%,而被接受申请的比例是95%,如果要从中抽取大约10%的样本,应该以100%的比例对被拒绝申请进行抽样,而以5%的比例对被接受申请进行抽样。
这种抽样设计被称为“基于选择的抽样”。
出于这一原因,在一些金融应用中常常建议使用Manski-Lerman 加权最大似然估计量。
参阅Palepu 等(1986)和Boyes 等(1989)。
但是,这一估计量只适用于包含选择标志的McFadden 条件logit 对数单位模型,而不适用于金融应用中的logit 模型。
计量经济学前沿限制因变量模型和估计
处理方法2:用抵押贷款申请是否被拒绝作为因变量建立多元回归模 型,探讨保持其他条件不变(相同)旳条件下,种族旳 差别对贷款申请是否被拒绝旳影响。
* 问题3: 方法2 能回答下列问题1 所提出旳问题吗?
6
Copyright © 2003 Prentice-Hall, ቤተ መጻሕፍቲ ባይዱnc.
(0.083)
Pr( y | P / I ratio,black) F (4.13 5.37P / I ratio 1.27black)
(0.35) (0.96)
(0.15)
22
Copyright © 2003 Prentice-Hall, Inc.
23
Copyright © 2003 Prentice-Hall, Inc.
13
Copyright © 2003 Prentice-Hall, Inc.
处理LPM不足思绪
定义: Pr( y 1| X ) G(0 1X i1 2 X i2 ) G(zi ) (3)
其中, G 是一种取值范围严格介于0 ~ 1之间旳函数,
对全部实数 z , 都有
0 G(z) 1
当
z
二值因变量模型
* 问题1:除种族不同外,两个条件完全相同旳人走进一家银行申请一
笔抵押贷款,目旳是购置一套房子,两套房子旳条件也完全相同,他 们是否有同等可能性让他们旳抵押贷款申请被接受?
怎样精确地检验种族歧视旳统计证据?
处理方法1 :用抵押贷款申请被拒绝旳比重来比较不同种 族旳人是否受到同等旳待遇.
P(Y 1| X ) jx j
▪ 回归系数能够用OLS 措施进行估计,而且一般旳(异方差 稳健旳)OLS原则误能够用来假设检验和构造置信区间
微观计量经济学教案受限数据模型
微观计量经济学教案受限数据模型教案章节一:引言1.1 课程目标本章节旨在介绍受限数据模型在微观计量经济学中的应用,帮助学生理解受限数据模型的概念及其在实际问题中的应用。
1.2 教学内容受限数据模型的定义受限数据模型的分类受限数据模型的应用场景1.3 教学方法讲授法:介绍受限数据模型的基本概念和分类案例分析法:分析实际问题中的受限数据模型应用教案章节二:受限数据模型的基本概念2.1 课程目标本章节旨在帮助学生理解受限数据模型的基本概念,包括受限数据的原因和处理方法。
2.2 教学内容受限数据的定义及其产生的原因受限数据模型的基本假设受限数据模型的处理方法2.3 教学方法讲授法:介绍受限数据的基本概念和处理方法互动讨论法:引导学生思考受限数据产生的原因及处理方法教案章节三:受限数据模型的分类3.1 课程目标本章节旨在帮助学生了解受限数据模型的分类,包括线性回归模型、逻辑回归模型等。
3.2 教学内容线性回归模型逻辑回归模型其他受限数据模型3.3 教学方法讲授法:介绍各类受限数据模型的特点和应用场景案例分析法:分析实际问题中的受限数据模型应用教案章节四:受限数据模型的估计方法4.1 课程目标本章节旨在帮助学生掌握受限数据模型的估计方法,包括最大似然估计、矩估计等。
4.2 教学内容最大似然估计矩估计其他估计方法4.3 教学方法讲授法:介绍受限数据模型的估计方法及其原理数值模拟法:让学生通过实际数据例子理解估计方法的应用教案章节五:受限数据模型的检验与诊断5.1 课程目标本章节旨在帮助学生了解受限数据模型的检验与诊断方法,以确保模型的有效性和可靠性。
5.2 教学内容模型检验方法模型诊断方法模型修正方法5.3 教学方法讲授法:介绍受限数据模型的检验与诊断方法案例分析法:分析实际问题中的受限数据模型检验与诊断教案章节六:线性回归模型的受限数据处理6.1 课程目标本章节旨在让学生掌握线性回归模型在受限数据情况下的处理方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章 受限因变量模型这一章讨论响应变量仅仅被部分观测到的情况。
引入被部分观测到的潜在随机变量y *,y *的实际观测变量为y i 。
引入二元指示变量D i ,如果a i < y *<b i ,D i = 1;否则,D i = 0。
即D i 表示变量y *是否可以被观测得到。
(a i , b i )称为观测区间。
如果对于D i = 1 和D i = 0都有实际观测数据,当D i = 1时,潜在变量与实际观测变量相等,当D i = 0时,实际观测变量同样有取值,但不等于潜在变量,这时称数据被归并(censored ),即小于a i 的数据被归并为a i ,而大于b i 的数据被归并为b i 。
用数学符号表示为:****,,,i i ii i i i i i i i a y a y y a y b b y b ⎧ <⎪= ≤≤⎨⎪ >⎩如果如果如果。
(1)如果只有当D i = 1时实际观测变量y i 才有观测数据,即:当D i = 1时,潜在变量与实际观测变量相等,而当D i = 0时,y i 没有观测值,这时称数据被截断(truncated ),即小于a i 的数据和大于a i 的数据被截断了。
因此截断数据与归并数据的区别在于,对于观测区间外的数据,归并数据将将其都归并为一点,而截断数据没有观测值。
将潜在随机变量y *的基本模型设定为:*i i i y v μσ=+。
(2)其中μi 为位置参数,σ为刻度参数;v i 为独立于x i 的连续随机扰动项,均值为0,方差为1,其分布函数、密度函数分别为F 、f。
在这些假定条件下,y i *的均值为μi ,方差为σ2,分布函数为*()i iy F μσ-,概率密度函数为*()/i i y f μσσ-(证明请参见附录1)。
a i < y i * < b i 等价于i ii ii i i a b c v d μμσσ--=<<=,那么y i *被观测到的概率为:*Pr()Pr(1)()()i i i i i i a y b D F d F c <<===- (3)下面对截断数据模型和归并数据模型分别进行介绍1.1 截断数据模型如果样本数据是从总体的一部分抽取得到,我们把这类数据称为截断数据。
比如,研究高收入阶层(月收入x ≥ 10000)的消费与收入的关系,所采集的数据只是位于收入总体分布的一个区间里。
假设所有居民的收入服从正态分布,那么高收入阶层的收入只是在x ≥ 10000的区间里观测得到的。
下面介绍截断数据的分布特征和模型估计。
1.1.1 截断数据的分布特征如前面所述,截断数据只包括D i = 1情况下的数据。
截断分布是指变量高于(低于)某个设定值的未截断部分的分布。
如果变量只有在高于某一门限值a 时才被观测到(x > a ),称之为从下面截断(truncation from below )或者是从左边截断(truncation from left );如果变量只有在低于某一门限值b 时才被观测到(x < b ),称之为从上面截断(truncation from above )或者是从右边截断(truncation from right)。
如图所示。
图一 截断分布图(上面截断(左图)、下面截断(右图))下面分析截断数据的分布函数、密度函数、均值和方差。
1. 截断变量的分布函数和密度函数给定模型(1)及相应的观测概率(2),那么第i 个观测变量y i 的条件分布函数为(证明请参见附录2):()()()()***0,()/(),1,i ii i i y i i i i i i i i y a F y F c F y a y b F d F c y bμσ⎧ <⎪--⎪= ≤≤⎨-⎪⎪ >⎩如果如果如果 (4)(注:此处及后面的,,,i i i i a b c d 的定义均与前面相同)密度函数为:()()()*()/1,()0,i i i i i i i y i f y a y b F d F c f y μσσ⎧- ≤≤⎪-=⎨⎪ ⎩如果其他 (5) 从截断数据的密度函数(4)式我们可以推出从下面截断或从上面截断的各种不同分布的变量的密度函数。
读者可以参阅下面介绍的几个例子。
例1 截断均匀分布的密度函数和分布函数如果x *在区间[a ,b ]上服从均匀分布(uniform distribution ),那么1(),()()x af x F x a x b b ab a-==<<--, (6) 如果在x *= c 处截断,即实际观测值x = x *,如果x *≥ c ;x = c ,如果x *< c 。
这是左截断的例子,即右截断点=b 。
根据(5)式,在x = c 处截断的随机变量x 的截断分布的密度函数为:**()()1/()1()(1)()()1()/()i f x f x b a f x P D F b F c c a b a b c-=====----- (7)分布函数为:()()()/()()/()()Pr(1)1()/()i F x F c x a b a c a b a x cF x D c a b a b c-------====---- (8) 例2 截断正态分布的密度函数模型设定为:*i i i y v μσ=+,y i = y i *,如果*i i i a y b << (9) y i = a i ,如果*i i y a ≤ y i = b i ,如果*i i y b ≥其中v i ~N (0, 1)。
即 y i * ~N (μi , σ2),其中μi 、σ分布表示y i 的均值和标准差。
以φ、Φ分别表示标准正态分布密度函数和分布函数。
那么:Pr()Pr()()()()()i ii ii ii i i i i i ii i a y b a y b b a d c μμμσσσμμσσ---<<=<<-- =Φ-Φ = Φ-Φ (10)其中,,i ii ii i b a d c μμσσ--==。
根据截断正态分布的密度函数公式:()()()*()/1,()0,i i i i i i i y i f y a y b F d F c f y μσσ⎧- ≤≤⎪-=⎨⎪ ⎩如果其他 可直接得到*i i i a y b ≤≤时y i 的密度函数:1()()()()()1()()11()i iy i i i i i i i i i i i y f y d c y if a d y if b c μφσσμφσσμφσσ-=Φ-Φ-⎧⎪ →-∝⎪Φ⎪ =⎨-⎪⎪ →+∝⎪-Φ⎩(11) 根据截断正态分布的分布函数公式:()()()()***0,()/(),1,i i i i i y i i i i i i i i y a F y F c F y a y b F d F c y bμσ⎧ <⎪--⎪= ≤≤⎨-⎪⎪ >⎩如果如果如果可直接得到*i i i a y b ≤≤时y i 的分布函数:()()()()()()()()()()()()()1()i ii ii i y i i i i i i iii i i i i i y y a c F y d c d c y if a d y c if b c μμσσμσμσ--Φ-ΦΦ-Φ==Φ-ΦΦ-Φ-⎧Φ⎪ →-∝⎪Φ⎪ =⎨-⎪Φ-Φ⎪ →+∝⎪-Φ⎩(12)图二 截断正态分布变量的累积分布函数图(设潜变量y *~N (0, 1),图中虚线表示标准正态分布函数,实线表示截断正态分布函数,截断点为-1、1)2. 截断变量的均值和方差截断随机变量的均值和方差称之为截断均值(truncated mean )和截断方差(truncated variance ),由下面的(5)、(6)式可以推出各种不同截断分布的均值和方差。
给定模型(9),y i 的均值为:[]i i i E y μσϕ=+ (13)其中,()[]()()ii d i i i i i c i i f v E v |c v d vdv F d F c ϕ=<<=-⎰y i 的方差为:2[|1][|]i i i i i i Var y D Var v c v d σ==<< (14)其中,22()[]()()ii d i i i i i c i i f v Var v |c v d v dv F d F c ϕ<<=--⎰。
(证明请参见附录3)。
例3:均匀分布的截断均值和截断方差给定模型(6),截断变量x 的均值和方差分别为:2222211()(|)()2()[(|)](|)11[()]21[()()]2bbccb cbc E x xf x x c dx xdx b c b c Var x x E x x c f x x c dx x b c dxb c b c c a b c =>==+-=->> =-+- =---+⎰⎰⎰⎰ (15)例4:正态分布的截断均值和截断方差给定模型(9),那么y i 的均值和方差分别为:[]i i i E y μσϕ=+ (16)其中,()()[|]()()i i i i i i i i i d c E v c v d d c φφϕ-=<<=-Φ-Φy i 的方差为:2[|1][|]i i i i i i Var y D Var v c v d σ==<< (17)其中,2()()()()[]1[]()()()()i i i i i i i i i i i i i i d d c c d c Var v |c v d d c d c φφφφ--<<=--Φ-ΦΦ-Φ。
其中,φ、Φ分别表示正态分布的密度函数和分布函数。
(1) 如果c i -∝,即数据只是在右边截断,这时φ( c i ) = 0、Φ( c i ) = 0,因此:()[]()()i i i i i i i d E v |v d d d φϕλ=<=-=Φ<0 (17a )2[]1()-()i i i i i i Var v |v d d d d λλ<=+ (17b )(2) 如果d i +∝,即数据只是在左边截断,这时φ( d i ) = 0、Φ( d i ) = 1,因此:()[]()1()i i i i i i i c E v |v c c c φϕλ=>==-Φ>0 (18a )2[]1()-()i i i i i i Var v |v c c c c λλ>=+ (18b )(17a )式中()()=-()i i i d d d φλΦ称之为Inverse Mills Ratio ,将(18a )式中()()=1()i i i c c c φλ-Φ称之为风险函数(Hazard Function )。