一般离散因变量模型和面板离散因变量模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
王中昭制作
• 采用线性回归的方式来构建二元选择模型,会导致如下 问题: • (1)、模型的随机误差项不能满足同方差的假设
由Yt X t t 得 : 当Yt 1时, t Yt X t 1 X t 当Yt 0时, t Yt X t X t 而t 取这两个值的概率分别 为: P( t 1 X t ) P(Yt 1) X t P( t X t ) P(Yt 0) 1 X t 因此t的期望值为: E ( t ) (1 X t )( X t ) ( X t )(1 X t ) 0 但t的方差为: var(t ) Et2 ( E ( t ))2 Et2 (1 X t ) 2 ( X t ) ( X t ) 2 (1 X t ) (1 X t )( X t ) 常数
1 Yt 0
1 2 X ( X 1 , X 2 ,..., X k ), ... k
王中昭制作
例如有如下数据,其X和Y的散点图为:
X 321 351 361 381 340 421 435 490 483 510 523 564 545 578 594 Y 1 0 0 0 1 0 0 1 0 1 0 0 0 1 1
2
obs 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1
Biblioteka Baidu
Y
0 300
350
400
450 X
500
550
600
王中昭制作
• 对Yt取期望, • E(Yt) = + Xt ……(2) • 下面研究Yt的分布。因为Yt只能取两个值0和1,所以 Yt 服从二项分布。把Yt的分布记为: • pt = P (Yt = 1) • 1 - pt = P ( Yt = 0) • 则: E(Yt) = 1×P ( Yt = 1) + 0×P ( Yt = 0) • = pt = P ( Yt = 1)……(3) • 由(2)和(3)式有 • pt = P ( Yt = 1) = +Xt ……(4) • 其中Yt的样本值是0或1,而预测值(拟合值)是概率。 • 因此模型(2)称为线性概率模型.
王中昭制作
因为线性概率模型的随机误差项的方差不是一个常数,因 此不能用OLS来估计模型,线性概率模型往往使用极大似然 法估计参数,有关极大似然法的推导见书P238-239。
logistic回归参数的极大似然估计具有如下性质:一是极大 似然估计为一致估计。二是极大似然估计是渐进有效的,当 样本容量较大时,极大似然估计的方差小于其它方法的方差。 三是极大似然估计为渐进的正态分布。
(3)、在线性概率模型 P(Yt =1) = +Xt中,模型假设Yt=1的概 率随Xt的变化而线性变化,这个假设通常与实际情况不相符。 以家庭购买汽车为例,当某个家庭的年收入X很低时,即便给予 这个家庭一定幅度的增加收入,其购买汽车的概率也不会比原来 增加多少,当某个家庭的年收入X很高时,因本来其购买汽车的 概率就很大,即便再给予这个家庭一定幅度的增加收入,其购买 汽车的概率也不会比原来增加多少,通常情况是:当X很大或者 很小时,P(Yt =1)的变化均较缓慢,而当X取其它值时, P(Yt =1) 的变化较快, P(Yt =1)与Xt不是线性关系,如下图,因此必须要 寻求符合这样非线性关系的模型。
王中昭制作
• 以pt=- 0.2+0.05Xt 为例,说明Xt 每增加一个单位, 则采用第一种选择(Yt = 1)的概率增加0.05。假设用 这个模型进行预测,当预测值落在 [0,1] 区间之 内(即Xt取值在[4, 24] 之内)时,则没有什么问题; 但当预测值落在[0,1] 区间之外时,则会暴露出该 模型的严重缺点。因为概率的取值范围是 [0,1], 所以此时必须强令预测值(概率值)相应等于0或 1(见下图)。
因此变量的显著性检验是采用Z统计量。
Zi
ˆ i
S i
(看相关的书:赵卫亚著《计量经济学》,机械工业出版社, 2008年9月,p188-189)。
王中昭制作
• (2)、线性概率模型要求Yt的取值落入[0,1]内,但是模型 参数估计后,
ˆ的实际值可能落入 ˆ ˆ Xt Y [0,1]外, 导致不合理结果 . t
P
X
•
王中昭制作
基于线性概率模型上述缺点,希望能找到一种
变
• •
换,使模型满足如下条件: ( 1 )使解释变量 Xt 所对应的所有预测值(概率值) 都落在(0,1)之间。 • (2)同时对于所有的 Xt,当Xt增加时,希望Yt也单 调增加或单调减少。 • 显然累积概率分布函数 F(Zt) 能满足这样的要求。 采用累积正态概率分布函数的模型称作 Probit模型。 用正态分布的累积概率作为 Probit模型的预测概率。 另外logistic函数也能满足这样的要求。采用logistic函 数的模型称作logit模型(服从Logistic分布)。
王中昭制作
一、一般的离散因变量模型
如果回归模型的解释变量中含有定性变量,则可以用虚拟变量 进行处理。在实际经济问题中,被解释变量也可能是定性变量。如 通过一系列解释变量的观测值观察人们对某项动议的态度,是否签 订合同。对某一商品是否购买(汽车或房子),某件事情的成功和失 败,求职者对某种职业是否接受或者拒绝,那么这种选择就可以用 1或者0来表示,这与解释变量的虚拟变量一样,只不过这里的变量 为被解释变量,建模过程就较为复杂。 当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的 二元选择模型或多元选择模型。这里主要介绍 Tobit (线性概率) 模型,Probit(概率单位)模型和Logit模型。
王中昭制作
1.Tobit(线性概率)模型 Tobit模型的形式如下, Yt = + Xtβ + μt …… (1) 其中μt为随机误差项,Xt为解释变量,和 β为待估计的参数。Yt为二元选择变量。此 模型由James Tobit提出,因此得名。如利 息税、机动车的费改税问题等。设
如果是第一种选择 如果是第二种选择