古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第15章定性响应回归模型

15.1 复习笔记

考点一:定性响应模型的性质★★

定性响应模型是指模型中的回归子是一个二值或二分变量的模型,通常被称为概率模型。回归子也可以是多分响应变量或多类型响应变量。将二值响应变量建立成概率模型的方法包括线性概率模型(LPM)、logit模型、probit模型和tobit模型。

考点二:线性概率模型(LPM)★★★★

1.LPM的定义

以下述回归模型为例说明:Y i=β1+β2X i+u i。其中X表示家庭收入;Y=1,则表示该家庭拥有住房;Y=0,则该家庭不拥有住房。该模型被称为线性概率模型,因为Y i在给定X i下的条件期望E(Y i|X i)可解释为在给定X i下事件(家庭拥有住房)发生的条件概率,即Pr(Y i=1|X i)。

2.LPM的特征

令P i表示“Y i=1”(即事件发生)的概率,而1-P i表示“Y i=0”(即事件不发生)的概率,则变量Y i服从贝努利概率分布。

根据期望的定义,有:E(Y i)=0(1-P i)+1P i=P i。此外有:E(Y i|X i)=β1+β2X i =P i,即模型的条件期望事实上可以解释为Y i的条件概率。

该模型的约束条件为:0≤E(Y i|X i)≤1。

3.LPM的问题

(1)干扰项u i的非正态性

若把方程写成:u i=Y i-β1-β2X i,u i的概率分布见表15-1。

表15-1 u i的概率分布

可见u i服从贝努利分布而不是正态分布。虽然干扰项不满足正态性假定,但OLS的点估计值仍具有无偏性。此外在大样本下,OLS估计量一般都趋于正态分布,因此LPM的统计推断仍可用正态性假定下的OLS程序。

(2)干扰项的异方差性

即使LPM中的干扰项满足零均值和无序列相关性假定,但也不能说它具有同方差性。对于贝努利分布,理论上的均值和方差分别为P和P(1-P),可见方差是均值的函数,而均值的取值依赖于X的值,因此LPM中的干扰项具有异方差性。

由于u i的方差依赖于E(Y i|X i),解决异方差性问题的方法之一就是进行数据变换,将模型的两边同时除以:

==

即:

12i i i Y X u ββ=++ 可以证明,上述方程中变换后的误差项是同方差的。因此,可以用OLS 对该方程进行

估计,这就是加权最小二乘估计(WLS )。 在实践中,由于真实的E (Y i |X i )未知,所以权重w i 也是未知的。为了估计w i ,可以用如下两步法:

步骤1:直接先对具有异方差的方程进行OLS 回归,可得到Y ∧i ,再求出w i 的估计值w ∧

i =Y ∧i (1-Y ∧i )。

步骤2:用估计的w i 去做数据变换,并用加权最小二乘法估计变换后的方程。

(3)不满足0≤E (Y i |X i )≤1情形

用OLS 估计LPM 时,没有考虑0≤E (Y i |X i )≤1的约束条件,因此无法保证E (Y i |X i )的估计量Y ∧i 的取值在0到1之间。有两种方法可以使估计的Y ∧i 介于0到1之间: ①用OLS 法估计LPM ,对于小于0的Y ∧i 取值为零,大于1的Y ∧i 则取值为1。 ②设计logit 和probit 模型等估计方法,以保证所估计的条件概率必定处于0与1之间。

(4)可疑的拟合优度:R 2值

在二分响应模型中,计算出的R 2大多介于0.2与0.6之间,比1小很多,可见R 2的价值是有限的。因此,在有定性因变量的模型中应避免使用判定系数。LPM 的根本问题在于,它假定P i =E (Y =1|X )随X 而线性增加,即X 的边际效应一直保持不变。

考点三:logit 模型 ★★★★

1.模型 LPM 若为:P i =β1+β2X i 。现在考虑如下表达式:

()1211i i X P e ββ-+=

+

把方程写成: 111i i i

Z i Z Z e P e e -==++ 其中Z i =β1+β2X i 。上式就是logistic (累积)分布函数。

并且由于: 111i

i Z P e -=+

因此有: 111i i i Z Z i Z i P e e P e

-+==-+ 取方程的自然对数得到:L i =ln[P i /(1-P i )]=Z i =β1+β2X i 。可见,机会比率的对数

L i 是X i 和参数的线性函数,上述模型称为logit 模型。

2.logit 模型的特点(见表15-2)

表15-2 logit 模型的特点

考点四:logit模型的估计★★★★

为达到估计目的,将方程改写成:L∧i=ln[P∧i/(1-P∧i)]=β∧1+β∧2X i+u i。对于模型的估计要区分个体层次上的数据和群组观测数据。

1.个体层次上的数据

如果数据属于微观或个体层次,就无法运用标准的OLS估计,只能采用极大似然(ML)法估计。

2.群组或重复观测数据

将相对频数作为P i估计值,即P∧i=n i/N i,可得logit模型:L∧i=ln[P∧i/(1-P∧i)]=β∧1+β∧2X i。如果在每一X i处的观测个数N i都足够大,那么这将是真实logit即L i的相当好的估计值。

可以证明,如果N i相当大,且对于给定X i的每一次观测独立地服从一个二值变量的分布,那么u i~N{0,1/[N i P i(1-P i)]}。因此,logit模型的干扰项也具有异方差性,必须使用加权最小二乘法。在经验研究中,用P∧i代替未知的P i并用下式作为σ2的估计量:σ∧2=1/[N i P∧i(1-P∧i)]。

相关文档
最新文档