分位数回归理论与应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

T
T
根据式(2), w yt = (1 )(yt ) ( yt ) ,
i: yi
t: yi
对于线性回归模型 yt = X t + ut, 求第分位数回归方程系数的估计量 βˆ( ) 的方法
是求下式(目标函数)最小,
T
T
T
T
Q (1 )uˆ( )t uˆ( )t
y(τ)tXt = F-1(y(τ)tXt)
其中 F(y(τ)tXt) 是 yt 在给定 X 条件下的累积概率分布函数(cdf)。则 y(τ)tXt 称作被解释变量 yt 对 Xt 的条件分位数函数。而 F'(y(τ)tXt) = f (y(τ)tXt)则称 作分位数概率密度函数。其中 F'(y(τ)tXt)表示 F(y(τ)tXt)对 y(τ)tXt 求导。
y(0.5)。
= y(0.5)
证毕
与定理 1 等价的表述是 y 以 = y(0.5)(中位数)时为最小。因此,
中位数回归估计量可以通过最小绝对离差法(least absolute deviation,
LAD)估计。其中 Xt 和分别为(k1)阶列向量。
同理,对于线性回归模型 yt = X t + ut,通过求 yt X t βˆ(0.5) 最小,
w yt 只有在 = yˆ ( )t 时取得最小值。其中
T
T
w yt = (1 )(yt ) ( yt )
(2)
i: yi
t: yi
(0, 1)。据此,分位数回归可以通过加权最小绝对离差和法(weighted least
absolute deviation, WLAD)进行估计。
1 . 总体分位数和总体中位数
在介绍分位数回归之前先介绍分位数和中位数概念。 对于一个连续随机变量 y,其总体第 τ 分位数 y(τ)的定义是:y 小于等于 y(τ)的概 率是 τ,即
τ = P( y ≤ y(τ)) = F(y(τ))
其中 P()表示概率,F(y(τ)) 表示 y 的累积(概率)分布函数(cdf)。 比如 y(0.95) =1.65,则意味着 y ≤ 1.65 的概率是 0.95。且有
2. 总体中位数的估计 在介绍分位数回归之前,先来看中位数的估计和中位数回归。下面以连续变量为例介绍定理 1。 定理 1 连续变量用 y 表示,其概率密度函数用 f(y)表示,累计概率密度函数用 F(y)表示,y 的中位数用
y(0.5)表示,则 y 与任一值 的离差绝对值的期望 E( y ) 以 = y(0.5) 时为最小。
另外,如果随机变量 y 的分布是对称的,那么其均值与中位数是相同的。当 其中位数小于均值时,分布是右偏的。反之,分布是左偏的。
若 yt 对以 Xt 为条件的第 τ 分位数用函数 y(τ)tXt 表示,则分位数回归 模型的含义是:以 Xt 为条件的 yt 小于等于 y(τ)tXt 的概率是 τ。这里的概 率是用 yt 对 Xt 的条件分布计算的。且有
以往介绍的回归模型实际上是研究被解释变量的条件期望。人们当然 也关心解释变量与被解释变量分布的中位数,分位数与解释变量呈何种关 系。这就是分位数回归,它最早由 Koenker 和 Bassett(1978)提出,是估计 一组回归变量 X 与被解释变量 Y 的分位数之间线性关系的建模方法。
分位数回归估计量的计算是基于加权的最小绝对离差和估计法。 分位数回归的优点是, (1)能够更加全面的描述被解释变量条件分布的全貌,而不是仅仅分析 被解释变量的条件期望(均值),也可以分析解释变量如何影响被解释变量 的中位数、分位数等。不同分位数下的回归系数估计量常常不同,即解释 变量对不同水平被解释变量的影响不同。 (2)中位数回归的估计方法与最小二乘法相比,估计结果对离群值则表 现的更加稳健,而且,分位数回归对误差项并不要求很强的假设条件,因 此对于非正态分布而言,分位数回归系数估计量则更加稳健。
y(τ) = F-1(y(τ))
即 F(y(τ))的反函数是 y(τ)。例:若 y 服从标准正态分布,1.65 = F-1(1.65) = -1(1.65)。
当 τ=0.5 时,y(τ) 是 y 的中位数。τ= 0.75 时,y(τ) 是 y 的第 3/4 分位数,τ= 0.25 时,y(τ) 是 y 的第 1/4 分位数。若 y 服从标准正态分布,y(0.5) = 0, y(0.975) =1.960。
估计的中位数回归系数估计量 βˆ(0.5) ,从而得到 yt 的中位数回归估计量
( yˆ(0.5)t X t ) X t' βˆ(0.5) 。
3. 分位数回归 Koenker 和 Bassett(1978)证明,若用 yˆ ( )t 表示 yt 的分位数回归估计量,则对于
以检查函数(check function)w为权数,yt 对任意值的加权离差绝对值和
(1 )(yt X βˆ ( ) )
( yt X βˆ ( ) )
uˆ( )t 0
uˆ( )t 0
t:yt X ˆ( )
t:yt X ˆ( )
其中 uˆ( )t 表示第分位数回归方程的残差。(0, 1)。第分位数的回归方程表达式是
yˆ ( )t = X t βˆ( )
其中 X t,都是 k1 阶列向量。 βˆ( ) 称作分位数回归系数估计量,或最小绝对离差 和估计量,估计方法称作最小绝对离差和估计法。
a
a
E( yt ) = -
(y Biblioteka Baidu f (y) dy
(y ) f (y)dy = -
f (y)d y
f ( y)dy
-
-
= dF( y) - dF( y) = F ( ) -[1- dF( y)] F ( ) - (1- F ( )) 2F ( ) -1
-
-
式(1)求极小的一阶条件是 E( yt ) = 0,即 2F() -1 =0, F() 0.5 。这意味着等于中位数
证明: E( y ) = -
(y ) f (y)dy
(y ) f (y)dy
-
(1)
根据莱布尼兹公式,若 F ( ) b f ( y, )dy ,则有 F ( ) bf ( y, )dy 。
a
a
令 f (y,) y - ,则有 F ( )
b(y -)dy -
b
dy
。运用于式(1),得
相关文档
最新文档