2.4 分位数回归估计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 例:软件EVIEWS6.0使用手册中实例的斜率相等性检验 结果,其中Y为家庭食物消费支出,X为家庭收入。
Quantile Slope Equality Test Equation: EQ1 Specification: Y C X Test Summary Wald Test Restriction Detail: b(tau_h) - b(tau_k) = 0 Quantiles 0.25, 0.5 0.5, 0.75 Variable X Restr. Value -0.086077 -0.083834 Std. Error 0.025923 0.030529 Prob. 0.0009 0.0060 Chi-Sq. Statistic 25.22366 Chi-Sq. d.f. 2 Prob. 0.0000
n
i
i
i
• 凡是连续随机变量作为被解释变量的计量经济学 模型,都可以进行分位数回归估计。
三、分位数回归的假设检验
• 分位数回归估计的检验包括两部分:
– 一是与均值回归类似的检验,例如拟合优度检验、约 束回归检验等; – 一是分位数回归估计特殊要求的检验,例如斜率相等 检验和斜率对称性检验等。
i 1,, k
• 如果接受斜率相等性假设,就不必进行斜率对称性检验。 • 如果拒绝斜率相等性假设,则可以进一步进行斜率对称性 检验,若接受原假设,则认为斜率具有对称性,否则,则 认为斜率不具有对称性。
• 例:软件EVIEWS6.0使用手册中实例的斜率对称性检验 结果,其中Y为家庭食物消费支出,X为家庭收入。
– 当数据出现尖峰或厚尾的分布、存在显著的异方差等 情况,最小二乘法估计将不再具有优良性质,且稳健 性非常差。分位数回归系数估计比OLS估计更稳健。 – 最小二乘估计假定解释变量只能影响被解释变量的条 件分布的均值位置,不能影响其分布的刻度或形状的 任何其他方面。而分位数回归估计能精确地描述解释 变量对于被解释变量的变化范围以及条件分布形状的 影响。
i t i
• 将分位数回归应用于归并数据(Censoring Data),构造归并数据分位数回归模型:
Yi max(0, Xi β i ), i 1, 2,, n
对应的“归并”数据分位数回归参数估计 为: ˆ β( ) arg min{ 1 ( )(Y max(0, X β( ))}
二、分位数回归及其估计
1、分位数回归原理
F (y )=Prob(Y y ) Q( )=inf{y:F (y ) }
假定随机变量y的概率分布函数 定义y的θ分位数 给定y的n个观测值,相对应的 分位数 等价地转化为求一个最优化问题
Qn ( )=inf{y:Fn (y ) }
• 实例1
– Koenker和Machado(1999)分析了1965~1975以及 1975~1985两段时间内世界主要国家的经济增长情况。 模型选取了13个影响经济增长的解释变量。 – 通过分位数回归得出结论:对于初始单位资本产出这 一解释变量,它的全部回归分位系数基本保持不变, 这就意味着对于经济发展迅速与缓慢的国家而言,初 始单位资本产出对于经济增长的影响基本相同; – 教育支出占GDP的比重以及公共消费占GDP的比重这 两个解释变量对于经济发展缓慢的国家影响更加强烈。
3、分位数回归的扩展
• 如果被解释变量的条件密度非同质,可以采用加 权的方法提高分位数回归估计的效率,权重与某 概率水平下的局部样本密度成比例。 • 加权分位数回归估计为:
β n ( )=argmin ( ) { fi (i ) (Yi Xiβ( ))}
i
• 将分位数回归应用Panel Data,构造Panel Data 分位数பைடு நூலகம்归模型。对于固定效应变截距Panel Data模型:
i 1,, k
• 如果接受该假设,说明每个斜率对于不同分位点具 有不变性,此时,应该采用普通最小二乘估计;如 果拒绝该假设,说明模型应该采用分位数回归估计, 以反映每个斜率在不同分位点的不同值。
• 斜率相等检验可以通过约束回归检验实现。原假设 相当于对分位数回归估计施加了个约束(斜率中不 包括常数项)。 • 应用软件中给出了一些相应的检验统计量,例如, EVIEWS6.0中的Wald统计量可以实现该约束检验。
Wald统计 量为0.53, 应该不拒 绝斜率在 tau=0.25 和0.75对 称的假设。
四、实例
Wald统计量 为25.22, 应该拒绝斜 率在 tau=0.25、 0.5和0.75相 等性的假设, 即斜率在不 同分位点上 的值是不同 的。
4、斜率对称性检验
• 斜率对称性检验,即检验对于给定的X,Y的分布 是否是对称的。 • 原假设被设定为:
H 0 :i ( )+i (1- )=2i (1/ 2)
Qn ( )=argmin { | Yi |
i:Yi
i:Yi
(1 ) | Y |}=argmin { (Y )}
i i i
分位数回归是对如上简单形式的扩展。
如果Y的条件分位数由k个解释变量X线性组合表示,即Y 的θ条件分位数被定义为:
• 实例2
– Chen(2004)使用分位数回归方法研究了美国8250名男 性的BMI(身体质量指数,一种广泛用于测量偏胖还 是偏瘦的指标)情况,并得出结论: • 在2~20岁这一快速成长期中,BMI迅速增加; • 在中年期间BMI值保持比较稳定;
• 60岁以后,BMI的值开始减少。
• 分位数回归估计与经典模型的最小二乘估计相比 较,有许多优点。
1、拟合优度检验
• 分位数回归估计拟合优度检验统计量(Machado 拟合优度 )为:
ˆ V ( ) R ( ) 1 V ( )
1
i
该统计量越大,说明拟合效果越好
ˆ V( )=min ( ) (Yi Xiβ( ))
最小化θ分位数回归的 目标函数 回归方程中不包含任何解释变 量,只包含常数项情况下最小 化θ分位数回归的目标函数
§2.4 分位数回归估计 Quantile Regression,QR
一、分位数回归的提出 二、分位数回归及其估计 三、分位数回归的假设检验 四、实例
一、分位数回归的提出
• 分位数回归由Koenker Roger和Bassett Gilbert Jr于1978年提出
– 利用解释变量和被解释变量的条件分位数进行建模, 试图揭示解释变量对被解释本来分布的位置、刻度和 形状的影响。 – 经典回归模型称为均值回归。建立了被解释变量的条 件均值与解释变量之间的关系。
有约束情况下 最小化θ分位 数回归的目标 函数值 无约束情况下 最小化θ分位 数回归的目标 函数值
约束的数目
稀疏度
3、斜率相等检验
• 斜率相等检验,即检验对于不同的分位点,估计 得到的结构参数(在线性模型中即为斜率)是否 相等。
• 原假设被设定为:
H 0 :i (1 )=i (2 )=...=i ( p )
Yit i Xit β it i 1,, n t 1,, T
对应的Panel Data分位数回归参数估计为:
ˆ ˆ ( ( ), β ( ))=argmin ( ), ( ) { (Yit i ( ) Xitβ( )) i ( ) }
Q( | Xi ,β( ))=Xiβ( )
分位数回归参数估计量为
β n ( )=argmin ( ) { (Yi Xiβ( ))}
i
2、分位数回归估计方法
• 参数估计方法有两类:
– 一类是直接优化方法,例如单纯形法、内点法等; – 一类是参数化方法,例如结合MCMC(Markov Chain Monte Carlo)的贝叶斯估计方法。 – 常用的计量经济和统计软件都可以实现对分位数回归模 型的估计和假设检验,如stata、sas、r、eviews等。
普通最小二乘估计 基本思想 目的 原理 算法 前提假设 假设要求 检验类型 承载信息 极端值 异方差 拟合曲线 计算方法
分位数回归估计
设法使所构建的方程和样本之间的距 同普通最小二乘估计方法 离最短 借助数学模型对客观世界所存在的事 同普通最小二乘估计方法 物间的不确定关系进行数量化描写 以平均数为基准,求解最短距离 最小二乘法 独立、正态、同方差 强假设 参数检验 描述平均的总体信息 无法考虑极端值的影响 影响大 只能拟合一条曲线 求偏导解行列式,算法完备 以不同的分位数为基准,求解最 短距离 加权最小一乘法 独立 弱假设 非参数检验 充分体现整个分布的各部分信息 可以充分考虑极端值的影响 影响小 可以拟合一簇曲线 自助方法估计标准误差,多种算 法求解目标函数
V( )=min 0 ( ) (Yi 0 ( ))
i
2、约束回归检验
• 分位数回归约束回归检验似然比统计量,采用无 约束和有约束情况下最小化θ分位数回归的目标函 数值构造。
ˆ 2(V ( ) V ( )) LR ( ) ~ 2 (q) (1 ) s ( )
Symmetric Quantiles Test Equation: EQ1 Specification: Y C X Test statistic compares all coefficients Test Summary Wald Test Quantiles 0.25, 0.75 Variable C X Restriction Detail: b(tau) + b(1-tau) - 2*b(.5) = 0 Restr. Value -5.084370 -0.002244 Std. Error 34.59898 0.045012 Prob. 0.8832 0.9602 Chi-Sq. Statistic 0.530024 Chi-Sq. d.f. 2 Prob. 0.7672