2.4 分位数回归估计-高级应用计量经济学课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 一类是直接优化方法,例如单纯形法、内点法等; – 一类是参数化方法,例如结合MCMC(Markov Chain
Monte Carlo)的贝叶斯估计方法。 – 常用的计量经济和统计软件都可以实现对分位数回归模
型的估计和假设检验,如stata、sas、r、eviews等。
3、分位数回归的扩展
• 如果被解释变量的条件密度非同质,可以采用加 权的方法提高分位数回归估计的效率,权重与某 概率水平下的局部样本密度成比例。
1、拟合优度检验
• 分位数回归估计拟合优度检验统计量(Machado 拟合优度 )为:
R1
(
)
1
Vˆ ( V%(
) )
该统计量越大,说明拟合效果越好
Vˆ ( )=min ( ) (Yi Xiβ( )) i
V%( )=min 0 ( ) (Yi 0 ( ))
i
最小化θ分位数回归的 目标函数
i:Yi
i:Yi
i
分位数回归是对如上简单形式的扩展。
如果Y的条件分位数由k个解释变量X线性组合表示,即Y 的θ条件分位数被定义为:
Q( | Xi ,β( ))=Xiβ( )
分位数回归参数估计量为
βn ( )=argmin ( ){ (Yi Xiβ( ))} i
2、分位数回归估计方法
• 参数估计方法有两类:
• 斜率相等检验可以通过约束回归检验实现。原假设 相当于对分位数回归估计施加了个约束(斜率中不 包括常数项)。
• 应用软件中给出了一些相应的检验统计量,例如, EVIEWS6.0中的Wald统计量可以实现该约束检验。
• 例:软件EVIEWS6.0使用手册中实例的斜率相等性检验 结果,其中Y为家庭食物消费支出,X为家庭收入。
• 在中年期间BMI值保持比较稳定;
• 60岁以后,BMI的值开始减少。
• 分位数回归估计与经典模型的最小二乘估计相比 较,有许多优点。
– 当数据出现尖峰或厚尾的分布、存在显著的异方差等 情况,最小二乘法估计将不再具有优良性质,且稳健 性非常差。分位数回归系数估计比OLS估计更稳健。
– 最小二乘估计假定解释变量只能影响被解释变量的条 件分布的均值位置,不能影响其分布的刻度或形状的 任何其他方面。而分位数回归估计能精确地描述解释 变量对于被解释变量的变化范围以及条件分布形状的 影响。
Variable
Restr. Value
0.25, 0.5
X
-0.086077
0.5, 0.75
-0.083834
Chi-Sq. d.f. 2
Std. Error 0.025923 0.030529
Prob. 0.0000
Prob. 0.0009 0.0060
Wald统计量 为25.22, 应该拒绝斜
§2.4 分位数回归估计 Quantile Regression,QR
一、分位数回归的提出 二、分位数回归及其估计 三、分位数回归的假设检验 四、实例
一、分位数回归的提出
• 分位数回归由Koenker Roger和Bassett Gilbert Jr于1978年提出
– 利用解释变量和被解释变量的条件分位数进行建模, 试图揭示解释变量对被解释本来分布的位置、刻度和 形状的影响。
Quantile Slope Equality Test
Equation: EQ1
Specification: Y C X
Chi-Sq.
Test Summary
Statistic
Wald Test
25.22366
Restriction Detail: b(tau_h) - b(tau_k) = 0
Quantiles
函数值
稀疏度
无约束情况下 最小化θ分位 数回归的目标
函数值
约束的数目
3、斜率相等检验
• 斜率相等检验,即检验对于不同的分位点,估计 得到的结构参数(在线性模型中即为斜率)是否 相等。
• 原假设被设定为:
H0:i (1)=i (2 )=...=i ( p ) i 1,L , k
• 如果接受该假设,说明每个斜率对于不同分位点具 有不变性,此时,应该采用普通最小二乘估计;如 果拒绝该假设,说明模型应该采用分位数回归估计, 以反映每个斜率在不同分位点的不同值。
率在 tau=0.25、 0.5和0.75相 等性的假设, 即斜率在不 同分位点上 的值是不同
的。
4、斜率对称性检验
• 斜率对称性检验,即检验对于给定的X,Y的分布 是否是对称的。
• 原假设被设定为:
H0:i ( )+i (1- )=2i (1/ 2) i 1,L , k
• 如果接受斜率相等性假设,就不必进行斜率对称性检验。 • 如果拒绝斜率相等性假设,则可以进一步进行斜率对称性 检验,若接受原假设,则认为斜率具有对称性,否则,则 认为斜率不具有对称性。
F(y)=Prob(Y y)
假定随机变量y的概率分布函数
Q( )=inf{y:F(y) }
定义y的θ分位数
Qn ( )=inf{y:Fn (y) }
给定y的n个观测值,相对应的 分位数
等价地转化为求一个最优化问题
Qn()=argmin{ |Yi | (1) |Yi |}=argmin{ (Yi )}
– 教育支出占GDP的比重以及公共消费占GDP的比重这 两个解释变量对于经济发展缓慢的国家影响更加强烈。
• 实例2
– Chen(2004)使用分位数回归方法研究了美国8250名男 性的BMI(身体质量指数,一种广泛用于测量偏胖还 是偏瘦的指标)情况,并得出结论:
• 在2~20岁这一快速成长期中,BMI迅速增加;
基本思想
目的
原理
算法 前提假设 假设要求 检验类型 承载信息 极端值 异方差 拟合曲线 计算方法
普通最小二乘估计 设法使所构建的方程和样本之间的距 离最短 借助数学模型对客观世界所存在的事 物间的不确定关系进行数量化描写 以平均数为基准,求解最短距离
最小二乘法 独立、正态、同方差 强假设 参数检验 描述平均的总体信息 无法考虑极端值的影响 影响大 只能拟合一条曲线 求偏导解行列式,算法完备
Chi-Sq. d.f. 2
Std. Error 34.59898 0.045012
Prob. 0.7672
Prob. 0.8832 0.9602
Wald统计 量为0.53, 应该不拒 绝斜率在
tau=0.25 和0.75对 称的假设。
四、实例
分位数回归估计 同普通最小二乘估计方法
同普通最小二乘估计方法
以不同的分位数为基准,求解最 短距离 加权最小一乘法 独立 弱假设 非参数检验 充分体现整个分布的各部分信息 可以充分考虑极端值的影响 影响小 可以拟合一簇曲线 自助方法估计标准误差,多种算 法求解目标函数
二、分位数回归及其估计
1、分位数回归原理
• 加权分位数回归估计为:
βn ( )=argmin ( ){ fi (i ) (Yi Xiβ( ))} i
• 将分位数回归应用Panel Data,构造Panel Data 分位数回归模型。对于固定效应变截距Panel Data模型:
Yit i Xitβ it i 1, , n t 1, ,T
Chi-Sq.
Test Summary
Statistic
Wald Test
0.530024
Restriction Detail: b(tau) + b(1-tau) - 2*b(.5) = 0
Quantiles
Biblioteka Baidu
Variable
Restr. Value
0.25, 0.75
C
-5.084370
X
-0.002244
βˆ( ) arg min{1n ( )(Yi max(0, Xiβ( ))}
i
• 凡是连续随机变量作为被解释变量的计量经济学 模型,都可以进行分位数回归估计。
三、分位数回归的假设检验
• 分位数回归估计的检验包括两部分:
– 一是与均值回归类似的检验,例如拟合优度检验、约 束回归检验等;
– 一是分位数回归估计特殊要求的检验,例如斜率相等 检验和斜率对称性检验等。
回归方程中不包含任何解释变 量,只包含常数项情况下最小
化θ分位数回归的目标函数
2、约束回归检验
• 分位数回归约束回归检验似然比统计量,采用无 约束和有约束情况下最小化θ分位数回归的目标函 数值构造。
LR( ) 2(V%( ) Vˆ( )) ~ 2 (q) (1 )s( )
有约束情况下 最小化θ分位 数回归的目标
– 经典回归模型称为均值回归。建立了被解释变量的条 件均值与解释变量之间的关系。
• 实例1
– Koenker和Machado(1999)分析了1965~1975以及 1975~1985两段时间内世界主要国家的经济增长情况。 模型选取了13个影响经济增长的解释变量。
– 通过分位数回归得出结论:对于初始单位资本产出这 一解释变量,它的全部回归分位系数基本保持不变, 这就意味着对于经济发展迅速与缓慢的国家而言,初 始单位资本产出对于经济增长的影响基本相同;
对应的Panel Data分位数回归参数估计为:
(ˆ ( ), βˆ ( ))=argmin ( ), ( ){
(Yit i ( ) Xitβ( )) i ( ) }
it
i
• 将分位数回归应用于归并数据(Censoring Data),构造归并数据分位数回归模型:
Yi max(0, Xiβ i ), i 1, 2,L , n 对应的“归并”数据分位数回归参数估计 为:
• 例:软件EVIEWS6.0使用手册中实例的斜率对称性检验 结果,其中Y为家庭食物消费支出,X为家庭收入。
Symmetric Quantiles Test
Equation: EQ1
Specification: Y C X
Test statistic compares all coefficients
Monte Carlo)的贝叶斯估计方法。 – 常用的计量经济和统计软件都可以实现对分位数回归模
型的估计和假设检验,如stata、sas、r、eviews等。
3、分位数回归的扩展
• 如果被解释变量的条件密度非同质,可以采用加 权的方法提高分位数回归估计的效率,权重与某 概率水平下的局部样本密度成比例。
1、拟合优度检验
• 分位数回归估计拟合优度检验统计量(Machado 拟合优度 )为:
R1
(
)
1
Vˆ ( V%(
) )
该统计量越大,说明拟合效果越好
Vˆ ( )=min ( ) (Yi Xiβ( )) i
V%( )=min 0 ( ) (Yi 0 ( ))
i
最小化θ分位数回归的 目标函数
i:Yi
i:Yi
i
分位数回归是对如上简单形式的扩展。
如果Y的条件分位数由k个解释变量X线性组合表示,即Y 的θ条件分位数被定义为:
Q( | Xi ,β( ))=Xiβ( )
分位数回归参数估计量为
βn ( )=argmin ( ){ (Yi Xiβ( ))} i
2、分位数回归估计方法
• 参数估计方法有两类:
• 斜率相等检验可以通过约束回归检验实现。原假设 相当于对分位数回归估计施加了个约束(斜率中不 包括常数项)。
• 应用软件中给出了一些相应的检验统计量,例如, EVIEWS6.0中的Wald统计量可以实现该约束检验。
• 例:软件EVIEWS6.0使用手册中实例的斜率相等性检验 结果,其中Y为家庭食物消费支出,X为家庭收入。
• 在中年期间BMI值保持比较稳定;
• 60岁以后,BMI的值开始减少。
• 分位数回归估计与经典模型的最小二乘估计相比 较,有许多优点。
– 当数据出现尖峰或厚尾的分布、存在显著的异方差等 情况,最小二乘法估计将不再具有优良性质,且稳健 性非常差。分位数回归系数估计比OLS估计更稳健。
– 最小二乘估计假定解释变量只能影响被解释变量的条 件分布的均值位置,不能影响其分布的刻度或形状的 任何其他方面。而分位数回归估计能精确地描述解释 变量对于被解释变量的变化范围以及条件分布形状的 影响。
Variable
Restr. Value
0.25, 0.5
X
-0.086077
0.5, 0.75
-0.083834
Chi-Sq. d.f. 2
Std. Error 0.025923 0.030529
Prob. 0.0000
Prob. 0.0009 0.0060
Wald统计量 为25.22, 应该拒绝斜
§2.4 分位数回归估计 Quantile Regression,QR
一、分位数回归的提出 二、分位数回归及其估计 三、分位数回归的假设检验 四、实例
一、分位数回归的提出
• 分位数回归由Koenker Roger和Bassett Gilbert Jr于1978年提出
– 利用解释变量和被解释变量的条件分位数进行建模, 试图揭示解释变量对被解释本来分布的位置、刻度和 形状的影响。
Quantile Slope Equality Test
Equation: EQ1
Specification: Y C X
Chi-Sq.
Test Summary
Statistic
Wald Test
25.22366
Restriction Detail: b(tau_h) - b(tau_k) = 0
Quantiles
函数值
稀疏度
无约束情况下 最小化θ分位 数回归的目标
函数值
约束的数目
3、斜率相等检验
• 斜率相等检验,即检验对于不同的分位点,估计 得到的结构参数(在线性模型中即为斜率)是否 相等。
• 原假设被设定为:
H0:i (1)=i (2 )=...=i ( p ) i 1,L , k
• 如果接受该假设,说明每个斜率对于不同分位点具 有不变性,此时,应该采用普通最小二乘估计;如 果拒绝该假设,说明模型应该采用分位数回归估计, 以反映每个斜率在不同分位点的不同值。
率在 tau=0.25、 0.5和0.75相 等性的假设, 即斜率在不 同分位点上 的值是不同
的。
4、斜率对称性检验
• 斜率对称性检验,即检验对于给定的X,Y的分布 是否是对称的。
• 原假设被设定为:
H0:i ( )+i (1- )=2i (1/ 2) i 1,L , k
• 如果接受斜率相等性假设,就不必进行斜率对称性检验。 • 如果拒绝斜率相等性假设,则可以进一步进行斜率对称性 检验,若接受原假设,则认为斜率具有对称性,否则,则 认为斜率不具有对称性。
F(y)=Prob(Y y)
假定随机变量y的概率分布函数
Q( )=inf{y:F(y) }
定义y的θ分位数
Qn ( )=inf{y:Fn (y) }
给定y的n个观测值,相对应的 分位数
等价地转化为求一个最优化问题
Qn()=argmin{ |Yi | (1) |Yi |}=argmin{ (Yi )}
– 教育支出占GDP的比重以及公共消费占GDP的比重这 两个解释变量对于经济发展缓慢的国家影响更加强烈。
• 实例2
– Chen(2004)使用分位数回归方法研究了美国8250名男 性的BMI(身体质量指数,一种广泛用于测量偏胖还 是偏瘦的指标)情况,并得出结论:
• 在2~20岁这一快速成长期中,BMI迅速增加;
基本思想
目的
原理
算法 前提假设 假设要求 检验类型 承载信息 极端值 异方差 拟合曲线 计算方法
普通最小二乘估计 设法使所构建的方程和样本之间的距 离最短 借助数学模型对客观世界所存在的事 物间的不确定关系进行数量化描写 以平均数为基准,求解最短距离
最小二乘法 独立、正态、同方差 强假设 参数检验 描述平均的总体信息 无法考虑极端值的影响 影响大 只能拟合一条曲线 求偏导解行列式,算法完备
Chi-Sq. d.f. 2
Std. Error 34.59898 0.045012
Prob. 0.7672
Prob. 0.8832 0.9602
Wald统计 量为0.53, 应该不拒 绝斜率在
tau=0.25 和0.75对 称的假设。
四、实例
分位数回归估计 同普通最小二乘估计方法
同普通最小二乘估计方法
以不同的分位数为基准,求解最 短距离 加权最小一乘法 独立 弱假设 非参数检验 充分体现整个分布的各部分信息 可以充分考虑极端值的影响 影响小 可以拟合一簇曲线 自助方法估计标准误差,多种算 法求解目标函数
二、分位数回归及其估计
1、分位数回归原理
• 加权分位数回归估计为:
βn ( )=argmin ( ){ fi (i ) (Yi Xiβ( ))} i
• 将分位数回归应用Panel Data,构造Panel Data 分位数回归模型。对于固定效应变截距Panel Data模型:
Yit i Xitβ it i 1, , n t 1, ,T
Chi-Sq.
Test Summary
Statistic
Wald Test
0.530024
Restriction Detail: b(tau) + b(1-tau) - 2*b(.5) = 0
Quantiles
Biblioteka Baidu
Variable
Restr. Value
0.25, 0.75
C
-5.084370
X
-0.002244
βˆ( ) arg min{1n ( )(Yi max(0, Xiβ( ))}
i
• 凡是连续随机变量作为被解释变量的计量经济学 模型,都可以进行分位数回归估计。
三、分位数回归的假设检验
• 分位数回归估计的检验包括两部分:
– 一是与均值回归类似的检验,例如拟合优度检验、约 束回归检验等;
– 一是分位数回归估计特殊要求的检验,例如斜率相等 检验和斜率对称性检验等。
回归方程中不包含任何解释变 量,只包含常数项情况下最小
化θ分位数回归的目标函数
2、约束回归检验
• 分位数回归约束回归检验似然比统计量,采用无 约束和有约束情况下最小化θ分位数回归的目标函 数值构造。
LR( ) 2(V%( ) Vˆ( )) ~ 2 (q) (1 )s( )
有约束情况下 最小化θ分位 数回归的目标
– 经典回归模型称为均值回归。建立了被解释变量的条 件均值与解释变量之间的关系。
• 实例1
– Koenker和Machado(1999)分析了1965~1975以及 1975~1985两段时间内世界主要国家的经济增长情况。 模型选取了13个影响经济增长的解释变量。
– 通过分位数回归得出结论:对于初始单位资本产出这 一解释变量,它的全部回归分位系数基本保持不变, 这就意味着对于经济发展迅速与缓慢的国家而言,初 始单位资本产出对于经济增长的影响基本相同;
对应的Panel Data分位数回归参数估计为:
(ˆ ( ), βˆ ( ))=argmin ( ), ( ){
(Yit i ( ) Xitβ( )) i ( ) }
it
i
• 将分位数回归应用于归并数据(Censoring Data),构造归并数据分位数回归模型:
Yi max(0, Xiβ i ), i 1, 2,L , n 对应的“归并”数据分位数回归参数估计 为:
• 例:软件EVIEWS6.0使用手册中实例的斜率对称性检验 结果,其中Y为家庭食物消费支出,X为家庭收入。
Symmetric Quantiles Test
Equation: EQ1
Specification: Y C X
Test statistic compares all coefficients