固定效应的分位数回归估计--经典
分位数回归及其实例
分位数回归及其实例
一、分位数回归的概念
分位数回归(Quantile Regression):是计量经济学的研究前沿方向之一,它利用解释变量的多个分位数(例如四分位、十分位、百分位等)来得到被解释变量的条件分布的相应的分位数方程。与传统的OLS 只得到均值方程相比,它可以更详细地描述变量的统计分布。
传统的线性回归模型描述了因变量的条件分布受到自变量X 的影响过程。普通最dx--乘法是估计回归系数的最基本的方法,它描述了自变量X 对于因变量y 的均值影响。如果模型中的随机扰动项来自均值为零而且同方差的分布,那么回归系数的最dx--乘估计为最佳线性无偏估计(BLUE);如果近一步随机扰动项服从正态分布,那么回归系数的最dx--乘法或极大似然估计为最小方差无偏估计(M Ⅵ甩)。但是在实际的经济生活中,这种假设常常不被满足,饲如数据出现尖峰或厚尾的分布、存在显著的异方差等情况,这时的最小二乘法估计将不再具有上述优良性且稳健性非常差。最小二乘回归假定自变量X 只能影响因变量的条件分布的位置,但不能影响其分布的刻度或形状的任何其他方面。
为了弥补普通最dx--乘法(0Ls)在回归分析中的缺陷,Koenkel"和Pxassett 于1978年提出了分位数回归(Quantile Regression)的思想。它依据因变量的条件分位数对自变量X 进行回归,这样得到了所有分位数下的回归模型。因此分位数回归相比普通最小二乘回归只能描述自变量X 对于因变量y 局部变化的影响而言,更能精确地描述自变量X 对于因变量y 的变化范围以及条件分布形状的影响。
分位数回归分位点的选取
分位数回归分位点的选取
分位数回归是一种统计方法,用于回答关于分位点的问题。在分位数
回归中,我们旨在找到与给定分位点相关的协变量的效应。分位点是
指将数据集划分为等份的数值点。
在分位数回归中,选择分位点是非常重要的。一般来说,我们可以选
择多个分位点来了解在不同位置的分位点上,协变量的效应如何变化。常见的分位点包括四分位数(25th、50th和75th),甚至可以选择其
他更高或更低的分位点。
为了选择适当的分位点,我们可以考虑以下几个因素:
1. 研究的目的:根据研究的目的,我们可以选择与我们关心的分位点
相关的协变量。例如,如果我们想了解低收入家庭的影响因素,可能
要选择较低的分位点。
2. 数据分布:我们需要考虑数据的分布情况。如果数据集的分布是偏
斜的,我们可能需要选择更多的分位点来覆盖数据的整个范围。
3. 统计稳定性:为了获得稳健的估计结果,我们可以选择稳定的分位点,这些分位点在样本量较小时也能给出合理的结果。
除了直观选择分位点外,还可以使用一些统计方法来确定分位点的选择,例如分位数的分布图和留一交叉验证等。
总之,选择适当的分位点对于分位数回归的结果非常重要。通过考虑
研究目的、数据分布和统计稳定性等因素,可以帮助我们确定合适的
分位点,从而获得准确和有意义的回归结果。
分位数模型回归分析
分位数模型回归分析
分位数是描述数据分布特征的重要指标,它不同于平均数和中位数,是以一定的百分比为界限,将数据分为等量的小组内容,并计算每一组内容的平均值而被定义出来的。分位数可以快速、全面地描述数据分布特征,是定量分析研究中一个重要的理论工具,在金融、心理学等多个学科都有广泛的应用。
分位数模型回归分析(Quantile Regression)是基于分位数理论而发展起来的,它是一种包含变量的统计回归方法,基本思想是用若干统计模型的参数估计来识别数据的分布特征,以达到更好的描述数据的目的。它的优势在于可以拟合出更加完整的数据分布情况,更有利于我们对数据的解读。
二、分位数模型回归分析的基本原理
分位数模型回归分析是一种用来估计量化分布情况的统计回归方法,基本方法是以特定的分位数来定义变量的分布,然后根据观测数据分布的特征和回归解释变量,来进行参数估计。它同样采用最小二乘法求得拟合参数,但与其他的最小二乘法不同的是,它是将数据根据分位数分为等量的小组内容后,考虑每组中的变量均值进行回归分析,而非只考虑全部数据的拟合情况,从而完善拟合结果。
分位数模型回归分析一般分为两个步骤:首先,根据先观察到的分位数和观测数据分布情况,定义回归模型参数;然后,根据观测数据拟合参数,完成分位数模型回归分析。
三、应用
分位数模型回归分析的应用已经广泛,主要在金融学、心理学、市场营销、社会学等领域,都有不同程度的使用。
1.融领域:在金融分析中,分位数模型回归分析可以用来确定数据的分布特征,从而实现对金融风险的评估和管理,并有助于金融机构获取更多有价值的信息。
分位数回归模型及其应用研究
分位数回归模型及其应
用研究
The manuscript was revised on the evening of 2021
第一组计量经济学理论与方法
分位数回归模型及其应用研究
王桂胜1
(首都经济贸易大学,北京,100026)
摘要:本文在对分位数回归方法的含义和基本原理进行全面分析说明的基础上,对分位数回归方法在PANEL DATA模型中的应用作了深入分析,并对不同回归估计方法在PANEL DATA模型中的估计效果进行了比较分析。在此基础上,通过分别采取一般最小平方法和分位数回归法对中国15省区的人均消费和人均收入的回归方程估计的统计结果比较,发现分位数回归方法在进行某些特殊的PANEL DATA模型估计时具有一定的优势。
关键词:分位数回归、面板数据模型、惩罚分位数回归估计
一、分位数回归研究介绍
自Koenker 和 Bassett (1978)提出线性分位数回归理论以来,分位数回归(QR)即成为近几十年来发展较快、应用广泛的回归模型方法,它不仅深化了对传统回归模型的理解,而且也推广了回归模型的类型和应用,使得回归模型拟合有关统计数据更加准确细致。分位数回归模型是在稳健估计模型基础上发展形成。稳健估计(Robust Estimation)理论包括基于一般凸损失函数的M 估计理论、基于样本秩统计量的R估计理论和基于样本次序统计量的L估计理论1王桂胜:男,1970年生,首都经济贸易大学劳动经济学院副教授,清华大学经管学院博士生。
等。分位数回归强调以解释变量的分位数来估计推断因变量的分位数,通过建
面板分位数回归stata命令
面板分位数回归stata命令
面板分位数回归是一种广泛使用的统计方法,它可以用于探究面板数据中的因变量和自变量之间的非线性关系。Stata软件也提供了一种方便的命令来执行面板分位数回归分析,即xtqreg命令。
xtqreg命令的基本语法如下:
xtqreg depvar indepvars, q(qnum) fe/ re/ be (fixed/ random/ between) cluster(cluster_variable)
其中,depvar是因变量名称,indepvars是自变量名称(多个自变量之间用空格隔开),qnum是分位数的位置(例如q(0.1)代表求解10%位数),fe/re/be是固定效应、随机效应和区间效应的类型(默认为固定效应),cluster_variable是聚类变量名称(用于处理面板带有聚类的数据)。
除了基本语法之外,还有一些可选参数可以根据具体需要进行设置,例如nquantiles(分位数数量)、robust(健壮标准误)等。
在使用xtqreg命令进行面板分位数回归分析时,需要先检验自变量和因变量之间的关系是否存在非线性效应,一种常用的方法是绘制自变量和因变量的散点图并进行观察。如果存在非线性效应,则可以考虑使用xtqreg命令进行拟合,进一步研究二者的关系。
总的来说,xtqreg命令是一种方便且实用的工具,可用于处理面板数据中的非线性关系问题。
【实证方法】分位数回归(QuantileRegression)
【实证方法】分位数回归(QuantileRegression)
以前的回归分析中,主要考察解释变量x对被解释变量y的条件均值E(y|x)的影响,此种方式属于均值回归。但是我们主要关心的是x对整个条件分布的y|x的影响,条件均值E(y|x)只是刻画了条件分布y|x的集中趋势的一个指标而已。如果能够估计条件分布的重要重要条件分位数,如中位数、1/4分位数、3/4分位数,则可以对y|x得到全面的认识。同时传统的条件均值回归分析,容易受到极端值的影响。所以提出分位数回归,分位数回归采用残差加权平均作为最小化的目标函数,不容易受到极端值的影响,结果相对较为稳健,同时分位数回归还提供了关于条件分布y|x的全面信息。
Stata命令
分位数回归相关的命令:
(1)只做一个分位数回归
qreg y x1 x2 x3(默认中位数回归)
qreg y x1 x2 x3,q() (分位数回归)
(2)使用自助法,只做一个分位数回归
Set seed 10101
Bsqreg y x1 x2 x3,q() reps()
(3)使用自助法,做多个分位数回归
Sqreg y x1 x2 x3,q(0.1 0.5 0.9) reps()
检验系数是否相等
Test [q10=q50=q90]:x1 (4)图形比较
安装grqreg命令
Set seed 10101
Bsqreg y x1 x2 x3,reps() q() Grqreg ,cons ci ols olsci
例证
分位数回归估计课件
05 分位数回归的未来发展
分位数回归的理论研究
01
深入研究分位数回归的理论基础,包括其假设、性 质和限制条件,以完善其理论体系。
02
探讨分位数回归与其他统计方法的结合,如混合模 型、贝叶斯方法等,以拓展其应用范围。
03
针对分位数回归的统计推断问题,研究更有效的推 断方法和理论。
$Y = Xbeta + epsilon$,其中$Y$是因变量,$X$是自变量,$beta$是待估 计的参数,$epsilon$是误差项。
非线性分位数回归模型
通过引入非线性函数或变换,使得模型能够更好地拟合非线性关系。
分位数回归的估计方法
最小二乘法
通过最小化残差平方和来估计参数。
迭代加权最小二乘法
。
针对具体问题,研究分 位数回归的定制化解决 方案,以满足不同领域
的特定需求。
结合机器学习和人工智 能技术,开发基于分位 数回归的预测和决策支
持系统。
THANKS 感谢观看
分位数回归的算法改进
01
优化分位数回归的算法,提高其计算效率和稳定性。
02
开发适用于大数据的分位数回归算法,以适应现代数据分析的
需求。
探索并行计算和分布式计算在分位数回归中的应用,以提高大
03
规模数据的处理能力。
2.4 分位数回归估计
• 将分位数回归应用于归并数据(Censoring Data),构造归并数据分位数回归模型:
Yi max(0, Xi β i ), i 1, 2,, n
对应的“归并”数据分位数回归参数估计 为: ˆ β( ) arg min{ 1 ( )(Y max(0, X β( ))}
Wald统计 量为0.53, 应该不拒 绝斜率在 tau=0.25 和0.75对 称的假设。
四、实例
i 1,, k
• 如果接受该假设,说明每个斜率对于不同分位点具 有不变性,此时,应该采用普通最小二乘估计;如 果拒绝该假设,说明模型应该采用分位数回归估计, 以反映每个斜率在不同分位点的不同值。
• 斜率相等检验可以通过约束回归检验实现。原假设 相当于对分位数回归估计施加了个约束(斜率中不 包括常数项)。 • 应用软件中给出了一些相应的检验统计量,例如, EVIEWS6.0中的Wald统计量可以实现该约束检验。
Yit i Xit β it i 1,, n t 1,, T
对应的Panel Data分位数回归参数估计为:
ˆ ˆ ( ( ), β ( ))=argmin ( ), ( ) { (Yit i ( ) Xitβ( )) i ( ) }
Wald统计量 为25.22, 应该拒绝斜 率在 tau=0.25、 0.5和0.75相 等性的假设, 即斜率在不 同分位点上 的值是不同 的。
分位数回归通俗理解
分位数回归通俗理解
分位数回归(Quantile Regression):是计量经济学的研究前沿方向之一,它利用解释变量的多个分位数(例如四分位、十分位、百分位等)来得到被解释变量的条件分布的相应的分位数方程。
与传统的OLS只得到均值方程相比,它可以更详细地描述变量的统计分布。传统的线性回归模型描述了因变量的条件分布
受到自变量X的影响过程。普通最dx--乘法是估计
回归系数的最基本的方法,它描述了自变量X对于
因变量y的均值影响。如果模型中的随机扰动项来
自均值为零而且同方差的分布,那么回归系数的最
dx--乘估计为最佳线性无偏估计(BLUE);如果近
一步随机扰动项服从正态分布,那么回归系数的最
dx--乘法或极大似然估计为最小方差无偏估计
(MⅥ甩)。但是在实际的经济生活中,这种假设常
常不被满足,饲如数据出现尖峰或厚尾的分布、存在
显著的异方差等情况,这时的最小二乘法估计将不
再具有上述优良性且稳健性非常差。最小二乘回归
假定自变量X只能影响因变量的条件分布的位置,
但不能影响其分布的刻度或形状的任何其他方面。
为了弥补普通最dx--乘法(0Ls)在回归分析中
的缺陷,Koenkel"和Pxassett于1978年提出了分位数
回归(Quantile Regression)的思想⋯。它依据因变
量的条件分位数对自变量X进行回归,这样得到了
所有分位数下的回归模型。因此分位数回归相比普
通最小二乘回归只能描述自变量X对于因变量y
局部变化的影响而言,更能精确地描述自变量X对
于因变量y的变化范围以及条件分布形状的影响。
分位数回归固定效应
分位数回归固定效应
分位数回归固定效应是一种常用的经济学数据分析方法,其主要用于研究不同分位数下的变量对因变量的影响。该方法主要通过建立一个多元回归模型,来探讨一个变量在不同分位数下对另一变量的影响。
在该方法中,固定效应是一种非常重要的处理方式,它可以消除个体间的差异性,使得时间不变量的影响得以消除。同时,分位数回归固定效应还可以用于研究分布特征不同的数据集,例如偏态数据和尾部厚重数据。
通过分位数回归固定效应的分析,我们可以更加准确地掌握变量之间的关系,为经济学研究提供更加有力的支持。
- 1 -
分位数回归及其实例
分位数回归及其实例
一、分位数回归的概念
分位数回归(Quantile Regression):是计量经济学的研究前沿方向之一,它利用解释变量的多个分位数(例如四分位、十分位、百分位等)来得到被解释变量的条件分布的相应的分位数方程。与传统的OLS 只得到均值方程相比,它可以更详细地描述变量的统计分布。
传统的线性回归模型描述了因变量的条件分布受到自变量X 的影响过程。普通最dx--乘法是估计回归系数的最基本的方法,它描述了自变量X 对于因变量y 的均值影响。如果模型中的随机扰动项来自均值为零而且同方差的分布,那么回归系数的最dx--乘估计为最佳线性无偏估计(BLUE);如果近一步随机扰动项服从正态分布,那么回归系数的最dx--乘法或极大似然估计为最小方差无偏估计(M Ⅵ甩)。但是在实际的经济生活中,这种假设常常不被满足,饲如数据出现尖峰或厚尾的分布、存在显著的异方差等情况,这时的最小二乘法估计将不再具有上述优良性且稳健性非常差。最小二乘回归假定自变量X 只能影响因变量的条件分布的位置,但不能影响其分布的刻度或形状的任何其他方面。
为了弥补普通最dx--乘法(0Ls)在回归分析中的缺陷,Koenkel"和Pxassett 于1978年提出了分位数回归(Quantile Regression)的思想。它依据因变量的条件分位数对自变量X 进行回归,这样得到了所有分位数下的回归模型。因此分位数回归相比普通最小二乘回归只能描述自变量X 对于因变量y 局部变化的影响而言,更能精确地描述自变量X 对于因变量y 的变化范围以及条件分布形状的影响。
分位数回归
分位数回归估计与经典模型的最小二乘估 计相比较,有许多优点。
当数据出现尖峰或厚尾的分布、存在显 著的异方差等情况,最小二乘估计将不再具 有优良性质,且稳健性非常差。分位数回归 系数估计结果比OLS估计更稳健,而且,分位 数回归对误差项并不要求很强的假设条件, 因此对于非正态分布而言,分位数回归系数 估计量则更加稳健。
普通最小二乘估计设法使所构建的方程和样本之间的距离最短借助数学模型对客观世界所存在的事物间的不确定关系进行数量化描写以平均数为基准求解最短距离分位数回归估计同普通最小二乘估计方法基本思想目的同普通最小二乘估计方法原理以不同的分位数为基准求解最短距文库手机文库文库手机文库加权最小一乘法独立独立弱假设非参数检验充分体现整个分布的各部分信息算法前提假设前提假设假设要求检验类型承载信息极端值异方差合曲线计算方法最小二乘法独立正态同方差独立正态同方差强假设数检验描述平均的总体信息无法考虑极端值的影响影响大只能拟合一条曲线求偏导解行列式算法完备可以充分考虑极端值的影响影响小可以拟合一簇曲自助方法估计标准误差多种算法求解目标函数二二二二分位数回归及其估计分位数回归及其估计分位数回归及其估计分位数回归及其估计损失函数损失函数
有约束模型似然函数值:
L(ˆ ,ˆ 2 ) L( , 2)
第29页,共38页。
似然比检验
• 显然 0。1 如果原假设是真,则λ趋近于1;如果
分位数面板门槛回归模型
分位数面板门槛回归模型
英文回答:
Quantile regression is a statistical technique that allows us to estimate the relationship between a set of independent variables and different quantiles of the dependent variable. It is particularly useful when the distribution of the dependent variable is not symmetric and we are interested in understanding how the relationship between the variables changes across different parts of the distribution.
Panel data refers to data that is collected over time on multiple individuals or entities. In the context of quantile regression, panel data can be used to estimate the quantile regression coefficients for each individual or entity over time.
2.4 分位数回归估计-高级应用计量经济学课件
Monte Carlo)的贝叶斯估计方法。 – 常用的计量经济和统计软件都可以实现对分位数回归模
型的估计和假设检验,如stata、sas、r、eviews等。
3、分位数回归的扩展
• 如果被解释变量的条件密度非同质,可以采用加 权的方法提高分位数回归估计的效率,权重与某 概率水平下的局部样本密度成比例。
1、拟合优度检验
• 分位数回归估计拟合优度检验统计量(Machado 拟合优度 )为:
R1
(
)
1
Vˆ ( V%(
) )
该统计量越大,说明拟合效果越好
Vˆ ( )=min ( ) (Yi Xiβ( )) i
V%( )=min 0 ( ) (Yi 0 ( ))
i
最小化θ分位数回归的 目标函数
i:Yi
i:Yi
i
分位数回归是对如上简单形式的扩展。
如果Y的条件分位数由k个解释变量X线性组合表示,即Y 的θ条件分位数被定义为:
Q( | Xi ,β( ))=Xiβ( )
分位数回归参数估计量为
βn ( )=argmin ( ){ (Yi Xiβ( ))} i
2、分位数回归估计方法
• 参数估计方法有两类:
• 斜率相等检验可以通过约束回归检验实现。原假设 相当于对分位数回归估计施加了个约束(斜率中不 包括常数项)。
分位数回归模型及其应用研究
第一组计量经济学理论与方法
分位数回归模型及其应用研究
王桂胜1
(首都经济贸易大学,北京,100026)
摘要:本文在对分位数回归方法的含义和基本原理进行全面分析说明的基础上,对分位数回归方法在PANEL DATA模型中的应用作了深入分析,并对不同回归估计方法在PANEL DATA模型中的估计效果进行了比较分析。在此基础上,通过分别采取一般最小平方法和分位数回归法对中国15省区的人均消费和人均收入的回归方程估计的统计结果比较,发现分位数回归方法在进行某些特殊的PANEL DATA模型估计时具有一定的优势。
关键词:分位数回归、面板数据模型、惩罚分位数回归估计
一、分位数回归研究介绍
自Koenker 和 Bassett (1978)提出线性分位数回归理论以来,分位数回归(QR)即成为近几十年来发展较快、应用广泛的回归模型方法,它不仅深化了对传统回归模型的理解,而且也推广了回归模型的类型和应用,使得回归模型拟合有关统计数据更加准确细致。分位数回归模型是在稳健估计模型基础上发展形成。稳健估计(Robust Estimation)理论包括基于一般凸损失函数的M 估计理论、基于样本秩统计量的R估计理论和基于样本次序统计量的L估计理论等。分位数回归强调以解释变量的分位数来估计推断因变量的分位数,通过建立分位数估计方程,并运用线性规划方法或非参数估计等方法来估计相应于不同分位数的解释变量系数或未知参数。分位数回归是中位数回归和均值回归的推广。分位数回归模型具体又分为四分位数回归、十分位数回归、百分位数回归、LOGIT分位数回归、审查分位数回归等模型。
分位数回归模型公式
分位数回归模型公式
分位数回归模型的一般形式为:
Q(y|x)=x’β(q)。
其中,Q(y|x)为在给定输入x的条件下,目标变量y的q分位数;x’为输入变量矩阵的转置;β(q)为在q分位数处的回归系数向量。
通常,分位数回归采用的损失函数为加权平方误差(weighted squared error),其中权重向量为:
w(q)=(q-1{y≤Q(y|x)})-1{y≤Q(y|x)}。
其中,1{·}为指示函数,当条件成立时取值为1,否则为0。该权重
向量的构造使得对于y≤Q(y|x)的样本,权重为负,对于y>Q(y|x)的样本,权重为正。这样,分位数回归可以在训练过程中更关注q分位数处的损失
函数值,从而得到更好的回归结果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Private school vouchers and student achievement:A
fixed effects quantile regression evaluation ☆
Carlos Lamarche ⁎
Department of Economics,University of Oklahoma,321Hester Hall,729Elm Avenue,Norman,
OK 73019,United States
Available online 3May 2008
Abstract
Fundamental to the recent debate over school choice is the issue of whether voucher programs actually improve students'academic ing newly developed quantile regression approaches,this paper investigates the distribution of achievement gains in the first school voucher program implemented in the US.We find that while high-performing students selected for the Milwaukee Parental Choice program had a positive,convexly increasing gain in mathematics,low-performing students had a nearly linear loss.However,the program seems to prevent low-performing students from having an even bigger loss experienced by students in the public schools.
©2008Elsevier B.V .All rights reserved.
JEL classification:I21;I28
Keywords:School choice;V ouchers;Milwaukee;Fixed effects;Quantile regression
“While we celebrate those [students]doing well,we can't turn a blind eye to those who are not ”Rod Paige,US secretary of Education,to the NY Times.
Available online at
Labour Economics 15(2008)575–
590
☆Version:March 31,2008.This paper is based on Chapter 2of my dissertation “Quantile Regression for Panel Data ”at the University of Illinois at Urbana-Champaign.I especially thank my advisor Roger Koenker for advice and detailed comments.I am grateful to Dan Bernhardt,Greg Burge,Todd Elder,Lynn Gottschalk,Kevin Hallock,Kangoh Lee,Darren Lubotsky,as well as labor lunch participants at the University of Illinois at Urbana-Champaign and seminar participants at Texas Tech and the 2007Annual Meetings of the European Association of Labour Economists.I thank Professor Cecilia Rouse for providing the Milwaukee Parental Choice program's data.I would like to thank the Guest Editor as well as two anonymous referees for their very helpful comments.⁎Tel.:+14053255857.
E-mail address:lamarche@
.
0927-5371/$-see front matter ©2008Elsevier B.V .All rights reserved.
doi:10.1016/beco.2008.04.007
576 marche/Labour Economics15(2008)575–590
1.Introduction
Fundamental to the recent debate over school choice is the issue of whether voucher programs actually improve students'academic achievement,while decreasing inequalities between the best and worst ton Friedman's proposal to use vouchers as a method of improving the quality of education is based on the idea that private schools are more productive than public schools,which is still a highly controversial issue.If private schools are in fact more efficient than public schools,governments can improve the quality of education by offering tuition vouchers to families that want to send their children to private schools.The Milwaukee Parental Choice program,the first program implemented in the US,has been providing vouchers to low-income students to attend private school since1990.
The simplicity of the program's idea contrasts sharply with the complexities that plague the program's evaluation.The voucher programs'effect,for example from time t to t',is the difference between what would have happened at time t'if the student was selected and remained in a choice school during the time interval,and what would have happened at time t'if the student was not selected,and remained in the Milwaukee public school.This counterfactual exercise is impossible to obtain using observational data(Rubin,1974).It may be possible,however,to construct groups using a randomized experiment(e.g.,children randomly assigned to attend choice schools and to attend public schools).At time t',the difference between students' academic performances could be attributed to the type of school since the initial assignment was random.However,the Milwaukee Parental Choice program was not implemented under idealized conditions(Witte,2000),and therefore the selection of the control group plays a major role.
Given the lack of a valid control group,it is not surprising that previous empirical studies have delivered mixed findings.Rouse's(1998)seminal study used a sample of students in the Milwaukee public schools as a comparison group and individual fixed effects to control for latent characteristics,such as more motivated parents or student abilities that may differ between treatment and comparison groups.The presented approach builds upon Rouse by employing a newly developed fixed effects form of quantile regression that not only controls for unobserved individual heterogeneity,but also allows an examination of the program effects at different points of the educational attainment distribution.
The empirical literature(e.g.,Witte,1997;Green et al.,1997;Rouse,1998)has focused upon estimating how the selection to attend the Milwaukee choice schools affects mean test scores. This approach to evaluation may be incomplete for policy analysis of programs serving heterogeneous students.To illustrate,if a stated policy goal is to raise students'achievement to a predetermined minimum standard,it may not be optimal to pursue a program that benefits strong students while causing weaker students to fall further behind.Because education is expected to play an important role in mitigating inequality,“the distribution of achievement gains... constitutes an appropriate criterion for evaluating a school choice intervention”(Howell and Peterson,2002).This paper focuses on the estimation of the selection to attend choice schools on the entire distribution of test scores,considering patterns of achievement in terms of quantiles.
There are important reasons why economists,educators,and policy makers are interested in how voucher programs affect students'achievement beyond the mean effect,which is typically estimated with Ordinary Least Squares(OLS)or Instrumental Variables(IV).First,the standard methodology may miss how a policy affects achievement differently at different points of the conditional test score distribution,as illustrated in Eide and Showalter(1998).Second,the possibility that vouchers may increase the differences between high-and low-performing students in the private schools,concern notably reflected in Ascher,Fruchter,and Berne(1996)question