分位数回归PPT课件 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

分位数回归参数估计的思想
与LR估计量明显不同的QR估计量的特点在于，在QR中数据点到回归线距离的测量通过垂直距离的加权总和（没有平方）而求得，这里赋予拟合线之下的数据点的权重是1-τ,而赋予拟合线之上的数据点的权重则是τ.对于τ的每一个选择，都会产生各自不同的条件分位数的拟合函数，这一任务是为每一个可能的寻找适合的估计量。
分位数回归原理
假设随机变量的分布函数为：
F(y)=Prob(Y y)
Y的分位数的定义为：
Q( )=inf{y:F(y) },0< <1
回归分析的基本思想就是使样本值与拟合值之间的距离最短，对于Y的一组随机样本，样本均值回归是使误差平方和最小，即
n
min
R
i 1
( yi
(Yi
xi' )

通过对上式求解得到其参数估计值。
参数意义解释：当其它协变量保持不变时，这一估计差异来自一个连续型协变量的单位增量，或者虚拟变量值从0 到1的变化。
SUCCESS
THANK YOU
2019/6/26
正如普通最小二乘OLS回归估计量的计算是基于最小化残差平方和一样，分位数回归估计量的计算也是基于一种非对称形式的绝对值残差最小化，其中，中位数回归运用的是最小绝对值离差估计(LAD，least absolute deviations estimator)。它和OLS主要区别在于回归系数的估计方法和其渐近分布的估计。在残差检验、回归系数检验、模型设定、预测等方面则基本相同。
分位数回归估计同普通最小二乘估计方法
同普通最小二乘估计方法
以不同的分位数为基准，求解最短距离加权最小一乘法独立弱假设非参数检验充分体现整个分布的各部分信息可以充分考虑极端值的影响影响小可以拟合一簇曲线自助方法估计标准误差，多种算法求解目标函数
二、分位数回归及其估计
损失函数
• 定义在统计学中损失函数是一种衡量损失和错
误程度的函数。常常记作 L( , a) 。
损失函数常用形式
分位数回归参数估计的思想
对于之前的线性模型来说，就是使得残差平方和最小，即损失函数为平方损失函数，此为最小二乘回归。而如果损失函数为绝对值损失函数，则称为最小一乘回归，它使得残差绝对值的和最小。最小一乘回归是分位数回归的特例。
: 1。
现假设因变量Y由k个自变量组成的矩阵X线性表示，对于条件均值函数E(Y | X x) xi' ，求解
^

arg min Rk
n i1
(Yi
Fra Baidu bibliotek

xi'

)2

得参数估计值。
分位数回归是对如上简单形式的扩展：
^

arg min Rk
n i1
分位数回归
一、分位数回归的提出二、分位数回归及其估计三、分位数回归的假设检验
一、分位数回归的提出
传统的回归分析主要关注均值，即采用因变量条件均值的函数来描述自变量每一特定数值下的因变量均值，从而揭示自变量与因变量的关系。这类回归模型实际上是研究被解释变量的条件期望,描述了因变量条件均值的变化。
分位数的性质
• 单调同变性
如果对一个随机变量进行函数h的单调转换（如指数或对数函数），分位数可通过对分位数函数进行同样的转换而得利。换言之，如果q是Y 的第p分位数，那么h(q)是h(Y)的第p分位数。
• 对离群值的不敏感性
假如有中位数为m的样本数据x1,…,xn,我们将一个位于中位数之上的数据值xi替换成同样在中位数之上的其他值，从而修改了样本。同样的，我们也可以将一个位于中位数之下的数据值替换成同样在中位数之下的其他值。这样的修改对样本中位数没有任何影响。
人们当然也关心解释变量与被解释变量分布的中位数，分位数呈何种关系。这就是分位数回归，它最早由凯恩克（Koenker Roger）和巴西特（Bassett Gilbert Jr）于1978年提出，是估计一组回归变量X与被解释变量Y的分位数之间线性关系的建模方法，强调条件分位数的变化。
中位数是一个特殊的分位数，它表示一种分布的中心位置。中位数回归是分位数回归的一种特殊情况，其他分位数则可以用来描述一种分布的非中心位置。第p 个百分位数表示因变量的数值低于这一百分位数的个数占总体的p%.因此，分位数可以指定分布中的任何一个位置。
u u I u 0
其中， I Z 为示性函数，Z是指示关系式。
当分位数为0.5时，就是最小一乘回归，即中位数回归。
最小二乘回归和最小一乘回归的损失函数是对称的，而一般的分位数回归的损失函数不是对称的，而是由两条从原点出发的分别位于第一和第二象限的射线组成，它们的斜率之比为
基本思想
目的
原理
算法前提假设假设要求检验类型承载信息极端值异方差拟合曲线计算方法
普通最小二乘估计设法使所构建的方程和样本之间的距离最短借助数学模型对客观世界所存在的事物间的不确定关系进行数量化描写以平均数为基准，求解最短距离
最小二乘法独立、正态、同方差强假设参数检验描述平均的总体信息无法考虑极端值的影响影响大只能拟合一条曲线求偏导解行列式，算法完备
分位数回归估计与经典模型的最小二乘估计相比较，有许多优点。
当数据出现尖峰或厚尾的分布、存在显著的异方差等情况，最小二乘估计将不再具有优良性质，且稳健性非常差。分位数回归系数估计结果比OLS估计更稳健，而且，分位数回归对误差项并不要求很强的假设条件，因此对于非正态分布而言，分位数回归系数估计量则更加稳健。
最小二乘估计假定解释变量只能影响被解释变量的条件分布的均值位置。
而分位数回归估计能精确地描述解释变量对于被解释变量的变化范围以及条件分布形状的影响,能够更加全面的描述被解释变量条件分布的全貌，而不是仅仅分析被解释变量的条件期望（均值），也可以分析解释变量如何影响被解释变量的中位数、分位数等。不同分位数下的回归系数估计量常常不同，即解释变量对不同水平被解释变量的影响不同。
)2
样本中位数回归是使误差绝对值之和最小，即
n
min
R
i 1
|
yi

|
样本分位数回归是使加权误差绝对值之和最小，即
min{
R i:Yi
| Yi

|
i:Yi
(1 )
| Yi

|}
上式可等价为：
n
min
R
i 1

(Yi
)
一般的分位数回归的损失函数为：