分位数回归高级计量ppt课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分位数回归
主要内容
1、OLS估计原理与QR估计的提出 2、总体分位数及样本分位数 3、损失函数
4、分位数回归的估计方法与假设检验 5、分位数估计的Stata操作
2020/2/22
东北大学工商管理学院
2
1、OLS回归原理与QR估计的提出
• 传统的回归分析主要关注均值,即采用因变量条件均值的函 数来描述自变量每一特定数值下的因变量均值,从而揭示自 变量与因变量的关系。这类回归模型实际上是研究被解释变 量的条件期望,描述了因变量条件均值的变化。
2020/2/22
东北大学工商管理学院
4
1、OLS回归原理与QR估计的提出
2020/2/22
东北大学工商管理学院
5
1、OLS回归原理与QR估计的提出
yLeabharlann 2020/2/22E(yx)01x
x
东北大学工商管理学院
6
1、OLS回归原理与QR估计的提出
拟合值和残差
2020/2/22
东北大学工商管理学院
2020/2/22
东北大学工商管理学院
23
4、分位数回归的估计方法与假设检验
对一个样本,估计的分位数回归式越多,对被解释变量 条件分布的理解就越充分。
yt
以一元回归为例,如果用LAD(最小绝对离差和)法估计的 中位数回归直线与用OLS法估计的均值回归直线有显著差别 ,则表明被解释变量 yt 的分布是非对称的。
• 建模的主要L目( g的) 是在给定 x 时表示求 y 的条件预测值。设 表
示预测函数,且
表示预测误差。
•
• 如条果件yˆ损均( x 失值) 的准则;是如果损失,准那则e么是(x就绝) 是对yO误L差Syˆ回(损x归)失,,最那优就预是测中值位为数
回归,最优预测值为条件中位数
。
Le(x)Lyy ˆ(x)
7
2020/2/22
东北大学工商管理学院
8
1、OLS回归原理与QR估计的提出
• OLS回归的缺点:
• (1)对异常值特别敏感; • (2)是均值回归,E( y | x) 只是刻画条件分布 y | x 集中趋势
的指标,而我们关心 x 对整个条件分布 y | x 的影响; • (3)假设严格,误差项条件均值为零,且方差独立同分布
,即 y | x 服从渐进正态分布;如果 y | x 不是对称分布,则 E( y | x) 很难反映条件分布的全貌。
2020/2/22
东北大学工商管理学院
9
1、OLS回归原理与QR估计的提出
异方差下的简单回归
2020/2/22
东北大学工商管理学院
10
1、OLS回归原理与QR估计的提出
异方差的一种情形
• OLS 回归模型着重考察 x 对 y 的条件期望 E( y | x) 的影响, 实际上是均值回归;
2020/2/22
东北大学工商管理学院
3
1、OLS回归原理与QR估计的提出
• 对于典型的一元回归模型:
y01x E( x)E()0 E(yx)01x
(外生性)
(球型扰动项)
2020/2/22
东北大学工商管理学院
11
1、OLS回归原理与QR估计的提出
异方差下不同分位数的回归结果
2020/2/22
东北大学工商管理学院
12
1、OLS回归原理与QR估计的提出
• 人们也关心解释变量与被解释变量分布的中位数、分位数呈 何种关系。这就是分位数回归,它最早由Koenker和Bassett
16
2、总体分位数与样本分位数
2020/2/22
东北大学工商管理学院
17
2、总体分位数与样本分位数
2020/2/22
东北大学工商管理学院
18
2、总体分位数与样本分位数
2020/2/22
东北大学工商管理学院
19
2、总体分位数与样本分位数
2020/2/22
东北大学工商管理学院
20
3、损失函数
• 在统计学中损失函数是一种衡量损失和错误程度的函数,常记作 。
L(e) e2 E (y x)
med ( y x)
2020/2/22
东北大学工商管理学院
21
3、损失函数
• 线性损失函数
•
其中,k1 和 失程度。
k2L是(两, a个)常 数kk,12((反a映a)),,在大于
a
a
和小a于
a
时的损
• 当 k1 和 k2 相等时,可以得到绝对值形式的损失函数:
L(,a)a
2020/2/22
东北大学工商管理学院
22
3、损失函数
• 对于之前的OLS来说,就是使得残差平方和最小,即损失函 数为平方损失函数,此为最小二乘回归;而中位数回归的损 失函数为绝对值损失函数,则称为最小一乘回归,使得残差 绝对值的和最小;
• 最小一乘回归是分位数回归的特例,在QR中,通过计算数 据点到回归线的加权距离(没有平方),赋予拟合线下数据 点的权重是 1-q ,赋予拟合线上数据点的权重为 q 。对于选择 的每个 q ,都会产生不同的条件分位数拟合函数。
2020/2/22
东北大学工商管理学院
25
4、分位数回归的估计方法与假设检验
2020/2/22
不可微分,线性规划,单纯形法
东北大学工商管理学院
26
4、分位数回归的估计方法与假设检验
2020/2/22
东北大学工商管理学院
27
4、分位数回归的估计方法与假设检验
2020/2/22
东北大学工商管理学院
24
4、分位数回归的估计方法与假设检验
• 如果散点图上侧分位数回归直线之间与下侧分位数回归直线
之间相比,上侧比较接近,则说明被解释变量 偏的,反之是右偏的。
yt
的分布是左
• 对于不同分位数回归函数,如果回归系数的差异很大,说明 在不同分位数上解释变量对被解释变量的影响是不同的。
于1978年提出,是估计一组回归变量 X 与被解释变量 Y 的
分位数之间线性关系的建模方法,强调条件分位数的变化。
• 分位数回归使用残差绝对值的加权平均(如: )作为最
小化的目标函数,而不是像OLS采用
作为目标函数,不
易受极端值影响,较为稳健;
• 分位数回归还能提供关于条件分布 y | x 的全面信息。
e n i1 i
e n 2 i1 i
2020/2/22
东北大学工商管理学院
13
1、OLS回归原理与QR估计的提出
2020/2/22
东北大学工商管理学院
14
2、总体分位数与样本分位数
2020/2/22
东北大学工商管理学院
15
2、总体分位数与样本分位数
2020/2/22
东北大学工商管理学院
主要内容
1、OLS估计原理与QR估计的提出 2、总体分位数及样本分位数 3、损失函数
4、分位数回归的估计方法与假设检验 5、分位数估计的Stata操作
2020/2/22
东北大学工商管理学院
2
1、OLS回归原理与QR估计的提出
• 传统的回归分析主要关注均值,即采用因变量条件均值的函 数来描述自变量每一特定数值下的因变量均值,从而揭示自 变量与因变量的关系。这类回归模型实际上是研究被解释变 量的条件期望,描述了因变量条件均值的变化。
2020/2/22
东北大学工商管理学院
4
1、OLS回归原理与QR估计的提出
2020/2/22
东北大学工商管理学院
5
1、OLS回归原理与QR估计的提出
yLeabharlann 2020/2/22E(yx)01x
x
东北大学工商管理学院
6
1、OLS回归原理与QR估计的提出
拟合值和残差
2020/2/22
东北大学工商管理学院
2020/2/22
东北大学工商管理学院
23
4、分位数回归的估计方法与假设检验
对一个样本,估计的分位数回归式越多,对被解释变量 条件分布的理解就越充分。
yt
以一元回归为例,如果用LAD(最小绝对离差和)法估计的 中位数回归直线与用OLS法估计的均值回归直线有显著差别 ,则表明被解释变量 yt 的分布是非对称的。
• 建模的主要L目( g的) 是在给定 x 时表示求 y 的条件预测值。设 表
示预测函数,且
表示预测误差。
•
• 如条果件yˆ损均( x 失值) 的准则;是如果损失,准那则e么是(x就绝) 是对yO误L差Syˆ回(损x归)失,,最那优就预是测中值位为数
回归,最优预测值为条件中位数
。
Le(x)Lyy ˆ(x)
7
2020/2/22
东北大学工商管理学院
8
1、OLS回归原理与QR估计的提出
• OLS回归的缺点:
• (1)对异常值特别敏感; • (2)是均值回归,E( y | x) 只是刻画条件分布 y | x 集中趋势
的指标,而我们关心 x 对整个条件分布 y | x 的影响; • (3)假设严格,误差项条件均值为零,且方差独立同分布
,即 y | x 服从渐进正态分布;如果 y | x 不是对称分布,则 E( y | x) 很难反映条件分布的全貌。
2020/2/22
东北大学工商管理学院
9
1、OLS回归原理与QR估计的提出
异方差下的简单回归
2020/2/22
东北大学工商管理学院
10
1、OLS回归原理与QR估计的提出
异方差的一种情形
• OLS 回归模型着重考察 x 对 y 的条件期望 E( y | x) 的影响, 实际上是均值回归;
2020/2/22
东北大学工商管理学院
3
1、OLS回归原理与QR估计的提出
• 对于典型的一元回归模型:
y01x E( x)E()0 E(yx)01x
(外生性)
(球型扰动项)
2020/2/22
东北大学工商管理学院
11
1、OLS回归原理与QR估计的提出
异方差下不同分位数的回归结果
2020/2/22
东北大学工商管理学院
12
1、OLS回归原理与QR估计的提出
• 人们也关心解释变量与被解释变量分布的中位数、分位数呈 何种关系。这就是分位数回归,它最早由Koenker和Bassett
16
2、总体分位数与样本分位数
2020/2/22
东北大学工商管理学院
17
2、总体分位数与样本分位数
2020/2/22
东北大学工商管理学院
18
2、总体分位数与样本分位数
2020/2/22
东北大学工商管理学院
19
2、总体分位数与样本分位数
2020/2/22
东北大学工商管理学院
20
3、损失函数
• 在统计学中损失函数是一种衡量损失和错误程度的函数,常记作 。
L(e) e2 E (y x)
med ( y x)
2020/2/22
东北大学工商管理学院
21
3、损失函数
• 线性损失函数
•
其中,k1 和 失程度。
k2L是(两, a个)常 数kk,12((反a映a)),,在大于
a
a
和小a于
a
时的损
• 当 k1 和 k2 相等时,可以得到绝对值形式的损失函数:
L(,a)a
2020/2/22
东北大学工商管理学院
22
3、损失函数
• 对于之前的OLS来说,就是使得残差平方和最小,即损失函 数为平方损失函数,此为最小二乘回归;而中位数回归的损 失函数为绝对值损失函数,则称为最小一乘回归,使得残差 绝对值的和最小;
• 最小一乘回归是分位数回归的特例,在QR中,通过计算数 据点到回归线的加权距离(没有平方),赋予拟合线下数据 点的权重是 1-q ,赋予拟合线上数据点的权重为 q 。对于选择 的每个 q ,都会产生不同的条件分位数拟合函数。
2020/2/22
东北大学工商管理学院
25
4、分位数回归的估计方法与假设检验
2020/2/22
不可微分,线性规划,单纯形法
东北大学工商管理学院
26
4、分位数回归的估计方法与假设检验
2020/2/22
东北大学工商管理学院
27
4、分位数回归的估计方法与假设检验
2020/2/22
东北大学工商管理学院
24
4、分位数回归的估计方法与假设检验
• 如果散点图上侧分位数回归直线之间与下侧分位数回归直线
之间相比,上侧比较接近,则说明被解释变量 偏的,反之是右偏的。
yt
的分布是左
• 对于不同分位数回归函数,如果回归系数的差异很大,说明 在不同分位数上解释变量对被解释变量的影响是不同的。
于1978年提出,是估计一组回归变量 X 与被解释变量 Y 的
分位数之间线性关系的建模方法,强调条件分位数的变化。
• 分位数回归使用残差绝对值的加权平均(如: )作为最
小化的目标函数,而不是像OLS采用
作为目标函数,不
易受极端值影响,较为稳健;
• 分位数回归还能提供关于条件分布 y | x 的全面信息。
e n i1 i
e n 2 i1 i
2020/2/22
东北大学工商管理学院
13
1、OLS回归原理与QR估计的提出
2020/2/22
东北大学工商管理学院
14
2、总体分位数与样本分位数
2020/2/22
东北大学工商管理学院
15
2、总体分位数与样本分位数
2020/2/22
东北大学工商管理学院