有序数据的贝叶斯分位数回归
分位数回归
![分位数回归](https://img.taocdn.com/s3/m/b36c59e4f90f76c661371ad5.png)
分位数回归及其实例一、分位数回归的概念分位数回归(Quantile Regression):是计量经济学的研究前沿方向之一,它利用解释变量的多个分位数(例如四分位、十分位、百分位等)来得到被解释变量的条件分布的相应的分位数方程。
与传统的OLS 只得到均值方程相比,它可以更详细地描述变量的统计分布。
传统的线性回归模型描述了因变量的条件分布受到自变量X 的影响过程。
普通最dx--乘法是估计回归系数的最基本的方法,它描述了自变量X 对于因变量y 的均值影响。
如果模型中的随机扰动项来自均值为零而且同方差的分布,那么回归系数的最dx--乘估计为最佳线性无偏估计(BLUE);如果近一步随机扰动项服从正态分布,那么回归系数的最dx--乘法或极大似然估计为最小方差无偏估计(M Ⅵ甩)。
但是在实际的经济生活中,这种假设常常不被满足,饲如数据出现尖峰或厚尾的分布、存在显著的异方差等情况,这时的最小二乘法估计将不再具有上述优良性且稳健性非常差。
最小二乘回归假定自变量X 只能影响因变量的条件分布的位置,但不能影响其分布的刻度或形状的任何其他方面。
为了弥补普通最dx--乘法(0Ls)在回归分析中的缺陷,Koenkel"和Pxassett 于1978年提出了分位数回归(Quantile Regression)的思想。
它依据因变量的条件分位数对自变量X 进行回归,这样得到了所有分位数下的回归模型。
因此分位数回归相比普通最小二乘回归只能描述自变量X 对于因变量y 局部变化的影响而言,更能精确地描述自变量X 对于因变量y 的变化范围以及条件分布形状的影响。
分位数回归是对以古典条件均值模型为基础的最小二乘法的延伸,用多个分位函数来估计整体模型。
中位数回归是分位数回归的特殊情况,用对称权重解决残差最小化问题,而其他的条件分位数回归则用非对称权重解决残差最小化。
一般线性回归模型可设定如下:()((0)),(0,1).x t t I t ρττ=-<∈在满足高斯-马尔可夫假设前提下,可表示如下:01122(|)...k k E y x x x x αααα=++++其中u 为随机扰动项k αααα,...,,,210为待估解释变量系数。
GJR-CAViaR模型的贝叶斯分位数回归——基于Gibbs抽样的MCMC算法实现
![GJR-CAViaR模型的贝叶斯分位数回归——基于Gibbs抽样的MCMC算法实现](https://img.taocdn.com/s3/m/40b0b4005e0e7cd184254b35eefdc8d376ee14e8.png)
GJR-CAViaR模型的贝叶斯分位数回归——基于Gibbs抽样的MCMC算法实现张颖;傅强【摘要】本文将基于Gibbs抽样的MCMC算法引入GJR-CAViaR模型,实现模型的贝叶斯推断.G JR-CAViaR模型是含有递归形式的分位数回归方程,尚未有文献提出如何对其进行贝叶斯分析和MCMC估计.本文首先利用不对称拉普拉斯分布建立GJR-CAViaR模型的似然函数,并通过引入标准指数分布和标准正态分布的混合分布得到不对称拉普拉斯分布的参数解析的条件分布,然后讨论模型的Gibbs抽样过程以及算法实现.对上证综指日收益率数据建立GJR-CAViaR模型,并得到模型参数的贝叶斯估计值.在马尔科夫链收敛的前提下,发现中国证券市场VaR具有自回归性质,且呈现收益对风险的不对称特征.这一特征不会受到样本容量大小及置信水平的影响.【期刊名称】《中央财经大学学报》【年(卷),期】2017(000)007【总页数】9页(P87-95)【关键词】GJR-CVAiaR;Gibbs抽样;不对称拉普拉斯分布;贝叶斯分位数回归【作者】张颖;傅强【作者单位】西北政法大学经济学院;中央财经大学财经研究院【正文语种】中文【中图分类】F011一、引言目前,常用的分位数回归模型的估计方法分为两类。
一类是直接进行优化求解,如单纯形法和内点法。
另一类是借助于贝叶斯原理进行参数估计。
直接优化求解属于频率学派的范畴,是传统的经典统计学方法。
经典估计方法将参数视为固定常数,然后利用最小二乘或极大似然等方法计算参数的估计值,得到参数的渐近分布和统计性质,并进行假设检验。
贝叶斯学派与经典统计法在参数估计的原理上存在不同。
贝叶斯学派将待估参数视为随机变量,利用贝叶斯原理和观测样本得到参数的后验分布。
在无法得到参数后验分布的具体表达形式时,采用重复抽样技术解决参数的估计问题。
因此,相对于传统统计对样本量的敏感,贝叶斯统计在小样本情形下也能得到可靠的参数信息。
分位数回归及其实例
![分位数回归及其实例](https://img.taocdn.com/s3/m/9593fefef8c75fbfc77db2a5.png)
分位数回归及其实例一、分位数回归的概念分位数回归(Quantile Regression):是计量经济学的研究前沿方向之一,它利用解释变量的多个分位数(例如四分位、十分位、百分位等)来得到被解释变量的条件分布的相应的分位数方程。
与传统的OLS 只得到均值方程相比,它可以更详细地描述变量的统计分布。
传统的线性回归模型描述了因变量的条件分布受到自变量X 的影响过程。
普通最dx--乘法是估计回归系数的最基本的方法,它描述了自变量X 对于因变量y 的均值影响。
如果模型中的随机扰动项来自均值为零而且同方差的分布,那么回归系数的最dx--乘估计为最佳线性无偏估计(BLUE);如果近一步随机扰动项服从正态分布,那么回归系数的最dx--乘法或极大似然估计为最小方差无偏估计(M Ⅵ甩)。
但是在实际的经济生活中,这种假设常常不被满足,饲如数据出现尖峰或厚尾的分布、存在显著的异方差等情况,这时的最小二乘法估计将不再具有上述优良性且稳健性非常差。
最小二乘回归假定自变量X 只能影响因变量的条件分布的位置,但不能影响其分布的刻度或形状的任何其他方面。
为了弥补普通最dx--乘法(0Ls)在回归分析中的缺陷,Koenkel"和Pxassett 于1978年提出了分位数回归(Quantile Regression)的思想。
它依据因变量的条件分位数对自变量X 进行回归,这样得到了所有分位数下的回归模型。
因此分位数回归相比普通最小二乘回归只能描述自变量X 对于因变量y 局部变化的影响而言,更能精确地描述自变量X 对于因变量y 的变化范围以及条件分布形状的影响。
分位数回归是对以古典条件均值模型为基础的最小二乘法的延伸,用多个分位函数来估计整体模型。
中位数回归是分位数回归的特殊情况,用对称权重解决残差最小化问题,而其他的条件分位数回归则用非对称权重解决残差最小化。
一般线性回归模型可设定如下:()((0)),(0,1).x t t I t ρττ=-<∈在满足高斯-马尔可夫假设前提下,可表示如下:01122(|)...k k E y x x x x αααα=++++其中u 为随机扰动项k αααα,...,,,210为待估解释变量系数。
数据分析知识:数据分析中的贝叶斯回归分析
![数据分析知识:数据分析中的贝叶斯回归分析](https://img.taocdn.com/s3/m/0b47695b9a6648d7c1c708a1284ac850ad020487.png)
数据分析知识:数据分析中的贝叶斯回归分析贝叶斯回归分析是一种基于贝叶斯统计理论的回归分析方法,在数据分析领域中被广泛应用。
它可以用来建立由多个自变量(特征)和一个因变量(目标)之间的关系模型,通过该模型预测未知数据。
本文将对贝叶斯回归分析进行详细的介绍和解释。
一、贝叶斯统计理论在介绍贝叶斯回归之前,先来了解一下贝叶斯统计理论。
贝叶斯统计理论是一种利用已知的先验概率来推导出未知的后验概率的理论。
这种理论认为概率是一个可分配的量,即一个事件的先验概率可以被分配给这个事件的不同条件,从而推导出事件在这些不同条件下的后验概率。
在数据分析领域中,贝叶斯统计理论被广泛应用于机器学习,尤其是在分类和回归等领域中。
二、贝叶斯回归贝叶斯回归分析是一种建立自变量和因变量之间关系的概率模型,可以用来预测未知数据。
贝叶斯回归通过先验知识和样本数据,计算出条件概率分布,从而得到模型的后验分布。
这种分布反映了在已知样本的情况下,目标变量的概率分布。
与传统的回归方法不同,贝叶斯回归提供了一种基于概率分布的分析方法,能够提供更多的置信度信息,并对模型的不确定性进行量化。
三、贝叶斯回归模型贝叶斯回归模型可以分为两类:线性回归和非线性回归。
在贝叶斯线性回归中,模型关系可以表示为:y = w0 + w1*x1 + w2*x2 + ... + wn*xn + ε其中,y表示目标变量,xn表示自变量,w0是一个常数项,wi是对应自变量xi的系数,ε是一个随机误差项。
该模型假设误差项是一个服从正态分布的随机变量,即ε~N(0,σ2)。
非线性模型可以用同样的方法推导出来。
在非线性模型中,自变量和系数之间的关系可以是曲线、二次函数或对数函数等。
四、贝叶斯回归的先验知识贝叶斯回归的先验知识通常是指对模型参数的先验分布。
它将参数的先验信息融入到数据分析中,可以提高贝叶斯回归的效率。
所谓的先验分布,是指在未进行任何实验之前,我们已经对概率分布有了一些基本的了解,这些知识可以来自于任意来源,例如对相似问题的观察,经验数据、专家判断等。
贝叶斯分层逻辑回归
![贝叶斯分层逻辑回归](https://img.taocdn.com/s3/m/bb31a242591b6bd97f192279168884868662b876.png)
贝叶斯分层逻辑回归全文共四篇示例,供读者参考第一篇示例:贝叶斯分层逻辑回归是一种结合了贝叶斯统计和逻辑回归的模型方法,能够有效地处理分类问题。
贝叶斯方法是一种基于贝叶斯理论的概率推断方法,通过先验分布和观测数据来估计模型参数,从而得到后验分布,并进行预测。
逻辑回归是一种线性分类模型,通过sigmoid函数将线性组合的特征与分类结果进行映射,常用于二分类问题。
贝叶斯分层逻辑回归将贝叶斯方法和逻辑回归模型进行了结合,利用了两者的优势,能够更好地处理分类问题。
在传统的逻辑回归模型中,模型参数的估计是通过最大似然估计或梯度下降等方法来进行的,但这些方法在样本数据较少或者存在数据不平衡的情况下容易出现过拟合或欠拟合的问题。
而贝叶斯方法能够更好地理解和利用先验信息,从而提高模型的泛化能力和预测准确性。
在贝叶斯分层逻辑回归模型中,模型参数的先验分布通常是一个正态分布,可以通过贝叶斯推断方法来更新参数的后验分布。
在更新后验分布之后,可以使用马尔可夫链蒙特卡洛(MCMC)方法来采样参数的后验分布,从而得到更精准的模型参数估计。
贝叶斯分层逻辑回归还可以结合分层抽样的方法来处理大规模数据集,提高模型的效率和准确性。
贝叶斯分层逻辑回归模型的应用领域非常广泛,包括金融风控、医疗诊断、电商推荐等各种领域。
在金融风控中,可以利用贝叶斯分层逻辑回归模型来预测客户的信用风险,从而降低坏账率和提高盈利能力;在医疗诊断中,可以利用贝叶斯分层逻辑回归模型来预测疾病的患病风险,从而提高医疗资源的利用效率和患者的治疗效果;在电商推荐中,可以利用贝叶斯分层逻辑回归模型来预测用户的购买行为,从而提高销售额和用户满意度。
第二篇示例:贝叶斯分层逻辑回归是一种结合了贝叶斯统计与逻辑回归的方法,广泛应用于机器学习和数据分析领域。
本文将介绍贝叶斯分层逻辑回归的概念、原理和应用,并探讨其在实际问题中的效果。
贝叶斯分层逻辑回归的概念贝叶斯分层逻辑回归是将贝叶斯统计方法与逻辑回归结合起来的一种方法。
分位数回归解读
![分位数回归解读](https://img.taocdn.com/s3/m/0d6c8b588e9951e79b892748.png)
分位数回归原理
假设随机变量的分布函数为:
F (y )=Prob(Y y )
Y的
分位数的定义为:
Q( )=inf{y:F (y) },0< <1
回归分析的基本思想就是使样本值与拟合值 之间的距离最短,对于Y的一组随机样本 , 样本均值回归是使误差平方和最小,即
min ( yi ) 2
MLE
显著异于零时,约束条件无效,拒绝原假设。
• 检验统计量
ˆ C) Var g ( ˆ) C (g ˆ C) ~ 2 (q) W (g
1
a
• Wald只需要估计无约束模型,但需要计算渐进协件下, Wald检验 H0 : R r
似然比检验:
• 似然比 • 命题:H0 : g C • 检验思想:如果约束是无效的,有约束的最大似然函 数值当然不会超过无约束的最大似然函数值,但如果 约束条件“有效”,有约束的最大值应当“接近”无 约束的最大值,这正是似然比检验的基本思路。 •
L( , 2 ) 似然比: ˆ , ˆ2) L(
对一个样本,估计的分位数回归式越多, 对被解释变量yt条件分布的理解就越充分。 以一元回归为例,如果用LAD(最小绝对离 差和)法估计的中位数回归直线与用OLS法估计 的均值回归直线有显著差别,则表明被解释变 量yt的分布是非对称的。
如果散点图上侧分位数回归直线之间与下侧 分位数回归直线之间相比,相互比较接近,则说 明被解释变量yt的分布是左偏倚的。反之是右偏 倚的。 对于不同分位数回归函数如果回归系数的差 异很大,说明在不同分位数上解释变量对被解释 变量的影响是不同的。
无约束分位数回归目标 函数
分位数回归参数估计 -回复
![分位数回归参数估计 -回复](https://img.taocdn.com/s3/m/bc461764182e453610661ed9ad51f01dc28157f6.png)
分位数回归参数估计-回复分位数回归是一种可以用于估计不同分位数之间关系的统计方法。
它在经济学、金融学和社会科学等领域广泛应用。
本文将分为三个部分来介绍分位数回归参数估计的方法和步骤。
第一部分:什么是分位数回归分位数回归是传统OLS(最小二乘法)回归的一种推广。
与OLS回归的目标是估计条件均值函数(即给定自变量的情况下,因变量的平均值),分位数回归的目标是估计给定分位数的条件函数(即给定自变量的情况下,因变量的特定分位数)。
这种方法的主要优势是能够提供关于因变量在不同条件下的不同分位数的有关信息。
在分位数回归中,我们首先假设有一个基本的线性模型:对于观测值i,有y_i = x_i'β+ ε_i,其中y_i 是因变量,x_i 是自变量,β是回归系数,ε_i 是误差项。
然而,与OLS回归不同的是,我们关心的是回归系数在不同分位数上的估计。
第二部分:分位数回归参数估计的步骤1. 选择分位数:首先,我们需要选择感兴趣的分位数进行回归分析。
常见的分位数包括中位数(50分位数)、上四分位数(75分位数)和下四分位数(25分位数),也可以选择其他分位数。
2. 估计回归系数:在选择了感兴趣的分位数后,我们可以使用极大似然估计、最小二乘法或其他统计手段对回归系数进行估计。
这里,我们以最小二乘法为例来说明估计方法。
a. 对于每个分位数q(对应着因变量y 在q 分位数处的值),我们定义一个新的误差项u_i=(y_i-x_i'β)。
在传统OLS回归中,我们用平方误差来度量误差项,但在分位数回归中,我们使用另一种度量标准,即绝对值误差(quantile loss function)。
b. 为了估计回归系数,我们通过最小化分位数损失函数来求解。
这可以通过线性规划等数值优化算法来实现。
3. 检验回归结果:在得到回归系数估计后,我们可以进行统计检验来评估模型的拟合度和显著性。
常见的检验方法包括计算标准误差、计算置信区间和进行假设检验。
纵向数据的贝叶斯惩罚分位数回归分析
![纵向数据的贝叶斯惩罚分位数回归分析](https://img.taocdn.com/s3/m/465b12511ed9ad51f01df2a1.png)
纵向数据的贝叶斯惩罚分位数回归分析第一章绪论1.1问题的提出及研究意义1.2国内外研究现状1.3本文研究的主要内容及结构安排1.4 本文研究的创新点与不足第二章贝叶斯惩罚分位数回归2.1 分位数回归2.1.1 分位数回归的基本思想2.1.2 惩罚分位数回归2.2 贝叶斯估计的基本原理2.2.1 贝叶斯定理2.2.2 先验分布的设定2.2.3后验分布与Gibbs抽样2.3 贝叶斯惩罚分位数回归2.3.1 非对称拉普拉斯分布(ALD)2.3.2 基于ALD的贝叶斯惩罚分位数回归第三章纵向数据模型的贝叶斯lasso分位数回归方法3.1 带有随机效应的纵向数据模型3.2 基于ALD的一个重要分解3.2.1 分层贝叶斯分位数回归模型3.3 条件Laplace先验与贝叶斯惩罚分位数回归方法3.3.1 贝叶斯lasso分位数回归方法3.3.2 贝叶斯自适应Lasso分位数回归方法3.4 参数估计的MCMC抽样算法3.5 数值模拟第四章关于随机截距项贝叶斯分析4.1 ALD先验下的随机截距及其重要分解4.2 ALD先验与贝叶斯惩罚分位数回归方法4.2.1 带有Lasso惩罚的贝叶斯分位数回归方法4.2.2 带有自适应Lasso惩罚的贝叶斯分位数回归方法4.3 参数估计的Gibbs算法4.4 数值模拟结论与展望第一章绪论1.1 问题的提出及研究意义纵向数据(Longitudinal)是指对一组个体按时间顺序或空间顺序追踪重复测得的数据,对每一个体在不同时间或不同实验条件下多次测得,所得的数据兼有时间序列和截面数据的特点,在经济学中也称为“面板数据”(Panel data)。
这种数据的特点是所研究的响应变量的观察值随时间变化,相关的协变量也随时间变化有一系列观察,具有如此特点的数据在生产实践和科学研究中随处可见,对其研究也日趋深入。
纵向数据分析在医学、生物学、经济学等方面有重要应用。
由于在纵向数据中对同一个体的多次重复观测之间往往具有相关性,特别是对于具有随机效应的纵向数据而言,若是在统计分析中忽略这种相关性或是对之处理不当,将会得到偏离实际甚至错误的结论。
分位数回归及应用简介
![分位数回归及应用简介](https://img.taocdn.com/s3/m/af3ddefdf021dd36a32d7375a417866fb84ac00a.png)
分位数回归及应用简介分位数回归(Quantile Regression)是一种预测模型,与传统的最小二乘法回归(OLS regression)不同,它不仅可以估计数据的均值,还可以估计数据分布的其他分位数。
这种方法在处理不同分位数下的潜在差异时非常有用,因为它可以提供理解和预测在不同条件下的数据变化情况。
最小二乘法回归通过最小化预测值与实际值的平方差,给出一个数据分布的均值估计。
然而,由于数据的分布可能是非对称的,存在异常值或极端值,使用最小二乘法回归的均值估计可能不准确。
在这种情况下,分位数回归是一种更好的方法,因为它可以估计多个分位数,包括中位数(50%分位数)和极值(例如90%或95%分位数)。
分位数回归可以通过最小化损失函数来估计模型参数,常用的损失函数是加权绝对值损失函数。
这个损失函数对应的优化问题可以使用线性规划或非线性规划的方法求解。
通过计算不同分位数的估计结果,可以获得数据分布的详细信息。
分位数回归有一些应用的优势。
首先,它可以提供更全面的数据估计,对于非对称或含有异常值的数据分布具有更好的预测能力。
其次,分位数估计结果可以用来比较不同分位数处的特征变量对因变量的影响程度。
例如,在收入预测模型中,分位数回归可以帮助我们比较高收入人群和低收入人群对某个特征变量的影响程度。
此外,分位数回归还可以用于分析不同条件下的潜在差异,例如预测某个特征变量在不同行业、不同地区或不同时间段的变化情况。
分位数回归的应用非常广泛。
在经济学领域,它常被用于研究收入分布、贫富差距以及社会流动性等问题。
它还可以用于金融学中的风险评估和资产定价分析,其中分位数回归可以帮助我们理解极端事件的风险程度。
此外,分位数回归还可以在医学和社会科学领域中,用于研究不同群体或个体的特征与某个健康指标或社会指标的关系。
尽管分位数回归有许多优点,但也存在一些限制。
首先,分位数回归对于数据分布的假设较少,因此可以适用于各种类型的数据。
分位数回归及应用简介
![分位数回归及应用简介](https://img.taocdn.com/s3/m/8a02bdae988fcc22bcd126fff705cc1755275f35.png)
分位数回归及应用简介分位数回归是一种在统计学和经济学中常用的回归分析方法,它与传统的平凡最小二乘回归分析相比,更加适用于处理非正态分布、异方差和异常值等问题。
本文将对分位数回归的基本原理进行介绍,并探讨其在实际应用中的一些例子。
一、基本原理分位数回归是指通过对数据进行分位数划分,将不同分位数的回归干系进行建模和分析的方法。
在传统的回归分析中,我们通常关注的是条件均值(条件期望)的回归干系,而分位数回归则可以揭示在不同条件下,数据的不同分位数的回归干系。
以简易的线性回归为例,我们通常会建立一个关于自变量和因变量的条件均值模型,即通过最小化猜测值与实际观测值之间的平方差,得到最佳拟合直线。
而在分位数回归中,我们可以通过最小化猜测值与实际观测值的分位差,得到在不同分位数条件下的最佳拟合直线。
这样做的好处是能够更好地理解数据的分布状况,以及对不同条件下的不确定性进行建模和猜测。
二、实际应用1. 收入差距探究分位数回归常被用于探究收入差距的影响因素。
以中国为例,我们可以通过对个人收入数据的分位数回归分析,得到不同分位数收入的影响因素和差异。
探究发现,教育水平、工作阅历和性别等因素对于不同收入分位数的影响程度是不同的。
通过分位数回归,我们可以更全面地洞察不同收入群体之间的差距和不对等现象。
2. 健康状况评估分位数回归也可以用于对健康状况评估的探究。
例如,我们可以通过分位数回归分析,探讨不同健康指标(如体重指数、血压等)与不同健康分位数(如50%、70%)的干系,从而对健康状况进行更精细的刻画和猜测。
探究发现,不同健康指标对不同健康分位数的影响具有显著差异,分位数回归可以援助揭示这些差异。
3. 风险评估在金融风险评估中,分位数回归也有重要应用。
通过分位数回归,我们可以建立基于市场因素、公司基本面等的风险模型,猜测不同风险分位数下的收益变化。
这对于投资组合的构建和风险管理具有重要意义。
探究表明,通过引入分位数回归,能够更准确地预估金融市场的风险暴露和收益猜测。
贝叶斯分位数回归matlab
![贝叶斯分位数回归matlab](https://img.taocdn.com/s3/m/3ee32b2e793e0912a21614791711cc7930b77845.png)
贝叶斯分位数回归(Bayesian Quantile Regression)是一种统计方法,用于估计在给定解释变量的条件下,响应变量的特定分位数。
在Matlab中,可以使用bayesqr函数进行贝叶斯分位数回归分析。
以下是一个简单的示例:
首先,确保已经安装了bayesqr函数。
接下来,创建一些模拟数据并进行贝叶斯分位数回归分析:
matlab
百分号生成模拟数据
rng(1); 百分号设置随机数生成器的种子,以便结果可重复
n = 100; 百分号样本数量
X = randn(n, 2); 百分号生成两个解释变量,每个解释变量有n个观测值
beta = [1; 2]; 百分号真实参数值
eps = randn(n, 1) * 0.5; 百分号生成误差项
y = X * beta + eps; 百分号生成响应变量
百分号进行贝叶斯分位数回归分析
q = 0.5; 百分号指定分位数
lambda = 10; 百分号指定先验参数
[b_hat, se_b_hat] = bayesqr(X, y, q, lambda);
百分号输出结果
fprintf('估计的分位数回归系数:b_hat =
');
disp(b_hat);
fprintf('分位数回归系数的标准误差:se_b_hat =
');
disp(se_b_hat);
在这个示例中,我们首先生成了一个包含100个观测值的数据集,其中有两个解释变量和一个响应变量。
然后,我们使用bayesqr函数进行贝叶斯分位数回归分析,并输出估计的回归系数及其标准误差。
分位数回归解释
![分位数回归解释](https://img.taocdn.com/s3/m/1a1cde2b842458fb770bf78a6529647d2628347c.png)
分位数回归解释嘿,朋友!咱们今天来聊聊分位数回归这回事儿。
你知道吗,分位数回归就像是一场独特的冒险之旅。
普通的回归分析就好像是走在一条平坦的大道上,只能看到一个平均的情况。
但分位数回归可不一样,它能带你探索不同的路径,看到更丰富的风景。
比如说,你想了解收入和教育程度之间的关系。
普通回归可能只会告诉你平均情况下的趋势,可生活中哪有那么多平均呀?分位数回归就能告诉你,在低收入人群中,教育程度的影响是怎样的;在高收入人群中,又有着什么样的变化。
这是不是比只知道个平均数有趣多啦?分位数回归就像一个细心的观察者,不放过任何一个细节。
它不满足于只看到整体的大概,而是要深入到各个角落,把不同层次的情况都给你呈现出来。
想象一下,你是一个厨师,普通回归就像是给你一个总的菜谱,告诉你大概放多少调料能做出一道菜。
可分位数回归呢,它会告诉你,对于口味清淡的人,调料要怎么放;对于口味重的人,又该怎么调整。
是不是感觉特别贴心?再打个比方,分位数回归好比是一个多面手的侦探。
普通回归可能只能找到一个主要线索,而分位数回归能从多个角度,不同的线索去破解谜团。
它能帮助我们更全面地理解数据背后的故事。
比如说研究房价,它不仅能告诉我们整体房价的趋势,还能告诉我们在房价较低的区域,哪些因素起了关键作用;在房价较高的区域,又是什么在左右着价格。
在实际应用中,分位数回归可有着大用处呢!比如说在经济领域,它能帮助分析不同收入层次的消费行为;在医学研究中,能搞清楚不同病情严重程度下,治疗效果的差异。
分位数回归就是这样一个神奇又实用的工具,能让我们看到数据世界里更多的精彩和可能。
咱们可不能只满足于表面的了解,得深入去探索,才能发现它的真正魅力呀!所以,别犹豫,大胆去运用分位数回归,开启你的探索之旅吧!。
分位数回归的作用
![分位数回归的作用](https://img.taocdn.com/s3/m/1412332aa200a6c30c22590102020740be1ecde1.png)
分位数回归的作用分位数回归是一种统计学方法,用于分析变量之间的关系。
它可以帮助我们更好地理解数据,并预测未来的趋势。
在本文中,我们将探讨分位数回归的作用及其在实际应用中的意义。
分位数回归是一种非参数回归方法,它不需要对数据进行任何假设,也不需要对数据进行任何转换。
相反,它使用分位数来描述变量之间的关系。
分位数是指将数据分成若干等份的值,例如将数据分成四等份,即四分位数。
分位数回归使用这些分位数来描述变量之间的关系,而不是使用平均值或中位数等统计量。
分位数回归的作用是帮助我们更好地理解数据。
它可以帮助我们发现变量之间的非线性关系,例如曲线关系或阈值关系。
它还可以帮助我们发现变量之间的交互作用,例如当一个变量的影响因另一个变量而改变时。
分位数回归还可以帮助我们预测未来的趋势,例如预测某个变量在未来几年内的变化趋势。
分位数回归在实际应用中有很多意义。
例如,在医学研究中,分位数回归可以用于研究药物剂量和治疗效果之间的关系。
在经济学研究中,分位数回归可以用于研究收入和教育水平之间的关系。
在环境科学研究中,分位数回归可以用于研究污染物浓度和健康影响之间的关系。
分位数回归的实现方法有很多种,例如基于线性模型的分位数回归、基于核密度估计的分位数回归和基于树模型的分位数回归等。
每种方法都有其优缺点,需要根据具体情况选择合适的方法。
分位数回归是一种非常有用的统计学方法,可以帮助我们更好地理解数据,并预测未来的趋势。
它在各个领域都有广泛的应用,例如医学、经济学和环境科学等。
在实际应用中,我们需要根据具体情况选择合适的方法,并结合其他统计学方法进行分析,以得出更准确的结论。
分位数回归及应用简介
![分位数回归及应用简介](https://img.taocdn.com/s3/m/7f9984c2cd22bcd126fff705cc17552707225e91.png)
分位数回归及应用简介一、本文概述分位数回归是一种统计学中的回归分析方法,它扩展了传统的均值回归模型,以揭示自变量和因变量之间的非线性关系。
本文将简要介绍分位数回归的基本原理、方法及其在各种领域中的应用。
我们将概述分位数回归的基本概念和数学模型,解释其如何适应不同的数据分布和异质性。
接着,我们将讨论分位数回归的统计性质和估计方法,包括其稳健性、灵活性和有效性。
我们将通过实例展示分位数回归在经济学、医学、环境科学等领域中的实际应用,并探讨其未来的发展前景和挑战。
通过本文的阐述,读者可以对分位数回归有更深入的理解,并了解其在处理复杂数据分析问题中的潜力和价值。
二、分位数回归的基本理论分位数回归(Quantile Regression)是统计学中的一种回归分析方法,它不同于传统的最小二乘法回归,旨在估计因变量的条件分位数与自变量之间的关系。
最小二乘法回归主要关注因变量的条件均值,而分位数回归则能够提供更为全面的信息,包括条件中位数、四分位数等。
分位数回归的基本理论建立在分位数函数的基础上,分位数函数是描述随机变量在某个特定概率水平下的取值。
在分位数回归模型中,自变量通过一组参数β影响因变量Y的条件分位数。
这些参数β是通过最小化因变量的实际值与预测值之间的某种损失函数来估计的。
分位数回归的优点在于,它对于因变量的分布假设较为宽松,不需要满足正态分布或同方差性等假设。
分位数回归对异常值和离群点的影响较小,因此具有较高的稳健性。
这使得分位数回归在处理具有复杂分布和非线性关系的实际问题时表现出色。
分位数回归的估计方法主要有线性规划法、单纯形法和非线性规划法等。
这些方法的选择取决于具体的研究问题和数据特点。
在实际应用中,分位数回归通常与一些机器学习算法相结合,如随机森林、支持向量机等,以提高模型的预测精度和泛化能力。
分位数回归在金融、医学、环境科学等领域有着广泛的应用。
例如,在金融领域,分位数回归可以用于预测股票价格的风险价值(VaR)和预期损失(ES),帮助投资者进行风险管理。
贝叶斯分位数回归模型
![贝叶斯分位数回归模型](https://img.taocdn.com/s3/m/2c445e491611cc7931b765ce05087632311274d3.png)
贝叶斯分位数回归模型
贝叶斯分位数回归模型是一种用贝叶斯统计方法处理分位数回归问题的模型。
它在处理数据时,能够考虑到每一个数据点的位置和分布。
贝叶斯分位数回归模型通常用于解决以下问题:
1. 处理具有不同分布的数据。
因为传统的平均回归模型只考虑了平均值,无法捕捉数据点的分布信息,而贝叶斯分位数回归模型则可以考虑到不同分布的数据,提高模型的准确度。
2. 处理数据中存在离群点的情况。
传统的平均回归模型受到离群点的影响较大,而分位数回归模型则可以通过设定小的分位数值,将离群点的影响降到最低。
3. 预测潜在事件,例如股价变化或房价变化。
贝叶斯分位数回归模型可以在预测潜在事件时,降低过度拟合的风险,提高模型的预测能力。
贝叶斯分位数回归模型的原理是利用贝叶斯统计的思想,对估计的参数进行后验概率进行估计,得到每个参数的置信区间。
具体地,通过设定小的分位数值,可以将离群点的影响降到最低;同时,通过设定大的分位数值,可以捕捉数据点的潜在极端值。
因此,贝叶斯分位数回归模型具有很强的鲁棒性和预测能力。
面板数据贝叶斯自适应Lasso分位数回归——基于非对称指数幂分布的研究
![面板数据贝叶斯自适应Lasso分位数回归——基于非对称指数幂分布的研究](https://img.taocdn.com/s3/m/272bf725fe00bed5b9f3f90f76c66137ef064f7e.png)
面板数据贝叶斯自适应Lasso分位数回归——基于非对称指数幂分布的研究面板数据贝叶斯自适应Lasso分位数回归——基于非对称指数幂分布的研究摘要:随着面板数据的广泛应用,对面板数据的分析方法也越来越受到关注。
本研究提出了一种基于非对称指数幂分布的面板数据贝叶斯自适应Lasso分位数回归方法,旨在解决不同分布假设下的参数估计问题。
实证结果表明,该方法在非对称指数幂分布下估计的参数相比传统方法更具稳健性和效率。
1. 引言近年来,随着大数据时代的到来,面板数据作为一种重要的数据形式,被广泛应用于经济、金融等领域的研究中。
然而,面板数据的特殊性要求我们使用适当的方法对其进行分析,以准确地估计参数并得到可靠的结果。
2. 相关研究综述面板数据的特点是同时含有横截面和时间序列的信息,因此在分析面板数据时需要解决两个问题:横截面依赖性和时间序列相关性。
传统的面板数据分析方法主要包括固定效应模型、随机效应模型和混合效应模型。
这些方法在一定程度上解决了面板数据的问题,但对数据的分布假设较为严格。
3. 方法介绍为了解决传统方法对数据分布假设较为严格的问题,本研究使用了非对称指数幂分布作为数据的分布假设。
非对称指数幂分布的特点是能够对数据的厚尾和偏态进行灵活建模,同时具有更强的鲁棒性。
在此基础上,基于贝叶斯框架,引入Lasso惩罚项,实现对面板数据的自适应稀疏估计。
4. 实证分析本研究使用了一个包含1000个个体和50个时间周期的面板数据进行实证分析。
首先,对原始数据进行了描述性统计分析,发现数据具有明显的厚尾和偏态,与非对称指数幂分布的特点相符。
然后,使用传统方法和提出的方法对面板数据进行了回归分析。
实证结果表明,提出的方法在非对称指数幂分布下估计的参数相比传统方法更具稳健性和效率。
5. 结论与展望本研究提出了一种基于非对称指数幂分布的面板数据贝叶斯自适应Lasso分位数回归方法,用于解决参数估计问题。
实证结果表明,该方法在非对称指数幂分布下具有较好的稳健性和效率。
数据分析知识:如何进行数据分析的贝叶斯回归
![数据分析知识:如何进行数据分析的贝叶斯回归](https://img.taocdn.com/s3/m/bb4ef755571252d380eb6294dd88d0d233d43cb7.png)
数据分析知识:如何进行数据分析的贝叶斯回归贝叶斯回归是一种统计学方法,用于建立一个预测模型,基于先验概率来确定模型参数。
它具有很高的泛化能力和拟合能力,能够有效预测未知数据,成为数据分析中应用广泛的方法之一。
一、基本思想贝叶斯回归以贝叶斯定理为基础,通过对数据进行分析,得到先验概率和后验概率,最终调整模型参数。
贝叶斯定理表达式:P(A|B)=P(B|A)P(A)/P(B)。
其中,P(A)为先验概率,P(B)为样本概率,P(B|A)为数据在某种先验条件下的概率,P(A|B)为后验概率。
贝叶斯回归过程分为两步。
第一步是根据贝叶斯公式计算模型的后验概率分布,即根据已有的样本数据计算参数的分布。
第二步是生成模型,并根据最大后验概率确定模型的参数。
二、方法步骤贝叶斯回归包括以下步骤:1.确定模型参数选择回归模型并确定参数,在建立模型之前需要选择变量和模型。
通常采用参数模型或非参数模型,参数模型指的是假设模型中的待估参数是有限的。
例如:多元线性回归模型是一个参数模型。
而非参数模型指的是模型中的可估参数是无限的,例如:样条回归或核回归。
2.确定先验分布选择不同的前验分布,构建贝叶斯回归,不同的先验分布会影响模型的推断和预测结果,一般使用高斯分布或者其他的共轭分布。
3.确定后验分布定义后验分布为这个贝叶斯模型的任务和目标,后验分布所包含的信息能够帮助我们理解概率模型的结构以及用于预测过程中的不确定性。
4.计算后验分布根据先验分布和观察到的数据计算后验分布,主要使用马尔科夫链蒙特卡罗(MCMC)算法进行计算。
5.预测使用后验分布进行预测,通过对样本数据的分析来推断新数据的性质和特征。
三、案例分析现假设有一个公司,需要预测客户购买某项产品的概率。
先收集了一些数据进行分析,并构建了一个贝叶斯回归模型。
1.确定模型参数采用logistic回归模型进行建模,并假设模型中包含两个解释变量X1和X2,输出变量为Y,可写作公式:logit(P(Y=1|X1,X2))=aX1+bX2+c。
贝叶斯分位数回归方法
![贝叶斯分位数回归方法](https://img.taocdn.com/s3/m/604422b44793daef5ef7ba0d4a7302768f996f67.png)
贝叶斯分位数回归方法是一种结合了贝叶斯理论与分位数回归的统计分析方法。
它允许我们在给定分位数水平下,估计自变量和因变量之间的关系,同时提供了对模型参数的不确定性度量。
这种方法的提出,为我们提供了一种新的视角来处理回归问题,特别是在处理具有异方差性、非对称分布或异常值的数据时,显示出其独特的优势。
首先,我们需要了解分位数回归的基本概念。
分位数回归是一种描述自变量和因变量的分位数之间线性关系的回归方法。
与传统的均值回归不同,分位数回归关注因变量的条件分位数,而不是条件均值。
这样,它可以提供更丰富的信息,比如因变量在不同分位数水平下的变化情况。
此外,分位数回归对模型中的随机误差项不需做任何分布的假定,这使得整个回归模型具有更强的稳健性。
贝叶斯方法的引入,为分位数回归提供了新的估计参数的方式。
在贝叶斯框架下,参数被视为随机变量,而不是固定的未知量。
我们通过为先验分布和似然函数指定概率模型,然后使用贝叶斯定理来计算参数的后验分布。
这种方法允许我们利用先验信息,并在新的数据出现时更新我们的信念。
在贝叶斯分位数回归中,一个关键步骤是假设分位数回归模型的误差项服从非对称拉普拉斯分布。
这是因为分位数回归的损失函数与非对称拉普拉斯分布的密度函数具有紧密的联系。
通过假设误差项服从非对称拉普拉斯分布,我们可以写出似然函数,并在特定的分位数水平下极大化似然函数。
这样,分位数回归的参数估计值就可以通过优化得到。
贝叶斯分位数回归方法的优点在于,它结合了分位数回归的稳健性和贝叶斯方法的灵活性。
通过利用先验信息,贝叶斯分位数回归可以在数据稀疏或存在异常值的情况下提供更准确的估计。
此外,由于参数被视为随机变量,我们可以得到参数的不确定性度量,这对于决策制定和模型验证非常有用。
然而,贝叶斯分位数回归方法也存在一些挑战。
首先,选择合适的先验分布可能是一个难题,因为不同的先验分布可能会导致不同的后验推断。
其次,计算后验分布通常需要高维积分,这在计算上可能是昂贵的。
贝叶斯分层逻辑回归
![贝叶斯分层逻辑回归](https://img.taocdn.com/s3/m/b3b2b801ce84b9d528ea81c758f5f61fb73628a5.png)
贝叶斯分层逻辑回归
贝叶斯分层逻辑回归:提升预测准确性的利器
在机器学习领域,贝叶斯分层逻辑回归是一种强大的模型,能够有效提升预测准确性。
它结合了贝叶斯统计和逻辑回归的优势,具备了较强的灵活性和可解释性。
贝叶斯分层逻辑回归的核心思想是将数据分层处理,通过建立多个逻辑回归模型来对不同的数据子集进行建模。
这样可以更准确地捕捉数据中的潜在关系和特征,从而提高预测的准确性。
我们需要将数据按照某种特征进行分层,例如按照年龄、性别、地区等信息进行分组。
然后,在每个子集中,我们建立一个独立的逻辑回归模型。
这样,每个模型都会关注不同的特征和关系,从而更好地拟合数据。
在进行预测时,我们可以根据新的数据点所属的特征分组,选择对应的逻辑回归模型进行预测。
这样,我们可以根据不同的特征获取更准确的预测结果,提高模型的整体准确性。
贝叶斯分层逻辑回归的优势不仅在于提高预测准确性,还在于其可解释性。
由于每个子集都有独立的逻辑回归模型,我们可以更好地理解每个特征与预测结果之间的关系。
这对于分析数据、发现潜在规律和解释预测结果都非常有帮助。
贝叶斯分层逻辑回归还可以应用于不平衡数据集的建模。
通过合理地选择分层方式和调整模型参数,我们可以更好地处理数据不平衡带来的问题,提高模型的鲁棒性。
总结一下,贝叶斯分层逻辑回归是一种有效的机器学习模型,能够提高预测准确性并具备较强的可解释性。
它通过将数据分层处理,建立多个逻辑回归模型来对不同的数据子集进行建模,从而更准确地捕捉数据中的潜在关系和特征。
在实际应用中,我们可以根据数据的特点选择合适的分层方式和模型参数,以达到最佳的预测效果。
koenker和bassett提出的分位数回归方法
![koenker和bassett提出的分位数回归方法](https://img.taocdn.com/s3/m/529b53aaafaad1f34693daef5ef7ba0d4a736ddd.png)
koenker和bassett提出的分位数回归方法Koenker和Bassett提出的分位数回归方法是一种统计建模方法,专门用于研究依变量在不同分位数处的条件分布。
该方法的核心是通过最小化残差的绝对值来估计条件分位数,从而对整个分布进行建模。
分位数回归的基本思想是通过引入一个分位数水平,将样本分为两个部分:低于分位数水平和高于分位数水平。
然后,针对每个部分分别建立一个回归模型。
这两个模型分别描述了在给定分位数水平下,依变量与自变量之间的关系。
这与传统的普通最小二乘回归不同,因为它关注整个分布而不是均值。
具体来说,Koenker和Bassett提出的分位数回归方法通过优化分位数回归损失函数来估计模型参数。
该损失函数是残差的绝对值与一个分位数相关的权重函数的乘积之和。
通过调整权重,可以选择不同的分位数水平,从而估计整个条件分布。
这种方法在处理偏态数据或存在异方差性质的数据时特别有用,因为它允许对数据的不同分位数进行更灵活的建模,而不仅仅局限于均值。
分位数回归在经济学、金融学和社会科学等领域中得到广泛应用,用于研究因变量在不同分位数下的变化和影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
∞
∞
σ
因此 0 < ∫
∞
−∞
∫0 π ( β , σ | r ) dβ dσ < ∞ 证毕。
∞
3. 有序数据模型
有序数据的分位数回归模型能够用连续的潜变量 ti 来表示
ti = xi′β p + i , i = 1, ,n
(8)
其中, xi 是 j 维的协向量, β p 是 j 维的未知参数向量,误差项 i ∼ ALD ( 0,1, p ) 。 n 表示观测值的个数。 潜变量与我们观测到的响应变量 yi 存在一定的关系,且响应变量有 K 个指标。我们用割点向量 γ p 来反应
Bayesian Quantile Regression Associated with the Ordinal Data
Shaokai Yin, Litan Yan
Department of Mathematics, Donghua University, Shanghai Received: Dec. 7 , 2017; accepted: Dec. 22 , 2017; published: Dec. 29 , 2017
σ x µ + 1 − p log p , if 0 ≤ x ≤ p F −1 ( x; µ , σ , p ) = µ − σ log 1 − x , if p < x ≤ 1 1− p p
从上式中可以的到一个很重要的性质:
F −1 ( x; µ , σ , p )
x= p
Open Access
1. 引言
1978 年,Koenker and Bassett [1]首次提出了用分位数回归方法来描述因变量的条件分位数与自变量 之间的关系。分位数回归的提出引起了广泛的关注。分位数回归被广泛应用于农业、基因芯片技术、生 存研究、经济学、医疗卫生、环境科学等领域。 在分位数回归估计中,算法的实现起着至关重要的作用。分位数回归模型估计方法中较经典的方法 有 Yu 和 Moyeed 在 2001 年提出的单纯形法和内点法。其他的估计方法还有参数化方法和非参数方法。 有序数据在对事物分类的同时给出了各类的顺序,其数据仍表现为“类别”,但各类之间是有序的, 可以比较优劣但其数值的大小差值却无意义。 在大多数研究领域中都会用到有序数据。目前已有大量的文献对有序数据进行了研究,但是用贝叶 斯方法对有序数据进行分析目前还鲜少有人提及。
摘
要
对于一般的分位数回归模型,基于非对称拉普拉斯分布提出了关于有序数据的贝叶斯推理框架。指出了 非对称分布的尺度参数在估计中应该被参数化。给出选择尺度参数与模型参数的先验分布的条件,其后 验分布是真实概率分布,并采用吉布斯抽样法与马尔卡夫蒙特卡洛模拟方法进行参数估计。
文章引用: 尹绍锴, 闫理坦. 有序数据的贝叶斯分位数回归[J]. 统计学与应用, 2017, 6(5): 565-575. DOI: 10.12677/sa.2017.65064
(2)
=µ
(3)
即服从非对称拉普拉斯分布的随机变量在概率 p 处的分位数等于位置参数 µ 。 设 服从如下的线性回归模型,
= rt Q p ( rt | xt , β ) + ut , t = 1, 2,
,n
(4)
式 中 Q p ( rt | xt , β ) 是 在 观 测 到 xt 的 条 件 下, rt 在 p 概 率 水 平 下 的 分 位 数, β 是 参 数 向 量 , 误 差 项
Keywords
Bayesian Inference, Quantile Regression, Ordinal Data, Asymmetric Laplace Distribution, Gibbs Sampling
有序数据的贝叶斯分位数回归
尹绍锴,闫理坦
东华大学理学院,上海
收稿日期:2017年12月7日;录用日期:2017年பைடு நூலகம்2月22日;发布日期:2017年12月29日
1 − 2 p + 2 p2 1 1 = + 2 2 2 2 p p (1 − p ) (1 − p )
1 min g = ( p ) g= 8 2
566
证毕。
DOI: 10.12677/sa.2017.65064
统计学与应用
尹绍锴,闫理坦
如果随机变量 ξ ∼ ALD ( µ , σ , p ) ,则其分位数函数(分布函数的逆函数)为
∫−∞ f ( β ) dβ =
可得
∞
∞
0 = ∫−∞ ∫0 0dβ dσ < ∫−∞ ∫0 L ( r | β , σ ) f ( β ) f (σ ) dβ dσ γ p , j − xi′β p γ p , j −1 − xi′β p = ∏∏ FAL − FAL σ σ i 1= k 1 = ∞ ∞ 1 n p n (1 − p ) ∫−∞ f ( β ) dβ ∫0 f (σ ) n dσ = = ∞
{ut , t = 1, 2,
即 ut ∼ ALD ( 0, σ , p ) 。 依据非对称拉普拉斯分布的 , n} 相互独立且服从非对称拉普拉斯分布,
线性变换性质,式(4)可以等价表示为
rt ~ ALD ( Q p ( rt | xt , β ) , σ , p )
故 rt 的密度函数为:
f ( rt ; Q p ( rt | xt , β = ) ,σ , p )
Statistics and Application 统计学与应用, 2017, 6(5), 565-575 Published Online December 2017 in Hans. /journal/sa https:///10.12677/sa.2017.65064
尹绍锴,闫理坦
关键词
贝叶斯推断,分位数回归,有序数据,非对称拉普拉斯分布,吉布斯抽样
Copyright © 2017 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). /licenses/by/4.0/
(
)
(1)
其中 µ ∈ R 为位置参数, σ > 0 为尺度参数, 0 < p < 1 为偏度参数。
Ψ (σ , p ) ≥ 8σ 2 。 引理 如果随机变量 ξ ∼ ALD ( µ , σ , p ) 则其方差 Var (ξ ) =
证明 由于
E ( x) = = ∫−∞ xf ( x; µ , σ , p ) dx
∞
µ +σ
1− 2 p p (1 − p )
且
Ψ (σ , p ) =∫−∞ ( x − E (ξ ) ) f ( x; µ , σ , p ) dx =σ 2
∞ 2
1 − 2 p + 2 p2 p 2 (1 − p )
2
.
根据函数
g(p = )
其中 p ∈ ( 0,1) ,经计算可得
p∈[ 0,1]
∫0 f (σ ) σ n dσ < ∞
则参数的联合后验分布 π ( β , σ | r ) 是一个真实分布,即满足条件
0 < ∫−∞ ∫0 π ( β , σ | r ) dβ dσ < ∞
∞ ∞
∞
1
证明 根据式(6)与(7)有
π ( β , σ | r ) ∝ L ( r | β , σ ) f ( β ) f (σ )
π ( β , σ | r ) ∝ L ( r | β , σ ) f ( β ) f (σ )
(7)
在已知的文献中,如 Yu 等[2],在估计过程中将尺度参数设定为常数 1。但在实际应用中,将尺度参 数设为常数缺有欠妥当。若尺度参数定为常数 1,则随机变量的方差将不小 8。在实际的数据研究中这个 约束条件的存在并不合理。事实上,尺度参数的存在使得服从非对称拉普拉斯分布的随机变量的方差能 取任意正值。尺度参数影响了参数估计的质量,在实际的应用当中,它应该被当为待估参数去处理,而 不是主观地被设为某个常数。 对于分位数回归中的参数,它们不存在标准的共轭先验分布。这导致在贝叶斯推理中获取参数的后 验分布解析表达式有一定的困难。若选择的参数的先验分布能确保参数的后验分布为真实分布,我们就 可以利用 MCMC 模拟得到参数的估计。 在 Yu 的研究中[2],尺度参数为常数时,参数 β 的先验分布是非真实均匀分布,得到的联合后验分 布为真实分布。考虑到尺度参数的参数化,在无信息的前提下,参数的先验分布存在很多种可能,而被
= f ( β ) f (σ )
p n (1 − p ) 1 − σ σn
n
∑ ρ p ( rt − Qp ( rt | xt , β ) )
t =1
n
可以推知
1 0 < exp − σ
∑ ρ p ( rt − Qp ( rt | xt , β ) ) < 1,
t =1
th nd th
Abstract
In this paper, we introduce an ordinal Bayesian quantile regression model associated with the ordinal data based on asymmetric Laplace distribution. We show that the posterior distributions of estimated parameters always proper when the prior distributions are given, and we also give an efficient Gibbs sampling algorithm for fitting the model to such data. To illustrate this approach, we give a simulation and a real data example.