面板数据分位数回归的一个简单方法
面板数据的分位回归方法及其模拟研究三
面板数据的分位回归方法及其模拟研究(三)罗幼喜田茂再2012-10-15 10:50:32 来源:《统计研究》(京)2010年10期第81~87页四、真实数据分析我们以2004-2008年我国各地区城镇居民人均可支配收入x(元)和消费支出y(元)的面板数据为例,利用上述提出的分位回归方法对近5年来我国城镇居民收入消费模式进行建模分析,探讨居民人均可支配收入x对其消费支出y的影响,数据来源于《中国统计年鉴(2005-2009)》。
通过对总体数据作散点图容易看到y与x之间有比较明显的线性关系,所以可以考虑采用线性模型来刻画。
而通过横向散点图可以看到各地区y与x的斜率变化不大,但截距却有明显的不同,即各地区平均边际消费倾向差异不大,但自发消费存在着明显差异;从纵向散点图可以看到各年度y与x的关系基本相同,无论是斜率还是截距都没有发生太大变化,所以可以认为不存在时期效应。
首先考虑直接利用混合数据建立简单线性模型:LS估计的结果如表6。
表6LS估计值及显著性检验虽然从表6的结果来看,模型和参数都通过了显著性检验,可决系数也比较高,但残差分析图显示方差并不相等,而且残差值波动比较大,拟合效果并不好,这有可能是由于LS估计没有照顾到各地区可能存在的个体差异而引起的。
另外91号数据(广东省2008年)、92号数据(广东省2007年)和129号数据(西藏2005年)残差表现异常,这也使得上述β的LS估计在这些异常点的强影响下可能错估了平均边际消费水平。
考虑带个体固定效应的模型:从第三节的蒙特卡洛模拟结果来看,当模型判断正确时,FE估计是能够极大地改进LS估计的,对参数β的估计也具有较高的精度和稳定性,所以我们首先用FE估计法对参数进行估计,结果如下:表7FE估计值及显著性检验从表7结果来看,F值显著增加,模型的拟合优度也提高了很多(当然这也有部分原因是由于我们加入了新的解释变量而引起的)β的估计值也高度显著,残差分析图显示残差方差异常的情况消失了,而且残差呈现正态分布。
分位数回归方法及应用PPT18页
▪
26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭
▪
Байду номын сангаас
27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。——罗曼·罗兰
▪
28、知之者不如好之者,好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
▪
30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!
18
分位数回归方法及应用
16、人民应该为法律而战斗,就像为 了城墙 而战斗 一样。 ——赫 拉克利 特 17、人类对于不公正的行为加以指责 ,并非 因为他 们愿意 做出这 种行为 ,而是 惟恐自 己会成 为这种 行为的 牺牲者 。—— 柏拉图 18、制定法律法令,就是为了不让强 者做什 么事都 横行霸 道。— —奥维 德 19、法律是社会的习惯和思想的结晶 。—— 托·伍·威尔逊 20、人们嘴上挂着的法律,其真实含 义是财 富。— —爱献 生
分位数回归 分样本回归
分位数回归分样本回归一、基本概念分位数回归是一种回归分析方法,与传统的OLS回归不同,它能够揭示自变量对因变量在不同分位数上的影响。
在传统OLS回归中,我们只能得到因变量均值对自变量的影响,而分位数回归则能提供更加全面的信息。
分位数是指将一组数据按大小顺序排列后,划分为若干等份,每一份包含相同比例的数据。
例如,25%分位数就是将数据分为四份,每一份包含25%的数据。
二、应用场景分位数回归在经济学、社会科学等领域具有广泛的应用。
它能够帮助研究人员了解不同自变量对因变量在不同分位数上的影响程度,从而更好地理解数据背后的规律。
例如,在研究收入不平等问题时,传统OLS回归只能告诉我们收入水平对平均收入的影响,而分位数回归可以告诉我们不同收入水平下收入的分布情况,从而更全面地了解收入分配状况。
三、分位数回归分析步骤进行分位数回归分析一般需要以下几个步骤:1. 数据准备:收集所需的自变量和因变量数据,并进行必要的数据清洗和变量转换。
2. 模型设定:根据研究问题和数据特点,选择适当的分位数回归模型。
常用的模型包括线性分位数回归模型和非线性分位数回归模型。
3. 估计模型参数:利用最小二乘法或其他合适的方法,对模型进行估计,并得到各个分位数上的回归系数。
4. 模型诊断:对估计结果进行检验,包括残差分析、异方差性检验等,以确保模型的可靠性和有效性。
5. 结果解释:根据估计结果,解释自变量对因变量在不同分位数上的影响情况。
可以通过绘制分位数回归曲线或计算边际效应来展示结果。
四、分位数回归的优势和局限性分位数回归具有以下优势:1. 揭示了因变量在不同分位数上的影响情况,提供了更加全面的信息。
2. 对于非线性关系的建模更加灵活,适用性广泛。
然而,分位数回归也存在一些局限性:1. 对于数据量较小的样本,分位数回归可能会产生估计不准确的问题。
2. 分位数回归依赖于分位数的选择,不同的分位数选择可能会导致不同的结果。
五、总结分位数回归是一种重要的回归分析方法,能够揭示自变量对因变量在不同分位数上的影响。
【实证方法】分位数回归(QuantileRegression)
【实证方法】分位数回归(QuantileRegression)
以前的回归分析中,主要考察解释变量x对被解释变量y的条件均值E(y|x)的影响,此种方式属于均值回归。
但是我们主要关心的是x对整个条件分布的y|x的影响,条件均值E(y|x)只是刻画了条件分布y|x的集中趋势的一个指标而已。
如果能够估计条件分布的重要重要条件分位数,如中位数、1/4分位数、3/4分位数,则可以对y|x得到全面的认识。
同时传统的条件均值回归分析,容易受到极端值的影响。
所以提出分位数回归,分位数回归采用残差加权平均作为最小化的目标函数,不容易受到极端值的影响,结果相对较为稳健,同时分位数回归还提供了关于条件分布y|x的全面信息。
Stata命令
分位数回归相关的命令:
(1)只做一个分位数回归
qreg y x1 x2 x3(默认中位数回归)
qreg y x1 x2 x3,q() (分位数回归)
(2)使用自助法,只做一个分位数回归
Set seed 10101
Bsqreg y x1 x2 x3,q() reps()
(3)使用自助法,做多个分位数回归
Sqreg y x1 x2 x3,q(0.1 0.5 0.9) reps()
检验系数是否相等
Test [q10=q50=q90]:x1 (4)图形比较
安装grqreg命令
Set seed 10101
Bsqreg y x1 x2 x3,reps() q() Grqreg ,cons ci ols olsci
例证。
我国碳金融市场中碳交易价格的影响因素分析——基于面板分位数模型
我国碳金融市场中碳交易价格的影响因素分析——基于面板分位数模型我国碳金融市场中碳交易价格的影响因素分析——基于面板分位数模型摘要:碳交易作为实现低碳经济转型的重要手段之一,其交易价格的波动对于我国碳金融市场发展和碳减排的有效实施具有重要影响。
本文针对我国碳金融市场中碳交易价格的影响因素展开研究,采用面板分位数模型对影响因素进行分析并给出结果,为进一步完善碳金融市场体系和提高碳交易价格稳定性提供参考。
关键词:碳交易价格;碳金融市场;影响因素;面板分位数模型一、引言随着全球气候变化问题的日益严重,低碳经济已经成为全球各国共同关注和努力的目标。
而在实现低碳经济转型的过程中,碳交易作为一种市场化手段正在逐渐被引入并发展起来,而碳交易价格的波动对于碳金融市场的稳定运行和碳减排的有效实施具有重要的影响。
二、碳交易价格的基本特征碳交易价格是碳金融市场中最具影响力的指标之一,它的波动程度和趋势可以直接反映市场参与者对碳减排的期望和改变。
本节首先对碳交易价格的基本特征进行介绍。
1. 碳交易价格的波动性碳交易价格具有较高的波动性,这是由于碳交易市场的特殊性和碳减排政策的调整频率较高所致。
碳减排政策的变化和市场预期都会对碳交易价格产生重要影响,因此碳交易价格的波动也是合理的。
2. 碳交易价格的季节性变化碳交易价格在不同季节会出现不同程度的变化。
一方面,季节性能源需求的变化会导致碳交易价格在不同季节呈现出不同的走势。
另一方面,碳减排政策的执行和监管也会随着季节的变化而有所差异,从而对碳交易价格产生影响。
三、碳交易价格的影响因素碳交易价格的波动和变化受到诸多因素的影响。
本节主要分析了一些重要的影响因素,并通过面板分位数模型进行量化和分析。
1. 宏观经济因素宏观经济因素对碳交易价格具有重要的影响作用。
经济增长水平、人均收入水平、产业结构等因素都会对碳交易价格产生影响。
通过分析宏观经济变量与碳交易价格的相关性,可以更好地理解宏观经济对碳交易价格的影响。
我国农业保险发展影响因素的实证检验——基于面板数据分位数回归方法
一、引言我国的农业保险是专门为农业生产者在从事种植业、林业、畜牧业和渔业生产过程中由于保险标的遭受约定的自然灾害、意外事故、疫病或者疾病等保险事故所造成的财产损失承担赔偿责任的一种保险,旨在为农户的经济活动提供安全保障。
许多学者对我国农业保险的发展进行了研究。
王韧等(2008)对农业保险行为主体进行博弈分析后发现,我国农业风险损失程度极高,因而必须由政府实施补贴才能实现纳什均衡,只有通过制度供给来明确农业保险财政补贴的实施机制,充分地保证补贴资金来源,并提供相关服务推动措施,才能保证防范农业风险,确保农户收入的稳定。
黄英君(2011)运用计量经济学方法对我国农业保险的发展状况进行了实证研究,得出农民人均纯收入、农业保险保费收入与赔付支出同步变化的结论。
王秀芬等(2013)利用吉林省农户的调查数据研究了不同类型农户保险需求的影响因素,发现家庭纯收入水平对于纯农型农户对农业保险的需求有一定影响,对其他类型农户则没有影响。
聂荣等(2013)运用Logistic 模型,利用入户调查得到的数据从农户家庭经济条件、家庭务农情况、风险分担等角度对影响政策性农业保险的因素进行了实证研究。
张彤等(2014)通过对比辽宁省和贵州省的玉米种植保险,发现不同省份气候、自然灾害发生频率和地形等方面的差异导致了农业生产面临的风险,得出政府需要提供较高的保费补贴以降低农户的保费负担进而提高高费率地区农户参保积极性的结论。
叶明华等(2014)通过问卷调查对苏、皖、川地区农户的风险认知、保险意识和风险承担能力进行研究,发现这三方面互相存在显著相关性而且个体差异也很显著,认为应关注不同特征农户的多样化需求,提高农业保险的保障程度和范围。
黄亚林(2015)认为,农业保险作为对农业风险损失进行事后补偿的一种手段,对稳定和保障农户的生产行为、引导农户生产行为规模化、振兴农村经济有着非常积极的作用。
上述学者从多方面对农业保险进行了分析研究,对本文有重要的借鉴意义。
分位数回归及应用简介
分位数回归及应用简介分位数回归(Quantile Regression)是一种预测模型,与传统的最小二乘法回归(OLS regression)不同,它不仅可以估计数据的均值,还可以估计数据分布的其他分位数。
这种方法在处理不同分位数下的潜在差异时非常有用,因为它可以提供理解和预测在不同条件下的数据变化情况。
最小二乘法回归通过最小化预测值与实际值的平方差,给出一个数据分布的均值估计。
然而,由于数据的分布可能是非对称的,存在异常值或极端值,使用最小二乘法回归的均值估计可能不准确。
在这种情况下,分位数回归是一种更好的方法,因为它可以估计多个分位数,包括中位数(50%分位数)和极值(例如90%或95%分位数)。
分位数回归可以通过最小化损失函数来估计模型参数,常用的损失函数是加权绝对值损失函数。
这个损失函数对应的优化问题可以使用线性规划或非线性规划的方法求解。
通过计算不同分位数的估计结果,可以获得数据分布的详细信息。
分位数回归有一些应用的优势。
首先,它可以提供更全面的数据估计,对于非对称或含有异常值的数据分布具有更好的预测能力。
其次,分位数估计结果可以用来比较不同分位数处的特征变量对因变量的影响程度。
例如,在收入预测模型中,分位数回归可以帮助我们比较高收入人群和低收入人群对某个特征变量的影响程度。
此外,分位数回归还可以用于分析不同条件下的潜在差异,例如预测某个特征变量在不同行业、不同地区或不同时间段的变化情况。
分位数回归的应用非常广泛。
在经济学领域,它常被用于研究收入分布、贫富差距以及社会流动性等问题。
它还可以用于金融学中的风险评估和资产定价分析,其中分位数回归可以帮助我们理解极端事件的风险程度。
此外,分位数回归还可以在医学和社会科学领域中,用于研究不同群体或个体的特征与某个健康指标或社会指标的关系。
尽管分位数回归有许多优点,但也存在一些限制。
首先,分位数回归对于数据分布的假设较少,因此可以适用于各种类型的数据。
分位数回归参数估计 -回复
分位数回归参数估计-回复什么是分位数回归参数估计?分位数回归参数估计是一种统计方法,用于分析自变量与因变量之间关系的特殊情况。
与传统的最小二乘法不同,分位数回归在估计参数时关注的是因变量在不同分位数处的条件分布。
由于分位数回归方法考虑了因变量在不同分位数下的变化,它能提供更为全面和准确的分析结果,尤其适用于研究数据分布不均匀的情况。
如何进行分位数回归参数估计?下面将以一步一步的方式介绍如何进行分位数回归参数估计。
步骤一:数据准备首先,需要准备一组包含自变量和因变量的数据。
这些数据可以是数值型或者离散型的,但一般都需要是连续的数据。
确保数据集包括了自变量和因变量的所有观测值。
步骤二:选择分位数水平确定感兴趣的分位数水平。
分位数水平是指我们想要估计的分位数位置,例如10、25、50、75、90等。
确定分位数水平是为了了解该水平下的因变量对自变量的依赖程度。
步骤三:估计分位数回归参数通过最小化分位数损失函数来估计分位数回归参数。
分位数损失函数是通过比较实际观测值和分位数预测值的差异来衡量模型的拟合度。
一般情况下,我们使用最小绝对偏差估计法来估计分位数回归参数,这是一种鲁棒性较好的方法。
步骤四:进行推断分析在获得估计的参数后,可以进行推断分析,包括参数的显著性检验、置信区间估计等。
这些分析可以帮助我们对模型的有效性和参数的可信度进行评估。
步骤五:解释分位数回归结果最后,根据估计的分位数回归参数,解释自变量对因变量的影响。
可以分析不同分位数水平下自变量变化对因变量变化的影响程度。
这对于研究因变量分布中的特殊部分非常有用。
为什么使用分位数回归参数估计?传统的最小二乘法在估计参数时假设了因变量的条件分布是对称的,而分位数回归方法不对分布进行任何假设,能够更好地适应于现实世界中的数据分布。
因此,分位数回归方法在研究中应用广泛。
分位数回归参数估计能够帮助我们了解自变量对因变量的影响在不同分位数下的差异。
这对于研究数据的潜在机制和不同部分之间的关系具有重要意义。
分位数回归及应用简介
分位数回归及应用简介分位数回归是一种在统计学和经济学中常用的回归分析方法,它与传统的平凡最小二乘回归分析相比,更加适用于处理非正态分布、异方差和异常值等问题。
本文将对分位数回归的基本原理进行介绍,并探讨其在实际应用中的一些例子。
一、基本原理分位数回归是指通过对数据进行分位数划分,将不同分位数的回归干系进行建模和分析的方法。
在传统的回归分析中,我们通常关注的是条件均值(条件期望)的回归干系,而分位数回归则可以揭示在不同条件下,数据的不同分位数的回归干系。
以简易的线性回归为例,我们通常会建立一个关于自变量和因变量的条件均值模型,即通过最小化猜测值与实际观测值之间的平方差,得到最佳拟合直线。
而在分位数回归中,我们可以通过最小化猜测值与实际观测值的分位差,得到在不同分位数条件下的最佳拟合直线。
这样做的好处是能够更好地理解数据的分布状况,以及对不同条件下的不确定性进行建模和猜测。
二、实际应用1. 收入差距探究分位数回归常被用于探究收入差距的影响因素。
以中国为例,我们可以通过对个人收入数据的分位数回归分析,得到不同分位数收入的影响因素和差异。
探究发现,教育水平、工作阅历和性别等因素对于不同收入分位数的影响程度是不同的。
通过分位数回归,我们可以更全面地洞察不同收入群体之间的差距和不对等现象。
2. 健康状况评估分位数回归也可以用于对健康状况评估的探究。
例如,我们可以通过分位数回归分析,探讨不同健康指标(如体重指数、血压等)与不同健康分位数(如50%、70%)的干系,从而对健康状况进行更精细的刻画和猜测。
探究发现,不同健康指标对不同健康分位数的影响具有显著差异,分位数回归可以援助揭示这些差异。
3. 风险评估在金融风险评估中,分位数回归也有重要应用。
通过分位数回归,我们可以建立基于市场因素、公司基本面等的风险模型,猜测不同风险分位数下的收益变化。
这对于投资组合的构建和风险管理具有重要意义。
探究表明,通过引入分位数回归,能够更准确地预估金融市场的风险暴露和收益猜测。
分位数回归及应用简介
分位数回归及应用简介一、本文概述分位数回归是一种统计学中的回归分析方法,它扩展了传统的均值回归模型,以揭示自变量和因变量之间的非线性关系。
本文将简要介绍分位数回归的基本原理、方法及其在各种领域中的应用。
我们将概述分位数回归的基本概念和数学模型,解释其如何适应不同的数据分布和异质性。
接着,我们将讨论分位数回归的统计性质和估计方法,包括其稳健性、灵活性和有效性。
我们将通过实例展示分位数回归在经济学、医学、环境科学等领域中的实际应用,并探讨其未来的发展前景和挑战。
通过本文的阐述,读者可以对分位数回归有更深入的理解,并了解其在处理复杂数据分析问题中的潜力和价值。
二、分位数回归的基本理论分位数回归(Quantile Regression)是统计学中的一种回归分析方法,它不同于传统的最小二乘法回归,旨在估计因变量的条件分位数与自变量之间的关系。
最小二乘法回归主要关注因变量的条件均值,而分位数回归则能够提供更为全面的信息,包括条件中位数、四分位数等。
分位数回归的基本理论建立在分位数函数的基础上,分位数函数是描述随机变量在某个特定概率水平下的取值。
在分位数回归模型中,自变量通过一组参数β影响因变量Y的条件分位数。
这些参数β是通过最小化因变量的实际值与预测值之间的某种损失函数来估计的。
分位数回归的优点在于,它对于因变量的分布假设较为宽松,不需要满足正态分布或同方差性等假设。
分位数回归对异常值和离群点的影响较小,因此具有较高的稳健性。
这使得分位数回归在处理具有复杂分布和非线性关系的实际问题时表现出色。
分位数回归的估计方法主要有线性规划法、单纯形法和非线性规划法等。
这些方法的选择取决于具体的研究问题和数据特点。
在实际应用中,分位数回归通常与一些机器学习算法相结合,如随机森林、支持向量机等,以提高模型的预测精度和泛化能力。
分位数回归在金融、医学、环境科学等领域有着广泛的应用。
例如,在金融领域,分位数回归可以用于预测股票价格的风险价值(VaR)和预期损失(ES),帮助投资者进行风险管理。
4.面板分位数回归模型
(25)
3 研究过程——竞争模型及评价方法
经济上的评价: 一般地,最优投资组合的有效边界的构建有两种等同的方式: (1)不同水平的投资组合风险价值下的期望收益最大化。 (2)不同水平的投资组合期望收益下的风险价值最小化。
(26)
3 研究过程——竞争模型及评价方法
3 研究过程——竞争模型及评价方法
原始的计算VaR的参数方法:
(17)
投资组合的波动率:
(18)
因此我们可以计算给定投资组合的风险价值比率(%VaR):
(19)
(20)
(21)
3 研究过程——竞争模型及评价方法
统计上的评价: 对于绝对表现的评价本文采用CAViaR检验,定义“hit”:
(22) (23) (24)
3 研究过程——仿真研究
样本内拟合:下表展示了三个模型在经济角度看最重要的四个分位数5%、 10%、90%、95%的估计结果(Monte-Carlo模拟):
显著 显著,但系数小于上面的
系数跟PQR-RV基本一样 系数小且不显著
3 研究过程——仿真研究
样本外表现(无条件覆盖的测量和CAViaR检验):
CAViaR检验 无条件覆 盖的测量
红框内的是各分位数上平均偏差最小的值,除了50%以外,PQR和UQR在各分位数上的平均偏差基 本上是最小的。这几个模型除了50%以外,平均偏差均是接近0的,表明没有模型是systematically misspecified的。
3 研究过程——仿真研究
样本外表现(Diebol-Mariano检验):
(2)另外一个吸引点是维度的减少,因为估计参数的数量总是小于或等 于k+n(k是回归量,n是资产的数量)。
分位数回归方法及其应用
p
( y x )
i 1 i i
得到参数估计值。而一般线性条件分位数函数 为 Q( |X=x)=x ( ) ,通过求解 得到参数估计 值 n
ˆ ( ) argmin R
p
( y
对于任意的 (0,1) ,估计 ( ) 称为第 分位 数下的回归系数估计。
ˆ
p
n
1.单纯形算法(Simplex Method):该算法估计出来的参 数具有很好的稳定性,但是在处理大型数据时运算的 速度会显著的降低(见Koenker and Orey,1993)。 2.内点算法(Interior Point Method):内点算法对于那 些具有大量观察值和少量变量的数据集运算效率很高 (见Portnoy and Koenker, 1997)。 3.平滑算法 (Smoothing Method):平滑算法在理论上 比较简单,它适合处理具有大量观察值以及很多变量 的数据集 (见Chen, 2004) 。 其他方法: 如adaptive method 等。
分位数回归模型的拟合优度
Koenker与Machado(1999)依据最小二乘回归中拟合 2 优度 R 的计算思想,提出了分位数回归中拟合优度的 计算方法,定义为 R1 ( ) ,且 0 R1 ( ) 1 。
R 2 依据残 差平方和度量了回归平 最小二乘回归中的
方和占总离差平方和的比重,而 R1 ( ) 则按照残差绝 对值的加权和,度量了在某个分位数 下分位数回归的 拟合效果。因此不像 反映的是整个分布的拟合情况, 描述的是在某个分位数下的局部拟合效果。
第二部分:应用实例分析
主要结合应用实例,介绍如何利用统计 软件实现分位数回归,如何对研究结果 进行解释和分析。
契约实施效率与FDI——基于中国省际面板数据的分位数回归
关键 词 : 契约 实施 效率 ; F D I ; 分位 数 回归
一
、
引 言
力 成本 、 市场规 模 和基础 没施 等 因素对 F D I 有着 显 著的影 响 。另 外 ,还有 一些 学者 研究 了制度 因素对 F D I 的作用
改 革 开 放 以 来 .伴 随 着 日益 强 烈 的 经 济 全 球 化 趋 势 .
本 文 的 分 析 与 以 上 文 献 有 三 处 重 要 不 同 首 先 . 本 文 着 重强调 契约 实施 制 度对 F D I 的影 响 : 其 次 本 文 研 究 了 一 国内 部各 地 区之 间的 契约 实施 效 率差 异 导致 F D 1 在 区 域
部 沿 海 地 区 .其 中长 三角 、珠 三 角 和环 渤 海地 区又 占了
外 商 直接投 资 ( F D I ) 大 量进 入我 国 大量 研究 和经 济现 实 A g o d o ( 1 9 7 8 ) 考 察 了美 国制 造业 企 业 在 非洲 的 投 资情 况 .
表明, F DI 有 效 地 弥 补 了 我 国 在 资 本 形 成 、 出 口 竞 争 力 和 发 现 稳 定 的 政 治 和 有 利 于 资 的 政 策 环 境 能 促 进 F D I的 技 术进 步方 面 的不 足 . 成 为 促 进 我 国 经 济 增 长 的 重 要 推 动
区, 对 于我 国经济 发展 、 缩 小 地 区 差 距 具 有 重 要 的 意 义 是
之 间 的契 约实 施效 率存 在较 大 的差异 . 跨 国公 司往 往选 择
最 适 合 其 战 略 目标 地 区 进 行 投 资 . 所 以研 究 F D I 在一国内
何 原 因导致 我 国 F D 1 分 布 的东西差 异? 影响 F D I 流 入 的 因 部 的 区 域 差 异 比 起 国 家 层 次 上 的 研 究 可 能 更 有 意 义 最
12.第九讲 面板数据回归.
面板数据,简言之是时间序列和截面数据的 混合。严格地讲是指对一组个体(如居民、 国家、公司等) 连续观察多期得到的资料。 所以很多时候我们也称其为“追踪资料”。 近年来,由于面板数据资料的获得变得相对 容易,使其应用范围也不断扩大。
1996-2002年中国15个省级地区的居民家庭人均消费数 据(不变价格) (例一)
-2
-1 x y
0 Fitted values
1
2
reg y x
0
10
20
30
40
-2
-1 x y Fitted values Fitted values
0
1 Fitted values Fitted values
2
gen d1=0 gen d2=0 gen d3=0 replace d1=1 if id==1 replace d2=1 if id==2 replace d3=1 if id==3 reg y x d1 d2
2
2 2 2
1951
1952 1953 1954
588.2
645.5 641 459.3
2289.5
2159.4 2031.3 2115.5
3
3 3 3
1951
1952 1953 1954
135.2
157.3 179.5 189.6
1819.4
2079.7 2371.6 2759.9
在stata中,首先使用xtset命令指定个 体特征和时间特征,然后可以用xtdes命 令显示面板数据的结构。 use fatality,clear xtset state year xtdes
面板数据的格式(例二)
company 1 1 year 1951 1952 invest 755.9 891.2 mvalue 4833 4924.9
面板数据回归分析步骤
面板数据回归分析步骤面板数据的分析方法或许我们已经了解许多了,但是到底有没有一个基本的步骤呢?那些步骤是必须的?这些都是我们在研究的过程中需要考虑的,而且又是很实在的问题。
面板单位根检验如何进行?协整检验呢?什么情况下要进行模型的修正?面板模型回归形式的选择?如何更有效的进行回归?诸如此类的问题我们应该如何去分析并一一解决?以下是我近期对面板数据研究后做出的一个简要总结,和大家分享一下,也希望大家都进来讨论讨论。
步骤一:分析数据的平稳性(单位根检验)按照正规程序,面板数据模型在回归前需检验数据的平稳性。
李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。
这种情况称为称为虚假回归或伪回归(spurious regression)。
他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。
因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。
因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。
而检验数据平稳性最常用的办法就是单位根检验。
首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。
单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。
后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。
Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250 之间,截面数介于10~250 之间) 的面板单位根检验。
面板数据门限分位数回归模型及应用
足括号内的条件时,I (×) = 1 ,否则 I (×) = 0 。
1.2 参数估计
PTQR 模型的参数估计可通过优化式(2)得到:
( ) θ̂1(τ)θ̂ 2(τ)θ̂ 3(τ)γ̂ 1(τ)γ̂ 2(τ)
( ) =
arg
θ1
min
θ2 θ3 γ1
γ2
S
(θ1
τ
θ2
åå ( ( | )) N T
(
τ
)
θ
3(
τ
)
γ1(
τ
)
γ
2(
τ
))
=
arg
θ1
min
θ2 θ3 γ1
γ2
i
=
1
t
=
1
ρ
τ
yit - Qyit
τ
xit
(2)
其 中 ,S(θ1(τ)、θ2(τ)、θ3(τ)、γ1(τ)、γ2(τ)) 为 目 标 函
数;ρτ(u) 为非对称损失函数,满足:
{ ρτ(u) =
τu, u ³ 0
(1 - τ)u, u < 0
二个门限值 γ̂ 2(τ) 是基于第一个门限值 γ̂ 1(τ) 确定存在的
条件下获得的,具有一致性;但估计的第一个门限值是基
于假定无门限的条件下,利用加权的绝对偏差和最小获得
的,不具有一致性。因此,需对第一个门限值 γ̂ 1(τ) 进行重 新估计。选取集合 Γ1 中小于第二个门限估计值 γ̂ 2(τ) 的
(1)
( | ) 其中,τ(0 < τ < 1) 为分位点;Qyit τ xit 表示给定 xit 条
件下 yit 的第 τ 条件分位数;γ1(τ) 和 γ2(τ) 为门限值,α(τ)
分位数回归.
2、不同分位点拟合曲线的比较# 散点图attach(engel) # 打开engel数据集,直接运行其中的列名,就可以调用相应列plot(income,foodexp,cex=0.25,type="n", # 画图,说明①xlab="Household Income", ylab="Food Expenditure")points(income,foodexp,cex=0.5,col="blue") # 添加点,点的大小为0.5abline( rq(foodexp ~ income, tau=0.5), col="blue" ) # 画中位数回归的拟合直线,颜色蓝abline( lm(foodexp ~ income), lty = 2, col="red" ) # 画普通最小二乘法拟合直线,颜色红taus = c(0.05, 0.1, 0.25, 0.75, 0.9, 0.95)for(i in 1:length(taus)){ # 绘制不同分位点下的拟合直线,颜色为灰色abline( rq(foodexp ~ income, tau=taus[i]), col="gray" )}detach(engel)3、穷人和富人的消费分布比较# 比较穷人(收入在10%分位点的那个人)和富人(收入在90%分位点的那个人)的估计结果# rq函数中,tau不在[0,1]时,表示按最细的分位点划分方式得到分位点序列z = rq(foodexp ~ income, tau=-1)z$sol # 这里包含了每个分位点下的系数估计结果x.poor = quantile(income, 0.1) # 10%分位点的收入x.rich = quantile(income, 0.9) # 90%分位点的收入ps = z$sol[1,] # 每个分位点的tau值qs.poor = c( c(1,x.poor) %*% z$sol[4:5,] ) # 10%分位点的收入的消费估计值qs.rich = c( c(1,x.rich) %*% z$sol[4:5,] ) # 90%分位点的收入的消费估计值windows(, 10,5)par(mfrow=c(1,2)) # 把绘图区域划分为一行两列plot(c(ps,ps),c(qs.poor,qs.rich),type="n", # type=”n”表示初始化图形区域,但不画图xlab=expression(tau), ylab="quantile")plot(stepfun(ps,c(qs.poor[1],qs.poor)), do.points=F,add=T)plot(stepfun(ps,c(qs.poor[1],qs.rich)), do.points=F,add=T, col.hor="gray", col.vert="gray")ps.wts = ( c(0,diff(ps)) + c(diff(ps),0) )/2ap = akj(qs.poor, z=qs.poor, p=ps.wts)ar = akj(qs.rich, z=qs.rich, p=ps.wts)plot(c(qs.poor,qs.rich), c(ap$dens, ar$dens),type="n", xlab="Food Expenditure", ylab="Density")lines(qs.rich,ar$dens,col="gray")lines(qs.poor,ap$dens,col="black")legend("topright", c("poor","rich"), lty=c(1,1),col=c("black","gray"))上图表示收入(income)为10%分位点处(poor,穷人)和90%分位点处(rich,富人)的食品支出的比较。