断点回归和指数效应

合集下载

stata模糊断点回归结果解读

【知识文章】标题：深度解读stata模糊断点回归结果在统计分析领域，断点回归是一种常用的分析方法，能够帮助研究人员在研究数据中找到关键的转折点或阈值，从而更好地理解现象背后的规律。

而在实际应用中，stata软件提供了模糊断点回归分析的功能，更加贴近实际情况，对于研究人员来说是一个非常有用的工具。

本文将深度解读stata模糊断点回归结果，帮助读者更好地理解该分析方法的有效性和结果解释。

一、基本概念1.1 模糊断点回归模糊断点回归是一种用于发现数据中的结构转变的分析方法，相比传统的断点回归更加灵活和智能。

它能够针对数据的不确定性进行分析，帮助研究人员更好地理解数据中的变化规律。

1.2 staa软件及其应用stata是一种专业的统计分析软件，广泛应用于学术研究和商业领域。

它提供了丰富的统计分析功能，包括模糊断点回归分析，在实际数据分析中有较高的可靠性和灵活性。

二、结果解读2.1 模糊断点的确定在进行模糊断点回归分析时，首先需要确定数据中的模糊断点位置。

通过stata软件的分析工具，可以得到数据中的潜在断点位置及其置信区间，帮助研究人员更好地理解数据的结构变化。

2.2 断点处的效应估计在确定了模糊断点位置后，接下来需要对断点处的效应进行估计。

stata软件能够提供准确的效应估计值和显著性检验结果，帮助研究人员判断断点处的效应是否显著，从而更好地理解数据的变化规律。

2.3 结果的解释和应用通过对模糊断点回归结果的深度分析，研究人员可以更好地解释数据中存在的潜在断点和其影响，从而为进一步的研究和决策提供依据。

stata软件提供了直观的结果展示和解释功能，帮助研究人员更好地应用分析结果。

三、个人观点和总结在实际研究和数据分析中，模糊断点回归分析是一种非常有用的方法，能够帮助研究人员更好地理解数据中的结构变化和规律。

而stata软件提供了便捷和可靠的分析工具，能够有效支持模糊断点回归分析的实施和结果解释。

对于研究人员来说，掌握stata模糊断点回归分析的方法和技巧，能够更好地发掘数据的潜在规律和价值，为实际决策和研究提供更有力的支持。

我从断点回归的研究论文中学到

我从断点回归的研究论文中学到
我从断点回归的研究论文中学到断点回归(Regression Discont inuity)是仅次于随机实验的,能够有效利用现实约束条件分析变量之间因果关系的实证方法。

断点回归的原理是“通过断点处一个天然跳跃造成关注变量的跳跃，从而识别因果”，换句话说，没有断点事件的干扰，这个变量本来会按它原本趋势继续下去。

这就让我想到了DID，DID原理是有两个具有平行性趋势的组，在经过一个特殊事件后，treatment group 的增长趋势发生改变，我们识别的就是treatment和control在事件后增长趋势的差异。

那么，断点回归就是DID的一个特殊案例，假设为control和treatment事件前趋势完全相同（都是它自己）且连续，事件后，treatment group发生了变化，treatment发生的变化完全是由于这一个事件引起的；目前我们掌握的是，control group事件前数据和treatment group事件后数据，由于我们的前提假设，趋势相同且连续，我们可以推断出control group原本应具有的事件后趋势，从而比较treatment和control的区别，得出事件具体影响效果。

断点回归方法的应用

一引言2010年4月24日，该年度的约翰·贝茨·克拉克奖章（John Bates Clark Medal）——针对40岁以下年轻经济学者的最高荣誉，授予了麻省理工学院经济系的Esther Duflo教授以表彰其在随机实验普及和其在发展经济学中应用方面的卓越贡献。

在因果关系分析的实证方法中，最优的选择应当为随机实验，但是随机实验的时间成本和经济成本都比较高，而在随机实验不可得的情况下，需要考虑使用其它方法。

断点回归（Regression Discontinuity）便是仅次于随机实验的，能够有效利用现实约束条件分析变量之间因果关系的实证方法。

Lee（2008）认为在随机实验不可得的情况下，断点回归能够避免参数估计的内生性问题，从而真实反映出变量之间的因果关系。

然而，断点回归也仅仅是在20世纪90年代末才被应用于处理经济学的问题。

2001年，Hahn等人对断点回归模型的识别和估计的理论问题进行了严格细致的分析，此后，断点回归才在众多的经济学研究领域中崭露头角。

时至今日，断点回归已经在劳动和教育经济学、政治经济学、环境经济学和发展经济学等领域取得了广泛的应用。

然而，断点回归却鲜为中国经济学者所应用，正是基于断点回归在实证研究中的重要性和国内文献的缺乏，本文拟以此为背景，从断点回归的理论、发展历史、实证步骤和经济学中的应用几个方面阐述断点回归这一个新“拟随机试验”方法的兴起。

二断点回归理论及发展历史断点回归是一种拟随机实验，此种随机实验定义了这样一个特征，即接受处置（Treatment）的概率是一个或者几个变量的间断函数。

Hahn et al.（2001）提出了断点回归的首要假设，如果变量表示处置效应，表示决定处置的关键变量，那么和必须存在，并且。

在使用断点回归的情况下，存在一个变量，如果该变量大于一个临界值时，个体接受处置，而在该变量小于临界值时，个体不接受处置。

一般而言，个体在接受处置的情况下，无法观测到其没有接受处置的情况，而在断点回归中，小于临界值的个体可以作为一个很好的可控组（Control Group）来反映个体没有接受处置时的情况，尤其是在变量连续的情况下，临界值附近样本的差别可以很好的反映处置和经济变量之间的因果联系。

stata断点回归结果解读

stata断点回归结果解读引言：断点回归是一种常用的统计方法，用于研究自变量对因变量的影响是否存在阈值效应。

Stata是一款流行的统计软件，可以进行断点回归分析并得出相应的结果。

本文将介绍如何解读Stata断点回归的结果，以帮助读者更好地理解和应用这一方法。

一、断点回归模型的基本原理断点回归模型是一种非线性回归模型，它假设自变量对因变量的影响在某个阈值点发生突变。

在Stata中，我们可以使用命令"regress"来拟合断点回归模型，并通过"margins"命令计算出相应的边际效应。

二、断点回归结果的解读1. 断点位置的确定在进行断点回归分析时，首先需要确定断点的位置。

Stata提供了一种自动选择断点的方法，即"rdrobust"命令。

该命令可以根据数据的特征自动选择最佳的断点位置，并给出相应的结果。

在解读断点回归结果时，需要注意断点位置的确定是否合理，是否与实际情况相符。

2. 断点效应的解读断点回归结果中最重要的是断点效应的解读。

断点效应可以通过计算边际效应来得到。

边际效应表示因变量在自变量达到断点时的变化情况。

在Stata中，可以使用"margins"命令来计算边际效应。

通过观察边际效应的符号和大小，可以判断断点对因变量的影响方向和程度。

3. 断点回归的显著性检验在解读断点回归结果时，还需要进行显著性检验。

Stata提供了多种方法来进行显著性检验，如t检验、F检验等。

通过观察p值的大小，可以判断断点回归结果是否显著。

一般来说，p值小于0.05可以认为结果是显著的。

4. 断点回归的模型拟合度除了断点效应和显著性检验外，还需要考虑断点回归模型的拟合度。

在Stata中，可以使用R方值来评估模型的拟合度。

R方值越接近1，说明模型的拟合度越好。

通过观察R方值，可以判断断点回归模型的拟合程度。

三、断点回归结果的应用1. 确定政策效果断点回归方法常用于评估政策效果。

模糊断点回归估计系数推导

模糊断点回归估计系数推导
模糊断点回归（FuzzyRegressionDiscontinuity）是一种在回归模型中使用断点方法来估计因果效应的方法。

在模糊断
点回归中，我们将特定变量（通常是一个连续变量）作为待估
计效应的“断点”，通过比较断点两侧的数据来估计因果效应。

1.设定断点：首先，我们需要选择一个自变量作为断点，并
且假设该变量存在一个连续的断点。

通常情况下，我们会根据
经验或理论来选择一个断点。

2.构建回归模型：然后，我们需要构建一个回归模型来估计
因果效应。

通常情况下，我们会使用线性回归模型或非参数回
归模型。

3.分组观察样本：接下来，根据自变量与断点的关系将样本
数据分为两个组：位于断点两侧的组。

这样我们就可以比较两
个组之间的差异，以估计因果效应。

4.进行回归分析：然后，我们使用回归模型对两个组的数据
进行回归分析。

具体地，我们将断点作为一个自变量加入回归
模型中，以及其他相关的控制变量，然后进行回归拟合。

5.估计因果效应：最后，我们利用回归模型的拟合结果来估
计因果效应。

一般来说，我们关注的是断点处因变量的差异，
也就是断点两侧的预测值之间的差异。

需要注意的是，模糊断点回归的核心在于寻找一个恰当的断点，以及合理地构建回归模型。

如果断点选择不当或者回归模型不恰当，估计的因果效应可能会有偏差。

因此，在进行模糊断点回归时，我们需要仔细选择合适的断点和回归模型，并进行必要的敏感性分析和稳健性检验，以确保估计的可靠性和有效性。

断点回归法事件研究法

断点回归法事件研究法断点回归法（Breakpoint Regression Analysis）是一种常用的事件研究方法，在金融学、经济学、管理学等领域得到广泛应用。

本文将介绍断点回归法的基本概念、原理和应用，并探讨其优缺点。

一、断点回归法的基本概念断点回归法是一种用于研究某个事件对特定变量的影响的统计方法。

该方法通过在时间序列数据中选择一个或多个断点，将数据分为两个或多个子样本，然后对每个子样本进行回归分析，从而比较不同子样本之间的差异。

这种方法能够帮助研究者判断某个事件对变量的影响是否存在、是否显著，并进一步分析影响的程度和方向。

二、断点回归法的原理断点回归法的核心原理是基于时间序列数据中存在的某个结构性断点，该断点可能是由于政策改变、市场变动、经济周期变化等原因引起的。

研究者通过设定断点，将样本数据分为两个或多个子样本，然后对每个子样本进行回归分析。

在分析中，需要控制其他可能影响结果的变量，以确保所得的结果是由所关注的事件引起的。

三、断点回归法的应用断点回归法在金融学、经济学、管理学等领域有广泛的应用。

例如，在金融市场中，研究者可以使用断点回归法来分析某个重大事件对股票市场的影响。

他们可以选择一个事件作为断点，将数据分为事件前后两个子样本，然后对每个子样本进行回归分析，以比较事件前后的差异。

这样可以帮助研究者了解事件对股票价格、交易量等指标的影响程度和方向。

四、断点回归法的优缺点断点回归法具有一定的优点和缺点。

其优点在于可以通过选择合适的断点，准确地判断事件对变量的影响，并量化影响的程度和方向。

此外，断点回归法能够更好地控制其他可能的干扰变量，提高分析结果的可靠性。

然而，该方法也存在一些缺点，如对断点的选择比较主观，需要研究者具备一定的经验和专业知识；另外，断点回归法只能检测到存在结构性断点的影响，对于连续性变化的影响则无法有效分析。

断点回归法是一种常用的事件研究方法，通过选择断点，将样本数据分为两个或多个子样本，并对每个子样本进行回归分析，以比较不同子样本之间的差异。

断点回归方法及其应用

断点回归方法及其应用下载温馨提示:该文档是我店铺精心编制而成，希望大家下载以后，能够帮助大家解决实际的问题。

文档下载后可定制随意修改，请根据实际需要进行相应的调整和使用，谢谢!并且，本店铺为大家提供各种各样类型的实用资料，如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等，如想了解不同资料格式和写法，敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!断点回归方法及其应用断点回归方法是一种用于分析因果关系的方法，通过对处理组和对照组进行划分，并利用断点回归分析处理效应。

社会科学研究中的断点回归设计

社会科学研究中的断点回归设计
断点回归设计是社会科学研究中常用的一种方法，旨在探究某个自变量在一个或多个特定阈值点发生变化时，对因变量产生的影响。

在断点回归设计中，研究者首先选择一个或多个自变量作为断点，并通过对该自变量的某个或多个阈值点进行分割，将样本观测值划分为低于、高于或等于阈值的不同组别。

然后，通过运用回归分析，分别对每个组别进行回归分析，以探究自变量在不同组别中对因变量的影响。

主要应用领域包括经济学、教育学、社会学等社会科学领域。

例如，在经济学中，研究者可能对所得水平进行断点回归分析，以探究所得对消费行为的影响是否存在非线性关系。

断点回归设计的优点包括能够识别自变量与因变量之间的不同关系模式，帮助理解自变量对因变量的影响方式；同时，通过考察阈值点，还可以揭示政策或实践上的相关意义。

然而，断点回归设计也存在一些限制和挑战。

例如，确定合适的阈值点需要在理论和实证的基础上进行推断，具有一定的主观性和不确定性；此外，样本选择和内生性问题也可能对分析结果产生影响。

总而言之，断点回归设计是一种用于社会科学研究中探究自变量对因变量影响的方法，其在研究领域中应用广泛，可以帮助研究者更深入地理解相关关系，并为政策制定提供参考依据。

《因果推断实用计量方法》大学教学课件--第12章-断点回归

方法，虽然它使用的是观测数据而非真正的实验数据。
断点回归的数据要求
断点回归的数据要求一
断点回归的数据需要包含3个基本变量
✓ 配置变量（ Assignment Variable ），也称作驱动变量（ Forcing Variables,
Running Variables）：配置变量是个体的一个连续特征变量，匹配变量的值
• 接受治疗的平均潜在健康状况 1 和收入关系的函数为
1 =
• 未接受治疗的平均潜在健康状况 0 和收入关系的函数为
0 =
• 给定收入水平，病人平均治疗效果为
τ = 1 − 0 = −
• 本文利用美国企业成立工会投票事件来估计工会对债券价格的因果影响。当
成立工会投票结果公布后，企业的债券价格会对投票结果做出反映，RDD的方
法是通过比较工会得票率在50%左右企业的债券价格变化来估计工会的影响。
变量
• 配置变量（vote_for_share）：支持成立工会的得票率；
• 断点：得票率为50%。如果支持工会成立得票率大于或等于50%，企业必须成
(5.2) 局部多项式回归（rdrobust）
多项式次数
带宽选择
权重选择
RDD运用实例
文章背景
• 文章引用：Murillo Campello, Janet Gao, Jiaping Qiu, and Yue Zhang, "Bankruptcy
and the Cost of Organized Labor: Evidence from Union Elections," Review of
(1) , ≤ 50

断点回归(RD)学习手册

断点回归（RD）学习手册断点回归由Thistlewaite and Campbell(1960)首次使用，但直到1990年代末才引起经济学家的重视。

Thistlethwaite、Campbell于1960年首次提出使用断点回归设计研究处理效应，在该文中他们的目的是研究奖学金对于未来学业的影响, 学生是否获得奖学金取决于考试的分数。

由于奖学金由学习成绩决定，故成绩刚好达到获奖标准与差一点达到的学生具有可比性。

如果考试分数大于获奖标准分数, 则进入处理组；如果考试分数小于获奖标准分数, 则进入控制组。

因此处理变量在获奖标准分数处形成了一个断点，该研究设计的主要思想是可以利用靠近这一断点附近的样本来有效估计处理效应。

Angrist and Lavy(1999)在研究班级规模对成绩的影响时，利用以色列教育系统的一项制度进行断点回归；该制度限定班级规模的上限为40名学生，一旦超过40名学生（比如41名学生），则该班级被一分为二。

此后30年, 该方法并未引起学术界的重视，直到1990年以后, 断点回归设计开始被应用于各种领域，并且近年来成为因果分析和政策评估领域最重要的研究方法。

Hahn et al(2001)提供了断点回归在计量经济学理论基础。

目前，断点回归在教育经济学、劳动经济学、健康经济学、政治经济学以及区域经济学的应用仍方兴未艾。

参见Imbens and Lemieux(2008)，Van Der Klaauw(2008)以及Lee and Lemieux(2010)的文献综述。

断点回归设计是一种准自然实验, 其基本思想是存在一个连续变量, 该变量能决定个体在某一临界点两侧接受政策干预的概率, 由于X在该临界点两侧是连续的，因此个体针对X的取值落入该临界点任意一侧是随机发生的, 即不存在人为操控使得个体落入某一侧的概率更大, 则在临界值附近构成了一个准自然实验。

一般将该连续变量X称为分组变量 (assignment variable) 。

断点回归量化研究方法

断点回归量化研究方法断点回归分析是一种常用的量化研究方法，用于分析在某个特定点发生突变对因果关系的影响。

它是一种因果研究设计，可用于评估某个政策或干预措施对特定变量的影响效果。

在这篇文章中，我们将介绍断点回归量化研究方法的基本原理和步骤，以及其在实践中的应用。

断点回归分析的基本原理是针对某一变量，通过在某个特定点将样本分为两组，比较两组之间的变化趋势来评估该变量对结果的影响。

为了实现这一目标，我们需要进行以下步骤：第一步是确定断点的选择。

断点通常是根据理论或确定性的阈值来选择的，它代表了某个变量从一个状态转变到另一个状态的临界点。

例如，我们可能想要分析某个政策对收入的影响，那么我们可以将政策实施的时间作为断点。

第二步是构建回归模型。

我们将因变量作为感兴趣的结果，自变量作为断点变量，并控制其他潜在的影响因素，例如个体特征或外部环境变量。

然后，我们可以使用线性回归等统计方法对模型进行估计。

第三步是进行断点估计。

为了获得关于断点附近的效应估计，我们可以在断点前后选择一个相对较小的区间，然后比较两个区间的回归系数是否有显著差异。

通常使用断点回归模型进行拟合，然后利用假设检验来评估估计的统计显著性。

在实践中，断点回归分析方法被广泛应用于多个研究领域。

例如，在经济学中，研究者可能使用断点回归方法来评估某个政策对就业率或经济增长的影响；在教育学中，研究者可能使用该方法来评估某个教育政策对学生学业成绩的影响。

断点回归方法的优势在于可以从统计上对特定变量的影响进行量化评估，并提供了一种因果推断的方式。

然而，它也存在一些限制。

首先，断点的选择可能会对结果产生较大的影响，因此需要仔细考虑。

其次，断点回归方法对数据的要求较高，需要足够的样本量和完整的数据。

总结起来，断点回归量化研究方法是一种寻找变量影响阈值的有效方法，可以帮助研究者评估某个政策或干预措施对特定变量的影响效果。

通过选择合适的断点，并建立适当的回归模型，我们可以得到关于断点附近效应的量化估计。

断点回归方法

断点回归方法嘿，咱今儿来聊聊断点回归方法。

这玩意儿啊，就像是一把神奇的钥匙，能帮咱打开好多知识宝库的大门呢！你想想看，生活中很多事情不就像是有个断点似的嘛。

比如说，考试及格线就是个断点呀，过了及格线那感觉肯定不一样，就好像进入了另一个境界。

断点回归方法呢，就是专门来研究这种断点前后变化的。

它就像是个超级侦探，能把那些因为断点而产生的细微变化都给揪出来。

比如说，政策上有个小小的改变，在断点前后，人们的行为或者某些现象可能就会有很大的不同。

断点回归方法就能把这些不同给分析得透透的。

咱可以打个比方啊，就好比是跑步比赛。

在起跑线这儿就是个断点，没到起跑线的时候大家都在准备，到了起跑线后，那可就开跑啦！断点回归方法能看出来起跑前后大家的状态变化，是不是很厉害？这方法在好多领域都能大显身手呢！像经济学、社会学这些领域，经常要研究一些政策或者事件带来的影响。

这时候，断点回归方法就派上大用场啦。

它能让那些隐藏的影响无所遁形。

你说它是不是很神奇？就像有一双慧眼，能看穿一切似的。

而且啊，它还特别靠谱，得出的结论让人信服。

那怎么用这断点回归方法呢？这可得好好琢磨琢磨。

就像做菜一样，得有合适的材料，合适的步骤，才能做出美味的菜肴。

断点回归方法也是，要选对数据，设计好研究方案，一步一步来，才能得出有价值的结果。

比如说，咱要研究一个地区实行新政策后的效果。

那就要找到断点，也就是政策实施的那个时间点。

然后对比断点前后的各种数据，看看有啥不一样。

这可不能马虎，得仔细认真，就跟侦探破案似的，不能放过任何一个小细节。

总之呢，断点回归方法是个特别有用的工具。

它能让我们更好地理解世界，理解那些看似平常但其实蕴含着大道理的现象。

咱可得好好掌握它，让它为咱的学习和工作助力呀！所以啊，断点回归方法真的是值得我们好好去研究和运用的，你说是不是呢？。

断点回归法名词解释

断点回归法名词解释
断点回归法是一种可以用来应对数据和观测值之间的线性关系
的回归统计学方法。

其主要应用是在观测数据中模型化变量之间的关系，以捕捉变量之间的线性关系。

断点回归法是一种基于变量之间的有效回归，它通过将观测值映射到不同的值来确定断点，然后再用一条线形拟合所有断点，进而建立以变量之间的关系的模型。

断点回归的主要目的是将数据分组，以便能够更好地探索数据之间的关系。

该方法是将观测量分组，然后用最为适当的断点来分组。

断点的挑选非常重要，因为有些断点可能会更有效地捕捉回归方程的趋势，而有些断点可能会给模型带来麻烦。

断点回归法可以被用来预测结果，对比单变量回归模型，断点回归可以更准确地预测并识别数据之间的关系。

当数据之间存在重大变化时，断点回归可以有效地识别出数据的变化，因为它允许在变量之间使用不同的断点。

与单变量回归模型相比，断点回归法更有可能穿过重要的断点点，从而可以更准确地模拟复杂的数据回归。

断点回归法还可以应用于反应可能在某一特定断点处突然发生
变化的过程。

例如，对于探究学校环境对学习成绩的影响，断点回归可以帮助我们发现一个突变点，这一点表明在此断点处学校环境与学生成绩之间的关系发生了突变。

断点回归法可以帮助我们深入探究变量之间的关系，可以更准确地预测结果，也可以帮助我们发现和识别重大变化点。

因此，断点回归法被认为是一种有效的统计学方法，可以帮助我们研究数据之间的
关系，并可以有效解决一些复杂的统计学问题。

断点回归的例子

断点回归的例子
断点回归是一种常见的统计方法，它假设样本在断点处被随机分组，然后估计处理效应。

下面是一个断点回归的例子：
高考分数线为492分，对于高考成绩为489、490、491、492、493、494的考生，他们在各方面（不可观测因素）没有系统差异，甚至可以认为他们的成绩具有一定的随机性。

有的考生发挥好，成绩为492、493、494，达到了录取分数线（处理组）；有的考生运气差点，成绩为489、490、491，未达到录取分数线（控制组）。

对于水平差不多的考生，若考生蒙对一道选择题，可能就考上了大学；相反，若考生蒙错一题，可能就上不了本科。

对于分数在492附近的考生能否考上大学，好像是上天在进行掷硬币的随机分组。

在这个例子中，断点为492分，考生的高考成绩落在（492-θ,492+θ）之间，好像是被随机分组了一般。

断点回归得到的结论一般不能推广至其他样本，在进行精确断点回归之前，首先要知道平均处理效应LATE。

这个例子只是断点回归的一个简单应用，在实际应用中，断点回归可以用于各种场景，例如政策实施效果评估、医疗效果评估等。

断点回归控制变量回归系数

断点回归控制变量回归系数
断点回归（Regression Discontinuity Design，RDD）是一种非实验性的研究方法，用于估计一个变量对另一个变量的因果效应。

在断点回归中，如果一个变量在某个特定的阈值处发生跳跃，那么我们可以通过观察这个跳跃点附近的观察值来估计该变量的效应。

控制变量（Control Variables）在回归分析中用于帮助估计自变量对因变量的影响，并控制其他可能的干扰因素的影响。

控制变量的选择应基于理论和研究的假设，并能够解释因变量的变异。

控制变量回归系数（Control Variable Regression Coefficients）是指在回归分析中，控制变量对因变量的影响程度。

控制变量的回归系数可以用于估计其效应的大小和方向，以及检验其是否显著。

在断点回归中，控制变量回归系数的解释和常规回归分析中的解释类似。

如果一个控制变量在断点附近的回归系数显著，那么可以认为该控制变量对因变量有显著影响。

同时，通过比较控制变量在断点附近和非断点附近的回归系数，可以评估该控制变量对因变量的因果效应。

需要注意的是，在断点回归中，控制变量的选择和回归系数的解释应谨慎。

由于断点回归是一种非实验性的研究方法，因此无法完全排除其他干扰因素的影响。

因此，在解释控制变量回归系数时，应考虑到其他可能的干扰因素，并进行充分的讨论和检验。

rd did 研究方法

rd did 研究方法
RD（断点回归）和DID（双重差分）是两种常用的研究方法，用于处理某些类型的问题，例如内生性问题、选择偏差等。

1. 断点回归（RD）：这是一种类似于随机受控实验的准实验法。

它通过找到一个断点，使得处于断点左侧的观测值与断点右侧的观测值在处理效应上近似相等，来估计处理效应。

这种方法可以在一定程度上控制选择偏差和内生性问题。

2. 双重差分（DID）：这是一种在政策评估研究中广泛应用的方法。

它的基本思想是，允许存在不可观测因素的影响，但假定这些因素是不随时间变化的。

通过比较处理组和对照组在政策实施前后的变化差异，可以估计政策的净效应。

DID 方法可以控制某些共同趋势和选择偏差，但在使用时需要注意其假设条件的合理性。

此外，还有工具变量法、倾向匹配方法等其他处理内生性问题的方法。

这些方法各有特点，使用时需要根据具体问题和数据特点进行选择。

断点回归法

断点回归法断点回归法是数理统计中一种常见的估计方法，可以用来估计某条数据记录在不同数据点上的状态变化情况。

这种统计方法在很多领域都得到了应用，在分析社会经济数据、物理研究以及医学研究中尤为有用，因其能从不同的角度展现数据的趋势变化以及其隐藏的函数关系的特点。

一、断点回归法的历史演变断点回归法是从弗里曼-格里利贝克斯（Friedman-Griliches）在20世纪50年代提出的批处理估计（batch estimation）演变而来。

弗里曼-格里利贝克斯认为，每个观察点（observation point）存在着一定的差异性，所以若想要估计某一不断变化的状态，就需要用到多个观察点（observation point）。

1972年英国统计学家柏林（ Berliner）将这一想法运用到数据处理的技术中，提出了断点回归法的概念，即使用多个观察点（observation point）来估计一段不断变化的状态。

二、断点回归法的基本概念断点回归法是一种将数据分割为几个断点（break point），并在每个断点上建立回归模型的方法。

它可以从不同的角度描述一系列数据的变化状态，从而把一段时间的变化状态划分为几个阶段，每个阶段的变化趋势可以根据不同的数据集使用回归模型来估计。

三、断点回归法的运用实例当需要估计数据变化状态时，断点回归法可以很好地满足这种需求。

比如，在某段时间内，研究人员可能需要分析一段时间内某城市人口变化情况，从而估计城市发展趋势。

这时，就可以使用断点回归法，先从不同的角度去描述某段时间内城市人口的变化情况，比如城市的工业发展、科技进步、社会发展等，然后根据不同的阶段建立回归模型，从而可以估计城市发展的趋势。

四、断点回归法的优缺点断点回归法的一大优点在于能够从不同的角度描述数据变化情况，可以清晰地表现某种数据变化的特点，也能准确反映出数据隐藏的函数关系。

另外，断点回归法也有其缺点，比如在确定断点（break point）时可能会存在一些误差，从而影响最终的估计结果，而且在建立回归模型时也可能会出现欠拟合现象，影响准确性。

stata做断点回归结果解读

stata做断点回归结果解读
断点回归是一种计量经济学方法，常用于分析连续变量在某一个特定点处的变化情况，例如政策出台前后的变化、不同收入水平下的消费行为等。

使用Stata进行断点回归的结果解读，需要重点关注以下几个方面：
- 断点位置：观察断点的估计值，及其在统计上是否显著。

如果断点位置的估计值在统计上显著，则说明在该点处，因变量的变化趋势可能发生了变化。

- 效应大小：比较断点两侧因变量的均值差异，以及相应的统计显著性水平。

如果差异显著，则说明因变量在该点处的变化幅度较大。

- 显著性检验：检查模型的整体显著性，以及各变量的显著性水平。

如果模型显著，并且各变量的显著性水平较高，则说明模型的拟合效果较好。

- 预测能力：根据模型的预测值与实际值之间的差异，评估模型的预测能力。

如果模型的预测误差较小，则说明模型的预测能力较强。

在进行断点回归结果解读时，需要综合考虑以上各方面的结果，并结合实际问题进行分析和解释。

如果需要更详细的解释和分析，可以考虑咨询专业的统计学家或经济学家。

断点回归及其在经济学中的应用

断点回归及其在经济学中的应用一引言2010年4月24日,该年度的约翰·贝茨·克拉克奖章JohnBatesClarkMedal——针对40岁以下年轻经济学者的最高荣誉,授予了麻省理工学院经济系的EstherDuflo教授以表彰其在随机实验普及和其在发展经济学中应用方面的卓越贡献;在因果关系分析的实证方法中,最优的选择应当为随机实验,但是随机实验的时间成本和经济成本都比较高,而在随机实验不可得的情况下,需要考虑使用其它方法;断点回归RegressionDiscontinuity便是仅次于随机实验的,能够有效利用现实约束条件分析变量之间因果关系的实证方法;Lee2008认为在随机实验不可得的情况下,断点回归能够避免参数估计的内生性问题,从而真实反映出变量之间的因果关系;然而,断点回归也仅仅是在20世纪90年代末才被应用于处理经济学的问题;2001年,Hahn等人对断点回归模型的识别和估计的理论问题进行了严格细致的分析,此后,断点回归才在众多的经济学研究领域中崭露头角;时至今日,断点回归已经在劳动和教育经济学、政治经济学、环境经济学和发展经济学等领域取得了广泛的应用;然而,断点回归却鲜为中国经济学者所应用,正是基于断点回归在实证研究中的重要性和国内文献的缺乏,本文拟以此为背景,从断点回归的理论、发展历史、实证步骤和经济学中的应用几个方面阐述断点回归这一个新“拟随机试验”方法的兴起;二断点回归理论及发展历史断点回归是一种拟随机实验,此种随机实验定义了这样一个特征,即接受处置Treatment的概率是一个或者几个变量的间断函数;Hahnetal.2001提出了断点回归的首要假设,如果变量表示处置效应,表示决定处置的关键变量,那么和必须存在,并且;在使用断点回归的情况下,存在一个变量,如果该变量大于一个临界值时,个体接受处置,而在该变量小于临界值时,个体不接受处置;一般而言,个体在接受处置的情况下,无法观测到其没有接受处置的情况,而在断点回归中,小于临界值的个体可以作为一个很好的可控组ControlGroup来反映个体没有接受处置时的情况,尤其是在变量连续的情况下,临界值附近样本的差别可以很好的反映处置和经济变量之间的因果联系;断点回归可以分为两类,第一类,临界值是确定的Sharp,即在临界值一侧的所有的观测点都接受了处置,反之,在临界值另一侧的所有观测点都没有接受处置;此时,接受处置的概率从临界值一侧的0跳转到另一侧的1；第二类,临界点是模糊的Fussy,即在临界值附近,接受处置的概率是单调变化的;Hahnetal.2001在一定的假设下,证明了无论是哪一类型的断点回归,都可以利用临界值附近样本的系统性变化来研究处置和其它经济变量之间的因果关系;断点回归首先是由美国西北大学的心理学家Campbell于1958年首先发展设计出来的,从那时开始直到二十世纪80年代,Campbell和西北大学心理学系和统计学系的同事一直从事断点回归的设计和研究工作;Thistlethwaite和Campbell1960正式发表了第一篇关于断点回归的论文,他们提出断点回归是在非实验的情况下处理处置效应TreatmentEffects的一种有效的方法,主要应用于心理学和教育学领域;随后,Campbell和Stanley1963为断点回归提供了更加清晰化的概念,但是由于他们并没有给出断点回归统计上的证明;在他们看来,断点回归主要是为了解决选择性偏误SelectionBias问题,断点回归利用了一个取决于某连续变量的间断函数,这个间断函数完全决定了个体是否受到处置,这就使得样本选择的细节完全展示出来,使得我们知道样本选择的问题所在;此外,Campbell和Stanley还认为断点回归仅仅是在间断的临界值处类似于随机实验,其推论的有效性也仅仅局限于间断的临界值处;整个20世纪60年代,断点回归方法的应用还停留在一种直觉的推导,而缺乏统计上严密的证明;Goldberger1972a,b曾对断点回归的无偏因果推断进行了证明,可惜的是,他的论文并没有得到发表,这主要是因为他认为断点回归的适用环境是一个高度理想化的环境,其适用范围十分有限;相反,变量之间因果关系的推断还包括了工具变量法IVApproach和Heckman处理样本选择问题的模型,这两种方法的适用性更加广泛,从而使得人们忽视了断点回归方法的应用,也使得断点回归在很长一段时间内消失在人们的视野之中;随着Campbell等人所认为的断点回归适用性仅仅局限于临界值附近这一论断被证伪之后,断点回归才开始重新回到人们的视野之中;Rubin1977证明了在个体是否接受处置仅仅取决于一个关键变量的情况下,处置效应能够在关键变量的整个范围内得到无偏的因果推断;Sacks和Ylvisaker1978提出了断点回归的估计方法,并在理论上给予了较粗略的证明;他们将被解释变量分解为观察变量的线性组合再加上一个非随机的误差项,其估计方法类似于局部非参数回归LocalNonparametricRegression,其有效性不仅仅是对于临界值附近的样本,而且可以扩展到关键变量的整个领域;断点回归在理论方面取得了新进展的同时,其它因果推断方法的不足之处也逐渐的被认识到;比如,工具变量法存在局限性,特别是排他性Excludability条件难以满足,即难以保证工具变量仅仅通过影响关键解释变量而影响到被解释变量,寻找合适的工具变量存在一定的困难;此外,Lalonde1985发现Heckman样本选择模型并不能产生和随机实验一样的结果;正因为因果关系的推断是经济学家所关注的最主要的问题,并且现有的因果推断方法都不能得出完全合理的因果关系,人们开始逐渐将目光转向了断点回归;Trochim1984继续了他老师Campbell的工作,Trochim综合了之前关于断点回归的理论和方法,并且将断点回归类型分为两类,第一类是确定型的断点回归SharpRegressionDiscontinuity,即个体在临界值一边接受处置效应的概率为1,而在临界值另一边接受处置效应的概率为0；第二类是模糊型的断点回归FuzzyRegressionDiscontinuity,即个体接受处置效应的概率均大于0小于1,个体在临界值一边接受处置的概率大于在临界值另一边接受处置的概率;Trochim特别对第二类断点回归问题进行了研究,并开始利用该方法进行实证研究;与Campbell观点不同,Trochim认为断点回归的应用性并非那么的狭隘,相反,其应用范围还十分的广泛;除此之外,他还强调了决定处置的关键变量不仅仅可以是一个单一变量,而且还可以是一个合成变量;随后,断点回归的优势逐渐被学界所认可,其应用也愈加广泛;具体而言,其优势包括两方面：第一,断点回归可以应用于出于对经济成本和伦理道德问题的考虑,随机实验不能进行的环境；第二,断点回归优越于所有其它已知的因果推断方法,其结果十分接近于随机实验结果,Lee和Lemieux2010也通过形象的例子展示了断点回归和随机实验的相似性;Hahnetal2001最终为断点回归的模型识别和模型估计进行了严格意义上的理论证明,并提出了相应的估计方法,由此,断点回归在经济学中的应用如雨后春笋般出现在重要经济学文献中;三断点回归的实施步骤一确定型断点回归运用图形来分析处置效应是否存在是断点回归分析的基础;图形分析在断点回归的实施中扮演着重要的角色,通过将样本点和决定处置的关键变量在坐标系中描述出来,便可以清楚的看到临界值附近的样本点是否存在跳跃;如果样本点存在跳跃,那么说明确实存在处置效应,相反,如果样本点没有出现相应的跳跃,那么说明断点回归的模型识别可能存在问题;当我们从图形分析中发现了临界值处存在处置效应,那么就应当做进一步更加细致的计量实证分析;为了使图形更为直观,需要根据决定处置的关键变量来划分箱体Bin和箱体的范围,并在该范围内计算变量的均值;一般而言,箱体的范围需要大到包含足够多的样本使其样本点在临界值两边都比较平滑,但又要小到一定程度使得样本点在临界值处的跳跃能够明显的显现出来;Lee和Lemieux2010提出两种方法来选择合适的箱体范围;第一种是根据对数据的观察决定使用个箱体；然后对个箱体的虚拟变量做回归；随后,将箱体范围缩小二分之一,使得箱体由个变为个,将个箱体的虚拟变量作为解释变量再做一次回归;由于使用个箱体虚拟变量的回归是内嵌于使用个箱体虚拟变量的回归之中的,因此,可以使用标准的F检验来比判断个箱体和个箱体的优劣;第二种方法是基于这样一个原理,如果箱体足够的小,那么被解释变量和决定处置的关键变量将不会出现系统的联系,因此,可以将被解释变量对箱体的虚拟变量以及该虚拟变量和决定处置的关键变量的乘积项做回归,并使用F检验来判断虚拟变量和关键变量的乘积项是否显着的为0;通过以上方法得到合适箱体范围后,便可以分别对临界值两边的样本进行估计,得到临界值两边的平滑曲线,具体实施步骤如下：第一步,构造箱体,,其中为临界值,为箱体的范围；其次,计算每一个箱体中的样本数量,,其中为决定处置的关键变量；再次,求出每个箱体的平均值,；最后,画出和二者之间的曲线关系; 第二步,同时利用临界值两边的样本进行回归;这就好比在非参数回归中使用了rectangular的核,选取叶宽bandwidth,将样本的估计局限在范围内;一般而言,可以使用非参数回归,但是如Hahnetal.2001指出的,非参数回归会产生高阶数的偏差,简单的非参数估计往往并不具有吸引力,所以对于样本的回归可以采取局部线性回归LocalLinearRegression,即最小化下式：这其中存在叶宽选择的问题,Hahn等2001提出最优的叶宽与成比例;例如,样本增加32倍,那么为1/2,叶宽就可以减少一半,但是这并没有解决如何选择叶宽的问题;计量经济学和统计学的文献中有两种选择叶宽的方法：第一种方法是根据拇指规则RuleofThumb对整个样本的数据进行估计以求得最优叶宽;比如,对于rectangular的核,最优叶宽可以根据下式求出：其中是断点回归的标准差,表示断点回归方程的二阶导数,是断点回归方程估计时的范围,是使用rectangular核估计的常数;另一种方法是交叉验证法cross-validation,即首先对临界值两边的样本分别进行回归,得到：交叉验证准则即为选择合适的叶宽以最小化：此外,断点回归中也可以加入其它的控制变量,如此做的原因是消除小样本偏差,同时使得估计更为精确;具体而言：如果控制变量的以为条件的分布在临界值处是连续的,那么的加入对处置效应的估计几乎没有影响,因为是独立于处置效应的；同时,只要接近临界值,那么的加入并不会对估计的偏差产生任何影响,但是,实际应用中,样本的选择往往并不能保证足够接近于临界值,因此,在计量模型中加入控制变量可以消除这些由于这些额外变量造成的偏差,并且,如果与被解释变量有关,控制变量的加入还可以改进估计的精确性;第三步,对断点回归的结果进行稳健性检验;首先,需要检验其它控制变量在临界值处是否存在跳跃,如果其它的控制变量在临界值处存在显着的跳跃,那么被解释变量在临界值处的跳跃将不仅仅是由于处置效应所带来的,这使得断点回归不能进行有效的因果推断；其次,需要检验决定处置的关键变量的条件密度是否存在不连续的情况,如果条件密度发生了跳跃,那么说明存在个体操作关键变量的可能;为此,可以计算每个箱体中样本的数量,将其作为纵轴,将关键变量作为横轴,通过图形和回归分析来考察关键变量的分布在临界值处是否存在跳跃;如果存在跳跃,则个体可能存在操作处置的可能,从而使断点回归方法失效；再次,需要检验当临界值取其它值时,变量是否存在跳跃;如果变量不仅在临界值处存在跳跃,而且也在其他值处存在跳跃,那么变量的跳跃是由处置效应造成的这一推断就值得怀疑,可能还存在其它因素决定了变量在临界值处的跳跃；最后,需要在计量模型估计时,使用不同的叶宽,并且分别考虑加控制变量和不加控制变量的情况,以此来考察不同的计量模型形式是否对结论产生了显着的变化; 二模糊型断点回归第一步,与确定型断点回归一样,运用图形来分析变量是否存在跳跃以及个体在临界值处接受处置的概率是否存在跳跃;第二步,使用两阶段最小二乘TSLS的方法来估计处置效应;具体步骤如下：首先根据下式求出和,其中;然后,利用和之比求出处置效应;由于,模糊型断点回归中需要进行两次计量回归求出和,因此最优叶宽的选择需要同时考虑这两次回归的结果,Lee2008提出使用以下的准则来求出最优叶宽：第三步,对断点回归的结果进行稳健性检验;检验步骤与确定型断点回归一样;四断点回归在经济学中的应用一劳动和教育经济学领域由于在劳动力市场和教育部门中,政府外生制定的政策和法规种类较多,所以断点回归在劳动和教育经济学领域中的应用十分常见;Angrist和Lavy1999利用以色列教育制度对班级大小的规定,即班级大小必须小于等于40人,如果超过40人,必须将原来的班级分成两个班级,通过断点回归来研究班级的大小对学生成绩和教育质量的影响,他们发现班级学生人数越小,其学生的考试成绩越好;Black1999利用家庭所属入学区不同这一特征,将入学区之间临界线两侧的样本作为研究对象,作者使用了享乐价格函数HedonicPriceFunction估计了入学区之间存在的教育质量差异对房屋价格的影响,并以此考察了为获得更优质的教育,家庭的支付意愿,其研究结果表明,如果小孩测试分数提高5%,家长愿意多支付%;Hoxby2000运用断点回归研究了班级大小对教育质量的影响,他同样利用了Angrist和Lavy1999所使用的政府对班级大小的规定,并考虑到入学对年龄的要求会导致不同年级的人数会有差别,而这差别又会对班级大小产生影响这一机制,其实证结果并没有支持Angrist和Lavy1999的结果;Lalive2007,2008使用断点回归研究了失业工人补贴时限的延长对劳动力市场的影响,由于奥地利对50岁以上失业人员补贴的时限与50岁以下失业人员补贴时限不一致,因此,通过比较50岁上下失业人员的情况,就可以发现这种失业补贴时限不一致对失业时间以及新找工作的待遇和类型的影响；同时,由于这种政策的实施还存在地理位置上的差异,因此,通过比较地区间临界线两侧的样本同样可以发现失业补贴时限对失业的影响,作者证实了补贴时限越长,工人失业的时间就越长;Chiang2009利用了美国弗罗里达州实施的对教学质量没有达标的学校进行惩罚这一规定,使用断点回归的方法研究了这种激励措施对教学质量的直接影响,他发现受益于这种激励,学校的教学质量,特别是学生的数学成绩有了一定幅度的改进,同时,学校也加大了教学基础设施建设、实验工具和老师培训方面的支出;Clark2009利用了英国中学必须获得学生家长一定份额的票数才能进行自治这一规定,通过断点回归研究了通过投票方式获得自治的学校和没有获得自治的学校在教学质量上的差别,他发现得到自治权的学校在考试通过率上表现更好;雷晓燕等2010利用了中国政府对退休年龄的规定,运用断点回归的方法分析了退休对健康的影响,他们发现在正常退休年龄退休对男性健康有显着的负面影响,相反,这种负面影响并没有在女性群体表现出来;二政治经济学领域在政治经济学研究领域中,由于政党选举通常需要得到一定的选票,而获得多少选票可以当选是由法律规章制度预先设定的,因此,存在一个当选与不当选的选票临界值;断点回归便是利用了这一临界值附近的样本来考察选民对政策的影响、在职者的政治优势和政府的开支等等一系列问题;在美国众议院选举中,一个政党如果能够获得所属选区50%以上的选票,那么就能够赢得该选区的选举;Leeetal.2004利用了50%得票率是获选与否的关键决定因素这一特征考察了选民对竞选者政策选择的影响;现有理论中存在两种关于选举对政策影响的观点,第一种观点认为,竞选者倾向于采取符合处于中位数选民偏好的政策,即所谓的唐斯收敛效应DownsianConvergenceEffect；第二种观点认为,考虑到政治家的承诺在选举后并不能完全兑现,选民倾向于选择当前最有利于他们权益的政策,Lee等人通过考察竞选者面临相近的选票时,即选举的压力加大时,是否会改变自己所提倡的政策,其实证结果表明唐斯收敛效应并不存在;相反,选民会在两党竞选者中选择出制定了对自己最有利政策的竞选者;在同样的背景下,Lee2008也利用了必须获得50%以上选票当选这一个规则,使用了断点回归方法研究了美国众议院在职者是否会利用本次当选所得到的权利,从而有利于在下一届众议院选举中再次当选这个问题,他发现众议院的在职者赢得下一次选举的概率更大;Albouy2009以美国两党制为背景,研究了国会包括参议院和众议院议员的党派身份对联邦政府在国会议员所属区域支出的影响,由于一个党派在参议院和众议院获得超过50%选票便能够成为该院占多数的党派,进而能够对议案的通过产生影响,因此,50%的选票便是一个临界值,通过比较临界值附近的样本差异,便可以得到获得国会多数席位的国会议员党派身份对联邦政府的支出的影响,他的研究结果表明,在国会获得多数席位的议员党派往往能够为该党派议员所属州争取更多的政府支出,并且对于不同的党派身份,这种政府支出的表现形式还存在差异,当共和党获得国会多数席位时,其议员所属州将会得到更多的国防开支,而当民主党获得国会多数席位时,其议员所属州将会得到更多教育和城市发展方面的政府开支;Ferreira和Gyourko2009同样使用断点回归的方法分析了政党选举对政治经济的影响;与之前研究不同的是,他们使用的是美国城市的数据,考察的对象是市长的选举,其研究结果表明,在职者仍然能够以较大概率赢得下一任的选举,但是国会选举所表现出来的党派政治对政策和经济的显着影响这一结论并不适用于市长选举,此时,党派政治对市政府的规模、公共品的支出和犯罪率并没有明显的影响,他们认为这其中的原因在于城市之间较强的同质性和城市之间的竞争使得党派政治对政策和经济的影响有所削弱,同时也使得竞选者的承诺更为可信;三环境经济学领域在环境污染方面,许多国家都颁布了相关的政策和法令来控制日益严重的环境问题,这也提供了可以利用断点回归进行政策分析和研究的背景;Chay和Greenstone2005使用了断点回归的方法研究了人们对避免空气污染的支付意愿,美国政府于二十世纪70年代颁布了清洁空气法案CleanAirActs,即一个地区如果污染程度超过联邦政府所制定的临界值,那么环保局会将该地区视为未达标地区,从而使得该地区面临更为严格的监管;因此,联邦政府为地区污染所制定的排放临界值便成为实证研究中的一个间断点,通过比较超过排放临界值地区和未超过排放临界值地区的房价水平,他们发现,受到环保局更严格监管地区的悬浮颗粒总量会有所下降,并且悬浮颗粒总量每下降1,地区的房价便会提高;Davis2008利用了墨西哥城于1989年实行的名为HoyNoCircula的项目,即每周车辆将根据其牌照最后一位数字而被限行一天,运用断点回归的方法研究了这一车辆限行政策对空气质量的影响,他发现车辆限行政策并没有改善当地的空气质量,相反,车辆限行提高了未被限行车辆的使用率,同时人们也转而使用高排放量的车辆;Greenstone和Gallagher2008使用断点回归的方法研究了1980年美国国会通过的并由卡特总统签署的综合环境反应、赔偿和责任法案ComprehensiveEnvironmentalResponse,Compensation,andLiabilit yAct,CERCLA所产生的经济价值,CERCLA赋予环保局对污染物质排放超标或对公共健康和环境构成威胁的地区实行环境清洁计划的权利,因此,污染物质排放水平便成为关键变量,它决定着一个地区是否实行了环境清洁计划,通过比较实行环境清洁计划地区和未实行环境清洁计划地区的房价和房屋租金,他们发现如果一个地区实行了环境清洁计划,那么20年后,该地区的房屋财产价值将会增加四千两百万美元,并且居住人口也会显着增加;Almondetal.2009研究了中国使用暖气的政策对地方环境污染的影响,在1950-1980年间,由于财政不足以令全国各地都经由免费煤炭供给使用暖气,因此,在中国,只有淮河和秦岭以北的地区能够得到免费的煤炭供给使用暖气,这项政策的实施使得以淮河和秦岭为界的南北地区空气污染程度产生了显着的差别,他们使用断点回归的方法对这一问题进行了细致的研究,其研究结果表明淮河和秦岭以北的地区空气中悬浮颗粒总量明显高于淮河和秦岭以南的地区,并且北方悬浮颗粒总量的指标是美国的5-8倍; 四发展经济学领域断点回归在发展经济学领域中的应用主要利用了各个地区行政区域划分的特点;Dell2008利用断点回归的方法研究了历史制度对区域经济影响的持久性,并考察了历史制度影响当前经济绩效的渠道;玻利维亚和秘鲁的执政者在16世纪西班牙殖民地时期,均在波托西Potosi银矿和万卡维利卡Huancavelica水银矿地区实行了名为Mita 的征收劳工制度,即执政者要求征用各个地区男性人口的七分之一用于开采银矿和水银矿,如果一个地区与矿产的距离较远,那么来回运输和监督成本就会很高,因此,出于对经济利益的考虑,一个地区是否实行了Mita制度在很大程度上取决于该地区与矿产距离的远近,通过比较Mita制度实行区域与未实行区域之间临界线两侧的样本,Dell发现Mita制度的实施减少了当前地区消费的32%,并且Mita 制度主要通过影响产权界定和公共物品的提供两个渠道影响到了当前的地区经济绩效;余静文和赵大利2010,余静文和王春超2010也利用了城市圈形成依赖于中心城市的辐射涓滴作用这一特性;如果一个地区距离中心城市较远,那么通过产业对接、产业互补和资源的重新配置发挥中心城市带动周边地区经济发展的辐射效应就会有所减弱,因此城市圈的划分与一个地区距离中心城市的远近相关,通过比较城。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

断点回归和指数效应
2015-10-08 金融学前沿论文速递
这是“金融学前沿论文速递”第177篇推送
选文:谢晓飞审稿:李娜编辑:张凡
仅用于学术交流，原文版权归原作者和原发刊所有，转载请注明出处
由Yen-Cheng Chang、Harrison Hong和InessaLiskovich共同撰写的Review of Financial Studies 2015年第1期文章“Regression Discontinuity and the Price Effects of Stock Market Indexing”采用Russell 1000和Russell 2000这两个指数之间交接处的独特样本研究了指数效应。

指数效应，指某只股票被纳入/剔除指数成份股后，其股价会上升/下降的现象。

Russell 1000和2000指数的成份股是按照市值排序最大的前1000家公司和随后的2000家公司。

排在第1000名前后的公司，只要市值稍稍变动就可能从一个指数移动到另一个指数中去。

由于指数以市值加权，因此追踪Russell 2000指数中最大股票的资金比追踪Russell 1000指数中最小股票的资金多。

文章利用这个不连续性，用断点回归方法发现了明显的指数效应：当股票从Russell 1000被纳入Russell 2000指数会导致价格上涨；而从Russell 2000中剔除到Russell 1000会导致价格下跌。

文章还研究了指数效应的时间趋势以及揭示了为指数交易者提供流动性的投资者类型。

虽然指数效应的研究众多，但已有研究还存在若干问题。

第一，有关指数效应是否真存在的问题。

传统研究方法认为纳入指数的股票存在指数纳入效应，因其与非纳入的控制组（一般为市场组合）的区别仅在于购买需求（纳入指数的股票会受到追踪指数的被动型投资者大量购买），因而推论应是股票的需求曲线向下倾斜。

这一推论与传统的有效市场假说相悖（假设股票的替代资产很多因而其需求曲线平直）。

后续研究提供了股票需求曲线向下倾斜的证据，但仍有一些问题待解：首先，纳入和剔除效应的具体大小尚未揭示（指数效应的论证中还混杂着其他潜在原因，已有研究揭示被纳入指数的股票有收益提升，但并未揭示多少提升是由于纳入指数而非基本面好或吸引关注等所造成）；其次，纳入和剔除效应有什么不同没有研究（受研究样本和方法所限，少有研究关注剔除效应）。

第二，有关指数效应时间趋势的问题。

现有研究用一次性事件很难分离购买所导致的指数成份股股价上升和摩擦减少对冲纳入效应更方便所导致的股价下降两种力量。

第三，有关谁为跟踪指数者提供流动性的问题。

这个问题还没有研究，但这个研究对于搞清指数投资需求上升的原因很重要。

为了解决这些难题，文章通过对Russell 2000指数中市值排名在界断点附近的股票进行一系列断点回归的研究设计清晰地考察了指数效应。

每年5月末股票会按市值进行排序，第1-1000名归入Russsell 1000指数，第1001-3000名归入Russell 2000指数。

指数每隔一年调整一次。

本文考察第1000名左右处于Russell 2000指数断点处的样本（第3000名断点处情况类似）。

由于指数是市值加权的，因而每年5月末市值排名刚好在1000名之下（第1001-1010名）的股票会受到大量买入，与之相对，排名刚好在1000名之上（第990-1000名）则几乎没有什么买入。

实际上，Russell 2000指数中排名刚好在1000名之下的股票权重比Russell1000指数中排名刚好在1000名之上的股票权重大10倍。

换句话说，每年5月末，股票市值是排在1000名之上还是之下是随机的，但受指数配置的影响，断点处的需求却有显著差异。

比起以往用S&P500指数来研究指数效应，这个研究设计天然避免了内生性。

文章首先测度了那些在t-1年在Russell 1000指数中，在t年6月1日进入到Russell 2000指数的股票的纳入效应。

发现，那些恰好被纳入到Russell 2000指数的股票，比那些恰好没被纳入Russell 2000指数的股票（其他条件类似）在6月份收益会高出大约5%（T值为2.65）。

与之前对S&P500指数的研究相同，文章发现纳入效应发生在指数调整的一个月内，之后的月份没有纳入效应。

与对S&P500指数的研究不同，文章发现了剔除效应：Russell 2000的成份股在被移动到Russell 1000指数以后，比那些还留在Russell 2000的股票收益低，剔除效应的大小约为5.4%（T值为3）。

文章还发现随着追踪指数的日益普及，虽然交易量不断增大，资产组合调整的影响不断增加，但是需求曲线变得越来越有弹性。

通过计算个股相对于Russell 2000指数的β值，发现股指成份股之间过度的联动随着时间的推移有所下降。

对成份股的卖空（套利交易以及指数调整月后的交易）随着时间的推移也有增加的趋势。

这些都导致了虽然指数越来越多，但指数效应并没有不断增加，成份股联动也没有加强。

此外，采用断点回归设计，观察基金在5月31日前后的持股变化还可以识别出哪些基金在追踪Russell 2000指数。

将那些卖出比排名1000更大市值的股票（例如排名990），同时买入比排名1000更小市值的股票（例如排名1100）的基金称之为“Russell 2000指数追踪者(Russell 2000 indexer)”，将相反交易者称为“流动性提供者”。

结果表明：流动性提供者大部分都是追踪其他指数的基金，而不是以往理论中所说的套利者。

本文对Russell 2000指数的研究设计比以往的研究设计提供了更加干净的指数效应的度量。

研究还发现指数效应随着时间推移不断减弱。

本文提出的断点回归研究设计也可应用于金融学其他领域。

原文：
Chang, Yen-Cheng, Harrison Hong and InessaLiskovich, 2015, Regression Discontinuity and the Price Effects of Stock Market Indexing, Review of Financial Studies 28 (1)，212-246.。