断点回归的非参数估计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
断点回归的非参数估计
断点回归是经济学中常用的方法之一,主要用于研究某些变量在某一特定阈值点处的
表现情况。
通俗地说,就是研究一个关键变量变化与另一个变量之间的不连续性,也就是“断点”的位置及其对后续数据的影响。
传统的断点回归方法主要是基于参数估计的,即设定一个预定的函数形式,并通过参
数估计来确定特定断点的位置。
然而,实际应用中常常会遇到诸如形状未知、非线性、存
在异方差等问题,这就使得传统的参数估计方法有时难以满足需要。
为此,非参数估计成为了断点回归的重要研究方向。
非参数估计不需要事先假定函数
形式,从而更具有灵活性和可适应性,其估计值对于形状未知、曲线不光滑、断点位置不
确定等问题具有较好的抗干扰能力。
非参数断点回归方法中最常用的是基于“局部线性回归”(Local Linear Regression,LLR)的方法。
在LLR中,将断点左侧和右侧数据分别组成两个区域,然后在每个区域内用线性回归来逼近数据的真实曲线。
具体而言,即对于每个区域内的每个点,分别以该点为
中心取一个窗口,然后在该窗口范围内进行线性回归,从而得到曲线在该窗口中的估计值。
最终,将所有窗口的估计值拼接起来,就得到了整个数据样本中曲线的估计值。
LLR方法的关键是如何选取窗口。
一般而言,窗口大小决定了估计的平滑度和偏差-方差权衡。
过大的窗口会导致过度平滑,而过小的窗口则会使估计的方差过大,从而造成过
拟合。
因此,需要通过交叉验证等方法来确定最适合的窗口大小。
此外,LLR方法还需要确定更多的参数,如窗口形状、窗口位置、平滑参数等。
这些
参数的选取也对估计结果产生较大的影响,因此需要谨慎选择。
总而言之,非参数断点回归方法在不需要指定函数形式的前提下,可以有效地解决估
计过程中的形状未知、曲线不光滑、断点位置不确定等问题。
而基于LLR的方法则是非参
数方法中最为流行的一种。
当然,不同的问题需要选择不同的方法,因此选择合适的方法
是成功应用断点回归的前提。