非参数回归模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非参数回归模型
非参数回归模型也叫多元回归模型,它是一种脱离于混沌理论的多条路段分析方法。它是对当前路段和几条相邻路段的交通流信息对当前路段进行交通流预测的单条路段分析的扩展。它不需要先验知识,只需要有足够的历史数据即可。它的原理是:在历史数据库中寻找与当前点相似的近邻,并根据这些近邻来预测下一时间段的流量。该算法认为系统所有的因素之间的内在联系都蕴含在历史数据中,因此直接从历史数据中得到信息而不是为历史数据建立一个近似模型。非参数回归最为一种无参数、可移植、预测精度高的算法,它的误差比较小,且误差分布情况良好。尤其通过对搜索算法和参数调整规则的改进,使其可以真正达到实时交通流预测的要求。并且这种方法便于操作实施,能够应用于复杂环境,可在不同的路段上方便地进行预测。能够满足路网上不同路段的预测,避免路段位置和环境对预测的影响。随着数据挖掘技术左键得到人们的认可和国内外学者的大量相关研究,使得非参数回归技术在短时交通流预测领域得到广泛应用。
非参数回归的回归函数()X g Y =的估计值()X g n 一般表示为:
()()∑==n i i i i n Y X W X g 1
其中,Y 为以为广策随机变量;X 为m 维随机变量;(Xi,Yi )为第i 次观测值,i=1,...,n ;Wi(Xi)为权函数.非参数回归就是对g(X)的形状不加任何限制,即对g (X )一无所知的情况下,利用观测值(Xi,Yi ),对指定的X 值去估计Y 值。由于其不需要对系统建立精确的数学模型,因此比较适合对事变的、非线性的系统进行预测,符合对城市交通流的预测,同时可以与历史平均模型实现优缺点的互补。
K 近邻法
Friedman 于1977年提出了K 近邻法。其并不是让所有的数据都参与预测,而是以数据点到X 点的距离为基础,甲醛是只有离X 最近的K 个数据被用来估计相应的g(X)值。可以引入欧式空间距离d ,然后按这个距离将X1,X2,...,Xn 与X 接近的程度重新排序:Xk1,...,Xkn,取权值如下:
Wki(X:X1,...,Xn)=ki,i=1,..,n
将与X 最近的前K 个观测值占有最大的权K=1,其余的观测值赋予权值k=0.最终得到应用于短时交通流预测的K 近邻法可表示为:
()()()()K t V t V g t V K i i ∑=+==+111
其中,K为所选取最邻近元素的个数,取值大小依赖于数据。选择欧式空间距离表达式为:
()2t
()()
-
=
d i
V
V
t
由于该算法要求只有离X最近的K个数据参与预测,因此该算法的计算量相对要小很多。
在上述传统的K近邻算法中,利用上式在历史数据库中进行搜索,可以搜索到当前时刻流量最近的K个数据。但是由于历史数据库中交通流量数据是一条多波峰和多薄谷的曲线,搜索到的最近邻历史数据并不能保证与当前时刻交通流量的走势一致,因此对传统的K近邻法的空间距离搜索公式进行改进,改进之后的距离公式为:
()()()
()2
()()
21
V
b
t
t
V
d i
t
V
V
⋅
-
a-
1
=t
-
+
⋅
-
i
其中,V(t-1)与vi(t-1)分别表示前一时刻的实时监测流量值与对应的历史流量值;(a,b)根据变量的选取和具体数据历史值的不同而不同,这样就可以保证搜索到的数据与前一时刻的交通流量也是相邻近的,从而使得预测精度得到提高。
基于K近邻的非参数回归算法应用于短时交通流状态预测的一般过程为:(1)构造交通状态向量;
(2)根据交通状态向量,结合历史数据建立历史数据样本库;
(3)实时采集数据并对该交通数据进行预处理;
(4)利用预处理之后的数据构建当前的状态向量;
(5)利用样本库进行模式匹配,同时判断当前状态向量是否为典型样本数据,若是,则补充道历史样本库;
(6)根据模式匹配结果得到最终预测结果值。