支持向量回归机
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
支持向量回归机
3.3 支持向量回归机
SVM 本身是针对经典的二分类问题提出的,支持向量回归机(Support Vector Regression ,SVR )是支持向量在函数回归领域的应用。SVR 与SVM 分类有以下不同:SVM 回归的样本点只有一类,所寻求的最优超平面不是使两类样本点分得“最开”,而是使所有样本点离超平面的“总偏差”最小。这时样本点都在两条边界线之间,求最优回归超平面同样等价于求最大间隔。 3.3.1 SVR 基本模型
对于线性情况,支持向量机函数拟合首先考虑用线性回归函数
b x x f +⋅=ω)(拟合n i y x i i ,...,2,1),,(=,n i R x ∈为输入量,R y i ∈为输出量,即
需要确定ω和b 。
图3-3a SVR 结构图 图
3-3b ε不灵敏度函数
惩罚函数是学习模型在学习过程中对误差的一种度量,一般在模型学习前己经选定,不同的学习问题对应的损失函数一般也不同,同一学习问题选取不同的损失函数得到的模型也不一样。常用的惩罚函数形式及密度函数如表3-1。
表3-1 常用的损失函数和相应的密度函数
损失函数名称
损失函数表达式()i c ξ
噪声密度
()i p ξ
ε-不敏感
i εξ
1
exp()2(1)
i εξε-+
拉普拉斯
i
ξ
1
exp()2
i ξ-
高斯
212
i ξ 21
exp()22i ξπ
-
鲁棒损失
2
1(),if ;2,otherwise;2
i i i ξξσσ
σξ⎧≤⎪⎪⎨
⎪-⎪⎩ 2
exp(),2exp(),2i i i
if otherwise
ξξσσσξ⎧-≤⎪⎪⎨
⎪-⎪⎩ 多项式 1
p
i p
ξ
exp()2(1/)
p
i p p ξ-Γ
分段多项式
11,1,p i i p i
if p p otherwise p ξξσσξσ-⎧≤⎪⎪
⎨
-⎪-⎪⎩ 1
exp(),1exp(),p
i i p i
if p p otherwise
p ξξσσσξ-⎧-≤⎪⎪
⎨
-⎪-⎪⎩
标准支持向量机采用ε-不灵敏度函数,即假设所有训练数据在精度ε下用线性函数拟合如图(3-3a )所示,
**()()1,2,...,,0i i i
i i i i i y f x f x y i n εξεξξξ-≤+⎧⎪-≤+=⎨⎪≥⎩
(3.11)
式中,*,i i ξξ是松弛因子,当划分有误差时,ξ,*i ξ都大于0,误差不存在取0。这时,该问题转化为求优化目标函数最小化问题:
∑=++⋅=n
i i i C R 1
**
)(21
),,(ξξωωξξω (3.12)
式(3.12)中第一项使拟合函数更为平坦,从而提高泛化能力;第二项为减小误差;常数0>C 表示对超出误差ε的样本的惩罚程度。求解式(3.11)和式(3.12)可看出,这是一个凸二次优化问题,所以引入Lagrange 函数:
*
11
****1
1
1()[()]
2[()]()
n n
i i i i i i i i n n
i i i i i i i i i i L C y f x y f x ωωξξαξεαξεξγξγ=====⋅++-+-+-+-+-+∑∑∑∑ (3.13)
式中,α,0*≥i α,i γ,0*≥i γ,为Lagrange 乘数,n i ,...,2,1=。求函数L 对ω,
b ,i ξ,*i ξ的最小化,对i α,*i α,i γ,*i γ的最大化,代入Lagrange 函数得到对偶形式,最大化函数:
一般对所有标准支持向量分别计算b 的值,然后求平均值,即
**0*
01{
[()(,)]
[()(,)]}
i j j i i j j j i C
x SV
NSV i j
j
j i x SV
C
b y K x x N y K x x α
αα
αεα
αε<<∈∈<<=
-
--+
-
--∑∑∑
∑ (3.18)
因此根据样本点),(i i y x 求得的线性拟合函数为
b x x b x x f n
i i i i +⋅-=+⋅=∑=1*)()(ααω (3.19)
非线性SVR 的基本思想是通过事先确定的非线性映射将输入向量映射
的一个高维特征空间(Hilbert 空间)中,然后在此高维空间中再进行线性回归,从而取得在原空间非线性回归的效果。
首先将输入量x 通过映射R n
Φ:映射到高维特征空间中用函数式变
为:
*
**1,1
**1
1
1(,)()()(()())
2()()n
i i j j i j i j n n
i i
i i i i i W x x y ααααααααααε
=====---⋅Φ⋅Φ+--+∑∑∑ (3.20)
式(3.20)中涉及到高维特征空间点积运算)()(j i x x Φ⋅Φ,而且函数Φ是未知的,高维的。支持向量机理论只考虑高维特征空间的点积运算
)
()(),(j i j i x x x x K Φ⋅Φ=,而不直接使用函数Φ。称),(j i x x K 为核函数,核函数
的选取应使其为高维特征空间的一个点积,核函数的类型有多种,常用的核函数有:
多项式核:''(,)(,),,0p k x x x x d p N d =+∈≥; 高斯核:2
''2(,)exp()2x x k x x σ
-=-;
RBF 核:''2
(,)exp()2x x k x x σ
-=-
;
B 样条核:''21(,)()N k x x B x x +=-;
Fourier 核:'''1
sin()()
2(,)1
sin ()2
N x x k x x x x +-=-; 与之前有的解释
与3.14对应
支持向量机的核心要点
说明为什么,其次讲一下为什么引入核函数