(数学建模教材)31第三十一章支持向量机

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三十一章 支持向量机

支持向量机是数据挖掘中的一项新技术,是借助于最优化方法来解决机器学习问 题的新工具,最初由 V.Vapnik 等人提出,近几年来在其理论研究和算法实现等方面都 取得了很大的进展,开始成为克服“维数灾难”和过学习等困难的强有力的手段,它的 理论基础和实现途径的基本框架都已形成。 §1 支持向量分类机的基本原理

根据给定的训练集

l

T = {(x 1,y 1 ), (x 2 ,y 2 ),L ,(x l ,y l )}∈ ( X ⨯ Y ) ,

其中 x ∈ X = R n , X 称为输入空间,输入空间中的每一个点 x 由 n 个属性特征组成, i i n

y i ∈Y = {-1,1},i = 1,L ,l 。寻找 R 上的一个实值函数 g (x ) ,以便用分类函数

f (x ) = sgn(

g (x )),

推断任意一个模式 x 相对应的 y 值的问题为分类问题。

1.1 线性可分支持向量分类机

考虑训练集 T ,若 ∃ω ∈ R n

, b ∈ R 和正数 ε ,使得对所有使 y = 1

的下标 i 有 i (ω ⋅ x i ) + b ≥ ε(这里 (ω ⋅ x i ) 表示向量 ω 和 x i 的内积),而对所有使 y i = -1 的下标 i 有 (ω ⋅ x i ) + b ≤ -ε ,则称训练集 T 线性可分,称相应的分类问题是线性可分的。 记两

类样本集分别为 M = {x i | y i = 1, x i ∈T }, M = {x i | y i = -1, x i ∈T }。定义 M + 的凸包 conv(M + ) 为

+

- ♣ N + N +

↔ conv(M +

) = ♦x = ∑λ x | ∑ λ λ ≥ 0, j = 1,L , N + ; x ∈ M + ←, = 1, j j j j j ♥ ↑

j =1 j =1 M - 的凸包 conv(M - ) 为 ♣ N - N -

↔ conv(M - ) = ♦x = ∑λ x | ∑λ λ ≥ 0, j = 1,L , N - ; x ∈ M - ←.

= 1, j j j j j ♥ ↑

j =1 j =1 其中 N + 表示 + 1 类样本集中样本点的个数, N - 表示 - 1类样本集中样本点的个数,定 理 1 给出了训练集 T 线性可分与两类样本集凸包之间的关系。

定理 1 训练集 T 线性可分的充要条件是, T 的两类样本集 M + 和 M - 的凸包相

离。如下图所示

图 1 训练集 T 线性可分时两类样本点集的凸包

证明:①必要性

-762-

+ -

若 T 是线性可分的,M = {x i | y i = 1, x i ∈T },M = {x i | y i = -1, x i ∈T },由线 性可分的定义可知,存在超平面 H = {x ∈ R n

: (ω ⋅ x ) + b = 0} 和 ε > 0 ,使得

(ω ⋅ x i ) + b ≥ ε , ∀x i ∈ M 且 (ω ⋅ x i ) + b ≤ -ε , ∀x i ∈ M . + -

而正类点集的凸包中的任意一点 x 和负类点集的凸包中的任意一点 x ' 可分别表示为

N + N - x = ∑αi x i 和 x ' = ∑ β j x ' j

i =1 j =1

N +

N -

其中αi ≥ 0, β j ≥ 0 且 ∑α

i

= 1, ∑β j = 1。

i =1

j =1

于是可以得到

N + N + N +

(ω ⋅ x ) + b = ω ⋅ ∑αi x i + b = ∑αi ((ω ⋅ x i ) + b ) ≥ ε ∑αi = ε > 0

i =1 i =1 i =1 N - N - N - ) + b ) ≤ -ε β = -ε < 0 j =1 ∑ j ∑ j ∑ j (ω ⋅ x ') + b = ω ⋅ β x ' + b = β ((ω ⋅ x ' j j

j =1 j =1 由此可见,正负两类点集的凸包位于超平面 (ω ⋅ x ) + b = 0 的两侧,故两个凸包相离。

②充分性

设两类点集 M +

,M -

的凸包相离。因为两个凸包都是闭凸集,且有界,根据凸集 强分离定理,可知存在一个超平面 H = {x ∈ R n

: (ω ⋅ x ) + b = 0} 强分离这两个凸包, 即存在正数 ε > 0 ,使得对 M +

, M -

的凸包中的任意点 x 和 x ' 分别有

(ω ⋅ x ) + b ≥ ε

(ω ⋅ x ') + b ≤ -ε

显然特别的,对于任意的 x ∈ M + ,有 (ω ⋅ x ) + b ≥ ε ,对于任意的 x ∈ M -

,有 i i i (ω ⋅ x i ) + b ≤ -ε ,由训练集线性可分的定义可知 T 是线性可分的。

由于空间 R n 中超平面都可以写为 (ω ⋅ x ) + b = 0 的形式,参数 (ω, b ) 乘以任意一个

非零常数后得到的是同一个超平面,定义满足条件

♠♣ y i ((ω ⋅ x i ) + b ) ≥ 0, i = 1,L , l ♦min ω ⋅ x (

i ) + b = 1 ♠ ♥ i =1, ,l

L 的超平面为规范超平面。

定理 2 当训练集样本为线性可分时,存在唯一的规范超平面 (ω ⋅ x ) + b = 0 ,使 得

♣(ω ⋅ x i ) + b ≥ 1 y i = 1; (1)

♥(ω ⋅ x i ) + b ≤ -1 y i = -1.

证明:规范超平面的存在性是显然的,下证其唯一性。

假设其规范超平面有两个: (ω'⋅x ) + b ' = 0 和 (ω"⋅x ) + b ' = 0 。由于规范超平面满 足条件

-763-

相关文档
最新文档