(数学建模教材)31第三十一章支持向量机
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三十一章 支持向量机
支持向量机是数据挖掘中的一项新技术,是借助于最优化方法来解决机器学习问 题的新工具,最初由 V.Vapnik 等人提出,近几年来在其理论研究和算法实现等方面都 取得了很大的进展,开始成为克服“维数灾难”和过学习等困难的强有力的手段,它的 理论基础和实现途径的基本框架都已形成。 §1 支持向量分类机的基本原理
根据给定的训练集
l
T = {(x 1,y 1 ), (x 2 ,y 2 ),L ,(x l ,y l )}∈ ( X ⨯ Y ) ,
其中 x ∈ X = R n , X 称为输入空间,输入空间中的每一个点 x 由 n 个属性特征组成, i i n
y i ∈Y = {-1,1},i = 1,L ,l 。寻找 R 上的一个实值函数 g (x ) ,以便用分类函数
f (x ) = sgn(
g (x )),
推断任意一个模式 x 相对应的 y 值的问题为分类问题。
1.1 线性可分支持向量分类机
考虑训练集 T ,若 ∃ω ∈ R n
, b ∈ R 和正数 ε ,使得对所有使 y = 1
的下标 i 有 i (ω ⋅ x i ) + b ≥ ε(这里 (ω ⋅ x i ) 表示向量 ω 和 x i 的内积),而对所有使 y i = -1 的下标 i 有 (ω ⋅ x i ) + b ≤ -ε ,则称训练集 T 线性可分,称相应的分类问题是线性可分的。 记两
类样本集分别为 M = {x i | y i = 1, x i ∈T }, M = {x i | y i = -1, x i ∈T }。定义 M + 的凸包 conv(M + ) 为
+
- ♣ N + N +
↔ conv(M +
) = ♦x = ∑λ x | ∑ λ λ ≥ 0, j = 1,L , N + ; x ∈ M + ←, = 1, j j j j j ♥ ↑
j =1 j =1 M - 的凸包 conv(M - ) 为 ♣ N - N -
↔ conv(M - ) = ♦x = ∑λ x | ∑λ λ ≥ 0, j = 1,L , N - ; x ∈ M - ←.
= 1, j j j j j ♥ ↑
j =1 j =1 其中 N + 表示 + 1 类样本集中样本点的个数, N - 表示 - 1类样本集中样本点的个数,定 理 1 给出了训练集 T 线性可分与两类样本集凸包之间的关系。
定理 1 训练集 T 线性可分的充要条件是, T 的两类样本集 M + 和 M - 的凸包相
离。如下图所示
图 1 训练集 T 线性可分时两类样本点集的凸包
证明:①必要性
-762-
+ -
若 T 是线性可分的,M = {x i | y i = 1, x i ∈T },M = {x i | y i = -1, x i ∈T },由线 性可分的定义可知,存在超平面 H = {x ∈ R n
: (ω ⋅ x ) + b = 0} 和 ε > 0 ,使得
(ω ⋅ x i ) + b ≥ ε , ∀x i ∈ M 且 (ω ⋅ x i ) + b ≤ -ε , ∀x i ∈ M . + -
而正类点集的凸包中的任意一点 x 和负类点集的凸包中的任意一点 x ' 可分别表示为
N + N - x = ∑αi x i 和 x ' = ∑ β j x ' j
i =1 j =1
N +
N -
其中αi ≥ 0, β j ≥ 0 且 ∑α
i
= 1, ∑β j = 1。
i =1
j =1
于是可以得到
N + N + N +
(ω ⋅ x ) + b = ω ⋅ ∑αi x i + b = ∑αi ((ω ⋅ x i ) + b ) ≥ ε ∑αi = ε > 0
i =1 i =1 i =1 N - N - N - ) + b ) ≤ -ε β = -ε < 0 j =1 ∑ j ∑ j ∑ j (ω ⋅ x ') + b = ω ⋅ β x ' + b = β ((ω ⋅ x ' j j
j =1 j =1 由此可见,正负两类点集的凸包位于超平面 (ω ⋅ x ) + b = 0 的两侧,故两个凸包相离。
②充分性
设两类点集 M +
,M -
的凸包相离。因为两个凸包都是闭凸集,且有界,根据凸集 强分离定理,可知存在一个超平面 H = {x ∈ R n
: (ω ⋅ x ) + b = 0} 强分离这两个凸包, 即存在正数 ε > 0 ,使得对 M +
, M -
的凸包中的任意点 x 和 x ' 分别有
(ω ⋅ x ) + b ≥ ε
(ω ⋅ x ') + b ≤ -ε
显然特别的,对于任意的 x ∈ M + ,有 (ω ⋅ x ) + b ≥ ε ,对于任意的 x ∈ M -
,有 i i i (ω ⋅ x i ) + b ≤ -ε ,由训练集线性可分的定义可知 T 是线性可分的。
由于空间 R n 中超平面都可以写为 (ω ⋅ x ) + b = 0 的形式,参数 (ω, b ) 乘以任意一个
非零常数后得到的是同一个超平面,定义满足条件
♠♣ y i ((ω ⋅ x i ) + b ) ≥ 0, i = 1,L , l ♦min ω ⋅ x (
i ) + b = 1 ♠ ♥ i =1, ,l
L 的超平面为规范超平面。
定理 2 当训练集样本为线性可分时,存在唯一的规范超平面 (ω ⋅ x ) + b = 0 ,使 得
♣(ω ⋅ x i ) + b ≥ 1 y i = 1; (1)
♦
♥(ω ⋅ x i ) + b ≤ -1 y i = -1.
证明:规范超平面的存在性是显然的,下证其唯一性。
假设其规范超平面有两个: (ω'⋅x ) + b ' = 0 和 (ω"⋅x ) + b ' = 0 。由于规范超平面满 足条件
-763-