增量密度加权近似支持向量机
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3 卷 第1 期 9 1 21 年1 月 02 1
计 算 机 科 学 C m ue Sine o p tr c c e
V l3 o 1 o .9N .1 N v2 1 o 0 2
增量密度加权近似支持向量机
鲁淑霞 崔芳芳 忽丽莎 ( 河北省机器学习重点实验室 河北大学数学与计算机学院 保定 0 1 0 ) 702
摘 要 近似支持向量机(S 是 有 但 的 P VM) 一 个 正 则 化 最 小 二 乘 问 题, 解 析 解, 是 它 失 去 了 支 持 向 量 机 ( VM) 稀 疏 S 性, 使得所有的训练样例都成为支持向量。为了有效地控制近似支持向量机的稀疏性, 提出了增量密度加权近似 支 持 , 向量机 (DWP VM) 它在训练集中选取最基本 的 支 持 向 量。 实 验 表 明,DWP VM 方 法 与 S I S I S VM, S P VM 和 DWP - S 其精度相似, 收敛速度快, 可有效地控制近似支持向量机的稀疏性。 VM 方法相比, 关键词 近似支持向量机, 密度加权, 增量, 稀疏性 中图法分类号 T 1 1 文献标识码 A P8
lce etlD ni e he rxm l u pr etr M cie nr m na es y W i tdPoi a p otV co ahn t S g
L h - i C IF n - a g U S uxa U a gfn HU L- h s i a
( e a f M cieL ann , e e rvne Cl g ah m t sa dC m ue , e e nvri ,a dn 7 0 2,hn ) K yL bo ahn erig H biPoic ,o eeo M te a c n o p tr H biU ies y B oig0 1 0 C ia l f i t
A s at h rxm l u pr etrm cie (S bt c T epoi a s p ot co ahns P VM)sarglr e at q ae rbe , hc a na ay c r v i uai d es- urspol m w ihhsa nlt e z l s i h a s lt s v f f slt n. o ee , eP VMlc s pre esa da ann ae eo e u pr etr . hsp pr oue ne- oui H w vrt S k asns ,n l riigdtsbc m p ot cos T i a e csdo o fc vl oto n h pre eso h S et eyc nrl gtes asns fte P VM. nice etld ni e he rxm ls p otvco ahn i i A nr m na es y wi td poi a u pr etr m cie t g (DWP VM)w spo oe , hc e cstebs u pr etr ntetann e . h x ei etrsl h w I S a rp sd w ihsl t h ai s p otvcosi h riigst T ee prm n eu ss o e s t t a fh I S ml ih h VM,S n a is a t P VM a dDWP VM eh d ,n n eg ne pe S m to sa dc vrec ed o s ta h crc e DWP VMcn s i i rwt eS ht e cuayo t i fse . h DWP VM cne et eyc nrl h pre eso h S s atr T e I S a fc vl oto tes asns f eP VM. f i t K y od Poi a s p otvco ahn ,es y wih , ce etS asns e w rs rxm l u pr etrm cie D ni e tI r m n ,pre es t g n 很好地控制了 P VM 的稀疏性。 的支持向量的个数, S
1 引言
[ 1 标准的支持向量机( VM) ]的 求 解 属 于 二 次 规 划 问 题, S
2 密度加权近似支持向量机
2. 标准的 P VM 1 S 标准的 P VM 通过拟合两类数 据, 到 两 个 平 行 的 间 隔 得 S 面, 这两个间 隔 面 通 过 类 中 心 , 得 样 本 的 聚 类 误 差 尽 可 能 使 且两个间隔面的间隔最大。 小, 标准的 P VM 的优化问题: S
n ( , ,) R +1+m ω bξ ∈
对于大规模数据, VM 的训练时间较长。为了减少 时 间 的 复 S 杂度, 许多学者提出了 S 如 VM 的各 种 变 形, 最 小 二 乘 支 持 向
[ ,] 2 量机 ( es q aeS p ot V co ahns L S L atS ur u pr etr M cie , S VM ) 3 、
近 似 支 持 向 量 机 (rxm lS p ot V co ahns P - Poi a u pr etr M cie , S [] 4 约简支持向量机( e ue u pr etrM cie , VM) 、 R d cdS p otV co ahns 文 R VM) 。文献[ ] S 6 给出了多类近似支持 向 量 机; 献[ ] 7 提
[] 5
出了一种改进的近似支持 向 量 机。文 献[ ] P VM 的 增 量 8是 S 版本, 适合解决大样本和高维数据问题。 标准的 P VM 方法是 M n aain 等人基于优化理论提 S a gsr a 出的, 它将 S VM 的 二 次 规 划 问 题 转 化 为 求 解 线 性 方 程 组 的 问题, 可以得到解析 解, 合 解 决 大 样 本 问 题, 是 它 使 所 有 适 但 训练样例都成为了支持向量, 去 了 标 准 S 失 VM 的 稀 疏 特 性。 因此需要对 P VM 模型进行稀 疏 化。文 献[ ] 出 了 去 除 部 S 9提 文献[0 去掉具有最小引入误差的样本, 得 获 分样本的方法; 1] 了好的稀疏性能; 献 [1] 剪 枝 法 控 制 稀 疏 性。 为 了 有 效 文 1 用 地控制 P VM 方 法 的 稀 疏 性, 文 在 文 献 [2] 基 础 上, 本 提 S 1 的 其 出了增量密度加权近似支持向量机方法, 从训练集合中选 取使得目标函数值最小的点作为支持向量, 而选取所期望 进
mn i
2 υ‖ ‖ + ξ
1 (T 2 b ω ω+ ) 2
() 1
st D( ω- b + = .. A e ) ξ e 式中, 矩阵 A∈Rm×n 表 示 训 练 集 合, + 表 示 训 练 集 合 中 正 类 A 样本组成的集合, - 表 示 训 练 集 合 中 负 类 样 本 组 成 的 集 合; A
m n m e ω υ ξ∈R 是误差项; ∈R 是 法 向 量; 为 正 则 化 常 数; ∈R 为 全 1 向 量; 是 一 个 m ×m 的 对 角 矩 阵, 角 线 元 素 取 +1 对 D
时, 对应的点为点集 A+ 中的元素, 对角线元素取 -1 时, 应 对 的点为点集 A- 中的元素。 2. 密度加权近似支持向量机 2 标准 P VM 的间隔 面 经 过 类 中 心, 般 情 况 下, 离 类 一 距 S 中心较近点周围的样例个数较多, 密度较大, 而类中心附近 的 点是重要的点。标准的 P VM 在 分 类 时, 样 例 赋 予 了 相 同 给 S
到稿日期:0 20 - 5 返修日期:0 20 - 8 2 1 - 10 2 1 - 60 本文受国家自然科学基金项目(1 7 0 4 ) 河 北 省 自 然 科 学 基 金 项 目 (2 1 2 1 6 ,2 1 - 61000 , F01003 F00 002 ) 0 3 3 资助。 , 博士, , 硕士, 鲁淑霞(9 6- ) 女, 教授, 主要研究方向为机器学习与计算智能、 支持向量机, a :mls @1 6. m; 主要 16 E-m i c cux 2 c l o 崔芳芳(9 4- ) 女, 18 , 硕士, 研究方向为支持向量机; 忽丽莎(9 6- ) 女, 主要研究方向为支持向量机。 18
·14· 9