基于子空间集成的概念漂移数据流分类算法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
情况 。
关键词 :概念漂移 ;数据流 :予空间:分类 ;集成
Cl s i c to g rt m o nc p ・ itngDa a S r a s d o bs a eI e r to a sf a i n Al o ih f rCo e tDr fi t t e m Ba e n Su p c nt g a i n i
计 算 机 系 统 应 用
ht:w . Sa r. t / wwc -. gc p/ - o n
21 0 1年 第 2 卷 第 1 0 2期
基于子空间集成的概念漂移数据流分类算
李 南 ,郭躬德
f 建师范大学 数学与计算机科学学院,福 州 3 0 0 ) 福 50 7
摘 要 :具有概念漂 移的复杂结构数据流分类 问题 已成为数据挖 掘领域研 究的热点之 一。提 出了一种新颖 的子 空 间分类算法 ,并采 用层次结构将其构成集成分类器用于解 决带概念漂 移的数据流 的分类 问题 。在将数据 流划 分为数据块后 ,在每个数据块上利用子空间分类算法建立 若干个 底层分类器,然后 由这几个底层分类 器组成集 成分类模型 的基分类器 。同时 ,引入数理 统计 中的参数估计方法检测概念漂移,动态调整模型 。实验 结果表 明: 该子 空间集成算法不但能够提高分类模型对 复杂类 别结构数据流 的分类精度 ,而且还能够快速适应概念漂移的
r s lss o t tt e p o os d m eh d do sn to l i nfc n l m p o e t e ca sfc t n p ro ma c n d ts t e ut h w ha h r p e t o e o ny sg i a ty i r v ls i a i ef r n e o a es i h i o a
wi o lx c t g r tu tr s b t lo q ikl d p st h i ai n o o c p rf. t c mp e ae o sr cu e , u s uc y a a t ot est to f n e t i h y a u c d t Ke r : o c p rf; aasr a s b p c ; ls i c to ;itg a in ywo ds c n e t i d t te m; u s a e c a sf a in n e r t d t i o
Ab t a t Thec a sfc to fc n e td i ig d t te mswihc mplx c tg r tucu e a e e tybe o so e sr c: ls i ai no o c p - rf n aasr a t o i t e ae o y sr tr sh sr c n l c me n o e mo tp p lrt p c n d a mi i g ft s o u a o is i a n n .Th sp p rp o o e ov ls b p c lsi c t n meh d, n s s i t h t i a e r p s s an e u s a e ca sf a i Байду номын сангаасo a d u e t o i o f r a n e l ls i e n ahir r h c ls u t r rc n e td i i g d t te msca sfc to . te i d n o m n e s mb ec a sf ri e a c ia t cu e f o c p - rf n a sr a ls i ai n Af rdvii g a i r o t a i gv n d t te m no s v r l a o ks i u e u s c l s iia in me o o tan s meb to c a sfe so ie a s a it e e a t blc ,t s st s b pa eca sfc o t dt i o o t m ls i r n a r da he t h r i e c aabl k a d t e s ste eb t m lsi e st r a eca sfe . eba eca sfr eu e ob idt e a h d t oc , n h n u e s o t ca sf r o f m ab s l siir Th s ls ie sa s d t u l h h o i o r e s mbl ls i e .M e n ie ti to u e h a a t re tmai t o o d tc o c p rf.Ex e i n a ne e ca sf r i a wh l,i n r d c s te p r mee si t on meh d t ee tc n e td i t p rme t l
LINa , n GU O n - Go g De
(c o l f te t s n o p t cec, ui r l i ri, uh u3 0 0 , hn ) Sh o Ma mai dC m ue Sine Fj n o h ca r a NomaUnv sy F z o 50 7C ia e t
随着 社会 的发展,在网络安全、 电子商务等众多
应用领域 每天都产生大量的数据流 ,这些数据流蕴含
取得较好的效果。Sr t 4 t e 等【 e 】 提出一个可用于数据流的概
关键词 :概念漂移 ;数据流 :予空间:分类 ;集成
Cl s i c to g rt m o nc p ・ itngDa a S r a s d o bs a eI e r to a sf a i n Al o ih f rCo e tDr fi t t e m Ba e n Su p c nt g a i n i
计 算 机 系 统 应 用
ht:w . Sa r. t / wwc -. gc p/ - o n
21 0 1年 第 2 卷 第 1 0 2期
基于子空间集成的概念漂移数据流分类算
李 南 ,郭躬德
f 建师范大学 数学与计算机科学学院,福 州 3 0 0 ) 福 50 7
摘 要 :具有概念漂 移的复杂结构数据流分类 问题 已成为数据挖 掘领域研 究的热点之 一。提 出了一种新颖 的子 空 间分类算法 ,并采 用层次结构将其构成集成分类器用于解 决带概念漂 移的数据流 的分类 问题 。在将数据 流划 分为数据块后 ,在每个数据块上利用子空间分类算法建立 若干个 底层分类器,然后 由这几个底层分类 器组成集 成分类模型 的基分类器 。同时 ,引入数理 统计 中的参数估计方法检测概念漂移,动态调整模型 。实验 结果表 明: 该子 空间集成算法不但能够提高分类模型对 复杂类 别结构数据流 的分类精度 ,而且还能够快速适应概念漂移的
r s lss o t tt e p o os d m eh d do sn to l i nfc n l m p o e t e ca sfc t n p ro ma c n d ts t e ut h w ha h r p e t o e o ny sg i a ty i r v ls i a i ef r n e o a es i h i o a
wi o lx c t g r tu tr s b t lo q ikl d p st h i ai n o o c p rf. t c mp e ae o sr cu e , u s uc y a a t ot est to f n e t i h y a u c d t Ke r : o c p rf; aasr a s b p c ; ls i c to ;itg a in ywo ds c n e t i d t te m; u s a e c a sf a in n e r t d t i o
Ab t a t Thec a sfc to fc n e td i ig d t te mswihc mplx c tg r tucu e a e e tybe o so e sr c: ls i ai no o c p - rf n aasr a t o i t e ae o y sr tr sh sr c n l c me n o e mo tp p lrt p c n d a mi i g ft s o u a o is i a n n .Th sp p rp o o e ov ls b p c lsi c t n meh d, n s s i t h t i a e r p s s an e u s a e ca sf a i Байду номын сангаасo a d u e t o i o f r a n e l ls i e n ahir r h c ls u t r rc n e td i i g d t te msca sfc to . te i d n o m n e s mb ec a sf ri e a c ia t cu e f o c p - rf n a sr a ls i ai n Af rdvii g a i r o t a i gv n d t te m no s v r l a o ks i u e u s c l s iia in me o o tan s meb to c a sfe so ie a s a it e e a t blc ,t s st s b pa eca sfc o t dt i o o t m ls i r n a r da he t h r i e c aabl k a d t e s ste eb t m lsi e st r a eca sfe . eba eca sfr eu e ob idt e a h d t oc , n h n u e s o t ca sf r o f m ab s l siir Th s ls ie sa s d t u l h h o i o r e s mbl ls i e .M e n ie ti to u e h a a t re tmai t o o d tc o c p rf.Ex e i n a ne e ca sf r i a wh l,i n r d c s te p r mee si t on meh d t ee tc n e td i t p rme t l
LINa , n GU O n - Go g De
(c o l f te t s n o p t cec, ui r l i ri, uh u3 0 0 , hn ) Sh o Ma mai dC m ue Sine Fj n o h ca r a NomaUnv sy F z o 50 7C ia e t
随着 社会 的发展,在网络安全、 电子商务等众多
应用领域 每天都产生大量的数据流 ,这些数据流蕴含
取得较好的效果。Sr t 4 t e 等【 e 】 提出一个可用于数据流的概