数据流滑动窗口方式下的自适应集成分类算法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ab s t r a c t : The ma i n dr a wb a c k o f bl o c k— b a s e d e n s e mbl e s i s t h e d i f f i c ul t y o f t u ni n g t h e bl o c k s i z e t o o f f e r a c o mp r om i s e be t we e n f a s t r e ac t i o ns t o dr i f t s .M o t i v a t e d by t h i s c ha l l e n ge,a n a d a p t i v e e n — s e m bl e f or e v ol v i n g d a t a s t r e a ms i s p r o po s e d t o de a l wi t h d i f f e r e nt t y pe s o f dr i f t .Th e a l g o r i t hm u s e s t he a d a pt i v e wi n do w a l go r i t hm a s a c ha ng e de t e c t o r .W h e n a c h a ng e i s de t e c t e d,t h e wo r s t c l a s s i f i e r o f t he e n s e mbl e i s r e mov e d a n d a n e w i s a d de d .Th e pr o p os e d a l g or i t hm i s e x pe r i me n t a l — l y c ompa r e d wi t h t he s t a t e — o f - t he — a r t a l g o r i t hm s o n s yn t he t i c a n d r e a l d a t a s e t s .Out o f a l l t h e c ompa r e d a l go r i t hms,t h e pr o po s e d a l g o r i t hm p r o v i de d h i ghe r c l a s s i f i c a t i o n a c c ur a c y wh i l e pr o — v i n g t o b e l e s s me mor y c on s u mi n g t h a n o t he r a pp r o a c he s .Ex pe r i me nt a l r e s ul t s s ho w t ha t t h e p r op os e d a l g o r i t hm c a n be c o ns i de r e d s ui t a bl e f o r s c e n a r i os ,i nv o l vi ng di f f e r e nt t y pe s o f dr i f t a s we l l a s s t a t i c e nv i r o nm e nt s . Ke y wo r d s: d a t a mi n i ng;d a t a s t r e a m s;c o nc e p t d r i f t ;e ns e mb l e c l a s s i f i e r ;s l i d i ng wi ndo ws
D O I : 1 0 . 1 1 8 6 0 / j . i s s n . 1 6 7 3 — 0 2 9 1 . 2 0 1 6 . 0 5 . 0 0 2
数 据 流 滑 动 窗 口方 式 下 的 自适 应 集成 分 类 算 法
孙艳 歌 , 王 志海 ,原 继 东 , 韩 萌
( 1 . 北京交通大学 计算 机与信息技术学院 , 北京 1 0 0 0 4 4 ;
关键 词 : 数 据挖 掘 ; 数据流; 概 念 漂移 ; 集成 分 类器 ; 滑动 窗 口 中图分 类号 : T P 1 8 1 文 献标 志码 : A
Ad a pt i v e e n s e mb l e a l g o r i t hm b a s e d o n s l i d i n g
2 . 信 阳师 范 学 院 计 算 机 与 信 息 技 术 学 院 , 河南 信 阳 4 6 4 0 0 0 )
摘 要 : 针 对基 于数 据块 的 集成 算 法 , 存在 数 据块 大 小影 响 分 类效 果 , 且 不 能及 时应 对 完整 式概 念
漂移 的 问题 , 提 出 了一种 考虑 数据 流局 部特 征 的和 能应 对 多种 类型概 念 漂移 的 集成 分 类算 法. 用 滑
2. Sc ho ol of Com put e r a nd I n f or ma t i on Te c hno l o gy, Xi nya n g No r ma l Un i v e r s i t y, Xi ny a ng He na n 46 40 0 0, Chi na )
第4 O 卷 第 5 期
2 0 1 6年 1 O月
北
京
交
通
大
学
学
报
Vo1 . 4 0 NO . 5 Oc t .2 O1 6
J OURNAL 0F BE UI NG J I A0T0NG UNI VE RS I TY
文章编号 : 1 6 7 3 — 0 2 9 1 ( 2 0 1 6 ) 0 5 — 0 0 0 9 — 0 7
wi n d o ws mo d e l f o r d a t a s t r e a ms
SUN Y a nБайду номын сангаасg e ,WANG Z h i h a i , YUAN J i d o n g ,HAN Me n g
( 1 . S c h o o l o f Co mp u t e r a n d I n f o r ma t i o n Te c h n o l o g y,Be i j i n g J i a o t o n g Un i v e r s i t y,Be i j i n g 1 0 0 0 4 4, Ch i n a ;
动 窗 口作 为概念 漂移检 测 器 , 当检 测 到概 念 漂移 时 , 则建 立新 的分 类 器 并加 入 到 集 成分 类 器 中. 本
文提 出的 算法在 人 工合 成和 真 实数 据 集上 与 经典 算法进 行 了广 泛 的对 比 实验. 结 果表 明 : 提 出的 算 法在分 类 准确 率上 具有 明显优 势 , 消耗 更 少的 内存 , 更 适合 多种 类型概 念 漂移 的环境 .