一个改进的决策树算法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
、 . 1 No4 b1 . . 3
Au . 0 1 g 2 1
本刊核Baidu Nhomakorabea层次论文
一
个 改进 的决策树算法
佟 玉军 ,曹光辉 ,陈文 实,刘鸿沈
( 宁工业 大学 电子 与信 息工程 学 院, 辽宁 锦 州 110 ) 辽 2 0 1
摘
要:I rt e ih tmi r es n ( ) t ai coo s ri 3I 算法是数据挖掘中经典的决策树分类算法 , e vD e v o D3 其核心是分裂训练集
关键词:I D3算法:属性关注度 ;信息增 益;AA D3算法 I
中图分类号:T 3 P 1 1 文献标识码 :A 文章编号 :17 —2 12 1)40 2 ・3 643 6 (0 0 -2 50 1
An En a c d I g rt m s d o t i u eAte to h n e D3 Al o ih Ba e n Atrb t t n i n
ue e ea ei o e v ne yRos il .t cr e esl-f ann ih sdt gn rt ad c int ei e tdb s na I oel si t pi o t iigwhc o e s r n Qu n s i nh t r
T NGY - n C u n —u, HE nsiL UHo gse O uj , AO G a gh iC NWe—h, I n - n u h
( e t n& I f r to n i e dn l g , a n n v r i f e h o o y Jn h u 1 0 , ia) Elc r o n o ma in E g n e gCo l e Lio ig Unie st o T c n l g , i z o 21 01 Ch n e y
第 3 卷 第 4期 l 2 1年 8 月 0l
辽宁工业大学学报 ( 自然科学版)
J un l f i nn iesyo T cn lg ( trl ce c dt n o ra o La ig v ri f eh oo yNa a S i eE io ) o Un t u n i
lmp d te sa d r fatiu e rfrn e n mey i fr ain g i so xmu q a t oh u e h tn ad o t b tsp ee e c , a l, n o r m t an i fma i m u ni b t o y t
属性 的选择标准 ,即分裂前后 的信息增益量最大 ,用该标准选 择属 性时对 于取值较 多的属性具有较 强依赖性 。剖 析了 I D3算法存在 的不足 并加以改进 ,引入 了属性关注度 ,提 出了改进算法 A D AI 3算法 。实验表 明改进算法对 原 I 算法 的取值偏 向问题有所克服并使分类更加准确,决策树更加简明。 D3
b f r p i o n f rs l - f. h s ft i r f r n e s n a d t ee ta t b t s h sa s o g e o e s l - f a d a e p i o T eu e o sp e e e c t d r o s l c t u e a t n t t t h a i r r d p n e c n r g d o e mi i a u d ati u e r fr n e Dia v tg s o D3 ag rt m r e e d n e i e a f t l - l e t b ts p e e e c . s d a a e fI l o h r h tv r n i we e n l z d a d i r v d t r u h i t d cn t b t t t .T f c,AAI l o t m s a ay e n mp o e h o g n o u i g ati u e a tn i n o t e e e t r r e o h D3 a g r i h wa p o o e .E p r e t l r s l x ai td AAI l o i m s s p ro o t e I n a c r c f r p s d x e m n a e u t e p t e i s a D3 a g r h i u e r t h D3 i c u a y o t i c a sf ai n c n ii no e i in te , n d p n e c o mu t v l e t i u e . l s i c t , o c s f cso e a d i e e d n ef m l - au da t b t s i o o d r n r i r
1 I 3算法原理 D
随着 网络 与信 息技术 的不断发 展 ,如何 从海量
K e r s I l o tm ; t b t t n i n i f r ai n g i ; y wo d : D3 a g r h a t u eat t ; n o m t a n AA I l o i m i i r e o o D3a g rt h
Ab ta t I e i o e ot g I rt eDi oo sr es n3( ) s lsi l loi m s c: nd cs nt esrn ,t ai c tmi r o I i acas a g rh r i r i e v h ev i D3 c a t