决策树分类算法研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[ b t c]I 3 lo tm t d t c o s te ti t f o l s s h lt gar u sA mi e rb m, i pp rn o ue t o A s at D g r h n so h oeh tb e o r v u e pi n tb t . i n a t o l t s ae i rd csw r a i e ar u s m e a e at s t i ti e g th p e h t
] yw rs D3ag rh ifr aingi; t b t i otne n mbr f tiuevle ; fr t netoy Ke o d ]I lo tm;no t an at ue mp r c; u e tb t a si omai nrp i m o i r a o ar u n o
第3 7卷 第 1 期 3
、0 . 7 ,13
・
计
算
wenku.baidu.com
机
工
程
2 1 年 7月 01
J y 01 ul 2 l
NO 1 .3
Comp t rEng n e i g ue i e rn
软件技术与数据库 ・
文 编 l 3 80 ) — 0 — 2 文 标 码: 章 号; 0 _ 4 ( 11 _6 - o 22 1 3 0 6 0 献 识 A
Re t n De s ̄ ’ e a sfC i nAI o ih R, e r h 0 e ii} r eCl s i c to R r t m s sa c o D c o nl CI t i a i
ZHANG n CHEN n, a — i g M U a - i Li , Ya LIT o y n , Xi ng we ( olg f rn p r t nMa a e n , l n Mai meU ie s y Da a 1 0 6 C ia C l e a s ot i n g me tDai r i n v ri , l n 1 6 2 , hn ) e oT ao a t t i
p r me e s i c u i g a ti u e i a a tr n l d n t b t mpo t n e a d n r r a c n umb ro t i u e v l e O i r v e e it d f r u a o n o a i n g i fI l o i m . i e fa t b t a u s t mp o e t x se o m l fi f r t a n o r h m o D3 a g rt h Th s c n rb t s o n a c n t e mp ra c o t e rtc l trb t s o ti u e t e h n i g h i o t n e f h c i a a t u e wi f we v l e a d i i h t e r a u s n m a i g he l o ih k n t a g rt m b t r e l c t e cu l e t r fe t h a t a e de ii n ma i g st a i n. c r i g t e p o e t so ec n e u c i n, t i lfe e c l u a i g f r l f n o ma i n e to y t mp ov c so — k n i t u o Ac o d n t r p ri ft o v x f n t oh e h o i mp i st ac l t o mu a o f r to n r p o i r e s i h n i t e e ii n y o on tu t g a d c so r e A o c e e e a l sg v n t e c i e t e s e i c a p i a i n o h f c e c fc sr c i e ii n t . c n r t x mp e i i e d s rb p cf p l to fi n e o h i c mpr v d a g rt m, n e r s l o e l o ih a d t e u t h s o h ti i o e e ce t ha e o g n l l o ih h ws t a t sm r f i n n t r i a g rt m. i t h i a
DOh 1 .9 9 . s. 0 —4 82 1.30 0 03 6/i n1 03 2 .0 11.2 js 0
l 概述
的信息增益公式进行改进 , 而提高取值数 量少但 较为关键 的属性 的重 要性,使算法更好地反映实 际决策情况 ,并根 据凸函数的性 质简化 从 信息熵的计算 ,提高决策树的构造效率 。通过实例介绍改进算法 的具体应 用方法 ,证明其性能相 比原算法有所提高 。
关健词 :1 3 D 算法 ;信息增益 ;属性重要性 ;属性取值数量 ;信息熵
中 分 号 T3 . 圈 类 : P06 1
决 策树 分 类算 法研 究
张 琳 ,陈 燕 ,李挑迎 ,牟向伟
( 大连海 事大学交通运输管理 学院,辽宁 大连 16 2 ) 06 1
摘
要 :I3算法在选择分 裂属性 时偏 向于选取属性取值较 多的属性 。针对 该问题 ,引入属性重要性和属性取值数量 2 D 个参数对 I3算法 D