决策树算法的研究及实例分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分 类 对 象 : 在 程 序 中输 入 的 数 据 或 称 训 练 集 ( t r a i n i n g s e t )样 本 , 是 由 每 个 包 含 若 干 个 属 性 ( a t t r i b u t e ) 的数据库 所记 录 ( r e c o r d ) 组成 的一个 特征 向趋 训 练集 中 的每条 记录还 必须 由系统 的输 入 一个 特定 的类标 签 ( c l a s s l a b e 1 ) 与之相 对应 的. 如 一个样 本 向量 ( , , , …, ; C ) 的形式 中 , 表示其 中属性 值 , C表示 它 的类 别 . 分类 的评价方 法 :
c o n s u mi n g .
Ke y wor d s : de c i s i o n t r e e a l g o it r h m;I D3 a l g o it r h m;c o mp r e h e ns i v e e v a l u a t i o n; c l a s s i ic f a t i o n a n d p r e d i c t i o n
i n — d e p t h r e s e a r c h i s c o n d u c t e d i n t o I D 3 a l g o r i t h m. F i n a l l y ,t h i s lg a o r i t h m o f d e c i s i o n t r e e i s u s e d t o c o mp r e h e n s i v e l y e v a l u a t e s t u d e n t s ’ p e r f o r ma n c e .I D 3 lg a o r i t h m,h o w e v e r ,h a s i t s d i s a d v a n t a g e s ,f o r e x mp l e ,c o mp l e x c a l c u l a t i o n a n d t i me —
c o n c e p t s a s i n f o r ma t i o n g a i n ,t o t a l s y s t e m e n t r o p y, a n d i n f o r ma t i o n a l e n t r o py ,a s we l l a s t h e c o mpu t a t i o n a l or f mu l a . An d
Ab s t r a c t : De c i s i o n t r e e a l g o r i t h m i s v i e w e d a s o n e o f t h e c o r e t e c h n i c l a a l g o r i t h ms o f c l a s s i i f c a t i o n a n d p r e d i c t i o n wh i c h i s
摘 要: 分类与预测是数据挖掘技术 中的一个重要研 究领域. 而决策树算法又是分类与预 测的核心技术算法之一. 描
述I D 3的主要算法 , 介 绍信息增益、 系统 总熵和信息熵的概念及其计 算公式 ; 然后对 I D 3算法进行 了深入地研 究与分 析; 最后把决策树 中的 I D 3算法运 用在学生综合测评 中. I D 3算法最大的缺点是运算复杂, 而且要花费较 多的时间. 关键 词 : 决策树算法 ; I D 3算法; 综合评价 ; 分类与预测
第1 1卷 第 3期 2 0 1 3年 9月
南 京 工 程 学 院 学 报 (自 然 科 学 版 )
J o u r n a l o f Na mi n g I n s t i t u t e o f T e c h n o l o g y ( N a t u r l a S c i e n c e E d i t i o n )
Vo 1 . 11, No . 3
S e p . , 2 01 3
文章编号 : 1 6 7 2— 2 5 5 8 ( 2 0 1 3 ) 0 3— 0 0 5 8— 0 4
决 策 树 算 法 的 研 究 及 实 例 分 析
周 桂 如
( 福建船 政 交通职 业 学院公共教 学部 , 福建 福州 3 s i d e r e d a k e y a r e a i n d a t a m i n i n g t e c h n o l o g y .T h i s p a p e r d e s c r i b e s t h e m a j o r a l g o i r t h m o f I D 3 a n d i n t r o d u c e s s u c h
中 图 分类 号 : T P I 8 1
Re s e a r c h i n t o De c i s i o n Tr e e Al g o r i t hm a n d Ca s e St ud i e s
Z H0U Gu i — r u
( D e p t .o f P u b l i c C o u r s e s T e a c h i n g ,F u j i a n C h u a n z h e n g C o m m u n i c a t i o n s C o l l e g e ,F u z h o u 3 5 0 0 0 7 ,C h i n a )