决策树与数据仓库结合的研究与应用
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
库 的理论共性 ,提出将决策树与数据仓库相 结合 , 包括表示 方法 的结合 和基 于 O A L P操作的结合 ,以达 到提供全新 决策 支持 的 目的。应用
结果证 明了该结合 的可行性 与优越性 。
关健词 :数据挖掘 ;决策树 ;数据仓库 ;决策支持 ;联机分析处理
Re e r h a dAp l a i n o m b n to t e s a c n p i to fCo c i a i n Be we n
De ii n Tr ea e so t nd t ’a e1 us c l U 1 e n Da a’ r ho e O a W ’r 1O Us
S HEN Xue1. . ZHONG a i Hu
( c o l f lc o is n fr t nE gn eig L a nn e h ia Un v ri , ld o1 5 0 , hn ) S h o E e t nc dI o mai n ie r , io i g c nc l i es y Huu a 2 1 5 C ia o r a n o n T t
l 概述
数据挖掘广泛地应 用在各 个领域。分类在 数据挖掘 中是
一
结点 的测试属性开始分裂 ,以便使之后进行分类时所需要的
信息量最小 J 。
项非常重要 的任 务,用于 预测数据对象 的离散类别 。在有
指导学 习中,决策树是一种常 用结构 ,它是一种应用广泛的 数据挖掘分类 方法 ,具有分类精度高、速度快、生成的模式 易于理解 等优点而受到广泛 关注…,它可 以生成易 于理解的
规则 ,计算量相对来说 并不是很大 ,同时还可以处理连续和
22 数据仓库 . 数据仓库是一个面 向主题 的、集成 的、随时间变化的和 不易丢失 的数据 集合 ,支持管理部 门的决策 过程 J 。数据仓
库通常基于多维数据模型 ,这种模型将数据看作数据立方体 形式 。 它其 中的每一维表示一个属性或数据模型中一组属性 ,
文献 标识码:A
中图 分类号: P8 T1
决 策树 与数据 仓库 结合 的研 究与应 用
沈 学利 ,钟 华
( 宁工程 技术大学 电子与信息工程学 院,辽 宁 葫芦 岛 15 0 ) 辽 2 15
摘
要 :针对决策树 因生长而 导致 的 占用存储空 间大、查询速度慢、提供分类决策信息失误率高等弊端 ,研究数据挖掘 中决策树与数据仓
d tb s, ipoetun u a r aiefaiit n pr r y a ae t s rjc rs t fm t s lya ds ei i . a h t o ai v e bi u o t
[ ywo d ]d t nn ; eiint e d t aeo s; eiinsp o ; l e ayiaPo es gO AP Ke r s a miig d cs e; aaw h ue d cs p r Oni lt l rcsi ( L ) a o r r o u t n An c n D0I 1 .99jsn1 0 —4 82 1 .1 3 : 036 /is. 03 2 . 11 . 0 . 0 0 0
Байду номын сангаас
[ src ]T ecmmo f eiint ea ddt aeo s ed t miigf l,hs ae raieyc mbn s oho e I re Ab ta t ot o h no cs e n aaw rh uei t aa nn i d ti pp r et l o ie t fh m.nodro d o r nh e c v b t t
多种子类 ,除此之外还 可以清晰地显示哪些信息 比较重要 。 但决策树会随着 生长过程而越来越 “ 繁叶茂” 当希望取到 枝 , 分类规则 时, 就显得繁复冗杂 。而且在查 询信 息时较为变慢 , 且存储空 间变大 。同时在 实际应 用中也不难发现 ,决策树构 建 出的较 多情况是将分好 的类别交 由决策者进行某方面 的决
a o tn t e o d p i g h c mbi a i n h p o l m s u h a i h t r g c p to ,l w u r p e d h g ro r ba i t f c a sfe d c so n to ,t e r b e s c s h g so a e oc u a i n o q e y s e d a i h e r r p o b l y o l s ii d e ii n n i i f r ai no m t on whih r s l d fo d c son te ’ c e sn r o q e e . t ra pl i g t i o c e u t r m e ii r e Si r a i g a ec n u r d Af p y n h sc mbi a i n t o eta e g n y’ c in n o ma i n e n e n to o s m r v la e c S le t f r t i o
p o i e f l e iin s p ot ticu e o iain o e r sn ain a d o eain b sd o l e A a t a P o esn ( AP .A tr r vd ul d cso u p r n ld s c mb n t frp e e tt n p rt a e n Oni n l i l r c s igOL ) f y ,i o o o n y c e
第3 7卷 第 1 期 1
V_ . 7 0 3 1
・
计
算
机
工
程
2 1 年 6月 01
J n 2 1 u e 0l
N O. 1 1
Co mpu e trEngne rn i eig
软 件技 术 与数 据 库 ・
文章编号: oo 32(1)—08—0 10- 48 011_ 9_ 2 1 o 3