国外先进数据挖掘工具的比较分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
onc
hllrtKklccd
imo China
data
mining
t001.whidl
fits
10
company[11is paper aimsIo allalyze and compare kinds of beading dataminingtools
【Ke)¨orrisl 1).岫illining;Knowledge
2数据挖掘工具特性比较
数越}挖捌l:具市场分为3个部分:(1)通用数据挖掘工具 包括:SAg
En'・erprise Miner、IBM Baidu Nhomakorabeantelligent Miner、
UnieaPRW、SPSS Clementinc、SGI MineSet、Oracle E}arwln
平|IAngoss KnowledgeSeeker;(2)综合数据挖掘工具能提供管 删报告、在线分析处删和在酱通结构・p的数据挖掘能力。
nq州纵 J,前掣糊外m f.H束做数婀 腱1‘和椎蔷。2)^竹浊1 ffJ 不址年¨模,“瞰置l‘的制讣曲 川都址弃户衙婴考啦ffJPIiJ'F J垃木。3)托十多竹m服舟 器f:的岳现篙世个0门r『』 服务船.斗|Lf4食CPU仪仪 盘持个川户。4)扎lld甘~ “.世个m常择埘幢川的I H.fII这楚咀减少商业0客 泉抉褂^}^收旆的止f^性们 蜘火为f℃价帕 w斗越NCR新 螂虻m一“品. ¨轼仆啊?山MS sQLm绁仆m f)¨搿.震 川-州惦打 Jt。2)操们t 挺抽世求世 岛缎桃Il讣 i<ji0舭人 ¨,}^玳巾: 咀即牌
Engineering会刊出版『由KDD技术专刊;以半月刊Knowledge Nuggets为代表的KDDlH予出版物和DM
Emai[
一般,可能仅满足要求.没有数据探索功能,与其他软件接
口箍,只能用DB2,难以发布。结果美观,但同样不好理 解。Oracle功能较弱,使用不方便,没有数据探索功能,市 场份额也小。Oracle2002年9月欲摊出其自己的数据挖掘_:_I二 具。SPSS是SAg的强有力竞争对手,也以统计理论为基础, 功能强大,有完备的数据探索功柏,也较易掌握,性价比较 高,有能力处理大数据量,而且SPSS具有方便的发布和集 成功能.使得结果形式完命在系统设计人员掌握之中。其它 数据挖掘工具,|;/IINCR只能接Teradata,曾是SPSS的合作伙 伴.刚推i_l{自己的挖掘工具,在某J!{}方面还不太成熟。 由于不町能对所有数据挖掘工具都有直接应用经验.而 I=L数据挖掘工具在不断更新,定期或不定期地有新版本出 现。溺此,奉文i;i:r能会迪瀑一些氟要的评仙属性,请尽可能 参阅各种:I:具的技术文档。 总之,1i}=业在选择数据挖掘]二具时需要考虑很多附豢, 很难按照一个固定的原则给数据挖掘工具排一个优劣次序。 应根据企业特定的应用需求加以选择。国外许多行业等已经 大量利用数据挖掘工具来协助其业务括动,国内在这方面的 应用还处于起步阶段,研究和学习国外先进的数据挖掘I:其 是很有必要的。
II)MOI
+il',lk务.柏为MS SQLI'I</J)/艟÷h壳
最刊川¨2)共{iE忧
”址{一』以II。描fl+书Jm 崩业Ur,缔结介刊数抓 {2*n f4,1'i!J{*j-
BI最统解珧 b。蛀
洲分训忆绝常
n韩个介埘ql女li
蝶。川蚰对・-』碰化J {1潍州伸博f柑9j啦数 n-:挖蜘的蛳少骤 盘t州7 台数{“: 摧州 I)适I』r多种{蚺”最 !'It49t#钟乳¨:浦。2, 垭过将撇"。推¨戤州 ¨.挝州数_|ll=J1:_l主;[

核心站予值山^擞柳昨日f挫
术轴九。Omele J睫m韭敦谢
坛为Clenmntille
MSfl+为111:摊址人 nq泵缱{IIOA软川 曲,^DMn瞄jj|} 乏崩业J州|J蚌骋
SAS为l}41hi f。h、川数圳 缆¨廿*ij盘 什.敦撕挖 捌I.H统}| 计析岫能世
mM悖凡Simon Fn咄l
Scien钟andtechnology,NaniingUniversity ol Agricullurc.Naniing 210095)
lAbstrac!l
have bccn
mthe
pasi
years,[bfeign coinpaniI:=s andinstitutions have producedmany advanced dataminingtools-At Iowidvel the,greatest problem is how to ch小)sc
打甜、le
C『{lSP.DM
没冉捌II…么柑 };I|的仃“、沦
不¨
’iSPSSJ
ElII]nlj
没响赴…f|幺特刖 的山法沦
SEMMA
戢机升忻挖蜘(OLAM) ll元规则甘引
、rCRISp-DM
山。浊沦
h、Hl!
l^朴 _I_Il解
J囱l亩11博户终 啼.晰":r J征们li'+i ql,6J趣.』i“ff}r
凡"j+:1nlellit+mnl
Systems Dutilbase
仝球雏钔商. 1婴经蠊“3-' 数11t14'.1叫{Jlf 茌州-
J4./':乩・I・啦龇蚍进Dm-iVin. 返意味卅阻轼fl将七副:抉褂 收入水£拧,”-%Jj:发f¨性术 芷i告.
Rc辨Br曲Lab-
oratoryalJ址.DBMinel rechnology避!}J|蛙 们个窜f『*瓠料挖 掘系统,
IIjM Clcnlenlilw.SPSS Inlelllgent Miler
t嚣髑工其性囊比较
SOL Server 20<m SAS NCR MIcm绷n SAS Insthule DBMiner I'echncllc,gy
Darwin
I)Oracle.1"hinking Machines
2)Omcle9i柑自新f1‘112蜘I H 逃f'l(Omcle "1t1:11{ MiningOpli椰)
Discovery and Data
其网列。1“。 我们用表格的形式(表I,见后2页)对这些数据挖掘]:具 进行了分析和比较.经分析可以看出,SAg完仝以统计理沦 为基础,功能强大,有完蔷的数据探索功能。但难以掌握, 要求是高级统计分析专业人员.结果难以理解。价格也极其 昂贵,而n是租赁模式。IBM的Exterprise Miner简单易用, 是理解数据挖掘的好的开始。能处理大数据量的挖掘,功能
I‘部"3-si川拽
f1:钳川 H柯II:;:ii'g!fi的啦 槲艘小披s,j、fIl ii_i|1需型“杂的 傺f1・.比较近卉 柞询凡¨ 仪II J(1 1Unix系缱h必坝址c, s鼎蜘√k诚入Oracle
dalalmses+
i;!【B,lgl!li'P
1世
没有f L何l矩l"求l JF
证11』丁多利一 拦1”最绒, -d以连接再 利・不IllJ n0数 槲源。提供 r系驯数蜊 胜小钍巧
Club论坛。Garlner Group的一次高级技术调查结果显示,
“未来3~5年内将对_:f:qk产生深远影响的5大关键技术”之 前的是数槲挖扣【和人1:智能,“未来5年内投资焦点的10大 新兴技术”前州f矗垃,f行处理体系和数据挖掘;麻省理工学 院的“科技nⅡ删挣公;IIi“改变未来的lO项新*科技趋势”之 ‘怂数札e挖掘;荚国罔家科学基金会的数据库研究项目中, KDD被#,J为最有价值的项日。
近川丁#剃一排fl采 绒。基I
Ol^I’他It【
救(ETemdata龃 州峨山“¨.n: 嗡r—I铺酏叫I: 没钉七H关 m¥释
叭MS^鲥、Ui.
的玳蔷,f.1if,g转
空水空什,或者衄过敦州H? 韬。州-氟统舡捌¨i施术珏八其 他敦掘乐鲢,3)Excel仆数 扪燧d、
Excel'f1故扣;键小
撼赴tsl(Iq挫谥U一呲
Discovery
基盒疆日:南京农业大学青年科技创新基金资助项H
作者蕾舟:张雪英【t970--】.女.讲lII|j、博士生,t要研究方向为
智能信息{盘索和Web数据挖掘 收藕B蠢:2002—08一07
的性能测试报告。订荧这屿数据挖掘工具的简要内容可参考
万 方数据
囊I
比括 掘廿 ,…11^犍 供IⅢ
discovely:Dalaminingt001
l概述
数据挖掘正成为计算机科学和技术应用的一・大研究热 点。m奖H人I:智能坍会主办的KDD例际研讨会已经召开 r7次,研究煎点逐渐从发现方法转向系统应用。一些章题 会议也把数辩挖撕I和知识发现列为议题之‘,数据库、人工 帮能、信息处瑚!、知识]:程等锁域的国际学术刊物也纷纷开 辟KDD章l趣或专列。例如IEEE的Knowledge
半。3) 小拙10 条驯数懈J裢
川p 蚪IllI
Jm过迎接竹一1^的A,j、 fF;。℃.搏,^n 11lJ雠编
垭过仕川“如n0 数拊lf讹化性求 帛1个健扎m雄 jJava(1IJ JII户胁 魁mm“术埔曲l
州税化摊IllI,为棚一节肯_l秆 缸船舶^挺{Jl:了州计较强m 川户补“
lU桃化抖Ill J
捌白 啦扣
¨SPSs定fp rfF灯+rk n世甜剜币ⅡO呐r:乩 #|J^illI就l-j吼II山惮 {1数删挖搠。斌吐SPS s砒砸时问noj.f训.iif 吼cf_ff』户r『I,q学碰数 抑H±州帕j立r—t81拧补 徘{1_。2l f瞳啦乖f~雌 护和樽,“¨缎上… ,4+j御蚪的竹川£
如:Cognos Scenario午llBttsiness Objec如;(3)面向特定应用的
数据挖掘【:具包括KDI(零售)、0ptions&Choic叫保险)、
HNC(欺诈行为探查),HlUnicaModelI(市场)。
…玑陶外比较有影响的典型数据挖掘系统有:SAS公
l习的Enterprise Miner、IBM公司的Intelligent Miner、SGI公司 的Mine,Set、SPSS公司的Clementine、Rule'Quest Research公 司的See5、还柯CoverStory、EXPLORA、Knowledge Workbench、DBMiner、Quesl等。参见http://www dataminiaglab conl,该网科i提供了许多数据挖掘系统和工具
NCR流Pll址; 一寤义商卅6U 地 ~教*‘探索 一帆处州 ~让一模,“ 一出施
MS
1・蚶址引埘小
sAs公司H 甘多‘Fl-甫 『fjlUf.fl
J'qk
I】融八多种*h!坡现
思姆.12JllflmJ槭性"P 约、窟舰9liJP,7导蛙 耻。2)最统Jm能较全 illl。.3j乐纯*‘仇r 利-技宅帮帕知iJ-艇州 ih
IBM队为数据挖 抑肿r人多拙辫 户烂…’h艇抽nq 过川.1刖此他fl'J 把j^什f1-山 人胆井☆川帕 个
1)D.刑in只陡先成少付∞m 川.山丁跳乏钾浊.兜成 !I常址的数州挖掘II jqil+l 雌。2)甚铷r数撕挖捌过¨ 的企¨性癣I州关0京的竹浒 参’,。3)高膻依靠I;u廿.Ji罩 低r‘J 0门n0 n',iqk 0家自JUl 外舟舯“沂性,4)JⅣ场份瑚
Analysis and Comparison of Overseas Leading Data
ZHANG Xueying (College
ofInformation
Mining Tools
present.more andillorctools the specitic business ol
01)C
l,j剃化掸Iflj.幕r
0LAl’
博十些骤均 有i—j桃化抖
i‘J视化71tlhl
P.。蚪琏・{啦矾定
4t川眦
挺fJtl+7 业范干 能山 SPSSI'14j桂心托t健山 址埘过再利一仆tlit女术 朱解挑商,4t/.f4ji!i 儿自抽}人n0仆礼 ¨盯能JJ。IBM 呐1,’班ml南坫徙 够点”人付I'PtJ套 饯川*I,Jj.t探liI凡 馒饪啦默挖盐【;卦.
第29卷29161tt]
计算机工程
2003年9月
・发展趋势,热点技术・
文章■号:Ioom0428(2帅3)16—_0帅I—m3
文_晦艰珥:A
中田分类粤l
TP3
国外先进数据挖掘工具的比较分析
张薯类
(南京农业大学信息科技学院,南京210095) 捕蔓:近年来,园外l辅续推出了-些先进的数据挖掘工具。国内也在不断地引入这些数据挖掘]二具。随着数据挖掘工具的不断涌现,如何 选择适合证北自身特定需要的数据挖掘r再。已成为企业引八数据挖掘拉术的一大难题e文章在摘要概述数据挖掘技术背景昀基础上,从食 _k应用的埔『堑,仝而洋缃地比较分析了当前国外先进的数据挖掘工具。 关t诩:数拊挖捌;知识发现;数据挖掘工具
相关文档
最新文档