常用数据挖掘工具介绍
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常用数据挖掘工具介绍
常用数据挖掘工具介绍
1.SAS统计分析软件
SAS统计分析软件是用于数据分析与决策
支持的大型集成式模块化软件包。它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等。
SAS统计分析软件特点如下:
➢信息存储简便灵活
➢语言编程能力强
➢丰富的统计分析方法
➢较强的统计报表与绘图功能
➢友好的用户界面
➢宏功能
➢支持分布式处理
➢采用输出分发系统
➢功能强大的系统阅读器
SAS统计分析软件界面如下:
SAS分析案例如下:
2.Clementine数据挖掘软件
Clementine是
ISL(Integral Solutions Limited)公司开发
的数据挖掘工具平台。Clementine基于图形化的界面提供了大量的人工智能、统计分析的模型(神经网络,关联分析,聚类分析、因子分析等)。
Clementine软件特点如下:
➢支持图形化界面、菜单驱动、拖拉式的操作➢提供丰富的数据挖掘模型和灵活算法
➢具有多模型的整合能力,使得生成的模型稳
定和高效
➢数据挖掘流程易于管理、可再利用、可充分
共享
➢提供模型评估方法
➢数据挖掘的结果可以集成于其他的应用中
➢满足大数据量的处理要求
➢能够对挖掘的过程进行监控,及时处理异常
情况
➢具有并行处理能力
➢支持访问异构数据库
➢提供丰富的接口函数,便于二次开发
➢挖掘结果可以转化为主流格式的适当图形Clementine软件界面如下:
Clementine分析案例如下:
3.R统计软件
R是属于GNU系统的一个自由、免费、开放源代码的软件,是一个用于统计计算、数据分析和统计制图的优秀工具。作为一个免费的统计软件,它有UNIX、 LINUX、MacOS和WINDOWS等版本,均可免费下载使用。
R是一套完整的数据处理、计算和制图软件系统。其功能包括:
➢数据存储和处理系统;
➢数组运算工具 (其向量、矩阵运算方面功能尤其强大);
➢完整连贯的统计分析工具;
➢优秀的统计制图功能;
➢简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。
R软件界面如下:
R分析案例一如下:
R分析案例二如下:
4.SPSS分析软件
SPSS
(Statistical Product and Service Sol utions),“统计产品与服务解决方案”软件,是世界上最早采用图形菜单驱动界面的统计软件,其主要特点是操作简便,编程方便,功能强大,针对性强,全面的数据接口,灵活的功能模块组合。
SPSS分析软件特点如下:
➢操作简单
除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过“菜单”、“按钮”和“对话框”来完成。
➢无须编程
具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。
➢功能强大
具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。
➢方便的数据接口
能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件,Excel的*.xls文件等均可转换成可供分析的SPSS数据
文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt及html格式的文件。
➢灵活的功能模块组合
SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。
K-均值聚类SPSS分析案例如下:
快速聚类SPSS分析案例如下: