常用数据挖掘工具介绍

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

常用数据挖掘工具介绍

常用数据挖掘工具介绍

1.SAS统计分析软件

SAS统计分析软件是用于数据分析与决策

支持的大型集成式模块化软件包。它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等。

SAS统计分析软件特点如下:

➢信息存储简便灵活

➢语言编程能力强

➢丰富的统计分析方法

➢较强的统计报表与绘图功能

➢友好的用户界面

➢宏功能

➢支持分布式处理

➢采用输出分发系统

➢功能强大的系统阅读器

SAS统计分析软件界面如下:

SAS分析案例如下:

2.Clementine数据挖掘软件

Clementine是

ISL(Integral Solutions Limited)公司开发

的数据挖掘工具平台。Clementine基于图形化的界面提供了大量的人工智能、统计分析的模型(神经网络,关联分析,聚类分析、因子分析等)。

Clementine软件特点如下:

➢支持图形化界面、菜单驱动、拖拉式的操作➢提供丰富的数据挖掘模型和灵活算法

➢具有多模型的整合能力,使得生成的模型稳

定和高效

➢数据挖掘流程易于管理、可再利用、可充分

共享

➢提供模型评估方法

➢数据挖掘的结果可以集成于其他的应用中

➢满足大数据量的处理要求

➢能够对挖掘的过程进行监控,及时处理异常

情况

➢具有并行处理能力

➢支持访问异构数据库

➢提供丰富的接口函数,便于二次开发

➢挖掘结果可以转化为主流格式的适当图形Clementine软件界面如下:

Clementine分析案例如下:

3.R统计软件

R是属于GNU系统的一个自由、免费、开放源代码的软件,是一个用于统计计算、数据分析和统计制图的优秀工具。作为一个免费的统计软件,它有UNIX、 LINUX、MacOS和WINDOWS等版本,均可免费下载使用。

R是一套完整的数据处理、计算和制图软件系统。其功能包括:

➢数据存储和处理系统;

➢数组运算工具 (其向量、矩阵运算方面功能尤其强大);

➢完整连贯的统计分析工具;

➢优秀的统计制图功能;

➢简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。

R软件界面如下:

R分析案例一如下:

R分析案例二如下:

4.SPSS分析软件

SPSS

(Statistical Product and Service Sol utions),“统计产品与服务解决方案”软件,是世界上最早采用图形菜单驱动界面的统计软件,其主要特点是操作简便,编程方便,功能强大,针对性强,全面的数据接口,灵活的功能模块组合。

SPSS分析软件特点如下:

➢操作简单

除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过“菜单”、“按钮”和“对话框”来完成。

➢无须编程

具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。

➢功能强大

具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。

➢方便的数据接口

能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件,Excel的*.xls文件等均可转换成可供分析的SPSS数据

文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt及html格式的文件。

➢灵活的功能模块组合

SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。

K-均值聚类SPSS分析案例如下:

快速聚类SPSS分析案例如下:

相关文档
最新文档