IBM数据挖掘解决方案(1)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通过选择或填写框快捷实现参数调整与设置
• IBM SPSS Modeler提供了两种建模方式:简单模式和专家模式 • 在简单模式下,用户无需做任何设定,系统会按照默认的设置建立模型 • 建模节点中的专家模式提供用户根据建模模型目标及实际业务数据特征等进行参数调整.如k-
means聚类模型中的专家选项,提供用户选择模型不同的最大迭代次数及更改容忍度等参数选项
多种行业典型数据挖掘应用模板
SPSS Modeler根据行业特点和成功应用经验,建立了包括电信行业(客户保持和增加交叉 销售)、CRM(针对客户的获取和增长,提高反馈率并减少客户流失)、欺诈探测(发现金融 交易和索赔中的欺诈和异常行为)等多种数据挖掘应用模板(SPSS Modeler CATs).提供了 从问题背景,模型建立过程至模型结果解读等详细描述.这些模板可以使用户快速了解数据挖 掘的行业应用,并将其应用在实际的项目中.
直观易读的图形表格加文字化的结果集
无论是简单的数据统计图形化结果还是最终建模模型的结果描述,通过图表与文 字描述的结合,将最终数据挖掘或分析的结果解读变得直观明了
图中条形图通过颜色深浅、长短来展示不 同变量对预测结果的重要性大小
网状图中线条的粗细展示了项目间关 联的强弱
数据挖掘流程易于统一管理、方便重复利用与共享
版
本
管
理 设
工
作
流
权
限
管
理
DM – 基于业务场景的向导式快速建模
• 影响决策的主要因素不仅仅是知道“将来可能会发生什么”,还有很多其他因素,比如已有的市场 经验、公司既定的政策等等。所以, IBM SPSS Decision Management 不仅能得出预测分析结果, 而且向前更进了一步,能够帮助决策者将影响决策的各种主要因素引入进来,最终得出更加明智的 决策。DM提供了在浏览器上完成分析和行动的能力,定制了分析中最常见的分析应用场景,使分 析人员在浏览器上直接调用分析结果,并把业务规则与分析结果进行匹配,从而分析结果能够快速 有效的被利用。
所有操作都在一个工作区完成而无需跨模块操作
整个数据挖掘过程中数据获取、处理,模型建立、评估及部署都只需在一个工作 区完成,无需分多个模块操作。
工作区
整个建模过程只需拖拽图标即可实现无需写代码
SPSS Modeler支持图形化界面、菜单驱动、拖拉式的操作。它提供了数据源、记录处理、 字段处理、图形、模型、输出和导出等7大类结点,建立数据挖掘模型时只需要把相关节 点通过鼠标拖拉的方式连接在一起就可以了,整个过程基本不需要任何编程序工作。
系统全面的中英文帮助文档说明
• 帮助文档提供了从数据挖掘整个过程点对 点的详细说明及应用举例。包括14种源节 点,10种记录操作,17种字段操作,9种 不同图形节点,30种建模节点9种输出及 9种导出节点.
• 在对节点做详细说明外,针对深入使用的 分析人员提供了脚本编写说明.
• 另外帮助文档提供关键词搜索,可以获取 需要的各种问题解答说明.
对所有分析挖掘的结果(包括如modeler生成的模型,statistic产生的分析结果等)进行集中、安全和可监控 的存储和管控,同时具备先进的机制把分析处理的结果分发至最终用户, 使得预测分析过程与企业系统 的整合更加便利。 通过工作流设定在管理控制数据挖掘流程的同时 更能与企业其它流程整合设定整体的工作流, 将数据挖掘与企业其它系统整合。 实时打分将分析模型结果实时地应用在业务中,将实时打分结果展示给相关业务操作人员,实时地 对不同的获得不同分数的打分对象作出相应的操作(如call center 不同的话术) 另外权限管理使所有分析结果在进行信息共享时更安全;模型管理及版本管理在使用分析结果时更 系统化更优化
• 开放的设计使得Modeler可以支持所有市场主流的数 据库,从宏观上平衡IT投资
• 多年来,SPSS在世界范围内与顶级高校的广泛合作, 使得市场上人才储备充足,缓解了业务部门数据分析 岗位人才维继的瓶颈。
内容提纲
简洁的操作界面 – 所有操作都在一个工作区完成而无需跨模块操作 简单的操作方式 – 整个建模过程只需拖拽图标即可实现无需写代码 自动化数据处理与建模 – 使用自动数据准备及建模,更轻松高效的完成建模工作 全局多维度的数据审核 – 全局的数据审核功能让数据的基本信息一目了然 便捷的参数调整方式 – 通过选择或填写框快捷实现参数调整与设置 易读易用的结果集 – 直观易读的图形表格加文字化的结果集 挖掘过程易管理及重复使用 – 数据挖掘流程易于统一管理、方便重复利用与共享 完整清晰的帮助文档 – 系统全面的中英文帮助文档说明 丰富的行业应用模板 – 多种行业典型数据挖掘应用模板 灵活开放的第三方集成 – 多层面灵活的第三方集成方式 集成的模型发布与管理(C&DS) – 集成的模型发布管理及实时的分析结果应用 向导式快速建模(DM) – 基于业务场景的向导式快速建模 电信业的成功案例
• 自动建模节点估算和比较多个不同的建模方法,在一次建模运行中即可尝试各种方法, 根据指定的测量为每个候选模型排序,并保存最佳模型用于评分或将来的分析。
自动数据准备结果
自动建模选择及运行结果
全局的数据审核功能让数据的基本信息一目了然
对原数据有整体的了解与观察对作数据处理或后续建立、优化模型有大的帮助。 modeler中的数据审核功能将原数据中所有字段的相关统计信息通过一张表来展现。包括 字段的分布情况,最大最小值,缺失值等。无需单个字段 一 一 作统计,可以一目了然观 察到所有字段的信息 。一个操作统观全局 。
使用自动数据准备及建模,更轻松高效的完成建模工作
• 准备分析数据是任何数据挖掘项目中最重要的步骤之一,而从传统来说也是比较耗时的 步骤之一,自动数据准备 (ADP)可以完全自动化地使用节点,允许节点选择并应用修正, 或者也可在修正前预览更改,按照需要接受或拒绝。可以快速、轻松地准备数据以供建 模,无需具备相关统计概念的预备知识。
SPSS Modeler – 简单易用的数据挖掘工具
数据挖掘工具易用性的商业意义
• SPSS Modeler通过对复杂参数设置,数据整理,结 果呈现等进行封装,加上自动化,向导和模板等多种 简化方式,使得业务用户非常容易上手,将建模和分 析的能力真正给到业务用户。
• SPSS Modeler强大的图形界面,省时高效的流程管 理工具,加速了“Time to solution”,使得用户可以 集中精力在要解决的业务问题本身,反复探询,研究, 而不受制于比如编写代码等技术性工作
– SPSS集成第三方产品(功能),如数据源Cognos,数据库内的挖掘功能 – 第三方挖掘产品集成SPSS(功能)
SPSS的模型可以通过部署的平台C&DS,通过Web service方式将SPSS算法集 成到其他数据挖掘产品中 – 第三方算法对SPSS的扩展(API)
C&DS – 集成的模型发布管理及实时的分析结果应用
• 可方便地定义业务规则,并能非常容易地与预测模型的结果集成 • 引入优化技术,结合预测与其它多种业务相关因素对最终结果进行优化 • 强大的可配置性,针对不同用户、不同场景,快速进行场景构建
典型的应用场景
向导式的操作
可应用的典型行业
SPSS获电信行业各家客户青睐
多行业案例
问题背景描述
建模过程描述
模型结果解读
Leabharlann Baidu
多层面灵活的第三方集成方式
• SPSS 在提供便捷快速的建模功能外,能与第三方灵活地集成(可灵 活地融合到smartcare平台)
• 第三方的集成包括两个层面:
– API集成,紧密的底层集成 – 功能集成,松散的上层集成,通过直接的产品调用
• 三种集成方式包括:
SPSS Modeler建立的所有数据流、模型、图形和表格结果都可以保存在数据挖掘项目 中,如SPSS Modeler中提供支持CRISP-DM的数据挖掘项目管理功能。将整个数据挖掘 过程中涉及的流或者挖掘结果分步骤分类别的统一作为一个工程进行存储和管理。再次使 用或共享该工程文件时,整个数据挖掘过程包括数据处理、建模、评估及部署的所有相关 操作文件将统一呈现。更方便统一的利用和共享已有的挖掘项目。