数据挖掘案例2014.04-10
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
成功案例:
1,Credilogros改善客户信用评分业务(直接数据挖掘,预测统计分析方法/软件) Credilogros是阿根廷第五大信贷公司,它需要识别与潜在预先付款客户(缺乏充分的信用记录数据)相关的潜在风险,以便将承担的风险最小化。Credilogros选择了SPSS Inc.的数据挖掘软件PASWModeler,因为它能够灵活并轻松地整合到Credilogros 的核心信息系统中。数据挖掘的收益包括:
1)处理信用数据和提供最终信用评分的时间缩短到了8秒以内。平均每月使用PASW
Modeler处理35000份申请。这使该组织能够迅速批准或拒绝信贷请求。
2)最小化每个客户必须提供的身份证明文档,某些情况,只需一份身份证明即可批准
信贷;
3)风险监控,仅在实施3 个月后就帮助Credilogros 将贷款支付失职减少了20%。
2,中国宝钢集团(直接数据挖掘,分类分析方法)
宝钢自1985年投产至今,积累了大量的生产数据,从每一炉钢到每一块板坯到每一个钢圈,各级计算机系统可以把这些数据完整地收集起来。采用数据挖掘技术对钢材生产的全流程进行质量监控和分析(通过全流程实时监控获得了丰富的生产数据),构建故障地图,实时分析产品出现瑕疵的原因,有效提高了产品的优良率。
宝钢采用了两个数据挖掘工具,一个是自行研发的基于SAS的practical Miner,另一个是美国SAS公司的Enterprise Miner。在冷轧和热轧的产品质量控制中,仅2001年就取得超过3000万元的经济效益。在配矿优化项目中,通过确定不同铁矿石的合理比例,每年可为宝钢降低成本6000万元。另外,通过分析轧制计划,分析和优化库存结构,降低库存成本和平衡物流成本。
3,DHL实时跟踪货箱温度
DHL每辆车都装有持续记录车速、时间及温度的特制“黑匣子”,拥有全球定位系统,并由随车安保人员实时监控。一旦有偏离路线、超时停车和车内温度异常情况,货车必须重新装货。基于“黑匣子”提供的大量数据进行数据挖掘,可以根据温度控制的目标,制定和优化行车线路、司机配置、提供车况评估等决策支持。
4,沃尔玛超市里的尿布与啤酒(间接数据挖掘,关联规则)
在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习惯,沃尔玛对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛数据仓库里集中了其各门店的详细原始交易数据。在这些原始交易数据的基础上,沃尔玛利用数据挖掘方法对这些数据进行分析和挖掘。一个意外的发现是:"跟尿布一起购买最多的商品竟是啤酒!经过大量实际调查和分析,揭示了一个隐藏在"尿布与啤酒"背后的美国人的一种行为模式:在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,而他们中有30%~40%的人同时也为自己买一些啤酒。产生这一现象的原因是:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。
5,民生银行“高端客户流失风险预测研究”项目
在客户关系管理中,“老客户的保留”是十分重要的研究领域。已经发生流失的客户还有较高的挽回余地,若银行能在客户刚刚产生流失意向时就准确识别出他们,并辅以适当的客户关怀策略,这些客户应具有更高的可能性被挽留。
项目研究首先明确一个标准化、规范化的商业银行数据挖掘流程框架,结合相应的数据准备、字段筛选、模型选择等问题,逐步建立客户流失分类预测的映射关系、客户按流失可能性从高到低排序、从客户特征中挖掘出客户将发生流失的规律、实现客户挽留策略的个性化定制和资源的差异化配置、将分类预测模型及相关结果部署于现有管理信息系统中。
6,中国银联股份有限公司“异常交易检测方法”
2006年网上支付在我国所有的电子支付交易中占比96%,而且会越来越普及。另一方面,网上支付的便利性和信用卡用户的不断增加也为犯罪分子进行金融欺诈等犯罪提供了更多的机会。这需要银行等金融机构采取一定的措施来予以控制。这里异常交易被定义为,满足系统对于正常交易的规定,但本质具有一定的欺诈特性,比如攻击者利用盗取的合法用户信息进行的交易,或者合法用户进行的恶意透支行为等。
提出一种基于数据挖掘的异常交易检测方法,可以在业务层面和操作层面对交易中的异常进
行检测。当一个用户提交一笔新的消费交易时,采用贝叶斯信念网络算法判断当前交易属于正常交易的后验概率,作为在业务层面的可信因子;然后提取该用户在当前交易之前的若干个操作,与当前交易一起构成一个固定长度的操作序列,并通过BLAST-SSAHA算法将其与该用户正常操作序列和已知异常操作序列进行比对,得出在操作层面的可信因子。综合考虑业务层面的可信因子和操作层面的可信因子,最终决定当前交易是否为异常交易。
7,英国电信
英国电信需要发布一种新的产品,先通过数据挖掘对客户进行分析,然后通过直邮方式向客户推荐这种产品,最终直邮的回复率提高了100%
另外,英国电信升级其Motive客户体验解决方案,并部署数据收集管理器,跟踪人们家中激增的通信设备,然后利用这些数据主动管理网络和设备的运行方式,确保客户有更好的体验。
8,GUS日用品零售商店(神经网络模型、规则归纳技术)
多年来GUS用多元回归分析和大型机系统软件进行预测,但这些评估经常过于保守。后来采用了SPSS快速、可视化建模的数据挖掘工作平台:Clementine,其神经网络模型所作的预测比较出色,均值绝对误差降低了4%,标准差降低了10%;通过Clementine的规则归纳技术,GUS在预测的风险等级分配的正确性方面提高了20%,通过数据挖掘的方法,更准确预测未来商品销售,库存成本比原来减少了3.8%。
9,美国国内税务局
基于IBM DB2数据库软件的综合逃税人监察项目,仅1996年就帮助税务局追回补交税款2亿笔、增收200亿美元的税金和罚款,并进行了120万笔账目审计。另外,可以合理安排税务官的工作,为纳税人提供更迅捷、更准确的服务。
10,Mellon银行
商业银行的利润和风险是共存的。为了保证最大利润和最小风险,必须对账户进行分析和归类,并进行信用评估。Mellon银行使用数据挖掘软件Intelligent Agent提高销售和定价金融产品的精确度,如家庭普通贷款。该工具可以(利用交往、分类或回归分析等商业智能)确定现有用户购买特定附加产品:家庭普通信贷限额的倾向,可生成用于检测的模型。