《客户数据挖掘》PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据挖掘的特点
• 数据挖掘是在没有明确假设的前提下去挖掘信息、 发现知识
• 数据挖掘所得到的信息应具有先未知、有效和可 实用三个特征
• 数据源必须是大量的、真实的、有噪声的
• 发现的是用户感兴趣的知识
• 发现的知识要可接受、可理解、可运用
• 并不要求发现放之四海皆准的知识,仅支持特定 的发现问题
从商业数据到商业智能
网站结构优化 网页推荐 商品推荐 。。。
基因挖掘
基因表达路径分析 基因表达相似性分析 基因表达共发生分析
。。。
商业应 用
商业模 型
算
法
关联规则、序列模式、分类、聚集、神经元网络、偏差分析…
挖掘算
层
法
数据挖掘的应用
决策树 Decision Trees
Income>$40K • 倾向性分析
Yes
NO
Debt<10% of Income
数据挖掘技术
●数据挖掘技术的分类
——聚类:根据某些属性将数据库分割为一些子集和簇
如:在了解客户的过程中,尝试使用从未使用过的属性分割人群以 发现潜在客户的簇
——关联:通过考察记录来识别数据间的密切关系 关联关系常常表现为规则,常用于超市购物篮分析
如:所有包含A和B的记录中有60%同时包含C。
——时间序列:用于帮助识别与时间有关的模式
90 80 70 60 50 40 30 20 10
0 1季度
2季度
3季度
4季度
统计的一个
重要价值就是它提供了对 东部 数据库的高层视图,这种 西部 视图提供了有用的信息, 北部 但不要求在细节上理解数
据库的每一条记录。
●经典方法
数据挖掘
可怕的数据
有价值的知识
4
苦恼: 淹没在数据中 ; 不能制定合适的决策!
数据
知识
决策
金融 经济 政府
POS 人口统计 生命周期
模式
目标市场
趋势
资金分配
事实
贸易选择
关系
在哪儿做广告
模型
销售的地理位置
关联规则
序列 数据爆炸,知识贫乏
5
数据挖掘
● 数据挖掘(Data Mining)
——数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间关系的 过程,这些模型和关系可以用来做出预测。
数据挖掘的特点
——数据挖掘与传统分析方法的区别 数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。
数据挖掘所得到的信息应具有先未知,有效和可实用三个特征:
先前未知的信息是指该信息是预先未曾预料到的,既数据挖掘是要发现 那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识
有效信息是指符合实际情况且具有一定的代表性 可实用是指可以指导企业的营销决策
如:通过对客户多次购物行为的分析可以发现购物行为在时间上的
关系
常用于产品目录营销的分析
数据挖掘的一般目的就是检测、解释和预测数据中定性的和/或定量的模式
数据挖掘技术
●数据挖掘方法学
——模式
数据库中一个事件或事件的结合,这些事件比预期的要 经常发生,其实际发生率明显不同于随机情况下的可期望发生率。
模式是数据驱动的,一般只反映数据本身 模式可视化
第9章 数据挖掘与客户关系管理
案例 卓越亚马逊的推荐系统
学习目标
通过本章的学习,将能够:
• 理解数据挖掘的含义 • 熟悉数据挖掘的功能 • 熟悉数据挖掘的主要技术 • 掌握数据挖掘的业务流程 • 了解客户关系管理对数据挖掘的需求 • 理解数据挖掘在客户关系管理中的作用
数据挖掘背景
数据库越来越大
Yes
NO
Debt=0% NO Yes
Good Credit Risks
Bad Credit Risks
Good Credit Risks
序列分析 Sequence Analysis
Open Accn’t
Add New Product
Decrease Usage
???
Time
• 客户保留 • 客户生命周期管理 • Leabharlann Baidu标市场 • 价格弹性分析
聚类分析 Clustering
• 客户细分 • 市场细分
关联分析 Association
• 市场组合分析 • 套装产品分析 • 目录设计 • 交叉销售
神经网络 Neural Networks
Q5 Q6 Q3 Q4
• 倾向性分析 • 客户保留 • 目标市场 • 欺诈检测
I1
I2 factor n
factor 1 factor 2
数据挖掘技术
●数据挖掘技术的分类
——回顾分析:注重解决过去和现在的问题 如:两年来不同地区、人口和产品情况下的各销售部门销售业绩分析
——预测分析:在历史信息的基础上预测某些事件和行为 如:建立预测模型来描述客户的流失率
——分类:根据某种标准将数据库记录分类到许多预先定义好的类别
如:信用卡公司将客户记录分为好、中、差三类 分类可以产生规则:如果一个客户收入超过5000万元,年龄在45-55岁之间, 居住在某地区,那么他的信用等级为好。
——验证模型
数据本身的处理过程需要验证 模型创建过程需要保证正确 模型应用的验证
在依据一些历史数据建造模型后,将模型应用于未参 与建造模型的其他类似的历史数据,比较其模型输出结果与实际结 果。
●经典方法
数据挖掘方法
——统计
统计可以通过对类似下列问题的回答获 得模式○在我的数据库中存在什么模式
○某个事件发生的可能性是什么 ○那些模式是重要的模式
——模型
对构建事件的源时的历史数据库的描述,并且能够成功 地应用于新的数据,以便对缺少的数据作出预测或对期望的数据作出 说明。
模型的一般表现形式
数学方程式
描述各客户段的规则集
计算机表示方式
●数据挖掘方法学
数据挖掘技术
——取样
根据问题的需要采用随机取样的方法从数据库中抽取数 据进行挖掘,有助于迅速发现模式、创建模型
客户接触
客户信息
统计分析与数据挖掘
客户数据库
客户知识发现
客户管理
知识发现:从数据中深入抽取隐含的、未知的和有潜在用途的信息
数据挖掘的应用
行
业 应 用
银行 电信 零售 保险
各行业电子商务网站
制药 生物信息 科学研究 。。。
相关行 业
层
商 业
CRM
产品推荐
客户细分
逻
客户流失
辑
客户利润
层
客户响应
WEB挖掘
——数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应 用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信 息和知识的过程。
——数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中 的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅 助商业决策的关键性数据。