数据挖掘模型DM分类及说明
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
▪ 所有的客户都应该包含在分群模型当中 ▪ 单个的客户和客户群必须一一对应
XX街XX号
7 60095245 G
XX街XX号
8 57252087 H
XX街XX号
9 54408928 I
XX街XX号
10 51565770 J
XX街XX号
11 48722611 K
XX街XX号
12 45879453 L
XX街XX号
13 43036294 M
XX街XX号
14 40193136 N
XX街XX号
6
指导性分群1
目标变量(分群指导变量):是否订阅了《纽约客》杂志
城市
纽约 台北
目标变量=1 (订阅过《纽约客》)
70% 30%
性别 女性 男性
目标变量=1 45% 55%
编码
性别
城市
编码后的 编码后的
性别
城市
1 0.8
2
1
A
女性 纽约
0.45
0.70
0.6
B
C
A 0.4
Gender
B
男性 台北
0.55
场合
分群维度
公司组织/ 人员
产业(SIC) 公司大小
关键购买 因素
需要
人人口口统统计计
客户价值 态度/意向
ARPU
盈利能力 与收入相配比的服务
成本
年龄 性别 职业 收入 生活方式 家庭状况
活动/行为
MOU 使用年限 安装时间 持有产品的种类 趋势
一般购买态度 购买心理因素
最最常常见见的的客户战分略群分维群度 维度
性别
A
女性 纽约
0
0
Gender
B
男性 台北
1
C
男性 纽约
1
1
A
0 0
0 群1: ?
群 2: ?
9
随意编码 0 1
B
1 City
客户分群常见维度
确定分群维
度
产品与服务的效果认
可
品牌的认知
感觉认知
财务制约 竞争对手
制约性
本地,地区,国家和国际 地点
竞争者的地点和客户服务
地理因素
什么时间 什么地点 如何购买
子目录
模型的分类与适用范围 模型的评价标准与方法 案例
0
数据挖掘模型按照功能划分主要分为描述性模型和预测性模型两类
技术相关:
无指导性分群
关联规则 (购物篮)
我们的客户是 什么样子的? 他们需要什么
?
如何选取最好的针 对性客户交互方式 ,以保证利润最大
化?
描述性模型 数据挖掘 预测性模型
技术相关: 指导性分群 逻辑回归 线性回归 非线性回归 决策树 神经网络
电信行业中最为广泛使用的预测模型通常是二元逻辑变量预测模型,如客户离网挽留 模型、营销活动相应模型等
Y=F(X)
400 350 300 250 200 150 100
50 0 0
25
50
75
100
黄色格子为 过去表现出 目标行为的 客户;白色 格子为过去 没有目标行 为的客户
寻找已经有 目标行为的 客户的共同 特征
7%-8% 6%-7% 5%-6% 4%-5% 3%-4% 2%-3% 1%-2% 0%-1%
2
电信业数据挖掘模型主要适用范围
交叉销售
客户分群模型
交易 行为
预测模型
信用 风险
流失倾向 交易价值 响应倾向 客户信用管理
生命周期价值
向上销售
账单催收管理
主动 新客户获取
客户挽留
3
无指导性分群定义
无指导性分群是将客户划分到具有相同行为、价值和社会属性等的不同组别的分析性工具
揭示蕴含于历史数据中的规律 无指导的学习
1
对未来事件的预测 有指导的学习
电信行业中最常用的两种数据挖掘模型是客户分群和预测模型
客户分群模型
• 指导性分群 • 无指导分群
263
145
110
90
70
50
28 128 228 290 360 580 982 1039
预测模型模型
• 回归 • 决策树 • 神经元
0.90
0.55
0.6
Gender
0.4
B
男性 台北
0.10
0.45
0.2
C
男性 纽约
0.10
0.55
0
0
0.2
群1:女性
8
群2:男性
目标变量=1 90% 10%
1
A
2
BC
0.4
0.6
0.8
1
City
无指导性分群
城市 纽约 台北
随意编码 0 1
性别 女性 男性
编码
性别
城市
编码后 的
编码后 的城市
1C
12
运用已经有 目标行为的 客户的共同 特征,按照 相似程度, 给其他客户 打分
目标客户列表
编号 电话号码
姓名 住址
1 85486643 A
XX街XX号
2 97645756 B
XX街XX号
3 59801486 C
XX街XX号
4 21957216 D
XX街XX号
5 59114637 E
XX街XX号
6 96272059 F
10
行为和价值是最能反映客户态度和需求的两个维度
态度决定行为 行为决定价值 关系体验决定满意度 交易关系、客户待遇及产
品满意度决定态度
品牌体验
品牌效应
客户
满意
需求/态度
行为
品牌依附度
关系
$价值$
基于产品种类
的参与 客户态度驱动了客户价值
11
预测模型定义
预测模型是通过对过去数据学习来判断未来某种行为或计量的数学模型,模型目标可 以是逻辑型或连续性变量,模型可以简单的用数学公式Y=F(X)来描述预测模型(X是 n元向量)。每个客户都将通过模型计算获得一个预测值作为业务决策依据之一。
15 37349977 O
XX街XX号
16 34506819 P
XX街XX号
17 31663661 Q
XX街XX号
得到模型计 分,选出相 似性高的客 户(红色格 子)
预测模型的建立方法
模型建立
应用1-4月份客户数据和6月份离网数据建立离网预测模型
1月
2月
3月
4月
5月
6月
客户数据
离网数据
模型验证
应用2-5月份客户数据和7月份离网数据进行离网预测模型检验
2月
3月
4月
5月
6月
7月
模型应用
基于离网模型,应用3-6月份客户数据预测9月离网客户
3月
4月
5月
6月
7月
8月
13
挽留行动
子目录
模型的分类与适用范围 模型的评价标准与方法 案例
14
分群模型评估标准
互斥性和穷尽性原则 (Mutually exclusive & Collectiv百度文库ly exhaustive)
0.30
0.2
C
男性 纽约
0.55
0.70
0
0
0.2
0.4
0.6
0.8
1
City
群1:纽约
7
群2:台北
指导性分群2
目标变量(分群指导变量):是否订阅了《化妆师》杂志
城市
纽约 台北
目标变量=1 (订阅过《化妆师》)
55% 45%
性别 女性 男性
编码
性别
城市
编码后的 编码后的
性别
城市
1
0.8
A
女性 纽约
群1 群3
4
群2 群4
指导性分群定义
指导性分群是在一定的目标变量(或称指导性变量)将客户划分到具有相同行为、价值和 社会属性等的不同组别的分析性工具
群1 群3
5
群2 群4
指导性分群和无指导分群的主要区别——问题
客户 A B C
性别 女性 男性 男性
城市 纽约 台北 纽约
您会怎样将这三个客户进行客户 分群呢?
XX街XX号
7 60095245 G
XX街XX号
8 57252087 H
XX街XX号
9 54408928 I
XX街XX号
10 51565770 J
XX街XX号
11 48722611 K
XX街XX号
12 45879453 L
XX街XX号
13 43036294 M
XX街XX号
14 40193136 N
XX街XX号
6
指导性分群1
目标变量(分群指导变量):是否订阅了《纽约客》杂志
城市
纽约 台北
目标变量=1 (订阅过《纽约客》)
70% 30%
性别 女性 男性
目标变量=1 45% 55%
编码
性别
城市
编码后的 编码后的
性别
城市
1 0.8
2
1
A
女性 纽约
0.45
0.70
0.6
B
C
A 0.4
Gender
B
男性 台北
0.55
场合
分群维度
公司组织/ 人员
产业(SIC) 公司大小
关键购买 因素
需要
人人口口统统计计
客户价值 态度/意向
ARPU
盈利能力 与收入相配比的服务
成本
年龄 性别 职业 收入 生活方式 家庭状况
活动/行为
MOU 使用年限 安装时间 持有产品的种类 趋势
一般购买态度 购买心理因素
最最常常见见的的客户战分略群分维群度 维度
性别
A
女性 纽约
0
0
Gender
B
男性 台北
1
C
男性 纽约
1
1
A
0 0
0 群1: ?
群 2: ?
9
随意编码 0 1
B
1 City
客户分群常见维度
确定分群维
度
产品与服务的效果认
可
品牌的认知
感觉认知
财务制约 竞争对手
制约性
本地,地区,国家和国际 地点
竞争者的地点和客户服务
地理因素
什么时间 什么地点 如何购买
子目录
模型的分类与适用范围 模型的评价标准与方法 案例
0
数据挖掘模型按照功能划分主要分为描述性模型和预测性模型两类
技术相关:
无指导性分群
关联规则 (购物篮)
我们的客户是 什么样子的? 他们需要什么
?
如何选取最好的针 对性客户交互方式 ,以保证利润最大
化?
描述性模型 数据挖掘 预测性模型
技术相关: 指导性分群 逻辑回归 线性回归 非线性回归 决策树 神经网络
电信行业中最为广泛使用的预测模型通常是二元逻辑变量预测模型,如客户离网挽留 模型、营销活动相应模型等
Y=F(X)
400 350 300 250 200 150 100
50 0 0
25
50
75
100
黄色格子为 过去表现出 目标行为的 客户;白色 格子为过去 没有目标行 为的客户
寻找已经有 目标行为的 客户的共同 特征
7%-8% 6%-7% 5%-6% 4%-5% 3%-4% 2%-3% 1%-2% 0%-1%
2
电信业数据挖掘模型主要适用范围
交叉销售
客户分群模型
交易 行为
预测模型
信用 风险
流失倾向 交易价值 响应倾向 客户信用管理
生命周期价值
向上销售
账单催收管理
主动 新客户获取
客户挽留
3
无指导性分群定义
无指导性分群是将客户划分到具有相同行为、价值和社会属性等的不同组别的分析性工具
揭示蕴含于历史数据中的规律 无指导的学习
1
对未来事件的预测 有指导的学习
电信行业中最常用的两种数据挖掘模型是客户分群和预测模型
客户分群模型
• 指导性分群 • 无指导分群
263
145
110
90
70
50
28 128 228 290 360 580 982 1039
预测模型模型
• 回归 • 决策树 • 神经元
0.90
0.55
0.6
Gender
0.4
B
男性 台北
0.10
0.45
0.2
C
男性 纽约
0.10
0.55
0
0
0.2
群1:女性
8
群2:男性
目标变量=1 90% 10%
1
A
2
BC
0.4
0.6
0.8
1
City
无指导性分群
城市 纽约 台北
随意编码 0 1
性别 女性 男性
编码
性别
城市
编码后 的
编码后 的城市
1C
12
运用已经有 目标行为的 客户的共同 特征,按照 相似程度, 给其他客户 打分
目标客户列表
编号 电话号码
姓名 住址
1 85486643 A
XX街XX号
2 97645756 B
XX街XX号
3 59801486 C
XX街XX号
4 21957216 D
XX街XX号
5 59114637 E
XX街XX号
6 96272059 F
10
行为和价值是最能反映客户态度和需求的两个维度
态度决定行为 行为决定价值 关系体验决定满意度 交易关系、客户待遇及产
品满意度决定态度
品牌体验
品牌效应
客户
满意
需求/态度
行为
品牌依附度
关系
$价值$
基于产品种类
的参与 客户态度驱动了客户价值
11
预测模型定义
预测模型是通过对过去数据学习来判断未来某种行为或计量的数学模型,模型目标可 以是逻辑型或连续性变量,模型可以简单的用数学公式Y=F(X)来描述预测模型(X是 n元向量)。每个客户都将通过模型计算获得一个预测值作为业务决策依据之一。
15 37349977 O
XX街XX号
16 34506819 P
XX街XX号
17 31663661 Q
XX街XX号
得到模型计 分,选出相 似性高的客 户(红色格 子)
预测模型的建立方法
模型建立
应用1-4月份客户数据和6月份离网数据建立离网预测模型
1月
2月
3月
4月
5月
6月
客户数据
离网数据
模型验证
应用2-5月份客户数据和7月份离网数据进行离网预测模型检验
2月
3月
4月
5月
6月
7月
模型应用
基于离网模型,应用3-6月份客户数据预测9月离网客户
3月
4月
5月
6月
7月
8月
13
挽留行动
子目录
模型的分类与适用范围 模型的评价标准与方法 案例
14
分群模型评估标准
互斥性和穷尽性原则 (Mutually exclusive & Collectiv百度文库ly exhaustive)
0.30
0.2
C
男性 纽约
0.55
0.70
0
0
0.2
0.4
0.6
0.8
1
City
群1:纽约
7
群2:台北
指导性分群2
目标变量(分群指导变量):是否订阅了《化妆师》杂志
城市
纽约 台北
目标变量=1 (订阅过《化妆师》)
55% 45%
性别 女性 男性
编码
性别
城市
编码后的 编码后的
性别
城市
1
0.8
A
女性 纽约
群1 群3
4
群2 群4
指导性分群定义
指导性分群是在一定的目标变量(或称指导性变量)将客户划分到具有相同行为、价值和 社会属性等的不同组别的分析性工具
群1 群3
5
群2 群4
指导性分群和无指导分群的主要区别——问题
客户 A B C
性别 女性 男性 男性
城市 纽约 台北 纽约
您会怎样将这三个客户进行客户 分群呢?