电信客户流失分析(pdf 25页)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
电信业客户流失分析和维系实务 --误区与正途
SAS中国 解决方案部
日程计划
1. 当前国内流行的流失分析及其应用 2. 困惑和问题摘取 3. 基于SEMMA的流失分析 4. 镶嵌于分析流程的BI 5. MA和维系实务流程 6. 结束语:三个闭环与架构
客户流失的商业事实
欧洲:每年有35-50%的客户流失
≥19
2 1 >%1
25%
0.2 0.00.0 0.2 0x.41 0.6 0.8 1.0
听
Assess-评估
公允的模型量化评估和综合评判模 型结果
• Lift Chart • ROC Curve-C统计量(AUC)
• Gains chart • 模型复杂程度 • 使用测试数据集
各有千秋时如何选择最终模型?
Explore-探索
最容易被忽视的一个环节 •变量的选择:很多解释变量都自相关, 通过R方,卡方和PCA等大量降维 •分群:可以作为许多报表和OLAP的基 础,也是多个流失预测模型系统的基础- 在每个群中建立不同的流失预测模型 •关联:可用作渠道分析等等 •多维和单维的视图观察,检查各类算法 所对应的假设条件是否满足
这才是我们想保留的客户!!!
目标:
• 在客户流失的行为发生前把 他们检测出来!!!
• 理解客户对您的期望和他们 流失的原因
问题定位:
• 那些客户看起来就要流失? 如何保留那些有利可图的客 户?
• 为什么客户会转向竞争者?
KPI:流失率还是利润率?什么时间段?
数据准备时间通常是分析时间的4-5倍
• 数据重组、汇总、转置、扩展 • 数据与时间、事件框架的匹配 • 时间失真 • 交易数据是最重要的,每一笔交易数据清晰显
解解决决问问题题的的方方法法是是正正本本清清源源,,彻彻底底理理解解方方法法论论的的含含义义
分析前先确定分析目标
流失定义:四类两对
• 财政/非财政 流失:财政原 因流失指有不良付款记录的 客户流失,非财政原因流失 指信誉良好的客户流失。
• 主动/被动 流失:指该客户 是否主动选择流失。
主动,非财政原因流失的客户大多 是那些高价值,长期合作的客户。 他们会对市场变化做出一定的反 应。
Modify-修改
优化您的数据 极值,异常值 缺失值
• 树填缺 • 统计量填缺
变量转换
• 建立新的变量 • 改变分布的形状
定义最优的输入域 处理共线性-与变量选择一起
Model-建模
流失预测建模需要考虑的算法特征:
稳健性:Bias-Variance
输入
灵活性
神经元 连 接 输权出
(Monte Carlo)等等报表,帮助进一步改进、更新和创新
MA和客户维系/关怀工作实务
只有将客户流失分析运用于维系实践才有作用 需要有分析与业务流程的无缝连接 需要在所有的客户互动中使用客户智能,无论:
· 互动是组织本身、第三方还是客户发起的 · 什么样的渠道,呼入还是呼出 · 什么样的互动方式,如市场活动、销售活动、服务、信息等
析主题
分析中,BI成为综合使用各类分析工具的纽带,例如:
· 流失预测模型本身不能降低流失率,只能找出流失概率 · 综合运用其他模型(如分群),可以帮助找出流失原因 · 需要BI工具展示结果,帮助业务人员根据原因设计维系方案,改变
客户行为趋势,才能真正降低流失率
分析后,BI产生各类统计测试、假设检验、事件模拟
概率( 流1失)
.5
0100
多层神经元网络
行为1
100 0 0 行为2
可解释性
隐藏层 1.0
算法之间不是互斥,而是互补-多个算法并用
0.8
从概率预测到科学决策
预测损益矩阵 双阶段模型
新案例 占线 = 11 申请留言信箱 =
x200..46
无日收人均入接通2=听话% <4==21k2109845%日均通话1<01-5占线次数950%2,无人接>521
分分析析人人员员仍仍有有大大量量困困惑惑和和问问题题
基于SEMMA的流失分析
• Sample • Explore • Modify • Model • Assess
取样 - 方法与重要性 探索 - 交互式的观察与分析 修改 - 合理地修改变量 建模 - 预测性模型简介 评估 - 公允的模型评
(Honest Assessment)
• 收益最高点时哪个模型更好 • 取决于需要关注哪个分位点阶段的客户 • 取决于成本预算大小 • 总体的指标:AUC,MSE,Confusion
Matrix……
ROC 好 中 差
增பைடு நூலகம் 累计增益
BI在流失分析流程中的作用
BI应当不仅仅能处理业务报表,更应能处理分析报表
分析前,BI处理分布对比、趋势分析等报告,帮助产生分
示了客户的行动--正在使用服务,支付账单, 咨询,投诉,处于本地还是漫游状态 • 客户过去行为的稳定性和改变是分析的重点- 通过衍生统计量,如比率、差分、移动平均等 来体现
• ……
Sample-取样
OK 流失
你做到了没有? ·看一下DOE是否合理 ·流失分析一般需要过采样 ·把数据分割为训练、验证和 测试三份 ·看目标变量在各数据中比例 是否一致 对公允的模型评估至关重要
获取一个新客户的平均成本:~$700 → 几乎相当于一个客户5年内给公司带来的净利润 直接导致客户回报率下降
美国:40%流失,新客户成本$400 亚洲:反常→ 过激竞争→ 极高的客户流失 全球:每年因为客户流失所带来的损失在100亿左右
所有数据仅限于电信行业
“通常”的流失分析及其运用
• 流失定义:拆机、停机… • 许多行为变量:呼入、呼出、支付、移动性、
帐单… • 流失倾向模型建立:决策树或者是黑箱… • 客户筛选:打分,让业务人员找前若干分位个
客户 • 模型运用:降价、降价、降价… • 模型监控和调整:一年一次?两年一次?…
困惑和问题
·“流失率的降低是唯一的KPI?” ·“我们的数据量特别大,分析所用的数据所占的时间和 空间都太大了!” ·“选择那种算法最适合流失分析?” ·“我们所建模型的最高提升值(Lift value)达到了 4.5,超过了其他模型,所以采用它!” ·“到底应该取前百分之几的客户做维系?” ·“流失预测模型会帮助降低流失率吗?” ·“一个模型用了两年多,效果似乎不错?” ·“如何看待流失预测的准确率?” ……
SAS中国 解决方案部
日程计划
1. 当前国内流行的流失分析及其应用 2. 困惑和问题摘取 3. 基于SEMMA的流失分析 4. 镶嵌于分析流程的BI 5. MA和维系实务流程 6. 结束语:三个闭环与架构
客户流失的商业事实
欧洲:每年有35-50%的客户流失
≥19
2 1 >%1
25%
0.2 0.00.0 0.2 0x.41 0.6 0.8 1.0
听
Assess-评估
公允的模型量化评估和综合评判模 型结果
• Lift Chart • ROC Curve-C统计量(AUC)
• Gains chart • 模型复杂程度 • 使用测试数据集
各有千秋时如何选择最终模型?
Explore-探索
最容易被忽视的一个环节 •变量的选择:很多解释变量都自相关, 通过R方,卡方和PCA等大量降维 •分群:可以作为许多报表和OLAP的基 础,也是多个流失预测模型系统的基础- 在每个群中建立不同的流失预测模型 •关联:可用作渠道分析等等 •多维和单维的视图观察,检查各类算法 所对应的假设条件是否满足
这才是我们想保留的客户!!!
目标:
• 在客户流失的行为发生前把 他们检测出来!!!
• 理解客户对您的期望和他们 流失的原因
问题定位:
• 那些客户看起来就要流失? 如何保留那些有利可图的客 户?
• 为什么客户会转向竞争者?
KPI:流失率还是利润率?什么时间段?
数据准备时间通常是分析时间的4-5倍
• 数据重组、汇总、转置、扩展 • 数据与时间、事件框架的匹配 • 时间失真 • 交易数据是最重要的,每一笔交易数据清晰显
解解决决问问题题的的方方法法是是正正本本清清源源,,彻彻底底理理解解方方法法论论的的含含义义
分析前先确定分析目标
流失定义:四类两对
• 财政/非财政 流失:财政原 因流失指有不良付款记录的 客户流失,非财政原因流失 指信誉良好的客户流失。
• 主动/被动 流失:指该客户 是否主动选择流失。
主动,非财政原因流失的客户大多 是那些高价值,长期合作的客户。 他们会对市场变化做出一定的反 应。
Modify-修改
优化您的数据 极值,异常值 缺失值
• 树填缺 • 统计量填缺
变量转换
• 建立新的变量 • 改变分布的形状
定义最优的输入域 处理共线性-与变量选择一起
Model-建模
流失预测建模需要考虑的算法特征:
稳健性:Bias-Variance
输入
灵活性
神经元 连 接 输权出
(Monte Carlo)等等报表,帮助进一步改进、更新和创新
MA和客户维系/关怀工作实务
只有将客户流失分析运用于维系实践才有作用 需要有分析与业务流程的无缝连接 需要在所有的客户互动中使用客户智能,无论:
· 互动是组织本身、第三方还是客户发起的 · 什么样的渠道,呼入还是呼出 · 什么样的互动方式,如市场活动、销售活动、服务、信息等
析主题
分析中,BI成为综合使用各类分析工具的纽带,例如:
· 流失预测模型本身不能降低流失率,只能找出流失概率 · 综合运用其他模型(如分群),可以帮助找出流失原因 · 需要BI工具展示结果,帮助业务人员根据原因设计维系方案,改变
客户行为趋势,才能真正降低流失率
分析后,BI产生各类统计测试、假设检验、事件模拟
概率( 流1失)
.5
0100
多层神经元网络
行为1
100 0 0 行为2
可解释性
隐藏层 1.0
算法之间不是互斥,而是互补-多个算法并用
0.8
从概率预测到科学决策
预测损益矩阵 双阶段模型
新案例 占线 = 11 申请留言信箱 =
x200..46
无日收人均入接通2=听话% <4==21k2109845%日均通话1<01-5占线次数950%2,无人接>521
分分析析人人员员仍仍有有大大量量困困惑惑和和问问题题
基于SEMMA的流失分析
• Sample • Explore • Modify • Model • Assess
取样 - 方法与重要性 探索 - 交互式的观察与分析 修改 - 合理地修改变量 建模 - 预测性模型简介 评估 - 公允的模型评
(Honest Assessment)
• 收益最高点时哪个模型更好 • 取决于需要关注哪个分位点阶段的客户 • 取决于成本预算大小 • 总体的指标:AUC,MSE,Confusion
Matrix……
ROC 好 中 差
增பைடு நூலகம் 累计增益
BI在流失分析流程中的作用
BI应当不仅仅能处理业务报表,更应能处理分析报表
分析前,BI处理分布对比、趋势分析等报告,帮助产生分
示了客户的行动--正在使用服务,支付账单, 咨询,投诉,处于本地还是漫游状态 • 客户过去行为的稳定性和改变是分析的重点- 通过衍生统计量,如比率、差分、移动平均等 来体现
• ……
Sample-取样
OK 流失
你做到了没有? ·看一下DOE是否合理 ·流失分析一般需要过采样 ·把数据分割为训练、验证和 测试三份 ·看目标变量在各数据中比例 是否一致 对公允的模型评估至关重要
获取一个新客户的平均成本:~$700 → 几乎相当于一个客户5年内给公司带来的净利润 直接导致客户回报率下降
美国:40%流失,新客户成本$400 亚洲:反常→ 过激竞争→ 极高的客户流失 全球:每年因为客户流失所带来的损失在100亿左右
所有数据仅限于电信行业
“通常”的流失分析及其运用
• 流失定义:拆机、停机… • 许多行为变量:呼入、呼出、支付、移动性、
帐单… • 流失倾向模型建立:决策树或者是黑箱… • 客户筛选:打分,让业务人员找前若干分位个
客户 • 模型运用:降价、降价、降价… • 模型监控和调整:一年一次?两年一次?…
困惑和问题
·“流失率的降低是唯一的KPI?” ·“我们的数据量特别大,分析所用的数据所占的时间和 空间都太大了!” ·“选择那种算法最适合流失分析?” ·“我们所建模型的最高提升值(Lift value)达到了 4.5,超过了其他模型,所以采用它!” ·“到底应该取前百分之几的客户做维系?” ·“流失预测模型会帮助降低流失率吗?” ·“一个模型用了两年多,效果似乎不错?” ·“如何看待流失预测的准确率?” ……