航空公司客户价值分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
次数的变化情况,推测客户消费异动状况,列 出客户名单对其重点联系,采取一定营销手段
,延长客户的生命周期。
03 模型构建及业务分析
一般与低价值客户 (客户群4、5)
04
这类客户所乘坐航班的平均折扣率(C)很低,
较长时间没有乘坐过本公司航班(R)高,乘坐
的次数(F)或里程(M)较低,入会时长(L)短。他 们是航空公司的一般用户与低价值客户,可能
们逐渐成为公司的忠诚客户。
03 模型构建及业务分析
这类客户乘坐次数(F)或者里程(M)较高,但是
重要挽留客户 (客户群3)
03
较长时间已经没有乘坐本公司的航班(R)高或是
乘坐频率变小。他们客户价值变化的不确定性
很高。由于这些客户衰退的原因各不相同,所 以掌握客户的最新信息、维持与客户的互动。
航空公司应该根据这些客户的最近消费时间、
聚类中心 ZF ZM ZC 2.483 2.424 0.308 -0.087 -0.095 -0.158 -0.574 -0.537 -0.171 -0.161 -0.165 -0.255 -0.227 -0.23 2.191
03 模型构建及业务分析
从图中可以看出:客户群1在乘坐次数 (F)、里程(M)属性上最大,在最近乘坐过本 公司航班(R)属性上最小;客户群2在入会时 长(L)属性上最大;客户群3在最近乘坐过本 公司航班(R)属性上最大,在乘坐次数(F)、 里程(M)属性上最小;客户群4在入会时长 (L)、平均折扣(C)属性上最小;客户群5在 平均折扣(C)属性上最大。 结合业务分析,通过比较各个指标在群 间的大小对某一个群的特征进行评价分析, 定义成五个等级的客户类别,分别是:
03 模型构建及业务分析
重要保持客户 (客户群1)
01
这类客户的平均折扣率(C)较高,最近乘坐过本
公司航班(R)低,乘坐的次数(F)或里程(M)较高
,是航空公司的高价值客户,是最为理想的客 户类型,对航空公司贡献最大,所占比例却较
小。航空公司应先将资源投放在他们身上。对
他们进行一对一营销,提高这类客户忠诚度与 满意度,尽可能延长这类客户的高水平消费。
ZR 0.14 -0.322 -0.488 -0.785 -0.427 -0.691 1.996
ZF -0.636 0.852 -0.211 0.002 -0.636 -0.636 -0.707
ZM 0.069 0.844 0.159 0.273 -0.685 -0.604 -0.662
ZC -0.337 -0.554 -1.095 -1.149 1.232 -0.391 -1.311
F M C
02 业务分析及数据预处理
LRFMC取值范围
属性名称 最小值 最大值 L 12.23 114.63 R 0.03 24.37 F 2 213 M 368 580717 C 0.14 1.5
LRFMC数据标准化
(部分数据)
ZL 1.69 1.69 1.682 1.534 0.89 -0.497 -0.869
03 模型构建及业务分析
采用K-均值聚类算法对客户数据进行客户分群
聚类类别 聚类个数 客户群1 客户群2 客户群3 客户群4 客户群5 5337 15735 12130 24644 4198
ZL 0.483 1.16 -0.314 -0.701 0.057
ZR -0.799 -0.377 1.686 -0.415 -0.006
LAST_TO_END FLIGHT_COUNT SEG_KM_SUM AVG_DISCOUNT 23 14 126850 1.02 6 65 184730 0.76 2 33 60387 1.27 123 6 62259 1.02 15 22 54730 1.36 23 26 50024 1.29 77 5 61160 0.94 67 4 48928 1.05 11 25 43499 1.33 22 36 68760 0.88 4 49 64070 0.91
L R F M C 会员入会时 客户最近一次乘 客户在观测 客户在观测 客户在观测窗口内 航空公司 间距观测窗口 坐公司飞机距观测 窗口内乘坐公 窗口内累积的 乘坐舱位所对应的折 LRFMC模型 结束的月数 窗口结束的月数 司飞机的次数 飞行里程 扣系数的平均值 模型
02 业务分析及数据预处理
1.数据探索
02 业务分析及数据预处理
根据传统RFM模型的三个指标即(最近消费时间间隔(Recency)、消费频 率(Frequency)和消费金额(Monetary))进一步改进,制定出客户关 系长度L、消费时间间隔R、消费频率F、飞行里程M和折扣系数均值C五个指 标最为航空公司识别客户价值指标,简称LRFMC模型
02 业务分析及数据预处理 L R
数据变换 从原始数据中提取 LRFMC五个指标
LOAD_TIME-FFP_DATE 观测窗口结束时间-入会时间 LAST_TO_END 最后一次乘坐时间至观测窗口结束时长 FLIGHT_COUNT 观测窗口内的飞行次数 SEG_KM_SUM 观测窗口内的飞行里程 AVG_DISCOUNT 平均折扣
航空公司客户价值分析
1
目录 CONTENTS
01 02 03 04
数据挖掘目标 业务分析及数据预处理 模型构建及业务分析 代码展示
01 数据挖掘目标
01 02 03
借助航空公司客户数据,对客户进行分类
对不同客户类别进行特征分析,比较不同类客户的客户价值
对不同价值的客户类别提供个性化服务,制定相应的营销策略
03 模型构建及业务分析
重要发展客户 (客户群2)
02
这类客户的平均折扣率(C)较高,最近乘坐过 本公司航班(R)低,乘坐的次数(F)或里程(M)较
高,客户入会时长(L)较短,他们是航空公司的
潜在价值客户。虽然这列客户的当前价值不高 ,但却有很大的发展潜力。航空公司应提高这
类客户价值,加强这类客户的满意程度,使他
最小值 0 0 … 368 0
属性规约结果
(部分数据)
FFP_DATE 2013/03/16 2012/06/26 2009/12/08 2009/12/10 2011/08/25 2012/09/26 2010/12/27 2009/10/21 2010/04/15 2007/01/26 2006/12/26
LOAD_TIME 2014/0Fra Baidu bibliotek/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31
空值记录数 551 138 … 0 0
最大值 239560 234188 … 580717 1.5
对数据进行缺失值分析与异 常值分析
2.数据清洗
数据预处理步骤
3.属性规约
选择与LRFMC模型相关的六 组数据
丢弃票价、平均折扣、总飞行 公里为空或为0的记录
4.数据变换
将数据转换成“适当的”格式, 以适应挖掘任务及算法需要
02 业务分析及数据预处理
数据探索结果
属性名称 SUM_YR_1 SUM_YR_2 … SEG_KM_SUM AVG_DISCOUNT
02 业务分析及数据预处理
航空信息原始数据(部分数据)
MEMBER_NO 289047040 289053451 289022508 289004181 289026513 289027500 289058898 289037374 289036013 289046087 289062045 289022276 FFP_DATE 2013/03/16 2012/06/26 2009/12/08 2009/12/10 2011/08/25 2013/06/01 2010/12/17 2009/10/12 2013/06/02 2007/01/26 2006/12/26 2011/08/15 FIRST_FLIGI 2013/04/28 2013/05/16 2010/02/05 2010/10/19 2011/08/25 2013/06/01 2010/12/27 2009/10/21 2013/06/02 2013/04/24 2013/04/17 2011/08/20 GENDE 男 男 男 男 男 男 男 男 女 男 女 男 FFP_TIER 6 6 5 4 6 5 4 4 6 6 5 6 WORK_C WORK_P ITY ROVIN 乌鲁木齐 新疆 北京 S.P.S CORTES 乌鲁木齐 新疆 北京 北京 ARCADIA CA 广州 广东 广州 广东 . 天津 长春市 吉林省 沈阳 辽宁 WORK US CN CN HN CN CN US CN CN CN CN CN AGE 56 50 34 45 47 36 35 34 54 47 55 41 LOAD_TIME 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 FIGHT_C BP_SUM OUNT 14 147158 65 112582 33 77475 6 76027 22 70142 26 63498 5 62810 4 60484 25 59357 36 55562 49 54255 51 53926
是航空公司机票打折促销时,才会乘坐本公司
航班。
04
代码展示
数据探索分析代码
04
代码展示 数据清洗代码
04
代码展示
数据标准化代码
K-均值算法建模代码
感谢聆听
,延长客户的生命周期。
03 模型构建及业务分析
一般与低价值客户 (客户群4、5)
04
这类客户所乘坐航班的平均折扣率(C)很低,
较长时间没有乘坐过本公司航班(R)高,乘坐
的次数(F)或里程(M)较低,入会时长(L)短。他 们是航空公司的一般用户与低价值客户,可能
们逐渐成为公司的忠诚客户。
03 模型构建及业务分析
这类客户乘坐次数(F)或者里程(M)较高,但是
重要挽留客户 (客户群3)
03
较长时间已经没有乘坐本公司的航班(R)高或是
乘坐频率变小。他们客户价值变化的不确定性
很高。由于这些客户衰退的原因各不相同,所 以掌握客户的最新信息、维持与客户的互动。
航空公司应该根据这些客户的最近消费时间、
聚类中心 ZF ZM ZC 2.483 2.424 0.308 -0.087 -0.095 -0.158 -0.574 -0.537 -0.171 -0.161 -0.165 -0.255 -0.227 -0.23 2.191
03 模型构建及业务分析
从图中可以看出:客户群1在乘坐次数 (F)、里程(M)属性上最大,在最近乘坐过本 公司航班(R)属性上最小;客户群2在入会时 长(L)属性上最大;客户群3在最近乘坐过本 公司航班(R)属性上最大,在乘坐次数(F)、 里程(M)属性上最小;客户群4在入会时长 (L)、平均折扣(C)属性上最小;客户群5在 平均折扣(C)属性上最大。 结合业务分析,通过比较各个指标在群 间的大小对某一个群的特征进行评价分析, 定义成五个等级的客户类别,分别是:
03 模型构建及业务分析
重要保持客户 (客户群1)
01
这类客户的平均折扣率(C)较高,最近乘坐过本
公司航班(R)低,乘坐的次数(F)或里程(M)较高
,是航空公司的高价值客户,是最为理想的客 户类型,对航空公司贡献最大,所占比例却较
小。航空公司应先将资源投放在他们身上。对
他们进行一对一营销,提高这类客户忠诚度与 满意度,尽可能延长这类客户的高水平消费。
ZR 0.14 -0.322 -0.488 -0.785 -0.427 -0.691 1.996
ZF -0.636 0.852 -0.211 0.002 -0.636 -0.636 -0.707
ZM 0.069 0.844 0.159 0.273 -0.685 -0.604 -0.662
ZC -0.337 -0.554 -1.095 -1.149 1.232 -0.391 -1.311
F M C
02 业务分析及数据预处理
LRFMC取值范围
属性名称 最小值 最大值 L 12.23 114.63 R 0.03 24.37 F 2 213 M 368 580717 C 0.14 1.5
LRFMC数据标准化
(部分数据)
ZL 1.69 1.69 1.682 1.534 0.89 -0.497 -0.869
03 模型构建及业务分析
采用K-均值聚类算法对客户数据进行客户分群
聚类类别 聚类个数 客户群1 客户群2 客户群3 客户群4 客户群5 5337 15735 12130 24644 4198
ZL 0.483 1.16 -0.314 -0.701 0.057
ZR -0.799 -0.377 1.686 -0.415 -0.006
LAST_TO_END FLIGHT_COUNT SEG_KM_SUM AVG_DISCOUNT 23 14 126850 1.02 6 65 184730 0.76 2 33 60387 1.27 123 6 62259 1.02 15 22 54730 1.36 23 26 50024 1.29 77 5 61160 0.94 67 4 48928 1.05 11 25 43499 1.33 22 36 68760 0.88 4 49 64070 0.91
L R F M C 会员入会时 客户最近一次乘 客户在观测 客户在观测 客户在观测窗口内 航空公司 间距观测窗口 坐公司飞机距观测 窗口内乘坐公 窗口内累积的 乘坐舱位所对应的折 LRFMC模型 结束的月数 窗口结束的月数 司飞机的次数 飞行里程 扣系数的平均值 模型
02 业务分析及数据预处理
1.数据探索
02 业务分析及数据预处理
根据传统RFM模型的三个指标即(最近消费时间间隔(Recency)、消费频 率(Frequency)和消费金额(Monetary))进一步改进,制定出客户关 系长度L、消费时间间隔R、消费频率F、飞行里程M和折扣系数均值C五个指 标最为航空公司识别客户价值指标,简称LRFMC模型
02 业务分析及数据预处理 L R
数据变换 从原始数据中提取 LRFMC五个指标
LOAD_TIME-FFP_DATE 观测窗口结束时间-入会时间 LAST_TO_END 最后一次乘坐时间至观测窗口结束时长 FLIGHT_COUNT 观测窗口内的飞行次数 SEG_KM_SUM 观测窗口内的飞行里程 AVG_DISCOUNT 平均折扣
航空公司客户价值分析
1
目录 CONTENTS
01 02 03 04
数据挖掘目标 业务分析及数据预处理 模型构建及业务分析 代码展示
01 数据挖掘目标
01 02 03
借助航空公司客户数据,对客户进行分类
对不同客户类别进行特征分析,比较不同类客户的客户价值
对不同价值的客户类别提供个性化服务,制定相应的营销策略
03 模型构建及业务分析
重要发展客户 (客户群2)
02
这类客户的平均折扣率(C)较高,最近乘坐过 本公司航班(R)低,乘坐的次数(F)或里程(M)较
高,客户入会时长(L)较短,他们是航空公司的
潜在价值客户。虽然这列客户的当前价值不高 ,但却有很大的发展潜力。航空公司应提高这
类客户价值,加强这类客户的满意程度,使他
最小值 0 0 … 368 0
属性规约结果
(部分数据)
FFP_DATE 2013/03/16 2012/06/26 2009/12/08 2009/12/10 2011/08/25 2012/09/26 2010/12/27 2009/10/21 2010/04/15 2007/01/26 2006/12/26
LOAD_TIME 2014/0Fra Baidu bibliotek/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31
空值记录数 551 138 … 0 0
最大值 239560 234188 … 580717 1.5
对数据进行缺失值分析与异 常值分析
2.数据清洗
数据预处理步骤
3.属性规约
选择与LRFMC模型相关的六 组数据
丢弃票价、平均折扣、总飞行 公里为空或为0的记录
4.数据变换
将数据转换成“适当的”格式, 以适应挖掘任务及算法需要
02 业务分析及数据预处理
数据探索结果
属性名称 SUM_YR_1 SUM_YR_2 … SEG_KM_SUM AVG_DISCOUNT
02 业务分析及数据预处理
航空信息原始数据(部分数据)
MEMBER_NO 289047040 289053451 289022508 289004181 289026513 289027500 289058898 289037374 289036013 289046087 289062045 289022276 FFP_DATE 2013/03/16 2012/06/26 2009/12/08 2009/12/10 2011/08/25 2013/06/01 2010/12/17 2009/10/12 2013/06/02 2007/01/26 2006/12/26 2011/08/15 FIRST_FLIGI 2013/04/28 2013/05/16 2010/02/05 2010/10/19 2011/08/25 2013/06/01 2010/12/27 2009/10/21 2013/06/02 2013/04/24 2013/04/17 2011/08/20 GENDE 男 男 男 男 男 男 男 男 女 男 女 男 FFP_TIER 6 6 5 4 6 5 4 4 6 6 5 6 WORK_C WORK_P ITY ROVIN 乌鲁木齐 新疆 北京 S.P.S CORTES 乌鲁木齐 新疆 北京 北京 ARCADIA CA 广州 广东 广州 广东 . 天津 长春市 吉林省 沈阳 辽宁 WORK US CN CN HN CN CN US CN CN CN CN CN AGE 56 50 34 45 47 36 35 34 54 47 55 41 LOAD_TIME 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 FIGHT_C BP_SUM OUNT 14 147158 65 112582 33 77475 6 76027 22 70142 26 63498 5 62810 4 60484 25 59357 36 55562 49 54255 51 53926
是航空公司机票打折促销时,才会乘坐本公司
航班。
04
代码展示
数据探索分析代码
04
代码展示 数据清洗代码
04
代码展示
数据标准化代码
K-均值算法建模代码
感谢聆听