航空公司客户价值分析PPT课件

合集下载

大数据分析技术-航空公司客户价值分析(一)

大数据分析技术-航空公司客户价值分析(一)

大数据分析技术-航空公司客户价值分析(一)实验内容:1.复习第一节课讲述的数据挖掘建模总体流程2.对航空公司客户数据进行分析,了解航空公司现状和客户情况3.完成航空公司客户价值分析总体流程步骤的构建4.对数据中存在的缺失值和异常值进行处理5.结合RFM模型进行特征筛选6.对筛选后的数据进行标准化7.练习使用python选取构建LRFMC模型所需的特征实验过程(请用简单的文字描述):1.复习第一节课讲述的数据挖掘建模总体流程2.对航空公司客户数据进行分析,了解航空公司现状和客户情况3.完成航空公司客户价值分析总体流程步骤的构建4.对数据中存在的缺失值和异常值进行处理5.结合RFM模型进行特征筛选6.对筛选后的数据进行标准化7.练习使用python选取构建LRFMC模型所需的特征# 这里简单的说明一下数据挖掘建模总体流程# 1.问题定义# 2.数据获取# 3.数据清洗# 4.缺失值处理# 5.特征选择# 6.数据集划分# 7.模型建立# 8.模型性能检测与分析# 9.预测结果实验详细操作步骤或程序清单:# 该程序主要用于实现练习使用python选取构建LRFMC模型所需的特征import numpy as npimport pandas as pdfrom sklearn.cluster import KMeans #导入kmeans算法airline_scale = np.load('F:\火线时刻\\airline_scale.npz')['arr_0']k = 5 ## 确定聚类中心数#构建模型kmeans_model = KMeans(n_clusters = k,n_jobs=4,random_state=123)fit_kmeans = kmeans_model.fit(airline_scale) #模型训练kmeans_model.cluster_centers_ #查看聚类中心kmeans_bels_ #查看样本的类别标签#统计不同类别样本的数目r1 = pd.Series(kmeans_bels_).value_counts()print('最终每个类别的数目为:\n',r1)# 该程序主要用于实现结合RFM模型进行特征筛选import pandas as pdimport numpy as np# 1.读取数据集data = pd.read_csv('F:\火线时刻\\air_data.csv',encoding='gb18030')# 2.数据清洗# 2.1缺失值处理data1 = data['SUM_YR_1'].notnull()data2 = data['SUM_YR_2'].notnull()data3 = data1 & data2env_data = data.loc[data3,:]# 2.2异常值处理index1 = env_data['SUM_YR_1'] != 0idnex2 = env_data['SUM_YR_2'] != 0index3 = (env_data['SEG_KM_SUM'] > 0) & (env_data['avg_discount'] != 0)airline = env_data[(index1 | idnex2) & index3]# 3.选取需求特征airline_selection = airline[["FFP_DATE","LOAD_TIME","FLIGHT_COUNT","LAST_TO_END","avg_discount" ,"SEG_KM_SUM"]]# 4.构建L特征L = pd.to_datetime(airline_selection["LOAD_TIME"]) - pd.to_datetime(airline_selection["FFP_DATE"])L = L.astype("str").str.split().str[0]L = L.astype("int")/30# 5.合并特征airline_features = pd.concat([L,airline_selection.iloc[:,2:]],axis = 1)print('构建的LRFMC特征前5行为:\n',airline_features.head())# 该程序主要用于实现对航空公司客户数据进行分析,了解航空公司现状和客户情况# 主要分析数据中的一些最大值,最小值,均值等这些数据特征,其中由于数据中的很多列没有分析的必要,所以我们只对一些列数据进行分析# 对于数据分析的具体操作,这里采用sklearn进行import pandas as pdimport numpy as npfrom sklearn.preprocessing import StandardScaler # 用于对数据进行标准差标准化from sklearn.model_selection import train_test_split # 用于划分数据集# 1.读取数据集data = pd.read_csv('F:\火线时刻\\air_data.csv',encoding='gb18030')# 2.分析数据# 2.1分析数据的基本信息print('air_data数据集的长度为:', len(data))print('air_data数据集的类型为:', type(data))# 2.2分析数据的数值特征信息# a.先获取数据,此时获取EP_SUM_YR_2air_data = np.array(data[['EP_SUM_YR_2']])print('EP_SUM_YR_2列列数据的最大值为:', np.max(air_data))print('EP_SUM_YR_2列列数据的最小值为:', np.min(air_data))print('EP_SUM_YR_2列列数据的平均值为:',np.mean(air_data))# b.然后获取数据,此时获取Points_Sumair_data = np.array(data[['Points_Sum']])print('Points_Sum列数据的最大值为:', np.max(air_data))print('Points_Sum列数据的最小值为:', np.min(air_data))print('Points_Sum列数据的平均值为:',np.mean(air_data))# c.然后获取数据,此时获取PPoint_NotFlightair_data = np.array(data[['Point_NotFlight']])print('PPoint_NotFlight列数据的最大值为:', np.max(air_data))print('PPoint_NotFlight列数据的最小值为:', np.min(air_data))print('PPoint_NotFlight列数据的平均值为:',np.mean(air_data))# 该程序主要用于实现对数据中存在的缺失值和异常值进行处理import pandas as pdimport numpy as np# 1.读取数据data = pd.read_csv('F:\火线时刻\\air_data.csv',encoding='gb18030')# print(data.shape)# print(data)# 2.数据清洗(在读取完数据之后,我们开始进行数据的清洗)# 在分析完数据集之后,发现数据集中存在票价为空的数据,显然这些数据是一些缺失值# 发现此时的数据集中存在两个数据列是关于票价的SUM_YR_1,SUM_YR_2,所以我们要分别进行处理# 2.1缺失值处理data1 = data['SUM_YR_1'].notnull()data2 = data['SUM_YR_2'].notnull()data3 = data1 & data2env_data = data.loc[data3,:]# print(env_data)print('删除缺失记录之后数据集的形状为:',env_data.shape)# 2.2异常值处理# 进行对数据集的观察,发现此时的数据集中存在票价为零的,和平均折扣率为0且总飞行公里数等于0的记录# 所以此时我们要对这些数据进行处理,即进行删除index1 = env_data['SUM_YR_1'] != 0idnex2 = env_data['SUM_YR_2'] != 0index3 = (env_data['SEG_KM_SUM'] > 0) & (env_data['avg_discount'] != 0)airline = env_data[(index1 | idnex2) & index3]print('删除异常记录之后的数据集的形状为:',airline.shape)# 该程序主要用于实现对筛选后的数据进行标准化import pandas as pdimport numpy as npfrom sklearn.preprocessing import StandardScaler# 1.读取数据集data = pd.read_csv('F:\火线时刻\\air_data.csv',encoding='gb18030')# 2.数据清洗# 2.1缺失值处理data1 = data['SUM_YR_1'].notnull()data2 = data['SUM_YR_2'].notnull()data3 = data1 & data2env_data = data.loc[data3,:]# 2.2异常值处理index1 = env_data['SUM_YR_1'] != 0idnex2 = env_data['SUM_YR_2'] != 0index3 = (env_data['SEG_KM_SUM'] > 0) & (env_data['avg_discount'] != 0)airline = env_data[(index1 | idnex2) & index3]# 3.选取需求特征airline_selection = airline[["FFP_DATE","LOAD_TIME","FLIGHT_COUNT","LAST_TO_END","avg_discount" ,"SEG_KM_SUM"]]# 4.构建L特征L = pd.to_datetime(airline_selection["LOAD_TIME"]) - pd.to_datetime(airline_selection["FFP_DATE"])L = L.astype("str").str.split().str[0]L = L.astype("int")/30# 5.合并特征airline_features = pd.concat([L,airline_selection.iloc[:,2:]],axis = 1)# 6.对数据进行标准化data = StandardScaler().fit_transform(airline_features)np.savez('F:\火线时刻\\airline_scale.npz',data)print('标准化后LRFMC五个特征为:\n',data[:5,:])实验环境:pycharm Python实验结果(上传实验结果截图或者简单文字描述):疑难小结(总结个人在实验中遇到的问题或者心得体会):心得体会:明白了对航空公司客户价值分析总体流程步骤的构建1.从数据源中获取数据1.1选择性获取(历史数据)1.2新增信息提取(增量数据)2.读数据进行预处理2.1数据清洗2.2特征构建2.3数据标准化3.分析与建模3.1建模数据基于客户LRFMC的分群3.2预处理后的增量数据模型分析客户价值排名模型应用4.结果反馈应用结果。

航空公司客户价值分析-航空公司客户价值分析实战

航空公司客户价值分析-航空公司客户价值分析实战

航空公司客户价值分析作者:柳睿来源:《财讯》2018年第09期航空市场竞争的加煎和航空业的发展,要求国内航空公司必须利用大量数据中隐含的知识才能抓住时机。

如此,客户是企业至关重要的成功因素和利润来源。

将数据挖掘、机器学习技术应用于客户关系管理,能够为企业提供经营和决策的量化依据,使企业能够把握重点,分轻重急缓,有效利用有限资源,拓展利润上升空间。

针对客户关系管理中客户价值这一问题,通过对航空公司现有数据仓库中客户信息的分析,本文采用RFM模型得到必要指标变量,再运用Kmeans算法对RFM所褥出的指标进行聚类,将客户群逊分为价值不同的五类客户群,并对每个客户群进行分析和总结,提出了针对每类客户群的营销策略。

RMF模型客户价值分析 Kmeans背景介绍航空公司同样也面临这样的何如划分客户群的问题,而客户细分就是能够解决这种问题的关键。

国内某航空公司市场面临旅客流失、资源为充分利用等经营危机。

因此本文的日标足利用某航空公司的会员档案信息和其航班乘坐记录,通过建市合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相应的个性化营销策略。

本文运用RFM 模型对客户分类。

数据描述与预处理(1)数据统计分析原始数据含有44个变量属性,我们对原始数据有个初步的描述理解。

由数据可知男性在观测窗几内飞行次数远超与女性。

会员级别为4的客户飞行次数最多,其次足会员级别为5的客户,会员级别为6的客户飞行次数最少,可以知道级别越高(4级最高,6级最低)飞行次数越多,可能是由于级别越高,得到的折扣率相对较高。

(2)数据预处理在本案例中,以2014年3月31日为结束时间,选取宽度为两年的时间段作为分析观测窗口(也就是时间间隔为2012年4月1H至2014年3月31日),抽取观测窗几以内有乘机记录的所有客户的详细数据形成历史数据,并将数据分为三个维度,分别是客户基本信息、乘机信息和积分信息,总共包含会员卡号、入会时间、年龄、工作地所在省份、观测窗口的结束时间、乘机积分、飞行公里数等44个变量属性。

python数据分析与挖掘实战---航空公司客户价值分析

python数据分析与挖掘实战---航空公司客户价值分析

python数据分析与挖掘实战---航空公司客户价值分析航空公司客户价值分析⼀、背景与挖掘⽬标客户关系管理是企业的核⼼问题,关键在于客户的分类:区别⽆价值客户,⾼价值客户,针对不同客户群体有的放⽮投放具体服务⽅案,实现企业利润最⼤化的⽬标。

各⼤航空公司采取优惠措施喜迎更多客户,国内航司⾯对客户流失和资源未完全利⽤等危机,因此建⽴⼀个客户价值评估模型来实现对客户的分类。

⼆、分析⽅法与过程本次的分析⽬的在于客户价值识别,客户价值识别最常⽤的模型是RFM模型:R(最近消费时间间隔)F(消费频率)M(消费⾦额)。

飞机票价取决于飞⾏距离和仓位等级,消费同等⾦额票价的旅客对航司的价值不⼀定相同:购买短程头等舱的旅客和购买长途经济舱的旅客,明显前者对航司的贡献更⼤。

所以对M(消费⾦额)建模时要进⾏修改:⽤⾥程数平均值M和仓位折扣系数平均值C来代替消费的⾦额。

同时,考虑旅客中,加⼊会员的时间越长,客户的潜在价值⼀般越⾼,所以定义⼀个客户关系长度L,作为区分客户的另⼀指标。

接下来针对LRFMC模型,对客户进⾏区分。

LRFMC模型:(1)客户关系长度L:航空公司会员时间的长短。

(2)是消费时间间隔R。

(3)消费频率F。

(4) 飞⾏⾥程M。

(5) 折扣系数的平均值C。

LRFMC模型指标含义:(1) L:会员⼊会时间距观测窗⼝结束的⽉数。

(2) R:客户最近⼀次乘坐公司飞机距离观测窗⼝结束的⽉数。

(3) F:客户在观测窗⼝内乘坐公司飞机的次数。

(4) M:客户在观测窗⼝内累计的飞⾏⾥程碑。

(5) C:客户在观测窗⼝内乘坐仓位所对应的折扣系数的平均值。

⽅法:本案例采⽤聚类的⽅法,通过对航空公司客户价值的LRFMC模型的五个指标进⾏K-Means聚类,识别客户价值。

三、数据描述给出所有属性的基本信息,共25个属性,均⽆⼤量缺失现象或缺失现象很少。

四、建模1、数据探索分析对数据进⾏缺失值分析与异常值分析,分析出数据的规律以及异常值查找每列属性观测值个数,最⼤值,最⼩值。

航空公司工作人员的客户心理分析和服务方法

航空公司工作人员的客户心理分析和服务方法

航空公司工作人员的客户心理分析和服务方法航空公司的工作人员扮演着至关重要的角色,他们面对着来自世界各地的乘客,需要处理各种不同的情绪和需求。

本文将分析航空公司工作人员需要了解的客户心理,并提供一些有效的服务方法。

第一部分:客户心理分析1. 了解乘客的情绪状态航空旅行可能会引发乘客的焦虑、压力或兴奋等情绪。

工作人员应该学会观察和倾听乘客的言谈举止,从而了解他们的情绪状态。

例如,有些乘客可能因为紧张而显得急躁,而另一些乘客可能在旅行前感到兴奋。

了解他们的情绪状态将有助于工作人员更好地应对并提供相应的服务。

2. 处理不同需求的能力乘客的需求各不相同,从订餐到座位调整,以及航班延误的处理等。

工作人员应该具备灵活的处理能力,能够快速判断乘客的需求,并提供适当的帮助。

在解决问题时,工作人员需要以友好和专业的态度与乘客进行沟通,以确保他们感到被重视和满足。

3. 理解不同文化差异航空公司服务的乘客来自世界各地,拥有不同的文化背景和价值观。

工作人员需要了解并尊重这些差异。

他们应该具备跨文化交流的能力,善于倾听和理解乘客的文化需求,并以尊重和包容的态度对待每一位乘客。

第二部分:服务方法1. 提供友好和专业的服务航空公司工作人员应该始终以友好和专业的态度对待乘客。

无论面对何种情况,他们应展示出耐心和尊重,并通过亲切的笑容和礼貌的言辞让乘客感到受到重视和尊重。

在提供服务的过程中,工作人员需要保持高度的专业水准以确保乘客的舒适和满意。

2. 主动解决问题当乘客遇到问题或面临困难时,航空公司工作人员应该主动提供帮助和解决方案。

他们应尽可能地满足乘客的需求,并热情地回答各种问题。

同时,工作人员应提供实时的信息更新,例如航班延误或取消的通知,以帮助乘客及时做出调整。

3. 提供个性化的服务航空公司工作人员可以通过提供个性化的服务来赢得乘客的好感。

比如,记录乘客的偏好,例如喜欢的饮料或餐点,下次再次乘坐时主动提供。

此外,工作人员可以积极关注乘客的特殊需求,例如小孩或老年人的照顾,以提供更贴心的服务体验。

航空公司客户价值分析PPT课件

航空公司客户价值分析PPT课件

模型
L
R
F
M
C
航空公司 LRFMC模型
会员入会时 客户最近一次乘 客户在观测 客户在观测 客户在观测窗口内 间距观测窗口 坐公司飞机距观测 窗口内乘坐公 窗口内累积的 乘坐舱位所对应的折 结束的月数 窗口结束的月数 司飞机的次数 飞行里程 扣系数的平均值
.
5
02 业务分析及数据预处理
1.数据探索
对数据进行缺失值分析与异 常值分析
2013/04/28 2013/05/16 2010/02/05 2010/10/19 2011/08/25 2013/06/01 2010/12/27 2009/10/21 2013/06/02 2013/04/24 2013/04/17 2011/08/20
GENDE
男 男 男 男 男 男 男 男 女 男 女 男
数据预处理步骤
3.属性规约
选择与LRFMC模型相关的六 组数据
.
2.数据清洗
丢弃票价、平均折扣、总飞行 公里为空或为0的记录
4.数据变换
将数据转换成“适当的”格式, 以适应挖掘任务及算法需要
6
02 业务分析及数据预处理
数据探索结果
属性规约结果 (部分数据)
属性名称 SUM_YR_1 SUM_YR_2
02 业务分析及数据预处理
LRFMC取值范围
属性名称 最小值 最大值
L 12.23 114.63
R 0.03 24.37
F
M
2
368
213
580717
C 0.14 1.5
LRFMC数据标准化 (部分数据)
ZL 1.69 1.69 1.682 1.534 0.89 -0.497 -0.869

客户关系管理-第8讲 如何看待“客户价值”这件事?

客户关系管理-第8讲 如何看待“客户价值”这件事?
前次课程回顾
客户的分类
按客户与企业的关系(消费者、B2B、渠道、内部) 按客户的重要性程度(贵宾型、重要型、普通型) 按客户的忠诚程度分类(忠诚客户、老客户、新客户和
潜在客户) 按客户能提供的价值(灯塔型、跟随型、理性、逐利)
客户分类的意义
区分不同价值的客户 对不同客户,采用不同的营销策略 最大效率利用企业有限资源
A380虽然提供了新的设计,但同时保持了运营通用性 的优点。A380具备与空中客车公司其它电传操纵系统 飞机相同的驾驶舱布局、程序和操作特性,从而大大减 少了飞行员从一种空中客车飞机转换到另一种空中客车 飞机所需的培训时间。
A380的缺点是其体积太过庞大,不少大型机场必须更 换设施方能应付A380着陆。波音指出,747可直飞全球 210个机场,A380到2009年也只可直飞29个机场,这表 示乘坐A380的旅客可能要转机才能到达目的地。
讨论:顾客的价值怎么计算和比较?
第8讲 如何看待“客户价值”这件事?
一、客户价值的涵义
从客户角度:是客户对产品属性、 属性效能以及使用结果的感知、 偏好和评价。
从企业角度:是客户对企业销售 额的影响、对未来收益率的贡献 与企业为客户保持所需投入之间 的比较。
案例分享:A380 的客户价值
座位数 航程 客舱布局 机身长度 机身宽度 翼展 油耗 舱内设施
555座 14 800 公里(8 000 海里) 双通道双层客舱 73米 239英尺3英寸 5.58米 21英尺 7英寸 79.8米 261英尺 10英寸 每人百公里3升 豪华包间 吧台、小商店
思考:
A380给客户带来的价值是 什么?
对于航空公司:
A380由四个引擎推动,标准航程为1.5万公里,足够由纽约飞到 罗马再回航,比波音747更省油、飞行时更宁静、营利能力更高, 运载每位乘客的成本较747低两成,载客量达五成八便可达收支 平衡,747则至少要七成载客量才能保本。若把A380机舱划分 为头等、商务和经济3个级别,并加添睡房、健身室和酒吧等设 施,其载客量为555人,波音747为416人;但若以包机规格(所 有座位为经济级别)计算,载客量则达840人,还有十多名机员。

A001_C-蔡健威_航空公司客户价值评估

A001_C-蔡健威_航空公司客户价值评估

第 2 页,共 14 页
太普华南杯数据挖掘竞赛论文报告


1. 2.
挖掘目标 .................................................................................................. 4 分析方法与过程 ....................................................................................... 4
The Evaluation of the Airlines` Customer Value
Abstract: In this report, in order to determine the indicators which are used to evaluate and analyse the value of the airlines` customers and build customer-value-assessment model ,we used SAS as a analysis platform , made use of the correlation analysis and principal component analysis methods. With the help of quantitative analysis ,we calculated the value of each customer score , which help airlines staff to develop appropriate marketing strategies for different value customer groups . Key words: data mining ; principal component analysis ; customer value

航空公司客户价值分析数据挖掘设计文档

航空公司客户价值分析数据挖掘设计文档

数据挖掘大作业题目:航空公司客户价值分析目录一、任务背景 (2)二、数据挖掘目标 (2)三、数据探索与预处理 (3)构建航空客户价值分析的关键特征 (3)数据抽取 (5)探索性分析 (5)数据处理 (6)四、模型构建与评价 (12)1.模型构建K-Means聚类算法 (12)客户价值分析 (13)五、总结 (16)一、任务背景高铁、动车等铁路的不断兴建,出行方式的多元化让航空公司受到很大的冲击。

航空公司之间竞争也很激烈,除了四大航空公司之间的竞争之外,还有新兴产业的各类小型航空公司、民营航空公司,旅游等。

甚至国外航线出现高速度增长。

随着时代的发展,客户问题越来越受到关注,客户流失对利润增长造成了非常大的负面影响。

客户与航空公司的关系越长,航空公司的利润就越高。

一个客户使用了几次这次服务,感觉服务不错,那下次还会倾向于这个服务,但是要获得新客户,不仅需要在广告和人员工资上花费很多,去吸引顾客,在销售、市场也会花费很多,并且大多数新客户产生的利润不如那些流失的老客户多。

很明显,失去一个客户对公司来说比得到一个新客户更昂贵。

另外老用户也可以带来新用户。

因此,在这一背景下,分析航空公司客户数据,对客户进行分类,提高客户流失率是当务之急。

航空公司应针对不同类型的客户制定相应的营销模式,以实现利润最大化。

二、数据挖掘目标按航空公司客户数据进行分类。

分析了不同类型顾客的特点,比较不同类型顾客的顾客价值。

可以为不同价值客户类别提供个性化服务,并采用相应的营销策略。

分类客户的目的,就是要更精确地说明谁是我们的客户,了解客户到底有哪些实际需要,企业应该去吸引哪些客户,哪些客户应该被重点保留,以及应该如何迎合重点客户的需求等重要问题,进而使客户关系管理真正成为业务获得成功、扩大产品销量的催化剂。

客户分类是客户关系管理的核心。

帕累托定律(2/8定律):就是20%的顾客给企业带来80%的销售利润。

20%的客户其利润率达到100%。

A008-P-彭晨枫_航空客户忠诚度与价值分析

A008-P-彭晨枫_航空客户忠诚度与价值分析

航空客户忠诚度与航空客户忠诚度与价值分析价值分析价值分析摘 要:根据对客户保持的研究表明“顾客忠诚度提高5%,企业利润将增加25.125%”,建立新客户的难度是保持老客户的5-10倍,维系老客户的营销成本远远低于获取新客户的成本。

本文基于国内某航空公司超过60000个会员数据,结合现有成熟的客户管理模型,在对数据样本集进行预处理后通过数理统计的方法对样本属性进行相关性分析,挑选出对构建行为忠诚度模型高影响的因子,构建客户的忠诚度价值模型。

同时基于客户价值区分RFM 分析法,建立基于均值的RFM 模型、基于聚类的RFM 模型和基于PCA 处理后的RFM 模型对客户价值水平分类,且评估三种不同的方法在客户分类上的侧重点。

关键词关键词::客户管理;忠诚度;RFM;相关性分析;聚类;PCA;价值分类Aviation customer loyalty and value analysisAbstract: According to customers's research suggests that "the customer loyalty increase 5%, corporate profits will increase by 25.125%", set up the difficulty of the new customer is 5 to 10 times to keep old customers, maintain old customers marketing costs well below the cost to acquire new customers. This article is based on a domestic airline by more than 60000 members, combined with the existing mature customer management model, after preprocessing the data set by mathematical statistics method, correlation analysis was carried out on the sample properties, pick out the high influence factor for the construction of behavior loyalty model, build the loyalty of the customer value model. Based on the customer value to distinguish the RFM analysis at the same time, based on the mean of the RFM model, the RFM model based on clustering and the RFM model based on PCA after processing level of customer value classification, and evaluation of three different methods to focus on customer classification.Key words: Customer management; Loyalty; RFM; Correlation analysis; Clustering; PCA; Value of classification目 录1.研究目标 (4)2.分析方法与过程 (4)2.1.总体流程 (4)2.2.具体步骤 (7)2.3.结果分析 (8)3.结论 (13)4.参考文献 (14)1.挖掘目标挖掘目标本次建模目标是利用太普公司提供的62988个航空公司的样本数据,其中包括有63个属性,共8个季度用户飞行的真实数据[1]。

基于机器学习的航空客户价值分析研究

基于机器学习的航空客户价值分析研究

基于机器学习的航空客户价值分析研究近年来,随着机器学习技术的迅速发展与普及,基于机器学习技术的航空客户价值分析逐渐成为了航空公司关注的热点问题。

通过挖掘海量的客户数据,运用机器学习算法分析这些数据,航空公司不仅可以深入了解客户的兴趣、需求、行为等方面的信息,还能够找到客户的潜在价值并加以挖掘,从而提高客户忠诚度和订单量,实现差异化竞争优势。

一、机器学习在航空客户价值分析中的应用随着“大数据”时代的到来,航空公司不仅拥有了海量的客户数据,还拥有了处理这些数据的更先进的技术手段。

在传统的分析方法中,一般通过客户满意度调查、问卷调查等手段来了解客户需求和行为,但这种方法存在一定的主观性和局限性。

而基于机器学习的方法则通过挖掘海量的客户数据,分析这些数据中的规律和潜在关联,进而发现客户的兴趣、需求、行为等方面的信息,从而实现更精准、更客观、更全面的客户价值分析。

机器学习通常包括监督学习、非监督学习、半监督学习、强化学习等几种技术手段。

其中,监督学习通常应用于分类、预测等方面;非监督学习则用于数据聚类、降维等方面;半监督学习则结合了监督和非监督学习的优点,更加灵活;强化学习则是一种在交互式环境中,通过对行为反馈的观察和学习,来实现智能决策的方法。

在航空客户价值分析中,机器学习技术可以应用于如下几个方面:1.航空客户分类客户分类是航空客户价值分析中的一个重要环节,可以将客户分为不同的类别,进而针对不同的客户类别实施不同的营销策略。

机器学习算法可以根据客户的历史行为、消费记录、航班偏好等多种因素,建立客户分类模型,并将客户分为潜在高价值客户、普通客户、潜在低价值客户等不同类别,以此为基础制定不同的客户服务和营销策略。

2.预测客户需求和行为预测客户未来的需求和行为对航空公司来说具有重要意义。

通过机器学习算法对客户历史数据进行分析,可以有效预测客户未来的出行需求、购买偏好、航班选择等行为,航空公司可以根据这些预测结果,提高客户体验,加强客户关系维护。

Python数据分析与应用 第7章 航空公司客户价值分析 PPT

Python数据分析与应用 第7章 航空公司客户价值分析 PPT
在RFM模型中,消费金额表示在一段 时间内,客户购买该企业产品金额的总和 ,由于航空票价受到运输距离,舱位等级 等多种因素影响,同样消费金额的不同旅 客对航空公司的价值是不同的,因此这个 特征并不适合用于航空公司的客户价值分 析。
构建航空客户价值分析的关键特征
4. 航空客户价值分析的LRFMC模型
目录
1
了解航空公司现状与客户价值分析
2
分析方法与过程
3
使用K-Means算法进行客户分群
4
小结
小结
本项目结合航空公司客户价值分析的案例,重点介绍了数据分析算法中K-Means聚类算法在客户价值分析中 的应用。针对RFM客户价值分析模型的不足,使用K-Means算法构建了航空客户价值分析LRFMC模型,详细 描述了数据分析的整个过程。
分析航空公司现状
2. 行业外竞争
随着高铁、动车等铁路运输的兴建,航空公司受到巨大冲击。
分析航空公司现状
航空公司数据特征说明
➢ 目前航空公司已积累了大量的会员档 案信息和其乘坐航班记录。
➢ 以2014-03-31为结束时间,选取宽度 为两年的时间段作为分析观测窗口, 抽取观测窗口内有乘机记录的所有客 户的详细数据形成历史数据,44个特 征,总共62988条记录。数据特征及其 说明如右表所示。
处理方法:丢弃票价为空的记录。 ➢ 其他的数据可能是客户乘坐0折机票或者积分兑换造成。由于原始数据量大,这类数据所占比例较小,对
于问题影响不大,因此对其进行丢弃处理。 处理方法:丢弃票价为0,平均折扣率不为0,总飞行公里数大于0的记录。
构建航空客户价值分析的关键特征
1. RFM模型介绍
本项目的目标是客户价值分析,即通过航空公司客户数据识别不同价值的客户,识别客户价值应用最广泛的 模型是RFM模型。 ➢ R(Recency)指的是最近一次消费时间与截止时间的间隔。通常情况下,最近一次消费时间与截止时间的 间隔越短,对即时提供的商品或是服务也最有可能感兴趣。 ➢ F(Frequency)指顾客在某段时间内所消费的次数。可以说消费频率越高的顾客,也是满意度越高的顾客 ,其忠诚度也就越高,顾客价值也就越大。 ➢ M(Monetary)指顾客在某段时间内所消费的金额。消费金额越大的顾客,他们的消费能力自然也就越大 ,这就是所谓“20%的顾客贡献了80%的销售额”的二八法则。

航空公司客户价值分析

航空公司客户价值分析

CN
FR
CALIFORNIA US
31
2014/3/31
42
2014/3/31
40
2014/3/31
64
2014/3/31
48
2014/3/31
64
2014/3/31
46
2014/3/31
50
2014/3/31
50 2014/3/31
43
2014/3/31
34
2014/3/31
47
2014/3/31
2006/11/2 2007/2/19
2007/2/1 2008/8/22 2009/4/10 2008/2/10 2006/3/22
2010/4/9 2011/6/7 2010/7/5 2010/11/18 2004/11/13 2006/11/23 2006/10/25 2010/2/1
2008/3/28
2008/12/24男 2007/8/3男 2007/8/30男 2008/8/23男 2009/4/15男 2009/9/29男 2006/3/29男 2010/4/9女 2011/7/1男 2010/7/5女
2010/11/20女 2004/12/2男
2007/11/18男 2007/10/27男
要保障。
对公司的利润贡献不及“011”型客户;但是,这类客户 具 有很高的潜在价值,如果公司分析、了解、满足他们的需 求,利用针对性的营销手段吸引他们,提高购买频率,将
给 公司带来更多利润,因此这类客户可视为公司重要的发展
客 户
这类客户有可能购买力有限;也可能购买力强,但对公司 的
一些产品不感兴趣。加大这类客户的营销投入存在一定的 失

Python数据分析与应用_第7章_航空公司客户价值分析报告

Python数据分析与应用_第7章_航空公司客户价值分析报告

特征名称 最小值 最大值
L 12.17 114.57
R 0.03 24.37
F
M
C
2
368
0.14
213
580717
1.5
大数据挖掘专家
17
标准化LRFMC五个特征
L、R、F、M和C五个特征的数据示例,上图为原始数据,下图为标准差标准化处理后的数据。
LOAD_TIME
FFP_DATE
LAST_ TO_END
1.34
大数据挖掘专家
18
目录
1
了解航空公司现状与客户价值分析
2
预处理航空客户数据
3
使用K-Means算法进行客户分群
4
小结
大数据挖掘专家
19
了解K-Means聚类算法
1. 基本概念
K-Means聚类算法是一种基于质心的划分方法,输入聚类个数k,以及包含n个数据对象的数据库,输出满足 误差平方和最小标准的k个聚类。算法步骤如下。 ➢ 从n个样本数据中随机选取k个对象作为初始的聚类中心。 ➢ 分别计算每个样本到各个聚类质心的距离,将样本分配到距离最近的那个聚类中心类别中。 ➢ 所有样本分配完成后,重新计算k个聚类的中心。 ➢ 与前一次计算得到的k个聚类中心比较,如果聚类中心发生变化,转(2),否则转(5)。 ➢ 当质心不发生变化时停止并输出聚类结果。
最大乘机间隔 积分兑换次数 总精英积分
促销积分 合作伙伴积分 总累计积分 非乘机的积分变动次数 总基本积分
6
思考
原始数据中包含40多个特征,利用这些特征做些什么呢?我们又该 从哪些角度出发呢?
大数据挖掘专家
7
项目目标
结合目前航空公司的数据情况,可以实现以下目标。

民航客户关系管理课件

民航客户关系管理课件

北京现代职业技术学院
Beijing Modern Vocational and Technical College
案例:“汤鸭蛋”的成功*
☼客户细分(Customer Segmentation) : 指企业在明确的战略、业务模式和特定的市场中,根据客户的 属性、行为、需求、偏好及价值等因素对客户进行分类,并提供 有针对性的产品、服务和营销模式。 ☼客户细分的必要性
北京现代职业技术学院
Beijing Modern Vocational and Technical College
目的和要求
★任务目的 通过学习,掌握客户开发的策略和方法。 ★任务要求 根据一个企业的实际情况,能够提出该企 业的客户开发策略及方法。
北京现代职业技术学院
Beijing Modern Vocational and Technical College
•不同的客户能够为企业提供的价值是不同的,企业从追求客户“数量” 转而寻求客户的“质量” •企业的资源是有限的,所以在对客户进行管理时非常有必要对客户进 行统计、分析和细分 •便于企业所拥有的高价值的客户资源显性化
•是一对一营销的基础
北京现代职业技术学院
Beijing Modern Vocational and Technical College Beijing Modern Vocational and Technical College
电话号码簿——记录公司、机构的电话号码, 查找出可能会成为目标的客户,与之联系; (文印室里的班级通讯录)
专业名册——如刊物订阅者名册,协会会员名 册,公司股东、职员名录,行业的公司名册等
北京现代职业技术学院
Beijing Modern Vocational and Technical College

航空公司客户价值分析

航空公司客户价值分析

RFM模型是衡量客户价值和客户创利能力的重要工具和手段,它通过一个客户的近期购买行为、购买的总体频次以及购买的总体金额三个指标来描述客户的价值状况。

分别为:最近消费时间间隔(Recently)、消费频率(Frequency)、消费金额(Money)。

在RFM模型的基础上,结合具体的业务背景,来对航空公司进行客户价值分析。

我们选择在一定时间内累积的飞行里程数(M)和客户在一定时间内乘坐舱位对应的折扣系数的平均值C来代替消费金额指标。

此外,航空公司会员入会时间的长短在一定时间内会影响客户价值,模型中增加了客户关系长度指标L。

利用客户入会时长L、消费时间间隔R、消费频率F、飞行里程数M以及折扣系数的平均值C来作为航空公司识别客户价值指标,见表1,记为LRFMC模型。

采用聚类分析的方法识别客户价值。

通过对航空公司客户价值LRFMC五个指标进行K-Means聚类,识别最有价值客户。

1、数据抽取以2014年3月31日为结束时间,选取宽度为两年的时间段作为分析观测窗口,抽取观测窗口内有乘机记录的所有客户的详细数据形成历史数据。

对于后续新增的客户详细信息,以后续新增数据中最新的时间点作为结束时间,采用上述同样的方法进行抽取,形成增量数据。

2、数据探索分析主要是进行缺失值分析和异常值分析,通过对数据的观察,发现原始数据中存在票价为空值,票价最小值为0、折扣率最小值为0、总飞行公里数大于0的记录,这个都是属于缺失值和异常值的范畴。

# 设置工作空间# 把“数据及程序”文件夹拷贝到F盘下,再用setwd设置工作空间setwd("F:/数据及程序/chapter7/示例程序")# 数据读取datafile <- read.csv('./data/air_data.csv', header = TRUE)# 确定要探索分析的变量col <- c(15:18, 20:29) # 去掉日期型变量# 输出变量最值、缺失情况summary(datafile[, col])#探索缺失数据的模式md.pattern(datafile[,col])#以图形方式描述缺失数据aggr(datafile[,col],number=T)3、数据预处理由于原始数据量比较大,上述被定义为缺失值和异常值的样本量很小,对问题的分学习影响不大,因此选择的是剔除缺失值和异常值。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

ZF -0.636 0.852 -0.211 0.002 -0.636 -0.636 -0.707
ZM 0.069 0.844 0.159 0.273 -0.685 -0.604 -0.662
02 业务分析及数据预处理
LRFMC取值范围
属性名称 最小值 最大值
L 12.23 114.63
R 0.03 24.37
F
M
2
368
213
580717
C 0.14 1.5
LRFMC数据标准化 (部分数据)
ZL 1.69 1.69 1.682 1.534 0.89 -0.497 -0.869
ZR 0.14 -0.322 -0.488 -0.785 -0.427 -0.691 1.996
模型
L
R
F
M
C
航空公司 LRFMC模型
会员入会时 客户最近一次乘 客户在观测 客户在观测 客户在观测窗口内 间距观测窗口 坐公司飞机距观测 窗口内乘坐公 窗口内累积的 乘坐舱位所对应的折 结束的月数 窗口结束的月数 司飞机的次数 飞行里程 扣系数的平均值
.
5
02 业务分析及数据预处理
1.数据探索
对数据进行缺失值分析与异 常值分析
2013/04/28 2013/05/16 2010/02/05 2010/10/19 2011/08/25 2013/06/01 2010/12/27 2009/10/21 2013/06/02 2013/04/24 2013/04/17 2011/08/20
GENDE
男 男 男 男 男 男 男 男 女 男 女 男
FFP_DATE 2013/03/16 2012/06/26 2009/12/08 2009/12/10 2011/08/25 2012/09/26 2010/12/27 2009/10/21 2010/04/15 2007/01/26 2006/12/26
LAST_TO_END FLIGHT_COUNT SEG_KM_SUM AVG_DISCOUNT
FIGHT_C OUNT 14 65 33 6 22 26 5 4 25 36 49 51
BP_SUM
147158 112582 77475 76027 70142 63498 62810 60484 59357 55562 54255 53926
.
4
02 业务分析及数据预处理
根据传统RFM模型的三个指标即(最近消费时间间隔(Recency)、消费频 率(Frequency)和消费金额(Monetary))进一步改进,制定出客户关 系长度L、消费时间间隔R、消费频率F、飞行里程M和折扣系数均值C五个指 标最为航空公司识别客户价值指标,简称LRFMC模型
航空公司客户价值分析
1
目录 CONTENTS
01
数据挖掘目标
02
业务分析及数据预处理
03
模型构建及业务分析
04
代码展示
.
2
01 数据挖掘目标
0
1
借助航空公司客户数据,对客户进行分类
0
2
对不同客户类别进行特征分析,比较不同类客户的客户价值
0
对不同价值的客户类别提供个性化服务,制定相应的营销策略
3
.
数据预处理步骤
3.属性规约
选择与LRFMC模型相关的六 组数据
.
2.数据清洗
丢弃票价、平均折扣、总飞行 公里为空或为0的记录
4.数据变换
将数据转换成“适当的”格式, 以适应挖掘任务及算法需要
6
02 业务分析及数据预处理
数据探索结果
属性规约结果 (部分数据)
属性名称 SUM_YR_1 SUM_YR_2
3
02 业务分析及数据预处理
航空信息原始数据(部分数据)
MEMBER_NO 289047040 289053451 289022508 289004181 289026513 289027500 289058898 289037374 289036013 289046087 289062045 289022276
FFP_TIER
WORK_C ITY
WORK_P ROVIN
6
6 乌鲁木齐 新疆
5
北京
4 S.P.S CORTES
6 乌鲁木齐 新疆
5 北京
北京
4 ARCADIA CA
4 广州
广东
6 广州
广东
6.
天津
5 长春市 吉林省
6 沈阳
辽宁
WORK
US CN CN HN CN CN US CN CN CN CN CN
FFP_DATE
2013/03/16 2012/06/26 2009/12/08 2009/12/10 2011/08/25 2013/06/01 2010/12/17 2009/10/12 2013/06/02 2007/01/26 2006/12/26 2011/08/15
FIRST_FLIGI
L
R
数据变换
F
从原始数据中提取
LRFMC五个指标
M
C
LOAD_TIME-FFP_DATE 观测窗口结束时间-入会时间
LAST_TO_END 最后一次乘坐时间至观测窗口结束时长
FLIGHT_COUNT 观测窗口内的飞行次数
SEG_KM_SUM 观测窗口内的飞行里程
AVG_DISCOUNT 平均折扣
.
8
23
14
126850
1.02
6
65
184730
0.76
2
33
60387
1.27
123
6
62259
1.02
15
22
54730
1.36
23
26
50024
1.29
77
5
61160
0.94
67
4
48928
பைடு நூலகம்
1.05
11
25
43499
1.33
22
36
68760
0.88
4
49
64070
0.91
.
7
02 业务分析及数据预处理
… SEG_KM_SUM AVG_DISCOUNT
空值记录数 551 138 … 0 0
最大值 239560 234188
… 580717
1.5
最小值 0 0 …
368 0
LOAD_TIME 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31
AGE
56 50 34 45 47 36 35 34 54 47 55 41
LOAD_TIME
2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31 2014/03/31
相关文档
最新文档