航空公司客户价值分析Kmeans
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据变换
由于原始数据没有直接给出LRFMC五个指标,需要自己计算,具体的计算方式为:
(1)L=LOAD_TIME-FFP_DATE
(2)R=LAST_TO_END
(3)F=FLIGHT_COUNT
(4) M=SEG_KM_SUM
(5)C=avg_discount
数据变换的Python代码如下:
1.def reduction_data(datafile,reoutfile):
2. data=(cleanoutfile,encoding='utf-8')
3.
data=data[['LOAD_TIME','FFP_DATE','LAST_TO_END','FLIGHT_COUNT','SEG _KM_SUM','avg_discount']]
4.# data['L']=(data['LOAD_TIME'])(data['FFP_DATE'])
5.#
data['L']=int(((parse(data['LOAD_TIME'])-parse(data['FFP_ADTE'])).d ays)/30)
6.####这四行代码费了我3个小时
7. d_ffp=(data['FFP_DATE'])
8. d_load=(data['LOAD_TIME'])
9. res=d_load-d_ffp
10. data['L']=(lambda x:x/(30*24*60,'m'))
11.
12. data['R']=data['LAST_TO_END']
13. data['F']=data['FLIGHT_COUNT']
14. data['M']=data['SEG_KM_SUM']
15. data['C']=data['avg_discount']
16. data=data[['L','R','F','M','C']]
17.(reoutfile)
变换结果如下:
客户聚类
采纳kMeans聚类算法对客户数据进行客户分组,聚成5组,Python代码如下:
1.import pandas as pd
2.from import KMeans
3.import as plt
4.from itertools import cycle
5.
6.datafile='./tmp/'
7.k=5
8.classoutfile='./tmp/'
9.resoutfile='./tmp/'
10.data=(datafile)
11.
12.kmodel=KMeans(n_clusters=k,max_iter=1000)
13.(data)
14.
15.# print
16.r1=.value_counts()
17.r2=
18.r=([r2,r1],axis=1)
19.=list+['类别数量']
20.# print(r)
21.# (classoutfile,index=False)
22.
23.r=([data,,index=],axis=1)
24.=list+['聚类类别']
25.# (resoutfile,index=False)对数据进行聚类分群的结果如下表所示:。