基于商务智能的客户流失预测模型与算法研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于商务智能的客户流失预测模型与算法研究客户流失管理是许多行业关注的一个重要问题,近年来,以传统统计学方法和人工智能方法为基础,客户流失预测研究取得了丰富的研究成果,但尚存许多值得研究的问题。商务智能的崛起为客户流失预测的研究提供了新的思路。本文在商务智能理论和客户关系理论框架下,对现有客户流失预测模型结构进行修订,提出了新的预测模型结构。然后,以新的预测模型结构为基础建立了客户流失策略管理模型、客户流失特征提取与属性选择方法、客户流失预测模型,对电信业的客户流失预测问题进行了实证考察,从一个新的角度加深了对客户流失的规律理解。
最后,对控制客户流失的策略进行了研究。现总结如下一、提出一种新的客户流失预测模型结构,以一种崭新的思路研究客户流失问题。根据客户数据的特点和现用预测方式的不足,采用特征提取、属性选择、预测模型设计的预测新思路来研究客户流失问题。通过对新模型结构实现算法和实证的研究,证明了新模型结构比现用模型结构更加有效。
二、应用基于企业竞争的Delta策略模型,提出一种用于电信业的客户流失管理策略模型(CMSM)。通过使用某电信企业客户流失数据集,对CMSM进行了验证。其结果表明,该模型描述了客户流失的原因且包含了与企业竞争策略相关的主要预测因子,从而使其实际应用更易控制。三、利用特征提取和指标属性选择方法,对电信业客户流失预测进行实证分析。
主要结论是1、将核主成分分析(KPCA)引入到客户流失预测中,提出了相应的特征提取算法,将KPCA与Logistic回归结合,设计了预测模型。对某电信公司客户流失预测的实证结果表明,该方法获得的命中率、覆盖率、准确率、提升系数、命中率置信度区间、覆盖率置信度区间、整体准确率置信度区间和Kappa,高于原始属性集和主成分分析(PCA)特征提取法。这表明KPCA能提取客户数据的非线性特征,是研究客户流失预测问题的有效方法。2、将信息增益(IG)引入到客户流失预测中,提出了相应的属性选择算法,将IG与神经网络(NN)结合,设计信息增益神经网络(IGNN)预测模型。
对某电信公司客户流失预测的实证结果表明,该方法获得的命中率、覆盖率、准确率、提升系数、命中率置信度区间、覆盖率置信度区间、整体准确率置信度
区间和Kappa,高于属性相关性选择法、一致性选择法、实例选择法和对称不确定性选择法,这表明IGNN具有比NN更好的预测能力和泛化能力,从而证实了该方法的有效性、可行性和可靠性。3、客户流失预测中的属性选择是一个满意优化问题。针对已有属性选择方法较少考虑属性获取代价和属性集维数的自动确定问题,提出一种满意属性选择方法(SASM),将样本分类性能、属性集维数和属性提取复杂性等多种因素综合考虑。给出属性满意度和属性集满意度定义,设计出满意度函数,导出满意属性集评价准则,详细描述了属性选择算法。
对某电信公司客户流失预测的实证结果显示,SASM获得的命中率、覆盖率、准确率、提升系数、命中率置信度区间、覆盖率置信度区间、整体准确率置信度区间和Kappa,高于属性相关性选择法、一致性选择法、实例选择法和对称不确定性选择法。证实了SASM的有效性、可靠性和实用性。4、随着时间跨度增加,利用特征提取和属性选择方法所建立的预测模型,需重新训练,才可能得到满意的结果。四、利用基于结构风险最小化准则的SVM方法,对电信业客户流失预测进行实证分析。
主要结论是1、应用标准SVM,研究了电信业客户流失预测问题,并以某电信公司客户流失预测为实例,与人工神经网络、决策树、贝叶斯分类器等方法进行了对比,发现,除模型整体准确率、整体准确率置信度区间略低于决策树C4.5外,该方法能获得最好的命中率、覆盖率、提升系数、命中率置信度区间、覆盖率置信度区间、Kappa,是研究客户流失预测问题的有效方法。2、针对目前客户流失预测方法的不足,在利用训练样本中不同类个数比值来确定各类惩罚参数的基础上,改进标准的C支持向量分类机(SVC)。通过以某电信公司客户流失预测为实例,与标准C-SVC、人工神经网络、决策树、贝叶斯分类器等方法进行了对比,发现,除模型整体准确率、整体准确率置信度区间略低于ANN,Logistic
回归和贝叶斯分类器外,该方法能获得较好的正确率、命中率、覆盖率、提升系数、命中率置信度区间、覆盖率置信度区间、Kappa,是研究客户流失预测问题的有效方法;3、利用简易SVM方法所建的客户流失预测模型,在模型评价结果相当的条件下,其运算花费的时间较小:4、通过对“拒真纳伪”两类错误在客户流失预测中不同影响分析比较,采用SVM作为预测模型,并利用某电信公司实际数据对两类错误的平衡控制进行了研究。实验结果表明,选取一个适当的损失
比例系数,预测模型能在控制两类错误的前提下,有效地减少期望损失函数值,这在实际应用中具有反映问题本质的现实意义。
5、随时间跨度的增加,预测模型应该重新训练才能得到满意的效果。五、结合客户关系管理理论,从客户价值和客户满意的角度提出了客户流失分类表;然后通过对客户流失进行受力分析,发现导致客户流失的为推力和引力;最后通过引入拉力策略和阻力策略来控制客户流失。