利用数据挖掘进行电信业客户流失分析wor

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

利用数据挖掘进行电信业客户流失分析wor

李军

数据仓库之路原创资料:// dwway 利用数据挖掘实现电信行业客户流失分析

随着世界经济的全球化、市场的国际化和我国加入WTO步伐的加速,国际化的市场环境要求国内的公众电信运营企业在经营治理上向国外先进的电信运营企业看齐,以迎接电信运营业的国际化竞争。同时随着国家改革的深化,国内电信业的市场环境已渐趋合理且竞争将日益加剧。国内、国际电信业的如此态势,对公众电信运营企业的服务内容、服务方式、服务质量、经营治理以及服务意识,已提出了严肃的挑战。企业的经营模式和服务体系正以客户的价值取向和消费心理为导向,真正表达“制造需求”、“引导消费”的现代客户服务意识与理念。

在电信企业面向市场,面向国内外众多的竞争者,努力制造更高价值的同时,客户流失的不断增加,客户平均生命周期的不断缩短严峻阻碍了电信企业的进展。那么,在猛烈的市场竞争和不断变化的市场需求面前,如何最大程度的降低客户的流失率呢?常用的方法之一确实是利用数据挖掘技术。

数据挖掘技术是目前数据仓库领域最强大的数据分析手段。它的分析方法是利用已知的数据通过建立数学模型的方法找出隐含的业务规则,在专门多的行业差不多具有成功的应用。在电信行业的应用领域要紧有客户关系治理,客户欺诈分析,客户流失分析,客户消费模式分析,市场推广分析等。

那么,在客户流失分析系统中,如何应用数据挖掘技术呢?要紧方式是依照往常拥有的客户流失数据建立客户属性、服务属性和客户消费数据与客户流失可能性关联的数学模型,找出客户属性、服务属性和客户消费数据与客户流失的最终状态的关系,并给出明确的数学公式。只要明白客户属性、服务属性和客户消费数据,我们就能够运算出客户流失的可能性。市场/销售部门能够依照得到的数学模型随时监控客户流失的可能性。假如客户流失的可能性过高,高于事先划定的一个限度,就能够通过多种促销手段提高客户的忠诚度,防止客户流失的发生,从而能够大大降低客户的流失率。基于严格数学运算的数据挖掘技术能够完全改变以往电信企业在成功获得客户以后无法监控客户的流失,无法实现客户关怀的状况,把基于科学决策的客户关系治理全面引入到电信企业的市场/销售工作中来。

通常一个完整的数据挖掘过程由业务问题定义,数据选择,数据清洗和预处理,模型选择与预建立,模型建立与调整,模型的评估与检验,模型说明与应用等多个步骤组成。那个地点我们以个人客户流失为例说明各个步骤的功能。

1.业务问题的定义

业务问题的定义要求专门明确。任何不明确的定义都会严峻阻碍模型的准确和应用时的成效。例如:在客户流失分析系统中,需要明确客户流失的定义。在客户流失分析中,要紧有两个核心的变量:1.财务缘故/非财务缘故;2.主动流失/被动流失。客户的流失类别依照这两个核心变量能够分为四种。其中自愿的、非财务缘故的流失客户往往是高价值的、稳固的客户。他们会正常的支付自己的服务费用,并对市场活动有所响应。因此这种客户才是我们真正想保持的客户。而真正在分析客户流失的状况时,我们还必须区分公司客户与个人客户,不同服务的奉献率,或者是不同客户消费水平流失标准的不同。举例来说,关

于用一种新服务替代原有服务的客户,是否作为流失客户?又或者,平均月消费额为2000元左右的客户,当连续几个月消费额降低到500元以下,我们就能够认为客户发生流失了,而那个流失标准就不能适用于原本平均月消费额就为500元左右的客户。实际上,在国外成熟的电信行业客户流失分析系统中,经常是依照相对指标判别客户流失。市场调查说明,通常大众的个人通信费用约占总收入的1%-3%,当客户的个人通信费用降低到远远低于此比例时,就能够认为客户流失发生。因此,客户流失分析系统必须针对各种不同的种类分别定义业务问题,进而分别进行处理。

2.数据选择

数据选择包括目标变量的选择,输入变量的选择和建模数据的选择等多个方面。

目标变量的选择

目标变量表示了数据挖掘的目标。在客户流失分析应用目标变量通常为客户流失状态。依据业务问题的定义,我们能够选择一个已知量或多个已知量的明确组合作为目标变量。目标变量的值应该能够直截了当回答前面定义的业务问题。在客户流失分析系统中,我们实际面对的流失形式要紧有两种:账户取消发生的流失和账户休眠发生的流失。关于不同的流失形式,我们需要选取不同的目标变量。关于账户取消发生的流失,目标变量直截了当就能够选取客户的状态:流失或正常。关于账户休眠发生的流失,情形就较为复杂。通常的定义是连续休眠超过给定时刻长度的客户被认为是发生了流失。然而,那个给定时刻长度定义为多长合适呢?另外一方面,每月的通话金额低于多少就能够认为是客户处于休眠状态?或者要综合考虑通话金额,通话时长和通话次数来划定流失标准?实际上,目标变量的选择是和业务问题的定义紧密关联在一起的。选择目标变量所要面对的这些问题,都需要业务人员给予明确的回答。

输入变量的选择

输入变量用于在建模时作为自变量查找与目标变量之间的关联。在选择输入变量时,我们通常选择两类数据:静态数据和动态数据。静态数据指的是通常可不能经常改变的数据,包括服务合同属性,如服务类型,服务时刻,交费类型等等;和客户的差不多状态,如性别,年龄,收入,婚姻状况,受教育年限/学历,职业,居住地区等等。动态数据指的是经常或定期改变的数据,如每月消费金额,交费纪录,消费特点等等。输入变量的选择应该在业务人员关心下进行,如此才能选择出真正与客户流失可能性具有潜在关联的输入变量。业务人员经常在实际业务活动中深深感受到输入变量与目标变量的内在联系,然而却无法以量化表示出来。在这种情形下,数据挖掘的工作往往能够得到良好的回报。在一时无法确定某种数据是否与信用卡流失可能性有关联时,应该选取,在后续步骤考察各变量分布情形和相关性时再决定取舍。

建模数据的选择

通常电信行业客户流失的方向有两种。第一种是客户的自然消亡。例如由于客户的身故,破产,迁徙,移民等缘故,导致客户不再存在。或者是由于客户的升级,如GSM 升级为CDMA,造成特定服务的目标客户消逝。第二种是客户的转移流失。通常指客户转移到竞争对手享受服务。

明显第二种流失的客户才是电信企业真正关怀的,对企业具有挽留价值的客户。

相关文档
最新文档