基于数据挖掘的电力行业客户细分模型分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于数据挖掘的电力行业客户细分模型分析
发表时间:2019-01-14T15:34:01.547Z 来源:《防护工程》2018年第31期作者:窦常永
[导读] 电力作为国家经济发展的基础,其重要性不言而喻。
国网甘肃省电力公司电力科学研究院甘肃兰州 730046
摘要:电力客户细分对电力客户价值的分析研究是供电企业施差异化服务、实现利益最大化的基础。设计电力价值评定指标,通过专家打分分别对客户当前价值、潜在价值标注等级,建立了基于CART决策树的客户价值决策模型,混合利用TOPSIS算法得到客户最终分值。CART决策树价值划分模型预测的结果经过对比分析证实具有较高的预测准确度和鲁棒性,是一种有效的电力客户价值评价方法。
关键词:数据挖掘;客户营销;决策树;回归模型;客户细分
引言
电力作为国家经济发展的基础,其重要性不言而喻。对此,为加快我国经济建设,国家出台了多项政策,对电力行业进行扶持,进而加快电力基础设施建设,满足不同地区和不同类型客户对电力的需求。而随着电力行业的不断进步,也开始从原来的基础建设,朝着提升电力服务水平,加强电力营销工作中来。特别是随着现代电力用户消费观念的提升,如何提高营销的工作效率,满足电力客户的电力需求,成为目前电力企业思考和探讨的重点。
1预测算法模型构建
1.1Logistic回归预测模型
Logistic回归本质上是线性回归,是在从特征到结果进行映射的过程中,加入一层函数进行映射。具体来讲就是先对特征进行线性求和,然后通过函数g(z)作为假设函数来对其进行预测。
1.2决策树模型
决策树是一个预测模型;它代表的是属性与值之间的一种映射关系。决策树(Decisiontree)由一个决策图和可能的结果组成,用来创建到达目标的规划,是一种特殊的树结构。在决策树中,每个节点表示为一个特定的属性,并且每一个分叉的路径则代表某一个可能的值,而每一个叶节点则表示为根节点到叶节点经历的路径所表示的对象的值。
2客户细分模型构建
2.1建模流程
根据数据挖掘的流程,以停电敏感性客户作为研究样本,以SPSS软件对数据进行处理,从而将其细分模型设计为如图1所示。
图1SPSSModeler建模流程
2.2关键字段选取
在采用上述方法进行建模过程中,需要选定关键的字段,即对客户的评价指标。本文则选取表1所示的字段。
3模型验证
3.1样本选取
为验证上述模型在客户细分中效果,以某市中的25万非居民用户和178万居民用户作为数据基础,在非居民用户中抽取40%的比例数据样本,在居民数据中抽取10%的样本,以此用于对模型的检验。同时根据建模需要,将上述的数据拆分为4∶3∶3的比例,分别设定为训练集、验证集和测试集,具体如图2所示。
图2数据样本区分
3.2技术
选取上述样本中曾经拨打过95598咨询过有关停电信息的客户资料,结合上述的指标,对模型进行检验,从而得到如图3所示的验证结果。
通过上述的分析看出,通过对验证集进行评分排序后,在前5%的客户里敏感客户中,其提升度为2.96倍;而采用决策树方法,提升度为2.61倍。由此,通过比较,本文选择逻辑回归模型对敏感客户进行细分。
图3逻辑回归模型结果提升度
3.3模型验证
通过分析节点,可以针对已知道其实际结果的记录来检验模型。将分析节点连接至生成的模型,通过运行分析节点,它可以为我们提供模型预测的正确错误率比较。分析表明,训练集中71001个记录中有70357个记录(约99.09%)的模型预测值与实际值相匹配;测试集中53336个记录中有52826个记录(约99.04%)的模型预测值与实际值相匹配;验证集中53520个记录中有52997个记录(约99.02%)的模型预测值与实际值相匹配。可以看出,在采用回归模型预测的正确率均在99%以上,准确率较高。
图4居民模型评估分析
3.4客户打分
同时,结合逻辑回归模型,对客户进行打分,进而得到表1的结果。同时,再结合客户细分标准,可以对其中的敏感性客户进行等级划分,最终得到不同的等级的敏感性客户。而电力企业则可以根据上述的等级客户,采取不同的服务措施。
结束语
综上,本文针对目前电力营销上客户细分的需求,在传统的采用K均值聚类的基础上,提出采用逻辑回归模型和决策树对客户进行细分,并通过以某市电力客户数据作为基础,通过SPSS软件对上述的模型进行了验证。通过结果看出,逻辑回归预测模型在对敏感性客户的分类精度来讲,要明显高于决策树算法,并且通过全量客户打分与测试集中的比例相当接近,由此验证了逻辑回顾模型在对客户进行细分中,其更加接近真实值,并验证其优势
参考文献:
[1]徐建民,粟武林,吴树芳,武晓波.基于逻辑回归的微博用户可信度建模[J].计算机工程与设计,2015,(03):772-777.
[2]高永梅,琚春华,邹江波.基于电信领域客户细分模型的个性化服务构[J].数学的实践与认识,2015,(05):44-54.
[3]郑芒英.湛江地区用电客户电费回收风险分析[J].中国新通信2015(07):101-103.
[4]张琪,周琳,陈亮,张晋昕,温兴煊,何贤英.决策树模型用于结核病治疗方案的分类和预判[J].中华疾病控制杂志,2015,
(05):510-513.
[5]覃文文,戢晓峰.基于K-means聚类的快递企业客户细分方法[J].世界科技研究与发展,2011,(06):955-958+969.
[6]曾小青,徐秦,张丹,林大瀚.基于消费数据挖掘的多指标客户细分新方法[J].计算机应用研究,2013,(10):2944-2947.