基于K―means聚类的客户细分案例分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于K―means聚类的客户细分案例分析
【摘要】当今流行的客户细分理论的视角主要关注在消费市场的细分上,现有的客户细分理论中根据客户购买的产品特征进行细分的分析和研究相对较少,因此本文的研究就是把某品牌鞋子的风格特征作为细分变量,基于某企业的销售数据来进行分析,选择K-means聚类分析方法结合企业的实际情况,划分出不同的客户群,企业可以根据不同客户群的需求和对企业的贡献制定不同的宣传营销策略,降低企业的销售成本,提高企业的竞争力。
【关键词】客户细分K-means聚类案例分析营销策略
一、案例介绍
某公司是一个以鞋类的研发制造及品牌管理为主的时
尚集团公司,业务遍及大中华区(中国大陆、香港、台湾)、亚洲、欧洲及北美洲,是中国最成功的国内品牌之一。该公司在中国经营的组织架构为:总公司――分公司――专卖店。其中,总公司负责拓展策略和公司年度工作计划的制定,以及成本控制和分公司事务管理。分公司负责执行总公司的战略,对专卖店、专卖店人员实施管理,工作内容包括:新开专卖店寻址、申请开店、签约、开店;对分公司人员管理、分公司销售指标达成、执行总公司促销活动等。
二、数据处理
(一)数据准备
原始数据包括两张表:客户交易记录表和鞋子具体属性表,其中客户交易记录表与鞋子属性表连接的变量是鞋子ID,交易记录数据的时间是过去一年2013年9月1日到2014年9月1日。
(二)数据清洗
该企业一年的交易记录有几千万条,所以原始的交易数据量非常大,这样就很容易出现噪声数据、空缺数据和不一致数据,所以必须要经过一系列的分析与处理,包括对缺失值的处理和异常值的处理,例如:去除客户属性为空的客户记录、剔除消费额和消费次数不在正常范围内的客户记录等。
(1)剔除异常的正负交易。从客户交易记录表中选出过去一年交易ID不为空的正常交易记录,交易记录表中的金额有正负之分,正表示购买记录,负表示退货记录,要剔除掉没有正交易与之对应的退货记录。
(2)剔除异常的购买数量和金额。由于有些客户不是会员,专卖店的销售员会帮客户刷自己的会员卡,这样就会出现一个会员ID在一段时间内交易数量和交易金额超出正常范围。本文用3δ准则剔除不在正常范围内异常客户。
(三)数据转换和整合
清洗后的数据是不能直接用来进行客户细分,需要对变量进行转换。
(1)按照消费金额给每个客户打标签。先计算每个客户在一年内消费的总金额MON,再结合企业的实际情况,在价值方面给每个客户打标签。
(2)选出有重复购买行为的客户,只有一次购买的客户多为一次性客户,本文不对其进行细分。
(3)连接交易记录表和鞋的属性表。按照鞋子的ID匹配,把鞋子的具体属性整合到客户的交易记录表中。
(4)根据客户购买时间定义大促和非大促,根据购买价格和上市价的比值,定义新品期和清仓期。
(5)把原来作为具体值出现的标签转换为变量,作为客户对该属性的偏好进入细分模型。
(6)把细分变量、消费金额和价值变量整合到一张宽表中,由于[其他类]比较宽泛的鞋类占比较少,而且进入细分的意义也不大,故本文将其剔除。
(7)计算各变量的相关系数。除了[女鞋]和[童鞋]的相关系数为-0.7,[大促]和[非大促]的相关系数为-0.93外较高外,其他变量之间的相关系数都较小。由于该品牌鞋子的客户群多为女性,把[女鞋]作为细分变量的代表性较差,故剔除[女鞋]保留[童鞋];考虑到变量的重要性,[大促]较为重要,故剔除[非大促]保留[大促]。最终进入细分模型的变量为27
个。
三、客户细分过程
把SQL里整理好的变量建立一张表导入到R里进行聚类分析,由于K-means聚类方法要求提前设定聚的类数,本文从聚为5类到12类全部运行一遍把运行结果导入到SQL 里与客户ID连接,分别计算各类客户群每个变量的均值以及普通会员、潜力会员、高价值会员和VIP的占比。
结合实际情况和分类特征要明显的原则,本文最终将客户细分为9类,为了方便分析将变量值进行一下转换,即将每一个变量值除以变量的均值再乘以100。
四、客户细分结果分析
第一类,高端会员,该类会员客单价最高,对促销不敏感,偏爱基本款半皮材质单鞋,客单价662,人数占比9%,销售占比12%;第二类,时尚追求者,在新品初期购买时尚款毛绒高跟靴,销售占比14%,82%为高价值会员和VIP;第三类,凉鞋爱好者,多在清仓期购买舒软凉鞋,喜欢非皮材质,VIP会员和高价值会员占比都最少,分别为7%和27%;第四类,铆钉链条控,偏爱铆钉链条以及毛绒风格,对其他都不太敏感,13%的客户群以及11%的销售额,各价值类人群分布较均匀;第五类,促销空,多在大促期间购买高跟鞋;第六类,超值学生妈妈族,喜欢超值款,多在大促期间购买童鞋和男鞋,客单价600较高,人数占比和销售占比都最高。
第七类,俏丽优雅,喜欢中跟经典款,对男鞋和童鞋及其不敏感,客单价365最少,销售占比6%也最少。
第八类,真皮靴子控,喜欢核心款和基本款,多在新品初期购买妈妈风格的真皮靴子,人数占比8%最少,近90%的VIP和高价值会员;第九类,贤惠妈妈群,购买超值款低跟休闲的童鞋和男鞋,VIP和高价值人群较少。
通过上面的分析,可以看出,第六类和第九类的客户群相似度较大,本文考虑合并第六类和第九类。
五、营销对策
由于某些原因的限制,本文提出的营销策略仅限于发送手机短信和EDM邮件。针对第一类对促销不敏感高端会员,可以在节假日之外的时间发送价格较高的应季单鞋;第二类时尚追求者的客户群,喜欢买靴子,可以在冬季向VIP和高价值会员发送新品靴子的信息;第三类凉鞋爱好者,多为普通会员和潜力会员,在夏末清仓凉鞋的时候发送信息较为合适;第四类和第五类客户群目标性不太强,可以有选择性的分别发送畅销的铆钉链条风格的鞋子和各类高跟鞋促销信息;合并后的第六类和第九类客户是一个很大的群体,多为已婚妈妈为自己、丈夫和孩子购买鞋子,可以针对潜力会员发送超值款的男鞋或童鞋信息;第七类优雅俏丽一族,客单价较低,可以向高价值会员发送相应风格的经典款中跟鞋子,以提高客单价;第八类真皮靴子控,人数最少,但价值