第13章数据挖掘在零售业的应用案例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8/25
2014-10-15
13.2.2 数据理解阶段
案例数据来自该超市的销售事务数据库mySHOPSHStock,数据库中 包含商品表Goods、销售流水表Sale_J(包括从2009年12月到2011 年9月间每个月份的销售数据)、收银流水表Pay_J以及商品类别表 Category。从表内容来看,Goods表存储商品的信息,主要包括商 品编码、名称、品牌和部类编号等属性;Sale_J表存储销售事务明细 ,主要包括交易时间、门店号、Pos号、小票号、销售量、销售额和折 扣额等属性;Pay_J表则记录了收银的情况,主要包括交易时间、门店 号、Pos机号、小票号、支付类型、支付款值和等价款值等属性; Category表记录了商品的类别信息,包括部门编号、部门名称、科、 大类、中类、小类等属性。
在超市经营管理中,商品的摆放位置对销售起着至关重要的作用。合 理的商品布局不仅能节省顾客的购买时间,还能刺激顾客的购买欲望 。将一些被认为没有关联的商品摆放在一起,可能会产生意想不到的 销售效果,比如著名的“啤酒与尿布”故事所展示的营销效果。 在本案例中,该超市主要经营食品生鲜、日用品、服装纺织、家电以 及家居用品等。该超市规模相对比较大,销售的商品种类繁多,货架 上有七万多种商品,配置有POS系统,销售数据存入统一的SQL Server数据库。随着超市竞争的加剧,为求进一步发展,该超市迫切 需要对自身的经营状况进行分析,并根据销售情况适时改变超市经营 策略,希望通过对历史销售记录的分析,了解顾客的购买习惯和偏好 ,了解顾客购物篮中商品间的关联性,以实现商品组合优化布局,促 进超市商品销售。
序 1 2 3 4 5 6 7 8 号 属 性 TransactionID Name Department ProductClass ProductFamily ProductCategory ProductSubcategory Weekday 属性描述 购物篮号 商品名 部门名 科名 大类名 中类名 小类名 购物时间 数据类型 标称变量 标称变量 标称变量 标称变量 标称变量 标称变量 标称变量 标称变量
2/25
2014-10-15
13.1 数据挖掘在零售业中的应用概述 (2)
数据挖掘技术在零售业中的深度应用是现代零售业发展的重要趋势。 数据挖掘技术在零售业的应用主要体现在以下几方面: (1)关联分析技术——商品分组布局,商品购买推荐 关联分析是零售领域应用最早的数据挖掘技术。从“啤酒与尿布”的 故事到超市商品的关联摆放,再到目前热门的电子商务网站的产品服 务推荐,都能体现关联分析的应用。关联分析技术通过分析历史事务 数据库数据,发现购买某种商品的顾客同时也购买另一种商品的组合 规则。 (2)聚类分析技术——客户细分 客户细分是指将一个大的消费群体划分为若干的小群体,同一小群体 的客户具有相似的消费特征。客户细分根据客户的属性行为、需求、 偏好和价值等因素对客户进行划分,并提供针对性的产品或服务。在 零售业中,利用聚类分析技术,根据历史顾客的基本信息、消费信息 以及其他信息等,把这些历史顾客划分为不同的客户群体。然后分析 这些群体中客户的相似行为特征,针对不同的用户群体,可采取不同 的个性化服务。
11/25 2014-10-15
13.2.4 建模阶段 (2)
(2)中类组合的关联分析 首先以中类(ProductCategory)作为两者变量,其它变量作为输入 变量进行数据分析,如表13-2。
表13-2 以中类(ProductCategory)作为两者变量的变量表 字 段 TransactionID Name Department ProductClass ProductFamily ProductCategory ProductSubcategory Weekday 类 型 范围 集 集 集 集 集 集 集 方 向 输入 无 无 无 无 两者 无 输入
12/25
2014-10-15
13.2.4 建模阶段 (3)
针对中类进行分析,考虑到数据量非常大,支持度和置信度的设定比 较难以确定。在实验中,设置最小支持度为1.0%,最小置信度为 20.0%。其中,最小支持度是Clementine里定义的前项支持度。提高 阈值会使规则减少,甚至找不到规则;反之如果降低阈值则会导致规 则太多,难以一一解释应用,实际指导意义不大。 可以从网络图13-1看出商品中类间存在的关联性:
在零售业竞争白热化和信息化趋势的大背景下,零售企业只有借助信 息化技术,有效利用业务系统积累的海量数据,分析市场信息、产品 信息和顾客需求,进而制定合适的营销管理策略,才能在企业经营中 取得成功。 在零售目录直销和仓储商场上,可以综合运用数据挖掘技术,根据客 户基本信息和消费行为研究不同客户群体的特点,以挖掘潜在市场、 获取目标市场的客户群体和预测客户行为,有针对性地对客户群进行 目录邮寄,将有限的资源投注在最具获利性的客户群体上,提高企业 客户响应度。在零售电子商务化上,比如美国的亚马逊和中国的淘宝 等电子商务网站,零售业和互联网的快速“联姻”以及互联网技术和 数据挖掘技术的结合成为零售业新的增长点。通过分析用户在电子商 务网站的历史消费行为数据,研究用户的消费习惯和购买偏好等行为 模式,进而为用户制定个性化的产品或服务推荐,提高用户满意度。
3/25 2014-10-15
13.1 数据挖掘在零售业中的应用概述 (3)
(3)分类分析技术——获取潜在客户、客户流失预测 在客户关系管理中,获取潜在客户是客户关系生命周期中的重要环节, 是进行客户关系管理的前提。而客户流失则是企业最不愿意看到的局 面,通常到了客户消费周期后期,由于各种原因,企业不得不面临客 户不可避免的流失。为了保证客户关系的良性发展,企业必须对潜在 客户有预测性的营销策略,吸引潜在客户成为自己的客户;同时要防 范客户流失,对流失可能性较大的客户,分析其价值,并采取相应的 措施(挽留或放弃)。 零售企业可以利用决策树、贝叶斯和神经网络等分类技术,对历史客 户信息(包括客户基本信息、历史购买信息、其它行为信息)进行分 析,并建立准确度高的分类模型。可以利用分类模型对某一群体或某 一客户进行分类预测,挖掘目标市场的潜在群体或潜在客户,扩大企 业的客户群体数量,增加其在市场的客户占有率与营销产品覆盖率。 同样,可以根据流失客户的信息,建立分类预测模型,对现有的客户 进行流失评估,对流失可能性较大的客户采取一定措施,使客户流失 的损失最小化。
图13-1 中类关联性网络图
13/25 2014-10-15
13.2.4 建模阶段 (4)
结合网络图和模型结果,可以得到中类商品的关联分析结果,如表133。 表13-3 商品中类部分关联规则列表
规 则 饼干&其他进口食品=>进口饼干 进口糖果&一次性用品=>进口饼干 速食面杯装类&常温火腿肠=>蛋类 进口饼干&一次性用品=>进口糖果 进口饼干&其他进口食品=>进口糖果 散装休闲联营 & 其他进口食品 => 进口饼 干 巧克力&一次性用品=>进口糖果 糖果&一次性用品=>蜜饯/果脯 饼干&一次性用品=>薯片 联营专柜=>联营床上用品 调味油/汁=>节庆熟食礼盒 蛋类=>速食面杯装类 支 持 度 1.054% 1.346% 1.14% 1.406% 1.23% 1.913% 1.602% 1.23% 2.104% 1.436% 1.772% 2.144% 置 信 度 29.524% 26.493% 21.145% 25.357% 25.306% 22.572% 22.571% 22.449% 22.673% 27.972% 21.813% 32.319% 提 升 度 11.76 10.553 9.863 9.232 9.214 8.991 8.218 8.189 8.107 7.802 7.662 7.502
表13-1 购物篮数据表AllData
10/25 2014-10-15
13.2.4 建模阶段 (1)
(1)建模思路 建模目标是借助Apriori算法分析商品之间的关联性,并找出推测商品 关联的原因。 模型的建立以两个层次(中类和小类)展开分析:选取 “Weekday=0”的记录,首先以中类作为分析对象,从中得出关联 性较强的中类组合;然后从得到的中类组合中,以小类作为分析对象 ,进行深层的关联分析,从中得到关联性强的小类组合。 采用上述方法进行分析,是因为商品种类繁多,如果直接对商品名进 行分析,会导致置信度和支持度过低而难以获得具有指导性意义的结 果。在实验过程中发现,直接将商品进行分析会多次出现“找不到规 则,阈值过高”的情况。若只针对“部门”、“科”或“大类”进行 分析,又缺乏具体性,难以得出具有实际应用意义的结果。因此,本 案例先针对商品的中类进行关联分析,从中筛选出关联性强的中类组 合,然后在此基础上将小类作为对象进行关联分析,筛选出关联性强 的小类组合,这样通过商品信息和类别信息的结合可以较好解决商品 繁多导致的计算代价巨大的问题,可得出具有指导意义的关联规则。
9/25
2014-10-15
13.2.3 数据准备阶段
对该超市销售数据进行预处理,主要包括合并数据表、增加标识字段 和删除无用的属性等,处理后可以得到总的收银流水表Pay、销售流 水表Sale、商品表Goods和商品类别表Category。 为了构造购物篮数据,我们需要对销售流水表Sale、商品表Goods和 类别表Category进行整合。首先根据Sale表中标识一个购物篮的4个 字段增加一个标识字段TransactionID,然后将Sale表、Goods表和 Category表进行连接,选择出分析需要的字段,包括交易标识编码、 商品名称和各类别信息等。
Leabharlann Baidu5/25
2014-10-15
13.1 数据挖掘在零售业中的应用概述 (5)
(5)时间序列分析和回归分析——销售预测分析 销售预测是企业制定销售计划的中心任务之一,销售预测影响到包括 计划、预算和销售额等方面的工作。随着企业对销售的预算管理和控 制的规范化,销售预测往往是企业进行年度预算管理和制定营销计划 的关键。企业通常会根据历史销售来制定销售计划,估计销售预算等。 时间序列和回归分析等方法可以应用到诸如此类的销售预测中,为营 销决策提供支持。
商务数据挖掘与应用案例分析
0/25
2014-10-15
第13章 数据挖掘在零售业中的应用
13.1 数据挖掘在零售业中的应用概述>> 13.2 案例1:关联分析在超市购物篮分析中的应用>> 13.3 案例2:超市工作时间与人员配置分析>>
1/25
2014-10-15
13.1 数据挖掘在零售业中的应用概述 (1)
4/25 2014-10-15
13.1 数据挖掘在零售业中的应用概述 (4)
(4)RFM分析技术和序列模式挖掘——客户忠诚度分析 客户忠诚度对企业的发展具有重要意义,有利于降低营销成本、增加 企业利润和扩大企业市场份额。 RFM分析技术基于客户购买次数、购买总金额以及最近购买时间三项 信息,对所有历史客户进行忠诚度评分,并划分为忠诚度高的客户、 忠诚度一般的客户以及忠诚度低的客户,然后对忠诚度不同的客户采 取不同的管理措施。 序列模式挖掘通过会员卡等实名制方式跟踪客户的消费行为,记录同 一客户不同时期购买的商品序列,可以分析客户的购买趋势,并结合 客户的消费行为分析出他们对某些商品忠诚度的变化,调整营销模式, 以留住老客户和吸引新客户。
规则ID 1 2 3 4 5 6 7 8 9 10 11 12
14/25
2014-10-15
13.2.4 建模阶段 (5)
6/25
2014-10-15
13.2 案例1: 关联分析在超市购物篮分析中的应用
13.2.1 商业理解
13.2.2 数据理解阶段
13.2.3 数据准备阶段 13.2.4 建模阶段 13.2.5 评估阶段 13.2.6 节假日和工作日的比较分析
7/25
2014-10-15
13.2.1 商业理解