客户、书籍细分(个性化or大众化)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《决策树技术在网上书店系统中的 应用》
——客户是商家争夺的焦点; ——通过决策树技术得到客户进行分析,发现客户所处的生命周期,针对处 于不同客户生命周期的客户,采取个性化的策略; ——可实现向其推荐书籍和客户保持,提高客户满意度,进而建立忠诚度, 防止客户流失; ——主要介绍ID3算法在网上书店的应用(文字略,可参见原文or我的暑假 笔记):
——因而对电子商务网站进行数据挖掘所做的主要工作是:数据准备; ——应将网站的用户点击序列保存在文本文件中,以用户ID为唯一不重 复的文件名,并利用Apriori算法的代码将其封装在ActiveX控件中,这样 有利于软件复用,并可在多种开发环境(包括ASP)中调用; PS:if将用户点击序列保存在DB中,不仅会给DB增加额外的空间,造 成表格设计的复杂性,而且会使挖掘程序本身与网站代码和DB系统的版 本和设计耦合,不利于软件复用。
有一些对促销没有作出反应的客户,处理方法: ——直接认为这些客户拒绝促销; ——把这些客户从分析中排除。
《基于分群模型的读者个性化服务 研究》
2 准备数据
具体流程: ——确定数据来源为:某财经类高校图书馆近3年读者借阅数据、图书信息 数据、图书信息调整记录、图书馆管理系统升级记录、近3年放假日期、学 生院系明细; ——数据范围:36个月; ——数据源:学校图书馆系统数据库; ——导出格式:Access2000; 建立4张表: ——借还书总表/图书总表/还书表/新书表; 借还书表的关键字段: ——正题名、索取号、读者证号、控制号、条形码、借出日期、应还日期、 限还时刻、时还时刻、借还标识、续借次数、读者姓名、操作员。
《数据挖掘技术在大型零售书店的 若干应用》
图书: 图书: ——分类(根据中国图书馆分类法的学科分类来定义); ——属性; ——供货商; ——客户资料; —— ——书店内部组织机构及其系统维护。
面向销售的数据立方体(通过该模型可对销售数据进行购物篮分析): 面向销售的数据立方体
面向销售和进货的数据立方体: 面向销售和进货的数据立方体
客户保持及流失分析: 客户保持及流失分Байду номын сангаас:
——根据对客户信息和营销数据的分析,找出哪些原因导致客户离开并且针对 其原因挽回那些有意离开的客户。
——财务原因/非财务原因; ——主动流失/被动流失。 抽取能够反映客户个人身份的背景、学历等方面的信息以及反映其交易心理的 相关信息。
图书促销分析:
——购买趋势、热销图书、降价图书、补货图书…. Eg:女性时尚类=>少儿类图书 for母亲们
《基于WEB数据挖掘技术的书店电 子商务系统的设计与实现》
购物篮分析: 购物篮分析:
——交叉销售; 图书销售表: 图书销售表: ——图书ID,时间ID,会员ID,销售数量,价格。
多维数据集: 多维数据集:
客户细分: 客户细分: ——将一个大的客户群体划分成一个个小的客户类别; 同类客户: ——拥有相似属性; 异类客户: ——拥有不同属性。
客户数据has三种类型: 三种类型: 客户数据 三种类型
1、客户基本特征数据; 2、企业促销活动数据; 3、企业交易数据。
一对一营销思想: 一对一营销思想:
要求——书店能够了解每个客户的爱好、需求,针对客户的个人特点营销不 同类型的书籍,和客户建立起长久稳定的关系。
可用分类和聚类来实现——提取“客户身份背景、购买能力、购买心理”相 关信息。
《关联规则挖掘算法及其在个性化 网站中的应用研究》
三、关联规则分析在web个性化网站中的应用
Eg:一个简单的模拟电子商务系统
3.1 电子商务网站数据挖掘
主要数据: ——客户的背景信息:主要来自于客户的登记表; ——浏览者的点击流(click-stream):主要用于考查客户的行为表现。 分析和建立模型的技术和算法: ——网站的数据挖掘与原来的数据挖掘差别并不大,很多方法和思想都可 以运用; ——不同的是网站的数据格式有很大一部分来自于点击流,与传统的数据 库格式有区别;
——利用决策树技术可以挖掘大量 的客户信息为构建预测模型,较准 确地找出符合离开因素的客户,制 定相应的方案,最大程度挽留他们。
在检查以上数据的基础上,构建用于分析的读者信息数据宽表,主要包 括: ——读者属性类数据; ——读者行为类数据; ——读者价值类数据; ——读者交换类数据; 以下是各部分的主要变量: ——读者属性类数据:eg:读者编码、读者服务状态、读者学历、读者 喜好、读者所属学院、所属专业、读者状态、创建时间; ——读者借阅类数据:eg:理工类、财经类、电脑类、文艺类、外语类、 推荐图书类、论文类、电子图书类、各类图书借阅个数、续借次数; ——读者行为类数据:包括用户详细的行为信息:各类图书借阅的总天 数、总次数,非工作日借书次数、寒暑假借书次数,不按时还书次数、 最长欠费时长、最大欠费额度等;
销售事实表: 销售事实表: 图书资料表: 图书资料表: ——图书书号; ——书名; ——定价; ——图书类别id; ——销售编号; ——销售时间; ——POS机编号; ——店铺id; ——图书书号; ——销售数量; 图书类别表: 图书类别表: ——图书类别id; ——类别名; ——销售码洋; 日销售表: 日销售表: ——销售日期; ——店铺id; ——图书书号; ——销售数量; ——销售码洋;