电商运营中个性推荐规则

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

个性推荐规则

①用户身份信息维度

性别,年龄,星座,居住城市,活跃区域,证件信息,学历,收入,健康等。

②用户社会生活信息维度(第三方平台帐户登录)

行业,职业,是否有孩子,孩子年龄,车辆,住房性质,通信情况,流量使用情况……

③用户行为偏好信息

是否有网购行为,风险敏感度,价格敏感度,品牌敏感度,收益敏感度,产品偏好,渠道偏好……

④用户购物偏好信息

品类偏好,产品偏好,购物频次,浏览偏好,营销广告喜好,购物时间偏好,单次购物最高金额……

⑤用户反馈信息维度

用户参与的活动,参与的讨论,收藏的产品,购买过的商品,推荐过的产品,评论过的产品……

用户画像标题体系设计

推荐系统评测十大指标:

用户满意度:适用的实验方法为用户调查法与在线测试法,区别于统计指标,度量用户满意度。

预测准确度:度量一个推荐系统活着推荐算法预测用户行为的能力,这个指标时最重要的推荐系统离线评测指标。

覆盖率:描述一个推荐系统对物品常委的发掘能力,最简单的定义为推荐系统能够推荐出来的物品占总物品集合的比例。

多样性:为满足用户广泛的兴趣,推荐列表需要能够覆盖用户不同的兴趣领域,多样性描述了推荐列表中物品两两之间的不相似性。

新颖性:衡量推荐系统推荐用户以前没听说过的物品的能力。

惊喜度:区别于新颖性,指的是推荐结果和用户历史兴趣不相似,但却让用户觉得满意的能力,目前没有什么工人的惊喜度指标定义方法,只有一种定性的度量方式。

信任度:衡量推荐系统是否得到用户信任,增加用户和推荐系统交互的能力,智能通过问卷调查的方式获得。

实时性:包括两个方面,一是推荐系统需要实时地更新推荐列表来满足用户新的行为变化,第二方面时推荐系统需要能够将新加入系统的物品推荐给用户。

健壮性:度量推荐系统抗攻击能力的评测指标,通过比较攻击前后推荐列表的相似度评测算法的健壮性。

商业目标:度量推荐系统服务商业盈利目标的能力的评测指标。

这十个指标高度的概括的推荐系统的衡量指标,具有抽象性,需以此为基础,将这些指标具化,跟自己的业务、产品结合起来落地实现。

一.根据推荐系统架构制定相应指标

一个推荐系统,至少分为数据层、召回层、排序层、重排序层以及业务层。根据系统框架制定各层指标是建立完善的数据指标体系的思路。

数据层拆分为用户画像、物品画像和用户行为数据,数据的准确性、完整性不仅仅决定一个推荐系统是否能够良好运转,同时也是产品其他模块以及运营依赖的重要底层数据,针对数据层的指标可以单独拿出来作为一个独立的区别于推荐系统、服务与整个产品的模块分析,这里暂不展开。

召回层

作为物品初步过滤的模块,最主要的衡量指标就是召回率。

召回率:召回的相关物品/数据库内的相关物品总量。

召回率在策略里出现频率之高大家早就明白,但在实际操作过程中需要区分整体召回与各算法各数据库的召回。

召回层会应用到多种方法以及策略,每一种方法和策略都需要对应的召回率,以此衡量每种算法的召回能力。

物品在进入推荐系统之前已经根据不同维度的特征划分至不同的物品库内,例如地域库、新库、热库等,每个库的商品召回情况也需要监控。

覆盖率:除召回率,仍需考虑召回商品的全面性,可利用用户画像的用户兴趣特征与召回商品分类目分品牌匹配对比,衡量推荐召回商品的丰富程度。下文会提到,召回率覆盖率等指标贯穿整个策略始终,不仅可以衡量离线数据,线上同样需要。

排序层

排序层对物品进行打分排序,是纯粹依赖算法的排序,会应用到大量机器学习深度学习算法,评测指标是算法特有的,应用于模型的不同环节,其最终目的仍然是衡量算法模型对物品排序的准确率,常见的指标有:

AUC:统计和机器学习里面重要模型评价指标,只能用于而分类模型的评价,不过对于类似LR等对物品打分的回归模型,本质作用还是分类,依然使用auc,auc值等于roc曲线下面积,完全随机状态下,auc值=0.5。

MAE:即平均绝对误差,计算预测评分和真实评分的差异。

RMSE:即均方根误差,与MAE思路类似,对每个绝对误差首先做了平方,所以对比较大的绝对误差有更重的惩罚。

重排序层:

排序层是利用算法对召回物品进行打分排序,完全依赖算法的排序并不一定完全符合业务要求与用户体验,例如:当前排序结果是否满足用户体验的新颖性,是否满足各类物品的均衡性,是否符合当前产品发展阶段某些流量倾斜策略。重排序就是在当前排序的基础上对排序进行调整,以满足以上目的。常用做法有打散、去重、部分物品打压降权或者提升加权、随机等。

排序的目的重点在算法预估准确,重排序的目的重点在用户体验。

新颖性:借助用户画像,用户兴趣特征,如兴趣品牌、类目以及其他兴趣标签与非兴趣商品对比,衡量推荐系统挖掘用户潜在兴趣的能力。这里的指标也是指离线指标。

业务层:

业务层是推荐产品直面用户的第一线,推荐系统将结果呈现给用户,收集用户信息,接受用户反馈,从而不断调整自己的计算,实现自我更新的闭环。

推荐系统最终目的指向业务,所以推荐系统的大部分指标体系都在业务层体现。数据指标体系的框架也由业务逻辑演化而来,如产品的核心指标,活跃留存等,如漏斗模型,它广泛的应用与流量监控、产品目标转化等日常数据监控工作,同样适用于推荐系统,将各数据分层监控。以电商行业为例,用户访问推荐产品模块是转化的第一步,购买是转化的最终目的。

转化漏斗:访问-点击-收藏/加车-购买。每一层都可以从pv、uv 量拆分,如有必要可监控用户或者物品去重数据。

将这些维度的数据交叉统计,获得所需要的数据。

推荐整体指标:活跃、留存。

规模指标:pv、uv、商品曝光、点击数量等。

转化率指标:点击转化率、收藏转化率、加车转化率、下单转化率。其中纯商品维度的曝光点击数据,即ctr,是推荐产品重要监控数据。

相关文档
最新文档