浅析电子商务个性化推荐技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

浅析电子商务个性化推荐技术

【摘要】随着互联网的普及和电子商务的发展,电子商务系统在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。电子商务推荐系统利用人工智能、统计学、数据挖掘等技术,直接与用户交互,帮助用户更好、更快的找到需要的商品。本文着重介绍并分析了目前常用的几种个性化推荐技术,包括基于关联规则的推荐技术、基于最近邻居的协同过滤技术和基于内容的推荐技术。并对今后个性化推荐技术的研究热点和发展方向进行了展望。

【关键词】个性化;推荐技术;电子商务

1 电子商务推荐系统的概念

电子商务推荐系统定义为:利用电子商务网站向用户提供商品信息和建议,帮助客户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。它是一个基于客户网上购物的以商品为推荐对象的个性化推荐系统,为客户推荐符合其兴趣爱好的商品。分析客户的消费偏向,向每个客户具有针对性地推荐的产品,帮助客户从庞大的商品目录中挑选真正适合自己需要的商品。电子商务推荐系统在帮助了客户,提高了客户对商务活动的满意度。同时,还能将电子商务网站的浏览者转变为购买者,提高电子商务网站的交叉销售能力,提高客户对电子商务网站的忠诚度,从而换来对电子商务站点的进一步支持。

2 电子商务推荐系统的关键技术分析

电子商务推荐系统主要由三大部分构成:输入模块、推荐方法模块和输出模块。输入模块用来接受用户的输入信息,用户的输入信息中最重要的是用户对项目的评价(rating)数据;推荐方法模块用来根据一定的算法和用户数据,得出对目标用户的推荐,该模块是整个推荐系统的核心部分,个性化推荐方面的研究的很大一部分,都集中在找到好的推荐方法。输出模块主要是指得到的推荐以何种形式反馈给用户。

电子商务推荐系统使用的技术主要有:内容推荐技术、关联规则,聚类,Horting图,协同过滤技术等。

2.1 基于关联规则的推荐技术

关联规则可以寻找在同一个事件中出现的不同项的相关性,比如在客户所购买不同商品之间的相关性。利用这些关联,就可以得到客户的购买特性,并根据发现的这些规律采取有效的行动。这对店铺的市场定位、商品的采购等决策问题都有重大的指导意义。同时,也能为商品推荐提供帮助。

关联规则的目标是在数据项目中找出所有的并发关系,这种关系也称为关

联。关联规则有三个度量。支持度反映在交易数据中发现该规则的频繁程度,置信度说明当“如果”部分为真时“那么”部分也为真的频繁程度[2]。比如手机一外壳规则,其支持度为15%表明15%的客户同时购买了手机和外壳,置信度为85%表明在所有购买手机的客户中,有85%的人也购买了外壳。而提升度反映在预测结果方面,规则比只是首先假设该结果会好多少,它是关于该规则工作情况的很好度量。这了挖掘出有意义的关联规则,一般都需要提供最小支持度和最小置信度。

关联规则挖掘问题可以分为两个子问题:

i)找出事务数据库中所有大于等于用户指定的最小支持度的频繁项集;

ii)利用频繁项集生成所有的关联规则,根据用户设定的最小置信度进行取舍,最后得到强关联规则。

(1)关联规则的定义:关联规则就是在一个交易数据库中统计购买了商品集X的交易中有多大比例的交易同时购买了商品集Y,得到的关联规则表示为:X=>Y[s%,c%]

s表示关联规则的支持度,c表示关联规则的置信度。

关联规则的发现算法很多,如Apriori,AprioriTid,DHP,FP-tree等。

(2)关联规则的算法过程

i)使用关联规则发现算法找出所有满足最小支持度和最小置信度的关联规则R;

ii)找出R中所有被客户支持的关联规则R1,即关联规则左边的所有商品都被客户购买;

iii)找出被关联规则R1所预测并且没有被客户所购买的所有商品P。

根据P中商品在关联规则R1中的置信度排序,如果某商品被多个规则预测,则取置信度最大者作为排序依据,挑选前N个商品作为算法输出。

2.2 基于最近邻居的协同过滤技术

通过比较用户之间喜好的相似性,使用统计技术寻找与目标客户有相同喜好的邻居;然后根据目标客户多个邻居的观点产生向目标客户的推荐。

基于最近邻居的协同过滤算法主要分为三个阶段:

(1)对用户已经购买的商品进行建模

用m*n阶客户-商品矩阵表示,Ri,j=1,如果第i个客户购买了第j件商品;Ri,j = 0,如果第i个客户没有购买第j件商品。

通过奇异值分解将m*n阶客户-商品矩阵变换为m*k阶矩阵,这种表示称为降维表示,可以部分解决原始表示存在的稀疏性、缩放性和同义词问题。

(2)寻找目标客户所对应的邻居

邻居形成阶段:关键在于计算客户之间的相似性。

目标客户:对于每个客户u,找到它的l个邻居N={N1,N2,…,Nl},使得sim(u,N1)最大,sim(u,N2)次之,……。

(3)从目标客户的邻居中产生N项产品推荐

由目标客户的邻居产生N件商品推荐,可以采用如下两种不同方法产生推荐:

i)最频繁项目推荐:扫描目标客户每一个邻居的购买数据,对其购买的商品进行计数,选择出现频率最高且目标客户没有购买的前N件商品最为推荐结果;

ii)基于关联的推荐:类似于前面介绍的基于关联规则的推荐算法,只是将目标客户的邻居作为算法的输入。

2.3 基于内容的推荐技术

基于内容的推荐起源于信息检索领域,它利用资源和用户兴趣的相似性来过滤信息。首先分析项目的内容,根据用户评价过的项目建立用户的兴趣模型,即用户描述文件。根据用户描述文件的不同又可以分为基于向量空间模型的推荐、基于关键词分类的推荐、基于领域分类的推荐和基于潜在语义索引的推荐。

为了更好地区别用户兴趣之间的差异,曾春等提出了一种基于概率模型的文本推荐方法,把用户兴趣文件表示为用户对不同领域感兴趣的概率,先建立一个领域分类模型,然后计算所有文档和用户在这个分类模型上的概率分布,用该概率分布来表达文档和用户兴趣[2]。基于内容的推荐利用资源和用户兴趣的相似性来过滤信息。首先分析项目的内容,根据用户评价过的项目建立用户的兴趣模型,即用户描述文件。根据用户描述文件的不同又可以分为基于向量空间模型的推荐、基于关键词分类的推荐、基于领域分类的推荐和基于潜在语义索引的推荐。这种方式直接、简单,推荐结果易于解释。可以体现用户兴趣的多样性,而且由于用户感兴趣领域的个数远小于关键词的个数,算法的运算速度也得到了提高。

3 电子商务个性化推荐技术发展展望

相关文档
最新文档