基于关联规则优化的个性化推荐系统

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于关联规则优化的个性化推荐系统
李菲
【摘要】In view of the low efficiency of processing data in current personalized recommendation system,this paper proposes a hybrid clustering association rules optimization method to realize the personalized recommendation system.The paper analysis the e-commerce personalized recommender system structure based on the Web services platform in depth,and divides the data analysis and recommen-dation algorithm into offline and online processing.This paper analyses the principle of initialization, association realization,data generation and interests mode prediction,and gives the implementation steps of the algorithm.Finally,the paper establishes a recommended books network based on hybrid clustering associated optimization platform.And the results show that the proposed method has higher recommend recommendation accuracy and efficiency,especially suitable for large data environment recommendation system.%针对当前个性化推荐系统处理数据效
率较低的问题,提出了一种混合聚类关联规则优化的个性化推荐系统实现方法。

深入分析了基于 Web网络服务平台的电子商务个性化推荐系统的结构组成,将数据分析与推荐算法实现分为离线和在线处理两部分,阐述了算法初始化、关联实现以及推荐数据集合生成和兴趣模型预测的具体原理,并给出了算法的实现步骤。

最后,基于提出的系统构建模型,建立了一种基于混合聚类关联优化的图书网络推荐平台。

实验结果表明,该方法具有较高的推荐精度和推荐效率,更适合大数据环境的推荐系统。

【期刊名称】《内蒙古师范大学学报(自然科学汉文版)》
【年(卷),期】2016(045)004
【总页数】6页(P515-520)
【关键词】电子商务;个性化推荐系统;关联规则;临近聚类
【作者】李菲
【作者单位】广西财经学院信息与统计学院,广西南宁 530003
【正文语种】中文
【中图分类】TP391
随着电子商务技术的快速发展,智能化客户推荐系统逐渐成为现代电商技术关注的热点,其主要思想就是利用客户在网页浏览及注册信息提供了数据,对客户兴趣进行建模分析,并对潜在的消费可能性进行预测和推荐[1].由于该方法能够实现线上商品最大化的推荐服务,通过单对单的推荐服务有效提升了客户的稳定度,受到了广泛关注.随着电子商务系统规模的不断拓展,数据信息庞大,客户兴趣模型的精确性以及推荐系统的及时性和效率都受到了前所未有的挑战[2-3].目前,针对电子商务推荐系统的研究主要集中在用户建模和个性数据聚类分析方面.文献 [4] 提出了基于特征向量集合的用户聚类建模方法,通过动态演进算法分析了模型的精确性; 文献 [5] 提出了评价恶意攻击用户的数据聚类分析方法和评价指标; 文献 [6] 基于扩散相似性原理,提出了一种相似数据融合方法; 文献 [7] 采用C4.5分类器进行数据特性的分类描述.虽然这些方法都在一定的应用环境中实现了很好的个性化推荐,但是在广泛互联大数据环境下,推荐精度较差,缺乏实时性.文献 [8] 针对大数据信息处理方式,提出了一种基于关联的推荐系统,虽然实现了大数据情况下的有效处理,但是启动方式简
单,导致系统容易陷入瘫痪.为此,本文提出一种基于临近聚类处理的用户兴趣模型关联优化算法,将数据分析与推荐算法实现分为离线和在线处理两部分,从而提高搜索系统的精度和效率.
1.1 推荐系统模型分析
充足的数据资源式设计系统模型的基础,目前获取用户信息数据的主要手段包括主动显示和被动隐式两种[9].其中,主动显示方式需要客户的主动参与,容易导致客户厌烦、甚至离开推荐平台,存在客户丢失的潜在风险,对于大数据智能处理系统而言,存在滞后信息缺陷; 被动隐式获取,不需要客户的参数,在数据挖掘技术的基础上,利用客户的流连历史距离,通过日志的形式与数据交易中心进行兴趣建模,然后提出相应的特征信息.目前的研究中多数采用被动隐式的数据获取方式.目前常用的基于Web 服务平台的挖掘技术实现的个性化推荐系统结构图可以表示为如图1所示[10].
从图1可以看出,标准的个性化推荐系统主要由前段客户信息模块、主机平台管理模块和终端推荐模块三部分组成.由于本文主要是在Web服务平台上进行数据关联分析和处理,为提升推荐系统的实时性,将系统划分为在线处理模块和离线处理模块,如图2所示.在线处理模块主要是通过网络服务信息,获取客户浏览数据.离线处理主要是通过获取的数据信息,进行关联、聚类分析,建立客户兴趣模型,为后期个性化推荐提供估计和预测手段.
1.2 在线模块功能分析
在线模块的主要功能就是数据集合的建立,通过网络平台(本文主要是基于Web服务器)实时记录客户访问网站信息以及浏览商品信息,并以数据列的形式形成初始化的客户数据集合,同时,将相应的网页和网址信息作为附属信息添加到相应推荐序列的低端,作为推荐系统的部分自推荐连接.根据在线模块的主要功能,可以将其划分为客户前段、网络服务器、会话对象、商品集合以及实时交互等模块,如图3所示.
1.3 离线模块功能分析
与离线模块关联性最大的就是各种可行的建模分析及算法实现,在前期在线模块获取的数据集合基础上通过数据挖掘技术,进行模式分类、选择和建模,在建立客户兴趣模型的基础上,判断并实现购物习惯及兴趣的预测和估计,实现实时的在线推荐.具体的实现流程如图4所示,通过在线处理模块,将实时估计和预测的个性化结果,上传引擎实现个性化实时推荐服务.
根据图1所示的个性化推荐系统的结构组成,本文在遵循基本Input-Process-Output处理过程的基础上,提出了一种如图5所示的聚类关联优化推荐构架模式,按照离线处理、在线引擎的实现方式,该构建组要包含聚类分析、协同过滤(主要包括聚类判断、规则分析)、个性化推荐以及网络引擎实现四个基本步骤.
2.1 关联初始化
分析前段数据信息的主要目的是为了建立用户的兴趣模型,本文在文献[11]的基础上,采用混合聚类优化的方法进行兴趣建模分析.假设用户兴趣评分采用0-5的数字表示,量化间隔为0.5,则针对11个兴趣标准的混合聚类规则为: (1) 如果客户购买商品,给定的评价为score,则Ru,k=score,如果没有评价,则有Ru,k=3; (2) 如果浏览商品的次数为n,则Ru,k=n×0.5,若Ru,k>5,则Ru,k=5,否则Ru,k=0; (3) 时间与评价指标的关系为
.
基于上述混合聚类关联的实现方法中,可以将用户的兴趣模型表示为m×n矩阵,其中,m、n分别表示用户和商品的个数,k为客户感兴趣的商品,或者已经购买,或者尚未购买.矩阵的具体计算参考文献 [12].
2.2 聚类关联实现
在图5所示的推荐系统构架基础上,可以将聚类混合关联的推荐模型进一步细化为图6,可以看出,数据处理和数据形成与用户的衔接模块主要就是临近聚类和关联优化方法.
为了实现推荐系统的智能化处理,解除客户主动参与的约束,本文采用基于余弦函数相似性关联计算规则,文献[13]给出了详细的原理分析.其主要原理就是根据余弦夹角的大小来度量用户兴趣模型的相似性.(i,j)用户的相似性sim(i,j)可以计算为
.
在获取用户(i,j)前段历史信息的基础上,可以将混合聚类关联的实现步骤描述为
输入信息: 用户(i,j)的评价数据集;
输出信息: sim(i,j)
软件编程步骤:
step1: (i,j)合法性判断;
step2: 令(xy)=0,设定商品数目总和n,根据式(1)初始化系统参量;
step3: 根据式(2)计算和sin(xy)的值:
for 客户数据集合
do
x=i1;y=j1;
if x,y
sum(x,y)+=x*y;
sum(x2)+=x*x;
sum(y2)+=y*y;
end if
end do
return sum(x,y)/(sqrt(sum(x2))*sqrt(sum(y2)));
将计算结果进行有序排列(一般采用降序),根据需求个数选择临近目标进行处理分析.
2.3 推荐数据生成
基于数据集合实现有效的关联预测以后,需要进行个性化兴趣的预测计算,主要的计
算目标就是客户兴趣商品的评分标准,其计算公式为
.
式中: u、Tu分别为兴趣客户和关联客户集合; n,i为兴趣客户对商品的评分;
sim(u,n)为两者的关联相似度; n分别表示两者的评分.
为进行推荐效率的比较,在构建的平台基础上,提供了单客户的累积访问数据信息,通过关联处理,建立相应的模型,并对在线实时预测兴趣的精度(与客户实际需要的图书信息)和推荐时间进行了分析,并分析结果同现有的方法进行了对比,具体的实验结果如图10和图11所示.从图10中可以看出,随着数据量的增加,三种方法的推荐精度都有所增加,但是本文方法收敛精度的时间较快,在后续数据量增加的基础上基本上保持了平稳的趋势,这样的收敛性能更有利于大数据平台的处理,这一点可以从图11中的推荐时间看出,随着数据信息的增加,文献[11]和文献[12]的方法消耗的时间明显增加,但是,本文方法在后续数据增加的情况下,需要消耗的时间明显区域平稳,主要原因就是本文采用了混合聚类关联的方法,一旦数据集合形成了聚类群,区域收敛状态,后续的数据将会按照聚类关联的规则划分到各个子模块进行分析,大幅度降低了数据的处理需求,而其他两种方法需要进行全部数据的关联处理,推荐时间明显高于本文方法.
针对大数据情况下的电子商务个性化推荐系统存在问题,本文详细分析了基于Web 网络服务平台的电子商务个性化推荐系统的结构组成,将数据分析与推荐算法实现分为离线和在线处理两部分,并提出了一种基于临近聚类处理的用户兴趣模型关联优化算法.并对具体的实现程序进行了详细的说明和推导,给出了算法的实现步骤.最后,在提出的构建模型基础上,搭建了一套图书个性化推荐系统,并对推荐系统的精度和效率问题进行了分析.可以看出,本文提出的个性化推荐系统具有潜在的大数据处理优势,为未来的大数据个性化推荐系统提供了一种有效的解决方法.
【相关文献】
[1] 易明. 基于Web挖掘的电子商务个性化推荐机理与方法研究 [D]. 武汉:华中科技大学经济管理学院,2006.
[2] 郭艳红. 推荐系统的协同过滤算法与应用研究 [D]. 大连:大连理工大学管理工程学院,2008.
[3] 黎星星,黄小琴,朱庆生. 电子商务推荐系统研究 [J]. 计算机工程与科学,2004(5):33-36.
[4] 徐立宇. 基于Web的数据挖掘技术研究及其应用 [J]. 电脑知识与技术,2009(8):44-46.
[5] CHIRITA P A,NEJDL W,ZAMFIR C. Preventing shilling attacks in online recommender systems [C]//Proceedings of the 7th Annual ACM International Workshop on Web Information and Data Management. New York:ACM Press,2005.
[6] SU Xue-feng,ZENG Hua-jun,CHEN Zheng. Finding group shilling in recommendation system [C]//Proceedings of the 14th International Conference on World Wide Web.New York,USA:ACM Press,2005.
[7] BURKE R,MOBASHER B,WILLIAMS C,et al. Detecting profile injection attacks in collaborative recommender systems [C]//Proceedings of the 8th IEEE International Conference on E-Commerce Technology and The 3rd IEEE International Conference on Enterprise Computing,E-Commerce,and E-Services (CEC/EEE’ 06). Washington D
C,USA:IEEE Computer Society,2006.
[8] O’MAHONY M P,HURLEY N,KUSHMERICK N,et al. Collaborative recommendation:a robustness analysis [J]. ACM Transactions on Internet Technology,2004,4(4):44-377. [9] BURKE R,MOBASHER B,WILLIAMS C,et al. Classification features for attack detection in collaborative recommender systems [C]//Proceedings of the 12th ACMSIGKDD International Conference on Knowledge Discovery and Data Mining. New York,USA:ACM Press,2006:198-201.
[10] 王国胤. Rough集理论与知识获取 [M]. 西安:西安交通大学出版社,2001.
[11] 邹瑞芝,罗可,曾正良. 基于粗糙集理论的决策树分类方法 [J]. 计算机工程与科
学,2009,31(10):112-114.
[12] 何发镁,王旭仁. 基于检测响应的安全协同推荐系统研究 [J]. 微计算机信息,2010,26(6):1-2.
[13] 马小龙. 基于协作过滤算法的电子商务个性化推荐系统的研究 [J]. 微型机与应
用,2014,33(15):13-15.。

相关文档
最新文档