基于模糊聚类的可扩展的协同过滤算法研究

合集下载

基于模糊权重相似性的协同过滤算法研究

基于模糊权重相似性的协同过滤算法研究

基于模糊权重相似性的协同过滤算法研究张雅科【摘要】在传统协同过滤算法中,相似度直接依据用户评分.但是,用户评分会受各种不确定因素影响.采用数值评分的推荐系统收集到的用户喜好信息是模糊、不精确和不完整的.单一的数值不能包含丰富的信息来表达用户喜好,也会导致推荐结果的不准确性.文中定义了几种模糊集的隶属函数,提出了基于模糊逻辑的相似度计算方法.实验结果表明,基于模糊权重的相似度有效的提高了推荐系统的预测准确度,一定程度上解决了协同过滤算法的可扩展性和数据稀疏性问题.【期刊名称】《电子科技》【年(卷),期】2015(028)007【总页数】4页(P111-114)【关键词】推荐系统;协同过滤;相似度;模糊权重【作者】张雅科【作者单位】西安电子科技大学数学与统计学院,陕西西安710071【正文语种】中文【中图分类】TP273互联网作为信息时代的基础平台,承载了大量的信息资源。

面对海量的信息资源,用户无法筛选出对自己有用的信息,这就是信息过载(Information Overload)问题[1]。

为了解决信息过载问题,推荐系统应运而生。

与传统的信息过滤技术搜索引擎相比,推荐系统无需用户提供搜索的关键词,而是通过分析用户历史行为记录发现用户潜在爱好,从而产生推荐,满足用户的个性化需求。

协同过滤推荐算法是推荐系统的主流算法,这种算法的基本思想是:用户会喜欢(不喜欢)与他兴趣相同(不同)的用户所喜欢的项目。

协同过滤算法主要分为基于内存的算法和基于模型的算法。

基于内存的协同过滤算法可分为基于用户的协同过滤算法(User-Based Collaborative Filtering,UBCF)和基于项目的协同过滤算法(Item -Based Collaborative Filtering,IBCF)。

两种算法的关键都在于相似度的计算,不同的相似度计算方法会对目标用户产生不同的邻居集,进而影响推荐结果。

文献[2]研究了评分和权重线性组合以优化相似度计算函数方法,其中权重通过遗传算法(Genetic Algorithm)迭代收敛到预定条件。

基于聚类的协同过滤算法的研究

基于聚类的协同过滤算法的研究

基于聚类的协同过滤算法的研究
杨文娟;金子馨
【期刊名称】《电脑知识与技术》
【年(卷),期】2018(014)016
【摘要】作为推荐系统中被普遍使用的算法之一,各大电商网站都会利用协同过滤算法来进行相应物品的推荐.对协同过滤算法来说,推荐精度和时间效率两个方面具有重要的研究价值.因此,如何结合这两方面的优势,从而能设计一种时间效率较高,并且推荐精度很好的协同过滤推荐算法是一个很好的研究方向.为了应对大数据时代的信息量过大的问题,聚类算法与协同过滤算法的结合屡见不鲜.基于此,本文主要就各种聚类算法之间的不同,对聚类算法与协同过滤算法的不同结合方式进行了深入的讨论,并就此进行了实验对比分析.
【总页数】4页(P185-188)
【作者】杨文娟;金子馨
【作者单位】合肥工业大学计算机与信息学院,安徽合肥230009;合肥工业大学计算机与信息学院,安徽合肥230009
【正文语种】中文
【中图分类】TP393
【相关文献】
1.基于聚类分析的协同过滤算法研究 [J], 颜颖;
2.基于聚类分析的协同过滤算法研究 [J], 颜颖
3.基于用户兴趣和双重聚类融合的协同过滤算法的优化研究 [J], 翟烁
4.基于BiasSVD和聚类用户最近邻的协同过滤算法研究 [J], 李佳; 张牧
5.基于BiasSVD和聚类用户最近邻的协同过滤算法研究 [J], 李佳;张牧
因版权原因,仅展示原文概要,查看原文内容请购买。

基于SVD与模糊聚类的协同过滤推荐算法

基于SVD与模糊聚类的协同过滤推荐算法

基于SVD与模糊聚类的协同过滤推荐算法
林建辉;严宣辉;黄波
【期刊名称】《计算机系统应用》
【年(卷),期】2016(025)011
【摘要】协同过滤为个性化推荐解决信息过载问题提供了方案,然而也存在着数据的稀疏性、可扩展性等影响推荐质量的关键问题.我们提出了一种基于奇异值分解(SVD)与模糊聚类的协同过滤推荐算法,通过引用物理学上狭义相对论中能量守恒的方法以保留总体特征值的数目,较为准确地确定降维维度,实现对原始数据的降维及其数据填充.另外,再运用模糊聚类的方法将相似用户进行聚类,从而达到减少邻居用户搜索范围的目的.在MovieLens与2013年百度电影推荐系统比赛等不同数据集上的实验结果表明,该算法能够提高推荐质量.
【总页数】8页(P156-163)
【作者】林建辉;严宣辉;黄波
【作者单位】福建师范大学数学与计算机科学学院,福州350007;福建师范大学数学与计算机科学学院,福州350007;福建师范大学数学与计算机科学学院,福州350007
【正文语种】中文
【相关文献】
1.基于SVD与层次聚类的协同过滤推荐算法实现 [J], 徐泽兵;王忠
2.基于SVD的协同过滤推荐算法研究 [J], 黄丽
3.基于SVD与层次聚类的协同过滤推荐算法实现 [J], 徐泽兵[1];王忠[1]
4.基于改进的BiasSVD和聚类用户最近邻的协同过滤混合推荐算法 [J], 刘超;赵文静;贾毓臻;蔡冠宇
5.缺失数据下基于SVDIFC的协同过滤推荐算法 [J], 纪成君;李蕊;王仕勤
因版权原因,仅展示原文概要,查看原文内容请购买。

《基于聚类专家选择的协同过滤推荐算法研究》

《基于聚类专家选择的协同过滤推荐算法研究》

《基于聚类专家选择的协同过滤推荐算法研究》一、引言随着互联网技术的飞速发展,信息过载问题日益严重,用户面临着从海量数据中筛选出有价值信息的挑战。

推荐系统作为一种有效解决信息过载问题的方法,已经广泛应用于电子商务、社交网络、视频网站等领域。

协同过滤推荐算法作为推荐系统中的一种重要方法,其通过分析用户行为数据,发现用户之间的兴趣相似性,从而为用户提供个性化的推荐服务。

然而,传统的协同过滤推荐算法在处理大规模数据时存在计算复杂度高、推荐准确度不高等问题。

因此,本文提出了一种基于聚类专家选择的协同过滤推荐算法,以提高推荐准确度和计算效率。

二、相关工作协同过滤推荐算法是一种基于用户行为的推荐方法,其基本思想是利用用户的历史行为数据,发现用户之间的兴趣相似性,然后根据相似用户的行为预测目标用户的行为。

聚类技术作为一种有效的数据挖掘方法,可以用于发现用户之间的兴趣相似性。

因此,将聚类技术与协同过滤推荐算法相结合,可以提高推荐准确度和计算效率。

目前,已经有许多研究者将聚类技术应用于协同过滤推荐算法中。

例如,有些研究者利用K-means聚类算法将用户划分为不同的兴趣组,然后在每个兴趣组内进行协同过滤推荐。

然而,这些方法忽略了不同聚类算法的适用性和有效性问题。

此外,一些方法在处理大规模数据时仍存在计算复杂度高的问题。

因此,本文提出了一种基于聚类专家选择的协同过滤推荐算法,以提高推荐准确度和计算效率。

三、基于聚类专家选择的协同过滤推荐算法本文提出的基于聚类专家选择的协同过滤推荐算法主要包括两个步骤:聚类专家选择和协同过滤推荐。

1. 聚类专家选择在聚类专家选择阶段,我们首先利用多种聚类算法对用户行为数据进行聚类分析。

具体地,我们可以选择K-means、谱聚类、DBSCAN等不同的聚类算法进行实验。

然后,我们利用一些评价指标(如轮廓系数、NMI等)对不同聚类算法的结果进行评估,选择出最佳的聚类算法和聚类结果。

这样,我们可以将用户划分为不同的兴趣组,并为每个兴趣组选择一个“专家”用户,该用户在该兴趣组内具有较高的活跃度和较好的兴趣代表性。

基于模糊聚类和改进混合蛙跳的协同过滤推荐

基于模糊聚类和改进混合蛙跳的协同过滤推荐

基于模糊聚类和改进混合蛙跳的协同过滤推荐许智宏;田雨;闫文杰;暴利花【期刊名称】《计算机应用研究》【年(卷),期】2018(035)010【摘要】由于传统的协同过滤推荐算法存在很多缺陷,如数据稀疏性、冷启动、低推荐精度等,提出了一种基于模糊聚类和改进混合蛙跳的协同过滤推荐算法.首先利用一种构造的基于时间的指数遗忘函数对原始评分数据进行处理;然后根据得到的基于时间衰退的评分矩阵对用户进行模糊C-均值(FCM)聚类,并找出与目标用户有较高相似性的前几个类作为候选邻居集;再用改进的混合蛙跳算法找到最近邻居集;最后求出目标用户对未参与项目的预测评分.经实验证明,该算法比其他一些算法的推荐精度要高,且由于数据稀疏性引起的不良影响也得到了有效的缓解.【总页数】4页(P2908-2911)【作者】许智宏;田雨;闫文杰;暴利花【作者单位】河北工业大学计算机科学与软件学院,天津300401;河北省大数据计算重点实验室,天津300401;河北工业大学计算机科学与软件学院,天津300401;河北工业大学计算机科学与软件学院,天津300401;河北省大数据计算重点实验室,天津300401;河北工业大学计算机科学与软件学院,天津300401【正文语种】中文【中图分类】TP301.6【相关文献】1.基于SVD与模糊聚类的协同过滤推荐算法 [J], 林建辉;严宣辉;黄波2.基于混合蛙跳模糊聚类的电子商务协同过滤推荐 [J], 邵琳琳3.基于改进的BiasSVD和聚类用户最近邻的协同过滤混合推荐算法 [J], 刘超;赵文静;贾毓臻;蔡冠宇4.基于改进混合蛙跳算法的个性化旅游路线推荐 [J], 申晓宁;王森林;吴俊潮;仇友辉;张磊;李常峰;王玉芳5.基于混合蛙跳联合聚类的协同过滤算法 [J], 喻金平;张勇;廖列法;梅宏标因版权原因,仅展示原文概要,查看原文内容请购买。

基于聚类技术的协同过滤优化算法

基于聚类技术的协同过滤优化算法
为图中独立的连通分量个数。
1
1
16 16
图的划分准则
(1)最小切(Min_cut)准则
cut ( A1 ,..., Ak ) i 1 cut ( Ai , Ai )
k
• 问题:
– 只考虑类外联结 – 不考虑类内密度
• 退化实例:
最优划分 最小切准则
17 17
图的划分准则
(2)率切(Ratio_cut)准则
0 0 0 0 1.7 0
x6
0 0 0 0 0 1.5
15 15
图的Laplacian矩阵
未规范化的拉普拉斯矩阵
规范化的拉普拉斯矩阵
L D W
1 2 1 2
Lsym D
1 2
LD
1 2
I D
WD
Lrw D L I D W
规范化的拉普拉斯矩阵Lsym和Lrw的特征值为0的个数即
0.8 0
14 14
度矩阵 Degree matrix(D)
n x n 对角矩阵
D(i, i ) wij : 入射到xi边权值和
j
x1 x1 x2 x3 x4 x5 x6
1.5 0 0 0 0 0
x2
0 1.6 0 0 0 0
x3
0 0 1.6 0 0 0
x4
0 0 0 1.7 0 0
x5
| Ai |=集合Ai中元素的个数
(3)规范切(Normalized_cut)准则
vol(Ai )=Σdi
平均割集准则(Min-Max-Cut) 多路规范割集准则(Multiway -Normalized-Cut)
18 18
谱聚类算法基本步骤
对数据集进行预处理,构建相似度矩阵W; 构造W的规范化拉普拉斯矩阵Lsym。对Lsym进行特征

基于蚁群模糊聚类的协同过滤推荐算法

基于蚁群模糊聚类的协同过滤推荐算法
5 6湖 南工 学 院学报 2 1 年 01
其 中, 为 目标 用 户 “对 信 息 资 源 项 _ 预 测值 . P, f的 算 法根据 与 目标用 户 相 似 的 N 个用 户 的评 价 进行 预测, 并非 所 有用 户 都参 与预 测 P 值 ,i ( ) sr , 为 e
利用 蚁群 模糊 聚类 算 法对 用 户 进 行 聚类 , 生成 若 干
P —R f +k∑sm( ) R i u, ( —R )
() 2
收 稿 日期 :0 1 0 —2 2 1- 6 9 作 者 简介 : 金 凤 (9 1 ) 硕 士 , 师 , 究 方 向 : 算 机 应用 . 黄 17一 , 讲 研 计 自动控 制 .
待 解决 的问题 : 推荐 适 合 当前 浏 览用 户 的商 品 给该 浏览 用户 , 从而 避免 用 户 由于在 过 多 的 商 品 中 找到 自己所需 商 品过 于 耗 时耗 力 而 离 开. 电子 商务 推 荐 系统 就是 解决此 类 问题 的解 决 方 案. 多 大 型 电子 许
用 户聚类 中心 , 再计 算 每个 用 户 和各 聚类 中心 的相 似性 以得 到相似 性 度量 矩 阵 ; 在线 时计 算 目标 用户 与各 聚类 中心 的相 似性 , 以 此搜 索 相 似 性 度 量矩 再 阵找 到其 最近邻 居并进 行评论 预测 , 最后 生成 推荐. 同时, 仿真 实验结 果表 明 , 本算 法在一 定程 度上 提高 了推荐 速度 和质 量.
其 中 ,。为用户 “的评 分向量 ,J I J J I 为 的长度 , 即
用户 打过分 的数 字资源数 目, R。 表示 用 户 “对项 目 _ 『的评 分.
其 次 , 算 目标 用户对 未 评 价过 的信 息 资源 项 计

基于粗集和模糊聚类的协同过滤算法

基于粗集和模糊聚类的协同过滤算法

定义 2 给定不完 备信息 系统
( A
力,M
表示 经过扩充 的可辨识矩 阵 中的第 行第 ,

列元 素 ,则经 过扩充 的可辨识矩 阵 M 定义 为 : M J )= { k a EAAa X 7a (_ Aa X l a (i  ̄k ) ): ( i ) k(i )≠ k( ) ≠ 八a ) 其 中 , j l ,…,1 ’表 示遗 失值 。 =, 2 1;“ 定义 3信 息系统 ( A /, = { 1 ,…, }是属性集 ,x∈U,定义 :MAS { k a 9 a , 2 m i a fk =
0 引 言
个性 化推荐作为一种崭新的智 能信 息服务方式 “ 以根据 用户 提 出的明确 要求,或通过用户个性 、 ,可 习惯 、偏 好的分析 ,准确地 向用户 提供感新 区的信息和服务 ,从而有效解 决信息过载和信 息迷失带来 的
种种 问题 。协 同过滤 ( o a oai Fl r g F C lb rt e iei ,C )是通过 比较用户之 间 的相似 性,把和 目标用户具有相 l v tn 似 兴趣的其他用户 的意见提供给 目标 用户完成推荐 , 目前最成功 的推荐 技术 乜 A z n和 C - w等 是 mao 。 D No 国外著名的 电子商务 网站都应用协 同过滤技术 向顾客推荐产 品,提高服务 的效率和质量 。 但 协 同过滤需要在整个用 户空间上搜 索 目标用户 的最近邻 居 ,随着 系统规模 的不断扩大 ,用户和项 目数量 急剧增加 ,最近邻协 同过滤技术面 临着评分数据稀疏 性这一 巨大挑战 。在用户评 分数据稀疏 的
( au n s)和不确 定 ( n e any V g ees U cr it)信息 的新型数 学工 具,它用等价类 的思想来研 究 问题 ,用集 合的上 t 近似和下近似 来刻 画集合 】 。

基于内容聚类的协同过滤推荐系统研究的开题报告

基于内容聚类的协同过滤推荐系统研究的开题报告

基于内容聚类的协同过滤推荐系统研究的开题报告一、研究背景及意义随着互联网的迅速发展,用户的信息获取方式不断地丰富和变化。

对于电子商务平台来说,如何为用户提供更加精准的商品推荐服务,也成为了一个亟需解决的问题。

目前,常见的推荐算法主要包括基于内容的推荐、协同过滤推荐等,但是它们各自存在着一些缺陷和局限性。

基于内容的推荐算法主要是通过分析商品的属性、标签等信息,来推荐给用户相似的商品。

虽然该算法对于个性化推荐效果较好,但是它无法很好地解决“长尾问题”,即用户对于那些较为冷门的商品可能会缺乏兴趣。

而协同过滤算法则是通过分析用户间的相似度,来推荐给用户与他们兴趣相似的商品。

该算法对于“长尾问题”的解决能力较强,但是对于新用户的冷启动问题则表现不佳。

在此背景下,基于内容聚类的协同过滤推荐系统应运而生。

该系统通过将商品进行聚类,然后利用协同过滤算法,选择商品群中与用户兴趣相似的用户群,来实现更加精准的商品推荐服务。

该算法既考虑了商品的相似性,又考虑了用户的相似性,能够更好地解决个性化推荐和“长尾问题”,因此具有广泛的应用前景和研究意义。

二、研究对象及内容本次研究的研究对象为基于内容聚类的协同过滤推荐系统。

研究内容主要包括以下方面:1.基于内容聚类的推荐算法首先需要对于相关的基于内容聚类算法进行研究,包括KMeans聚类算法、层次聚类算法以及DBSCAN聚类算法等。

研究这些算法的原理、优缺点等,为后续的推荐算法提供基础。

2.协同过滤算法基于内容聚类的协同过滤算法的核心是协同过滤算法,因此需要对于相关的协同过滤算法进行深入的研究,包括基于用户的协同过滤算法、基于商品的协同过滤算法等,从而为后续的推荐算法提供支持。

3.基于内容聚类的协同过滤推荐系统基于以上两个部分的研究,需要进一步构建基于内容聚类的协同过滤推荐系统,并进行实验验证,以评估该算法的推荐效果和性能等。

三、研究方法本次研究采用实验研究法,通过采集商品数据,对于基于内容聚类的协同过滤推荐系统进行设计和构建,并在实验平台上进行验证和评估。

模糊聚类算法在推荐系统中的应用 以协同过滤算法为例

模糊聚类算法在推荐系统中的应用 以协同过滤算法为例
模糊聚类算法在推荐系统中的应用 —以协同过滤算法为例
大纲
一. 背景知识及研究现状 二. 基于FCMC有效性的CF算法 三. 实例研究 四. 展望与问题
2
一. 背景知识及研究现状
3
一. 背景知识及研究现状(1/8)
协同过滤推荐
用户通过和他的邻居用户协作来 过滤出他感兴趣的物品 • 协同过滤(Collaborative Filtering)也可叫做“协作型过滤”。
10

同时属于几个类,采用硬聚类 算法K-Means算法很难符合实 聚类算法在推荐系统中的研究现状 际情况 •确定最佳的聚类数目k,需要 计算不同聚类数目下的推荐评 价指标,也增加了计算复杂度
一. 背景知识及研究现状 (8/8) •在实际应用中一个项目可能
使用K-means方法对用户或是项目聚类,减少了寻找最近 邻的开销(Tsi CF, Hung C,2012;Pham M C, Cao Y,2011)
| pi qi | n
正确推荐 的物品数 量
n
p
a ac
被推荐
感兴趣
不感兴趣
召回率 (Recall)、
a b
c d
r
a ab
未推荐
8
一. 背景知识及研究现状(6/8) 协同过滤存在的问题
“稀疏性”问题 • 随着推荐系统 用户和项目数量的增加 ,由于用户 评价过 的项目 占全体项目数量的 比例很小 ,无法产生精确的推 荐。 “扩展性”问题 • 随着用户和项目数不断增加,协同过滤算法的 复杂度 剧 增,传统协同过滤算法无法迅速实时地为用户做出推荐。 • 当新用户或 新项目进入系统时 ,由于缺乏用户或项目的评 “冷启动”问题 价资料与历史偏好,无法为新用户推荐或推荐新物品。

《2024年基于协同过滤和深度学习的混合推荐算法研究》范文

《2024年基于协同过滤和深度学习的混合推荐算法研究》范文

《基于协同过滤和深度学习的混合推荐算法研究》篇一一、引言随着互联网技术的迅猛发展,信息过载问题日益突出。

在这样的背景下,推荐系统作为一种解决信息过载问题的有效手段,得到了广泛的研究和应用。

其中,混合推荐算法融合了多种推荐技术,可以更好地平衡推荐准确性和用户满意度。

本文将重点研究基于协同过滤和深度学习的混合推荐算法,探讨其原理、优势及在实践中的应用。

二、协同过滤推荐算法协同过滤是一种基于用户行为的推荐算法,其核心思想是利用用户的历史行为数据,找出与当前用户兴趣相似的其他用户,然后根据这些相似用户的喜好信息为目标用户生成推荐。

协同过滤推荐算法主要包括基于用户的协同过滤和基于项目的协同过滤两种方法。

基于用户的协同过滤主要是通过计算用户之间的相似性,找出与目标用户兴趣相似的其他用户,然后根据这些相似用户的喜好为目标用户生成推荐。

然而,这种方法在处理大规模数据时计算复杂度较高。

基于项目的协同过滤则是通过计算项目(如电影、商品等)之间的相似性,然后根据目标用户的喜好项目和其他项目的关系为其推荐相似的项目。

这种方法可以有效处理稀疏性问题,但在处理高维度数据时可能效果不佳。

三、深度学习推荐算法深度学习在推荐系统中也有广泛的应用。

深度学习可以通过学习高维非线性关系,从原始数据中提取出有用的特征信息,从而更好地捕捉用户的兴趣和需求。

常见的深度学习推荐算法包括基于深度神经网络、卷积神经网络和循环神经网络等。

深度神经网络可以通过多层神经元的学习和调整,从原始数据中提取出高层次的特征信息,从而更好地进行推荐。

卷积神经网络则可以处理具有局部依赖性的数据,如图像和文本等。

循环神经网络则可以处理具有时间序列特性的数据,如用户的浏览历史和购买记录等。

四、基于协同过滤和深度学习的混合推荐算法混合推荐算法将协同过滤和深度学习两种算法进行融合,以充分利用各自的优势。

本文提出一种基于用户历史行为数据的协同过滤和深度神经网络的混合推荐算法。

基于模糊C均值聚类有效性的协同过滤算法

基于模糊C均值聚类有效性的协同过滤算法

基于模糊C均值聚类有效性的协同过滤算法葛林涛;徐桂琼【期刊名称】《计算机技术与发展》【年(卷),期】2016(000)001【摘要】针对电子商务系统中传统协同过滤算法普遍存在的稀疏性和扩展性问题,文中提出了基于模糊 C 均值聚类有效性的协同过滤算法。

首先依据四种不同的聚类有效性函数确定合理的聚类数区间,并在合理聚类数区间中根据 Xie-Beni方法搜寻得到最佳的聚类数,然后使用最佳聚类数对项目进行模糊 C 均值聚类,将用户对单个项目的偏好转化为对相似群组的偏好,将稀疏的用户-项目偏好信息构造成密集的用户-模糊类的偏好信息,最后在项目所属类别中寻找目标用户的最近邻并产生推荐。

在数据集 MovieLens 上与传统推荐算法相比的实验结果表明,新算法在平均绝对偏差、召回率、准确覆盖率等方面都有了较大改善,提高了推荐质量。

%Considering the sparsity and the scalability of traditional collaborative filtering recommendation algorithms in electronic com-merce system,a new collaborative filtering algorithm is presented based on fuzzy C-means clustering validity. Firstly,a reasonable cluster number range is presetted,and then an optimal cluster number is determined based on some representative fuzzy clustering validity func-tions and Xie-Beni method. Secondly,using the optimal number of cluster,this algorithm transforms the users’ preferences of single item to similar groups with fuzzy C-means clustering,and sparse user-item preferences is establishedto dense user-fuzzy preferences. Finally, according to the item’s cluster itfinds the nearest neighbors of the object user and generates recommendations. The experimental results in MovieLens show that the new algorithm improves recommendation quality in MAE,recall and coverage.【总页数】6页(P22-26,32)【作者】葛林涛;徐桂琼【作者单位】上海大学管理学院,上海 200444;上海大学管理学院,上海200444【正文语种】中文【中图分类】TP391【相关文献】1.模糊C均值聚类算法的有效性检验研究 [J], 刘来权;陈燕;雷燕瑞2.基于负序功率方向比较和模糊C均值聚类的电网故障区域识别 [J], 傅利;刘亚磊;王巍横;罗易桥3.基于自适应局部迭代滤波和模糊C均值聚类的滚动轴承故障诊断方法 [J], 张超;何闯进;何玉灵4.基于上下文模糊C均值聚类的图像分割算法 [J], 徐金东;赵甜雨;冯国政;欧世峰5.基于改进模糊c均值聚类中心优化算法的负荷分类方法 [J], 乔新东;刘林林因版权原因,仅展示原文概要,查看原文内容请购买。

基于模糊聚类的协同过滤算法

基于模糊聚类的协同过滤算法

————————————基金项目基金项目::国家自然科学基金资助项目(61003022, 71271126);上海高校青年教师培养资助计划基金资助项目作者简介作者简介::王明佳(1987-),女,博士研究生,主研方向:信息推荐技术,电子商务;韩景倜,教授、博士生导师;韩松乔,讲师、博士 收稿收稿日期日期日期::2011-11-11 修回日期修回日期::2012-01-04 E-mail :xinxin650@基于基于模糊聚类的协同过滤算法模糊聚类的协同过滤算法王明佳1,2,韩景倜1,韩松乔1(1. 上海财经大学信息管理与工程学院,上海 200433;2. 上海商学院,上海 200235)摘 要:针对传统协同过滤算法普遍存在的稀疏性和扩展性问题,提出一种基于模糊聚类的协同过滤算法。

利用模糊聚类的方法对项目进行聚类,通过用户-项目评分矩阵计算用户之间的相似度,从中选出与用户最相似的前k 个用户,根据这k 个用户对当前用户的未评分项目的打分进行预测,选出前n 个推荐。

实验结果证明,与基于用户的协同过滤算法相比,该算法能提高冷启动问题下的相似度计算精度。

关键词关键词::电子商务;推荐系统;模糊聚类;协同过滤;推荐精度Collaborative Filtering Algorithm Based on Fuzzy ClusteringW ANG Ming-jia 1,2, HAN Jing-ti 1, HAN Song-qiao 1(1. School of Information Management and Engineering, Shanghai University of Finance and Economics, Shanghai 200433, China;2. Shanghai Business School, Shanghai 200235, China)【Abstract 】To deal with the sparsity and expansibility of traditional collaborative filtering algorithm, which affects the accuracy of their recommendations, a collaborative filtering algorithm based on fuzzy cluster is proposed in this paper. It applies fuzzy clustering method to cluster the item, and computes the similarity between the users by analyzing the average ratings that the k users rate the items of the clusters. It predicts the ratings of the items that the k users rate based on the ratings of the neighbors that they rate, chooses the first n recommendations. Experimental result demonstrates that the algorithm can improve the accuracy of recommendation under the condition of the extreme sparsity of user rating data. 【Key words 】e-commerce; recommendation system; fuzzy clustering; collaborative filtering; recommendation accuracy DOI: 10.3969/j.issn.1000-3428.2012.24.012计 算 机 工 程 Computer Engineering 第38卷 第24期V ol.38 No.24 2012年12月December 2012·软件技术与数据库软件技术与数据库·· 文章编号文章编号::1000—3428(2012)24—0050—03 文献标识码文献标识码::A中图分类号中图分类号::TP3121 概述电子商务推荐系统是模拟销售人员向网络客户推荐商品的系统,推荐精度的高低直接影响用户的购买量,也影响用户对该系统的信任度,信任程度的高低决定了用户对该系统的使用率,从而影响用户浏览实现了推荐功能的网站进行物品购买的次数。

基于协同过滤的算法研究

基于协同过滤的算法研究

基于协同过滤的算法研究一、本文概述随着信息技术的飞速发展,互联网已经成为人们获取信息、交流思想的重要平台。

在这个信息爆炸的时代,如何从海量的数据中快速、准确地找到用户感兴趣的信息,成为了亟待解决的问题。

协同过滤算法作为一种经典的推荐算法,因其简单有效、易于实现等优点,在各个领域得到了广泛应用。

本文旨在对基于协同过滤的算法进行深入研究,探讨其原理、应用及优化方法,以期为用户提供更加精准、个性化的推荐服务。

本文将介绍协同过滤算法的基本原理和分类,包括基于用户的协同过滤、基于物品的协同过滤以及混合协同过滤等。

通过对这些算法的分析,我们可以更好地理解其工作机制和适用场景。

本文将探讨协同过滤算法在各个领域的应用实例,如电子商务、社交网络、音乐推荐等。

通过实际案例的分析,我们可以了解协同过滤算法在实际应用中的表现和挑战。

本文将研究协同过滤算法的优化方法,包括数据稀疏性处理、冷启动问题、算法融合等方面的内容。

通过对这些优化方法的研究,我们可以提高协同过滤算法的推荐性能和准确性,为用户提供更好的服务体验。

本文将对基于协同过滤的算法进行全面而深入的研究,旨在推动该算法在实际应用中的发展和优化。

希望通过本文的探讨,能够为相关领域的研究人员和实践者提供有益的参考和启示。

二、协同过滤算法的基本原理协同过滤(Collaborative Filtering,简称CF)是一种广泛应用于推荐系统的技术,它的基本原理是:如果用户在过去的行为(如购买、浏览、评分等)与其他用户相似,那么他们在未来的行为也可能相似。

因此,协同过滤算法会基于大量用户的行为数据,找出与目标用户相似的其他用户(或称为“邻居”或“相似用户”),然后根据这些相似用户的行为来预测和推荐目标用户可能感兴趣的项目。

协同过滤算法主要可以分为两类:基于用户的协同过滤(User-Based Collaborative Filtering)和基于项目的协同过滤(Item-Based Collaborative Filtering)。

Hadoop下基于聚类协同过滤推荐算法优化的研究

Hadoop下基于聚类协同过滤推荐算法优化的研究

Hadoop下基于聚类协同过滤推荐算法优化的研究田保军;胡培培;杜晓娟;苏依拉【期刊名称】《计算机工程与科学》【年(卷),期】2016(038)008【摘要】作为重要的个性化推荐算法之一,协同过滤推荐算法有其独特的优势,但同时存在数据稀疏性、冷启动和扩展性问题.针对数据稀疏性问题,对项目相似度进行改进,利用基于项目的协同过滤对原始评分矩阵进行填充,以此降低数据稀疏性对推荐质量的影响.针对冷启动问题,采用基于用户和项目属性分别进行聚类的方法,通过聚类模型建立新用户和新项目与现有用户和现有项目之间的联系,根据对现有用户和现有项目的推荐预测新用户和新项目的推荐.针对扩展性问题,利用云平台Hadoop的MapReduce框架完成相关算法的并行化,以此解决传统协同过滤推荐算法面临的严重扩展性问题.实验表明,改进后的算法较好地解决了以上问题.【总页数】10页(P1615-1624)【作者】田保军;胡培培;杜晓娟;苏依拉【作者单位】内蒙古工业大学信息工程学院,内蒙古呼和浩特010080;内蒙古工业大学信息工程学院,内蒙古呼和浩特010080;内蒙古工业大学信息工程学院,内蒙古呼和浩特010080;内蒙古工业大学信息工程学院,内蒙古呼和浩特010080【正文语种】中文【中图分类】TP301【相关文献】1.基于Hadoop分布式改进聚类协同过滤推荐算法研究 [J], 孙天昊;黎安能;李明;朱庆生2.基于Hadoop的协同过滤推荐并行化研究 [J], 曹萍3.基于Hadoop平台的优化协同过滤推荐算法研究 [J], 申晋祥;鲍美英4.基于Hadoop平台的聚类协同过滤推荐方法研究∗ [J], 赵恩毅; 王瑞刚5.基于Hadoop的协同过滤推荐算法的研究 [J], 尹铁源; 杨慧慧因版权原因,仅展示原文概要,查看原文内容请购买。

基于用户模糊聚类的协同过滤推荐研究

基于用户模糊聚类的协同过滤推荐研究

基于用户模糊聚类的协同过滤推荐研究李华;张宇;孙俊华【期刊名称】《计算机科学》【年(卷),期】2012(39)12【摘要】传统的协同过滤算法没有考虑用户的自身信息对评分的影响,存在的数据稀疏性、扩展性差等弊端直接影响了推荐系统的推荐质量.对此提出了一种基于用户情景模糊聚类的协同过滤推荐算法.首先根据用户情景信息利用模糊聚类算法得到情景相似的用户群分类,然后在进行协同过滤前预先通过Slope One算法填充用户-项目评分矩阵,以有效改善数据稀疏性和实时性.实验结果表明,改进后的算法在推荐精度上有较大提高.%Traditional collaborative filtering algorithm does not consider the influence caused by the users' information, and the existing issues such as data sparsity, poor scalability and others directly affecte the recommendation quality of recommendation systems. To address these issues,a collaborative filtering algorithm based on user context fuzzy clustering was proposed. First,users are clustered by fuzzy clustering algorithm according to user context, then the user-item rating matrix should be filled through slope one algorithm in advance before the traditional collaborative filtering. This effectively improves the sparsity of user rating data and the real-time performance. The experimental results indicate that the recommendation accuracy of the advanced approach is largely improved.【总页数】4页(P83-86)【作者】李华;张宇;孙俊华【作者单位】重庆大学计算机学院重庆400044;重庆大学计算机学院重庆400044;重庆大学计算机学院重庆400044【正文语种】中文【中图分类】TP391.7【相关文献】1.基于蚁群模糊聚类的协同过滤推荐算法 [J], 黄金凤;雷筱珍2.基于用户模糊聚类的两阶段协同过滤推荐 [J], 龚松杰3.基于SVD与模糊聚类的协同过滤推荐算法 [J], 林建辉;严宣辉;黄波4.基于混合蛙跳模糊聚类的电子商务协同过滤推荐 [J], 邵琳琳5.基于模糊聚类和改进混合蛙跳的协同过滤推荐 [J], 许智宏;田雨;闫文杰;暴利花因版权原因,仅展示原文概要,查看原文内容请购买。

基于模糊聚类的可扩展的协同过滤方法

基于模糊聚类的可扩展的协同过滤方法

基于模糊聚类的可扩展的协同过滤方法
王晓军;付超
【期刊名称】《南京邮电大学学报(自然科学版)》
【年(卷),期】2017(037)001
【摘要】作为电子商务系统领域里一种重要的推荐算法,协同过滤在过去十年取得了广泛的传播和使用.但随着数据库中用户和商品数量的增长,为用户做出推荐所需的计算成本逐渐加大,可扩展性成为协同过滤面临的重要挑战.为了改善协同过滤的可扩展性,提出一种基于模糊聚类的可扩展的协同过滤方法.该方法首先根据项目特征利用模糊聚类算法对项目进行聚类,并在簇内产生潜在相似关系集合,然后将潜在相似关系集合进行分区并在各个分区内并行计算项目的相似度,最后搜索邻居并做出推荐.实验结果表明,此方法在提高协同过滤推荐系统的可扩展性上取得了一些好的结果,同时保持了较好的精确度.
【总页数】5页(P14-18)
【作者】王晓军;付超
【作者单位】南京邮电大学物联网学院,江苏南京210003;南京邮电大学计算机学院,江苏南京210023
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于信任与用户兴趣变化的协同过滤方法研究 [J], 王占;林岩
2.一种基于农产品推荐的混合协同过滤方法的设计 [J], 余明艳;支和才
3.一种基于自适应局部融合参数的协同过滤方法 [J], 程小林;熊焰;刘青文;陆琦玮
4.基于加权相似度的用户协同过滤方法 [J], 范永全;杜亚军
5.一种基于二进制语义特征向量的协同过滤方法 [J], 赵芸;徐兴
因版权原因,仅展示原文概要,查看原文内容请购买。

基于协同过滤技术的推荐方法研究共3篇

基于协同过滤技术的推荐方法研究共3篇

基于协同过滤技术的推荐方法研究共3篇基于协同过滤技术的推荐方法研究1标题:基于协同过滤技术的推荐方法研究随着互联网技术的发展,我们已经进入了大数据时代。

在海量数据的背景下,如何为用户提供精准的推荐服务成为了互联网企业需要解决的难题。

推荐系统是基于用户的历史行为、偏好和兴趣等信息预测用户未来的需求,从而为用户提供精准的个性化推荐。

目前,推荐系统已经成为各大互联网平台的标配,其中基于协同过滤技术的推荐方法因其简单、有效而备受广大研究者的关注。

协同过滤技术是推荐系统中比较成熟的技术之一,它的核心思想是利用用户历史行为数据,找到用户之间的相似性,进而对目标用户进行个性化推荐。

协同过滤技术主要分为基于用户和基于物品两种。

基于用户的协同过滤推荐算法是根据用户历史行为数据,计算用户之间的相似度,然后利用相似用户的历史行为数据为目标用户进行推荐。

而基于物品的协同过滤推荐算法是根据物品之间的相似度,为目标用户推荐与其历史行为中相似度高的物品。

无论是基于用户还是基于物品的协同过滤推荐算法,都需要先进行数据预处理和相似度计算。

在实际应用中,协同过滤推荐算法存在一些问题。

例如,数据稀疏性问题,可能存在一些用户或物品没有交互行为,导致无法计算相似度;推荐的新颖性问题,推荐系统容易陷入热门推荐或长尾推荐的困境,缺乏足够多样性的推荐结果;冷启动问题,对于新注册的用户或新上线的物品,难以为其做出准确的推荐。

针对这些问题,研究者们提出了一系列的解决方案。

针对数据稀疏性问题,我们可以采用加权的相似度计算方法,对相似度进行加权,同时考虑用户或物品的权重,从而提高推荐的准确性。

针对推荐的新颖性问题,我们可以采用基于聚类的协同过滤推荐算法,将相似的物品或用户分组,从而为用户提供更多样化的推荐结果。

针对冷启动问题,我们可以采用基于内容的推荐算法或混合推荐算法。

基于内容的推荐算法是根据物品的特征来计算相似度,从而为新物品推荐与其特征相似的物品。

基于模糊相似度的协同过滤推荐算法研究

基于模糊相似度的协同过滤推荐算法研究

基于模糊相似度的协同过滤推荐算法研究随着互联网的快速发展,海量的信息和数据涌入我们的生活。

面对如此庞大的数据量,如何对用户进行个性化推荐成为了一项重要的研究内容。

协同过滤推荐算法是目前最为流行的推荐算法之一,其能够根据用户的历史行为和偏好来进行推荐。

本文研究基于模糊相似度的协同过滤推荐算法,旨在提高推荐准确性和效率。

一、协同过滤推荐算法简介协同过滤推荐算法是一种基于相似性的推荐算法,其核心思想是利用用户历史行为和偏好来为用户推荐其可能感兴趣的物品。

该算法分为两大类:用户协同过滤和物品协同过滤。

用户协同过滤算法主要是通过挖掘不同用户之间的相似性,找到与目标用户历史行为和偏好相近的一组用户,然后根据这些用户的行为和喜好,为目标用户进行推荐。

物品协同过滤算法则是通过寻找物品之间的相似性,找到与目标物品相似的一组物品,然后根据这些物品的历史被喜好,为目标用户进行推荐。

虽然这两种算法的本质不同,但是数据计算和推荐模型是相似的。

二、传统的协同过滤算法存在的问题虽然协同过滤算法在提高推荐效果方面取得了显著成效,但仍然存在一些问题,主要体现在以下三个方面:1. 数据稀疏性问题:在现实中,用户和物品之间的交互量往往是非常有限的,用户只会对少数物品进行评价和浏览,而且很可能每个用户感兴趣的物品都不太相同。

因此,很容易出现相同用户对相同物品进行评价的情况非常稀疏,导致算法无法进行有效的学习和推荐。

2. 冷启动问题:在协同过滤算法中,为了制定个性化推荐策略,需要借助用户的历史行为数据。

但是,在刚开始使用服务的时候,用户往往没有产生足够的行为数据,因此很难给用户进行个性化推荐。

3. 算法的可扩展性:对于大规模数据集,传统的基于用户或基于物品的协同过滤算法会面临计算时间过长和内存消耗过大的问题,而且随着用户数和物品数的增加,这个问题会更加明显。

三、基于模糊相似度的协同过滤算法为了克服传统协同过滤算法所面临的问题,研究者提出了基于模糊相似度的协同过滤算法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于模糊聚类的可扩展的协同过滤算法研究1王惠敏聂规划武汉理工大学经济学院电子商务系,武汉(430070)Email: huiminwangbj@摘要:本文主要分析了传统协同过滤算法的不足,提出了一种新的电子商务推荐算法。

该算法将模糊聚类技术用于划分相似的项目和相似的用户,在项目的划分中采用基于项目的协同过滤算法计算出用户对未评分项目的初始评分,在此基础上在用户的划分中采用基于用户的协同过滤算法完成预测评分。

实验结果表明,该算法改善了协同过滤算法的数据稀疏性和可扩展性问题,提高了推荐系统的推荐质量。

关键词:电子商务;协同过滤;模糊聚类;推荐系统中图分类号:TP3911. 引言电子商务推荐系统是基于可得到的信息资源向用户推荐适合其需要的信息或商品的系统[1]。

电子商务推荐技术是电子商务推荐系统中最核心、最关键的技术,很大程度上决定了推荐系统性能的优劣。

目前电子商务推荐技术主要有基于内容的推荐技术和协同过滤推荐技术[2]。

协同过滤作为目前最成功的推荐算法被广泛的应用,其目标是根据具有相似偏好的用户的观点向目标用户推荐新的商品。

协同过滤推荐算法基本上可以分为 Memory-based 协同过滤推荐算法和 Model-based 协同过滤推荐算法两类[3]。

Memory-based 协同过滤算法利用整个用户—项目评分数据集来产生推荐,系统利用统计技术搜寻一组用户,称为邻居,他们与目标用户有一致的历史偏好。

Memory-based 协同过滤算法主要有基于用户的协同过滤推荐算法和基于项目的协同过滤推荐算法。

基于用户的协同过滤根据评分相似的最近邻居的评分数据向目标用户产生推荐。

基于用户的协同过滤虽然当给出足够清楚的偏好信息时,它通常表现出良好的性能,但随着站点结构,内容的复杂度和用户人数的不断增加,一些缺点逐渐暴露出来,主要存在稀疏性和可扩展性两个问题。

通常在电子商务网站中,用户购买或评分的商品相对于总商品数量仅占有限的百分比,为总数量的1%以下,这导致用户-项目评分数据集稀疏。

在这种数据量大而评分数据又极端稀疏的情况下,一方面难以成功的定位邻居用户集,影响推荐精度;另一方面在整个用户空间上计算相似用户群的过程不可避免地成为了算法的瓶颈。

并且输入数据通常包含大量的用户和商品,致使系统扩展困难,推荐质量下降。

针对基于用户的协同过滤推荐算法面临的问题,研究者们提出了基于项目的协同过滤推荐算法[3]。

基于项目的协同过滤推荐依赖于项目的相信似度来决定推荐。

算法的不足之处是只能推荐那些和用户当前购买的商品相类似的商品,不能挖掘用户的潜在兴趣,作出“跨类型”的推荐。

聚类分析是数据处理的一种重要手段和工具,通过把样本按照某种相似性准则划分成各种不同的类别,从而发现人们感兴趣的内容。

聚类技术已被广泛地大数据集的处理,研究者们也将其应用于协同过滤可扩展性问题的改善。

张海燕等运用模糊聚类技术将项目的属性特性的相似性与基于项目的协同过滤推荐算法相融合,以改善推荐质量[4]。

Xue G. R.采1 本课题得到国家自然科学基金“基于知识网络的电子商务智能推荐系统研究”(70572079)资助- 1 -用聚类方法将训练集中的用户聚类,在类中采用基于用户的协同过滤方法预测所有未评分数据并将其填充,然后用平滑后的用户—项目评分数据集预测测试集中的未评分数据[5]。

针对基于用户的协同过滤和基于项目的协同过滤两种算法的不足,本文提出的协同过滤算法融合了 两种算法的基本思想,不仅考虑了用户的相似性,而且也考虑了项目的相似性对目标用户推荐产生的影响。

同时运用模糊聚类技术分别将相似的项目和相似的用户进行划分。

在项目的划分中利用用户对相似商品的评分预测用户对未评分商品的评分,在此基础上在用户的划分中计算用户的相似度,产生推荐的预测评分。

2. 相关工作协同过滤是预测某客户对某个他没有评价过的项目的喜爱程度,预测的依据是过去用户群体对一系列项目的历史评分。

用户-项目评分数据可用一个n m ×阶矩阵表示,m 行代表个用户,列代表个项目,第i 行第),(n m R m n n j 列的元素代表用户i 对项目j i R ,j 的评分数值。

2.1基于用户的协同过滤推荐基于用户的协同过滤推荐根据评分相似的最近邻居的评分数据向目标用户产生推荐。

该算法的核心部分是为一个需要推荐服务的目标用户寻找最相似的最近邻居集。

最近邻居查找的效果和效率很大程度上决定了基于用户的协同过滤算法的效果和效率。

余弦相似性和相关相似性是常用的二种相似性度量方法。

本文采用相关相似性度量方法,其表示如下:∑∑∑∈∈∈−−−−=xy xy xy S s S s y ys x xs S s y ys x xs R R R R R R R Ry x sim 22)()())((),(xs R 和分别是用户ys R x 和用户y 对项目的评分;s x R 和y R 分别是用户x 和用户y 的平均评分;是用户xy S x 和用户y 评分项目的交集。

基于相似性度量找出最相似的用户之后,需要根据目标用户的评分,预测其对未评分项目的评分。

用户x 对未评分项目p 的预测评分可表示为:∑∑==×−+=uul i l i i ip x xp i x sim i x sim R R R P 11),(),()(其中为相似的用户数。

u l 2.2 基于项目的协同过滤推荐- 2 -基于项目的协同过滤推荐是用目标用户对相似项目的评分来预测其对未评分项目的评分。

该算法是根据目标用户已经评价过的项目与目标项目的相似性,选择项目的最近邻居集,按如下公式预测用户u 对未评分项目的评分。

s us P ∑∑==×=i i l b l b ub us b s sim b s sim R P 11),(),( 其中为相似的项目数,项目相似度可通过相关相似性度量方法计算获得。

i l ),(b s sim 3. 基于模糊聚类的可扩展的协同过滤算法针对由于评分数据的极端稀疏导致难以定位相似的用户集合,本文首先对用户—项目评分数据集按项目进行模糊聚类,在聚类后的划分中计算项目的相似度,预测用户对未评分项目的评分,并将其预测值填充在用户评分数据集中。

填充后的评分数据集作为输入数据,运用模糊聚类算法对数据集中的用户进行划分,在用户的划分中计算用户的相似度,完成最后的预测评分。

具体算法如下:步骤1:将模糊c-均值算法应用于训练集的用户—项目评分数据集,将项目划分为 类;c 步骤2:查找目标用户的未评分数据所属的类,类中的项目作为目标用户未评分项目的邻居;步骤3:在类中采用相关相似性函数作为度量函数,计算用户未评分项目与其邻居项目的相似度;步骤4:预测用户对未评分项目的评分,并将其预测值填充在训练集的用户—项目评分数据集中;步骤5:将模糊c-均值算法应用于填充后的评分数据集,将用户划分为 g 类;步骤6:查找测试集中目标用户所属的类,类中的用户作为目标用户的邻居;步骤7:在类中采用相关相似性函数作为度量函数,计算目标用户与其邻居用户的相似度,预测目标用户对未评分项目的评分。

4. 实验及结果分析实验采用的数据集来自 Minnesota 大学 GroupLens Research 项目组收集的MovieLens 数据集。

MovieLens 站点( /)是一个基于 Web 的研究型推荐系统,用于接收用户对电影的评分并提供相应的电影推荐列表。

从MovieLens 数据集中随机截取100个用户对800部电影的评分数据,然后将评分数据按0.9的比率划分为训练集和测试集,从测试用户中的评分中随机选取5个评分作为可见的评分。

- 3 -本文采用平均绝对偏差MAE(Mean Absolute Error)作为评价推荐系统推荐质量的度量标准,验证算法的有效性。

平均绝对偏差MAE 通过计算预测的用户评分与实际的用户评分之间的偏差来度量预测的准确性,MAE 越小,推荐质量越高。

对于测试集中的项目评分和用户,MAE 表示为:Lr PMAE s x s x s x ∑−=,,,|| 其中,表示用户s x P ,x 对项目的预测评分,表示用户s s x r ,x 对项目的实际评分,为测试集合的基数。

s L 实验以传统的基于用户的协同过滤推荐算法和基于项目的协同过滤算法作为参照,分别计算其平均绝对偏差MAE ,然后与基于模糊聚类的可扩展的协同过滤推荐算法作比较,实验结果为:基于用户的协同过滤算法的MAE 为0.731;基于项目的协同过滤算法的MAE 为0.726,基于模糊聚类的可扩展的协同过滤推荐算法的MAE 为0.692。

实验结果表明基于模糊聚类的可扩展的协同过滤推荐算法具有较小的MAE ,完成的推荐质量要较高一些。

5. 结论在本文提出的电子商务推荐算法中,将模糊聚类技术应用于项目最近邻居和用户最近邻居的查找,降低了在项目空间和用户空间的计算维度,改善了传统协同过滤算法的可扩展性。

同时未评分项目的预测过程综合考虑了用户—项目评分数据集中所含的项目相关和用户相关的信息,降低了评分数据的稀疏性,预测结果更为准确。

参考文献[1] Weng L.T., Xu Y., and Li Y.F. An Improvement to Collaborative Filtering for Recommender Systems[A]. Proceedings of the 2005 International Conference on Computational Intelligence for Modelling, Control and Automation, and International Conference on Intelligent Agents, Web Technological and Internet Commerce, 2005, 792-795[2] Breese J., Heckerman D. and Kadie C..Empirical Analysis of Predictive Algorithms for Collaborative Filtering[A]. Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence, 1998.43-52[3] Sarwar B., Karypis G., and Konstan J .Item-based collaborative filtering recommendation algorithms[A]. Proceedings of the 10th International World Wide Web Conference, 2001,285-295[4] 张海燕,顾峰,姜丽红.基于模糊簇的个性化推荐方法[J].计算机工程,2006,32(12):65-67[5] Xue G. R., Lin C., Yang Q., et al. Scalable Collaborative Filtering Using Cluster-based Smoothing[A]. Proceedings of the 28th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 2005, 114-121- 4 -Research on Scalable Collaborative Filtering AlgorithmBased on Fuzzy ClusteringWang Huimin, Nie GuihuaDepartment of Economics, Wuhan University of Technology, Wuhan, HuBei, PRC, 430070AbstractThe paper proposes a novel e-commerce recommendation algorithm on the basis of the limitations of traditional collaborative algorithms. The algorithm applies the fuzzy clustering technology to partition similar items and similar users. In the partition of items, original ratings of items that users have not rated are predicted by the item-based collaborative filtering, then in the partition of users, final ratings are predicted by the user-based collaborative filtering. Experiments show the proposed algorithm can improve data sparsity and scalability of traditional collaborative filtering and provide a better recommendation.Keywords:E-commerce, Collaborative filtering, Fuzzy clustering, Recommendation system作者简介:王惠敏,女, 1971年生,博士、讲师,主要研究方向是电子商务和商务智能。

相关文档
最新文档