基于用户的协同过滤推荐算法研究及应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
性特征来计 算用 户相似度 ,不依赖 用户 .项 目 实验的测试集。在实验 的训练集上分别通过基 评 分矩阵。因此 ,基于人 口统计 的协 同过滤 推 于用户的协同过滤推荐算法和基于人 口统计 与
0.7
度,这样用少量的数据样本替代整体样本 统计
:=;;,, ::::H
特性,那么会造成计算的相似度无法反应出用 l。
一~
户间的真实相似性。将惩罚函数引入传统相似 襄 。m 。—————一.~ . 一 嚣
度 的计算 中,对共同评分项 目极少情况下 的相
…
一 ”
似度计算进行 平滑,从而降低过度估计带来的
参考文献
[1】Yi—Fan W U,Wang H R.Co1 1aborat ive
fiit e ring aI g0rithm U sing U ser
2基于人 口统计的协同过滤算法
的好坏 。平均绝对误差通过计 算预 测的用户评 分与实际 的用户评分之 间的偏 差度 量预测 准确
于其他协 同过滤算法来讲更容 易实现 。基于人
实验 在整个 数据集 中 随机 抽取 80% 的数 【2】Re sni ck P,Vsri an HR.Recommonder
口统计的协 同过滤推荐算法利用用户 的人 口属 据作为 实验 的训 练集 ,剩 下 的 20% 数 据作 为
sY st em s[J】.Communi Cation s of the
b a c k g r o un d i11f 0 r m at i 0n[J】.
Joulrna1 0f Computer ApP1i cati 0
基于 人 口统计 的协 同过 滤推 荐算 法相 对 性,MAE越 小,推荐质量越高。
ns,2009,28(28):2972-2974.
在 得到 目标用户 i的相似集 u(i)后 ,计 算 用 户 i对 项 目11的预 测评 分 P 。这 样得 到 的 预测评 分既考 虑 了用户的共 同评价 问题 ,又融 合 了用户 的人 口统计信 息。
5 实验结果 与分析
为 了验证 改进 的协 同过 滤算法 的有效性 , 使 用 明尼 苏 达大 学 GroupLens研 究 小 组提 供 的 Moivelens数据集 对该算法 进行实证 分析 , 采 用平均 绝对 误差 (MAE)来衡 量推 荐结 果
。
: , 4
影 响 。
蜜黢敬wk.baidu.com
4改进 的基于用户 的协 同过滤算 法 【关键词 】推荐 系统 协 同过滤算法 人 口统计
惩 罚 函数
本 文改 进 的基 于用户 的协 同过 滤算 法 ,
图 1:实验结果 6 结 束 语
1 引言
经过 近 二十年 的研 究 ,个 性化 推 荐系 统 己经建立 了一套 比较完备 的理论依据和框架 , 在各领域的实际应用 中也取得 了一定 的成功 , 并且个性化推荐系统也 已成为未来互联 网发展 中极其重要的组成部分 。但是 ,伴随着互联 网 应 用发展的多样化,各种新的应用形式层 出不 穷 ,互联 网用户 和信息的规模急剧增加 ,推荐 系统 的发 展将 面临新的挑战,传统推荐系统 中 没有考虑和 重视 的问题 也正影响这推荐系统 的 进一步发展和应 用。 目前,个 性化推荐系统面 临 的问题主要是稀 疏性 问题。本文 旨在针对现 有协 同过滤推荐算法 由于数据稀 疏性造成的准 确度低的现象 ,对传统 的协 同过 滤推 荐系统的 推荐算法进行改进 。
一 表 明 ,提 出的改 进 算法 能有 效提
高协 同过滤算法预测 的准确 率。
∑l = 0)
1+— —————————一
y a{ ≠Ovap≠o1
k=l
公 式 【1)
(\ v=l {
’
≠0), /
当用 户共 同评 分项 目数 量 极少 时,如 果
继续用传统的相似度计算方法计算用户 间相似
the Application of Computer Technology· 计算机技术应 用
基于 用户 的协 同过滤推荐 算法研 究及应 用
文 /楚 扬 杰 李 珊
随 着 互联 网技 术 飞速发 展 , 信 息过 载 问题 日益严 重 ,对 个性 化推荐 系统的研 究 已成必 然趋 势 。 为 了提 高传 统协 同过 滤 算法 的准 确性 ,本 文提 出基 于人 口统计 与 惩罚 函数 的 协 同过滤 算 法,先 引 入 惩 罚 函数缓 解传 统推 荐 算法 的 数 据 稀疏 性 问题 ,再 引入人 口统 计 信 息来 进一 步减 少数 据稀 疏性 问题对 预 测 结果 带来 的影 响 ,从 而提 高预 测 的准确 性。 实验 验证
本 文在传 统 的基于 用户 的协 同过 滤算 法 上,使 用 惩罚 函数来 缓解 共 同评价 过少 情况 下,用少量的样本数据代替整个数据 的统计特 性使相似度的计算值与实际值 出现较大偏差 的 问题,从而改进传统的协 同过滤算法 。在此基 础 上,进一步分析改算法存在的缺点 ,提 出同 时使用 基于人 口统计的协同过滤算法 。使用级 联 式的基 于人 口统计与平滑共同评价的协 同过 滤算法 ,找 到新的融合相似度。这样在为 目标 用户预测 时,既考虑 了用户 评价过少而引起的 过度估算 的情况 ,又 为用户找 到了背景知识相 似 的用户 的喜好 ,有 效提 高了预测 的准确度。 实验在 Moivelens数 据集上进 行,验证 了本文 提 出的改进 的推荐算法 的预测结果 。
在平滑共 同评价 的协 同过滤算法基础上,进一 步考虑人 口统计相似度 ,来减 少用户知识背景 差异对推荐结果带来 的影 响,得 到融合的相似 度计算 公式 (1)。先 使用传 统的协 同过滤 算 法找到 基于用 户的 pearson相似度 ,在此基 础 上利用惩罚函数计算出改进的 pearson相似度; 然后进一步 比较平滑共 同评价 的相似度与人 口 统计相似 度,从而提 高预测 的准确性。