一种电影个性化推荐系统的研究与实现
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为两个 向量余弦 的计算问题。算 出影 片和用 户特
征模 型 的相 似度 后 , 就可 以选定 某 个 阈值 , 定 当 规 向量夹 角余 弦值 大 于 0时 , 认 为该 影 片是 用 户可 则
能 感兴 趣 的 , 其推 荐 给 用 户 , 果 小 于 0 则 过 滤 将 如 , 掉该 影 片 ; 或者 可 以选 择 相 似 度 最 高 的 TOPN 个 -
分矩 阵 , 出不 同数 据 项 之 间 的相 似 性 关 系 , 用 求 利
台 管
理
数( 据
誉 霆
此 向用 户推 荐 与用 户 喜 欢 的项 目相 似 的项 目。 由
于数 据项 本身 信息 变化 一般 不大 , 而 数据 项 之 间 进
系统 初 始 化模 块
站 点
的关系相对比较稳定, 以基于数据项的协作过滤 所
rtm.I tg aet esrn t sa dwek e sso o tn i eiga dc l b r t ef tr g,p o o ea d p ieh b i ie i h n e rt h te gh n a n se f ne t l r n o l o a i i ei c ft n a v l n r p s na a t y r f — v d h
作 者简 介 : 钱程 , , 男 讲师 , 研究方 向 : 数据挖掘 。阳小兰 , , 女 讲师 , 研究方 向 : 数据挖掘 、 软件工程 。
7 4
钱
程等 : 一种 电影 个性化推荐系统的研究与实现
第 3 9卷
普 通 户
生推 荐 。 3 2 2 基 于数据 项 的协作 过 滤推 荐 算 法 ..
走有 评分 且 与项 目 相似 度 较 大 ( 说 是 同一 类 ) 或 , 则累 加 尺 最 后 除 以累 加 的与 项 目 J相 似 的项 目 , 总数 目, 即可得 到 。 得 到 目标 用 户的邻 居用 户后 , 可 以对 目标 用 就
3 2 协作 过滤 算法 . 根 据协作 过 滤 技 术 所 使 用 的事 物 之 问 的关 联 性, 协作 过 滤算 法可 分 为基 于用 户 ( e—ae) Usr sd 的 B 协 作 过滤 推 荐 算 法 与 基 于 项 目 (tm—ae ) I B sd 的协 e 作 过 滤算 法[ 1 。 8 o -] 32 1 基 于用 户的协作 过 滤推荐 算法 ..
户 的反馈 更新 维护 用户 的兴 趣模 型 。 2 )系统 可 以根 据 用 户 的兴 趣 偏 好 , 向其 推 荐 用户 可能 感兴 趣 的电影 。
3 )系统将 运 行状态 通 过 日志记 录到 日志文 件
。
2 2 系统 总体 框 架 . 系统 的总体 框 架如 图 1 示 。 所
能 和 准 确 度 。根 据 改 进 的算 法 , 对 电 影 领 域 进 行 实 验 , 明 了其 可 行 性 。 针 证
关键词
协作过滤 ;内容过滤 ; 个性化推荐 系统
TP 9 33
中 图分 类 号
Байду номын сангаас
Re e r h a e lz to f s a c nd R a i a i n o
t e M o i r o alz d Re o m e da i n S s e h v e Pe s n i e c m n to y t m
QinCh n Ya gXio a a eg n a ln
( l g fI fr t n E gn eig Col eo no mai n iern ,W u a iest fS in ea d Te h oo yZh n n nBrn h e o h nUnv riyo ce c n c n lg o g a a c ,W u a 4 0 2 ) hn 3 23
Ke o d c l b r t efl r g o tn i e ig e s n l e e o y W r s ol o ai ie i ,c n e tfl rn ,p ro ai d rc mme d t n s se a v t n t z n ai y tm o
Cls m b r TP3 3 a s Nu e 9
r g ag rt m ,i r v n i e e f r a c n c u a y i lo ih n mp o i g f t rp ro m n e a d a c r c .Ac o dn O a o e i r v d ag rt m ,d sg n l c r ig t b v mp o e l o i h e i n a d i lme ta mp e n p r o aie ve r c mme d t n s se f rt e f m d s r e s n l d mo i e o z n a i y t m o h i i u ty,e p rme ta d p o e t e ag rt m ’ f a i i t . o l n x e i n n r v h l o ih S e sb l y i
1 引 言
个性化推荐技术根据用户的偏好 , 向用户推荐 可能感兴趣的信息 , 从而提供针对不 同用户 的个性
化 服务 。个 性化 推 荐 技 术 可应 用 的 领域 范 围 十分 广泛 , 电子商 务 领 域 , 性 化 推 荐 系 统 可 以将 电 在 个
子 商务 网站 的浏览 者变 为购 买者 , 高 电子 商 务 网 提 站 的交叉 销售 能力 , 高客 户对 电子 商 务 网站 的 忠 提 诚度 _ 。本 文 主要 研 究 的是 用 于 电 影 个 性 化 推 】 ]
A s rc I ec l b rt eftr ga o i m b s do mi r rjcs a igit c o n e i l i ew e e b ta t nt l o ai l i l r h a e ns l oe t tk n oa c u t h mi r yb t e n t h oa v ie n g t i ap n t s at h
的评 分 颇 高 , 而对 文 艺 类 影 片 的 评 分 偏 低 甚 至 最
影片的信息可以提取 出为一个特征向量 , 向量
每个 分量 的值 取 决 于该 影 片 的 片名 、 发行 日期 、 影 片类 型 以及描 述信 息 , 通过 对 以上 信 息进 行 分词 处
理, 统计 每个 词 的权 重 后 , 可 以形 成 一 个 多 维 向 就
2 电影 个 性 化 推 荐 系统 设 计
2 1 系统的 主要 功能 .
户 的兴趣 模 型 , 用 户 推 荐 其 最 可 能 感 兴 趣 的影 向
1 )系统 可 以 构 建 用 户 的 兴 趣 模 型 , 根 据 用 并
片, 同时收集系统的推荐性能的信息 。影片推荐后
*
收稿 日期 :0 1 2月 1 , 回日期 :0 1 3 2 21 年 41 修 3 2 1 年 月 1日
具有 更好 的可 扩 展性 。
图 1 电影 推 荐 系统 架构 图
台管 理站 点 主要 有 电影 管 理 、 户管 理 、 统 监 控 用 系
以及 系统初 始 化等模 块 , 主要 的功 能是 系统 数 据 的
4 算 法 的 改进
4 1 改进 的协作 过滤 算 法 .
初始 化 , 系统 影 片 、 户 的 管 理 以及 系 统 中参 数 的 用 调控 。
总第 2 2期 6
计算机与数字工程
C mp tr& D gtl n ier g o ue ii gn ei aE n
Vo. 9 No 8 13 .
7 3
2 1 年第 8期 01
一
种 电影 个 性 化 推 荐 系 统 的研 究 与 实 现
钱 程 阳小 兰
武汉 402) 3 2 3 ( 武汉科技大学 中南分校信 息工程学 院
s o e ,t i fc o s i r v d b d ig f t r g a g r h f t rn l o ih s h l o i p o e t e a c r c f t e ag — c r s h s a t r i mp o e y a d n i e i l o i m i e i g a g rt m ep t m r v h c u a y o h l o l n t l
系统 主要分 为两 部分 : 与普 通 用户 交 互 的 电影
推荐站 点 和管理 员操 作 的影 片 推荐 后 台 管理 站点 。
荐 系统算 法及 实现 。
电影推荐站点主要有注册/ 注销 、 个人信息管理、 用
户 兴趣 收集 以及影 片 推荐等 模 块 , 主要 的功能 是 用
户 注册 、 注销 、 录 , 据用 户 的行 为建 立 、 护 用 登 根 维
3 1 内容过 滤算 法 .
内容 过滤 的工 作过 程 是 : 提 取 待过 滤影 片特 先
某人可 能很 喜欢 科幻类 影 片 , 是 不喜 欢 文艺 类 影 但
片, 因此 , 当此 人对 影 片评 分时 , 能对 科幻 类 影 片 可
征 向量 , 后 根据 用户 兴趣模 型 与 待过 滤影 片特 征 然 向量 进行 匹配 过 滤得 到过 滤后 的结 果E 7。 5 ] -
摘
要
在 协 作 过 滤 算 法 研 究 的基 础 上 , 虑 到 相 似 项 目之 间评 分 的 相 似 性 , 此 因 素 加 入 过 滤 算 法 得 到 改 进 的协 助 考 将
过滤算法 , 提高 了算法的准确度 。综合 内容和协作过滤的优缺点 , 出一 种具 有 自适应调节的混合过滤算法 , 提 提高了过 滤性
影片。
评分 , 表示用户 U对数据项 J的评分 , , R ; 表示
用户 i对 数 据 项 的相 似 项 目( 同类 项 目) 的平 均 评分 ; 是 加权 系数 ,<a 1 口 O < 。 R 的计算 方法 如下 :
依次 查找用 户 i 每 个项 目尼的 评分 , 项 目 对 若
3 常用算 法
一
所 描述 的改 进 算 法 是 基 于 用 户 的 协作 过 滤算 法 的改 进 , 改进 思想 同样 也可 用 于基 于 数据 项 的 其 协作 过 滤算法 。一般情 况 下 , 对某 一 类事 物 感 兴 人
趣 较大 , 对 另外 一 类 事 物 几 乎 不 感 兴 趣 。 比 如 , 而
其 中 s u 表 示用 户 i i ,) m( 和用 户 “的相 似度 , 和 R 分别 表示 用户 i 用 户 对 所 有 数据 项 的平 均 和
用 户兴趣 模 型 和 待 过 滤 影 片 的 匹配 过 程 基 于
向量 空 间法 , 户模 型和 影片 的相 似 度 比较 被 转换 用
量。
低 。因此 , 在采用上文提到的算法 预测评分 时, 预 测的准确性有待提高 , 下面是在此基础上改进 的算
法:
P 一 ( - aR + ; 1 ) ,
5 Ni (, *R _ r “ ) ( 一R ) 2 s e
>: 1i “ i ) ~ (s m( ,)1
Mo i推荐 ve 站点
基 于数据 项 的协 作 过 滤 算 法 是基 于数 据项 之
电 影 推 荐
后
一一 一 一 一 一
][
智能 推 荐
问的相似性来推荐的 , 这与基于用户的协作过滤算 法有相似之处 , 也有不 同之处 , 二者 的出发点不一
样 。基 于数据 项 的协作 过 滤 算 法根 据 用 户一 目评 项