个性化推荐系统研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单位代码:
1wenku.baidu.com293
密
级:
硕 士 学 位 论 文
论文题目:
个性化推荐系统研究
学 姓 导 学 研 科 究
号 名 师 专 业 方 向
Y006091732 陈 敏 顾亦然 控制理论与控制工程 计算机控制与系统集成 工学硕士 二〇一二年二月
申请学位类别 论文提交日期
南京邮电大学学位论文独创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确 的说明并表示了谢意。
Keywords: Personalized recommendation, Social tagging networks, Time-weighted, Tripartite graphs
II
南京邮电大学硕士研究生学位论文
目录
目录
摘要........................................................................................................................................................ I Abstract.................................................................................................................................................. II 目录......................................................................................................................................................III 第一章 绪论 ...........................................................................................................................................1 1.1 研究背景与意义 ........................................................................................................................1 1.1.1 研究背景 ........................................................................................................................1 1.1.2 研究意义 ........................................................................................................................1 1.2 推荐系统研究现状与分析 ..........................................................................................................2 1.3 推荐系统面临的主要挑战 ...........................................................................................................5 1.4 论文研究内容............................................................................................................................6 1.5 论文章节安排............................................................................................................................6 第二章 推荐系统概述及其相关技术 ........................................................................................................8 2.1 个性化推荐概述 ........................................................................................................................8 2.2 常用推荐方法分类 .....................................................................................................................9 2.2.1 基于内容的推荐算法 .......................................................................................................9 2.2.2 基于协同过滤的推荐算法 .............................................................................................. 12 2.2.3 基于网络结构的推荐算法 .............................................................................................. 16 2.2.4 混合推荐算法 ................................................................................................................ 18 2.3 本章小结................................................................................................................................. 19 第三章 基于网络结构的标签时间加权推荐算法 ..................................................................................... 20 3.1 引言 ........................................................................................................................................ 20 3.2 标签系统研究介绍................................................................................................................... 20 3.2.1 社会标签系统 ................................................................................................................ 20 3.2.2 社会标签的推荐 ............................................................................................................ 22 3.3 基于资源分配的二部图设计 ..................................................................................................... 24 3.4 基于标签时间加权的推荐 ......................................................................................................... 26 3.4.1 三部图网络结构中时间衰减分析 .................................................................................... 28 3.4.2 用户添加标签的活跃期影响分析 .................................................................................... 28 3.4.3 基于标签时间加权的推荐算法描述 ................................................................................ 31 3.5 算法时间复杂度分析 ................................................................................................................ 32 3.6 本章小结 ................................................................................................................................. 33 第四章 仿真实验与性能分析................................................................................................................. 35 4.1 评价指标 ................................................................................................................................. 35 4.1.1 预测准确度 ................................................................................................................... 35 4.1.2 分类准确度 ................................................................................................................... 36 4.1.3 排列准确度 ................................................................................................................... 37 4.1.4 其他评价指标 ................................................................................................................ 37 4.2 数据集 ..................................................................................................................................... 39 4.3 实验结果及分析 ....................................................................................................................... 40 4.3.1 MovieLens 数据集中实验结果 ....................................................................................... 42 4.3.2 Delicious 数据集中实验结果 ....................................................................................... 48 4.3.3 实验结果综合分析 ........................................................................................................ 50 4.4 本章小结 ................................................................................................................................. 55
南京邮电大学硕士研究生学位论文
Abstract
Abstract
With the rapid development of network technology, the problem of an explosion of information growth making it overload in the network becomes more and more serious. It's difficult for users to find useful information in the network. Some rarely concerned information is also submerged in the sea of information and becomes the isolated island of information. The traditional search engine can't help people to effectively solve this problem and personalized recommendation systems emerge as the times require. Finding their individual preference resources object for users is the essence of recommendation system. Inevitably, recommendation systems are confronted with many problems, such as the accuracy of recommendation, "cold start" and user interest changes with time and other issues. How to effectively solve these problems become many scholars ’ research goals. In recent years, the maturity of Web2.0 technology makes the social tags system widely used. Social tagging systems introduce a novel platform for users' participation and search network resources more efficiently. Because social tags can provide highly abstract information about not only item contents but also personalized preferences, the use of labels can improve the accuracy of personalized recommendation. In order to solve the limitations of the traditional personalized recommendation system, this dissertation studies how to use the social tag to improve the performance of the recommendation system. Aiming at the problem of user preferences changes over time in the personalized recommendation system, and combining with using tag frequency and label time on user-object-tag tripartite graphs, we propose a recommendation a lgorithm based on tag time-weighted network. Simulation experiments are performed in the Delicious and MovieLens two data. Experimental results demonstrate that the usage of tag time-weighted can significantly improve accuracy and diversification of recommendations, and the more abundant label categories, the higher accuracy of recommendation. Furthermore, it is found that the smaller object degree is and the better recommendation will be. The results also prove that using social label proposed recommendation algorithm can solve the recommendation "cold start" problem.
研究生签名:
日期:
南京邮电大学学位论文使用授权声明
南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留 本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其 他复制手段保存论文。 本人电子文档的内容和纸质论文的内容相一致。 除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括 刊登) 论文的全部或部分内容。论文的公布 (包括刊登)授权南京邮电大 学研究生部办理。
主
题
词:个性化推荐、社会标签网络、时间加权、三部分 网络
Keywords: Personalized recommendation, Social tagging networks, Time-weighted, Tripartite graphs networks
摘要
随着网络技术的快速发展,信息爆炸式的增长使网络中信息超载问题变的日趋严重,用 户在网络中很难找到有用的信息,一些很少被关注的信息也被淹没在信息的大海中,成为孤 岛信息。传统的搜索引擎无法帮助人们有效的解决这个问题,个性化推荐系统应运而生。推 荐系统的本质就是为用户找到符合其个性偏好的资源对象,现有的推荐系统都不可避免的面 临着很多问题,如推荐精度、 “冷启动”和用户兴趣随时间变化等问题。如何有效解决这些问 题成为众多学者的研究目标。 近几年,Web2.0 技术的成熟使得社会标签系统得到广泛应用。社会标签以一种新颖的形 式创造了更好的平台,让人们更高效的查找网络资源。因为社会标签可以提供对象高度抽象 的内容信息和个性偏好信息,因此利用标签辅助推荐有助于提高个性推荐的精度。为了解决 传统个性化推荐系统的局限性问题, 本文主要研究如何利用标签系统来提高推荐系统的性能。 针对个性化推荐系统中用户兴趣随时间改变的问题,在用户-标签-对象三部分图结构中,结 合标签使用频率和用户添加标签的时间, 提出了一种利用标签时间加权的资源推荐算法,同时 在 Delicious 和 MovieLens 两个数据集中进行仿真实验。实验结果显示利用标签时间加权的 算法能有效地提高推荐的精度和多样性,并且标签类别越丰富,推荐精度就越高。在进一步 的实验中发现,数据集中对象度越小本文提出的推荐方法表现越好,结果也证明本文利用社 会标签提出的推荐算法能够解决推荐中的“冷启动”问题。 关键词:个性化推荐;社会标签网络;时间加权;三部分网络
研究生签名:
导师签名:
日期:
南 京 邮 电 大 学 硕士学位论文摘要
学科、专业:工学、控制理论与控制工程 研 究 方 向:复杂系统与网络控制
作
者:陈敏
指 导 教 师:顾亦然 副教授 题 目:个性化推荐系统研究
英 文 题目:Research on personalized recommendation system
1wenku.baidu.com293
密
级:
硕 士 学 位 论 文
论文题目:
个性化推荐系统研究
学 姓 导 学 研 科 究
号 名 师 专 业 方 向
Y006091732 陈 敏 顾亦然 控制理论与控制工程 计算机控制与系统集成 工学硕士 二〇一二年二月
申请学位类别 论文提交日期
南京邮电大学学位论文独创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确 的说明并表示了谢意。
Keywords: Personalized recommendation, Social tagging networks, Time-weighted, Tripartite graphs
II
南京邮电大学硕士研究生学位论文
目录
目录
摘要........................................................................................................................................................ I Abstract.................................................................................................................................................. II 目录......................................................................................................................................................III 第一章 绪论 ...........................................................................................................................................1 1.1 研究背景与意义 ........................................................................................................................1 1.1.1 研究背景 ........................................................................................................................1 1.1.2 研究意义 ........................................................................................................................1 1.2 推荐系统研究现状与分析 ..........................................................................................................2 1.3 推荐系统面临的主要挑战 ...........................................................................................................5 1.4 论文研究内容............................................................................................................................6 1.5 论文章节安排............................................................................................................................6 第二章 推荐系统概述及其相关技术 ........................................................................................................8 2.1 个性化推荐概述 ........................................................................................................................8 2.2 常用推荐方法分类 .....................................................................................................................9 2.2.1 基于内容的推荐算法 .......................................................................................................9 2.2.2 基于协同过滤的推荐算法 .............................................................................................. 12 2.2.3 基于网络结构的推荐算法 .............................................................................................. 16 2.2.4 混合推荐算法 ................................................................................................................ 18 2.3 本章小结................................................................................................................................. 19 第三章 基于网络结构的标签时间加权推荐算法 ..................................................................................... 20 3.1 引言 ........................................................................................................................................ 20 3.2 标签系统研究介绍................................................................................................................... 20 3.2.1 社会标签系统 ................................................................................................................ 20 3.2.2 社会标签的推荐 ............................................................................................................ 22 3.3 基于资源分配的二部图设计 ..................................................................................................... 24 3.4 基于标签时间加权的推荐 ......................................................................................................... 26 3.4.1 三部图网络结构中时间衰减分析 .................................................................................... 28 3.4.2 用户添加标签的活跃期影响分析 .................................................................................... 28 3.4.3 基于标签时间加权的推荐算法描述 ................................................................................ 31 3.5 算法时间复杂度分析 ................................................................................................................ 32 3.6 本章小结 ................................................................................................................................. 33 第四章 仿真实验与性能分析................................................................................................................. 35 4.1 评价指标 ................................................................................................................................. 35 4.1.1 预测准确度 ................................................................................................................... 35 4.1.2 分类准确度 ................................................................................................................... 36 4.1.3 排列准确度 ................................................................................................................... 37 4.1.4 其他评价指标 ................................................................................................................ 37 4.2 数据集 ..................................................................................................................................... 39 4.3 实验结果及分析 ....................................................................................................................... 40 4.3.1 MovieLens 数据集中实验结果 ....................................................................................... 42 4.3.2 Delicious 数据集中实验结果 ....................................................................................... 48 4.3.3 实验结果综合分析 ........................................................................................................ 50 4.4 本章小结 ................................................................................................................................. 55
南京邮电大学硕士研究生学位论文
Abstract
Abstract
With the rapid development of network technology, the problem of an explosion of information growth making it overload in the network becomes more and more serious. It's difficult for users to find useful information in the network. Some rarely concerned information is also submerged in the sea of information and becomes the isolated island of information. The traditional search engine can't help people to effectively solve this problem and personalized recommendation systems emerge as the times require. Finding their individual preference resources object for users is the essence of recommendation system. Inevitably, recommendation systems are confronted with many problems, such as the accuracy of recommendation, "cold start" and user interest changes with time and other issues. How to effectively solve these problems become many scholars ’ research goals. In recent years, the maturity of Web2.0 technology makes the social tags system widely used. Social tagging systems introduce a novel platform for users' participation and search network resources more efficiently. Because social tags can provide highly abstract information about not only item contents but also personalized preferences, the use of labels can improve the accuracy of personalized recommendation. In order to solve the limitations of the traditional personalized recommendation system, this dissertation studies how to use the social tag to improve the performance of the recommendation system. Aiming at the problem of user preferences changes over time in the personalized recommendation system, and combining with using tag frequency and label time on user-object-tag tripartite graphs, we propose a recommendation a lgorithm based on tag time-weighted network. Simulation experiments are performed in the Delicious and MovieLens two data. Experimental results demonstrate that the usage of tag time-weighted can significantly improve accuracy and diversification of recommendations, and the more abundant label categories, the higher accuracy of recommendation. Furthermore, it is found that the smaller object degree is and the better recommendation will be. The results also prove that using social label proposed recommendation algorithm can solve the recommendation "cold start" problem.
研究生签名:
日期:
南京邮电大学学位论文使用授权声明
南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留 本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其 他复制手段保存论文。 本人电子文档的内容和纸质论文的内容相一致。 除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括 刊登) 论文的全部或部分内容。论文的公布 (包括刊登)授权南京邮电大 学研究生部办理。
主
题
词:个性化推荐、社会标签网络、时间加权、三部分 网络
Keywords: Personalized recommendation, Social tagging networks, Time-weighted, Tripartite graphs networks
摘要
随着网络技术的快速发展,信息爆炸式的增长使网络中信息超载问题变的日趋严重,用 户在网络中很难找到有用的信息,一些很少被关注的信息也被淹没在信息的大海中,成为孤 岛信息。传统的搜索引擎无法帮助人们有效的解决这个问题,个性化推荐系统应运而生。推 荐系统的本质就是为用户找到符合其个性偏好的资源对象,现有的推荐系统都不可避免的面 临着很多问题,如推荐精度、 “冷启动”和用户兴趣随时间变化等问题。如何有效解决这些问 题成为众多学者的研究目标。 近几年,Web2.0 技术的成熟使得社会标签系统得到广泛应用。社会标签以一种新颖的形 式创造了更好的平台,让人们更高效的查找网络资源。因为社会标签可以提供对象高度抽象 的内容信息和个性偏好信息,因此利用标签辅助推荐有助于提高个性推荐的精度。为了解决 传统个性化推荐系统的局限性问题, 本文主要研究如何利用标签系统来提高推荐系统的性能。 针对个性化推荐系统中用户兴趣随时间改变的问题,在用户-标签-对象三部分图结构中,结 合标签使用频率和用户添加标签的时间, 提出了一种利用标签时间加权的资源推荐算法,同时 在 Delicious 和 MovieLens 两个数据集中进行仿真实验。实验结果显示利用标签时间加权的 算法能有效地提高推荐的精度和多样性,并且标签类别越丰富,推荐精度就越高。在进一步 的实验中发现,数据集中对象度越小本文提出的推荐方法表现越好,结果也证明本文利用社 会标签提出的推荐算法能够解决推荐中的“冷启动”问题。 关键词:个性化推荐;社会标签网络;时间加权;三部分网络
研究生签名:
导师签名:
日期:
南 京 邮 电 大 学 硕士学位论文摘要
学科、专业:工学、控制理论与控制工程 研 究 方 向:复杂系统与网络控制
作
者:陈敏
指 导 教 师:顾亦然 副教授 题 目:个性化推荐系统研究
英 文 题目:Research on personalized recommendation system