电影推荐系统

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数学建模暑期培训论文

第1题

基于用户聚类的协同过滤电影推荐系统

姓名方向

谢瑜建模

舒浩浩建模

吴杨君编程

徐婷婷编程

黄睿论文

吴双论文

2014年7月20日

承诺书

我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):B

我们的参赛报名号为(如果赛区设置报名号的话):

所属学校(请填写完整的全名):武汉理工大学

参赛队员(打印并签名) :1.

2.

3.

指导教师或指导教师组负责人(打印并签名):数模组

日期:2014年 7 月 20 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页

赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

基于用户聚类的协同过滤电影推荐系统

摘要

本文通过对网站电影推荐系统的探究,采用基于用户聚类的协同过滤分析方法[1]与Topsis(逼近理想点法)建立用户喜好模型与电影推荐模型,尝试模拟电影推荐系统的主要功能,对用户的信息与兴趣进行分析与呈现。

针对问题一,我们分析建立了两个关于用户喜好的评判指标:其观看同一类电影的数量以及对该类电影观后所给出的均分(通过统计方法求得)。其后建立用户观影类型矩阵,由此计算观看某一类的数量与对该类电影的打分,再根据对用户喜好体现程度的大小,采用Topsis法,即将每个电影打分与理想分数(5分)进行比较,如果该分数在设定条件下与理想分数距离更接近,则可以认为此电影更好。因此我们取欧氏距离得到评价函数,将两者综合后从而得到函数值大小对应用户对电影类型好恶的评价标准。

针对问题二,我们考虑寻找与目标用户喜爱电影类型相同的其他用户,其后再将其他用户观影评分高的同类电影筛选5部对目标用户进行推荐。具体而言,我们采用协同过滤分析法,即在用户群中找到指定用户的相似兴趣用户,综合这些相似用户的评价,进而对该用户的喜好进行预测。经与问题一中类似的处理,我们构建其他用户喜好矩阵(0-1化),较之于目标用户喜好矩阵(0-1化),同样采用欧氏距离比较两矩阵异同(相同则入选)。确定了相同偏好用户群后,通过设计筛选流程、算法编程,从用户群相同偏好电影中便可得到所推荐的5部电影。

针对问题三,由于用户观影信息未知,故我们将用户职业和年龄与已知观影用户信息进行整合归类,即建立职业-喜好、年龄-喜好的两个映射,得到职业喜好矩阵,并由系统聚类法中的Ward法经SPSS年龄分类得到年龄喜好矩阵,通过比较得出三种推荐电影类型,再采用问题二中的筛选流程即可得到针对用户的5部推荐电影。

综上所述,本文主要综合了基于用户的协同过滤分析法、聚类分析法、逼近理想点法等模型,结合了MATLAB、Excel、SPSS等分析软件,初步构建了模拟电影推荐系统,并结合数据对用户喜好电影类型进行了有效分析、能够结合用户喜爱电影类型对特定用户进行电影推荐、能对新用户的可能喜好电影进行预测和不完全推荐。本模型的预测结果具有代表性和通用性,虽然在制定评价指标时有一定的主观性,但对于实际电影推荐应用有较大的参考价值。

关键词:协同过滤,聚类分析,Topsis,欧氏距离,电影推荐系统

一、问题重述

1.1背景分析

随着信息时代的来临,如何在大量信息中搜寻、筛选和呈现所需信息给信息的需求者和提供者均带来不小挑战,而推荐系统[2]的出现则有效地解决了这一问题:其利用用户和信息产品间关系的建立,为信息的搜寻与呈现这两方面的问题提供了解决方案。通常而言,一个完整的推荐系统包含收集用户信息的行为记录模块,分析用户喜好的模型分析模块和推荐算法模块三个部分[3]。

电子商务网站的推荐系统作为人们最熟悉、最常用的应用,也被广泛应用于大型电子商务网站的营销之中,更有文献表明早期Amazon(亚马逊)的35%销售增量都来自它的推荐系统。除了商品,音乐、电影等也是常见的推荐对象。对合理有效的推荐模型的应用可以在较大程度上改善用户体验,因此对网站发展与改进有重要意义。

1.2问题重述

问题一,建立用户喜好模型,模型根据用户的已知喜好来分析其兴趣特点,使用所建立的模型对指定用户的喜好进行分析。

问题二,建立电影推荐模型,根据问题一的分析结果,在用户可能感兴趣的电影分类中给第一题中的用户各推荐5部电影(同等条件下电影编号最小者优先)。

问题三,针对新用户,即没有已知喜好的用户,选定合适的推荐标准,设计一个推荐系统。

二、问题分析

题中要求根据用户观看电影的统计情况、对所看电影的打分情况来分析和推测用户感兴趣的其他电影。我们使用Topsis(逼近理想点法)对两个评价指标进行综合,得到用户对各类型电影喜好程度的打分,得到用户的喜好向量。由此,我们通过聚类分析的方法找到具有相似喜好向量的用户,这些用户所看的电影形成目标群体。最后,我们在目标群体中筛选出均分最高的电影作为推荐方案。

2.1问题一分析

问题一中,为建立目标用户爱好模型,首先考虑部数对喜爱程度的影响,我们对目标用户观看的各类电影数量进行统计,得到每类电影观看总部数,并对得出数据进行标准化处理,作为第一个指标。除此以外,考虑平均分对喜爱程度的影响,计算目标用户对每一类电影打分的均值,同样进行标准化处理,得到第二个指标。为实现这两个目标的最大化,建立多目标规划模型,使用Topsis(理想解法)进行求解,得到目标用户关于喜爱程度的综合评价指标,最后通过对综合指标的排序得出其喜欢的电影类型排序。

相关文档
最新文档