个性化推荐系统

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

个性化推荐系统软件说明书

一.软件背景

随着近年来互联网的飞速发展,个性化推荐已成为各大主流网站的一项必不可少服务。提供各类新闻的门户网站是互联网上的传统服务,但是与当今蓬勃发展的电子商务网站相比,新闻的个性化推荐服务水平仍存在较大差距。一个互联网用户可能不会在线购物,但是绝大部分的互联网用户都会在线阅读新闻。因此资讯类网站的用户覆盖面更广,如果能够更好的挖掘用户的潜在兴趣并进行相应的新闻推荐,就能够产生更大的社会和经济价值。

初步研究发现,同一个用户浏览的不同新闻的内容之间会存在一定的相似性和关联,物理世界完全不相关的用户也有可能拥有类似的新闻浏览兴趣。此外,用户浏览新闻的兴趣也会随着时间变化,这给推荐系统带来了新的机会和挑战。因此,希望通过对带有时间标记的用户浏览行为和新闻文本内容进行分析,挖掘用户的新闻浏览模式和变化规律,设计及时准确的推荐系统预测用户未来可能感兴趣的新闻。

本软件就是用来实现根据用户数据,分析用户行为,为用户进行个性化推荐等功能.

二.软件环境

运行环境Windows XP/7/8

编译环境VS2010

三.运行参数

News_list:新闻列表

News_times:x新闻阅读次数

Step_correlation:一步转移数据

User_list:用户列表

Train_data:原始数据

附加数据:用户适应度

四.算法说明

人们常把事物的随机变化过程称作马尔可夫过程。它具有无后效性,即事物的将来呈什么状态、取什么值,仅与它现在的状态和取值有关,与它以前的状态和取值无关。马尔可夫链则是事物在连续一段时期内若干马尔可夫过程的总称,表明事物状态由过去到现在、由现在到将来,一环接一环,像一根链条。在预测领域,人们用其对预测对象各个状态的初始分布和各状态间的转移概率进行研究,描述状态的变化趋势,并由此来预测未来。由于新闻网页推荐方式的不同,可能导致链长不同的马尔科夫链的产生。其他不定因素诸如用户的浏览习惯也可能导致不同链长的马尔科夫链。

本软件使用了该思想,利用用户最后的阅读记录来进行推测。由于许多用户的新闻阅读数目有限,直接限制了链长的长度,所以我们从三阶马尔科夫链开始,作为尝试,但尝试后发现效果并没有提升,反而会出现因为条件过于苛刻而无法推荐的情况。

最终我们采取了一步马链的形式来作为推荐算法,流程图如下:

算法流程图

五.使用说明

图一:软件初始界面

打开软件可以看到的初始界面,可以按功能分区,执行不同的功能.想要完成某项功能时需要按要求依次点击按钮.

图二:选取文件

点击”选取文件”按钮可以进行选取文件操作,只有选取了文件才能接下来进行读取操作.

首先要点击选择文件按钮,弹出相应的选择界面,按照需求选择文件,然后进行读取操作.

在选择文件后,文件的路径会被显示在软件上,以便核对.

图五:读取文件

点击文件路径相应读取按钮读取文件信息,读取结果显示在右侧列表中,可以看到读取文

件所在路径,读取条数,以及所用时间.

图六:读取文件

按照要求继续读取数据文件,每次读取的结果都会相应的显示在右侧的列表中,以便核对,

防止出现错误.

继续读取第三个文件,此文件一般较大,请耐心等候.

图八:读取文件

继续读取,此文件时需要读取的最后一个基本文件,读取过后便开始计算,计算过程稍长,

请耐心等待.

在读取完成相关数据后,便可以开始计算.

在计算完毕后,读取附加数据,用于过滤结果,调整输出.

图十一:输出结果

点击输出结果按钮,软件会将结果输出到指定的文件夹中.

图十二:打开结果

点击打开结果按钮,会弹出out.csv

想要生成step_correlation.txt,就需要在选择相应文件后,点击相应按钮进行生成.

拉动按钮,会调节阈值的选择(5~20),阈值的变化会影响最终结果的输出.

相关文档
最新文档