基于LBSN的个性化旅游包推荐系统_胥皇
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表 2 符号约定表
符号 j c i u U
含义 地点 地点小类 地点大类 用户 用户全集
4. 1 地点与用户建模
4. 1. 1 地点热度计算 旅游地点有旺季和淡季之分,如大部分的植物园
在春夏门庭若市,而在冬季人迹罕至。系统引入地点 热度 H( j,m) 度量月份对用户选择地点的影响。H ( j,m) 表示地点 j 在月份 m 的热度,热度取值在 0 ~ 1 之间,值越大表示该地点在 m 月越受欢迎。本文引 入记号 VTu,m,j 表示用户 u 在 m 月访问地点 j 的次数, 利用公式( 1) 计算地点的热度。其中 rankj是数据源中的
表 3 时间分段表
时间段编号 0 1 2 3 4 5
开始时间 0: 00 8: 00 11: 00 13: 00 18: 00 20: 00
结束时间 8: 00 11: 00 13: 00 18: 00 20: 00 0: 00
地点热度和频繁序列是对所有用户都适用的
“全局因素”,系统还要考虑每个用户不同的“局部个
2014 年第 1 期
胥皇等: 基于 LBSN 的个性化旅游包推荐系统
187
1 相关研究
传统的 旅 游 应 用 通 常 为 用 户 推 荐 单 个 地 点[5], 很少考虑旅游路线。近年来,LBSN 网站的快速发展, 促使大量研究工作[3-4,6-9]致力于从 GPS、带有地理标 记的照片和签到数据中发现兴趣点或挖掘受欢迎的 旅游轨迹,这些研究主要是发现数据中大众频繁访问 的地点和路线,并没有考虑用户的个性化需求。在这 些工作的基础上,一些研究人员将个性化引入旅游推 荐中,如基于已有的旅游包数据进行个性化推荐[2]。 此外,也有部分研究工作[3,10]从 LBSN 数据中挖掘轨 迹,根据用户提出的旅游时间和地理区域要求,为用 户自动生成旅游路线。
2 系统结构
系统主要包括服务器和客户端 2 部分。服务器 存储用户签到数据并进行数据分析,运行旅游包推荐 算法,响应客户端发送的请求。客户端提供用户交互 界面,用户通过客户端提交旅游需求,浏览推荐结果。
图 1 系统结构图
系统结构如图 1 所示。系统使用采集自 LBSN 的数据作为数据源,提取用户信息,包括用户 ID、用 户所在城市等。系统根据用户历史签到记录,建立用 户偏好模型和地点热度模型,并挖掘频繁地点序列。 推荐引擎在用户与地点建模的基础上,完成用户兴趣 点发现和路线规划,生成包含多种类型的地点以及最
{1,( x,y) ∈Ps
Ps ( x,y) = 0,( x,y) Ps
( 2)
4. 1. 3 用户建模
用户行为具有一定的规律,一般白天出行,前半
夜休闲娱乐,并且会在一天中较固定的时间就餐。将
一天分为多个时间段,分别在每个时间段度量用户的
个性偏好。本文将一天分成 6 个时间段,具体的时间
段如表 3 所示。
性”,也就 是 要 建 立 用 户 模 型。 旅 游 中,用 户 一 般 倾
向于从自己喜欢的地点类型中选择目的地。系统根
据用户历史 记 录 对 用 户 建 模,采 用 向 量 表 示 用 户 偏
好。考虑到推荐时每个时间段只考察一个大类,系统
根据用户对一个地点大类中各小类的偏好建立用户
模型。本文用 VCu,r,j 表示用户 u 在时间段 r 访问 j 的 次数,式( 3) 定义了用户偏好向量,式( 4) 是偏好向量
表 1 数据集详情表
类别 餐饮 休闲 /娱乐 景点 /户外 合计
wk.baidu.com
记录数 656315 124031 39972 820318
地点数 21543 3163 1115 25818
记录 /地点 30. 47 39. 21 35. 85 31. 77
4 旅游包推荐
为表述方便,本文约定部分符号如表 2 所示。
的参考价值。
关键词: 旅游包推荐; 基于位置的社交网络; 兴趣点发现; 个性化; 路线规划
中图分类号: TP399
文献标识码: A
doi: 10. 3969 / j. issn. 1006-2475. 2014. 01. 042
LBSN-based Personalized Travel Package Recommendation System
了大量关于位置和活动的信息。为辅助用户制订旅游计划,本文提出一个基于 LBSN 的个性化旅游包推荐系统。该系统
利用采集自 LBSN 的数据,建立地点和用户偏好模型,根据用户需求,在时空约束下生成旅游路线,形成旅游包推荐给用
户。本文实现的原型系统能交互地获取用户旅游意向,实时生成多个旅游包供用户选择,对游客制订旅游计划具有一定
仅仅考虑单个旅游地点[5]不能满足用户的旅游 需求,同时从 LBSN 数据中挖掘出来的旅游地点或路 线[3,4,6-9]往往只考虑数据的统计特性,得到人们最频 繁访问的地点和轨迹,而这种旅游轨迹并不能适应用 户的独特需求。
本文提出的基于 LBSN 的个性化旅游包推荐系 统,根据 LBSN 数据定义地点模型,利用用户的历史 签到数据建立用户模型,发现用户兴趣点,引入旅游 时空约束,生成包含多种类型的地点和地点间访问顺 序等信息的旅游包,更好地满足用户的独特需求( 如 起止时间、开始地点等) 和用户偏好。
去一些著名的景点,然后去品尝附近的特色餐饮。这
种顺序访问关系对用户旅游路线设计有很重要的影
响,系统中引入序列模式反映地点间关联关系。根据
数据集中记录的时间戳和用户信息,系统从数据中挖
掘出频繁地点序列集 Ps。本文用 Ps ( x,y) 表示一个 地点序列( x,y) 是否属于频繁地点序列。频繁地点
序列将在路线规划( 见式( 8) ) 中影响推荐结果。
0引言
随着经济和交通的发展,旅游逐渐成为人们生活 的一部分。对游客而言,旅游目的地选取和路线规划 是旅行准 备 中 最 重 要 的 部 分[3]。 为 制 定 旅 游 计 划, 游客们往往通过旅行社或者网络等获取旅游信息和 建议。然而,旅行社提供的旅游信息比较单一,缺乏 个性化,另一方面,用户难以从日益膨胀的网络数据 中快速找到有用的信息。在这种情况下,一个能考虑 游客的个性化需求并能够自动制定旅游计划的工具 将会给用户带来巨大的便利。
XU Huang,YU Zhi-wen,FENG Yun,ZHOU Xing-she
( School of Computer Science,Northwestern Polytechnical University,Xi’an 710072,China)
Abstract: Travel has become an important part in our daily lives,but making travel plans is not easy. Location Based Social Networks( LBSN) provides a large amount of information about location and activity,which is useful for location search and recommendation. This paper proposes a LBSN-based personalized travel package recommendation system to help users make travel plans. We generate location profile and user preference model based on the collected LBSN data. Then we produce travel routes under spatio-temporal constraints and recommend the travel packages. The travel package contains travel destinations and visiting order of these destinations. Key words: travel package recommendation; LBSN; POI detection; personalization; path planning
每一维的计算公式。式( 3) 和式( 4) 建立了用户模
型,即用户对各个类型地点的偏好。
Vu,r,j = < F1 ,F2 ,…,F i >
( 3)
Fc
=
∑j∈c VCu,r,j ∑q∈i VCu,r,q
( 4)
佳游览顺序等信息的个性化旅游包。为了提供实时 响应,系统离线建立用户和地点模型,在线运行推荐 引擎。
3 LBSN 数据
本文使用的 LBSN 数据是街旁网 ( http: / / www. jiepang. com) 的用户上传的带有地点信息和时间戳的 照片记录集合,主要以上海市的数据为主。该数据集 包括 57805 个用户的 1260364 条记录。数据中的每 条记录包含相应的用户信息、签到时间和位置信息, 位置信息包括经纬度、地点名称、地点所属类型以及 用户对该地点的评分均值等。
本文利用采集自国内街旁网的带有地理位置信 息的签到数据,研究实现一个基于大众数据的个性化 旅游包推荐系统。系统挖掘签到数据,建立用户模型 和地点模型。用户可以交互地提出旅游需求,系统根 据这些需求,综合考虑时间、空间和用户偏好等上下文, 为用户定制多个可供选择的旅游包并向用户推荐。
收稿日期: 2013-09-12 基金项目: 国家自然科学基金资助项目( 61222209,61103063) ,教育部“新世纪优秀人才支持计划”( NCET-12-0466) ,教育 部高等学校博士学科点专项科研基金( 博导类) ( 20126102110043) 作者简介: 胥皇( 1991-) ,男,湖南汨罗人,西北工业大学计算机学院博士研究生,研究方向: 普适计算; 於志文( 1977-) ,男, 教授,博士生导师,研究方向: 普适计算,移动互联网和智能信息技术; 封云( 1989-) ,女,硕士研究生,研究方向: 普适计算; 周兴社( 1955-) ,男,教授,博士生导师,研究方向: 嵌入式计算,分布计算和普适计算。
2014 年第 1 期 文章编号: 1006-2475( 2014) 01-0186-06
计算机与现代化 JISUANJI YU XIANDAIHUA
基于 LBSN 的个性化旅游包推荐系统
总第 221 期
胥 皇,於志文,封 云,周兴社
( 西北工业大学计算机学院,陕西 西安 710072)
摘要: 旅游是人们生活中的重要部分,但是制定旅游计划是一件繁杂的工作。基于位置的社交网络( LBSN) 的发展,提供
随着无线通信技术的飞速发展,手机成为社会中 普及广泛的计算终端,成为人们与外界联系的不可或
缺工具,基于位置的社交网络( Location-Based Social Network,LBSN) 得到广泛应用。人们利用 LBSN 可 以随时随地共享自己的位置和活动数据,这些数据形 成了一个巨大的知识库,其中包含丰富的旅游相关信 息[4],挖掘并 使 用 这 些 信 息 将 使 旅 游 应 用 更 加 符 合 用户需求。
188
计算机与现代化
2014 年第 1 期
评分均值,取值在 0 ~ 10 之间,所以将 rankj归一化。
H(
j,m )
= 0.
5
×
∑ VT
u∈U
u,m,j
∑ VT u∈U,q∈c u,m,q
+ 0.
5
×
rankj 10
( 1)
4. 1. 2 频繁序列挖掘
地点之间存在顺序访问的关系,如用户可能喜欢
地点所属类型包括所属大类,如餐饮、景点等,以 及地点在所 属 大 类 中 的 小 类,如 餐 饮 大 类 中 的 湖 南 菜,每个大类都细分为若干小类。数据集中涉及的地 点的大类有 8 个,小类有 165 个,52016 个地点。本 系统主要考虑推荐 3 个大类的地点,分别是餐饮类、 休闲 / 娱乐 / 文化类以及景点 / 户外类。其中餐饮类包 括 36 个小类,休闲 / 娱乐 / 文化类包括 17 个小类,景 点 / 户外类包括 17 个小类。系统使用的数据集详情 如表 1 所示。