近十年国外旅游推荐系统的应用研究_乔向杰
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[基金项目]本研究受国家社科基金重点项目(13AJY016)、北京市教委科技计划项目(SQKM201411417012)和北京联合大学“新起点”计划项目(zk201220)共同资助。
[This study was supported by grants from the Key Project of National Social Science
Foundation
of
China
(to
ZHANG
Lingyun)
(No.13AJY016),the Science and Technology Project of Beijing Municipal Education Commission (to QIAO Xiangjie )(No.SQKM201411417012)and the “New Start ”Academic Research Projects of Beijing Union University (to QIAO Xiangjie)(No.zk201220).]
[收稿日期]2013-03-12;[修订日期]2013-09-28
[作者简介]乔向杰(1977—),女,河南信阳人,博士,讲师,研究方向为旅游信息化与旅游推荐系统,E-mail:lytxiangjie@ ;张凌云(1960—),男,上海人,教授,博士生导师,研究方向为旅游信息化、旅游经济与管理、基础理论,E-mail:zhanglingyun1960@ ,通讯作者。
[摘
要]利用网络进行在线信息搜索已成为旅游者在旅游
前获取信息的主要渠道,然而随着互联网的普及发展以及电子商务网站的兴起,旅游者常常被淹没于大量的信息搜索和产品选择当中,而旅游推荐系统则是解决信息超载问题的有效方法。
文章通过国外近十年的相关文献的收集整理,对旅游推荐系统的概念、应用及发展现状进行了分析,并重点对旅游推荐系统中的关键技术运用等进行了综述,指出旅游推荐系统应用的复杂性与特殊性,以及在旅游推荐系统中单纯利用基于协同过滤或基于内容过滤的技术的限制性而更多地采用基于知识的及混合的方法;探讨了旅游决策理论在推荐系统中的作用与应用;最后提出了旅游推荐系统的一般模型及未来研究热点,以期对国内旅游推荐系统的研究与应用有所借鉴。
[关键词]信息超载;个性化;旅游推荐系统;旅游决策理论[中图分类号]F59[文献标识码]A
[文章编号]1002-5006(2014)08-0117-11Doi:10.3969/j.issn-1002-5006.2014.08.012
1引言
1.1推荐系统的概念、应用及发展
旅游行业已经成为B2C 电子商务最重要和活
跃的领域之一,旅游行业的总交易额在2003年即占
有全球B2C 的50%以上的份额[1]。
大量的近期研究表明,至少在西方发达国家,网络已经成为用户搜索和预订旅游服务的主要信息来源[2,3],有四分之三的旅游者在出游前往往会考虑在线搜索旅游评论信息来规划他们的行程[4]。
借助信息与通讯技术(ICT )技术,用户已经可以大量地在线进行旅游信息的搜索、旅游产品与服务的选购,比如在线机票预订、在线酒店预订、在线行程规划、在线门票购买等,从而大大提高了旅游体验度。
然而,随着互联网的普及发展以及电子商务网站的兴起,网络信息的爆炸式增长和新的电子商务服务(产品选购,产品比优,拍卖等)常常将旅游者淹没于大量的信息搜索和产品选择当中,使得他们无力进行理性决策。
旅游者会发现,从网站提供的众多的产品和服务中选取最适合的选项是非常困难的。
推荐系统则被认为是近年来一个解决信息超载问题的有效方法[5,6]。
在没有足够信息和知识的情况下,消费者常常会依赖家人、朋友、专家(如销售)来辅助决策。
推荐系统的价值就在于它能为顾客提供相关的选择而不需要顾客明确定义他们所想要的内容的能力[7]。
豪伯尔和特里夫茨(Haubl &Trifts )定义推荐系统为一种基于对用户特性信息学习而进行推荐的软件工具[8]。
在一些文献中亦认为推荐系统是一种向用户提供相关项目(item,项目是指系统向用户推荐的内容)的建议的软件工具和技术[9-11]。
推荐系统同以搜索引擎为代表的信息检索系统(information retrieval system )看起来相似,伯克(Burke )则更强调推荐结果的个性化(individulized )、有趣且有用(interesting and
useful )[10,12]。
“搜索”是你明确地知道自己要找的内容,而“发现”是你并不明确地知道,而这些东西还潜在的存在,并且主动找到了你[13]。
推荐系统是指产生个性化的推荐,或者以个性化的方式引导用户在大量的选项中选择有趣的或有用的对象的系统。
信息检索或搜索引擎是帮助用户查询他正想
近十年国外旅游推荐系统的应用研究
乔向杰,张凌云
(北京联合大学旅游学院,北京100101)
查找的内容,其结果对所有的用户是相同的。
如果要做决策就必须进行深度的搜索,比如选项比较、知识获取、产品选择。
而推荐系统则要根据每个用户的喜好、习惯、个性化需求来智能地定制其反馈的结果与排序的内容,而不是简单地对查询关键字的匹配。
最近,现代web搜索引擎也依赖于推荐技术来实现高级搜索特性。
比如,搜索引擎推荐当前用户查询的类似查询,或者试图应用一些个性化的形式来产生查询结果,即不仅仅是同查询项相关,而且同用户的上下文相关(如当前的位置信息)以及搜索历史等。
当今,推荐系统已被大量应用于各类电子商务网站并支持上亿消费者的产品搜索。
推荐系统亦被认为是互联网中发展最快的应用之一,并将被逐步精细化和提高效率[7]。
目前已经成为一些电子商务网站不可缺少的一部分,已经被广泛应用于推荐书[14]、文章[15]、电影[16]、电视节目[17]、新闻[18]、音乐[19]、网页[20]等。
亚马逊网络商店()通过数据挖掘算法和基于协同过滤的算法寻找具有相似用户消费偏好,用来预测和发现用户可能感兴趣的商品,从而大大提高了客户的黏性和销售率。
为了提高系统的推荐性能,美国最大的DVD租赁网站Netflix设立了100万美元的奖金,奖励给可以让推荐机制性能提高10%的人[13]。
在旅游方面,两个最成功的推荐系统技术应用是triplehop的tripmatcher (被应用于)和VacationCoach 的专家建议平台MePrint(被应用于travelocity. com)。
这两个推荐系统试图通过模拟传统旅游代理同用户商榷和帮助用户简化假日目的地的搜索过程[5]。
1.2旅游推荐系统的行业应用
推荐系统在缺少足够的个人选择经验时提供决策帮助:一方面,是“推”的过程,即向客户推荐产品,另一方面,是“拉”的过程,向客户提供信息,帮助他们决定购买什么产品。
因此,它既是旅游者用于搜索相关旅游信息的一个得力助手,亦是旅游管理组织部门及电子商务企业,开展旅游目的地的营销及产品与服务推广的有力工具。
比如,一个旅游目的地推荐系统可以:(1)使得潜在的旅游者去“体验”目的地;(2)简化选择目的地并满足特殊需求和愿望的旅游决策过程;(3)方便产品和服务的随时随地购买;(4)通过客户关系管理技术激励潜在游客反复重游一个目的地[7]。
Trip@dvice是由意大利特兰托(Trento)的电子
商务与旅游研究实验室研发的专门应用于旅游领域而设计的推荐技术,为了推广此项技术与应用,专门成立了ECTRL Solutions公司负责运维,而其主要客户即是目的地管理组织,为了给其官方网站访问者提供个性化内容和旅游行程规划,并已经被一些目的地旅游组织选择作为他们的旅游门户支持[21]。
例如,是欧洲旅游委员会(ETC)推介欧洲旅游目的地的电子营销门户,它提供一个基于内容的和协同过滤的方法来帮助游客构建个性化的旅行路线规划工具,并将Trip@dvice 组件嵌入其中来支持旅游访问者的信息搜索过程[22];意大利的威尼托区(Veneto)也将Trip@dvice旅游计划和推荐组件整合到它们的官方旅游门户网站中;奥地利国家旅游局为的门户开发了基于Trip@dvice的推荐工具;意大利比耶拉省(Biella)采用Trip@dvice技术开了发他们新的门户网站。
在旅游电子商务企业中,则采用了V ocationCoach的MePrint平台来提高网站的转化率、客户满意度并最终提高客户忠诚度。
该系统主要由知识个性化技术(knowledge personalization technology,KPT)实现,包括3个功能模块:智能用户建模、专家知识库和建议引擎,类似于一个专家系统。
SkiMatcher推荐系统即是TripleHop的Tripmatcher推荐引擎应用于滑雪旅游电子商务网站的定制化版本。
通过对网站4个月的转化率的实证分析,发现使用了推荐系统的应用使得用户从浏览到购买的过程的决策效率提升了4.95倍。
而且从用户对该系统使用的评价也证明了用户对系统能有效辅助其旅游决策的高满意度[23,49]。
2旅游推荐系统的学术研究现状
推荐系统最早成为一个独立的研究领域是在20世纪90年代中期[24]。
在最近几年,推荐系统的关注极速增加。
这主要是基于几个方面的原因:一是由于推荐技术在目前流行的电子商务网站如,YouTube,Netflix,Tripadvisor,Last.frm 以及IMDb等的成功运用;二是有较流行的同该领域相关的会议和研讨会。
比如由美国计算机协会ACM组织的“The ACM Conference Series on Recommender Systems”(/),从2007年开始到目前已经成功举办了8次,是一个专门致力于推荐技术研究、推广和应用的国际会议。
另外,也有一些传统的专题会议像数据库、信息系统和自适应系统里也包含推荐系统相关的议题。
在这些会议中,最值得一提的是ACM的信息检索专题兴趣组SIGR,用户建模、自适应和个性化UMAP,以及数据管理专题兴趣组SIGMOD等所主办的专题会议。
另外,在学术期刊上也有专栏讨论推荐系统的研究与开发的,如:AI Communication、IEEE Intelligent Systems、International Journal of Electronic Commerce、ACM Transactions on Computer-Human Interaction及ACM Transactions on Information Systems等[25]。
为了全面了解国外旅游推荐系统相关的研究现状与进展,笔者以“tourism recommender systems”为关键词,分别在四大著名的外文数据库Springer、ScienceDirect、EBSCO(Hospitality&Tourism Complete)、IEEE Explore中进行检索发现,旅游推荐系统的研究从20世纪初开始,并正在成为当前的研究热点。
从期刊所属的学科来看,主要分布于计算机学科、旅游管理学科以及信息技术与旅游的交叉学科中,尤其是Springer数据库中检索的结果明显反映出在计算机学科领域里,主要包括人工智能、语义网络、用户建模、机器学习、数据挖掘、决策支持、自适应系统、信息检索、人机交互等。
这主要是因为旅游推荐系统是推荐系统在旅游行业中的应用之一,而推荐系统最初也是来源于信息抽取技术及信息检索技术等与计算机紧密相关的领域,在实现这一系统时往往要用到这些与人工智能相关的理论与技术。
在ScienceDirect数据库中期刊主要为计算机类、旅游类以及社会与行为科学类。
目前许多旅游类的期刊亦将旅游信息化、智能化的技术与应用作为一个主要的论题。
在EBSCO数据库中,大量的期刊来自Information Technology& Tourism和Information and Communication Technologies in Tourism。
其中Information Technology&Tourism为当前旅游与信息技术交叉领域的专门期刊,Information and Communication Technologies in Tourism是由国际信息技术与旅游业联盟(IFITT)主办的ENTER会议的论文集,该论文集每年均由Springer-Verlag出版社作为Springer-Computer Sciences丛书系列的文集正式出版发行。
其他相关论文涵盖率较高的期刊主要为专家系统及其应用(Expert Systems with Applications)、基于知识的系统(Knowledge-Based Systems)、旅游管理(Tourism Management)、用户建模和用户自适应交互(User Modeling and User-Adapted Interaction)、电子商务和Web技术(E-Commerce and Web Technologies)等。
另外,由费森梅尔、沃贝尔和沃斯内尔(Fesenmaier、Wӧber&Werthner)主编的《目的地推荐系统:行为基础和应用》一书(Destination Recommendation Systems:Behavioral Foundations and Applications)[7]集结了致力于旅游推荐系统的主要专家及学者对目的地推荐系统的行为基础、系统设计、案例分析及未来研究趋势的全方位的学术成果,为研究旅游推荐系统的应用提供了重要的参考。
3旅游推荐系统
3.1按推荐技术分
3.1.1协同过滤技术(collaborative filtering)
基于协同过滤的推荐系统是根据用户的偏好提供个性化的推荐,通常通过用户对产品的评分、购买历史来发现用户的兴趣并找出可能的相似用户,相似用户喜欢的产品也将会推荐给当前用户。
协同过滤技术具有推荐新项目、产生新奇推荐的能力,能够发现用户潜在的但尚不知道的兴趣爱好;适用于推荐难以进行内容分析的非结构化的项目(如图像、视频、音乐等)。
然而,协同过滤推荐系统也存在一些难以解决的问题,比较典型的有数据稀疏性问题(用户评分数据少),冷启动问题(包括项目冷启动和用户冷启动,指当一个新项目或新用户加入系统时,由于没有对该项目的评分或该用户的评分信息,因此该项目就无法得到推荐,或无法理解用户的兴趣和无法找到类似的用户来推荐),算法的可扩展性问题(随着用户数和项目数的增加而使得计算量急剧增加)等。
因此,在利用协同过滤技术设计推荐系统时,往往要考虑如何解决这些问题。
例如,霍罗佐维等人(Horozov,et al.)所采用的基于协同过滤的方法中[26],在处理冷启动问题时,系统以居住得近的用户所喜欢的景点类型也相似的假设为前提,主要采用了三项策略:通过人工引入虚拟用户,事先对餐馆分类并进行评分,从而使得在很少评价的情况下也能找到相同类别的用户;允许系统随机产生基于相似度驱动的选择项;向用户推荐离其最近的具有最高平均评分的项目。
3.1.2基于内容的过滤技术(content-based filtering)
基于内容的推荐技术通过分析用户所偏好项目的特性来构建用户描述文件。
这种系统是利用用户的历史内容来产生用户描述文件的,新的项目将会用于匹配用户描述文件来发现最接近的项目。
然而,基于内容的推荐系统由于根深于信息抽取技术[24],也具有一些难以克服的缺点:(1)由于特
征提取的能力有限,基于内容的推荐技术通常只能应用于资源内容比较容易分析的系统,对于非结构化数据(图形、视频、音乐等)难以进行内容分析的数据,也常会因为缺少相应的特征提取技术而无法处理。
(2)推荐的资源范围过于狭窄。
这主要是因为系统总是尽量向用户推荐与用户所感兴趣的内容特征最相符的项目,因而常常不能对系统所发现的当前用户兴趣之外的新奇项目进行推荐。
两个最成功的推荐系统TripMacher(triplehop. com)和MePrint()都可被分类为基于内容的方法,用户通过表达需求、偏好和限制,系统来匹配项目描述。
MePrint通过显式地询问用户将用户进行归类(文化迷、海滩迷等),并推断出用户没有提出的隐式需求[32]。
而TripMatcher则采用的是较为复杂的方法,综合考虑用户的历史行为和当前的上下文情境和偏好。
为了更好地匹配用户需求,系统构建了一个专门的领域知识对话模型,并采用行业专家输入和自动文本挖掘分析两种方法建立了包括400多个目的地信息的专业知识库,用于匹配用户的偏好特性。
然而对于一个企业和机构来说,要构建这样一个庞大的数据库是一个历时较长、成本较高的过程,因此,这类产品在推广时往往将基于目的地的知识库封装到产品版本当中,便于后期的扩展和使用,同时提供相应的过滤和文本挖掘技术[49]。
INTRIGUE将项目(景点)结构化为若干个属性,如景点的名称、代码、类型、艺术风格、游览时间、电话、开放时间等,并对每个属性根据用户的特点赋予权重来计算用户的兴趣[28]。
3.1.3基于知识的过滤技术(knowledge-based filtering)
基于知识的过滤技术利用用户和产品的知识来产生推荐,即使用一个推理过程来发现什么产品最适合用户需求[12]。
该种技术没有冷启动的问题,因为它不依赖于用户的打分。
但这种方法需要大量的领域知识和推理技术。
在旅游推荐系统中,更多的是采用基于案例的推荐技术[27-33]。
基于案例推理的技术从以前推荐过的相似案例中找到直接可用的或通过修改后可以解决当前存在问题的案例进行推荐。
3.1.4混合推荐技术(hybrid)
混合推荐系统通过整合两种或更多推荐技术可以取得更好的推荐效果,最常见的做法是将协同过滤推荐技术与其他某一种推荐技术相结合,以克服冷启动问题。
常用的混合推荐方法有:权重型、合并型、瀑布型、特征递增型、元层次型等[12]。
主要是充分利用各种技术的优点来规避某种技术的不足来提高推荐性能与推荐精度。
例如,饭店推荐系统Entree即是采用的瀑布型的处理方式[12],即先采用基于知识的推荐技术产生一个按照用户所表达喜好的排名,然后使用基于协同过滤的技术进一步对之前的结果集进行排序。
相关研究亦证明,采用纯CF技术的推荐精度为52%,采用纯CBF技术的推荐精度为55%,而采用混合推荐技术的推荐精度在80%以上[34]。
3.2按照用户使用终端分类
按照用户使用系统终端的不同,可以分为基于计算机和移动终端设备的推荐系统。
实际上,从2003年到2004年是旅游移动推荐系统发展的旺盛期,到2005年以后才有更多的基于计算机的旅游推荐系统被开发出来。
这主要是由于基于计算机的推荐系统的功能更强大,旅游者能组织整个行程,而不是像在移动设备上只能获取单一主题的信息。
当然,2000年以后也出现了一些推荐系统既能用于计算机,又能用于移动设备[35]。
旅游移动推荐系统在技术实现上与传统基于计算机的推荐系统是相似的,但在推荐时尤其受到移动上下文的影响。
这里的上下文信息可以通过嵌入移动设备中的感应器(比如GPS模块、加速计、计时器、罗盘、陀螺仪、相机)、Web服务(比如天气报告或公共交通信息服务)、支持设施(如从部署在一个特定地区或人群中的感应器中获取温度信息)或其他用户(通过WPAN连接)来获取。
潜在用户上下文参数的例子有位置、距离吸引物的距离、预算、时间、季节、空闲时间、交通方式、天气状况、移动历史(比如用户已经游览过的景区)、社会环境等。
也就是说,除了考虑位置还要考虑其他上下文信息。
但是,移动设备本身的特点,如有限的输入、计算能力以及移动设备的交互能力,使得移动推荐系统的发展更具挑战性[36]。
同时,随着3G、4G等移动通信技术的逐步应用以及云计算、网格计算等技术的兴起,也使得移动互联网的访问速度以及终端存储和处理能力不足等问题得到缓解,从而有利于智能移动设备中推荐系统的应用。
移动设备的可携带性使得用户之间的互动更加频繁(如移动通信、移动社交网络服务),也使得移动社交网络的构建更容易,并且更真实可靠。
因此,有些移动推荐系统也将社交网络服务引入其中[37-40],不仅支持游览城市还能分享游览后的感受。
用户的活动(如移动模式、游览过的景点、浏览过的网页
等)被系统自动记录,与旅游者相关的内容(如评论、给景点打分、照片/视频等)也同时被管理和共享。
社交网络服务的应用有些是直接集成到推荐系统作为系统的一部分[37],而有些是基于第三方的社交网络平台来抽取用户的档案信息,如I’m feeling Loco System即是基于foursquare平台[38],SPETA系统是基于OpenSocial API进行集成的[40]。
实际上,各种形式的社交网络如家庭、朋友、同学、同事、讨论组、兴趣组等,对于发现相似用户、相似兴趣以及移动项目的推荐都是非常有用的。
3.3按推荐的项目分类
个性化推荐应用到旅游领域里,既包括对单体的景点、酒店、餐馆、航班等的推荐,亦包括对旅游目的地、旅游计划、旅游包等涵盖多项产品、活动与服务等组合内容的推荐。
如Traveller提供一个假日包[34];相似地,Travel Planner包含住宿、餐馆、活动和交通[41];在A V ANTI中提供一些旅游站点、酒店和度假村等信息的推荐[42]。
在评价产品和服务时所考虑的准则因素亦根据所推荐的项目的不同而不同(表1)。
在航班推荐中,大都会将价格作为主要因素,许多系统也把目的地和用户所在的位置作为考虑因素。
也有少数采用了站点、旅行的区间、航空公司或范围。
景点推荐的因素大都为位置、价格、时间和兴趣。
如SPETA主要考虑三种因素:景点主题(文化、休闲、现代艺术等)、吸引物区位(室内或室外)、时间约束(景点开放和关闭的时间)。
有些文献还主要考虑了用户个性与动机,如旅游动机(享受大自然、学习新知识、寻找新发现、逃避现实环境)、年龄阶段、职业、个性等[43]。
CABATA在一个案例中,主要考虑假日类型(休闲、活动、学习语言),选择地区(既有总体的描述像山岳、海洋,也包括具体的国家或城市),希望的交通方式(汽车、火车、飞机),旅行的季节,预期的价格等[33]。
一些系统提供对许多服务的推荐,同一系统用几个因素,但一些被用于每一个服务,而有些只用于一个。
如Traveller采用以下因素:范围、位置或目的地、价格、交通方式、交通公司(如航空公司)、住宿(酒店名字)、住宿类型(小旅馆、五星酒店等)、房间类型(单人间、双人间;标准间、套间)以及服务类型。
所有的因素只有在一个系统必须推荐多个不同的服务时采用。
许多系统也都跟Traveller相似,在推荐旅行包时通过组合不同的服务来提供推荐。
一些系统还提供个性化的地图向导。
在所有这些系统中,主要的因素是用户的位置。
而对于移动推荐系统来说,基于其自身的特点,通常会使用用户当前的位置来过滤结果,并会更多地考虑上下文参数。
例如对景点的推荐,包括时间[44],已经参观过的景点[45],用户移动模式[44],天气[45]、交通方式[38]、用户心情[38]、社交环境[37][45]等。
对于酒店的推荐可能会考虑提供的设施、用户评价、可以预订的房间、入住/退房的时间、距离景点的远近和价格等;而对于餐馆的推荐则会考虑菜系、位置、开放时间、客户评价、菜单和价格范围等。
但同时也会考虑上下文信息,如季节、当前时间、位置、天气、温度等。
3.4关于旅游推荐系统的特殊性讨论
推荐系统应用在旅游领域里,有着区别于其他推荐项目的特殊性。
首先,旅游推荐系统的设计与应用更为复杂。
旅游经历是包括旅游产品和服务的复杂过程,不仅包括人的主观决策因素,还包括
表1推荐项目及其准则因素Tab.1Recommender items and criteria
推荐项目Recommender items
航班
Flights
旅行包Travel packages
景点
Attractions
餐馆/咖啡店Restaurants/Cafes
酒店
Hotels
旅游计划
Travel plans
准则因素
Criteria
价格、经停站、出发点、目的地、时间(起飞、到达)、飞行时间、航空公司
目的地、季节、价格、类型、历史或艺术风格(指吸引物)
类型、距离、价格、位置、时间、天气、交通、经历、兴趣/目标、参观过的景点、用户心情、移动模式、社交环境、旅游动机、个性、职业、年龄
价格、菜系、就餐时间、开放日/时间点、设施可得性、位置、服务类型、菜单、客户评价
位置、价格、居住天数、时间、饭店星级、房间类型(单人间、双人间、标准间、套房等)、类别、可以预订的房间、入住/退房的时间、距离景点的远近
旅游期望和约束(旅游同伴、预算限额、交通方式、住宿类型、离开地、旅游季节、旅游时间、旅游目的如运动、冒险、放松、追求艺术与文化体验等)、旅行包(旅游地类型、住宿、活动、吸引物)
资料来源:据本研究整理。