实用文档其他之差分隐私保护下一种改进的协同过滤推荐算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
差分隐私保护下一种改进的协同过滤推
荐算法
【摘要】协同过滤(cf)是推荐系统中最常用的算法,然而传统的构建在协同过滤上的推荐系统很难提供一个严格并有数学证明的隐私保证。
近期研究表明,攻击者可以通过观察用户的推荐结果,推测出用户的评分记录,这将对用户的隐私造成极大的威胁。
论文在应用差分隐私保护技术的隐私保持协同过滤算法的基础上,对用户与物品进行裁剪,从而大量减少了噪声的引入,在保证隐私的前提下提升了算法准确度。
同时,论文提出的算法改进方法具有较广的适用性,能够与已有的研究能够很好的结合。
【关键词】协同过滤(cf);差分隐私保护;安全
【 abstract 】 collaborative filtering (cf) is the most common algorithm in recommender system. however, the traditional approaches can hardly provide a rigid and provable privacy guarantee for recommender system. recent research revealed that by observing the public output of the cf, the adversary could infer the historical ratings of the particular user, which will cause a great threat to user privacy. this paper address the privacy issue in cf by cutting the data,which is constructed on the basis of the notion of differential privacy. as a result, this method would reduce the large number of noise introduced by differential privacy algorithm,and increase the accuracy of the algorithm with privacy preserving. furthermore, our method can easily apply in the existing research.
1 引言
ramakrishnan等人首次提出在推荐系统中的隐私问题,narayanan等人通过联合netflix与imdb的发布数据集成功的标识出部分户。
calandrino等人通过观察推荐系统一段时间内推荐结果的变化,结合背景知识推断出某用户的历史评分与行为。
差分隐私保护是一种在满足差分隐私的条件下保证发布数据或查询结果的精确性的,有着严格数学证明的理论,能够有效的保护个人隐私。
在通常情况下,由于推荐系统中的查询往往具有较高的敏感度,所以应用差分隐私技术会引入大量的噪声,这会导致在保证隐私的同时会有较大的精度损失。
很多学者就差分隐私在推荐系统中的应用提出不同的方法,在隐私保护与推荐的准确性方面均取得了不错的效果,但仍有许多局限性,它们主要表现在两个方面。
(1)差分隐私技术会引入噪声,由于推荐系统中的查询往往具有较高的敏感度,所以应用差分隐私技术会引入大量的噪声,导致数据可用性较差。
为了减少大量噪声的引入,现有研究往往采用各自定义的局部敏感度进行计算,但这使得推荐算法仅在特定应用场景有较好的效果。
(2)现有研究的各种隐私保护推荐算法对原有算法进行了大量的改进,但算法的大量修改使得其很难利用传统推荐领域已有研究成果。
本文在应用差分隐私保护技术的隐私保持协同过滤算法的基础上,根据隐私保护程度对用户与物品进行裁剪,从而大量减少了噪声的引入。
同时,本文提出的算法改进方法具有较广的适用性,能够与已有的研究能够很好的结合。
2 改进的隐私保持协同过滤推荐算法
在本部分,我们将提出改进的隐私保持协同过滤推荐算法(ipricf)来解决基于近邻的协同过滤推荐算法中的隐私问题,在后面的部分,我们将首先介绍算法的总体思想,然后对我们的算法进行详细的描述。
2.1 算法思想
定义1 (全局敏感度)对于任意一个函数f:d→rd,函数f的全局敏感度为:
2.2 算法描述
根据以上思想,改进的隐私保持协同过滤推荐算法描述如下:算法1 ipricf。