大数据背景下隐私保护方法研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

假名技术是将数据要素中的用户标识信息即用户 ID 隐 藏起来,使用一个无关假名替换或者删除用户标识,以打破 用户隐私与用户数据之间的联系,从而保护了用户隐私。通 常条件下,假名技术并不能很好保护用户的隐私。比如,某 时某刻某地只有一个用户的数据,虽然攻击者不能直接了解 数据与用户的关联关系,但是通过其他方式得知了该时该地 存在的唯一用户是谁,就能窃取用户的隐私信息,此时需要 更高纬度的隐私保护技术。
1 引言
在大数据时代,来自社交网络、物联网、Internet 等新兴 平台和网络的数据正在以惊人的速度产生,而数据的不断增 长和累积,又形成了丰富的大数据资源。很好利用大数据, 可以给个人生活带来便利,比如,购物时的喜爱推荐等,还 能帮助政府机构更好地作出一些决策。但如果使用不当,会 给人们的日常生活带来烦扰,比如,保险公司会打电话推销 保险,这类骚扰电话都是因为个人隐私信息泄露造成的。如 今数据泄露事件数不胜数,例如,土耳其曾经发生过重大的 数据泄露事件,这起事件涉及上千万公民的个人隐私信息, 其中包括电话号码、亲属关系、住址等个人敏感信息。美国 著名有线电视公司时代华纳也曾被黑客攻击,几十万用户的 邮件密码等个人隐私信息被窃取。数据泄露事件的频发让人 们对隐私安全问题越来越关注,如今迫切地需要使用隐私保 护技术来保护数据,避免敏感信息泄露。
关键词:隐私保护;匿名技术;差分隐私 中图分类号:TP309.2 文献标识码:A 文章编号:1003-9767(2018)07-050-03
Research on Privacy Protection Method in Big Data Background
Lin Qing
(Xi'an Peihua University, Xi'an Shaanxi 710125, China) Abstract: The author introduces several aspects of privacy protection. The first is the traditional privacy protection technology and focuses on anonymous technology. It then introduced the emerging concept of privacy protection - differential privacy. The differential privacy model is a widely accepted and strict privacy protection model. It adds random noise to the data set to influence the attacker to steal sensitive information in the data. It does not depend on the attacker's background knowledge and can be quantitatively analyzed. The risk of privacy leaks. Key words: privacy protection; anonymous technology; differential privacy
2 传统隐私保护技术
2.1 加密技术 加密技术 [1] 是对于数据而言的,在隐私保护中也有应用,
对用户的敏感信息进行加密,达到保护用户隐私的目的。目 前常见的加密技术有对称和非对称加密、Hash 加密、同态加 密和安全多方计算等等。
2.2 匿名技术
不同于针对数据的加密技术,匿名技术的本质是将数据 与用户名称(ID)区分开来,使攻击者无法将收集到的隐私 数据与实际用户联系起来,那么他所得到的隐私数据信息就 失去了本身的意义。常见的隐私匿名技术有假名匿名、时空 匿名、k- 匿名等等。
(2)
表示,用户发布位置数据或者进行位置服务时提供的位置数
式中:
Baidu Nhomakorabea
据并不是真实准确的,而是把包括自己所在位置在内的一整
D 和 D'——相邻数据集;
块区域发送给服务商,从而提高了隐私保护程度。
||F(D)-F(D')||——查询函数在两个数据集上输出结果的
算法语言
信息与电脑 China Computer&Communication
大数据背景下隐私保护方法研究
2018 年第 7 期
林 青
(西安培华学院,陕西 西安 710125)
摘 要:笔者介绍了隐私保护的几个方面,首先是传统的隐私保护技术,重点介绍了匿名技术。其后介绍了隐私保 护的新兴概念——差分隐私。差分隐私模型是一种被广泛认可的严格的隐私保护模型,它通过向数据集里添加随机噪声, 来影响攻击者窃取数据中的敏感信息,它不依赖攻击者的背景知识,并且可以定量分析隐私泄露的风险。
定义 2:全局敏感度。差分隐私通过添加噪声来保护隐
私,其噪声大小与全局敏感度密切相关。敏感度小,只需要
添加少量噪声就可以达到很好的隐私保护效果;反之,则需 要添加大量噪声来实现数据的保护。设有查询函数 f:D → Rd,
f 的全剧敏感度 Δf 定义如下:
理,是将用户的具体空间数据用一个模糊的宽泛的空间区域= ∆f maxD,D′ F ( D) − F ( D′)
基金项目:西安培华学院科研项目(项目编号:PHKT17054)。 作者简介:林青(1979-),女,陕西西安人,硕士研究生,副教授。研究方向:计算机网络。
— 50 —
2018 年第 7 期
信息与电脑 China Computer&Communication
算法语言
2.2.1 假名匿名
的子集 S,有如下公式:
2.2.2 时空匿名
时空匿名 [2] 顾名思义就是对时空数据进行模糊匿名处
Pr{F ( D) ∈ S} ≤ Pr{F ( D′) ∈ S}× eε
(1)
式中:
Pr{}——隐私泄露的风险、概率;
实数 ε——差分隐私保护系数,也被称作差分隐私预算。
ε 的值与隐私保护程度成反比,即 ε 越小,隐私保护
度越大。
相关文档
最新文档