基于d-邻域子图匿名的社会网络隐私保护
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
金 华 张志祥 , ,刘善成 鞠时光 ,
(. 1 江苏大学 计算机科学与通信工程学院, 江苏 镇江 22 1 ; . 103 2 南通大学 杏林学院, 江苏 南通 260 ) 20 2
摘 要 :社会 网络分 析 可能会侵 害到 个体 的隐私信 息 , 需要 在发 布的 同时进行 隐私保 护 。针 对社会 网络发 布 中
了将顶点聚类与边 聚类相结合 的方法 ; i Lu等人 研 究 了不 带 有标签 的社会 网络 的 一 名 问题 J并 研究 了把 边 的权重 值 匿 ,
当做敏感值进行隐私保护 的匿名方 法。Z o h u等人 考虑 了顶 点带有非敏感 属性 的社会 网络的匿名保护 ,om d 等人 提 Croe
Ke r s sc a ew r s r a y p e e ain;d n ih o h o u g a h;k a o y t y wo d : o il t o k ;p i c r s r t n v v o — eg b r o d s b r p - n n mi y
是攻击者仍 然可以通过节点 的邻域 子图信 之 间的最短路径 长度小 于正 整数 d 且 的节点 , 度为 1则该路径上 的所有 点也构成一个超边 。 ,
基 于上述 定义 , 文提 出 了基 于超 边矩 阵表示 的 d邻域 本 一
子 图匿名模型 。其基本思 想是通过对 顶点 d邻域 子图的 匿名 一
化使得 图中每个节 点的 d邻域子 图都 至少 与 k一1 - 个节点 的 d 一 邻域子 图同构 , 而保 证攻 击者 无法 通过 节 点 的子 图以超 过 从 1k的概率识别 出该 节点 。采 用基 于贪 心 的分 组 策略 将满 足 /
( .colfC m ue c ne Tl o mu i t n n i e n JaguU i rt, hna gJ n s 10 3 C ia 2 Xn l ol e 1Sh o o o p t Si c & e cm nc i s gn n g, ins nv sy Z e in i gu2 2 1 , hn ; . igi Clg r e e ao E e ei j a n e
出了对二分 图进行 匿名的( 1 一 ,)安全分组方 法。
然而 由于社会 网络 的复杂性 , 攻击者也 比较容易通过 图的
( 原始 图 a )
节点匿名图
图1 社 会网络发布图
结构信息 实施 隐私攻击 。例 如 , 1 a 表示 一个综 合 的亲密 图 ()
朋友社会 网络 。网络中的每个节 点代 表一个人 , 两个人之 间若 有边相连则表示他们是 亲密朋友 。
( 1 域子 图 a 邻 ) 节点匿名保护图
d邻域子图同构的节点分到 同一组 , 并通过邻域 匿名化保证每
个分组 中的节 点至少有 k 。实现步骤如下 : 个 a 提取每个节点 的 d邻域子 图。 ) -
图2 1 - 邻域子 图攻击示 例
本文在前人研 究的基础上对 1邻 域子 图 的攻 击进行 了扩 .
第2 8卷 第 1 1期
21 0 1年 1 1月
计 算 机 应 用 研 究
Ap lc t n Re e r h o mp t r p i ai s a c fCo u e s o
V0 . 8 No 1 12 . 1 NO . 0 l V 2 1
基 于 d邻 域 子 图 匿名 的社 会 网络 隐私 保 护 术 一
系 。这些信息通常 以社会 网络的形式进行描述 和发布 , 但是如
果直接对社会 网络进行 发布一定 会造成 大量 的隐私泄 露。 目 前 国外研究者 已经提 出了一 些用 于保 护社会 网络 隐私发布 的 模型 _ J 1 。如 H y等人 提 出 的基 于顶点 聚类 的匿名 方法 ; a Ze v hl a等人 提 出的基于边聚类 的方法 ; a pn等人 提 出 e Cm a
作者简介 : 华(9 7 ) 金 17 一 ,男,江苏海安人 讲师 , 博士研究生 , 主要研 究方向为数据库安全 、 隐私保护 (ih a j.d . n ; j u @useu e ) 张志祥( 9 6 ) n 17 - , 男, 士 , 硕 主要研 究方向为隐私保护 ; 刘善成( 9 8 ) 18 一 ,男,硕士研 究生, 主要研 究方 向为 隐私保护 ; 时光( 9 5 ) 鞠 15 一 ,男, 授 , 导, 士, 教 博 博 主要研
s b r p f et x.a d e s r d t a 出e n mb r fi mo p i - eg b r o d s b r p sn e st a fre e e e . u ga h o r v e n n u e h t u e so o r hc d n ih o h o u g a h wa o l s h n s o v r v r x y t
为 了充分地保护隐私 信息 , 在社会 网络发 布时 , 就需要 保 证任何个体在匿名 网络 中都 不能 以高于某 一概率 被正确地 识
别出来 , 例如用 1k来表示该 概率 , 中 k是一 个用 户指定 的 / 其
如果仅仅隐去网络中个体的标志信息 , 如图 1b 所示 , () 但
收稿 日期 :2 1— 42 0 10 -9;修回 日期 :2 1- 6 0 0 10 — 8
c n v oae t e i d vd a r a y a i lt h n i iu l i c .T i p p rp o o e -n n mi d l fd n ih o h o u g a h d s rb d b ti p v h s a e rp s d a k a o y t mo e — eg b r o d s b r p e ci e y ma r y o x
b 引入贪 心分 组策 略 , ) 设计 了基 于超 边矩 阵 表示 的 d邻 一
域子 图 尼匿名发布算法 。 一 e 在模拟数据 集上 进行 了 大量实 验 , ) 测试 了数据 的发 布 质量 和执行效 率 , 明了模型 的有效性 。 说
o up — d e I ta so me t a n miain f s bg a nt thig t marx whc rpr s n e te d— eg o h o fs e e g . t r n f r d he no y z t o u rph i o ma c n he o t ih e e e td h n ihb r o d i
存在 的邻 域攻 击 问题 , 出 了基 于超 边矩 阵表 示 的 d邻 域子 图 k匿名模 型。该模 型 采用矩 阵表 示顶 点的 d邻 域 提 一 . 一
子图, 通过 矩阵 的 匹配来 实现 子 图的 k匿名 , 得 匿名 化 网络 中的 每 个节 点都 拥有 不 少于 k个 同构 的 d邻 域 予 一 使 一 图。 实验 结果 表 明该 模型 能够 有效地抵 制 邻域 攻击 , 保护 隐私信 息 。
Ex e m e a e u t ho t tt epr p s d mo lc n ef ciey r ss e g o h o ta k n r s r eprv c n om ain. p r ntlr s lss w ha h o o e de a fe tv l e itn ihb r o d at c sa d p e e ia y ifr to i v
节点分到 同一组 。
a 提 出了超边 矩 阵的概 念 , 出 了基于 超边 的邻 域 提取 ) 给
原则 , 利用简化的三角 矩阵 表示 d邻 域子 图 , 并 一 实现 子 图的k -
匿名模型 。
d 通过 匿名化使分 组满足 |匿名 。 ) } j -
1 2 邻 域 提 取 及 表 示 .
关 键 词 :社 会 网 络 ;隐 私 保 护 ; 一 域 子 图 ; 一 名 d邻 k匿
中图分 类号 :T 3 1 P 1
文献标 志码 :A
文章 编号 :10 —6 5 2 l ) 14 2 —4 0 139 (0 1 1—320
d i1 .9 9 ji n 10 — 6 5 2 1 . 10 7 o :0 3 6/ .s .0 1 3 9 . 0 1 1 . 8 s
展, 提出了一种通 用 的 d邻域 子 图 隐私保 护模 型 。本 文 的主 一
要贡献如下 :
b 采用基 于超边 的三角矩阵表示 d邻域 子图。 ) 一 e 基于贪心的 策略 , 照节 点度 由高 到低对 d邻 域子 图 ) 按 一 三角矩 阵进行 同构 测试 , 将满足 同构要求 的节 点或接近同构的
参数与关系表隐私保 护 的 一 匿名模 型 中的 相 同。在上 例 中
基金项 目:国家 自然科 学基金 资助项 目(0 7 0 9 ; 苏省 自然科 学基金 资助 项 目 6 7 34 ) 江
( K 00 9 ) 国家教育部博士点基金 资助项目(0 9 2 7 10 5 。 B 2 1 12 ; 20 3 2 10 0 )
N nog U i rt,N nogJa gu26 0 ,C ia a tn nv sy a t ins 2 0 2 hn ) e i n
Absr t: Pr s r i rv c s v r c say frs c a e wo k i fr to b ih n t ac e e vng p a y i ey ne e s r o o iln t r no ma in pu ls i g,b a e a ay i fs c a t r i ec us n lss o o ilnewo ks
P e e vn rv c n s ca ewo k a e n r s r i g p ia y i o iln t r sb s d o d- eg b r o d s b rp n n mi n ih o h o u ga h a o y t y
JN Hu ,Z I a HRN Z i in I h n c e g ,J h.u n G h- a g ,L U S a —h n U S i a g x g
0 引言
近年来伴随着互联 网的高速发展 , 涌现出了很 多知名的社 会网站 , Fcbo 、 S ae 若邻 网、 内网等。这些 网站 提 如 aeok Myp c 、 校 供 了大量 的人们在 网络上 的活动 以及 他们彼 此间 的互动和 联
攻 击者知道图 1 a 中的陈某有 四个 亲密朋友 , 这 四个 朋友 () 在 中有两人彼此也 是亲密朋友 , 另有 两个人彼 此不认 识对方 , 如 图 2 a 所示 , 图称 为陈某 的 1邻域 子图。由于在图 1 b 中 () 该 一 () 没有相 同 1邻域子 图 的节点 , . 因此该 攻击 者根 据其 背景 知识 可以很 容易地将 代表陈某 的节点 唯一 地识 别 出来 。同样钱某 也可以被唯一地识别出来 。这样 攻击 者可 以知道 陈某 和钱 某 是 亲密的朋友 , 而且他们拥 有一个 共 同的亲密朋 友 , 而导致 从 其 他的私人信息也可以进一步推导 出来 。
究方 向 为数 据 库 理 论 和 信 息 安 全 .
第 1 期 1
金
华 , : 于 d邻域 子 图 匿名 的社会 网络 隐私 保护 等 基 一
・ 3 3・ 42
可以通过添加噪声边连接 张某 和李某 , 得到 图 2 b , ( ) 这样钱某 和陈某 的 1 邻域 子图都不 是唯一的 , 而实现隐私保护 。 一 从
(. 1 江苏大学 计算机科学与通信工程学院, 江苏 镇江 22 1 ; . 103 2 南通大学 杏林学院, 江苏 南通 260 ) 20 2
摘 要 :社会 网络分 析 可能会侵 害到 个体 的隐私信 息 , 需要 在发 布的 同时进行 隐私保 护 。针 对社会 网络发 布 中
了将顶点聚类与边 聚类相结合 的方法 ; i Lu等人 研 究 了不 带 有标签 的社会 网络 的 一 名 问题 J并 研究 了把 边 的权重 值 匿 ,
当做敏感值进行隐私保护 的匿名方 法。Z o h u等人 考虑 了顶 点带有非敏感 属性 的社会 网络的匿名保护 ,om d 等人 提 Croe
Ke r s sc a ew r s r a y p e e ain;d n ih o h o u g a h;k a o y t y wo d : o il t o k ;p i c r s r t n v v o — eg b r o d s b r p - n n mi y
是攻击者仍 然可以通过节点 的邻域 子图信 之 间的最短路径 长度小 于正 整数 d 且 的节点 , 度为 1则该路径上 的所有 点也构成一个超边 。 ,
基 于上述 定义 , 文提 出 了基 于超 边矩 阵表示 的 d邻域 本 一
子 图匿名模型 。其基本思 想是通过对 顶点 d邻域 子图的 匿名 一
化使得 图中每个节 点的 d邻域子 图都 至少 与 k一1 - 个节点 的 d 一 邻域子 图同构 , 而保 证攻 击者 无法 通过 节 点 的子 图以超 过 从 1k的概率识别 出该 节点 。采 用基 于贪 心 的分 组 策略 将满 足 /
( .colfC m ue c ne Tl o mu i t n n i e n JaguU i rt, hna gJ n s 10 3 C ia 2 Xn l ol e 1Sh o o o p t Si c & e cm nc i s gn n g, ins nv sy Z e in i gu2 2 1 , hn ; . igi Clg r e e ao E e ei j a n e
出了对二分 图进行 匿名的( 1 一 ,)安全分组方 法。
然而 由于社会 网络 的复杂性 , 攻击者也 比较容易通过 图的
( 原始 图 a )
节点匿名图
图1 社 会网络发布图
结构信息 实施 隐私攻击 。例 如 , 1 a 表示 一个综 合 的亲密 图 ()
朋友社会 网络 。网络中的每个节 点代 表一个人 , 两个人之 间若 有边相连则表示他们是 亲密朋友 。
( 1 域子 图 a 邻 ) 节点匿名保护图
d邻域子图同构的节点分到 同一组 , 并通过邻域 匿名化保证每
个分组 中的节 点至少有 k 。实现步骤如下 : 个 a 提取每个节点 的 d邻域子 图。 ) -
图2 1 - 邻域子 图攻击示 例
本文在前人研 究的基础上对 1邻 域子 图 的攻 击进行 了扩 .
第2 8卷 第 1 1期
21 0 1年 1 1月
计 算 机 应 用 研 究
Ap lc t n Re e r h o mp t r p i ai s a c fCo u e s o
V0 . 8 No 1 12 . 1 NO . 0 l V 2 1
基 于 d邻 域 子 图 匿名 的社 会 网络 隐私 保 护 术 一
系 。这些信息通常 以社会 网络的形式进行描述 和发布 , 但是如
果直接对社会 网络进行 发布一定 会造成 大量 的隐私泄 露。 目 前 国外研究者 已经提 出了一 些用 于保 护社会 网络 隐私发布 的 模型 _ J 1 。如 H y等人 提 出 的基 于顶点 聚类 的匿名 方法 ; a Ze v hl a等人 提 出的基于边聚类 的方法 ; a pn等人 提 出 e Cm a
作者简介 : 华(9 7 ) 金 17 一 ,男,江苏海安人 讲师 , 博士研究生 , 主要研 究方向为数据库安全 、 隐私保护 (ih a j.d . n ; j u @useu e ) 张志祥( 9 6 ) n 17 - , 男, 士 , 硕 主要研 究方向为隐私保护 ; 刘善成( 9 8 ) 18 一 ,男,硕士研 究生, 主要研 究方 向为 隐私保护 ; 时光( 9 5 ) 鞠 15 一 ,男, 授 , 导, 士, 教 博 博 主要研
s b r p f et x.a d e s r d t a 出e n mb r fi mo p i - eg b r o d s b r p sn e st a fre e e e . u ga h o r v e n n u e h t u e so o r hc d n ih o h o u g a h wa o l s h n s o v r v r x y t
为 了充分地保护隐私 信息 , 在社会 网络发 布时 , 就需要 保 证任何个体在匿名 网络 中都 不能 以高于某 一概率 被正确地 识
别出来 , 例如用 1k来表示该 概率 , 中 k是一 个用 户指定 的 / 其
如果仅仅隐去网络中个体的标志信息 , 如图 1b 所示 , () 但
收稿 日期 :2 1— 42 0 10 -9;修回 日期 :2 1- 6 0 0 10 — 8
c n v oae t e i d vd a r a y a i lt h n i iu l i c .T i p p rp o o e -n n mi d l fd n ih o h o u g a h d s rb d b ti p v h s a e rp s d a k a o y t mo e — eg b r o d s b r p e ci e y ma r y o x
b 引入贪 心分 组策 略 , ) 设计 了基 于超 边矩 阵 表示 的 d邻 一
域子 图 尼匿名发布算法 。 一 e 在模拟数据 集上 进行 了 大量实 验 , ) 测试 了数据 的发 布 质量 和执行效 率 , 明了模型 的有效性 。 说
o up — d e I ta so me t a n miain f s bg a nt thig t marx whc rpr s n e te d— eg o h o fs e e g . t r n f r d he no y z t o u rph i o ma c n he o t ih e e e td h n ihb r o d i
存在 的邻 域攻 击 问题 , 出 了基 于超 边矩 阵表 示 的 d邻 域子 图 k匿名模 型。该模 型 采用矩 阵表 示顶 点的 d邻 域 提 一 . 一
子图, 通过 矩阵 的 匹配来 实现 子 图的 k匿名 , 得 匿名 化 网络 中的 每 个节 点都 拥有 不 少于 k个 同构 的 d邻 域 予 一 使 一 图。 实验 结果 表 明该 模型 能够 有效地抵 制 邻域 攻击 , 保护 隐私信 息 。
Ex e m e a e u t ho t tt epr p s d mo lc n ef ciey r ss e g o h o ta k n r s r eprv c n om ain. p r ntlr s lss w ha h o o e de a fe tv l e itn ihb r o d at c sa d p e e ia y ifr to i v
节点分到 同一组 。
a 提 出了超边 矩 阵的概 念 , 出 了基于 超边 的邻 域 提取 ) 给
原则 , 利用简化的三角 矩阵 表示 d邻 域子 图 , 并 一 实现 子 图的k -
匿名模型 。
d 通过 匿名化使分 组满足 |匿名 。 ) } j -
1 2 邻 域 提 取 及 表 示 .
关 键 词 :社 会 网 络 ;隐 私 保 护 ; 一 域 子 图 ; 一 名 d邻 k匿
中图分 类号 :T 3 1 P 1
文献标 志码 :A
文章 编号 :10 —6 5 2 l ) 14 2 —4 0 139 (0 1 1—320
d i1 .9 9 ji n 10 — 6 5 2 1 . 10 7 o :0 3 6/ .s .0 1 3 9 . 0 1 1 . 8 s
展, 提出了一种通 用 的 d邻域 子 图 隐私保 护模 型 。本 文 的主 一
要贡献如下 :
b 采用基 于超边 的三角矩阵表示 d邻域 子图。 ) 一 e 基于贪心的 策略 , 照节 点度 由高 到低对 d邻 域子 图 ) 按 一 三角矩 阵进行 同构 测试 , 将满足 同构要求 的节 点或接近同构的
参数与关系表隐私保 护 的 一 匿名模 型 中的 相 同。在上 例 中
基金项 目:国家 自然科 学基金 资助项 目(0 7 0 9 ; 苏省 自然科 学基金 资助 项 目 6 7 34 ) 江
( K 00 9 ) 国家教育部博士点基金 资助项目(0 9 2 7 10 5 。 B 2 1 12 ; 20 3 2 10 0 )
N nog U i rt,N nogJa gu26 0 ,C ia a tn nv sy a t ins 2 0 2 hn ) e i n
Absr t: Pr s r i rv c s v r c say frs c a e wo k i fr to b ih n t ac e e vng p a y i ey ne e s r o o iln t r no ma in pu ls i g,b a e a ay i fs c a t r i ec us n lss o o ilnewo ks
P e e vn rv c n s ca ewo k a e n r s r i g p ia y i o iln t r sb s d o d- eg b r o d s b rp n n mi n ih o h o u ga h a o y t y
JN Hu ,Z I a HRN Z i in I h n c e g ,J h.u n G h- a g ,L U S a —h n U S i a g x g
0 引言
近年来伴随着互联 网的高速发展 , 涌现出了很 多知名的社 会网站 , Fcbo 、 S ae 若邻 网、 内网等。这些 网站 提 如 aeok Myp c 、 校 供 了大量 的人们在 网络上 的活动 以及 他们彼 此间 的互动和 联
攻 击者知道图 1 a 中的陈某有 四个 亲密朋友 , 这 四个 朋友 () 在 中有两人彼此也 是亲密朋友 , 另有 两个人彼 此不认 识对方 , 如 图 2 a 所示 , 图称 为陈某 的 1邻域 子图。由于在图 1 b 中 () 该 一 () 没有相 同 1邻域子 图 的节点 , . 因此该 攻击 者根 据其 背景 知识 可以很 容易地将 代表陈某 的节点 唯一 地识 别 出来 。同样钱某 也可以被唯一地识别出来 。这样 攻击 者可 以知道 陈某 和钱 某 是 亲密的朋友 , 而且他们拥 有一个 共 同的亲密朋 友 , 而导致 从 其 他的私人信息也可以进一步推导 出来 。
究方 向 为数 据 库 理 论 和 信 息 安 全 .
第 1 期 1
金
华 , : 于 d邻域 子 图 匿名 的社会 网络 隐私 保护 等 基 一
・ 3 3・ 42
可以通过添加噪声边连接 张某 和李某 , 得到 图 2 b , ( ) 这样钱某 和陈某 的 1 邻域 子图都不 是唯一的 , 而实现隐私保护 。 一 从