机器学习的隐私保护研究综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
机器学习的训练模式主要分为集中学习和联邦学习 2 类,前者在
模型训练前需统一收集各方数据,尽管易于部署,却存在极大数据隐私 与 安 全 隐 患;后 者 实 现 了 将 各 方
数据保留在本地的同时进行模型训练,但该方式目前正处于研究的起步阶段,无论在技术还是部署中仍
面临诸多问题与挑战 .
现有的隐私保护技术研究大致分为 2 条主线,即以同态加密和安全多方计算为代
i
ng homomo
r
i
c
que
yp
ph
enc
r
t
i
onands
e
cur
emu
l
t
i

r
t
ompu
t
i
ngandt
hepe
r
t
urba
t
i
on me
t
hodr
ep
r
e
s
en
t
edbyd
i
f
f
e
r
en
t
i
a
l
yp
pa
yc
r
i
va
c
a
chhav
i
ngi
t
sadvan
t
age
sandd
i
s
advan
t
age
61762082)andt
heNa
t
i
ona
lKeyRe
s
e
a
r
chandDeve
l
opmen
tPr
og
r
amo
fCh
i
na (
2016YFB1000602,2016YFB1000603).
r
v
i
ng;d
i
f
f
e
r
e
n
t
i
a
lp
r
i
v
a
c
c
h
i
n
el
e
a
r
n
i
ng;d
e
e
e
a
r
n
i
ng;f
e
d
e
r
a
t
e
dl
e
a
r
n
i
ng
y
p
y;ma
pl
ywo
实 现 了 经 济 效 益 和 社 会 效 益 的 共 赢,但 也 令
摘 要 大规模数据收集大幅提升了机器学习算法的性能,
个人隐私保护面临更大的风险与挑战 .
(
Co
l
l
egeofIn
o
rma
t
i
on,Renmi
nUn
i
v
e
r
s
i
t
i
na,Be
i
i
ng 100872)
f
yof Ch
j
Ab
s
t
r
a
c
t La
rge

s
c
a
l
eda
t
ac
o
l
l
e
c
t
i
onha
sva
s
t
l
r
ovedt
hepe
r
f
o
rmanc
eo
fma
ch
i
nel
e
a
rn
i
ng,and
yimp
,
a
twe
en t
r
ad
i
t
i
ona
l ma
ch
i
ne l
e
a
rn
i
ng mode
l
s and de
ep l
e
a
rn
i
ng mode
l
s.Then, we
summa
r
i
z
et
hepr
ob
l
emsex
i
s
t
i
ngi
nt
hecu
r
r
en
tf
ede
r
a
t
edl
e
a
rn
i
ngs
t
udy.
F
i
na
l
l
opo
s
et
2):346 362,2020
机器学习的隐私保护研究综述
刘俊旭 孟小峰
(中国人民大学信息学院 北京 100872)
(
unxu_l
i
u@r
uc.
edu.
cn)
j
Su
r
v
e
i
va
c
GPr
e
s
e
r
v
i
ng Ma
ch
i
neLe
a
rn
i
ng
yonPr
y
L
i
uJunxuand MengXi
ao
f
eng
ys
o
ft
hes
t
udy,i
ta
l
s
o ha
s many p
r
ob
l
emst
o bes
o
l
ved.Theex
i
s
t
i
ng wo
rk on p
r
i
va
cy

r
e
s
e
r
v
i
ng
p
t
e
chn
i
sc
an beconc
l
udedi
n
t
otwo ma
i
nc
l
ue
s—t
heenc
r
t
i
on me
t
hodi
nc
l
ud
61532016,
61762082);国 家 重 点 研 发 计 划 项 目 (
2016YFB1000602,
2016YFB1000603)
Th
i
swo
rkwa
ssuppo
r
t
edbyt
he Na
t
i
ona
lNa
t
ur
a
lSc
i
enc
eFounda
t
i
ono
fCh
i
na (
91646203,61532010,91846204,61532016,
s.
I
nt
h
i
spape
r,wef
i
r
s
tf
ocusont
hede
s
i
f
p
y,e
gno
d
i
f
f
e
r
en
t
i
a
l
l

i
va
t
ema
ch
i
nel
e
a
rn
i
nga
l
r
i
t
hm,e
spe
c
i
a
l
l
rc
en
t
r
a
l
i
z
eds
e
t
t
i
ng,andd
i
s
cus
st
he
y
pr
go
yunde
d
i
f
f
e
r
enc
e
s be
ch
i
evedawi
n
Gwi
ns
i
t
ua
t
i
onf
o
rbo
t
he
c
onomi
cands
o
c
i
a
lbene
f
i
t
s wh
i
l
epe
r
s
ona
lpr
i
vacre来自ser
va
t
i
on
yp
i
sf
a
c
i
ngnewandg
r
e
a
t
e
rr
i
sksandc
r
i
s
e
s.
I
nt
h
i
spape
r,wesumma
r
i
z
et
hep
a
l
i
z
edl
e
a
rn
i
ngandf
ede
r
a
t
edl
e
a
rn
i
ng.Thef
o
rme
rne
eds
t
oco
l
l
e
c
ta
l
lt
heus
e
rda
t
abe
f
o
r
et
r
a
i
n
i
ng.Al
t
hought
h
i
ss
e
t
t
i
ngi
se
a
syt
odep
l
oy,i
ts
t
i
l
lex
i
s
t
s
eno
rmous pr
i
va
cy and s
hema
i
n
y,wepr
cha
l
l
enge
si
nt
he f
u
t
u
r
e wo
rk and po
i
n
t ou
tt
he conne
c
t
i
on among pr
i
va
c
o
t
e
c
t
i
on, mode
l
y pr
i
n
t
e
rp
r
e
t
a
t
i
onandda
t
at
r
anspa
r
enc
y.
Ke
r
d
s p
r
i
v
a
c

r
e
s
e
e
cu
r
i
t
i
dden t
r
oub
l
e
s.The l
a
t
t
e
ra
ch
i
eve
st
ha
t ma
s
s
i
ve dev
i
c
e
sc
an
yh
c
o
l
l
abo
r
a
t
et
ot
r
a
i
nag
l
oba
lmode
lwh
i
l
eke
ep
i
ngt
he
i
rda
t
ai
nl
oc
a
l.Asi
ti
scu
r
r
en
t
l
nt
hee
a
r
l
t
age
yi
表的加密方法和以差分隐私为代表的扰动 方 法,二 者 各 有 利 弊 .
为 综 述 当 前 机 器 学 习 的 隐 私 问 题,并 对
收稿日期:
2019-06-21;修回日期:
2019-09-11
基金项目:国 家 自 然 科 学 基 金 项 目 (
91646203,
61532010,
91846204,
r
i
va
cyi
s
sue
si
n ma
ch
i
ne
l
e
a
rn
i
ngandt
heex
i
s
t
i
ng wo
rkonp
r
i
va
c

r
e
s
e
r
v
i
ng ma
ch
i
nel
e
a
rn
i
ng.Wer
e
spe
c
t
i
ve
l
i
s
cus
stwo
y
p
yd

s
e
t
t
i
ngso
ft
hemode
lt
r
a
i
n
i
ngp
r
o
c
e
s
s c
en
t
r
机器学习的训练模式主要分为集中学习和联邦学习2类前者在模型训练前需统一收集各方数据尽管易于部署却存在极大数据隐私与安全隐患
计算机研究与发展
J
ou
r
na
lo
fCompu
t
e
rRe
s
e
a
r
chandDe
ve
l
opmen
t
DOI:
10.
7544

i
s
sn1000

1239.
2020.
20190455
57(
相关文档
最新文档