利用贝叶斯原理在隐私保护数据上进行分类的方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

t h e p r o b l e m t h a t t h e r e s u l t o f d a t a mi n i n g i s a f f e c t e d wh e n t h e r e t r i e v a b l e g e n e r a l a d d i t i v e d a t a p e r t u r b a t i o n( RGADP)a l g o r i t h m i s u s e d t o p r e s e r v e p r i v a c y i n d a t a b a s e .Th e p r o c e s s o f RGADP
法 。该方 法分析 R GAD P算 法过 程 , 利 用 贝叶斯原 理 , 根 据 扰 动 数据 推 算 原 始数 据 的概 率分 布 , 用
估 算 的 概 率 分 布 重 构数 据 , 并 对重 构数据 进行 分类 以提 高分 类的 正确性 。实验 结果表 明 : 该 方 法 估
算 出的概 率分 布与原 始数 据概 率分 布接近 , 且 重构 数 据 的分 类 正确 率相 比扰 动数 据 而 言 平均 可 提
第4 9卷
第 4 期
西 安 交 通 大 学 学 报
J 0URNAL OF XI ’ AN J I AOTONG UNI VE RS I TY
Vo 1 . 49 No. 4
A pr .2 01 5
2 0 1 5年 4月
DOI :1 0 . 7 6 5 2 / x j t u x b 2 Байду номын сангаас 1 5 0 4 0 0 8
Ab s t r a c t : A c l a s s i f i c at i o n me t ho d f or pe r t ur be d d a t a us i n g t he Ba y e s i a n r u l e i s p r e s e nt e d t o s o l v e
此该 方 法也具 有较 高的 效率 。
关键 词 :隐私保 护 ; 数 据扰 动 ; 贝叶斯原 理 ; 分 类
中 图分类 号 :TP 3 0 1 文献标 志 码 :A 文章 编 号 :0 2 5 3 — 9 8 7 X( 2 0 1 5 ) 0 4 — 0 0 4 6 — 0 7
A Cl a s s i f i c a t i o n Me t ho d f o r Pr i v a c y — Pr e s e r v e d Da t a Us i ng Ba y e s i a n Ru l e
2 .S ha a n x i Pr o v i nc e Ke y La b o r a t o r y o f Co mp u t e r Ne t wor k,xi a n J i a o t o n g Un i v e r s i t y,Xi ’ a n 7 1 0 0 4 9,Ch i n a;
a l g or i t h m i s a na l y z e d,a nd t he Ba ye s i a n r u l e i s u s e d t O e s t i ma t e t he pr o ba b i l i t y d i s t r i bu t i o n of o r i gi n a l d a t a f r om t he p e r t u r b e d da t a . The n, n e w d a t a a r e r e c o ns t r uc t e d f r o m t h e e s t i ma t e d pr o ba b i l i t y d i s t r i bu t i o n a nd a r e c l a s s i f i e d t o i n c r e a s e t he a c c ur a c y of c l as s i f i c a t i on . Expe r i me nt a l
高 4 9 / 6 以上 , 其更接 近 原始数 据 的分 类 正确 率 , 从 而 有 效地 降 低 了扰 动 算 法对 数 据 分 类的 影 响 ; 该
方 法的运行 时间与数 据 量和数 据 分组数 成正 比 , 重构 1 0 0 0 0条 数 据 的 运 行 时 间 在 2 0 0 ms以 内 , 因
3 .S c h o o l o f I n f o r ma t i on,Xi ’ a n Uni v e r s i t y o f Fi n a n c e a n d Ec o n o mi c s ,xi ’ a n 71 0 0 4 9,Ch i n a )
YANG Pa n , GU I Xi a o l i n ~, A N J i a n ~, TI AN Fe n g , W ANG Ga n g 。
( 1 .S c h o o l o f El e c t r o n i c s a n d I n f o r ma t i o n En g i n e e r i n g,Xi ’ a n J i a o t on g Un i v e r s i t y,Xi ’ a n 7 1 0 0 4 9,Chi n a ;
重 点 实 验 室 ,7 1 0 0 4 9 ,西安 ;3 . 西 安 财经 学 院信 息 学 院 , 7 1 0 0 4 9 ,西 安 )
摘 要 :针 对 可 还 原 数 据 扰 动 ( r e t r i e v a b l e g e n e r a l a d d i t i v e d a t a p e r t u r b a t i o n , RG ADP ) 算 法 在 保 护 数 据 库 隐私 时 会 影 响 数 据 挖 掘 结 果 的 问题 , 提 出一 种 利 用 贝 叶 斯 原 理 在 扰 动 数 据 上 进 行 分 类 的 方
利用 贝 叶斯 原 理在 隐私保 护数 据 上进 行 分 类 的方 法
杨 攀 。 ,桂 小林 ,安健 。 ,田丰 ,王 刚。
( 1 . 西 安 交 通 大 学 电 子 与 信 息 工 程 学 院 ,7 1 0 0 4 9 ,西安 ;2 . 西安 交 通 大学 陕 西 省计 算机 网 络
相关文档
最新文档