基于MapReduce的贝叶斯垃圾邮件过滤机制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中 图分 类 号 : P l ;P 9 .9 T 3 1T 3 30 8 文献 标 志 码 : A
M a Re u e ba e y sa n is a le i e h nim p d c - s d Ba e i n a t・ p m f t rng m c a s i
TA0 n . a . XUE Zh n .u n. S e Yo g c i e gy a HI L i (colfI omai ni en ,Z egh uU i rt hnzo ea 50 1 hn) Sh o o fr tnE gn r g hnzo nv sy n o ei e i,Z egh uH n n4 00 ,C i a
o t z d t e malt i ig a d la nn y tk n d a tg fma s d t rc s ig o p e u e h x e me tlr s l p i e h i r n n n e r i g b a i g a v na e o s aa p o e sn fMa R d c .T e e p r n a e u t mi a i s
a t s a l r g me h n s w s p o o e , w ih f s mp o e h r d t n l a e in f trn e h i u , a d t e n i p m f t i c a im a r p s d - i en h c i t i r v d te t i o a r a i B y s l i g tc n q e a i e n h n
滤技术进行改进 , 另一方面利用 MaR dc 模 型的海量数据 处理优势优化 邮件集训练 与学 习。 实验表 明, p eue 较之 目前
流 行 的 传 统 贝 叶斯 算 法 、 最 近 邻 ( n 算 法和 支持 向 量 机 ( V 算 法 , 于 MaR d c X N) S M) 基 p e ue的 贝叶 斯 垃 圾 邮 件 过 滤 机 制 在 召 回 率 、 准 率 和精 确 率方 面保 持 了较好 的表 现 , 查 同时 降低 了邮 件 学 习和 分类 成 本 , 高 了 系统 执 行 效 率 。 提 关键 词 : 垃圾 邮件 ; 件过 滤 ; 邮 贝叶斯 算 法 ; a R d c ; 据 处 理 M p eue 数
第3 l卷 第 9期
2 1年 9 月 0l
计算机应用
J u n lo o ue p iai n o r a fC mp trAp l t s c o
Vo . No 9 1 3l .
S p. 011 e 2
文 章 编 号 :0 1— 0 1 2 l )9— 4 2一o 10 98 (O 1 0 2 1 5
( V )a o tm ,teMaR d c-ae aei ni pm ft n ehns e om ee nrcl pei o n S M l rh s h p euebsd B ys na tsa l r gm ca i pr r sb tri ea, rc i ad gi a - ie i m f t l sn
( yto Z.d .a i ca@ZU eu c) e
摘
要: 贝叶斯邮件过 滤器具有较强的分类能 力和较 高的准确性 , 但前期 的邮件 集训 练与学 习耗 用大量 系统 资
源和 网络 资 源 , 响 系统 效 率 。提 出一 种 基 于 MaR dc 技 术 的 贝 叶 斯 垃 圾 邮件 过 滤 机 制 , 方 面 对 传 统 贝叶 斯 过 影 p eue 一
so a o ae i e rdtnl aei l r geh i e K N a s N i br K N n u p ̄V co Mahn hw t t mprd t t aio a Bys nft i cnq , - er t eg o ( N )adSn t u e h
a c r c ,r d c st e c s o i la n n n l si ig a d i rv s t es s m f ce c . c u a y e u e h o t fmal e r i g a d c a s yn n mp o e h y t ef in y f e i
l anig a al tg o u s yse a d n t r e o c sa d af c y tm f c e c e r n te ry sa e c ns me ma ss tm n ewok r s ure n fe ts se ef i n y.A a i M pRe c — a e y sa du e b s d Ba e in
Ab ta t h a e in a t s a f trh s sr n ls i c t n c p ct n ih a c r c ,b tt e ma l ri i g a d sr c :T e B y s n i p m l a t g ca s ai a a i a d h g c u a y u h i tan n a — ie o i f o y n
d i1.7 4 S ..07 2 1 .2 1 o:0 3 2/ P J 18 .0 0 42 1
基 于 Ma R d c p e u e的 贝 叶 斯 垃 圾 邮 件 过 滤 机 制
陶永才, 薛正 元 , 石 磊
( 州 大学 信 息 工 程学 院 , 州 40 0 ) 郑 郑 50 1
M a Re u e ba e y sa n is a le i e h nim p d c - s d Ba e i n a t・ p m f t rng m c a s i
TA0 n . a . XUE Zh n .u n. S e Yo g c i e gy a HI L i (colfI omai ni en ,Z egh uU i rt hnzo ea 50 1 hn) Sh o o fr tnE gn r g hnzo nv sy n o ei e i,Z egh uH n n4 00 ,C i a
o t z d t e malt i ig a d la nn y tk n d a tg fma s d t rc s ig o p e u e h x e me tlr s l p i e h i r n n n e r i g b a i g a v na e o s aa p o e sn fMa R d c .T e e p r n a e u t mi a i s
a t s a l r g me h n s w s p o o e , w ih f s mp o e h r d t n l a e in f trn e h i u , a d t e n i p m f t i c a im a r p s d - i en h c i t i r v d te t i o a r a i B y s l i g tc n q e a i e n h n
滤技术进行改进 , 另一方面利用 MaR dc 模 型的海量数据 处理优势优化 邮件集训练 与学 习。 实验表 明, p eue 较之 目前
流 行 的 传 统 贝 叶斯 算 法 、 最 近 邻 ( n 算 法和 支持 向 量 机 ( V 算 法 , 于 MaR d c X N) S M) 基 p e ue的 贝叶 斯 垃 圾 邮 件 过 滤 机 制 在 召 回 率 、 准 率 和精 确 率方 面保 持 了较好 的表 现 , 查 同时 降低 了邮 件 学 习和 分类 成 本 , 高 了 系统 执 行 效 率 。 提 关键 词 : 垃圾 邮件 ; 件过 滤 ; 邮 贝叶斯 算 法 ; a R d c ; 据 处 理 M p eue 数
第3 l卷 第 9期
2 1年 9 月 0l
计算机应用
J u n lo o ue p iai n o r a fC mp trAp l t s c o
Vo . No 9 1 3l .
S p. 011 e 2
文 章 编 号 :0 1— 0 1 2 l )9— 4 2一o 10 98 (O 1 0 2 1 5
( V )a o tm ,teMaR d c-ae aei ni pm ft n ehns e om ee nrcl pei o n S M l rh s h p euebsd B ys na tsa l r gm ca i pr r sb tri ea, rc i ad gi a - ie i m f t l sn
( yto Z.d .a i ca@ZU eu c) e
摘
要: 贝叶斯邮件过 滤器具有较强的分类能 力和较 高的准确性 , 但前期 的邮件 集训 练与学 习耗 用大量 系统 资
源和 网络 资 源 , 响 系统 效 率 。提 出一 种 基 于 MaR dc 技 术 的 贝 叶 斯 垃 圾 邮件 过 滤 机 制 , 方 面 对 传 统 贝叶 斯 过 影 p eue 一
so a o ae i e rdtnl aei l r geh i e K N a s N i br K N n u p ̄V co Mahn hw t t mprd t t aio a Bys nft i cnq , - er t eg o ( N )adSn t u e h
a c r c ,r d c st e c s o i la n n n l si ig a d i rv s t es s m f ce c . c u a y e u e h o t fmal e r i g a d c a s yn n mp o e h y t ef in y f e i
l anig a al tg o u s yse a d n t r e o c sa d af c y tm f c e c e r n te ry sa e c ns me ma ss tm n ewok r s ure n fe ts se ef i n y.A a i M pRe c — a e y sa du e b s d Ba e in
Ab ta t h a e in a t s a f trh s sr n ls i c t n c p ct n ih a c r c ,b tt e ma l ri i g a d sr c :T e B y s n i p m l a t g ca s ai a a i a d h g c u a y u h i tan n a — ie o i f o y n
d i1.7 4 S ..07 2 1 .2 1 o:0 3 2/ P J 18 .0 0 42 1
基 于 Ma R d c p e u e的 贝 叶 斯 垃 圾 邮 件 过 滤 机 制
陶永才, 薛正 元 , 石 磊
( 州 大学 信 息 工 程学 院 , 州 40 0 ) 郑 郑 50 1