反垃圾邮件过滤技术探讨
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
掉 , 其是 当合 法 邮件 含 有 与 过 滤 规则 相 似 的 内容 尤 时 。同 时 , 垃圾 邮件制 造 者 也 经 常更 换 垃 圾 邮 件发
件 , 毒 ,o 攻 击等不 良网络行 为 。据 统计 , 互联 病 Ds 在
网发送的邮件 中, %是垃圾 邮件, 7 5 用户的收件箱中
常常充斥着未被请 求 的、 欺诈性 的或者令 人反 感 的邮
件 。为了处理这些 垃圾邮件 , 用户 常常需 要花 费相 当
多的时间 。为 了反击 垃圾 邮件 , 人提 出 了许 多反 相关 垃圾 邮件 的策 略与技 术 , 许多 策略与技术 已经 被应用 于实 际 的反垃圾 邮件行动之 中 , 有效地 减少 了用户 收 件箱 中的垃圾 邮件数 量 。在各种反 垃圾 邮件 技术 中 ,
Absr c t a t:Atf s ,t s p p ra ay e e s a prblm n o r c u ty r t hi a e n l s s t p m o e i u o n r .Th n i e ume ae r e a t— i h e t n r t st e n h i s a fl rn p r a h swi ey u e y p o l a y sa le ig i mp a ie .Atls ,t e a t— p m ti g a p o c e d l s d b e p e, nd Ba e i n Fi rn s e h sz d i e t a t h ni s a flei g tc n lg n t e f t r spu o wad. p m trn e h oo y i h u u e i tf r r i Ke y wor : s a ;fle n ds p m i tr g;eT rd si ci n r t i io itn t ae o
摘
要 :首先 分析 了垃圾 邮件ห้องสมุดไป่ตู้在我 国泛 滥 的 严 重性 ,然后 列举 了现 今 被 广 泛使 用 的反 垃圾 邮件
过 滤技 术 ,并 重点分 析 了贝叶 斯过 滤技 术 在反 垃圾 邮件 实践 中的应 用 ,最后 对 未 来反 垃圾 邮件
过 滤技 术提 出 了展 望 。
关 键词 :垃圾 邮件 ;过 滤 ;误辨 率
件 的产 生 。下 文将 介 绍 现 有 的垃圾 邮件 过 滤 技 术 ,
技术 的智 能化 程度 是 比较低 下 的 , 因此 , 它不 能满 足
未来 邮件 过滤 的需 要 。
2 散 列 值 过 滤
散列值 过 滤是将 收集 到 垃圾 邮件 的特征 进行 哈 希 运 算 , 算 后得 到 的散 列 值作 为过 滤 规 则 进行 将计 储 存 和使 用 。基 于 散 列 值 的过 滤 系 统 在 处 理 邮件
收 稿 日期 :2 1 0 0 0— 1—1 I
并对 未来 的邮件过 滤技 术提 出展 望 。
1 内容 过 滤
内容 过滤 指直 接根 据 电子 邮件 的不 同内容 区域
作者简介 :陈要武 (9 7一) 女 , 16 , 哈尔滨理 工大学在读硕 士, 主要研 究方 向为 电子信息工程。
0 引言
近 年来 , 全球互 联 网用 户数 量 随着 It t ne 的膨 me
胀 而急剧增长 , 随之 而产生 了许 多 问题 , 例如 : 垃圾 邮
进行 过 滤 。过 滤 规 则 一 般 由 MT 管理 员 为 所 有本 A
地用 户制 定 , 过滤 的 区域有 信头 内容 、 正文 内容或 邮 件扩 展部 分 的 内容 等 。过滤 规则 可设定 为分 析或解 析恶 意 的邮件 信头 区域 , 析 邮件 正文 内容 以查找 解 垃圾 邮件关 键 词 , 检查 邮件 扩展部 分 ( 如附件 ) 。 等 许 多基 于 内容过 滤 技 术 的垃圾 邮件 过 滤 系统 , 都容 易将 合法 的 邮件误识 别 为垃 圾 邮件 而将 其过滤
Dic s i n o n is a le i g t c n l g s u so n a t-p m f t r n e h o o y i
CHEN o WH Ya . ( el gin o il rdt f c , abn 10 0 , hn ) H i n j gS ca C ei O e H r i 5 0 1 C ia o a i
送手段 , 以逃避系统过滤, 如使用生僻的文字和带有
文字 的 图片 。为 了保 证 内容过 滤规 则 的 有 效性 , 管
理 员 必须 经常 更新 过 滤 规 则 。 由此 可 见 , 内容 过滤
最常用且最有效的技术是垃圾邮件过滤技术 。
邮件过滤 技术 可 以在不 修改 现有 电子 邮件 协议 的基 础 上直接 使用 。较 好 的过滤 技术 可 以减少 误将 合 法 邮件 当成 垃圾 邮件 过 滤 掉 的 可 能性 , 而最 大 从 限度地提 高垃 圾 邮件 的过滤 效率 。过 滤技 术虽 然能 够 阻止 垃圾 邮件进 入 邮件 系 统 , 无法 阻止 垃 圾 邮 但
一
1 6l 一
时, 先计算接收邮件的特征散列值 , 再利用散列值与 预设的规则进行 比较 , 如果符合垃圾邮件的规则 , 那 么, 该邮件将被视为垃圾 邮件而被系统过滤。然而, 这种过 滤技术 也有其 缺 点 , 圾 邮件 制 造 者经 常 通 垃 过向邮件中插人无用信息干扰过滤系统对共同特征 的识别 , 从而逃 脱系统过 滤 。
2 1 年第7 00 期
中图分类号 :P 9 .9 T3308 文献标识码 : A 文章 编号 :09— 5 2 2 1 )7— 11— 2 10 2 5 (0 0 0 0 6 0
反 垃 圾 邮 件 过 滤 技 术 探 讨
陈要 武
( 黑龙江省社 会信用办公室 ,哈尔滨 10 0 50 1)
件 , 毒 ,o 攻 击等不 良网络行 为 。据 统计 , 互联 病 Ds 在
网发送的邮件 中, %是垃圾 邮件, 7 5 用户的收件箱中
常常充斥着未被请 求 的、 欺诈性 的或者令 人反 感 的邮
件 。为了处理这些 垃圾邮件 , 用户 常常需 要花 费相 当
多的时间 。为 了反击 垃圾 邮件 , 人提 出 了许 多反 相关 垃圾 邮件 的策 略与技 术 , 许多 策略与技术 已经 被应用 于实 际 的反垃圾 邮件行动之 中 , 有效地 减少 了用户 收 件箱 中的垃圾 邮件数 量 。在各种反 垃圾 邮件 技术 中 ,
Absr c t a t:Atf s ,t s p p ra ay e e s a prblm n o r c u ty r t hi a e n l s s t p m o e i u o n r .Th n i e ume ae r e a t— i h e t n r t st e n h i s a fl rn p r a h swi ey u e y p o l a y sa le ig i mp a ie .Atls ,t e a t— p m ti g a p o c e d l s d b e p e, nd Ba e i n Fi rn s e h sz d i e t a t h ni s a flei g tc n lg n t e f t r spu o wad. p m trn e h oo y i h u u e i tf r r i Ke y wor : s a ;fle n ds p m i tr g;eT rd si ci n r t i io itn t ae o
摘
要 :首先 分析 了垃圾 邮件ห้องสมุดไป่ตู้在我 国泛 滥 的 严 重性 ,然后 列举 了现 今 被 广 泛使 用 的反 垃圾 邮件
过 滤技 术 ,并 重点分 析 了贝叶 斯过 滤技 术 在反 垃圾 邮件 实践 中的应 用 ,最后 对 未 来反 垃圾 邮件
过 滤技 术提 出 了展 望 。
关 键词 :垃圾 邮件 ;过 滤 ;误辨 率
件 的产 生 。下 文将 介 绍 现 有 的垃圾 邮件 过 滤 技 术 ,
技术 的智 能化 程度 是 比较低 下 的 , 因此 , 它不 能满 足
未来 邮件 过滤 的需 要 。
2 散 列 值 过 滤
散列值 过 滤是将 收集 到 垃圾 邮件 的特征 进行 哈 希 运 算 , 算 后得 到 的散 列 值作 为过 滤 规 则 进行 将计 储 存 和使 用 。基 于 散 列 值 的过 滤 系 统 在 处 理 邮件
收 稿 日期 :2 1 0 0 0— 1—1 I
并对 未来 的邮件过 滤技 术提 出展 望 。
1 内容 过 滤
内容 过滤 指直 接根 据 电子 邮件 的不 同内容 区域
作者简介 :陈要武 (9 7一) 女 , 16 , 哈尔滨理 工大学在读硕 士, 主要研 究方 向为 电子信息工程。
0 引言
近 年来 , 全球互 联 网用 户数 量 随着 It t ne 的膨 me
胀 而急剧增长 , 随之 而产生 了许 多 问题 , 例如 : 垃圾 邮
进行 过 滤 。过 滤 规 则 一 般 由 MT 管理 员 为 所 有本 A
地用 户制 定 , 过滤 的 区域有 信头 内容 、 正文 内容或 邮 件扩 展部 分 的 内容 等 。过滤 规则 可设定 为分 析或解 析恶 意 的邮件 信头 区域 , 析 邮件 正文 内容 以查找 解 垃圾 邮件关 键 词 , 检查 邮件 扩展部 分 ( 如附件 ) 。 等 许 多基 于 内容过 滤 技 术 的垃圾 邮件 过 滤 系统 , 都容 易将 合法 的 邮件误识 别 为垃 圾 邮件 而将 其过滤
Dic s i n o n is a le i g t c n l g s u so n a t-p m f t r n e h o o y i
CHEN o WH Ya . ( el gin o il rdt f c , abn 10 0 , hn ) H i n j gS ca C ei O e H r i 5 0 1 C ia o a i
送手段 , 以逃避系统过滤, 如使用生僻的文字和带有
文字 的 图片 。为 了保 证 内容过 滤规 则 的 有 效性 , 管
理 员 必须 经常 更新 过 滤 规 则 。 由此 可 见 , 内容 过滤
最常用且最有效的技术是垃圾邮件过滤技术 。
邮件过滤 技术 可 以在不 修改 现有 电子 邮件 协议 的基 础 上直接 使用 。较 好 的过滤 技术 可 以减少 误将 合 法 邮件 当成 垃圾 邮件 过 滤 掉 的 可 能性 , 而最 大 从 限度地提 高垃 圾 邮件 的过滤 效率 。过 滤技 术虽 然能 够 阻止 垃圾 邮件进 入 邮件 系 统 , 无法 阻止 垃 圾 邮 但
一
1 6l 一
时, 先计算接收邮件的特征散列值 , 再利用散列值与 预设的规则进行 比较 , 如果符合垃圾邮件的规则 , 那 么, 该邮件将被视为垃圾 邮件而被系统过滤。然而, 这种过 滤技术 也有其 缺 点 , 圾 邮件 制 造 者经 常 通 垃 过向邮件中插人无用信息干扰过滤系统对共同特征 的识别 , 从而逃 脱系统过 滤 。
2 1 年第7 00 期
中图分类号 :P 9 .9 T3308 文献标识码 : A 文章 编号 :09— 5 2 2 1 )7— 11— 2 10 2 5 (0 0 0 0 6 0
反 垃 圾 邮 件 过 滤 技 术 探 讨
陈要 武
( 黑龙江省社 会信用办公室 ,哈尔滨 10 0 50 1)