基于规则匹配算法信息过滤系统的设计与实现

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

协 议头 信息 , 取 HT 提 TP等协 议 中的相关 语法 元素 中 的数 据 , 造成 文 档 , 构 传递 给 文 档过 滤 模 块. 模 块 该
运 行在前 台. () 5 过滤模 块. 滤模块 负责 过滤 文档 流. 过 它通 过 比较 后 台存储 的 P oi 文 件 和 输入 的文 档 , rf e l 过滤 出 用 户感 兴趣 的结果 文档 , 将它 们按 照过滤 规则 提交 给用户 . 并 该模 块 运行在 前 台.
网络 上大量 的 反动 资料 、 宣扬 邪 教 、 暴力恐 怖 等不 良信 息 干扰 了正 常 的 网络 生 活. 因此 增 加 对 网 络信 息 的
监 控手 段 , 提高 信息 过滤 的能力便 成 为 一种 强 烈 的需 求.目前 互 联 网上 的 绝 大 多数 信 息均 表 现 为 文 本 方 式, 信息 过滤 的 关键 技术 是文 本信 息 过滤技 术 , 这个 文本 信息 过 滤分 为 3部分 : 滤特 征描 述 、 过 数据 特征 表 示 和过 滤过程 _ . 1 本文 依 次解决 这 些 问题 , 出了不 良信 息过 滤 系统解 决 方案 . ] 提
1 网络 信息 过滤 系统 的 系统 结构
作 为 网络信 息 的监视 系统 , 网络信 息过 滤 系统 ( F ) 集 来 自网络 的信 息 , 既 可 以作 为 网关 软件 NI S 采 它 的一 部分 , 可 以独立 运行 在一 个 网络 结点 上 , 个 结点 也称 为监 视结 点. 也 这 网络 信 息 过滤 系 统 ( F Biblioteka Baidu NI S 的拓
() 3 数据包 捕 获模块 . 数据包 捕 获模块 主要 是通 过监 听 网络 中的数 据通 信. 用一 定 的机 制 从 网络 中 采 截 获符合 特定 服务 的原始 数据 帧 , 递给 网络协议 分 析模块 进行 分析 . 传 该模 块运 行在前 台. () 4 网络协 议分 析模 块. 网络 协议 分析 模块 根据数 据 包捕 获 模块 传 送过 来 的原 始 数 据 帧. 离其 中的 分
的修改 . 在建 立用 户 的兴 趣文 件 时 , 户有 时难 以准 确 表述 自己的信 息 需 求 , 且用 户 的信 息需 求 是 一 个 用 而
长 期 的过程 , 其兴 趣 和前 后行 为通 常难 以保 持一 致 , 而且 随着 时 间 的推 移 , 息 的 内容 也 在 不 断地 发 生 变 信 化, 因此 必须 不 断学 习用 户变 化 的兴趣 . 该模 块 利用 用户 对结 果 文档 的评 估值 重 新修 改 P oi 文 件 , rf e l 此模
目标 .
关 键词 : 则 匹配算 法 ; 息过 滤 系统 ; n cp 规 信 WiP a
中图法分 类 号 : 330 TP 9 . 8 文 献 标 识 码 :A
0 引 言
随着信 息技 术及 互 联 网技术 的 飞速发 展 , 网络 信息 成 为一种 人们 熟 知 的便捷 信息 来 源和休 闲方式 , 但
P o l 的生成 rfe i
训练文档集

H鬣

2 系统关 键技 术分析 及 其实现 2 1 网络 信 息的捕 获 .
* 收 稿 日期 :0 91-4 2 0— 12 作 者 简介 : 继 俊 ( 9 1 )男 , 南 省潢 川 县人 , 理 工程 师 , 士 , 赵 18 一 , 河 助 硕 研究 方 向 : 算 机 网络 安 全 计

l0 ・ l
陕 西 科技 大学 学报
第 2 8卷
块 运行 在后 台.
摘 要 : 析 了信 息过 滤 系统 的 实现 方 案及 关键技 术 , 分 设计 并 实现 了一种基 于 内容 和地 址 的不
良信 息过 滤 系统. 中主要 介 绍 了 系统 的构 架 、 则库 匹配过 滤算 法、 文 规 管理 机 与被 监 控 机 的 通 信 技 术 , 给 出了通 信数 据 包的数据 结 构. 并 系统运 行在 Wid ws8或 Wid ws2 0 / P平 台 no 9 n o 0 0 X 上, 经过 实际运 行测 试 , 明 系统性 能稳 定 、 则库 中的敏 感信 息 能有 效过 滤 , 到 了预期 设计 证 规 达
扑结 构如 图 1所示 .
网络 信息 过 滤 系 统 ( F ) NI S 的逻 辑 结 构 如 图 2所 示 . 网
络信 息过 滤系 统 ( F ) NI S 主要 由 以下 几个 部分 组 成 :
( ) rf e的生成 模 块 . 户 的信 息 需 求 必 须 以 计 算 机 1 P oi l 用
能够 识别 的形 式揭 示 出来 , 就是 用 户 需 求模 板 ( rf e 也 这 p oi , l
叫过 滤模板 ) 并 将 它 保 存 在 磁 盘 介 质 上. 模 块 运 行 在 后 , 该
台. ( ) rfe的重 建 模 块. r fe的 重 建模 块 负责 P oi 2Poi l P oi l r fe l 图 1 NI S的 网络 拓 扑 图 F
基 于规 则 匹 配算 法信 息 过滤 系统 的设 计 与 实现
赵 继 俊 ,胡 启 秀 冯 茜 ,李 璐 , ,向兰 康
(. 国 烟 草 总 公 司郑 州 烟 草 研 究 院 ,河 南 郑 州 1中
45 052) 0
4 0 0 ;2 河 南 省 煤 炭 地 质 勘 察 研 究 院 ,河 南 郑 州 50 1 .
N o.1
陕 西 科 技 大 学 学 报
J OU RNAI OF S HAANXIU NI VERS TY OF S ENCE & TE I CI CHNOIOGY
Fe .2 0 b 01

V0 . 8 12
1 09 ・
文 章 编 号 :0 05 1 (0 0 0— 190 1 0 — 8 1 2 1 ) 10 0 — 4
相关文档
最新文档