模式识别的改进算法研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

h n i ai f ce c n teie t c t nef in ya dr u etet s tdEx e me t rs t h w a i ag r h h o da q t i t,p n s n b s e s d i f o i d e c me h i wa e . p r ns e u o s h th s lo t m a g o d p a l yo e s dr u t s . i l s t t i s bi e a o n K y wor s g a r t iv ; l r aet t ; i i g ihe iin y;td e d : u d ai se e at n t mae d s n u s f ce c s y c e o t u
i =1
C是 变 异 的 总 数 量 , 7是 给 定 的 参 数 。 7
过 滤 引 入 的 字 符 串 。例 如 ,给 定 2 字 符 串 S= 100 1 个 , 11 1 , 0 =0 10 1 00 0 1 ,以及 一 个 掩 码 ^,通过 随机 产 生 ,如 ^ = — 1 6 2 5 83 74置 换 顺 序 ,新 串相 应 在 原 串 中 的位 置 ) - —— — — — ( ,那
那 么 匹配 ,而 ^( 不 匹 配 ^( 。这 个 通 过 转 变 表 ) ) 示 方 式 的方 法 虽 能 避 免 漏 洞 ,但 是 并 没 有 在 这 个 转 变 过 程 中实 现样 本 的优 化 ,而 且 增 加 了 时 间 的 消 耗 [。 2 ] 同样 ,使 用 海 明 距 离 匹 配 规 则 也 存 在 漏 洞 。 事 实
lI foo10 L1100 0 0 1 m 1f o00 a 110 0 2 1 J

图 1
… 1’和
“ ” 的 位 图 7
Baidu Nhomakorabea

3. 系统 训 练 2
首先对数 字 “ ”的模 式作 系统训 练 。随机产 生 5 1 个
样 本 f= ) Ⅳ 5,对 这 些 样 本 与 数 字 1 模 式 进 行 海 明 距 离 计 的 算 ,选 择 海 明 距 离 最 大 的 3 样 本 ( 3组 成 样 本 集 合 个 = )
息 、识 别 和理 解 周 围 环 境 的 感 知 能 力 。模 式 识 别 是 一 个 不 断 发 展 的新 学 科 ,它 的理 论 基 础 和 研 究 范 围也 在 不 断
D 6 : ‘ i
6 l o— wie 。 【 te i 0 i h r : s

发展 。模式识别 的方法很 多 ,例 如决策 理论方法 、句法
在 利 用 连 续 位 匹 配 的 时候 会 出现 “ ” 洞 ,既 能 与 待
识别对象 匹配 ,也 能和非识别对 象匹配 ,无 法生成一个
《 信息化 纵横 》20 年第 1 期 09 0
Sof t war c oog e Te hn l y
有效 的检测器 。随着 的减 少 ,“ 洞” 的数 量会增加 ,R
方 法 ,大 多通 过 样 本 的相 似程 度 进 行 识 别 。 本 文 设 计 的
2 个样 本 分 别 用 S bb6…b 和 T c 2 …c表 示 ,即 = l 3 L = lc L 2 C3
海明距 离 的大小 与样本 的 匹配程度 成正 比。
连 续 位 匹 配 规 则 是 指 ,对 于 任 意 2 长 度 为 的 个 字符 串 a b 和 ,如 果 在 相 对 应 的位 置 上 至 少 有 个 连 续 的 位 相 同 ,那 么 a b 匹 配 。 和 相 例 如 ,长 为 8 的位 串 a 100 ,b l0 00 ,若定 = 0 110 = 1 10 1 1
样本是用 固定长度 的二进 制字符 串来模 拟 ,样本 识别通
过 海 明 距 离 和 R连 续 位 匹 配 实 现 。
1 模 式识 别算 法分 析
在 模 式 识 别 中 ,匹 配 规 则 是 一 个 关 键 点 。 匹 配 规 则
分为完全 匹配和部 分匹配 。如果 2 个等 长字符 串 的每个
Ab t c : nt i p p r ed s n d ak n f th n lo tm a e nsr gc d n , e l e tes mp eq a r t iv n ec o s s r t I s a e , e i e id o c i gag rh b s d0 t n ig t ra i a h w g ma i i o o z h a l u d ai se ea d t r s — c h m thn f w df rn mac n ag r ms hs e in da a c igo t o i e t th g o i e i l h t . i d sg e T Ⅱ nc uda odte“ oe e e t e y e ea e ee t ns mp e o hg u lys g| Ⅱ o l v i h h l ” f c v l, n rt d tci a ls f hq a i ' n t i g o i t n 1
串表 示 ,每个像 素用 1 个二 进制 数表示 ,其 中 l 示对 表 应的像 素为黑色 ,0 表示对应 的像素 为 白色 。1 7 和 构成
的 模 式 集 合 可 用 矩 阵 表 示 :

进 算法 中为 了提高识别 效率 、降低时 间消耗 ,使 用海 明
距 离 和 R连 续 位 匹 配 2 不 同 的 匹 配 方 式 交 叉 进 行 模 式 种 识 别 ,这 样 在 不 同 规 则 下 产 生 的 不 同 漏 洞 可 以 互 相 弥 补 ,不 仅 可 以 有 效 减 少 “ ” 的 存 在 ,而 且 还 可 以 避 免 洞 使 用 其 他 表 示 方 式 消 耗 时 间 。 所 以 ,交 叉 使 用 2 不 同 种 的 匹 配 规 则 不 仅 可 以减 少 “ ” 的 数 量 , 而且 可 以生 成 洞 高 质 量 的样 本 。 另 外 ,结 合 生 物 学 上 基 因 突 变 的 思 想 , 大 量 复 制 和 变 异 与 识 别 对 象 匹 配 度 高 的 样 本 , 而 对 于 匹 配 度 低 的 样 本 重 复 这 个 变 异 和 选 择 的 过 程 , 保 证 样 本 和 识 别 对 象 的 匹配 度 逐 步 增 大 【 3 ] 。
关键 词 :二 次 筛选 ; 交叉 匹配 ;识 别 效 率 ;学 习性 中图分 类号 :T 3 14 P 9. 文 献 标 识 码 :A
S u y o mpr ve e tag rt m o a t r e o n to t d f i o m n l o ih f rp te n r c g ii n
对应 位 上 的符 号都 相 同 ,那 么这 样 的 匹配称 为完 全 匹 配 。然而 实际的模式识别 中 ,完全 匹配只是其 中的一个
特 例 ,大 多 数 情 况 下 人 们 通 过 不 完 全 匹 配 进 行 模 式 识
1 6
义 : ,则 串 a与串 b匹配 ,因为位 串 的第 3 第 6 4 至 位 对应相 等 。显 然 ,当 R 4时 ,位 串 a < 、b 仍然 匹 配 。
l r1 L 一
景学 者们 的 日益关 注 ,成 为一 门广泛 交叉 的前 沿科学 。 模式识别 是人工智能研究 的重要领域 之一 ,模式 识别是 指计算机代 替人类或帮助 人类 感知模式 ,是对人类 感知 外界功能 的模 拟。它研究 的是计 算机模 式识别 系统 ,也 即使一个计 算机系统具有模 拟人类通过 感官接受 外界信
取 值 8 ,每 一 个 串只 能 匹配 自身 ,不 存 在 “ ” 时 洞 ,但 是
样 本 变 异 的总 数量 公式 :

增加 了时间复杂度降低 了检测效率 。传统的避免 “ 洞”的
方 法 是 采 用 多 种 表 示 法 。它 通 过 一 个 随 机 产 生 的掩 码 来
c ∑ +) : f
2改进 算法 的实 现
该 改进算 法 的实 现步 骤如 下 :
f) 机 产 生 J个 样 本 集 合 ; 1 随  ̄ r (对这个 样本集 合与 识别对 象进行 海 明距离计 算 ; 2 )
a, t ;然后在 重新 随机 生成 的 5 个样 本 中与 数字 1 的模 式 进行海 明距离计算 ,选择海 明距离最 大 的 2 个样 本( 2 = )
So t f war c noo y e Te h lg
模式识别 的改进算法研究
沈 学利 ,张家明 ( 宁工程技术 大学 电子 与信息工程学院,辽 宁 葫芦 岛 1 5 ) 辽 15 2 0
摘 要 :针 对模 式识 别 问题 ,设计 了一种 基 于字符 串编码 的 匹配算 法 ,实现 了对样本 的二 次 筛选 和 两种 不 同的模 式 匹配算 法的 交叉 匹配 ,不仅 可 以有效地 减 少 “ ”的存 在 ,而且 可 以生成 高质 量 的 洞 检 测样 本 ,从 而增 强识 别效 率 、降低 时 间消耗 。对数 字识别 的 实验 结果表 明 ,该 匹配算 法具 有很 高的 识 别 率 ,能 有效 降低 错误 率 ,得 到 稳 定 的 满意 解 ,具 有 良好 的适应 性 、学 习性 、开放 性 和 鲁棒 性 。
人 工 智 能 的迅 速 发展 引 起 了众 多学 科 和 不 同专 业 背
别 ,这 样 可 以在 尽 可 能 短 的 时 间 内识 别 尽 可 能 多 的 字 符 串 。最 常 用 的模 式 匹配 规 则 有 海 明距 离 和 R连 续 位 匹 配 。 海 明 距 离 有 多 种 实 现 方 式 ,例 如 相 对 海 明距 离 、加 权海 明 距 离 、相 对 加 权 海 明 距 离 ,这 些 都 是 在 基 本 海 明 距离 的基 础 上 改 进 而 来 的 ,没 有 实 质 的 变 化 …。海 明 距 离 的公 式 如 下 :
组 成 样 本 集 合 ,这 样 就 完 成 了上 面 所 说 的 步 骤 () 4,形 成 了高 质 量 的 匹 配 度 高 的 样 本 。把 这 5 高 质 量 的样 本 个 与数 字 1 的模 式 串 进 行 2 连 续 位 的 匹 配 (= ) 个 R 2,根 据 海
利 用上 述算 法识别 ,用位 图表示 “ ”和 “ ”这 2 1 7 个 数 字 ,如 图 1 示 。 所 有 的 数 字 都 用 1 i的 二 进 制 所 2bt
上 ,目前 使 用 的所 有 带有 一 定 匹 配率 的匹 配规 则 都 避
免 不 了漏 洞 。鉴 于 此 ,本 文 提 出 一 种 改 进 的 算 法 。在 改
() 算集 合 G中的样 本和 识别 对 象 的海 明距 离 ; 9计 f0 1) 把集合 G中海 明距离大于记忆集合 的样本 ,增 加 到 记 忆集 合 中 ; (1 果没 有 达到识 别 要求 则转 到 步骤 () 1) 如 1。 3 实例验 证
3 1 问题 描 述 .
么 ^(.0 1 11,^( =00 0 1 ) 0 110 = S 00 11 。使用连续位规则 R 3  ̄ =,
S N Xu i HA i n HE eL ,Z NG JaMig (colf l t nc Ifr ai n ier g Lann ehia U ie i , uu a 5 0 , hn) Sho o e r i & nom t nE g ei , io g cncl nvr t H d o1 15 C ia E co o n n i T sy l 2
相关文档
最新文档