基于汉字识别的碎纸片拼接复原模型研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
h
量 明月,
( 7 2 _ _ i ) , 则只需要对剩余所有图片 自左向右读取第
n -( 7 2 一j ) 列、 第t 到t + n 行像素的灰度值 。若该行
有缺 损文 字 , 则 与第一 张 图 片 同一 行 的后 ( 7 2 一i ) 列 像 素 灰 度值 进行 匹配 , 再 利 用模 式 识别 判 断 能 否成 字 ,这样 就 可 以找 到 与第 一 张 图片 相 匹 配 的 图片 。 如果 没有 缺损 文字 , 则从 上往 下读 取第 t + ( i 一1 ) n + ( i 一1 ) 到t + i n + ( i —1 ) 水 h ( i 为 读 取 字 的行 数 ) 行
( 7 2 一j ) 。
1 1 0 - “
『l l 帕 + 1 r
h
第三步 , 由于 每个 印 刷体 方 块 字 的字 宽 和字 高
n
、 f 一
l 入
都是一定的 , 所 以可以推断出剩余 图片中与第一张 图 片缺损 部 分相 匹配 的 缺损 部 分 的宽 度 为 n 一
t
j
n
t
‘ -・
第二步 , 通 过 Ma t l a b软件 读取 出第 一 张 图片缺
h
l 窗前
毛旦 籼
N C L
月光 ,
卜霞
[ = 】 1. / I 、 日 。
损字 的左边距 i , 每个方体字 的字宽和字高 n , 字间
距 h 。这样 第一 张 图 片最右 边 的缺损 字 的宽 度 即为
图四 图 片拼 接 展 示 图
进行灰度值处理 、 匹配 , 确保 了模 型建立的合理性 ,
编程 实现 简单 , 通俗 易懂 。且利 用 函数 的连续性 , 证
明了函数的离散化是合理的 ,得到的结果相似度很 高。 缺点是在对图片进行匹配时, 会同时出现多张匹
配 图片 , 需 要人 工干 预 的次 数增 多 , 模 式识 别技 术 复 杂, 精 确度 相对 较低 。
2 考 虑单 面文 件汉 字既 纵切 又横 切 的情 况
( 7 2 一j ) 列、 第t 到t + n 行像素的灰度值。 若该行有缺 损文字 , 则与第一张图片 同一行的后( 7 2 _j ) 列像素
灰 度值 进行 匹 配 , 再 利用 模式识 别 判 断能否 成字 , 这 样 就 可 以找到 与第一 张 图片 相匹 配 的图 片 。如 果没 有 缺损 文字 , 则于汉 往下字识别 读取 第的碎 t + ( i 一1 ) n + ( i 一1 ) 到 基 纸片拼 接复原 模型 研究 什i n + ( i 一1 ) ( i 为 读 取 字 的行 数 ) 行 像 素 的 灰 度
边灰度值 为 n 一( 7 2 _ _ j ) 的图片。在这个过程中 , 我 们也同样的考虑上下图片的匹配 。通过利用文字几
何 特 征 与模 式 识别 相 结 合 的方 法 对 文 字进 行 识别 , 判 断 是否 成字 。 如果 还 有部分 图片没有 匹 配 出来 , 再 加人 人工 干预 , 这样 就 可 以精 确 地把 图片 拼接 出来 。 第一 步 , 通 过 Ma t l a b软 件读 取 出所 有 图片 的灰
度值 , 然后 自 左 向右循环读取每一列像素的灰度值 , 直到读取到灰度值为 0 ( 黑色 ) 就停止读取 , 这样就
~
可 以根据 前几 列 均为 2 5 5 ( 白色 ) 找 到每 一行 的第 一 张 图片 , 而 且可 以确定 左边 距 l , 同理 可 以测 出上边
距 t 。
灰度值为 0 ( 黑色) 时则停止读取 , 这样就可以根据
前几列均为 2 5 5 ( 白色 ) 找 到第 一 张 图片 , 而且 可 以
读 取 所 有 碎 纸 片
读 出灰度值
l 囊 —习 荻霞■全为
I 2 5 5
I l ■后—习灰 霞■全 为 I
I l 2 s s l
值 。利用文字几何特征与模式识别相结合的方法对 文字进行识别 , 判断是否成字 。若还有部分图片没
有 匹 配 出来 , 则 加人 人 工干 预 , 即可准 确地 把 图片拼
接 出来 。
( 4 ) 类似地 , 通过两两配对合模式识别 , 可以继
续 匹 配找 出后 面所有 图片 , 最 后完 成碎 纸 片 的拼 接 。 流程 如 图二 所示 。图三 是 图片拼 接展示 。
8
[二 亘垦口
8
[ 二垂E 口
图 二 拼 接流 程 图
图 一 图片 的 灰 度 值 读 取 流 程 图
t 1
—
n
‘
王
确 定左 边 距 I , 同理 可 以测 出上边 距 t 。 流程 如 图一
所示 a t l a b软 件读 取 出第 一张 图片缺 损 字 的 左边 距 j , 每 个方 体 字 的字 宽 和 字高 n , 行 间距 h 。 这 样第 一 张 图 片最 右 边 的缺 损 字 的宽 度 即为 ( 7 2 一
J ) 。
听 r 一
h
图 片拼 接 展 示 图
h
( 3 ) 由于 每 个 印刷 体 方 块字 的字 宽 和字 高 都 是
一
深 木 海 、 .
图三
定的 , 所以可 以推断出剩余图片中与第一张 图片
缺 损 部分 相 匹 配 的缺 损 部 分 的宽 度 为 n 一( 7 2 一j ) , 则 只 需 要 对 剩 余 所 有 图 片 自左 向 右 读 取 第 n一
一
针 对单 面 文件汉 字 既纵切 又 横切 的情形 ,通 过 Ma t l a b软 件检 测 所 在行 列 的灰 度 值 , 首先 确定 好 每
张图片中每一列的灰度值 , 确定第一张图片。 继续
确定第一张图片最右边缺损汉字 的灰度值为 ( 7 2 一
) , 从左往右循环读取出剩余图片的灰度值 , 找出左
像素的灰度值。
第 四步 , 同理 , 可 以找 出每 一行 后 面 所有 图片 , 最 后 完成 每一行 碎纸 片 的拼接 , 可 以得 到 l 1 行 的图 片, 接 下来 就进 行行 与行 之 间的图 片拼接 。
量 明月,
( 7 2 _ _ i ) , 则只需要对剩余所有图片 自左向右读取第
n -( 7 2 一j ) 列、 第t 到t + n 行像素的灰度值 。若该行
有缺 损文 字 , 则 与第一 张 图 片 同一 行 的后 ( 7 2 一i ) 列 像 素 灰 度值 进行 匹配 , 再 利 用模 式 识别 判 断 能 否成 字 ,这样 就 可 以找 到 与第 一 张 图片 相 匹 配 的 图片 。 如果 没有 缺损 文字 , 则从 上往 下读 取第 t + ( i 一1 ) n + ( i 一1 ) 到t + i n + ( i —1 ) 水 h ( i 为 读 取 字 的行 数 ) 行
( 7 2 一j ) 。
1 1 0 - “
『l l 帕 + 1 r
h
第三步 , 由于 每个 印 刷体 方 块 字 的字 宽 和字 高
n
、 f 一
l 入
都是一定的 , 所 以可以推断出剩余 图片中与第一张 图 片缺损 部 分相 匹配 的 缺损 部 分 的宽 度 为 n 一
t
j
n
t
‘ -・
第二步 , 通 过 Ma t l a b软件 读取 出第 一 张 图片缺
h
l 窗前
毛旦 籼
N C L
月光 ,
卜霞
[ = 】 1. / I 、 日 。
损字 的左边距 i , 每个方体字 的字宽和字高 n , 字间
距 h 。这样 第一 张 图 片最右 边 的缺损 字 的宽 度 即为
图四 图 片拼 接 展 示 图
进行灰度值处理 、 匹配 , 确保 了模 型建立的合理性 ,
编程 实现 简单 , 通俗 易懂 。且利 用 函数 的连续性 , 证
明了函数的离散化是合理的 ,得到的结果相似度很 高。 缺点是在对图片进行匹配时, 会同时出现多张匹
配 图片 , 需 要人 工干 预 的次 数增 多 , 模 式识 别技 术 复 杂, 精 确度 相对 较低 。
2 考 虑单 面文 件汉 字既 纵切 又横 切 的情 况
( 7 2 一j ) 列、 第t 到t + n 行像素的灰度值。 若该行有缺 损文字 , 则与第一张图片 同一行的后( 7 2 _j ) 列像素
灰 度值 进行 匹 配 , 再 利用 模式识 别 判 断能否 成字 , 这 样 就 可 以找到 与第一 张 图片 相匹 配 的图 片 。如 果没 有 缺损 文字 , 则于汉 往下字识别 读取 第的碎 t + ( i 一1 ) n + ( i 一1 ) 到 基 纸片拼 接复原 模型 研究 什i n + ( i 一1 ) ( i 为 读 取 字 的行 数 ) 行 像 素 的 灰 度
边灰度值 为 n 一( 7 2 _ _ j ) 的图片。在这个过程中 , 我 们也同样的考虑上下图片的匹配 。通过利用文字几
何 特 征 与模 式 识别 相 结 合 的方 法 对 文 字进 行 识别 , 判 断 是否 成字 。 如果 还 有部分 图片没有 匹 配 出来 , 再 加人 人工 干预 , 这样 就 可 以精 确 地把 图片 拼接 出来 。 第一 步 , 通 过 Ma t l a b软 件读 取 出所 有 图片 的灰
度值 , 然后 自 左 向右循环读取每一列像素的灰度值 , 直到读取到灰度值为 0 ( 黑色 ) 就停止读取 , 这样就
~
可 以根据 前几 列 均为 2 5 5 ( 白色 ) 找 到每 一行 的第 一 张 图片 , 而 且可 以确定 左边 距 l , 同理 可 以测 出上边
距 t 。
灰度值为 0 ( 黑色) 时则停止读取 , 这样就可以根据
前几列均为 2 5 5 ( 白色 ) 找 到第 一 张 图片 , 而且 可 以
读 取 所 有 碎 纸 片
读 出灰度值
l 囊 —习 荻霞■全为
I 2 5 5
I l ■后—习灰 霞■全 为 I
I l 2 s s l
值 。利用文字几何特征与模式识别相结合的方法对 文字进行识别 , 判断是否成字 。若还有部分图片没
有 匹 配 出来 , 则 加人 人 工干 预 , 即可准 确地 把 图片拼
接 出来 。
( 4 ) 类似地 , 通过两两配对合模式识别 , 可以继
续 匹 配找 出后 面所有 图片 , 最 后完 成碎 纸 片 的拼 接 。 流程 如 图二 所示 。图三 是 图片拼 接展示 。
8
[二 亘垦口
8
[ 二垂E 口
图 二 拼 接流 程 图
图 一 图片 的 灰 度 值 读 取 流 程 图
t 1
—
n
‘
王
确 定左 边 距 I , 同理 可 以测 出上边 距 t 。 流程 如 图一
所示 a t l a b软 件读 取 出第 一张 图片缺 损 字 的 左边 距 j , 每 个方 体 字 的字 宽 和 字高 n , 行 间距 h 。 这 样第 一 张 图 片最 右 边 的缺 损 字 的宽 度 即为 ( 7 2 一
J ) 。
听 r 一
h
图 片拼 接 展 示 图
h
( 3 ) 由于 每 个 印刷 体 方 块字 的字 宽 和字 高 都 是
一
深 木 海 、 .
图三
定的 , 所以可 以推断出剩余图片中与第一张 图片
缺 损 部分 相 匹 配 的缺 损 部 分 的宽 度 为 n 一( 7 2 一j ) , 则 只 需 要 对 剩 余 所 有 图 片 自左 向 右 读 取 第 n一
一
针 对单 面 文件汉 字 既纵切 又 横切 的情形 ,通 过 Ma t l a b软 件检 测 所 在行 列 的灰 度 值 , 首先 确定 好 每
张图片中每一列的灰度值 , 确定第一张图片。 继续
确定第一张图片最右边缺损汉字 的灰度值为 ( 7 2 一
) , 从左往右循环读取出剩余图片的灰度值 , 找出左
像素的灰度值。
第 四步 , 同理 , 可 以找 出每 一行 后 面 所有 图片 , 最 后 完成 每一行 碎纸 片 的拼接 , 可 以得 到 l 1 行 的图 片, 接 下来 就进 行行 与行 之 间的图 片拼接 。