基于基本笔画笔压特征的手写汉字笔迹鉴定的研究(2)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
# )5 )5 " + + + B " )< $ 5 g h & & ’ & i jk g h f ‘ b g f ’ f ‘ l9 ’ k g m > & ‘ b g9 ‘ c b ‘ k k > b ‘ cf ‘ l2_ m & nf m b & ‘ h f ‘ c h f b 0‘ b o k > p b m q h f ‘ c h f b h b ‘ f
3 基本算法简介
本研究的流程如图 $所示 ! 观测就是用光电设备 如扫描仪 " 将手写汉字输 " 万方数据 入到计算机 " 在此过程中已将汉字二值化 !
第 4期
刘
基于基本笔画笔压特征的手写汉字笔迹鉴定的研究 俊( 等2
g3 " e g
!" # $%& $’ ( !) # *%+& *%,( !- # *%’ & *%,. 其 设书写 者 / 第 0个 样 本 特 征 1 的值为 ! ( / ( 1 ( 0 中2 #3 ( 4 ( " ( 5( 71 #3 ( 4 ( " ( 5( 70 #3 ( 4 ( " ( 5( / 6 6 . 6 现选取书写者 8 的第 0 9个样本的特征值作为 鉴定对象的特征组 2 : ! 3 ( 0 ( ! 4 ( 0 ( 5( ! 6 ( 0 ; ( 8( 9 8( 9 8( 9 中任意值 . 其中 ( 3 =6 > 8 为该书写者序号 ( 0 9为< 然后根据样本平均法求取各个书写者的标准参 考样本 ( 根据定义 ( 书写者 / 的特征 1 在特征空间中 的标准参考值为 2
$ " % & 鉴定的研究依然没有摆脱结体依存性的影响 # 在 !
其 研 究流程中 " 首先是要判断书写者书写的是什么 汉字 " 然后与辞书中相同的汉字一一对应进行鉴别 " 因此 对 于特定的 汉 字 有 效 率 很 高 " 但对于辞书以外 的汉字就无能为力了 ! 举例来说 ’ 以往研究对 ( ) )个 既定汉字的笔迹鉴定的鉴别 率高达 * 但 其研 究 ( +" 的鉴别率只限于这 ( 若要鉴别的汉字不 ) )个 汉 字 " 在这 ( 则鉴别率为 ) 据康 熙 字 典记 ) )个汉字之内 " ! 载的汉字已达 ( 按中华大字典记载已达 ,) ) )多个 " 多个 " 近年台湾中央语言研究所称 " 包括异体 ( *) ) ) 字与未解明训诂的汉字已达 即使常用 )) ) )之钜 " 的汉字也已经有 .) 如此庞大的汉字字库 " ) )多个 " 在存 在 着结体依 存 性 的 笔 迹 鉴 定 的 研 究 中 " 无疑是 个难以克服的巨大困难 ! 相对于此 " 笔者希望能找到 而信息含量最大的方式实现笔 一 种研究对象最 少 / 迹鉴定的方法 " 从而彻底排除了结体依存性的影响 ! 值 得 指 出 的 是" 本研究部分笔者已提出了新的 见文献 # 该方法针对结体依存性所 研究方法 0 1 " ( & 2 ! 存 在的不足 " 提出了以手写汉字基本笔画的骨骼运 笔 为特征进行笔 迹 鉴 定 的 新 思 路 ! 由于基本笔画是 构 成汉字 的 基 本 要 素 " 数 量 少" 因 此" 如能以基本笔 画为对象 " 实现手写汉字的笔迹鉴定 " 不仅能彻底地 摆 脱结体依存性 的 影 响 " 还可以极大缩小所需的辞 书空间 " 这无疑是对笔迹鉴定作出了有益的探索 ! 为 了 进 一步提高笔 迹 鉴 定 率 " 笔者将沿着手写汉字基 本 笔画为对象的 基 本 思 路 " 找到一种新的鉴别手写 汉 字的有 效 特 征 ! 具 体 来 讲" 由 于 个 人 习 惯 不 同" 不 同 的 人在书写时 用 力 大 小 的 变 化 会 有 所 不 同 ! 其笔 压的变化可以在笔画的粗细中反映出来 " 一般来说 " 两者之间存在着单调变化的关系 ! 因此 " 本研究就从 笔画粗细的变化入手 " 研究其有效性 !
@: r s O S Q P R S h k> k p k f > g hb pt f p k l& ‘f ‘f p p _ n= m b & ‘m h f mo f ’ b li k f m _ > k p& ih f ‘ l u> b m m k ‘< h b ‘ k p k (5 g h f > f g m k > pf > kg & ‘ m f b ‘ k lb ‘m h k= > k p p _ > k& i m h ku> b m k > v p p m > & w k p &ukl k f ’ ub m hm h kt f p b g p m > & w k p (: f pnf b ‘& t x k g mb ‘u> b m k >b l k ‘ m b i b g f m & ‘ h kt f p b gh f ‘ l u> b m b ‘ cp m > & w k pf > kp k ’ k g m k li > & n< h b ‘ k p k (2 n_ C g h f > f g m k > pf p m h k nf b ‘& t x k g m p ’ m b l b nk ‘ p b & ‘i k f m _ > k p = f g k b p & t m f b ‘ k li > & nm h k = > k p p _ > k i k f C (: m _ > kt f p k l& ‘m h kt f p b g p m > & w k p h k ‘ukg f ‘& t m f b ‘m h kl b p m > b t _ m b & ‘& i k o k > q& t x k g m b ‘m h ki k f m _ > k (y )uk p = f g k qg f ’ g _ ’ f m b ‘ cm h k l b p m f ‘ g k t k m uk k ‘fg k > m f b ‘u> b m k > f ‘ l& m h k > u> b m k > p b ‘m h k l b g m b & ‘ f > q (akp )f (: f g g & n= ’ b p hm h ku> b m k >b l k ‘ m b i b g f m b & ‘ k ’ k g m m k ‘u> b m k > p ‘ li & _ >t f p b gp m > & w k p k ‘p f n= ’ k p (5 f > kg h & p k ‘i > & nk f g hp m > & w k f m b p i f g m & > q> k p _ ’ m pf > k& t m f b ‘ k li > & np & nkp b n= ’ k< h b ‘ k p kg h f > f g C (: C m k > p h k> k p k f > g hm & m f ’ ’ q& o k > g & nk pm h kl k i k g m& im h k= > k o b & _ p> k p k f > g ht f p k l& ‘m k z m )f ( l k = k ‘ l k ‘ g k ‘ lf ’ p &> k l _ g k pm h kl b g m b & ‘ f > qp = f g k @u> H= Hc Hi Ht {N |} X Q V O b m k >b l k ‘ m b i b g f m b & ‘ > k p p _ > ki k f m _ > k k ‘ k > f ’ b ~ k ll b p m f ‘ g k k f m _ > kp = f g k f p b g p m > & w k p 笔迹鉴定作 为 一 种 个 人 身 份 辩 识 的 有 效 手 段 ) 无论 是 在 政 治 ! 经 济! 文 化 甚 至 犯 罪 学 领 域) 都有着 重要的作用 ) 随着经济的日益发展 ) 各国文化交流的 日益频繁 ) 如何高效 ! 准确地进行笔迹鉴定就显得更
B C, & 以笔画 D 横E 的特征 量提取 为例 " 如 笔 部分去掉 # !
图 %所示 !
行笔部分的起点为 L 该 点 的 笔 画 宽 度 为 ML" " 终点为 N 该 点 的 宽 度 为 笔画宽度最小值所在 " MN" 的点为 O 该值为 MO" 最大值所在的点为 P" 最大值 " 为 MP " 还 有 三 个 距 离 关 系 的 特 征 量" 分 别 是’ 起点 到终 点的距 离 MLN" 起 点到最 小值的 距离 MLO" 起点 到最大值的距离 MLP ! 则特征量为 Q MN" $R M LS Q MO" %R M LS
J K L M N O NJ K P Q P R S N QTQ L S N QU V N M S L W L R P S L X MY P O N VX M Z Q N O O O [ Q N\ N P S [ Q N O X W Y P O L R] S Q X ^ N O
) a9 ) d C 3 8 0. _ ‘ * ;b ‘ c 62*7 e b f ‘ > & ‘ c
文章编号 @ A + + B C " D E A # " + + , $ + " C + A , F C + -
基于基本笔画笔压特征的手写 汉字笔迹鉴定的研究
G
刘
俊) 文
颖 ) 张宪荣
上海大学 机械电子工程与自动化学院 ) 上海 " # + + + B " $ 摘要 @ 基于汉字笔迹鉴定的有效特征主要蕴含于 基 本 笔 画 运 笔 中 的 设 想 ) 提出以手写汉字基本笔画为研究对象) 抽 取其中笔压变化特征 ) 形成特征空间 ) 求得鉴定对 象 在 特 征 空 间 中 分 布 ) 并计算它与辞书中各书写者之间的广义距 离) 从而实现笔迹的鉴定 ( 本研究选 用 A 四种基本笔画) 每种基本笔画采用 A 其结 +位 书 写 者 ) +个 样 本 进 行 了 实 验 ( 果证实了本方法完全克服了以往笔迹鉴定研究中结 体 依 存 性 带 来 的 不 足 ) 只需对少数基本笔画的研究就对全体汉 大大缩小了辞书空间 ( 字有效 ) 关键词 @ 笔迹鉴定 H 笔压变化特征 H 广义距离 H 特征空间 H 基本笔画 中图分类号 @ ! A ( : I, 文献标识码 @ 2
第 !卷 第 "期 " + + ,年 -月
上 海 大 学 学 报 # 自 然 科 学 版$
$ . /01 *23/45 62*7 628 0*8 %9 1 5 8 : ;# *2: 01 235 < 8 9 *< 9
( ! )百度文库& ( " %& ’ (" + + , 2= >
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
万方数据
刘 G 收稿日期 @ " + + " C A A C " B 作者简介 @ 俊# 男) 湖北荆州人 ) 硕士生 ) 主要从事模式识别研究 ( A ! B F "$ )
T$ 1 . T
上 海 大 学 学 报 0 自 然 科 学 版2
第 *卷
加重 要 ! 在 我 国" 笔 迹 鉴 定" 尤其是对汉字的笔迹鉴 定研究 " 得到了众多学者的关注 ! 目前 " 许多场合都使用人工鉴定方法 " 其效率不 仅低下" 而且在 鉴 定 过 程 中 容 易 引 入 人 为 的 感 情 因 素" 因此 " 其结果不一定可靠 ! 鉴于此 " 研究人员提出 了 利用计算机进 行 自 动 鉴 别 的 方 法 ! 根据对计算机 笔 迹 鉴定和有关 资 料 的 调 查 发 现 " 目前计算机笔迹
图 % 特征提取示意图 ! % F 4 5 6 G @ = : ;H< I8 > @ J = K < : = 5 8 A 图 $ 鉴定流程图 ! $ 4 4 5 6 7 8 9: ; < = 8 > 5 ? @ A = 5 > 5 : < = 5 8 A
本研究的对象是不同手写汉字中相同的基本笔 画笔 压变化 " 由于笔压变化与笔画粗细的变化成单 调的关 系 " 而笔 画 粗 细 可 以 从 双 侧 轮 廓 之 间 的 距 离 反映出 来 " 因 此" 笔 者 抽 取 特 定 方 向 的 双 侧 轮 廓" 即 用微分算子来提取汉字中的方向信息 " 这样 " 就可以 得到不同手写汉字中相同基本笔画的笔压变化曲 线! 在这里需要说明的是 " 本研究是针对基本笔画的 行笔部分的研究 " 在抽取双侧轮廓时 " 要将起笔和收
3 基本算法简介
本研究的流程如图 $所示 ! 观测就是用光电设备 如扫描仪 " 将手写汉字输 " 万方数据 入到计算机 " 在此过程中已将汉字二值化 !
第 4期
刘
基于基本笔画笔压特征的手写汉字笔迹鉴定的研究 俊( 等2
g3 " e g
!" # $%& $’ ( !) # *%+& *%,( !- # *%’ & *%,. 其 设书写 者 / 第 0个 样 本 特 征 1 的值为 ! ( / ( 1 ( 0 中2 #3 ( 4 ( " ( 5( 71 #3 ( 4 ( " ( 5( 70 #3 ( 4 ( " ( 5( / 6 6 . 6 现选取书写者 8 的第 0 9个样本的特征值作为 鉴定对象的特征组 2 : ! 3 ( 0 ( ! 4 ( 0 ( 5( ! 6 ( 0 ; ( 8( 9 8( 9 8( 9 中任意值 . 其中 ( 3 =6 > 8 为该书写者序号 ( 0 9为< 然后根据样本平均法求取各个书写者的标准参 考样本 ( 根据定义 ( 书写者 / 的特征 1 在特征空间中 的标准参考值为 2
$ " % & 鉴定的研究依然没有摆脱结体依存性的影响 # 在 !
其 研 究流程中 " 首先是要判断书写者书写的是什么 汉字 " 然后与辞书中相同的汉字一一对应进行鉴别 " 因此 对 于特定的 汉 字 有 效 率 很 高 " 但对于辞书以外 的汉字就无能为力了 ! 举例来说 ’ 以往研究对 ( ) )个 既定汉字的笔迹鉴定的鉴别 率高达 * 但 其研 究 ( +" 的鉴别率只限于这 ( 若要鉴别的汉字不 ) )个 汉 字 " 在这 ( 则鉴别率为 ) 据康 熙 字 典记 ) )个汉字之内 " ! 载的汉字已达 ( 按中华大字典记载已达 ,) ) )多个 " 多个 " 近年台湾中央语言研究所称 " 包括异体 ( *) ) ) 字与未解明训诂的汉字已达 即使常用 )) ) )之钜 " 的汉字也已经有 .) 如此庞大的汉字字库 " ) )多个 " 在存 在 着结体依 存 性 的 笔 迹 鉴 定 的 研 究 中 " 无疑是 个难以克服的巨大困难 ! 相对于此 " 笔者希望能找到 而信息含量最大的方式实现笔 一 种研究对象最 少 / 迹鉴定的方法 " 从而彻底排除了结体依存性的影响 ! 值 得 指 出 的 是" 本研究部分笔者已提出了新的 见文献 # 该方法针对结体依存性所 研究方法 0 1 " ( & 2 ! 存 在的不足 " 提出了以手写汉字基本笔画的骨骼运 笔 为特征进行笔 迹 鉴 定 的 新 思 路 ! 由于基本笔画是 构 成汉字 的 基 本 要 素 " 数 量 少" 因 此" 如能以基本笔 画为对象 " 实现手写汉字的笔迹鉴定 " 不仅能彻底地 摆 脱结体依存性 的 影 响 " 还可以极大缩小所需的辞 书空间 " 这无疑是对笔迹鉴定作出了有益的探索 ! 为 了 进 一步提高笔 迹 鉴 定 率 " 笔者将沿着手写汉字基 本 笔画为对象的 基 本 思 路 " 找到一种新的鉴别手写 汉 字的有 效 特 征 ! 具 体 来 讲" 由 于 个 人 习 惯 不 同" 不 同 的 人在书写时 用 力 大 小 的 变 化 会 有 所 不 同 ! 其笔 压的变化可以在笔画的粗细中反映出来 " 一般来说 " 两者之间存在着单调变化的关系 ! 因此 " 本研究就从 笔画粗细的变化入手 " 研究其有效性 !
@: r s O S Q P R S h k> k p k f > g hb pt f p k l& ‘f ‘f p p _ n= m b & ‘m h f mo f ’ b li k f m _ > k p& ih f ‘ l u> b m m k ‘< h b ‘ k p k (5 g h f > f g m k > pf > kg & ‘ m f b ‘ k lb ‘m h k= > k p p _ > k& i m h ku> b m k > v p p m > & w k p &ukl k f ’ ub m hm h kt f p b g p m > & w k p (: f pnf b ‘& t x k g mb ‘u> b m k >b l k ‘ m b i b g f m & ‘ h kt f p b gh f ‘ l u> b m b ‘ cp m > & w k pf > kp k ’ k g m k li > & n< h b ‘ k p k (2 n_ C g h f > f g m k > pf p m h k nf b ‘& t x k g m p ’ m b l b nk ‘ p b & ‘i k f m _ > k p = f g k b p & t m f b ‘ k li > & nm h k = > k p p _ > k i k f C (: m _ > kt f p k l& ‘m h kt f p b g p m > & w k p h k ‘ukg f ‘& t m f b ‘m h kl b p m > b t _ m b & ‘& i k o k > q& t x k g m b ‘m h ki k f m _ > k (y )uk p = f g k qg f ’ g _ ’ f m b ‘ cm h k l b p m f ‘ g k t k m uk k ‘fg k > m f b ‘u> b m k > f ‘ l& m h k > u> b m k > p b ‘m h k l b g m b & ‘ f > q (akp )f (: f g g & n= ’ b p hm h ku> b m k >b l k ‘ m b i b g f m b & ‘ k ’ k g m m k ‘u> b m k > p ‘ li & _ >t f p b gp m > & w k p k ‘p f n= ’ k p (5 f > kg h & p k ‘i > & nk f g hp m > & w k f m b p i f g m & > q> k p _ ’ m pf > k& t m f b ‘ k li > & np & nkp b n= ’ k< h b ‘ k p kg h f > f g C (: C m k > p h k> k p k f > g hm & m f ’ ’ q& o k > g & nk pm h kl k i k g m& im h k= > k o b & _ p> k p k f > g ht f p k l& ‘m k z m )f ( l k = k ‘ l k ‘ g k ‘ lf ’ p &> k l _ g k pm h kl b g m b & ‘ f > qp = f g k @u> H= Hc Hi Ht {N |} X Q V O b m k >b l k ‘ m b i b g f m b & ‘ > k p p _ > ki k f m _ > k k ‘ k > f ’ b ~ k ll b p m f ‘ g k k f m _ > kp = f g k f p b g p m > & w k p 笔迹鉴定作 为 一 种 个 人 身 份 辩 识 的 有 效 手 段 ) 无论 是 在 政 治 ! 经 济! 文 化 甚 至 犯 罪 学 领 域) 都有着 重要的作用 ) 随着经济的日益发展 ) 各国文化交流的 日益频繁 ) 如何高效 ! 准确地进行笔迹鉴定就显得更
B C, & 以笔画 D 横E 的特征 量提取 为例 " 如 笔 部分去掉 # !
图 %所示 !
行笔部分的起点为 L 该 点 的 笔 画 宽 度 为 ML" " 终点为 N 该 点 的 宽 度 为 笔画宽度最小值所在 " MN" 的点为 O 该值为 MO" 最大值所在的点为 P" 最大值 " 为 MP " 还 有 三 个 距 离 关 系 的 特 征 量" 分 别 是’ 起点 到终 点的距 离 MLN" 起 点到最 小值的 距离 MLO" 起点 到最大值的距离 MLP ! 则特征量为 Q MN" $R M LS Q MO" %R M LS
J K L M N O NJ K P Q P R S N QTQ L S N QU V N M S L W L R P S L X MY P O N VX M Z Q N O O O [ Q N\ N P S [ Q N O X W Y P O L R] S Q X ^ N O
) a9 ) d C 3 8 0. _ ‘ * ;b ‘ c 62*7 e b f ‘ > & ‘ c
文章编号 @ A + + B C " D E A # " + + , $ + " C + A , F C + -
基于基本笔画笔压特征的手写 汉字笔迹鉴定的研究
G
刘
俊) 文
颖 ) 张宪荣
上海大学 机械电子工程与自动化学院 ) 上海 " # + + + B " $ 摘要 @ 基于汉字笔迹鉴定的有效特征主要蕴含于 基 本 笔 画 运 笔 中 的 设 想 ) 提出以手写汉字基本笔画为研究对象) 抽 取其中笔压变化特征 ) 形成特征空间 ) 求得鉴定对 象 在 特 征 空 间 中 分 布 ) 并计算它与辞书中各书写者之间的广义距 离) 从而实现笔迹的鉴定 ( 本研究选 用 A 四种基本笔画) 每种基本笔画采用 A 其结 +位 书 写 者 ) +个 样 本 进 行 了 实 验 ( 果证实了本方法完全克服了以往笔迹鉴定研究中结 体 依 存 性 带 来 的 不 足 ) 只需对少数基本笔画的研究就对全体汉 大大缩小了辞书空间 ( 字有效 ) 关键词 @ 笔迹鉴定 H 笔压变化特征 H 广义距离 H 特征空间 H 基本笔画 中图分类号 @ ! A ( : I, 文献标识码 @ 2
第 !卷 第 "期 " + + ,年 -月
上 海 大 学 学 报 # 自 然 科 学 版$
$ . /01 *23/45 62*7 628 0*8 %9 1 5 8 : ;# *2: 01 235 < 8 9 *< 9
( ! )百度文库& ( " %& ’ (" + + , 2= >
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
万方数据
刘 G 收稿日期 @ " + + " C A A C " B 作者简介 @ 俊# 男) 湖北荆州人 ) 硕士生 ) 主要从事模式识别研究 ( A ! B F "$ )
T$ 1 . T
上 海 大 学 学 报 0 自 然 科 学 版2
第 *卷
加重 要 ! 在 我 国" 笔 迹 鉴 定" 尤其是对汉字的笔迹鉴 定研究 " 得到了众多学者的关注 ! 目前 " 许多场合都使用人工鉴定方法 " 其效率不 仅低下" 而且在 鉴 定 过 程 中 容 易 引 入 人 为 的 感 情 因 素" 因此 " 其结果不一定可靠 ! 鉴于此 " 研究人员提出 了 利用计算机进 行 自 动 鉴 别 的 方 法 ! 根据对计算机 笔 迹 鉴定和有关 资 料 的 调 查 发 现 " 目前计算机笔迹
图 % 特征提取示意图 ! % F 4 5 6 G @ = : ;H< I8 > @ J = K < : = 5 8 A 图 $ 鉴定流程图 ! $ 4 4 5 6 7 8 9: ; < = 8 > 5 ? @ A = 5 > 5 : < = 5 8 A
本研究的对象是不同手写汉字中相同的基本笔 画笔 压变化 " 由于笔压变化与笔画粗细的变化成单 调的关 系 " 而笔 画 粗 细 可 以 从 双 侧 轮 廓 之 间 的 距 离 反映出 来 " 因 此" 笔 者 抽 取 特 定 方 向 的 双 侧 轮 廓" 即 用微分算子来提取汉字中的方向信息 " 这样 " 就可以 得到不同手写汉字中相同基本笔画的笔压变化曲 线! 在这里需要说明的是 " 本研究是针对基本笔画的 行笔部分的研究 " 在抽取双侧轮廓时 " 要将起笔和收