笔迹图像中的单个汉字字符分割

合集下载

Python+opencv实现图片文字的分割的方法示例

Python+opencv实现图片文字的分割的方法示例

Python+opencv实现图⽚⽂字的分割的⽅法⽰例实现步骤:1、通过⽔平投影对图形进⾏⽔平分割,获取每⼀⾏的图像;2、通过垂直投影对分割的每⼀⾏图像进⾏垂直分割,最终确定每⼀个字符的坐标位置,分割出每⼀个字符;先简单介绍⼀下投影法:分别在⽔平和垂直⽅向对预处理(⼆值化)的图像某⼀种像素进⾏统计,对于⼆值化图像⾮⿊即⽩,我们通过对其中的⽩点或者⿊点进⾏统计,根据统计结果就可以判断出每⼀⾏的上下边界以及每⼀列的左右边界,从⽽实现分割的⽬的。

下⾯通过Python+opencv来实现该功能⾸先来实现⽔平投影:import cv2import numpy as np'''⽔平投影'''def getHProjection(image):hProjection = np.zeros(image.shape,np.uint8)#图像⾼与宽(h,w)=image.shape#长度与图像⾼度⼀致的数组h_ = [0]*h#循环统计每⼀⾏⽩⾊像素的个数for y in range(h):for x in range(w):if image[y,x] == 255:h_[y]+=1#绘制⽔平投影图像for y in range(h):for x in range(h_[y]):hProjection[y,x] = 255cv2.imshow('hProjection2',hProjection)return h_if __name__ == "__main__":#读⼊原始图像origineImage = cv2.imread('test.jpg')# 图像灰度化#image = cv2.imread('test.jpg',0)image = cv2.cvtColor(origineImage,cv2.COLOR_BGR2GRAY)cv2.imshow('gray',image)# 将图⽚⼆值化retval, img = cv2.threshold(image,127,255,cv2.THRESH_BINARY_INV)cv2.imshow('binary',img)#⽔平投影H = getHProjection(img)通过上⾯的⽔平投影,根据其⽩⾊⼩⼭峰的起始位置就可以界定出每⼀⾏的起始位置,从⽽把每⼀⾏分割出来。

文字分割算法效果评估说明

文字分割算法效果评估说明

文字分割算法效果评估说明文字分割是图像处理的一个重要任务,它的目标是将一幅包含文字的图像切割成单独的文字区域,以便进行后续的文字识别、文本分析等任务。

评估文字分割算法的效果是确保其准确性和可靠性的重要环节。

评估文字分割算法的效果通常可以从以下几个方面进行说明:1. 准确率:文字分割算法的准确率是评估其有效性的重要指标之一。

准确率可以通过计算分割出的文字区域与真实标注的文字区域的重叠程度来衡量。

常用的指标包括IoU(Intersection over Union)和Dice系数。

IoU是通过计算预测的文字区域与真实标注的文字区域的交集与并集的比值来衡量的,其取值范围为0到1,值越大表示预测的文字区域与真实标注的文字区域越接近;Dice系数是通过计算预测的文字区域与真实标注的文字区域的2倍交集与预测的文字区域的大小的比值来衡量的,其取值范围也为0到1,值越大表示预测的文字区域与真实标注的文字区域越接近。

2. 召回率:文字分割算法的召回率表示算法能够正确分割出的文字区域占真实标注的文字区域的比例。

常用的计算方式是将预测的文字区域与真实标注的文字区域进行匹配,如果两个区域的IoU大于一定阈值,则认为匹配成功。

召回率可以用来评估算法在不同场景、不同尺度、不同样式的图像上的稳定性。

3. 精确率:文字分割算法的精确率表示算法分割出的文字区域中真正是文字的比例。

常用的计算方式是将预测的文字区域与真实标注的文字区域进行匹配,如果两个区域的IoU大于一定阈值,则认为匹配成功。

精确率可以用来评估算法的鲁棒性和泛化能力。

4. F1值:F1值是精确率和召回率的调和平均值,用于综合评估算法的准确性和召回率。

F1值是一个介于0和1之间的数,值越大表示算法的效果越好。

F1值可以通过以下公式计算:F1 = 2 * (精确率 * 召回率) / (精确率 + 召回率)5. 平均分割时间:文字分割算法的平均分割时间是评估算法效率的指标之一。

一种基于双向投影的文本图像字符分割方法

一种基于双向投影的文本图像字符分割方法

观察众 多文本图像 , 发现文本 图像一般 内容规整 , 多数 以行与 方法 , 通过实验验 证了所提方法的有效 陛。 实验结果表 明, 新方法字
运算速度快 。 列 的形式存在 。 基 于此观察 , 提 出本文方法 , 其基本思想 是: 将文本 符分割效率高 ,
图1算法流程 图
收 稿 日期 : 2 0 1 7 — 0 4 — 2 7
应 用 研 究

种基于双 向投影的文本图像字符分割方法
王莉丽 于印
( 中国电子科技集 团公 司第二 十八研 究所, 江苏南京 2 1 0 0 0 7 )
摘要: 针对 目前主流文本 图像 字符分割方法 面临的 问题, 考虑投影 法及 改进 方法容 易实现之优 点, 提 出了一种行与列投 影的文本 图像 字符分割新 方法, 以通过双向扫描 分割 字符 。 首先对文本图像 进行行投影, 接 着, 实施列投影操作, 最后, 根据投 影谱 图统计字符 内、 外 间距,
作 者简介: 王莉 ̄( 1 9 8 1 - - ) , 女, 江苏句容人, 工程 师, 本科, 现主要从事 系统应 用软件设计 开发 工作; @ ̄ F ( 1 9 8 3 -) , 男, 江苏姜堰人, 工程师, 硕士 研 究生, 现主要 从事 系统应 用软件 设计开发工作。

! ! 竺 术 _ l l 皇 l 用
现 代 置 气业 务悬 我 碹 气藤 事业 发 展 的核 心 逢现 代 气黎业 舟体 系 的重 要 蜘成 鄙 分 。 在 西摩 防 灾减 突中 占 有重 要 的地 住 。 走气研 究是 置
撵 现 代 天 气业 务 发展 的 重 要 保 证.点 囤 术 气皋科 技 创 新 悼 系建 设 的 重 蚤任 务 。

图像分割,行切分和字符切分基础

图像分割,行切分和字符切分基础

图像分割,行切分和字符切分基础1.1字符分割的基础字符分割的任务是把多行或多字符图像中的每个字符从整个图像中分割出来,成为单个字符。

对于字符分割的问题常常不被重视,但是字符的正确分割对字符的识别是至关重要的。

由于字符字体存在着多样性,所以在一般的字符识别系统中,字符识别之前要先对图像进行阈值化,然后再进行行字切分,以分割出一个个具体的二值表示的字符图像点阵,作为单字符识别的输入数据。

由于获得的文本图像不但包含了组成文本的一个个字符,而且包含了字符行间距与字间的空白,甚至还会带有各种标点符号,这就需要采用一定的处理技术将文本中的一个个字符切分出来,形成单个字的图像阵列,以进行单字识别处理。

这就需要两个步骤来完成,行切分和字切分。

首先由行切分得到一行行文本,然后在每行文本中进行列切分得到一个个单独的字符。

1.1.1行切分技术行切分就是要将一行行字符切分出来,形成单行字符文本图像数据。

这里我们以含有汉字的图像为例,介绍一下行切分技术。

对于输入的二值化汉字图像从上到下逐行扫描并计算每个扫描行的像素,以获取图像的水平投影。

我们会发现汉字图像沿行方向的水平投影比较有规律,投影中的每个波峰与图像中的每个文本行相对应,在相邻的两行之间有比较宽的一段投影信息为0,这是对应了相邻两行之间的空白区域。

根据这个规律,对行切分比较容易,可以把整幅的汉字图像在水平方向投影后,直接对汉字图像进行行切分。

具体方法为:首先分析投影图像,找到投影波峰所对应的文本行的位置,从而可以计算出每行的行距;其次对所有行的行距累加求和后,求出文本图像的标准行距,以标准行距对汉字图像进行行的粗切分;最后在每一个粗切分出的行附近上下扫描,进行细微调整,选取最合适的分割位置。

4.1.2字切分技术字切分是从切分出的文本图像行中将单个的字符图像切分出来。

字切分的正确与否直接影响识别结果,是字符识别系统中比较难的部分。

我们还是以单个的汉字切分为例来说明。

手写汉字的图像分割及识别技术研究

手写汉字的图像分割及识别技术研究

手写汉字的图像分割及识别技术研究手写汉字一直是书法爱好者和字迷们热衷的话题。

然而,对于电脑和智能手机等现代设备而言,手写汉字却一直是一道难题。

电子产品并没有像人类一样能够理解和认识手写的汉字,因此,对于手写汉字的识别技术不断进行研究和探讨,成为一个亟待解决的问题。

手写汉字图像分割是手写汉字识别过程中的第一步骤。

它是将线性的手写汉字图案分割成不同的部分,通过分割后对每个部分进行分析,来确认每一个字的内容和意义。

手写汉字图像分割技术首先要做的,就是将整体的图案分割成多个部分,然后对每个部分进行分析,以确认它所代表的字或词。

如何进行手写汉字图像分割是一个十分重要的问题,因为它直接关系到之后的手写汉字识别成功率。

在许多相关的技术研究中,研究者们提出了很多手写汉字的图像分割方法。

其中,一些基础技术包括:·利用连通区域提取来去除噪声·利用距离变换来确定汉字的边缘·利用深度学习和神经网络方法除此之外,还有一些新的方法也在不断涌现,如基于基线和距离变换的分割算法、基于协同过滤的分割算法、基于自适应阈值的分割算法等。

在手写汉字分割的过程中,除了技术方法之外,还需要精巧的算法来确保有效的分割。

该算法能够根据汉字特征,优化算法参数,使其具有更高的准确度和稳定性。

算法探讨包括:·使用多种特征提取技术·优化分割算法参数·多个算法的组合运用通过这些技术和算法的不断发展和优化,现今手写汉字图像分割的成功率已经越来越高万分,也为手写汉字识别的进一步研究奠定了基础。

手写汉字的识别技术是比手写汉字图像分割技术更为庞大和更具挑战性的工作。

对于手写汉字识别,其过程包括对图像的处理、特征提取和映射预测等步骤。

首先,需要对输入的图像进行预处理。

这包括对灰度处理、滤波和降噪等。

其次,需要提取汉字图像特征。

这个过程是将汉字图像映射到不同的特征空间中,建立汉字图像和特征之间的联系。

手写汉字的特征提取方法,主要包括:·基于方向的梯度直方图·基于区域轮廓的集成方法·基于形状统计的方法最后,就可以对映射空间进行设计,根据已知的特征预测出输入汉字的结果。

ps怎么把文字切掉一部分ps中制作文字切掉一部分的效果教程

ps怎么把文字切掉一部分ps中制作文字切掉一部分的效果教程

ps怎么把⽂字切掉⼀部分ps中制作⽂字切掉⼀部分的效果教程
ps怎么把⽂字切掉⼀部分?在ps中可以给⽂字做各种各样的效果,有的朋友可能还不太清楚⽂字切掉⼀部分的效果要怎么制作?今天,⼩编为⼤家带来了ps中制作⽂字切掉⼀部分的效果教程。

感兴趣的朋友快来了解⼀下吧。

Adobe Photoshop 2020 v21.2.8.17 ACR13.2/12.4 中⽂版+安装教程
类型:图像处理
⼤⼩:1.93GB
语⾔:简体中⽂
时间:2021-05-14
查看详情
ps中制作⽂字切掉⼀部分的效果教程
我们在数字的右边输⼊百分⽐的符号【%】,如图所⽰。

我们右键把百分⽐的符号【转换为形状】,如图所⽰。

接着,我们⽤【直接选择⼯具】选中斜线下⾯的两个点,如图所⽰。

接下来,我们把斜线向下拉长⼀些,要超过数字,如图所⽰。

我们给数字的图层添加上蒙版,然后⽤【多边形套索⼯具】框出⼀个三⾓形填充上⿊⾊即可,如图所⽰。

我们在切掉数字的右边再输⼊⼀些英⽂,和数字的底部对齐,如图所⽰。

最后,我们看到数字切掉⼀部分的效果就完成了。

以上便是⼩编为⼤家分享的"ps怎么把⽂字切掉⼀部分 ps中制作⽂字切掉⼀部分的效果教程"的全部内容,希望能够帮到你,持续发布更多资讯,欢迎⼤家的关注。

用于手写汉字识别的文本分割方法

用于手写汉字识别的文本分割方法

用于手写汉字识别的文本分割方法雷鑫;李俊阳;宋宇;赛琳伟【摘要】本文提出了一种手写汉字文本的分割方法,填补了汉字识别领域在文本行分割方面的空白.本方法首先对预处理后的文本图片进行池化处理,然后运用并查集算法得到每行为一个连通区域,最后调整每行上下的孤立区域的归属,最终把多行文本图片分割为单行,为后期的汉字列分割做准备.此方法虽然用行分割,但也为汉字的列分割提供了新的思路.【期刊名称】《智能计算机与应用》【年(卷),期】2018(008)002【总页数】3页(P126-128)【关键词】手写汉字识别;池化;文本分割;并查集【作者】雷鑫;李俊阳;宋宇;赛琳伟【作者单位】河海大学常州校区数理部, 江苏常州213022;河海大学常州校区数理部, 江苏常州213022;河海大学常州校区数理部, 江苏常州213022;河海大学常州校区数理部, 江苏常州213022【正文语种】中文【中图分类】TP391.41引言汉字识别技术经过长期的发展已经日趋成熟,无论是联机汉字识别还是难度更高的脱机手写汉字识别[1],其识别成功率均有较大的提升,并在相关的领域得到了一定的推广应用。

作为汉字识别中的关键组成部分,汉字分割技术的进展也将制约着汉字识别率的研究提升。

能够完整无误地分割出整个汉字对汉字识别来说尤为重要,这也是目前汉字识别技术攻关中的研究处理重点。

区别于字母、数字,汉字的结构复杂,形式多样,不同人的书写习惯和选用字体也形色多样,书写起来多具有很大的随意性,因此汉字分割较其它字符的分割也更显难度。

近年来,学界已基于汉字识别技术研发提出了一系列的汉字分割方法。

这些方法主要包括:基于汉字结构的切分方法[2]、基于识别的切分方法[3]、基于词的整体切分方法以及基于统计的切分方法[4]等。

如上的汉字分割方法虽然对特定的汉字图片获得了可观的成功率[5],但却都各自存在着一定缺陷。

例如基于结构的切分方法中汉字笔画的提取十分复杂,基于识别和词整体切分方法又会产生效率与识别率双重走低的问题,而基于统计的切分方法则只适用于非黏连的汉字。

一种手写汉字投影切分方法的改进算法

一种手写汉字投影切分方法的改进算法

一种手写汉字投影切分方法的改进算法作者:王序哲,曹卫来源:《电脑知识与技术》2011年第25期摘要:在分析传统的手写汉字投影切分算法的基础上,提出了改进算法。

算法初切分阶段通过对局部图像进行水平投影法切分来确定行切分点,从而得到当行字符,之后针对单行字符,通过多种策略进行单字切分,包括针对字间间距、标点符号等信息做出的单字切分策略。

实验结果表明,该算法能有效的减少传统垂直投影分割法的误切分现象,且分割速度快,实现容易。

该算法经过大量实验证明了其在准确率方面的优越性。

关键词:局部图像;切分点;行和数组;列和数组;误切分中图分类号:TP391.1文献标识码:A文章编号:1009-3044(2011)25-6205-02An Improvement of Projection Segmentation Algorithm for Handwritten Chinese CharactersWANG Xu-zhe, CAO Wei(School of Computer Science, South-Central University for Nationalities, Wuhan 430074, China)Abstract: Based on the analysis of traditional projection segmentation algorithm for handwritten chinese characters proposed the improved algorithm. Early stages, taking advantage of the local level projection to determine the line of cut-off point of of the partial image to obtain a line of characters; Then making use of a variety of strategies to obtain words , including for the spacing between words, punctuation, etc. Experimental results show that the algorithm can effectively reduce errors of the traditional vertical projection segmentation algorithm;simultaneously,the improved algorithm splits fastly and easy to implement. After a large number of experiments certify that the algorithm is better quality in accuracy rate.Key words: local image; segmentation point; line and array; column and array; mistakenly segmentation目前,脱机手写体汉字的切分方法有很多种,包括投影切分法、Hough变换法[1]等,其中投影切分法是利用像素点在水平或者垂直方向上的投影来确定字符间隙,进而来切分字符的。

用于手写汉字识别的文本分割方法

用于手写汉字识别的文本分割方法

用于手写汉字识别的文本分割方法作者:雷鑫李俊阳宋宇赛琳伟来源:《智能计算机与应用》2018年第02期摘要:本文提出了一种手写汉字文本的分割方法,填补了汉字识别领域在文本行分割方面的空白。

本方法首先对预处理后的文本图片进行池化处理,然后运用并查集算法得到每行为一个连通区域,最后调整每行上下的孤立区域的归属,最终把多行文本图片分割为单行,为后期的汉字列分割做准备。

此方法虽然用行分割,但也为汉字的列分割提供了新的思路。

关键词:手写汉字识别;池化;文本分割;并查集Abstract:In this paper a text segmentation method for handwritten Chinese characters is developed which fills in the blank of text line segmentation in the field of Chinese character recognition. In this method the pretreatment of the text image is pooled. Then using the method of searching and collecting coarse segmentation of the pictures after the pooling step is processed and the result of the coarse segmentation is segmented by the calculation of the connected set. Finally the multi-line text picture is segmented into a single line to prepare for the later Chinese character segmentation. Although this method is used for row segmentation it also provides a new way for column segmentation of Chinese character text.Key words: handwritten Chinese character recognition;pool;text segmentation;the method of searching and collecting引言汉字识别技术经过长期的发展已经日趋成熟,无论是联机汉字识别还是难度更高的脱机手写汉字识别[1],其识别成功率均有较大的提升,并在相关的领域得到了一定的推广应用。

一种基于像素点的手写体文本图像分割方法(1)

一种基于像素点的手写体文本图像分割方法(1)

第26卷第11期 计算机应用与软件Vol 126No .112009年11月 Computer App licati ons and Soft w are Nov .2009一种基于像素点的手写体文本图像分割方法王 辉 王嘉梅(云南民族大学物理与电子电气信息工程学院 云南昆明650031)收稿日期:2009-05-13。

2008年教育部人文社会科学研究规划项目(08JA740040);国家民委2008年教学研究项目(Z00471)。

王辉,硕士生,主研领域:图像通信。

摘 要 文字的正确识别与否很大程度上取决于能否对文字进行有效的分割。

在分析传统手写文字文本图像切分算法的基础上,提出一种基于像素点的文字分割方法。

算法具有很强的抗干扰性,能够有效地解决手写过程中的小角度歪斜以及字符笔画断裂和粘连的问题。

通过MAT LAB 的仿真试验,结果表明此方法能够对手写过程中普遍存在歪斜的文字进行有效的分割。

关键词 文字分割 列分割 字分割AN I M AGE SEG M ENT I NG M ETHOD FO R HANDW R I T I NGTEXT BASED O N P I XEL PO INTW ang Hui W ang J ia mei(School of Physics and Electronic 2Electrical Infor m ation Engineering,Yunnan U niversity of N ationalities,Kunm ing 650031,Yunnan,China )Abstract T o a great extent,whether the characters can be recognized correctly or not depends on if they can be seg mented effectively .The paper puts f or ward a character 2seg menting method based on p ixel point according t o the analysis of traditi onal text i m age seg mentati on al 2gorith m of hand writing characters .The algorith m has str ong interference i m munity and is able t o effectually handle the p r oble m s of askew i m a 2ges in s mall angle and str oke 2j ointing and str oke 2parting when the characters are being hand written .Si m ulati on experi m ent on MAT LAB indi 2cated that the method can seg ment the aske w characters effectively of which it is common occurred when hand writing .Keywords Text seg mentati on Seg mentati on of lines Seg mentati on of characters0 引 言我国拥有大量的古籍文字资料,这些古籍资料大多是手写体的且在书写过程中都是竖排的。

python简单实现图片文字分割

python简单实现图片文字分割

python简单实现图⽚⽂字分割本⽂实例为⼤家分享了python简单实现图⽚⽂字分割的具体代码,供⼤家参考,具体内容如下原图:图⽚预处理:图⽚⼆值化以及图⽚降噪处理。

# 图⽚⼆值化def binarization(img,threshold):#图⽚⼆值化操作width,height=img.sizeim_new = img.copy()for i in range(width):for j in range(height):a = img.getpixel((i, j))aa = 0.30 * a[0] + 0.59 * a[1] + 0.11 * a[2]if (aa <= threshold):im_new.putpixel((i, j), (0, 0, 0))else:im_new.putpixel((i, j), (255, 255, 255))# im_new.show() # 显⽰图像return im_new# 图⽚降噪处理def clear_noise(img):# 图⽚降噪处理x, y = img.width, img.heightfor i in range(x-1):for j in range(y-1):if sum_9_region(img, i, j) < 600:# 改变像素点颜⾊,⽩⾊img.putpixel((i, j), (255,255,255))# img = np.array(img)# # cv2.imwrite('handle_two.png', img)# # img = Image.open('handle_two.png')img.show()return img# 获取⽥字格内当前像素点的像素值def sum_9_region(img, x, y):"""⽥字格"""# 获取当前像素点的像素值a1 = img.getpixel((x - 1, y - 1))[0]a2 = img.getpixel((x - 1, y))[0]a3 = img.getpixel((x - 1, y+1 ))[0]a4 = img.getpixel((x, y - 1))[0]a5 = img.getpixel((x, y))[0]a6 = img.getpixel((x, y+1 ))[0]a7 = img.getpixel((x+1 , y - 1))[0]a8 = img.getpixel((x+1 , y))[0]a9 = img.getpixel((x+1 , y+1))[0]width = img.widthheight = img.heightif a5 == 255: # 如果当前点为⽩⾊区域,则不统计邻域值return 2550if y == 0: # 第⼀⾏if x == 0: # 左上顶点,4邻域# 中⼼点旁边3个点sum_1 = a5 + a6 + a8 + a9return 4*255 - sum_1elif x == width - 1: # 右上顶点sum_2 = a5 + a6 + a2 + a3return 4*255 - sum_2else: # 最上⾮顶点,6邻域sum_3 = a2 + a3+ a5 + a6 + a8 + a9return 6*255 - sum_3elif y == height - 1: # 最下⾯⼀⾏if x == 0: # 左下顶点# 中⼼点旁边3个点sum_4 = a5 + a8 + a7 + a4return 4*255 - sum_4elif x == width - 1: # 右下顶点sum_5 = a5 + a4 + a2 + a1return 4*255 - sum_5else: # 最下⾮顶点,6邻域sum_6 = a5+ a2 + a8 + a4 +a1 + a7return 6*255 - sum_6else: # y不在边界if x == 0: # 左边⾮顶点sum_7 = a4 + a5 + a6 + a7 + a8 + a9return 6*255 - sum_7elif x == width - 1: # 右边⾮顶点sum_8 = a4 + a5 + a6 + a1 + a2 + a3return 6*255 - sum_8else: # 具备9领域条件的sum_9 = a1 + a2 + a3 + a4 + a5 + a6 + a7 + a8 + a9 return 9*255 - sum_9经过⼆值化和降噪后得到的图⽚对图⽚进⾏⽔平投影与垂直投影:# 传⼊⼆值化后的图⽚进⾏垂直投影def vertical(img):"""传⼊⼆值化后的图⽚进⾏垂直投影"""pixdata = img.load()w,h = img.sizever_list = []# 开始投影for x in range(w):black = 0for y in range(h):if pixdata[x,y][0] == 0:black += 1ver_list.append(black)# 判断边界l,r = 0,0flag = Falset=0#判断分割数量cuts = []for i,count in enumerate(ver_list):# 阈值这⾥为0if flag is False and count > 0:l = iflag = Trueif flag and count == 0:r = i-1flag = Falsecuts.append((l,r))#记录边界点t += 1#print(t)return cuts,t# 传⼊⼆值化后的图⽚进⾏⽔平投影def horizontal(img):"""传⼊⼆值化后的图⽚进⾏⽔平投影"""pixdata = img.load()w,h = img.sizever_list = []# 开始投影for y in range(h):black = 0for x in range(w):if pixdata[x,y][0] == 0:black += 1ver_list.append(black)# 判断边界l,r = 0,0flag = False# 分割区域数t=0cuts = []for i,count in enumerate(ver_list):# 阈值这⾥为0if flag is False and count > 0:l = iflag = Trueif flag and count == 0:r = i-1flag = Falsecuts.append((l,r))t += 1return cuts,t这两段代码⽬的主要是为了分割得到⽔平和垂直位置的每个字所占的⼤⼩,接下来就是对预处理好的图⽚⽂字进⾏分割。

笔迹图像中的单个汉字字符分割

笔迹图像中的单个汉字字符分割

笔迹图像中的单个汉字字符分割于明;张彦云;薛翠红;孙林娟【摘要】提出了一套完整的针对单字的笔迹图像分割算法,选用不同的笔迹样本作了验证实验,对实现单字分割做了全面的阐述论证.将模板分割算法中的行分割、字分割、单字图像库建立和基于模板匹配的分割算法结合在一起,提高了算法的运算速度和精确度.利用50幅笔迹样本进行测试,92%的单字分割样本可以作为单字模板,应用模板匹配分割算法92%的样本可以实现单字提取.【期刊名称】《计算机工程与应用》【年(卷),期】2010(046)009【总页数】4页(P180-182,245)【关键词】分割算法;行分割;字分割;单字图像库;模板匹配分割【作者】于明;张彦云;薛翠红;孙林娟【作者单位】河北工业大学,计算机科学与软件学院,天津,300401;河北工业大学,计算机科学与软件学院,天津,300401;河北工业大学,计算机科学与软件学院,天津,300401;河北工业大学,计算机科学与软件学院,天津,300401【正文语种】中文【中图分类】TP3911 引言笔迹鉴别是一种通过分析手写笔迹的风格特点来判断书写人身份的技术,已成为模式识别邻域的一个非常活跃的研究课题[1-2]。

应用范围也越来越广泛,为了避免笔迹专家的主观人为因素的影响,实现笔迹鉴别的自动化和智能化,使笔迹鉴别结果更客观,成为该领域中的重要研究目标。

而笔迹预处理又直接关系到最后笔迹鉴别正确率,受书写者的习惯和知识水平的影响,行的多次扭曲和字符尺寸的严重变异,使得预处理的工作非常困难,通常采用投影直方图法来解决这个问题。

对于西文传统的投影方法非常适合,因为西文字符尺寸比较小,变异也比较小。

但是对于中文情况要复杂,汉字尺寸较大且变异较大,投影法对于单字分割所取得的效果不是很好,而且要根据直方图找出分割点,人为因素参与了其中,使得自动化程度不高。

目前在许多文献中,论文在字符分割这部分大多采用人工手动分割。

提出一种完整的笔迹分割方法,在单字分割算法上有了很大改进,取得了很好的分割效果,这对于提高笔迹的鉴别率会有很大帮助。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

笔迹图像中的单个汉字字符分割
作者:于明, 张彦云, 薛翠红, 孙林娟, YU Ming, ZHANG Yan-yun, XUE Cui-hong, SUN Lin-juan
作者单位:河北工业大学,计算机科学与软件学院,天津,300401
刊名:
计算机工程与应用
英文刊名:COMPUTER ENGINEERING AND APPLICATIONS
年,卷(期):2010,46(9)
被引用次数:2次
1.Plamond R.Lorette G Automatic signature verification and writer identification-The state of art 1989(02)
2.Peake G S.Tan T N Script and language identification from document images[外文会议] 1997
3.阮晓钢基于改进的多通道Gabor小波变换的笔迹鉴别[学位论文] 2002
4.王凤岭.刘连芳基于纹理分析的笔迹图像预处理子系统的设计和实现[期刊论文]-南宁职业技术学院学报
2005(04)
5.张德贤.郭小波.刘永平笔迹鉴别预处理与特征抽取技术研究[期刊论文]-微计算机信息 2006(9/1)
6.朱勇.谭铁牛.王蕴红基于笔迹的身份鉴别[期刊论文]-自动化学报 2001(02)
7.李莹.宋刚汉字笔迹鉴别中预处理算法实现[期刊论文]-山东大学学报 2007(02)
1.李莹汉字笔迹鉴别的算法研究[学位论文]2007
2.王宏志.姜昱明.WANG Hong-zhi.JIANG Yu-ming基于笔划包围盒的脱机手写体汉字分割算法[期刊论文]-计算机工程与设计2005,26(3)
3.丁红霞基于神经网络技术的笔迹鉴别方法与系统[学位论文]2007
4.高学.Gao Xue基于动态规划的联机手写汉字分割方法[期刊论文]-华南理工大学学报(自然科学版)
2007,35(1)
5.朱锴.赵宇明.吴越一种离线手写体汉字切分的自适应算法[期刊论文]-计算机工程与应用2004,40(6)
6.陈倩倩基于信息融合的笔迹鉴别算法研究[学位论文]2010
7.董慧格笔迹样本的收集方法[期刊论文]-科技风2010(24)
8.清华大学首次成功研制了计算机笔迹鉴别系统[期刊论文]-现代图书情报技术2005(5)
9.袁玉倩.于明.董浩.王哲.Yuan Yuqian.Yu Ming.Dong Hao.Wang Zhe一种改进的说话人识别系统[期刊论文]-信息安全与通信保密2006(7)
10.李国宏.施鹏飞基于假设-证实的离线手写汉字分割方法[期刊论文]-中国图象图形学报A辑2003,8(z1)
1.郑蕊蕊.赵继印.李敏.于为民.吴宝春多民族脱机手写体汉字数据库的设计与构建[期刊论文]-大连民族学院学报 2011(5)
2.陈睿.唐雁基于关键词提取的手写汉字文本依存笔迹鉴别技术[期刊论文]-四川大学学报(自然科学版)
2013(4)
本文链接:/Periodical_jsjgcyyy201009051.aspx。

相关文档
最新文档