一种网页图像文字分割方法

合集下载

一种改进的字符图像分割方法

Ａｂｓｔｒａｃｔ：Ｆｏｒｃｈａｒａｃｔｅｒｓｓｅｇｍｅｎｔａｔｉｏｎｐｒｏｂｌｅｍｉｎｄｏｃｕｍｅｎｔｉｍａｇｅｓ，ｔｈｉｓｐａｐｅｒｉｎｔｒｏｄｕｃｅｓｔｈｅＬＬＴａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｌｏｃａｌ
ＳＵＮＹａｎｇ—ｇｕａｎｇ
（ＣｏｌｌｅｇｅｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ，Ｓｏｕｔｈ — ＣｅｎｔｒａｌＵｉｔｉｅｓ，Ｗｕｈａｎ４３００７４，Ｃｈｉｎａ）
ＩＳＳＮ１００９－３０４４
Ｅ— ｍａｉｌ：ｅｄｕｆ＠ｄｎｚｓ．ｎｅｔ．ｃｎ
ｈｔｔｐ：／／ｗｗｗ．ｄｎｚｓ．ｎｅｔ．ｃｎＴｅｌ：＋８６—５５１ —６５６９０９６３６５６９０９６４
ｔｈｒｅｓｈｏｌｄａｎｄｉｔｓｍａｔｈｅｍａｉｃｔａｌｍｏｄｅ１．Ｂｙｆｕｒｔｈｅｒａｎａｌｙｚｉｎｇｔｈｅｋｅｙｐａｒａｍｅｔｅｒｓｓｅｔｉｔｎｇ，ａｎｉｍｐｒｏｖｅｄｓｅｇｍｅｎｔａｔｉｏｎｍｅｔｈｏｄｆｏｒ
关键词：字符图像；二值化；图像分割中图分类号：ＴＰ３１１文献标识码：Ａ文章编号：１００９ — ３０４４（２０１３）０４ — ０８４４ — ０２

ps文字拆分

PS文字拆分什么是PS文字拆分PS文字拆分（Photoshop Text Split）是一种在Adobe Photoshop软件中使用的技术，它将文字拆分成多个部分并对其进行独立处理。

这种技术可以被广泛应用于设计、广告、宣传等领域，使文字表现更具艺术性和创意性。

使用PS文字拆分的好处使用PS文字拆分可以带来以下好处：1.创意表现：通过拆分文字并对其进行操作，可以创造独特的设计效果，增加作品的创意性和艺术性。

2.引人注目：拆分后的文字可以吸引观众的注意力，使设计更具吸引力和视觉冲击力。

3.灵活性：拆分后的文字可以被单独调整、变形、着色、镶嵌等等，使设计师能够有更多的自由度和创造力。

4.多样性：通过拆分文字并进行不同的处理，可以生成多种样式的文字，适用于不同的设计需求。

如何进行PS文字拆分下面是进行PS文字拆分的一般步骤：1.打开Adobe Photoshop软件并创建一个新的文件。

2.在文件中插入需要拆分的文字或创建新的文本图层。

3.选择拆分工具，通常是”切割”工具或”划分”工具。

将工具应用于文本图层，拆分文字成多个部分。

可以根据需要进行细分。

4.对每个拆分的文字部分进行单独的处理。

可以调整位置、颜色、字体、大小等等。

5.排列拆分的文字，可以根据需要进行堆叠、旋转、镶嵌等操作。

调整文字之间的间距和对齐方式，以达到理想的效果。

6.进行其他必要的调整和修饰，如添加背景、特效、眩光等等，使文字更加鲜艳、突出和生动。

7.最后将设计保存为所需的格式，如JPEG、PNG等。

使用PS文字拆分的创意实例以下是一些使用PS文字拆分的创意实例，以帮助你更好地理解这一技术的应用：1.漂浮文字：将文字拆分为多个部分，并将它们分散在画布上，仿佛文字在空中漂浮。

可以使用不同的字体和颜色，增加立体感。

2.破碎文字：将文字拆分为多个碎片，并将它们重叠在一起，形成一个破碎的效果。

可以调整碎片的形状和大小，使文字看起来破碎而有趣。

3.镶嵌文字：将文字拆分成多个部分，然后将它们嵌入到画布的背景图像中。

AE中实现文字分割效果的方法

AE中实现文字分割效果的方法Adobe After Effects（简称AE）是一款广泛应用于影视制作和动态图形设计的软件。

在AE中，我们可以运用各种技巧和特效来创造出炫酷的影片效果。

其中，文字分割效果是一个非常有趣和常用的技巧，可以使文字动画更加生动，吸引观众的眼球。

本文将介绍一种常见的AE文字分割效果的实现方法。

首先，我们需要准备一个含有文字的合成。

在AE中打开一个新合成，选择一个合适的分辨率和时长，并将文字图层添加进去。

可以通过文本工具创建文字图层，也可以将一个现有的图像导入并转换为文字。

接下来，选中文字图层，在“图层”窗口中点击右键，选择“预合成”。

在弹出窗口中，将预合成命名为“文字分割”，点击“确定”。

预合成的目的是将文字独立出来，并将其作为一个整体进行处理。

现在，我们需要为文字图层添加一个效果，用于实现文字分割的特效。

在AE的效果菜单中，选择“拷贝效果”，然后从下拉列表中选择“切割”效果。

将此效果应用在文字图层上。

在“切割”效果的参数窗口中，可以设置文字的切割方式和频率等选项。

常见的文字分割方式有水平切割和垂直切割两种，可以根据需要选择合适的方式。

频率参数决定了文字被切割为多少块，可以根据文字的长度和效果需求进行调整。

在调整参数的过程中，可以通过预览窗口来实时查看效果。

可以尝试不同参数的组合，以达到最理想的分割效果。

如果需要更加个性化的效果，还可以尝试其他的AE特效或插件。

文字分割效果的核心在于切割的速度和流畅性。

通过调整时间轴上的关键帧和贝塞尔曲线，可以控制文字分割的速度和变化过程。

可以尝试设置不同的帧间隔和缓动曲线，以实现更加生动和流畅的分割效果。

除了文字分割，还可以结合其他特效和动画技巧来进一步提升文字效果。

例如，可以在文字分割的基础上添加透明度渐变、阴影效果或运动路径等。

通过不同的组合和搭配，可以创造出更加出彩和吸引人的文字动画效果。

当完成文字分割和其他特效的调整后，可以对合成进行最终的渲染和导出。

一种文本图像的手写汉字分割方法及系统[发明专利]

专利名称：一种文本图像的手写汉字分割方法及系统专利类型：发明专利
发明人：魏东琦,赛琳伟,王占昌,唐亚明,杨博
申请号：CN201910832751.2
申请日：20190904
公开号：CN110516674A
公开日：
20191129
专利内容由知识产权出版社提供
摘要：本申请公开了一种文本图像的手写汉字分割方法及系统，所述方法包括：将文本图像进行二值化和去除背景网格线操作，获得预处理文档；采用大小为2×128的区域对所述预处理文档做平均池化，得到每行区域；对所述每行区域分割成一块或多块，再进行合并，得到每个字的区域，使得一个汉字的偏旁和部首能正确地合并在一起。

本发明的优点是：实现简单，能完美地去除图像中的横竖线条，能处理倾斜行和汉字间的连笔情况，有效找到连笔应该断开的位置；列分割精度高，采用了动态规划算法，结合深度神经网络汉字识别，确保了一个汉字的偏旁部首能正确的合并到一起；综合采用了机械分割、深度学习、统计自然语言处理多种手段，达到了理想的分割效果。

申请人：中国地质调查局西安地质调查中心
地址：710054 陕西省西安市碑林区友谊东路438号
国籍：CN
代理机构：合肥超通知识产权代理事务所(普通合伙)
代理人：龚存云
更多信息请下载全文后查看。

网页基本版式

4.中轴型
沿浏览器窗口的中轴将图片或文字作水平或垂直方向的排列。水平排列的页面给人稳定、平静、含蓄的感觉。垂直排列的页面给人以舒畅的感觉。
5.曲线型
图片、文字在页面上作曲线的分割或编排构成，产生韵律与节奏。
6.倾斜型
页面主题形象或多幅图片、文字作倾斜编排，形成不稳定感或强烈的动感，引人注目。
2.满版型
页面以图像充满整版。主要以图像为诉求点，也可将部分文字压置于图像之上。视觉传达效果直观而强烈。满版型给人以舒展、大方的感觉。随着宽带的普及，这种版式在网页设计中的运用越来越多。
3.分割型
把整个页面分成上下或左右两部分，分别安排图片和文案。两个部分形成对比：有图片的部分感性而具活力，文案部分则理性而平静。可以调整图片和文案所占的面积，来调节对比的强弱。例如：如果图片所占比例过大，文案使用的字体过于纤细，字距、行距、段落的安排又很疏落，则造成视觉心理的不平衡，显得生硬。倘若通过文字或图片将分割线虚化处理，就会产生自然和谐的效果。
8.焦点型
焦点型的网页版式通过对视线的诱导，使页面具有强烈的视觉效果。焦点型分三种情况。
（1）中心以对比强烈的图片或文字置于页面的视觉中心。
（2）向心视觉元素引导浏览者视线向页面中心聚拢，就形成了一个向心的版式。向心版式是集中的、稳定的，是一种传统的手法。
（3）离心视觉元素引导浏览者视线向外辐射，则形成一个离心的网页版式。离心版式是外向的、页面给人稳定、严谨、庄重、理性的感受。
对称分为绝对对称和相对对称。一般采用相对对称的手法，以避免呆板。左右对称的页面版式比较常见。
四角型也是对称型的一种，是在页面四角安排相应的视觉元素。四个角是页面的边界点，重要性不可低估。在四个角安排的任何内容都能产生安定感。控制好页面的四个角，也就控制了页面的空间。越是凌乱的页面，越要注意对四个角的控制。

一种快速_稳健的图像分割方法

式计算：
! 0! "! 1/ #- " " ( ,
"
! "
"
（2 ）
其中， ( 是色彩分辨率， / 是归一化系数。显然， "! 越大， *" 处越平滑。现在，需要确定一个阈值 1" 来区分平滑与否。考虑到平滑程度是一个相对概念，可以基于全局来定义 1" 的数值。在整个图像的各像素点 * " 处计算 "! ，将 "! 归一化为 "2!
!$#
图像区域合并
采用连接算法将非平滑区量化后的各像素连接成区域，将
面积很小的 “毛刺” 区域合并到差异最小的相邻较大区域上。从而完成图像的分割。
2
图像分割算法实现
传统 A)B 色度空间是非线性的。为了实现有意义的图像
* （! ）（!! ） ./0 , !!! （! ） # ! 其中，那么，窗口内 !" 的密度估计可以按下 . 向量的维数。
!$*
平滑和非平滑区域划分
一幅图像中像素点的色彩特征矢量可以定义为：
（$ ，（* ） !"# %， &） ’ + ，，是图像的相对亮度和、色度坐标。其中， $ % & % & 令 () 表示空间分辨率， * " 表示 ()+() 窗口中心的像素点， !" 表示 * " 点的色彩特征矢量， , 表示该窗口区域， !" 表示窗口内 * " 点的特征矢量。通过估计 , 内 !" 的分布密度，可以判定 * " 点处是否平滑。核函数密度估计是最常用的密度估计方法。设（! ）是多元正态函数： -

一种基于图像内容的数据分割方法

维普资讯
２００６年４月
西安电子科技大学学报（自然科学版）
ＮＡＩＯＦＸⅢ 】，ＡＮＩＳⅡ Ｙ
Ａｐ．０６ｒ２０Ｖｏ．３Ｎｏ２１３．
第３卷３
第２期
一
种基于图像内容的数据分割方法
杜建超吴成柯杨亚东，肖，，嵩
（．西安电子科技大学综合业务网理论与关键技术国家重点室，１陕西西安７０７；１０１
２．空军工程大学电讯工程学院，陕西西安７０７）１０７
摘要：基于对Ｈ２４数据分割技术的分析，出一种基于图像内容的新的数据分割方法．．６提它将视频流按照比特重要性分为３个子流，次为：依头信息、ｔＩｒｎａ宏块信息和部分Ｉｔｎｒ宏块信息、ｅ剩余Ｉｔ宏块信息．ｎｒｅ
ｍａｒｂｏｋｅｏｇｎｏｄｆｒｎｕ — ｉｔａｅｄｆｒｎｉｔｄａｃｒｉｇｔｅｒｉａｔｃｏｌｃｓｂｌｎｉｇｔｉｅｅｔｓｂｂｔｒｍｓａｉｅｅｔｅｃｏｄｎｏｔｉｍｐｃｓｓｅｒｆａｈｏｈｕｌｙｏｅｐｃｕｅｎｈｕｅｓｄｃｄｄｂｎｏｔｌｇｒｈ．Ｓｍｕａｉｎｎｔｅｑａｉｆｔｉｔｒ，ａｄｔｅｎｍｂｒｉｅｉｅｙａｐｍａａｏｉｍｔｈｉｌｔｉｌｔｏｒｓｈｈｗｔａｏａｅｉｅｄｔｐｒｔｎｎｏｌｉ２，ｔｅｐｏｓｄｍｅｏｓｅｕｓｓｏｔｃｍｐｒｄｗｔｔａａｔｉｉｇｔｎＨ．６ｈｈｈａｉｏ４ｈｒｐｅｔｄｉｏｈｍｏｅａａｔｅｔｅｃａｇｆｐｃｕｅｃｎｅｔａｄｎｔｏｋｃｎｉｏｓｏｅｈｒｗｔｎｑａｒｄｐｖｏｔｈｎｅｏｉｔｒｏｔｎｅｗｒｏｄｔｎ．Ｔｇｔｅｉｕｅｕｉｈｎｉｈｌ

ocr工作原理

ocr工作原理OCR（Optical Character Recognition）是一种将图像中的文字转换为可编辑文本的技术。

它通过识别图像中的文字，并将其转换为计算机可识别的字符编码，从而实现自动化的文字识别和处理。

OCR技术广泛应用于各个领域，包括文档处理、图像搜索、自动化数据输入等。

OCR工作的基本原理是通过图像预处理、文字分割、文字识别和后处理等步骤完成。

下面将详细介绍每个步骤的工作原理。

1. 图像预处理：图像预处理是OCR的第一步，其目的是对输入图像进行优化，以提高文字识别的准确性。

常见的预处理操作包括图像去噪、灰度化、二值化和图像增强等。

- 图像去噪：通过应用滤波算法，去除图像中的噪点和干扰线，以减少后续处理的误差。

- 灰度化：将彩色图像转换为灰度图像，简化后续处理的计算量。

- 二值化：将灰度图像转换为黑白图像，使文字部分为黑色，背景部分为白色，以便文字分割和识别。

- 图像增强：通过调整图像的对比度、亮度等参数，增强文字的清晰度和可读性。

2. 文字分割：文字分割是将图像中的文字区域从背景中分离出来的过程。

文字分割的目标是将连续的文字区域切分成单个字符，以便后续的文字识别。

文字分割可以基于连通区域分析或者基于边缘检测。

常见的文字分割算法包括基于投影法、基于边缘检测的方法和基于机器学习的方法等。

- 基于投影法：通过对图像进行水平和垂直投影，找到文字的边界，然后进行切割。

- 基于边缘检测：通过检测图像中的边缘，找到文字的边界，然后进行切割。

- 基于机器学习：通过训练模型，学习文字的特征，并进行文字区域的切割。

3. 文字识别：文字识别是OCR的核心步骤，其目标是将分割后的文字区域识别为计算机可识别的字符编码。

文字识别可以基于模板匹配、特征提取和机器学习等方法。

- 模板匹配：通过比较输入的文字区域与已知的字符模板，找到最匹配的字符编码。

- 特征提取：通过提取文字区域的特征，如形状、纹理和颜色等，将其转换为计算机可识别的特征向量，然后通过比较特征向量找到最匹配的字符编码。

通过计算机视觉技术实现文本识别的技巧

通过计算机视觉技术实现文本识别的技巧计算机视觉技术的发展，使得文本识别变得更加高效和精确。

通过计算机视觉技术实现文本识别，可以将纸质文档转化为可编辑和可搜索的电子文档，提高文档处理的效率和便利性。

以下是一些可以帮助实现文本识别的技巧。

1. 图像预处理在进行文本识别之前，对图像进行预处理可以帮助提高识别的准确性。

常见的图像预处理操作包括降噪、增强对比度、调整亮度和灰度化等。

这些操作可以帮助消除图像中的噪声和干扰，使得文字更清晰可辨。

2. 字符定位准确的字符定位是文本识别的关键步骤，它可以帮助确定文本的位置和边界。

字符定位可以通过边缘检测、轮廓检测和文字区域检测等方法实现。

这些方法可以帮助将图像中的文字从其他内容或背景中分离出来，为后续文本识别做好准备。

3. 文字分割在对整个图像进行文本识别之前，首先需要将图像中的文字进行分割。

文字分割可以将一张包含多个字符的图像切分成多个独立的字符图像，从而提高识别的准确性。

常用的文字分割方法包括基于连通区域、垂直投影和水平投影等。

这些方法可以根据字符之间的间隔和连接关系，将字符进行有效地分割。

4. 文本识别算法文本识别算法是实现文本识别的核心。

常见的文本识别算法包括基于模板匹配、基于特征提取和基于深度学习的方法等。

模板匹配方法通过与预定义的字符模板进行比对，找出最佳匹配的字符。

特征提取方法则通过提取字符的局部特征，例如边缘和轮廓信息，来进行字符识别。

而基于深度学习的方法则通过卷积神经网络等深度学习模型，学习图像中的文字特征，实现高精度的文本识别。

5. 数据集和训练为了实现准确的文本识别，需要大量的标注数据来对模型进行训练。

建立一个包含大量文字样本的数据集，并对每个样本进行人工标注，以提供准确的字符信息。

然后，利用这些数据集对文本识别算法进行训练和优化，提高算法的识别准确率。

6. 后处理和校正在进行文本识别之后，可能需要对结果进行后处理和校正。

后处理可以通过消除错误的检测和纠正误识别来提高文本识别的准确率。

图像背景下的满文文字提取

图像背景下的满文文字提取朱满琼;李敏;许爽;崔艳秋;丛碧辉【摘要】提出了一种图像背景下的满文文字提取方法.用数字图像处理的方法对含有图像背景的满文图片进行单字提取,并进行去噪、细化、剪枝等预处理,找到这个单字的主轴,终止点、内部点和交叉点,在主轴上找到临界点,由临界点进行笔画生长从而达到满文文字笔画提取的目的.为了验证方法的可行性,对手写体满文图像、印刷体满文图像和彩色图像中的满文分别进行了文字提取.实验结果表明该方法对满文文字提取率较高,为进一步研究满文的识别奠定了坚实的基础.【期刊名称】《大连民族学院学报》【年(卷),期】2014(016)001【总页数】4页(P78-81)【关键词】满文;笔画提取;笔画生长【作者】朱满琼;李敏;许爽;崔艳秋;丛碧辉【作者单位】北方民族大学数学与信息科学学院,宁夏银川750021;大连民族学院理学院,辽宁大连116605;大连民族学院信息与通信工程学院,辽宁大连116605;大连民族学院信息与通信工程学院,辽宁大连116605;大连民族学院信息与通信工程学院,辽宁大连116605;大连民族学院计算机科学与工程学院,辽宁大连116605【正文语种】中文【中图分类】TP391满族作为曾经的统治阶级，大量涉及政治、文化、经济、军事、外交、天文等各个方面的资料都是用满文记载的，具有很高的史料价值。

如果满语消失，那么这些史料也失去了它的价值。

而现在全国会说满语的人很少，精通满语的人更是少之又少，因此，研究满文识别系统对保护清代文化遗产来说显得尤为重要。

同时，对其他阿尔泰系语言的扫描识别，尤其对蒙古文和锡伯文的识别研究也有很大的贡献。

而满文文字的提取又是满文识别系统的关键步骤，因此做好满文文字的提取工作显得尤为重要。

随着计算机技术、多媒体技术和通信技术的飞速发展，以图像、音频和视频为主的多媒体信息正在迅速成为信息交流与服务的主流。

而图像中的文字也反映了该图像的部分重要内容［1］。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

柳培忠，宁
欣，李卫军：一种网页图像文字分割方法
2014， 50 （10）
181
一种层次聚合聚类分类方法，通过建立句子相似度矩阵来确定最优边界。在基于颜色模型的方法中，文献 [12] 假设文字像素分布符合高斯混合模型并且文字的局部和全局部分符合同样的颜色分布，然后用一种一维高斯函数来模拟文字颜色分布。上述方法对于普通图片和视频图片效果都比较好，但是由于网页图片存在分辨率低、噪声高、字符颜色多变等特点，很多分割方法还不能直接应用于网页图片。本文针对网页图片提出了一种有效的文字分割方法，方法首先对文字图像进行了反色判断、中值滤波、灰度拉伸等预处理操作，统一了分割后字符颜色标准、去除了大量噪声、提高了图像对比度。然后采用了一种基于最大类间差法（OTSU）的分割方法，在全局阈值分割的基础上确定了字符区域，又分别对不同字符区域进行局部阈值分割，得到了较好的分割效果。
（1）利用四个方向的 Sobel 算子求原灰度图像 I 所对应的边缘图像 L 。其中，I ( x y) （2）利用公式（1）可以得到临时值 t ，为原灰度图像 I 的各个像素，图像 L 上像素点 (i j) 的灰度大小为 L(i j) ，N x y 为 I ( x y) 相邻的区域；
2.3
灰度拉伸
网页中的一些图像对比往往比较低，文字部分和背
3.2
连通区域分析
对预处理后的文字图像直接进行二值化势必会存
景部分区分不是很明显，分割后容易导致笔画粘连，本文采用了文献 [14] 中提到的非线性灰度拉伸方法来提高图像的对比度，具体步骤如下：
在大量的噪声和非字符成分，本文采用连通区域分析的方法来过滤噪声，具体步骤如下：
（b）图像反相结果
2.1
反色判断
不同的网页图像背景及前景色深浅度不同，因此二
（c）中值滤波结果
值化后将形成不同的前景色，为了使分割后图像的文字部分统一为一种颜色（本文为黑色），必须对原始文字区域图像进行反色判断，对于深背景浅字的图像要进行图像反相处理。首先采用 OTSU 算法求取文字区域的一个全局阈值 T ，假设 N d 为区域图像中像素小于 T 的像素个数，N t 为区域图像中像素大于等于 T 的像素个数，则认为此文字区域为深如果 N d 与 N t 的比值大于 0.5，背景区域，对此块图像中的每个像素取反。图像反相效果如图 1 （b）所示。
1
引言
随着网络技术的发展，互联网已经成为我们获取信
别的效果严重依赖于文字分割的好坏。基于以上考虑，本文主要研究网页图片分割技术。文字分割技术可以分为 3 类：基于阈值的方法、基于聚类的方法和基于颜色模型的方法 [6]。在基于阈值的方法中，文献 [7] 提出了一种改进的 Niblack 方法对图片进行二值化；文献 [8] 对图片在 CMY 颜色模型中的各通道的直方图进行了分析，然后选取一个最优通道进行分割。在基于聚类的方法中，文献 [9] 将条件随机场应用到了图片文字分割中，通过设计分类器，得到了较好的首分割结果； Zhan[10] 提出了一种基于聚类的分割方法，先用 SRG 方法求取各连通分量，然后用聚类的方法将背景和文字分开，最后将文字分割出来；文献 [11]则提出
[4-5]
，关于文字分割的研究相对较少，然而文字识
基金项目：华侨大学引进人才科研启动费（No.12Y0316）；中央高校基本科研业务费资助项目（No.JB-ZR1202）；泉州市资助基金（No.24201305）。作者简介：柳培忠（1976—），男，博士，研究领域为图像处理、仿生模式识别、信息安全、物联网技术；宁欣（1989—），男，硕士，研究领域为图像处理、模式识别；李卫军（1975—），男，博士，研究员，研究领域为图像处理、模式识别。E-mail： ningxin@ 收稿日期： 2013-08-13 修回日期： 2013-11-22 文章编号： 1002-8331 （2014） 10-0180-04 CNKI 网络优先出版： 2014-01-15, /kcms/doi/10.3778/j.issn.1002-8331.1308-0150.html
（2）
由图 1 （d）可以看出，灰度拉伸后图像的深浅色彩更加突出，图像对比度更强，文字部分更加明显，更有利于后续的字符分割。
2
图像预处理
在字符分割前对文字区域进行预处理非常关键，好
（a）原始图像
的预处理可以有效提高字符分割的正确率。本文采用的预处理方法主要包括反色判断、中值滤波、灰度拉伸。
进行预处理，统一了分割后字符的颜色、去除了大量的噪声、提高了图像的对比度；在全局阈值的基础上确定了各字符区域的位置；利用局部最优阈值对文础上，提升了分割后字符的效果，具有较强的鲁棒性。关键词：网页图像；最大类间差法（OTSU）；文字分割；图像预处理文献标志码： A 中图分类号： TP391 doi： 10.3778/j.issn.1002-8331.1308-0150
[13]
3.1
全局阈值二值化
本文采用最大类间方差二值化阈值分割算法（OTSU
算法）对预处理后的灰度图像进行初步全局阈值二值以类间方化。 OTSU 算法 [15] 是一种全局阈值分割算法，差作为判别依据，方差越大，说明构成图像的两部分差别越大，当部分目标错分为背景或是部分背景错分为目标都会导致两部分差别变小。因此， OTSU 算法的准则是选取一个全局阈值使得错分概率最小。
（d）灰度拉伸结果图1 预处理结果
3
文字分割
针对网页图像的特点，本文算法的设计步骤如下：
（1）采用 OTSU 算法求取一个全局阈值，对文字区域图像进行初步二值化；（2）对二值图像求取连通域，进行连通分量分析，去除部分噪声及非字符成分；（3）用一种自适应投影法切分出单个字符成分，确定单个字符的位置；（4）根据单个字符区域在原灰度图像的灰度信息求取局部最优阈值，再重新对原灰度图像进行二值化，得到分割结果。以下为重要步骤的具体阐述。
2.2
中值滤波
网页图像包含各种情况，其中有些图像存在较大的
噪声，文字信息难以提取，对后续字符分割部分造成了很大的干扰。对图像进行中值滤波可以去除大量的噪声，降低噪声对字符分割的影响。中值滤波首先通过从图像中的某个采样窗口取出奇数个数据进行排序，然后用排序后的中值代替将要处理的数据。通过中值滤波，孤立的噪声点得到有效的抑制，并且文字的边缘信息得到了明显的增强。中值滤波效果如图 1 （c）所示。
较理想的分割效果。假令 T 0 为上述通过 OTSU 算法求得的全局阈值，图像像素的总数为 N ，设原灰度图像灰度级数目为 L ，像素灰度为 i 的个数为 ni ，则各灰度级的概率为整幅图像的灰度平均值为 μ0 = p i = n i /N ，
t=
(i j) Î N X Y
å
I (i j) ´ L(i j) L(i j)
X Y
å (i j) Î N
（1）
（3）用公式（2）求得一个新的灰度值 I ′( x, y) 。
I ′( x y) = t - (t - 0)2 - ( I ( x y) - 0)2 t - (255 - t )2 - ( I ( x y) - 255)2
180
2014， 50 （10）
Computer Engineering and Applications 计算机工程与应用
一种网页图像文字分割方法
柳培忠 1，宁欣 2，李卫军 2
LIU Peizhong1, NING Xin2, LI Weijun2
1.华侨大学工学院，福建泉州 362000 2.中国科学院半导体研究所神经网络实验室，北京 100083 1.College of Engineering, Huaqiao University, Quanzhou, Fujian 362000, China b of Artificial Neural Networks, Institute of Semiconductors, CAS, Beijing 100083, China LIU Peizhong, NING Xin, LI Weijun. Approach for text segmentation in web image. Computer Engineering and Applications, 2014, 50 （10）： 180-183. Abstract： According to the features of complex web images, a text segmentation method is proposed based on the OTSU method. The image is preprocessed, thus to unify the divided character color, in addition to remove a lot of noise and improve image contrast. The position of each character area is determined based on the global threshold value. Using the optimal threshold for text image segmentation. Experimental results show that the method improves the segmentation character, based on the high accuracy, with strong robustness. Key words： web image; OTSU method; text segmentation; image preprocessing 摘要：针对复杂网页图像中文本的特点，提出了一种基于最大类间差法（OTSU）的文字分割方法。对原文字图像