二值化算法在车牌识别中的应用(2)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Abstract: Studies the classical binaryzation algorithms in detail, and applies them to the development of license plate recognition system; presents a color- binaryzation method in order to resolve the problem of plate localization. It remedies the shortcoming of texture analysis, makes great contribution to enhance the recognition rate. Keywords: binaryzation; threshold; histogram; convolution;HSV color space
步骤如下: 由粗定位找出车牌的底色 Clr 并把车牌区域
A 适当扩大。 对区域中的每一点按前面的公式计算出 H
( x, y) 、S( x, y) 。 逐点对图像进行二值化:
若 Clr= WHITE 或 Clr= BLACK, 退出;
若 Clr= YELLOW, 如果 30 H( x, y) 70 且 S( x, y) 15, 则 b( x, y) = 0, 否则 b( x, y) = 1;
=
W1
21+
W2
2 2
算法的描述如下:
求出图像中最大的灰度 max gray; 令 k= 0;
求出大于和小于 k 的这两类像素总数和像素
的灰度平均值;
计算类间方差
2 B
和类内方差
2A;
k= k+ 1, 循环 3 ~ 5 步, 直到 k> max gray;
百度文库
找出最大的值, 得到相应的阈值 k。
Otsu 算法基于图像像素的灰度值分类, 按照使类
2003 年第 6 期 文章编号: 1006- 2475( 2003) 06- 0013- 04
计算机与现代化 JISUANJI YU XIANDAIHUA
二值化算法在车牌识别中的应用
吴传孙1, 邹扬德2, 周定康1
( 1. 江西师范大学计算机学院, 江西 南昌 330027; 2. 武警南昌指挥学校, 江西 南昌 330100)
0引言
在车牌自动识别系统中, 从汽车的彩色图像信息 输入到最终车牌号码的获取大致要经过如下几个过 程: 预 处理、车 牌 定 位、二 值化、字 符切 分、字 符 识 别[ 1~ 2] 。其中二值化是非常关键的一步, 二值化的效 果直接影响到后面的切分和识别。因为字符的切分 和识别是基于车牌区域的二值化结果进行的。二值 化算法又称为阈值算法, 其目的就是要找出一个合适 的阈 值, 将 待研 究的 区 域划 分 为前 景 和 背景 两 部 分[ 3] 。二值化后的车牌要能再现原字符图像, 基本不 出现笔画断裂和粘连现象, 尽量不丢失原字 符的特 征。另外, 二值化算法还可以用在车牌定位这个过程 中精确定位车牌的上下左右四边界。为此, 必须对二 值化算法作深入细致的研究。
( V) 是指颜色的明暗程度, 通常用百分比度量, 从黑 0% 到白 100% ; 饱和度 ( S) 指颜色的深浅, 也用百分
比来度量, 从 0% 到完全饱和 100% 。 2. 2 彩色二值化方法及应用
经过长期的实验, 我们发现定位车牌的上下左右 四个边界这项工作是非常困难的。文献[ 5] 先对整个 车辆图像进行颜色分割, 然后作纹理分析; 这种方法 虽然好, 但最后对车牌的精确定位要用 Hough 变换来 检测车牌的边缘; 我们认为 Hough 变换应尽量少用, 因为它的计算量相当大, 并且车牌的边缘不一定很清 晰, 再说车牌的两条竖直边很短, 难以检测出来; 我们
总第 94 期
摘要: 详细研究了二值化的经典算法 , 并将它运用到车牌识别 系统的开发 过程中; 同时针对 车牌边 界定位 难的问 题, 提
出了一种彩色二值 化方法, 弥补了纹理分析的不足, 有助于提高车牌的识别率。
关键词: 二值化; 阈值; 直方图; 卷积; HSV 颜色空间
中图分类号: TP391. 4
HSV 颜色空间也 称为 HSB 空间。H ( Hue) 指色 调, 是评定某种颜色的直接依据; S( Saturation) 指的是 饱和度, 即某种颜色的深浅; V( Value) 或 B( Brightness) 都是亮度, 指的是颜色的明暗程度。其中色调分量是 基于人眼能感知到的红橙黄绿青蓝紫这些基本的颜 色信息, 用 0~ 360 来表示。色调和饱和度的范围都 是 0~ 100。参考 PhotoShop 中的 ColorPicker 可以加深 对 H、S、V 这三种颜色分量的理解。由于彩色图像中 的每一个像素只含有 R、G、B 三彩色分量, 所以在使 用 HSV 颜色空间之前得进行转换。转换公式如下:
1 基于灰度的二值化
假设一幅灰度车牌图像的大小为 M 行 N 列, 用 f
( x, y) ( 0 x< M, 0 y< N, x 和 y 都为整数) 来表示一
像素的灰度。那么二值化处理可以表示如下式所示:
1 f( x, y) T f( x, y) =
{ 0 otherwise 这里的 T 称为阈值( Threshold) , 经过二值化处理
后, 字符前景和车牌背景就由黑白两种颜色分开, 选
择不同的阈值会得到不同的分离结果。在车牌识别
中对车牌灰度图像进行二值化的方法主要有全局动
态二值化、局部自适应二值化。
1. 1 全局动态二值化
全局动态二值化从整个灰度图像的像素分布出
发寻求一 个最佳的门限 值, 其中的 经典算法是 Otsu 算法[ 4] , 它是在 判别最小二乘法 的基础上推导 出来
的。基本思想是: 取一个阈值 t , 将图像像素按灰度大
小分为大于等于 t 和小于 t 两类, 然后求出两类像素
的平均值方差
2 B
(
类间方差)
和两个类各自的均方差
2 A
(
类
内方
差)
,
找
出使两个
方差比
2 B
/
2 A
最大的阈值
t, 该阈值即为二值化图像的最佳阈值。这种方法不
收稿日期: 2003-02- 19 作者简介: 吴传孙( 1974- ) , 男, 江西永新人, 江西师范大学计算机学院硕士 研究生, 研 究方向: 图像处理、模式 识别、数 据库 技术。
差为 21( k) ; 类 2 中的像素总数为 W2( k) , 平均灰度为
M2( k) , 方差为 22( k) ; 所有图像像素的平均值为 Mr。
类间方差
2 B
和类内方差
2 A
分别由下两式决定:
2 B
=
W1 (M1 -
Mr ) 2+
W2 (M2 -
Mr) 2=
W1W2( M1-
M2 ) 2
2 A
T 3( x, y) = max f( x+ k, y+ l ) - min f ( x + k, y
-w k w
-w k w
-w l w
-w l w
+ l)
对每点的阈值 T2 进行一次滤波处理 得新阈
值
T4: T4( x, y) =
-
avg
wk
T
w
2(
x+
k, y+
l)
-w l w
逐点对图像进行二值化
14
计算机与现代化
2003 年第 6 期
论图像的直方图有无明显的双峰, 都能得到较为满意
的效果。因此这种方法是阈值自动选取的较优方法。
具体方法如下:
设给定图像具有 1, 2, 3, , L , 共 L 级灰度, 阈 值设为 k, 把灰度大于 k 和小于 k 的像素分为两类。
类 1 中的像素总数为 W1( k) , 平均灰度为 M1 ( k) , 方
判据, 来决定对当前点是置 0 还是置 1。文献[ 3] 中
的 LEVBB 算法是局部自适应算法的典型算法: 对每一点计算阈值:
T2( x, y) =
1 2
max f ( x + k, y + l) + min f( x
-w k w
-w k w
-w l w
-w l w
+ k, y+ l) 计算另一阈值 T3:
Hmax
s 0, Imax= r
h=
[ 2+
bImax -
r Imin ]
Hmax
s
0, Imax= g
{[ 4+
rImax -
g Imin ]
Hmax
s
0, Imax= b
其中, Hmax代表色调的个数, 通常取为 60。色度
( H) 是由颜色名称来辨别的, 如 红、绿、蓝等, 它用角
度 0 ~ 360 来度 量, 对应 于颜色轮上 的角度。亮度
的方法是: 首先利用纹理扫描对车牌进行粗定位, 然
后适当向四周扩散, 从粗定位的车牌的中心取出一小 块区域判断颜色, 根据判断出来的颜色从 HSV 空间
中选取适当的 H、S 值进行二值化。这里没有利用 V 分量即亮度信息, 主要是考虑到因为天气、环境以及 人为等因素造成了车辆图像中的亮度信息最不稳定, 所以我们的二值化判据中只有色调和饱和度, 其中又 以色调 H 为主。
设 Imax= max{ r, g, b} , Imin= min{ r, g, b}
2003 年第 6 期
吴传孙等: 二 值化算法在车牌识别中的应用
15
0
Imax = 0
s = Imax - Imin { Imax
Imax
0
v= Imax
undefined
s= 0
g- b Imax - Imin
若( f( x, y) > T 4( x, y) ) 且( T 3( x, y) > ( T1- min) )
则 b( x, y) = 1 否则 b( x, y) = 0
255
其中 T1 满足 H( x) 0. 1, H( x ) 为灰度直方图。 x= T1
2 彩色二值化
上述二值 化方法都是基于车牌的灰度图像的。 但是我国的车牌占绝大多数是黄底黑字、蓝底白字, 还有少部分黑底白字以及白底黑字。前两种车牌的 颜色信息非常丰富, 可以充分利用这些信息来做些辅 助工作。关于彩色信息的提取, 可以从不同的颜色空 间去考虑, 常用的有 RGB 空间、HSV 空间、CMYK 空 间、YIQ 空间和 YUV 空间等。RGB 空间是最 简单也 是最 基本 的一 种 颜色 空 间, 因为 一 般 的图 像 都 是 RGB 格式, 从像素中可以直接提取出 R、G、B 三分量。 CMYK 颜色空间常用于印刷工业中; YIQ 颜色空间通 常被北美的电视系统所采用( 属于 NTSC 系统) ; YUV 则被欧洲的电视系统所采用( 属于 PAL 系统) 。在车 牌识别中颜色信息的利用可以从 HSV 空间去考虑, 这种颜色空间使用起来比较方便, 已被广泛利用。文 献[ 5] 提出了一种基于 HSV 空间的彩色二值化算法, 利用的是 S、V 这两种分量; 文献[ 6] 中颜色信息的利 用也是基于 HSV 空间的。后面我们的彩色二值化算 法也是基于 HSV 空间的, 这里先介绍一些关于 HSV 空间的知识。 2. 1 HSV 颜色空间
间方差与类内方差比值最大的原则获得门限值, 使目
标占背景之间方差最大, 即找出使两个方差比
2 B
/
2 A
的最大的阈值 T , 这种算法具有以下优点:
算法的实现简单; 基于图像的整体特性的积分而非局部特性;
可推广到多阈值的分割方法;
该算法的适用性强。
然而, 尽管该方法有一定的自适应性, 但以灰度
分布为特征, 判决准则 函数 S( k) =
2 B
/
2 A
可能 呈双
峰, 即全局最大值不能保证是正确的阈值; 另外当图
像存在光照不均匀的现象时, 往往整幅图无法找到合
适的单一阈值。
1. 2 局部自适应二值化
局部自适应二值化是针对灰度图像中的每一个
像素逐点进行阈值计算的, 以当前点为中心选取一个 适当的邻域模板, 从这个模板中的像素灰度值中获得
文献标识码: A
The Application of Binaryzation Algorithms in License Plate Recognition
WU Chuan- sun1, ZOU Yang- de2, ZHOU Ding- kang1
( 1. Computer College, Jiangxi Normal University, Nanchang 330027, China; 2. Nanchang Command College of Armed Police Forces, Nanchang 330100, China)
步骤如下: 由粗定位找出车牌的底色 Clr 并把车牌区域
A 适当扩大。 对区域中的每一点按前面的公式计算出 H
( x, y) 、S( x, y) 。 逐点对图像进行二值化:
若 Clr= WHITE 或 Clr= BLACK, 退出;
若 Clr= YELLOW, 如果 30 H( x, y) 70 且 S( x, y) 15, 则 b( x, y) = 0, 否则 b( x, y) = 1;
=
W1
21+
W2
2 2
算法的描述如下:
求出图像中最大的灰度 max gray; 令 k= 0;
求出大于和小于 k 的这两类像素总数和像素
的灰度平均值;
计算类间方差
2 B
和类内方差
2A;
k= k+ 1, 循环 3 ~ 5 步, 直到 k> max gray;
百度文库
找出最大的值, 得到相应的阈值 k。
Otsu 算法基于图像像素的灰度值分类, 按照使类
2003 年第 6 期 文章编号: 1006- 2475( 2003) 06- 0013- 04
计算机与现代化 JISUANJI YU XIANDAIHUA
二值化算法在车牌识别中的应用
吴传孙1, 邹扬德2, 周定康1
( 1. 江西师范大学计算机学院, 江西 南昌 330027; 2. 武警南昌指挥学校, 江西 南昌 330100)
0引言
在车牌自动识别系统中, 从汽车的彩色图像信息 输入到最终车牌号码的获取大致要经过如下几个过 程: 预 处理、车 牌 定 位、二 值化、字 符切 分、字 符 识 别[ 1~ 2] 。其中二值化是非常关键的一步, 二值化的效 果直接影响到后面的切分和识别。因为字符的切分 和识别是基于车牌区域的二值化结果进行的。二值 化算法又称为阈值算法, 其目的就是要找出一个合适 的阈 值, 将 待研 究的 区 域划 分 为前 景 和 背景 两 部 分[ 3] 。二值化后的车牌要能再现原字符图像, 基本不 出现笔画断裂和粘连现象, 尽量不丢失原字 符的特 征。另外, 二值化算法还可以用在车牌定位这个过程 中精确定位车牌的上下左右四边界。为此, 必须对二 值化算法作深入细致的研究。
( V) 是指颜色的明暗程度, 通常用百分比度量, 从黑 0% 到白 100% ; 饱和度 ( S) 指颜色的深浅, 也用百分
比来度量, 从 0% 到完全饱和 100% 。 2. 2 彩色二值化方法及应用
经过长期的实验, 我们发现定位车牌的上下左右 四个边界这项工作是非常困难的。文献[ 5] 先对整个 车辆图像进行颜色分割, 然后作纹理分析; 这种方法 虽然好, 但最后对车牌的精确定位要用 Hough 变换来 检测车牌的边缘; 我们认为 Hough 变换应尽量少用, 因为它的计算量相当大, 并且车牌的边缘不一定很清 晰, 再说车牌的两条竖直边很短, 难以检测出来; 我们
总第 94 期
摘要: 详细研究了二值化的经典算法 , 并将它运用到车牌识别 系统的开发 过程中; 同时针对 车牌边 界定位 难的问 题, 提
出了一种彩色二值 化方法, 弥补了纹理分析的不足, 有助于提高车牌的识别率。
关键词: 二值化; 阈值; 直方图; 卷积; HSV 颜色空间
中图分类号: TP391. 4
HSV 颜色空间也 称为 HSB 空间。H ( Hue) 指色 调, 是评定某种颜色的直接依据; S( Saturation) 指的是 饱和度, 即某种颜色的深浅; V( Value) 或 B( Brightness) 都是亮度, 指的是颜色的明暗程度。其中色调分量是 基于人眼能感知到的红橙黄绿青蓝紫这些基本的颜 色信息, 用 0~ 360 来表示。色调和饱和度的范围都 是 0~ 100。参考 PhotoShop 中的 ColorPicker 可以加深 对 H、S、V 这三种颜色分量的理解。由于彩色图像中 的每一个像素只含有 R、G、B 三彩色分量, 所以在使 用 HSV 颜色空间之前得进行转换。转换公式如下:
1 基于灰度的二值化
假设一幅灰度车牌图像的大小为 M 行 N 列, 用 f
( x, y) ( 0 x< M, 0 y< N, x 和 y 都为整数) 来表示一
像素的灰度。那么二值化处理可以表示如下式所示:
1 f( x, y) T f( x, y) =
{ 0 otherwise 这里的 T 称为阈值( Threshold) , 经过二值化处理
后, 字符前景和车牌背景就由黑白两种颜色分开, 选
择不同的阈值会得到不同的分离结果。在车牌识别
中对车牌灰度图像进行二值化的方法主要有全局动
态二值化、局部自适应二值化。
1. 1 全局动态二值化
全局动态二值化从整个灰度图像的像素分布出
发寻求一 个最佳的门限 值, 其中的 经典算法是 Otsu 算法[ 4] , 它是在 判别最小二乘法 的基础上推导 出来
的。基本思想是: 取一个阈值 t , 将图像像素按灰度大
小分为大于等于 t 和小于 t 两类, 然后求出两类像素
的平均值方差
2 B
(
类间方差)
和两个类各自的均方差
2 A
(
类
内方
差)
,
找
出使两个
方差比
2 B
/
2 A
最大的阈值
t, 该阈值即为二值化图像的最佳阈值。这种方法不
收稿日期: 2003-02- 19 作者简介: 吴传孙( 1974- ) , 男, 江西永新人, 江西师范大学计算机学院硕士 研究生, 研 究方向: 图像处理、模式 识别、数 据库 技术。
差为 21( k) ; 类 2 中的像素总数为 W2( k) , 平均灰度为
M2( k) , 方差为 22( k) ; 所有图像像素的平均值为 Mr。
类间方差
2 B
和类内方差
2 A
分别由下两式决定:
2 B
=
W1 (M1 -
Mr ) 2+
W2 (M2 -
Mr) 2=
W1W2( M1-
M2 ) 2
2 A
T 3( x, y) = max f( x+ k, y+ l ) - min f ( x + k, y
-w k w
-w k w
-w l w
-w l w
+ l)
对每点的阈值 T2 进行一次滤波处理 得新阈
值
T4: T4( x, y) =
-
avg
wk
T
w
2(
x+
k, y+
l)
-w l w
逐点对图像进行二值化
14
计算机与现代化
2003 年第 6 期
论图像的直方图有无明显的双峰, 都能得到较为满意
的效果。因此这种方法是阈值自动选取的较优方法。
具体方法如下:
设给定图像具有 1, 2, 3, , L , 共 L 级灰度, 阈 值设为 k, 把灰度大于 k 和小于 k 的像素分为两类。
类 1 中的像素总数为 W1( k) , 平均灰度为 M1 ( k) , 方
判据, 来决定对当前点是置 0 还是置 1。文献[ 3] 中
的 LEVBB 算法是局部自适应算法的典型算法: 对每一点计算阈值:
T2( x, y) =
1 2
max f ( x + k, y + l) + min f( x
-w k w
-w k w
-w l w
-w l w
+ k, y+ l) 计算另一阈值 T3:
Hmax
s 0, Imax= r
h=
[ 2+
bImax -
r Imin ]
Hmax
s
0, Imax= g
{[ 4+
rImax -
g Imin ]
Hmax
s
0, Imax= b
其中, Hmax代表色调的个数, 通常取为 60。色度
( H) 是由颜色名称来辨别的, 如 红、绿、蓝等, 它用角
度 0 ~ 360 来度 量, 对应 于颜色轮上 的角度。亮度
的方法是: 首先利用纹理扫描对车牌进行粗定位, 然
后适当向四周扩散, 从粗定位的车牌的中心取出一小 块区域判断颜色, 根据判断出来的颜色从 HSV 空间
中选取适当的 H、S 值进行二值化。这里没有利用 V 分量即亮度信息, 主要是考虑到因为天气、环境以及 人为等因素造成了车辆图像中的亮度信息最不稳定, 所以我们的二值化判据中只有色调和饱和度, 其中又 以色调 H 为主。
设 Imax= max{ r, g, b} , Imin= min{ r, g, b}
2003 年第 6 期
吴传孙等: 二 值化算法在车牌识别中的应用
15
0
Imax = 0
s = Imax - Imin { Imax
Imax
0
v= Imax
undefined
s= 0
g- b Imax - Imin
若( f( x, y) > T 4( x, y) ) 且( T 3( x, y) > ( T1- min) )
则 b( x, y) = 1 否则 b( x, y) = 0
255
其中 T1 满足 H( x) 0. 1, H( x ) 为灰度直方图。 x= T1
2 彩色二值化
上述二值 化方法都是基于车牌的灰度图像的。 但是我国的车牌占绝大多数是黄底黑字、蓝底白字, 还有少部分黑底白字以及白底黑字。前两种车牌的 颜色信息非常丰富, 可以充分利用这些信息来做些辅 助工作。关于彩色信息的提取, 可以从不同的颜色空 间去考虑, 常用的有 RGB 空间、HSV 空间、CMYK 空 间、YIQ 空间和 YUV 空间等。RGB 空间是最 简单也 是最 基本 的一 种 颜色 空 间, 因为 一 般 的图 像 都 是 RGB 格式, 从像素中可以直接提取出 R、G、B 三分量。 CMYK 颜色空间常用于印刷工业中; YIQ 颜色空间通 常被北美的电视系统所采用( 属于 NTSC 系统) ; YUV 则被欧洲的电视系统所采用( 属于 PAL 系统) 。在车 牌识别中颜色信息的利用可以从 HSV 空间去考虑, 这种颜色空间使用起来比较方便, 已被广泛利用。文 献[ 5] 提出了一种基于 HSV 空间的彩色二值化算法, 利用的是 S、V 这两种分量; 文献[ 6] 中颜色信息的利 用也是基于 HSV 空间的。后面我们的彩色二值化算 法也是基于 HSV 空间的, 这里先介绍一些关于 HSV 空间的知识。 2. 1 HSV 颜色空间
间方差与类内方差比值最大的原则获得门限值, 使目
标占背景之间方差最大, 即找出使两个方差比
2 B
/
2 A
的最大的阈值 T , 这种算法具有以下优点:
算法的实现简单; 基于图像的整体特性的积分而非局部特性;
可推广到多阈值的分割方法;
该算法的适用性强。
然而, 尽管该方法有一定的自适应性, 但以灰度
分布为特征, 判决准则 函数 S( k) =
2 B
/
2 A
可能 呈双
峰, 即全局最大值不能保证是正确的阈值; 另外当图
像存在光照不均匀的现象时, 往往整幅图无法找到合
适的单一阈值。
1. 2 局部自适应二值化
局部自适应二值化是针对灰度图像中的每一个
像素逐点进行阈值计算的, 以当前点为中心选取一个 适当的邻域模板, 从这个模板中的像素灰度值中获得
文献标识码: A
The Application of Binaryzation Algorithms in License Plate Recognition
WU Chuan- sun1, ZOU Yang- de2, ZHOU Ding- kang1
( 1. Computer College, Jiangxi Normal University, Nanchang 330027, China; 2. Nanchang Command College of Armed Police Forces, Nanchang 330100, China)