条形码的识别图像处理报告解析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
华侨大学厦门工学院图像通信课程设计报告
题目:基于数字图像处理的条形码识别专业、班级:
学生姓名:
学号:
指导教师:
分数:
目录
一、设计任务及要求 (3)
二、设计原理及设计方案 (3)
2.1、条码译码原理 (3)
2.2条码译码方案 (4)
三、设计步骤与结果 (10)
3.1设计步骤 (10)
3.2结果分析 (11)
四、课程设计总结 (15)
五、心得体会 (15)
六、参考文献 (16)
附录一、源程序 (17)
附录二、成绩评定表 (25)
一、设计任务及要求
本课程设计研究的是基于数字图像处理的EAN-13条形码识别算法,通过工具平台MATLAB 实现。
其中图像处理部分是条码识别重要的前期工作,利用MATLAB 强大的图象处理工具箱实现图像的读入、加噪仿真、滤波、二值化处理等工作,最终得到高质量的二值化图像。
条码识别就是在二值图像的基础上实现,二值图像的质量直接关系到条码能否正确识读。
二、设计原理及设计方案
2.1、条码译码原理:
如图1-1所示是EAN-13条码的一个字符。
条、空宽度的定义如下:图中1C 、2C 、3C 、4C 表示每个字符中四个相邻条、空的宽度,T 表示一个字符的宽度。
图1-1 EAN-13条码宽度的定义
设一个字符中单位模块的宽度为n ,则单位模块的宽度:
n=T /7
T=1C +2C +3C +4C
由于条码条、空宽度1C 、2C 、3C 、4C 已知,设条码条、空分别占单位模块的个数为i m ,则:
i m =i C /n(其中i 取1、2、3、4)
因此,由mi 可知道条码的编码。
例如:
(1)若1m =2、2m =2、3m =2、4m =1;
条码的排列为条-空-条-空,则可知条码编码为1100110,是右侧偶性字符1;
(2)若1m =1、2m =2、3m =1、4m =3;
条码的排列为空-条-空-条,则可知条码编码为0110111,是右侧奇性字符8。
2.2条码译码方案: 方案一:宽度测量法
在图像方式的译码过程中,宽度的测量不再采用传统的脉冲测量法,而是通过记录每个条或空的宽度中所含象素的个数来确定实际的条/空宽度,从而确定整个条码符号所代表的信息。
方案二:平均值法
对条码符号图像中从起始符到终止符整个宽度进行测量,然后除以95(标准宽度),求出单位模块所含的像素列宽,再分别测量各个条空的实际宽度(此宽度以单位宽度为单位计算)。
方案三:相似边距离的测量方法
这种方法的设计思路是通过对符号中相邻元素的相似边之间距离的测量来判别字符的逻辑值,而不是由各元素宽度的实际测量值来判别。
前两种方案对条码图像的要求非常高,因为它们都是测量各元素符号的实际宽度,然后根据查表法得到所代表的码值。
如果实际测量值与标准值存在一点偏差,就不能实现正确译码。
而第三种方案正是有效的解决了这一问题,因此本文采用相似边距离测量的方法来实现译码功能。
下面就简要说明一下这一方法。
由原理知,要想辨识一个条码,必须先测量条码条、空宽度1C 、2C 、3C 、4C 以及一个字符的宽度T 。
条码图像经过预处理后得到的是二值图像,该点的颜色信息在阈值变换时已经定义,用255和0表示白和黑色。
我们从条码的左边开始取点,若遇到点的灰度值由255变到0即由点的颜色由白色变为黑色,则表示检测到条,记录下该点的坐标值,如果点的颜色由黑色变为白色,则表示检测到空,记录下该点的坐标值。
这样经过扫描后得到各个颜色变化点的坐标,然后将相邻两点的横坐标相减得到各个条、空的宽度.由前面所述EAN-13条码的组成知:一个由占3个条空的起始符、3个条空的终止符、4个条空的左侧数据符、5个条空的中间分隔符、20个条空的右侧数据符、4个条空的校验符组成。
所以,
整个条码字符占的条空总数为59,若条码字符没有发生几何畸变,一行扫描应记录的坐标数为60个。
而对于有几何畸变的条码图像,例如条码污染、条码断裂、条码瑕疵等,该扫描行的坐标数将肯定大于60或小于60,这时将不记录该扫描行,对此行不处理。
这样利用图像统计方法,逐行扫描图像,获取条码图像信息,比起只由一行获取信息的方式可靠性更高,这样即使个别噪声点存在并不影响图像信息的获取。
(1)条码宽度的计算:
设条码字符颜色由黑变为白或由白变为黑(由“0”变为“1”或由“1”变为“0”)的各点坐标为1x 、2x 、 ……、60x 。
则一行扫描的条空宽度(像素)分别为:1c =2x -1x 、2c =3x -2x 、……、59c =60x -59x 。
由上述图像条码译码理论可总结出条码条空宽度计算步骤,如图1-2所示:
图1-2 条码条空宽度计算
在MATLAB 中采用读取像素的方法实现。
经过二值化后得到一个二值化图象矩阵bw 。
简单起见,可以读取矩阵bw 的中间一行,得到一个向量A 。
为了提高可靠性,我们也可逐行扫描。
[h,l]=size(bw); %得到二值图像bw 的大小
A=bw(round(h/2),:);
A 中只有0和1表示黑与白。
读取其中的元素,发生变化记下坐标(像素)存入另一个向量x 中,x 元素前后依次相减存入向量y 中得条码宽度。
(2)条码字符的判别—相似边距法:
理论上条形码字符的逻辑值应该由条形码的实际宽度来判断,而相似边距离方法的设计思想通过对符号中相邻元素的相似边之间距离的测量来判别字符的逻辑值,而不是由元素宽度的实际值来判别。
此种方法的优点是:即使条码质量存在缺欠,使得实际测量值和条码应该具有的理论值有较大的偏差,仍然可以根据相似边的距离能够正确解释。
图1-3给出了相似边之间的距离,则图中1t ,2t ,3t ,4t ,5t ,6t ,7t (归一化值)为条形码相似边距离。
本文采用归一化理论,
用一种相似边距离归一化的方法对字符进行判别。
该方法即使条码印刷质量有偏差,仍能正确对条码进行识读。
图1-3 相似边之间的距离 图1-4 条码字符宽度示图
首先见图1-4各种宽度的定义: 1C , 2C , 3C , 4C 表示每个字符中四个相邻条、空的宽度,T 表示一个字符的宽度,1t ,2t 为相似边之间的距离,则用下
列值i T (i=1,2)来定义1T 与2T 的归一化值。
测量7个宽度值T ,1t ,2t ,3t ,4t ,5t ,6t ;然后将测量值1t ,2t ,3t ,4t ,5t ,6t 转换为常数值1T ,2T ,3T ,4T ,5T ,6T 即T 序列值,它代表了这些测量值的整数模块宽,以下方法用于i 序列值的求取:
若1.5≦i t ≦2.5,那么i T =2
若2.5≦i t ≦3.5,那么i T =3
若3.5≦i t ≦4.5,那么i T =4
若4.5≦i t ≦5.5,那么i T =5
表1-1列出了正向译码时,EAN-13条码字符值与归一化值(1T ,2T )的对应关系。
表1-1中“E”表示偶字符,“O”表示奇字符。
EAN-13码字符编码与归一化值(1T ,2T )的对应关系见表1-2。
表1-1 EAN-13条码字符与归一化值
表1-2 EAN-13字符编码与归一化值
可以看到条形码编码和归一化值在多数情况下呈现一一对应的关系,只要确定了归一化值就能确定字符值,但是有四种情况例外,在表1-2中知,左侧奇字符和右侧偶字符1,7归一化值均为44,左侧奇字符和右侧偶字符2,8归一化值均为33,左侧偶字符1,7归一化值均为34,左侧偶字符2,8归一化值均为
43。
这两种情况可以在判别字符时根据1C ,2C ,3C ,4C 进一步判别,根据它们条空宽度特点进行判别。
有1728字符标准条空宽度值的特点知:对于左侧奇字符、右侧偶字符1和7可通过3C 与4C 作比较,3C >4C 者为字符1,反之为7;对于左侧奇字符、右侧偶字符2和8可通过2C 与3C 作比较,2C >3C 者为字符8,反之为2;对于左侧偶字符1和7可通过1C 与2C 作比较,1C >2C 者为字符7,反之为1;对于左侧偶字符2和8可通过2C 与3C 作比较,2C >3C 者为字符2,反之为8。
由上述条码字符识别理论可总结出相似边距离测量法的一般步骤。
由条码宽度的
计算我们得到了各个条、空的宽度(像素),并通过计算n=T /7,
T =1C +2C +3C +4C 得到单位模块的宽度(像素)。
各个条空的宽度除以单位模块的宽度就是归一化的条空宽度。
而为了方便译码,我们除去起始符3个条空,中
间分隔符5个条空,终止符3个条空,对剩下的48个条空每4个条空为一组进行译码。
计算相似边之间的距离1t 、2t 从而得到归一化(1T ,2T )。
最后查表可得条码字符。
为检验译码的正确性利用校验位对码字进行校验。
流程图如图1-5 和1728判别子程序流程如图1-6。
图1-5 字符判别流程图
图1-6 1728判别子程序流程图
三、设计步骤与结果
3.1设计步骤
对于一个条码图像我们先要对其进行一定的处理才能达到正确译码的目的。
而要对其进行处理,首先是要将其读入。
由于有噪声的存在,必须对其进行滤波。
也可以人为地加入一定类型的噪声仿真,然后用合适的滤波方法进行滤波,这样有助于理解各种滤波方法所针对的噪声类型。
最后就是要二值化,得到二值图像。
条码图像预处理流程图如图1-7所示。
图1-7 条码图像预处理流程图
⑴ MATLAB中利用函数imread来实现图像文件的读取操作。
图1-8是首次需要处理的条码图片。
图1-8 需要处理的条码
一般情况下,通过imread函数读取的大多数图像都是8位的。
当把这些图像加载到内存中时,MATLAB就将其存储在类uint8中。
此外,MATLAB还支持16位的PNG和TIFF图像。
当用户读取这类图像时,MATLAB就将其存储在类uint16中。
而对于索引图像来说,即使图像矩阵的本身为uint8或uint16,imread 函数仍将颜色映射表读取并存储在一个双精度浮点类型的矩阵中。
例如:I=imread('008.bmp');
该语句可将条码图像读入内存,并以矩阵形式存储。
⑵MATLAB的图像处理工具箱提供imnoise函数,可以用该函数给图像添加不同种类的噪声。
该函数的调用格式如下:
J=imnoise(I,‘type’,parameters)
表1-3列出了imnoise函数能够产生的五种噪声及其对应参数。
表1-3 imnoise函数支持的噪声种类及参数说明
例如:J=imnoise(I,'salt & pepper',0.01);
该语句实现在条码图像I中加入椒盐噪声。
⑶条码图像被采集进入计算机,由于设备、以及传输过程中的各种因素的影响,一些噪声将会对图像的质量产生影响。
任何一幅未经处理的原始图象,都存在一定程度的噪声干扰。
不同的噪声干扰,处理方法不同。
影响条码图像质量最典型的噪声是椒盐噪声。
椒盐噪声的特点是此干扰在图像中是以孤立点的形式
存在的。
针对噪声的类型,采用中值滤波。
中值滤波是一种非线性信号处理方法。
可以克服线性滤波器如最小均方滤波,平均值滤波(平滑滤波)等所带来的图像细节模糊。
而且对于脉冲干扰及点状噪声有良好抑制作用,能较好保持图像边缘。
它可以起到既消除噪声又保持图像细节的作用。
为了达到好的滤波效果应选择合适的滤波窗口。
从条码图像的特征来讨论选择采用的中值滤波窗口。
条码图像的特点在于是由纵向一定宽度黑白条空组成,我们建立不同大小的模板,对含有噪声的图像进行滤波处理,比较它们滤除噪声干扰的效果。
在MATLAB 中可以使用imfilter 函数或filter2函数调用创建好的滤波器(可以是预定义滤波器,也可以是自定义滤波器)对图像进行滤波。
指定了一个阈值T 之后,将图像中的像素与阈值作比较,如果图像中某像素的灰度值小于该阈值,则将该像素的灰度值设置为0,否则灰度值设置为255。
按下式对图像进行处理可得到二值图像g(x,y):
255(,)0
g x y ⎧=⎨⎩ (,)
(,)f x y T f x y T ≥< 在MATLAB 中,通过使用函数graythresh 和im2bw 创建一个新的二值图像bw :
level=graythresh(L);
bw=im2bw(L,level);
根据上述译码理论,采用相似边距离测量方法对图1-8预处理后的条码图像(二值图像)进行译码,得到如下所示译码结果:
图1-9是第二张需要处理的条码图片。
图1-9 需要处理的条码
根据条码图像预处理的理论知识编译相关的MATLAB程序,得到如图1-10所示的图像预处理结果。
图1-10 条码图像预处理
得到如下所示译码结果:
3.2结果分析
误码率方面,一般情况下条码都能够正确识读。
但在由一个字符的归一化的相似边距离1t 、2t 转换为T 序列值1T 、2T 时,如果1t 、2t 的值为2.5、3.5、4.5
之一,系统将不能正确的将其转换为T 序列值,此时存在最大的误码率,条码几乎不能被正确识读。
所以应该尽量避免此种情况的发生,这就要求我们做好图像的预处理工作,防止条码线条过度展宽或细化。
需要指出的是,在实际的译码中还存在着正向译码和反向译码的情况,两种情况下字符编码对应着不同的归一化值。
因此译码前需要判别译码方向。
本设计直接采用正向译码。
最后,译码是编码的反过程,编码技术的熟练掌握对译码工作有着事半功倍的效果。
四、课程设计总结
通过多次对不同EAN-13条码的识读,证明该条码检测系统速度快、效率高、而误码率却很低,即使在图像预处理上达不到理想的效果,条码仍能正确识读。
这是因为我们选择了相似边距离测量的方法。
可见,影响条码识别效果的不仅仅是条码图像预处理效果,译码方法更是不可忽视的重要原因。
相似边距离测量方法有着其它译码方法无可比拟的优势,它不是根据条码条空宽度的实际值来判别,而是通过所谓的相似边距离来判别。
因此,即使条码质量存在欠缺,仍然能够根据相似边距离正确解释条码,有着很强的对实际情况的适应性。
五、心得体会
在对条码图像作相应的图像预处理之后,对得到的二值条码图像利用上述条码识别算法在MATLAB软件环境下编写了相应的软件程序。
通过实验,识别效果不错,误码率低,提高了条码的识别率。
本次设计在译码方法上进行了比较选择,确定了相似边距离的测量方法的优越性。
这种方法的设计思路是通过对符号中相邻元素的相似边之间距离的测量来判别字符的逻辑值。
另外用软件实现条码的识别比硬件具有更好的抗噪声性能,且速度快,效率高。
尽管如此,设计中也遇到了很多的问题有待进一步的解决和探索研究。
本设计只是对质量较好的条码图像进行一般性处理,但实际中的图像并都不是这么理想,例如条码污染、条码断裂、条码瑕疵等。
这些需要进行特殊的图像处理过程才能达到译码的目的。
如果条码被污染了要进行修复,条码发生几何畸变要进行图像矫正等等。
只有考虑到更多的方面才能提高系统的性能和适应性,对一定质量范围内的条码图像都能进行有效的处理。
在设计中,由于本人在图像处理上的造诣不高,对很多细节、常识方面了解不够导致问题的出现,而且没能采取科学的方法进行错误分析、排查,使得问题小却难以解决。
今后在做类似的工作的时候要注重基础知识的学习,并讲究科学的方法。
做软件编程的对所用语言基础要够熟练掌握并能借助一定的参考资料进一步充实自己,提高自己。
六、参考文献
[1] 邹永星.条码国家标准汇编[M].北京.中国标准出版社.2004:12-21
[2] 中国自动识别技术协会.条码技术基础[M] .武汉.武汉大学出版社.2008:15-16
[3] 黄红, 黄才骏.条码的奥秘[M]. 北京.中国铁道出版社.2000:69-72
[4] 王雅静.EAN-13 条码图像辨识方法的研究[D].青岛.山东科技大学.2003
[5]唐莉,刘富强.条码国家标准汇编[M].北京.中国标准出版社.2004:11-25
[6]张铎,王耀球.条码技术与电子数据交换[M].北京.中国铁道出版社.1998:13-16 [7薛红.条码技术及商业自动化系统-条码技术[M] .北京.中国轻工业出版社.2008:67-69
附录一、源程序
%function code = barcode(pic) %条形码识别
close all
check_left = [13,25,19,61,35,49,47,59,55,11;... %左边数据编码,奇 39,51,27,33,29,57, 5,17, 9,23]; %左边数据编码,偶check_right = [114,102,108,66,92,78,80,68,72,116]; %右边数据编码first_num = [31,20,18,17,12,6,3,10,9,5]; %第一位数据编码
bar = imread('123.bmp'); %读输入条形码图片
bar_Gray = rgb2gray(bar); %将RGB图片转换灰度图
figure(1)
imshow(bar)
title('条形码图')
figure(2)
subplot(121),imshow(bar_Gray),title('灰度图')
subplot(122),imhist(bar_Gray),title('灰度图直方图')
bar_Gray= imnoise(bar_Gray, 'salt & pepper', 0.02);
figure(3)
subplot(121); imshow(bar); title('原图像');
subplot(122); imshow(bar_Gray); title('添加椒盐噪声图像');
bar_Gray = medfilt2(bar_Gray); %进行3*3模板中值滤波figure(4)
imshow(bar_Gray)
title('中值滤波之后图片')
%for i=1:m %对图像进行二值化处理
%for j=1:n
% if bar_Gray(i,j)>150 %选择适当的阈值进行二值化处理 % bar_10(i,j) = 1;
%else
% bar_10(i,j) = 0;
%end
%end
%end
[a_hist x] = imhist(bar_Gray);
hist_max = [];
if a_hist(1)>a_hist(2)
hist_max = [hist_max 1];
end
x = max(x);
for i=2:x
if a_hist(i)>a_hist(i-1) && a_hist(i)>a_hist(i+1) hist_max = [hist_max i];
end
end
if a_hist(x)<a_hist(x+1)
hist_max = [hist_max x+1];
end
[m,n] = size(hist_max);
k = 0;
max_1 = 0;
max_2 = 0;
for i=1:n
if k<a_hist(hist_max(i))
k = a_hist(hist_max(i));
max_1 = hist_max(i);
end
end
temp = a_hist(max_1);
a_hist(max_1) = 0;
k = 0;
for i=1:n
if k<a_hist(hist_max(i))
k = a_hist(hist_max(i));
max_2 = hist_max(i);
end
end
a_hist(max_1) = temp;
if max_1>max_2
k = max_1;
max_1 = max_2;
max_2 = k;
end
T = max_1;
k = a_hist(max_1);
for i=max_1:max_2
if k>a_hist(i)
k = a_hist(i);
T = i;
end
end
[m,n] = size(bar_Gray); %求灰度图的大小
for i=1:m %对图像进行二值化处理
for j=1:n
if bar_Gray(i,j)>T %选择适当的阈值进行二值化处理 bar_10(i,j) = 1;
else
bar_10(i,j) = 0;
end
end
end
figure(5)
imshow(bar_10);
title('二值化图')
l = 0; %检测59根条形码
for i=1:m
k = 1;
l = l+1;
for j=1:n-1
if bar_10(i,j)~=bar_10(i,j+1) %比较同一行相邻两点的颜色是否一致 %bar_x(l,k) = i;
bar_y(l,k) = j; %记录转折点的纵坐标
k = k+1; %准备记录下一个数据点
end
if k>61 %点数大于60,该行应该删掉
l = l-1;
break
end
end
if k<61 %点数小于60,该行应该删掉
l = l-1;
end
end
[m,n] = size(bar_y);
if m<=1 %查看条形码是否有效
code = '0';
fprintf(1,'GameOver!\n');
return
end
for i=1:m %计算每根条形码的宽度
for j=1:n-1
bar_num(i,j) = bar_y(i,j+1) - bar_y(i,j);
if bar_num(i,j)<0
bar_num(i,j) = 0;
end
end
end
bar_sum = sum(bar_num)/m; %求每根条形码宽度的平均值
k = 0;
for i=1:59 %计算59根条形码的总宽度
k = k + bar_sum(i);
end
k = k/95; %计算单位条形码的宽度
for i=1:59 %计算每根条形码所占位数
bar_int(i) = round(bar_sum(i)/k);
end
k = 1;
for i=1:59 %将条形码转换成二进制数
if rem(i,2)
for j=1:bar_int(i) %黑色条用1表示
bar_01(k) = 1;
k = k+1;
end
else
for j=1:bar_int(i) %白色条用0表示
bar_01(k) = 0;
k = k+1;
end
end
end
if ((bar_01(1)&&~bar_01(2)&&bar_01(3))... %判断起始符是否正确
&&(~bar_01(46)&&bar_01(47)&&~bar_01(48)&&bar_01(49)&&~bar_01(50))... %判断中间分隔符是否正确
&&(bar_01(95)&&~bar_01(94)&&bar_01(93))) %判断终止符是否正确
l = 1;
for i=1:6 %将左侧42位二进制数转换为十进制数
bar_left(l) = 0;
for k=1:7
bar_left(l) = bar_left(l)+bar_01(7*(i-1)+k+3)*(2^(7-k));
end
l = l+1;
end
l = 1;
for i=1:6 %将右侧42位二进制数转换为十进制数
bar_right(l) = 0;
for k=1:7
bar_right(l) = bar_right(l)+bar_01(7*(i+6)+k+1)*(2^(7-k));
k = k-1;
end
l = l+1;
end
end
num_bar = '';
num_first = 0;
first = 2;
for i=1:6 %从左边数据编码表中查出条形码编码数字
for j=0:1
for k=0:9
if bar_left(i)==check_left(j+1,k+1)
num_bar = strcat(num_bar , num2str(k));
switch first %记录左边数据的奇偶顺序
case 2
first = j;
break;
case 1
num_first = num_first + j*(2^(6-i)); break;
case 0
num_first = num_first + ~j*(2^(6-i)); break;
otherwise
break;
end
end
end
end
end
for i=1:6 %从右边数据编码表中查出条形码编码数字
for j=0:9
if bar_right(i)==check_right(j+1)
num_bar = strcat(num_bar , num2str(j));
end
end
end
for i=0:9 %从第一位数据编码表中查出第一位数字
if num_first==first_num(i+1)
num_bar = strcat(num2str(i) , num_bar);
break;
end
end
if numel(num_bar)~=13
fprintf(1,'Please Turn It Around!\n');
return
end
check_code = 0;
for i=1:12 %计算校验码
if rem(i,2)
check_code = check_code + str2num(num_bar(i)); else
check_code = check_code + str2num(num_bar(i))*3; end
end
check_code = rem(check_code,10);
if check_code>0
check_code = 10 - check_code;
end
if check_code==str2num(num_bar(13)) %判断校验码是否正确 disp('识别出的条形码:')
code = num_bar
else
fprintf(1,'Please Turn It Around!\n');
return
end
图像通信课程设计成绩评定表
1. 课程设计报告成绩评价表
序号评价指标满分值得分
1 设计任务要求准确清晰 5
2 有一定扩展或创新、工作量大15
3 方案的选择及原理正确20
4 整体程序调试成功,结果正确40
5 报告行文通顺、规范,条理清晰10
6 课程设计过程中的学习态度认真10
总评
2.平时成绩
满分值得分
100
3. 课程设计总评成绩(报告70% + 平时30%)
总评成绩内容得分
报告成绩
平时成绩
课程设计总评成绩
指导老师:
时间:。