条形码识别技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

条形码识别技术
■标准化文件发布号:(9456・EUATWK-MWUB・WUNN・INNUL・DDQTY-KII
一维条形码生成与识别技术
一、引言
条形码(简称条码)技术是集条码理论、光电技术、计算机技术、通信技术、条码印制技术于一体的一种自动识别技术。

条形码是山宽度不同、反射率不同的条(黑色)和空(口色),按照一定的编码规则编制而成,用以表达一组数字或字母符号信息的图形标识符。

条形码符号也可印成其它颜色,但两种颜色对光必须有不同的反射率,保证有足够的对比度。

条码技术具有速度快、准确率高、可靠性强、寿命长、成本低廉等特点,因而广泛应用于商品流通、工业生产、图书管理、仓储标证管理、信息服务等领域。

二、EAN-13条形码简介
一维条码主要有EAN和UPC两种,其中EAN码是我国主要釆取的编码标准。

EAN 是欧洲物品条码(European Article Number Bar Code )的英文缩写,是以消费资料为使用对象的国际统一商品代码。

只要用条形码阅读器扫描该条码,便可以了解该商品的名称、型号、规格、生产厂商、所属国家或地区等丰富信息。

* 通用商品条码是模块组合型条码,模块是组成条码的最基本宽度单
位,每个模块的宽度为0.33毫米。

在条码符号中,表示数字的每个条码字符均由两个条和两个空组成,它是多值符号码的一种,即在一个字符中有多种宽度的条和空参与编码。

条和空分别III 1-4个同一宽度的深、浅颜色的模块组成,一个模块的条表示二进制的V化一个模块的空表示二进制的"0J每个条码字符共有7个模块。

即一个条码字符条空宽度之和为单位元素的7倍,每个字符含条或空个数各为2,相邻元素如果相同,则从外观上合并为一个条或空,并规定每个字符在外观上包含的条和空的个数必须各为2个,所以EAN 码是一种(7, 2)码。

EAN条码字符包括0-9共10个数字字符,但对应的每个数字字符有三种编码形式,左侧数据符奇排列、左侧数据符偶排列以及右侧数据符偶排列。

这样十个数字将有30种编码,数据字符的编码图案也有三十种,至于从这30个数据字符中选哪十个字符要视具体情况而定。

在这里所谓的奇或偶是指所含二进制的个数为偶数或奇数[2)。

2.1 EAN-13码的格式
EAN条形码有两个版本,一个是13位标准条码(EANJ3条码),另一个是8位缩短条码(EAN-8条码)。

EAN-13条码山代表13位数字码的条码符号组成,如图1所示⑴。

余形码符号- 数字码- 前縊码
F|F-,F3
制逍厂両代码
丽品标识代码I』山Ms
图1
前2位(骂~码,欧共体12国采用)或前3位(骂~禺,其他国家采用)数字为国家或地区代码,称为前缀码或前缀号。

例如:我国为690,日本为49*,澳大利亚为93*等(其中的"*"表示0~9的任意数字)。

前缀后面的5位
(还~辺)或4位(还~蛆)数字为商品制造商的代码,是山该国编码管理局审查批准并登记注册的。

厂商代码后面的5位(厶~厶)数字为商品代码或商品项LI代码,用以表示具体的商品项LI,即具有相同包装和价格的同一种商品。

最后一位数字为校验码,用以提高数据的可靠性和校验数据输入的正确性,校验码的数值按国际物品编码协会规定的方法计算。

2.2 EAN-13条形码的构成
EAN-13条形码的构成如图2所示。

左侧空
白起始符
左侧数据符
6位数字
中间分
隔符
右侧数据符
6位数字
校验符
1位数字终止符
右侧
空白
图2典型EAN-13条形码的构成
(1)左、右侧空白:没有任何印刷符号,通常是空白,位于条码符号的两侧。

用以提示阅读,准备扫描条码符号,共有18个模块组成(其中左侧空白不得少于9个模块宽度),一般左侧空白11个模块,右侧空白7个模块。

(2)起始符:条形码符号的第一位字符是起始符,它特殊的条空结构用于识别条形码符号的开始。

由3个模块组成。

(3)左侧数据符:位于中间分隔符左侧,表示一定信息的条码字符,由42个模块组成。

(4)中间分隔符:位于条码中间位置的若干条与空,用以区分左、右侧数据符,
由5个模块组成。

(5)右侧数据符:位于中间分隔符右侧,表示一定信息的条码字符,由35个模块组成。

(6)条码校验符:表示校验码的条码字符,用以校验条码符号的正确与否,由7个模块组成。

(7)终止符:条形码符号的最后一位字符是终止符,它特殊的条空结构用于识别条形码符号的结束。

由3个模块组成。

—个条形码图案是数条黑色和白色线条组成,如图3所示。

图3条形码图案实例
图案分成五个部分,从左至右分别为:起始部分、第一数据部分、中间部分、第二数据部分和结束部分。

(1)起始部分:由11条线组成,从左至右分别是8条白线,一条黑线,—条白线和一条黑线。

(2)第一数据部分:由42条线组成,是按照一定的算法形成的,包含了左侧数据符严】~盅)这些数字的信息。

(3)中间部分:由5条线组成,从左到右依次是白线,黑线,白线,黑
线,白线。

(4)第二数据部分:由42条线组成,是按照一定的算法形成的,包含了右侧数据符(昕)这些数字的信息。

(5)结尾部分:由11条线组成,从左至右分别是一条黑线,一条白线和—条黑线,8条白线。

2. 3 EAN-13的编码规则
EAN-13的编码是由二进制表示的。

它的数据符、起始符、终止符、中间
分隔符编码见表
左侧数据符有奇偶性,它的奇偶排列取决于前置符,所谓前置符是国别识别码的第一位X,该位以消影的形式隐含在左侧六位字符的奇偶性排列中,这是国际物品编码标准版的突出特点。

前置符与左侧六位字符的奇偶排列组合方式的对应关系见表Z实际上由表2这种编码规定可看出,X与这种组合方式是一一对应固定不变的。

例如:中国的国别识别码为"690",因此它的前置
符为"6",左侧数据符的奇偶排列为"OEEEOO"【3】,"E"表示偶字符,
"0"表示奇字符。

2.4 EAN-13
校验码的主要作用是防止条形码标志因印刷质量低劣或包装运输中引起标志破损而造成扫描设备误读信息。

作为确保商品条形码识别正确性的必要手段,条形码用户在标志设计完成后,代码的正确与否直接关系到用户的自身利益。

对代码的验证,校验码的计算是标志商品质量检验的重要内容之一,应该谨慎严格,需确定代码无误后才可用于产品包装上。

下面是EAN-13条形码的校验码验算方法,步骤如下⑶:
(1)以未知校验位为第1位,由右至左将各位数据顺序排队(包括校验码);
(2)由第2位开始,求出偶数位数据之和,然后将和乘以3,得积坷;
(3)由第3位开始,求出奇数位数据之和,得弘;
(4)将纠和弘相加得和弘;
(5)用^ 了除以10,求得余数,并以10为模,取余数的补码,即得校验
位数据值;
(6)比较第1位的数据值与C的大小,若相等,则译码正确,否则进行纠错处理。

例如,设EAN-13码中数字码为6901038100578 (其中校验码值为
8),该条码字符校验过程为:朋二3次(7 + 0+1 + 3+1 + 9)二心,
皿二5 + 0+8 + 0 + 0 + 6二19 ,弘二"i+弘二82,弘除以10的余数为2, 故0 = 10-2 = 8 ,译码正确》
3 EAN-13条形码的生成
条形码的生成方法如下⑶:
(1)由%根据表3产生和右~叫匹配的字母码,该字母码有6个字母
组成,字母限于A和B。

(2
)将右~叫和此产生的字母码按位进行搭配,来产生一个数字一字母匹配对。

并通过查表4生成条形码的第一数据部分。

表4数字一字母映射表
(3)将此~右2和C进行搭配,并通过查表4生成条形码的第二数据部分。

(4)按照两部分数据绘制条形码:1对应黑线,0对应白线。

例如,假设一个条形码的数据码为:6901038100578.血二6,对应的字母码为ABBBAA.右~盅和%产生的字母码按位进行搭配结果为9A、0B、IB、OB、3A、8A,查表4得第一部分数据的编码分别为0001011. 0100111. 0110011. 0100111. 0111101. 0110111 ; ~右2 和C 进行
搭配结果为1C、0C、0C、5C、7C、8C;查表4得第二部分数据的编码分别为1100110. 1110010. 1110010. 1001110. 1000100. 1001000o
4条形码识别
4. 1条码识别的基本原理
EAN-13是一种(7, 2)码,即每个字符的总宽度为7个模块宽,交替由两个条和两个空组成,而每个条空的宽度不超过4个模块,如图4所示。

当前字符T 下一字符
图片看不清楚?请点击这里查看原图(大图)。

图4 EAN-13条码宽度的定义
图4中G’GC S’G表示当前字符中四个相邻条、空的宽度,T是一个字
4
T Q. =7
符的宽度,满足为整数21,234 ;且^1 。

用E表示当前字符单位模块的宽度,则Z门。

令廻二G5,
2123,4。

由刚宀代严4的值可以得到编码。

例如:若
叫J临=3化二1,叫二2 ,且条码的排列为条—空—条—空,则可知当前字符的编码为1000100,是右侧偶字符7。

聊1二3◎二1,叫二1,叫=2 ,且条码的排列为空一条一空一条.则可知当前字符的编码为0001011,是左侧偶字符9。

由于条码印刷和图像采集设备的限制,在图像采集时边缘部分还存在着半像素问题.实际扫描后得到的图像会出现一定程度的边缘模糊,尤其当条码密度较大,条空间距较小时边缘模糊更为明显。

边缘出现模糊时,将导致寻找条空边缘时产生一定偏差.当这个偏差超过半个模块宽度时,便会出现误码。

如果再考虑到流通过程中磨损、水渍浸泡等因素引起的图像缺陷,在这种情况下如果用边缘检测的方法确定条空序列会大大降低条码的识别率。

本文采用的方法为:以起始模块的中心为起始中心、一个单位模块宽度为间距来检测条空序列。

4. 2条形码扫描方向的判别
为了能够正确地解译条形码,在解译条形码符号所表示的数据之前,需要先进行条形码扫描方向的判别,EAN-13的起始字符和终止字符的编码结构都是"101",只能通过它进行码制的判别(对于多种条码识别的时候,其它码制的条码起始字符和终止字符都不是"101”),但是不能通过起始字符和终止字符来判别它的扫描方向。

由EAN-13码的编码结构可知,它的右侧字符为全
偶.而左侧字符的奇偶顺序由前置符决定‘没有全偶的,从而可以利用此原理来确定EAN-13码的扫描方向。

如果扫描到的前6个字符为全偶,即为反向扫描,否则为正向扫描。

4.3条形码字符的判别方法
从上述条码识别原理知,它的逻辑值可以通过和单位模块比较判别。

这种方法对于印刷质量很好、没有缺陷的条码很适用,但是对于条码印刷质量存在缺陷,则不能正确地
解译。

因此本文提出了一种解决此类问题的较好方法,即
相似边距离测量方法。

图5条码字符宽度示图
相似边距离就是相邻条和空的宽度之和, 如图5中的兀勺
归一化值“益和山益如下:
‘2<2.5/7
2 4 3.5/7<7^/7<4.5/7
5 7;/Z>4.5/7i = 1?2
表5列出了正向译码时EAN-13条码字符值与归一化值(卫兀乂爲)的对应关系,表6列出了反向译码时EAN-13条码字符值与归一化值(卫兀/爲)的对应关系,其中"E"表示偶字符,"0"表示奇字符。



表7和表8分别为正向译码和反向译码时EAN-13条码编码与归一化值的对应关系。

由表5~8可以看出,条形码编码和归一化值在多数情况下呈现一一对应的关系,只要确定了归一化值就能确定字符值,但是有四种情况例外。

以正向译码为例,在表6中,左侧奇字符和右侧偶字符匕7归一化值均为44.左侧奇字符和右侧偶字符2, 8归一化值均为33,左侧偶字符1, 7归一化值均为34,左侧偶字符2, 8归一化值均为43,这几种情况可以根据字符的条空宽度进一步判别。

表9为1728字符标准条空宽度值,其中字符上有"-"的对应条,否则对应空。

根据表9中各字符条空宽度的特点可知:①对于左侧奇字符、右侧偶字符
1和7,可通过比较。

与G来判别,若则为字符匕反之为7;② 对于左侧奇字符、右侧偶字符2和&可通过比较G与G来判别,若
则为字符8,反之为2;③对于左侧偶字符1和7,可通过比较G与。

来判别,若
则为字符7,反之为1;④对于左侧偶字符2 和8,可通过比较。

与G来判别,若则为字符2,反之为8°采用相似边距离归一化的条码识别方法,当条码质量存在缺陷使得实际测量值和条码应该具有的理论值有较大偏差时,仍能正确解译。

例如对于左侧奇字符"0"进行译码,该字符的四个元素宽度的理论值应该是
= 二1心二1 ,但是由于印刷等原因的影响,实际上测量值是G二2.5,二
2.5,6 =二1.2。

如果只根据元素宽度的测量值进行译码,那么这四个元素的宽度测量值四舍五入取整后分别为3、3、1、1,从而造成译码错误。

若采取相似边距离归一化的条码识别方法进行译码,此时T1 = C1^C2 = 5r T2 = C2+C3 =
3.3,7 = 7^71 = 5^7^ =3(由表7 知字符编码为左侧奇字符"0"。

可见利用相似边距离归一化的条码识别方法判别字符值,可以得到比较满意的效果。

4.4纠错处理
采用相似边距离归一化的译码方法能够在一定程度上消除条、空误差对译码识别的影响。

当系统误差特别是条码印刷误差较大导致益、爲改变时,译码将出错。

因此译码软件应具有一定的纠错能力,以减少条空宽度值不精确的影响,提高条码识别率⑴。

纠错主要从以下两方面进行:
(1)如果条码字符的召或爲在临界位置,当条或空的宽度有误差时,就会导致'益或乂爲的整数值増1或减1。

如果/盂和/益中只有一个发生错误,则引起该字符的奇偶性、字符值的改变,如果/益和/爲都出错,则引起该字符值的改变,但奇偶性未变。

实际情况中第一种现象出现的概率比第二种情况大得多,因此本文主要对第一种情况进行纠错。

由表1和表2可知,右侧字符为全偶字符排列,左侧字符有10种奇偶排列,这11种排列构成有效的排列集合,把所译的字符串奇偶排列与有效的奇偶排列对比,判断是否
为排列集合成员。

若是,所译的字符串不作任何处理;若不是,所译码出错,并找出“益或乂爲哪个处在临界值,修改它的归一化整数值,这样可实现纠错。

(2)当字符数据为2、8、1、7时,由于条码宽度不精确导致误码,即2 判成8、1判成7,或反之。

分析这种误码相对于校验位的差值有一定规律,因此可利用此规律进行纠错。

由EAN-13校验方法知:当偶数位上有2错译成8 或1错译成7时,计算得到的实译值与校验值差-8或2,反之8错译成2或7 错译成1时,计算得到的实译值与校验值差8或-2 ;当奇数位上有2错译成8 或1错译成7时,计算得到的实译值与校验值差-6或4,反之,8错译成2或7错译成1时,计算得到的实译值与校验值差6或-4 ;当然别的字符译错也可能出现这些差值,但几率很小,可以不予考虑。

这样若程序校验没通过,可加—个判断,根据差值判断其属于上述哪种情况,找出出错的字符并纠正。

5程序实现
5.1应用Visual C+ +生成条形码图像
5.11创建工程文件
(1)打开VC++6.0,点击"File"菜单的"New"菜单项,在出现的界面中选定"Projects"栏点击"MFC APPWiza「d(exe)",工程文件名为Generator0按"确定"按纽,进入MFC APPWizard o
(2)在MFC APPWizard 第一步选择Single document 文档类型。

第二步和第三步按默认方式。

第四步中去掉"Docking toolbar"、"Initial status bar"、"Printing and print preview"前面的"7",即不选该三项。

然后点击"Advanced...",在出现的界面中填写"File extension"为"bmp" o 第五步和第六步按默认方式。

最终生成工程Generator。

(3)修改菜单。

①增加"操作"菜单;②删除"编辑"菜单;③修改"帮助"菜单。

参见工程文件。

(4)插入两个对话框(IDD_WELCOME、IDD_GIVECODE)并修改这两个对话框。

参见工程文件。

5.1.2类代码编制
(1)在Generator I程中增加新类CWelcomeDIg,类型为Generic Class o
(2)在Generator工程中增加新类CGiveCodeDIg.类型为Generic Class o
(3)点击"View"菜单的"ClassWizard"菜单项,在出现的界面中,选择Class Name 为", CGeneratorView",增加成员函数,Object Ids、Messages. Member functions 分别为:①ID_EDIT_GIVE、COMMAND. ON」D_EDIT_GIVE : COMMAND ;②ID_FILE_SAVE、COMMAND. ON_ID_FILE_SAVE O
(4)给类GeneratorView添加成员变量,参见源程序
Gen eratorview.h0
(5)打开文件GeneratorView.h,增加代码,参见源程序。

打开文件GeneratorView.cpp,增加代码,参见源程序。

(6)点击"View"菜单的"ClassWizard"菜单项,在出现的界面中,选择Class Name 为"CWelcomeDIg",增加成员函数,Object Ids、Messages. Member functions 分别为:IDOK、BN_CLICKED. On0K()。

(7)点击"View"菜单的"ClassWizard"菜单项,在出现的界面中,选择Class Name 为M CMainFrame° ,增加成员函数,Object Ids、Messages. Member functions 分别为:CmainFrame. WM_CREATE S OnCreate()o
(8)打开文件MainFrame.cpp,增加"#include "WelcomeDIg.h"", 输入代码,
参见源程序。

(9)打开GeneratorView.cpp 源文件,增加语句"#include "GiveCodeDIg.h" , #inc, lude "GiveSizeDIg.h", #include <map> , ^include <algorithm>w ,输入成员函数代码,参见源程序。

(10)编译、连接、运行。

5.2应用Visual C++识别条形码图像
5.2.1创建工程文件
(1)打开VC++6.0,点击"File"菜单的"New"菜单项,在出现的界面中选定"Projects"栏,点击M MFC APPWizard(exe)M ,工程文件名为Recognizor.按"确定"按纽,进入MFC APPWizard o
(2)MFC APPWizard 第一步选择Single document 文档类型° 第二步和第
三步按默认方式。

第四步中去掉"Docking toolbar" s"Initial status bar”、"Printing and print preview"前面的"7",即不选该三项。

然后点击"Advanced...",第四步、第五
步和第六步按默认方式。

最终生成工程Recognizor。

(3)修改菜单。

①修改"文件"菜单;②删除"编辑"菜单;③修改"帮助"菜单。

参见工程文件。

(4)插入一个对话框(IDD_WELCOME),参见工程文件。

5.2.2类代码编制
(1)在Recognizor工程中增加新类CWelcomeDIg,类型为Generic Class。

(2)给类RecognizorView添加成员变量参见源程序
Recog nizorview.h。

(3)点击"View"菜单的"ClassWizard"菜单项,在出现的界面中,选择Class Name 为"CRecognizorView",増加成员函数,Object Ids s Messages. Member functions 分别为:ID_FILE_OPEN、COMMAND. ON」D_FILE_OPEN : COMMAND ;
(4)点击"View"菜单的"ClassWizard"菜单项,在出现的界面中,选择Class Name 为TMainFrame",增加成员函数,Object Ids、Messages. Member functions 分别为:CmainFrame. WM_CREATE S ON_WM_CREATE;
⑸ 打开文件MainFrame.cpp,增加“#include "WelcomeDIg.h"", 増加代码,参见源程序。

(6)打开RecognizorView.卬p源文件,输入成员函数,参见源程序。

(7)编译、连接、运行。

6结论
本文介绍了一维条码格式、编码规则等技术特点,以及条码图像生成与识别的基本原理,并用Visual C+ +实现了条码图像生成和具有一定纠错能力的条码识别软件。

尽管关于一维条码识别的设备很多,但这些都是针对于光电识别的。

光电识别设备只能识别印刷质量好的条码,而通过图像处理技术辨识一维条码能对质量差的条码达到好的识别效果,因此它明显优于光电识别设备。

相关文档
最新文档