基于计算机视觉的检测技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于计算机视觉的检测技术

化工与环境学院董守龙学号:10805001

摘要:计算机视觉检测技术是一个发展迅速、应用广泛的新的技术领域。本文就基于计算机视觉的检测技术进行了概述,介绍了几种典型的应用,包括汽车牌照自动识别技术、特定目标识别技术、生物特征鉴别技术、机器人视觉系统等,并分别就其涉及的主要问题进行了分析。

关键词:图像技术;图像处理;计算机视觉;机器人视觉

近年来,图像技术受到人们广泛的关注。在人类接收的信息中有80%来自视觉即图像( Image)信息,这是人类最有效和最重要的信息获取、交流方式。随着计算机的普及,人们越来越多地利用计算机帮助人类获取与处理视觉(图像)信息。图像技术就是对视觉图像获取与加工处理技术的总称。根据抽象程度和处理方法的不同,图像技术可分为三个层次:图像处理、图像分析和图像理解。这三个层次的有机结合也称为图像工程。

图像处理是较低层的操作,主要在图像象素级上进行处理。比较狭义的图像处理主要包括对图像分割以改善视觉效果,或对图像压缩编码以减少传输时间或存储容量。图像分析则是进入中层的操作,分割和特征提取是把原来以象素描述的图像转变成简洁的非图形形式的符号描述。即图像分析是一个图像进而数据出的处理,数据可以是对某一特征测量所得的结果,或是基于测量的符号表示。图像理解也经常被称为计算机视觉,主要是高层操作。图像理解进一步研究图像中的目标和它们之间的联系,其处理过程和方法与人类的思维推理有不少类似之处。

随着计算机的普及和大规模集成电路技术的发展,计算机视觉检测技术(AVI)实现成本已大大降低,并得到广泛应用。计算机视觉的应用领域主要包括对照片、视频资料如航空照片、卫星照片、视频片段等的解释、精确制导、移动机器人视觉导航、医学辅助诊断、工业机器人的手眼系统、地图绘制、物体三维形状分析与识别及智能人机接口等。下面将就一些主要的重点应用展开介绍。

1 汽车牌照自动识别技术

近年来交通问题引发的关注越来越多,智能交通系统(Intelligent Transportation System,ITS)的研究也越发广泛而深入。汽车牌照识别(License Plate Recognition,LPR)技术作为智能交通系统的关键技术,在交通流量监测、交通诱导控制、路桥收费、违章车辆监控等方面有着广泛的应用前景,对实现交通事业现代化有着重大意义。

汽车牌照自动识别系统以车牌号码自动识别为基础,可以对车辆进行自动验证、监视和报警。车牌识别系统集中了先进的光电、计算机控制、图像处理、模式识别、远程数据访问等技术,可以实现对监控路面过往的每一辆机动车的特征图像和车辆全景图像的全天候实时记录,计算机可以根据所拍摄的图像进行牌照自动识别。

LPR系统包括三个关键子系统,分别是车牌区域定位系统、车牌字符分割系统和车牌字符识别系统。牌照图像通常由CCD摄像机等摄影摄像设备获得,有时为了提高图像质量会采用主动红外照明摄像或使用其他特殊的传感器。获得的图像质量受多方面条件的影响,因此多数情况下需要对得到的摄影图像进行预处理。

车牌的定位检测是车牌识别中关键的一步,定位的准确与否直接关系到系统的识别精度和识别速度;同时,这也是整个环节的难点所在,由于牌照位于图像上任意位置,加上光照不均匀、反光、拍摄角度倾斜、复杂背景干扰以及车牌本身折损等原因,牌照精确定位难度较大。车牌定位算法有很多,如局部阀值二值化与自适形态滤波法、基于小波变换的边缘检测法等,是一个研究的热点。

在区域定位获得车牌图像之后需要对车牌上的字符进行分割以便识别,先把多行或多字符图像中的每个字符从整个图像中切割出来成为单个字符。由于车牌上的字符类型较少、变化较小,所以常采用简单的直接分割法。

字符识别系统首先要对字符进行位置、大小归一化处理,如果是英文大写字母和数字还要进行字符细化处理。然后将牌照上的字符分为两大类:汉字和符号(包括英文大写字母和数字)。对于汉字,采用汉字的字符笔划密度和字符复杂指数特征对汉字进行粗分类,再采用模板匹配法识别汉字。而对于符号,通过对车辆牌照上英文字符和数字字符结构特征的详细分析,选择字符中的细节点特征、闭合曲线特征和拐角点特征作为字符识别的依据,根据这些特征来识别牌照上的英文字母和数字字符。

2 特定目标识别技术

早期进行数字图像处理的目的之一是要通过采用数字技术提高照片的质量,辅助进行航空照片和卫星照片的读取判别与分类。由于需要判读的照片数量很多,需要借助自动的视觉系统进行,于是产生了许多航空照片和卫星照片判读系统与方法。自动判读的进一步应用就是对所关注特定目标的自动识别和实时分类,并与制导系统相结合。目前常用的制导方式包括激光制导、电视制导和图像制导,在导弹系统中常常将惯性制导与图像制导结合,利用图像进行精确的末端制导。

特定目标识别技术中很重要的一个研究方向是动目标检测技术。在军事领域,现代战争要求我们必须能尽早尽快地发现来袭目标;在实施高精度、高准确性的军事打击时,也需要精确、快速定位并识别出攻击目标。在复杂战场条件下,如何快速检测并识别出运动目标成为各国军方的研究热点。军事领域常使用的成像传感器有合成孔径雷达、毫米波雷达、红外成像仪、激光成像仪、全彩色成像仪、光谱成像仪等。

特定目标识别技术在视觉监视上的应用需求也相当广泛。随着多媒体技术的发展和计算机性能的提高,近年来基于图像处理的自动监控技术得到了广泛的应用。传统可视化的监控系统要求监控人员不停的监视屏幕,获得视频信息,通过人为的理解和判断才能得到相应的结论并做出相应的决策。如果能实现对特定被监控目标的自动检

测、提取、识别、跟踪,则可节省人力、物力,大大提高工作效率,所以人们对基于视频图像的监控系统的智能化要求越来越迫切。

运动目标检测主要方法有背景相减法、两帧差分法和光流分析法等。背景相减方法是利用当前图像与背景图像的差分来检测运动区域的一种技术,通过分析不同时间的两幅序列图像相减构成的残差图像来获取信息;两帧差分法即提取连续两帧的视频图像进行相减运算得到差分图像,在差分图像上检测运动变化区域;光流分析法是对图像的运动场进行估计,利用图像序列关于时间和空间的灰度变化来估计位置速度场的方法,其基本思想是通过计算出光流场来模拟运动场。

3 生物特征鉴别技术

近年来,基于生物特征( biometrics) 的鉴别技术得到了广泛重视,主要集中在对指纹、虹膜、人脸、声音等特征上,这其中大多都与视觉信息有关。与生物特征识别密切相关的另一个重要应用是用于构成智能人机接口。现在计算机与人的交流基本局限于键盘、鼠标,其他输入手段还不成熟,计算机也无法识别用户的真实身份。利用计算机视觉技术可以让计算机检测到用户是否存在、鉴别用户身份、识别用户的体势(如点头、摇头)等。此外,这种人机交互方式还可推广到一切需要人机交互的场合,如入口安全控制、过境人员的验放等。

由于指纹的唯一性、不变性和排列规律性,指纹识别已经成为生物特征鉴别技术中最常见、最成熟的技术。指纹识别在过去主要应用于刑侦系统,现在已广泛应用于民用市场,如考勤、门禁、保险箱柜、机动车等。计算机对输入的指纹图像进行预处理,以实现指纹的分类、定位、提取形态和细节特征,然后根据所提取的特征对指纹进行比对和识别。

虹膜识别是当前应用较为方便和精确的一种识别技术,虹膜的高度独特性、稳定性及不可更改的特点,是虹膜可用作身份鉴别的物质基础。虹膜识别技术将虹膜的可视特征转换成一个512个字节的Iris Code(虹膜代码),这个代码模板存储后可用于后期识别。虹膜识别技术与相应的算法结合后,可以达到很高的准确度。两个不同的虹膜信息有75%匹配信息的可能性是1/1000000,两个不同的虹膜产生相同Iris Code的可能性是1/1052。比其他生物认证技术的准确度高几个到几十个数量级。虹膜识别技术在国际上已经开始在各行各业以各种形式进行应用,但国内的应用还很有限。

人脸识别与其他方法比较,更直接、友好、方便,可以通过非接触方式获得,使用者无任何心理障碍,所以人脸识别技术成为人们最容易接受的身份鉴别方式之一。人脸检测是人脸识别的关键环节,人脸检测就是对所输入的图像进行检测,判断图像是否存在人脸,如果存在则返回人脸在图像中的确切位置和范围。由于人脸表情千变万化,可能会有附属物如眼镜、胡须、装饰等,同时图像质量受摄录器材和光照影响很大,人脸识别技术在应用中还面临很多棘手的问题,识别率不高。

相关文档
最新文档