机器视觉综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

机器视觉综述

机器视觉是一门涉及人工智能、神经生物学、心理物理学、计算机科学、图像处理、模式识别等诸多领域的交叉学科。机器视觉主要利用计算机来模拟人或再现与人类视觉有关的某些智能行为,从客观事物的图像中提取信息进行处理,并加以理解,最终用于实际检测和控制。近年来,随着计算机技术尤其是多媒体技术和数字图像处理及分析理论的成熟,以及大规模集成电路的迅速发展,机器视觉技术得到了广泛的应用研究,取得了巨大的经济与社会效益。笔者在阅读大量文献的基础上,对国内外机器视觉技术的发展及应用做以概述。

1 机器视觉概念

1.1 机器视觉的定义

简单来讲,机器视觉可以理解为给机器加装上视觉装置,或者是加装有视觉装置的机器。给机器加装视觉装置的目的,是为了使机器具有类似于人类的视觉功能,从而提高机器的自动化和智能化程度。由于机器视觉涉及到多个学科,给出一个精确的定义是很困难的,而且在这个问题上见仁见智,各人认识不同。美国制造工程师协会(SME)机器视觉分会和美国机器人工业协会(RIA)自动化视觉分会关于机器视觉的定义是:“Machine vision is the use of devices for optical non-contact sensing to automatically receive and interpret an image of a real scene in order to obtain information and/or control machines or processes.”译成中文是:“机器视觉是使用光学器件进行非接触感知,自动获取和解释一个真实场景的图像,以获取信息和(/或)控制机器或过程。”目前我国还没有哪个官方协会或组织给出一个中文的正式定义。

历经多年的发展,特别是近几年的高速发展,机器视觉已经形成了一个特定的行业。机器视觉的概念与含义也不断丰富,人们在说机器视觉这个词语时,可能是指“机器视觉系统”,“机器视觉产品”,“机器视觉行业”等。机器视觉涉及到光源和照明技术、成像元器件(半导体芯片、光学镜头等)、计算机软硬件(图像增强和分析算法、图像卡、IO卡等)、自动控制等各个领域。将所需要的这些不同技术集成到一起本身也是一门技术,需要各领域技术人员的参与和合作才能促进机器视觉的快速发展。

本文希望能够起到抛砖引玉的效果,引起大家的兴趣和讨论,给出一个能够得到大家认可的关于机器视觉的正式定义。

1.2 机器视觉的组成及工作原理

机器视觉系统处理的核心目标是“图像”,一目标物体的“图像”被单帧或多帧采集量化为数字化信息,反之可以说,用一些离散的数字化数值阵列就可以表示一目标物体的“图像”。对于复杂的“图像”或需要进行更高精度的处理来说,采集量化的数字化信息则要求更大。即处理精度与数字化信息量成正比。一般来说,图像用多级亮度来表示并进行量化采集,即所谓灰度法。以灰度来表示图像量化的每一个像元素特征。基于灰度法的机器视系统框图由图1所示。

机器视觉系统包括:光路系统、面阵摄像机(CCD)、量化存贮单元、模板库、专用高速处理单元、监视单元等大模块。其中光路系统由程控光源、变焦伺服机构、自动光圈、光学镜片组等组成。

图1 机器视觉系统组成框图

对于以灰度进行量化处理的机器视觉系统而言,图像亮度是一个尤为重要的参数,而决定这一重要参数的因素便是光路系统的质量。一般来说机器视觉系统为了避免环境自然光线或灯光对其工作状态的影响,光路设计均采用自足光源,程控光源要求亮度大、亮度可调、均匀性好、稳定性高,以抑制外界环境各种光对图像质量产生较大影响而导致机器视觉系统故障或误判行为。其次,光路系统设计需满足视场需求和图像分辨率要求。它的设计质量决定了图像质量,决定了机器视觉系统的准确率。

工业生产中采用的机器视觉系统,灰度级差异较大,小到二值图像、大到256灰度级,以及特殊需求可更大。采用的灰度级越大,数字化图像越逼真清晰,越接近原视图。一般来说,人眼能分辨的灰度级约为50~60级之问。因此64级灰度足以提供必要的观察信息及辨认需求,这是许多机器视觉系统采用64级灰度级的原因。但是,要使机器视觉系统具有很强的精密区别目标的能力,一般采用的灰度级为256级,但是由于要处理的信息量很大,要求处理单元有足够快的运算能力。例如采用512×512阵列像元图像量化为二值图像,一帧图像信息量为262 144Bit,而按256级灰度时,一帧图像信息量为2 000 000 Bit。因此,实用化的机器视觉系统除尽可能选用专用高速处理单元外,还应根据不同应用需要选取,在识别处理精度、处理时间长短、像元灰度级等因素之间进行综合平衡,以达到高效、实用的目的。

机器视觉系统常用的摄像机一般为固态CCD或线阵摄像机,面阵分辨率可为300~700线或更高,线阵分辨率则可多达4 048像元以至更高。根据需求进行取舍配置。

机器视觉系统的精度取决于摄像机视场和所包含的像元数量,视场越小,每个像元代表的距离也越小,识别精度也越高。标准CCD像元阵列为768×576和512×512二种。另外,为满足某些需要较大视场较小分辨率的要求,可设计多路CCD将视图分割为一个个较小视场,又可提高分辨率。

机器视觉系统的核心是专用高速图像处理单元,如何把存入存贮单元大量离散的数字化信息与模板库信息进行比较处理,并快速得出结论是处理单元软、硬件面对的问题。运算信息量大,意味着处理结果的准确率高,但如果运算时问较长,机器视觉便失去其存在的意义。这种信息量与运算速度之问的矛盾已成为世界各国微处理器研制生产厂商必须面对的课题。目前,已有多种视觉专用硬件处理器芯片、DSP芯片等等不断涌现并被广泛应用于计算机、通讯、娱乐等产品之中,进行高速图像计算、数据压缩,解压缩、贮存与传输。除去硬件因素,选用适当的算法,可以提高处理运行效率,减少存贮容量、提高运算速度及准确度。图

像处理算法软件及技巧也成为高效机器视觉系统需要精益求精、探索不止的目的和不可缺少的重要组成部分。

机器视觉系统的特点是测量精确、稳定、快速、可大幅度提高生产的柔性及自动化程度以提高生产效率,且易于实现信息集成,是实现计算机集成制造的核心技术之一。如在一些不适合人工作业的危险环境;在当前大批量工业自动生产过程中,用人工检查产品质量效率过低且精度不高;和其他一些人工视觉难以满足要求的场合,机器视觉正在迅速取代人工视觉。事实上,也正因如此,在世界上现代自动化生产过程中,机器视觉已经广泛用于工况监控,成品检验及其他质量控制等领域。在我国,这种应用也逐渐被认知,对机器视觉的需求也越来越多。

2 机器视觉理论基础

2.1 机器视觉计算理论

视觉是一个古老的研究课题。到了70年代末、80年代初,美国麻省理工学院的马尔(Dr.Marr)教授创立了视觉计算理论[2](博京孙,蔡自兴,徐光佑编著.人工智能及其应用.北京:清华大学出版社,1997),使视觉的研究前进了一大步。视觉可以看作是从三维环境的图象中抽取、描述、和解释信息的过程,它可以划分为六个主要部分:①感觉;②预处理;

③分割;④描述;⑤识别;⑥解释。再根据实现上述各种过程所涉及的方法和技术的复杂性将它们归类,可分为三个处理层次:低层视觉处理、中层视觉处理和高层视觉处理。

➢感觉

感觉是指获得图象的过程即数字图象的采集。常见的图象采集装置有摄像机、线型CCD 像感器(Line Scan Image Sensor)、面型CCD像感器(Area Scan Image Sensor)、扫描仪及目前推出的数字相机等:根据用途不同可采用不同的传感器,它们一般是通过采集板连接到计算机的总线上。

➢预处理

普通图象的预处理的方法很多,主要考虑计算机的运算速度和低成本的要求;主要有二种预处理方法:一种是基于空域技术的方法;另一种是基于频域技术的方法。它主要解决图象的增强、平滑、尖锐化、滤波以及伪彩色处理间题。

➢分割

分割是将图象划分成若干有一定含义的物体的过程。它是视觉技术中重要的一步,常用的分割技术有灰度阈值法、边缘检测、匹配和拟合、区域跟踪和增长、迭代松弛法以及运动分割等。

➢描述

描述是为了进行识别而从物体中抽取特征的过程。在理想情况下,描述符应该含有足够多的可用于鉴别的信息,以便在众多的物体中唯一的识别某物体。描述符的质量会影响识别算法的复杂性,也会影响识别的性能,描述可分为对图象中各个部分的描述以及各部分间关系的描述。

➢识别

识别是一种标记过程。识别算法的功能在于识别景物中每个已分割的物体,并赋予该物

相关文档
最新文档