计算机视觉系统(外文翻译)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机视觉系统:
功能和结构概论
摘要:计算机视觉系统(CVS)在实时工作时必须具备能快速选择(在空间和时间)感兴趣区域,且对接下来的数据结果变动时进行资源再分配,并且依据部分数据更新方法从而达到这样的功能。CVS最有发展潜力是直接地针对卷积的变化信息和多解决方案的计算的要求。本文中,在这些解决方案之中,我们将描述三种不同由典型的聚焦机制引导的生物系统的硬件。
1引言
一个标准图像解析过程由几个部分组成:图像顺序存储、预先处理和图像分割、最后是特征提取阶段,处理后的图像被分析和被解释或者被分类。这类开环的模式不支持实时处理,甚至连最简单的人类做到的任务也办不到。
图像采集由一台商用照相机拍摄,以7
610
10 个像素每秒并且规范了相机的视野。大多数收集的数据是不能直接使用的,并且必须从这些庞大的数据中提取一小部分有益的数据。普通计算机无法处理这种具有选择性的难题。在最近十几年,一些研究论述提到专业的计算机视觉系统(CVS),他们由此能有效地进行区域和感兴趣部分的识别,并且以某种类似于人的视觉系统的方式处理这些区域和感兴趣部分。
人类的聚焦机理在相当大的数量的数据情况下能有效地通过直接的指挥(有很高的敏锐性和识别力的能力的视网膜部分)最佳区域完成当前的任务。焦点被移动到一个预先定义或暂时分辨序列的明显区域(scanpath)。为了完成实时的动作,简单来说,一个CVS必须有以下功能:
.在空间和时间上选择正在运动中的区域;
.计算机资源分配保持必要的效率,即使数据量以数据集合形式有相当大变动;
.如当前任务所需,为了及时处理整体和局部的特性而改变数据结果;
.基于以完成的部分一步一步更新处理方法。
在直接地针对被引述的要求的不同的提案之中,多数有前景的理论都是根据卷
积变化的空间区域[1,2],和在多分辨率处理[3,4,5]提出的。这些方法包括通过在可变方案所提供场合的内容进行图像数据结构分析。这样为当前操作、任和图像开发最适当的小型数据结构。
作为一般方法,组分大的可以被分解成小的方案,而小组分的应进行充分的解决。 然而,独立目标的尺寸,在每次众多的数据中有很大数量被去处的处理来获得介入的产物是独立区域那是更加适当的。
在第2节Schwartz 的提案如[6]Cortex I 系统可描述为一个在视网膜上的紧密跟踪传感器;第3节解决实现第一个商用的多功能系统的方法:金字塔型的流水线[7 (根据Sarnoff 芯片的系统的简介);最后,第4节考虑最普遍的等级制度的建立的家庭:金字塔,特别是有些细节在PAPIA 2工程[8]给出。
2 卷积系统
人的视觉既是活跃的又是空间可变的。最近研究员把他们的注意力集中在空间变形传感器可模仿生物视觉系统。这种系统不得不处减少像素的数量,以处理那些大量与判断系统一致的命令。
Bederson ,Wallace 和Schartz 提出了Cortex I [6]基于对数结构小型化的几何像素的主动视觉系统。研究表明,类似的结构的视觉系统也存在于灵长类动物和人类的眼睛。 展示的机器由一个CCD 传感器,微型云台、控制器、通用处理器和显示器组成。
2.1 空间可变化图像
空间变化图像传感器的是由一个不规则的像素几何描绘:图由一个非常大的数据描述,像素视场的周围覆盖了大片区域[9]。
特别是,采用图片采集方法( 图 2.1)的一个点P1,在图像区域,用复数θi re
z =的标记,通过对数转换被映射为P2在传感器空间变形的区域。
θθi r re i +=)log()log( (2.1) 这种关系可把极坐标转换到直角坐标系。以上提出的映射显示一些有趣的特性。径向线被映射水平线并且圆弧集中到圆心处的垂直线;产生的结果是回转体和
尺寸径向线被简单卷积转换出来。
图2.1 圆行视场和相应的卷积
采集映射的反馈在起始点(z=0)是显著的,为避免这个问题作者引入一个实常数a ;映射函数变为:
)log(a z w += if 0)Re(≥z
)log()log(2a z a w +--= if 0)Re( 2) 常数a 是在图像几乎是的线性区域区的一个测量值。在这个区域我们得[z] << a ,在这个假设之下可以得到: a z a f z f z f +≈'+≈)log()0()0()( (2.3) 因子l/a 是像点在锅中的放大率和传感器的矩阵求解有关:如果我们固定一个角度方法k(沿圆周的像素数目),像素尺寸是: k I π 2= (2.4) 通过引入放大因子我们可以得到它的像素尺寸: k a L fov π2= (2.5) 这种标记的结果是一个典型蝴蝶形状。测量传感器的全部视场区域可以为被描述为半径为R 圆(R>> a)。如果像素数目为n,沿采集图的X 轴方向的像素尺寸是: n a R a R a I ) /log(2))log()log(2(≈-+= (2.6) 如果像素是固定的并是四方形的,从上面的公式(2.4和2.6)我们可以得到: )l o g (a R k n π= (2.7) 像素总数在采集图中为 )log(222 log a R k kn N π≈≈ (2.8) 另外一个固定程序的有同样视场和同样程序的传感器在图形中有 222222a R k L R N fov unif ππ== 个像素。 在固定方案的传感器情况下,如果我们保留锅形方法的常数,像素点的数量非常迅速增长为)(2R O RN unif =,此外在用采集传感器的情况下增长规律是 )(l o g l o g R O N =。 2.2连通性图表 当采取采集映射局部连通性时对4连通性或8连通性的标准图象处理是不同寻常的,它的特征被附近的非固均匀传感器所公用。这些畸变的像素不存在且有非常多个非标准的邻域。在蝴蝶右翼的像素与在左边的像素有关(图 2.2)。为了进行图像处理开发拓扑结构传感器的处理,作者[6]开发了一个基于连通性图表使用的技术。 图2.2 图2.1的连通性图表 图G = (V , E)描绘拓扑结构传感器的特性通过设置垂直量V (每v 垂直量对应于一个像素点)并且边缘E (边缘对应于一个毗邻物理联系),从这个假定这种邻里跟随的定义如下:N={q|(p,q) ∈E }。 使用连通性图表,我们可以建立图象处理的常规库,它是的独立于几何传感器