第十章 机器视觉 人工智能课程 北京大学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十章机器视觉
教学内容:本章所研究的机器视觉是诸多传感信息中包含信息最丰富、最复杂和最重要的感觉之一,也是应用最为广泛的机器感觉之一。内容包括图象的理解与分析、视觉的知识表示与控制策略和物体形状的分析与识别等。
教学重点:物体边缘距离的计算、表面方向的计算、物体形状识别方法
教学难点:图匹配法、松弛标示法、多层匹配法等
教学方法:用较为通俗的语言将机器视觉的相关知识讲透彻,同时结合图表,对不同线条的标示方法进行讲解。多结合日常生活中常有的现象,让学生对所学知识有更深入的认识。
教学要求:重点掌握视觉信息的表达方法,包括初始简图、二维半简图和三维模型;掌握物体边缘距离和表面方向的生理学基础及计算原理和计算方法;了解复杂形状物体的表示和三维物体的形状描述方法;一般了解机器视觉应用系统的构成、视觉系统的设计思想。
10.1 图象的理解与分析
教学内容:对图象进行理解和解释是计算机视觉的研究中心,也是人工智能研究的焦点之一。
教学重点:初始简图、二维半简图和三维模型
教学难点:松弛算法、边缘距离的计算
教学方法:以课堂书本知识为主,采取提问,讨论等方式提高学生学习的积极性,自主性和创造性。
教学要求:重点掌握视觉信息的表达方法,包括初始简图、二维半简图和三维模型;掌握物体边缘距离和表面方向的生理学基础及计算原理和计算方法
10.1.1 视觉信息的表达方法
根据马氏(Marr)提出的假设,视觉信息处理过程包括3个主要表达层次,即初始简图、二维半简图和三维简图,如图10.1所示。
图10.1 视觉信息的表达层次
1、初始简图的基本概念:
亮度图象含有两种重要信息:图象的亮度变化和局部几何特征。初始简图是一种本原表达法,它能完全而又清楚地表示上述信息。初始简图所包含的信息大部分集中在与实际边缘以及边缘终止点有关的剧烈灰度变化上。对于每一边缘亮度变化,在初始简图上都有对应的描述。这些描述包括:与边缘有关的亮度变化率、总的亮度变化、边缘长度、曲率和方向等。粗略地说,初始简图是以勾划草图的形式来表示图象中的亮度变化的。
图10.2 用初始简图表示灰度变化图10.3 二维半简图举例
2、二维半简图的基本概念:
二维半简图包含景物表面的信息,可以把它看做某些内在特性的混合信息。二维半简图清楚地表示物体表面方向的信息。物体表面法线从物体内部穿出来,使物体好象穿刺。
3、三维模型的表示方法
三维表达法能够完全而又清晰地表示有关物体形状的信息,其方法之一即为广义柱体。广义柱体的概念十分重要,而其表示方法又十分简单,如图10.4所示。图中,柱体的横截面沿轴线的投影不变。一个普通圆柱可看作是一个圆周沿其中心垂线移动而成;一个楔形物是一个三角形沿其中垂线移动而得的,等等。一般地说,一个广义柱体是二维轮廓图沿其轴线移动而成的。在移动过程中,轮廓与轴线之间保持固定的角度不变。轮廓可为任何形状,而且在移动过程中其尺寸可能是变化的,其轴线也不一定是垂线或直线,如图10.4所示。
图10.4 广义锥体 10.5 截面形状变化或轴线为曲线时
的广义柱体
10.1.2边缘距离的计算
1、图象辉亮边缘的平均与差分
产生噪声边缘问题是因为在获得图象时,会遇到传感器的亮度灵敏性波动、图象坐标信息误差、电子噪声、光源扰动以及无力接收大范围变化的亮度信息等。另一个原因是图象本身很复杂,其实际边缘并不是陡削的,而是逐步过渡的;还可能存在相互照明效应、意外划痕和灰尘等。
一种处理噪声边缘的方法包括下列四个步骤:
(1)从图象建立平均亮度阵列。
(2)从平均亮度阵列产生平均一阶差分阵列。
(3)从一次平均差分阵列建立二次平均差分阵列。
(4)据所得阵列,记下峰点、陡变斜率和过零点,以寻求边缘信号的集合。
2、灵长目动物视网膜特性
图10.6 灵长目动物视网膜输入-输出特性实验图10.7 视网膜实验特
性与墨西哥草帽形滤波结果的比较
墨西哥草帽形滤波器与一些了解灵长目动物早期视觉的实验相一致。关键实验如图10.6所示。被试动物注视各种从白色背景前移过的色质(stimuli)。这些色质包括一条窄的黑带、一条宽的黑带以及一个单白黑边缘。记录探针测定各种神经反应。把此神经反应与据墨西哥形草帽滤波器作出的预计进行比较。
图10.7给出比较结果。在图10.7中,(a)表示3个自左向右移动的色质的亮度分布曲线;(b) 表示以适当宽度的墨西哥草帽形滤波器对所给出的亮度分布进行滤波的结果;(c)为所谓X神经节细胞上记录的实验数据。比较图10.7(b)和(c)可见,两者极其相似。这表明灵长目动物的视网确实进行了某些与墨西哥
草帽形滤波器十分相似的处理工作。如果对墨西哥草帽形滤波器稍加修改,就能够改善相似性,如图10.7(d)所示。
比较结果得到的高度相似性,使我们有足够的根据作出下列假设:
(1)灵长目动物视膜所进行的滤波处理功能在运算上是与由墨西哥草帽形点扩散函数所进行的滤波相似。
(2)存在有两种视膜细胞,一种用于传输滤波图象的正向部分,另一种传递滤波图象的负向部分。
(3)对于每种细胞,墨西哥草帽形滤波器是通过激发与禁止这两种操作的组合来实现的。这个滤波器等价于两个以二维高斯滤波器滤波所得图象的差。
3、物体距离的测定
图10.8表示两眼立体视觉中的相对位置关系。图中,P点为一物体。两个透镜的轴线是平行的。f为两透镜与图象平面的距离,即为其焦距。b为两透镜轴线在基线上的距离,即为两眼的距离。l和r分别为P点与左、右透镜轴的距离。α和β分别为左右图象与其相应透镜轴线的距离。
从两相似三角形,可求得观察者双眼
至物体的距离:
由于双眼距离b为已知,焦距f也是确定的,因此,一个物体与双眼的距离和(α+β)成反比。(α+β)为该点的一幅图象点位置相对于另一幅图象点位置的位移,称为视差(disparity)。