计算机视觉在各个方面的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机视觉在各个方面的应用
摘要
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。
关键词:图像处理,模式识别,图像理解。
正文
1.1序言
计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所做的那样。
计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算计科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。
所需要的知识储备以及相关课程如下,
图1-1 图1-2
1.1.2 现阶段的形式
视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的
图1-3计算机视觉与其他领域的关系
研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战(grand challenge)。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。作为一门学科,计算机视觉开始于60年代初,但在计算机视觉的基本研究中的许多重要进展是在80年代取得的。计算机视觉与人类视觉密切相关,对人类视觉有一个正确的认识将对计算机视觉的研究非常有益。为此我们将先介绍人类视觉。
人类正在进入信息时代,计算机将越来越广泛地进入几乎所有领域。一方面是更多未经计算机专业训练的人也需要应用计算机,而另一方面是计算机的功能越来越强,使用方法越来越复杂。这就使人在进行交谈和通讯时的灵活性与目前在使用计算机时所要求的严格和死板之间产生了尖锐的矛盾。人可通过视觉和听觉,语言与外界交换信息,并且可用不同的方式表示相同的含义,而目前的计算机却要求严格按照各种程序语言来编写程序,只有这样计算机才能运行。为使更多的人能使用复杂的计算机,必须改变过去的那种让人来适应计算机,来死记硬背计算机的使用规则的情况。而是反过来让计算机来适应人的习惯和要求,以人所习惯的方式与人进行信息交换,也就是让计算机具有视觉、听觉和说话等能力。这时计算机必须具有逻辑推理和决策的能力。具有上述能力的计算机就是智能计算机。
智能计算机不但使计算机更便于为人们所使用,同时如果用这样的计算机来控制各种自动化装置特别是智能机器人,就可以使这些自动化系统和智能机器人具有适应环境,和自主作出决策的能力。这就可以在各种场合取代人的繁重工作,或代替人到各种危险和恶劣环境中完成任务。
1.1.3 简单原理
计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重
要应用领域就是自主车辆的视觉导航,目前还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。因此,目前人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理。但是,人类视觉系统是迄今为止,人们所知道的功能最强大和完善的视觉系统。如在以下的章节中会看到的那样,对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。因此,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,也是一个非常重要和信人感兴趣的研究领域。这方面的研究被称为计算视觉(Computational Vision)。计算视觉可被认为是计算机视觉中的一个研究领域。
2.1 简单举例--计算机视觉中的摄像机定标方法2.1.1三维定标法
在人们的平常思维中凡是物体的影像必定是三维的本文的理论研究也同样基于这样的想法在讨论单幅图像的设计标定之时我们所追求的理论基础就是需要摄像机的定标物是人们所追求的那种三维的效果在此基础上再进行相关的理论研究以达到相得益彰的效果在此过程中首先要准确定位定标物上一些比较重要的点的三维坐标这样才能够为后来的工作提供方便然后在与定标物相对应的成像上找到相应的点的位置这是至关重要的一步这也决定了后面成像的具体设计方法最后在那些比较重要的点的图像上标出其具体的三维坐标达到定标物的实际成像效果图这样就可以完全解决摄像机的成像问题了这种定标方法的基本原理就是充分分析定标物的三维信息同时与它的具体成像位置相关联在这两者之间形成一种具体的相对应关系由此我们可以充分利用计算机的快速运算实现摄像的功能并适时进行程序功能改进优化定标物参数的获取方法从而达到增加摄像机清晰度的目标
2.1.2 平面定标法
与上面的定标方法相对立的一种方法就是多幅图像的设计标定在这样的时代背景下人们的要求应尽可能得到满足因而理论研究者会在这个方面下足功夫弄懂这里面的个中玄机利用多幅图像对平面的定标物来进行物体的标定工作以达到摄像机定标的目的这样的平面定标方法就是充分利用平面物体的运动特性在它和摄像机之间找到一个平衡点观察两者的相对运动这样的定标方法也给拍摄运动中的物体带来了生机此方法在实施之余也会带给人们不一样的感受让人们充分体会到摄像的魅力当然这种考虑运动的平面定标法会受到特征点的增多的影响随着点的不断增加定标情况就会越来越好定标物的精度也会不断提高于是在定标物相同的前提下平面定标法自然就可以从定标物上获得更多的数据信息为准确对定标物进行定位测量提供了更多的依据因此这种方法的效果要比前面的方法好很多得到推广的力度也会大大增加所得到的经济效益也会增加设备的成本在原来的基础上还有降低的趋势所以理论研究者的研究领域就会逐渐向这一方面进行转变
2.1.3 两步定标法
有了前面的研究成果作支撑摄像机定标方法的进一步研究就会显得异常容易人