计算机视觉应用场景与人工智能技术发展现状研究分析

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

计算机视觉应用场景与人工智能技术发展现状研究分析

广州创亚企业管理顾问有限公司

目录contents

创亚咨询

一、计算机视觉

（一）计算机视觉简介

1、简介

2、定义

3、计算机视觉与人工智能的关系

4、计算机视觉原理

（二）计算机视觉图像处理方法

1、图像增强

2、图像的平滑

3、图像的数据编码和传输

4、边缘锐化

5、图像的分割

6、数据驱动的分割

7、模型驱动的分割

8、图像的识别二、计算机视觉的应用场景

（一）人脸识别

1、人脸识别的应用场景

2、代表企业

（二）视频/监控分析

1、视频/监控分析应用场景

2、代表企业

（三）图片识别分析

1、图片识别应用场景

2、代表企业

（四）驾驶辅助/智能驾驶

1、辅助驾驶、智能驾驶的应用场景

2、代表企业

（五）三维图像视觉

1、三维图像视觉应用场景

2、代表企业

（六）工业视觉检测

1、工业视觉应用场景

2、代表企业

（七）医疗影像诊断

1、医疗影像诊断应用场景

2、代表企业

（八）文字识别

1、文字识别应用场景

2、代表企业

（九）图像及视频编辑

1、图像及视频编辑应用场景

2、代表公司三、中国计算机视觉发展情况

（一）市场

1、应用市场结构分布

2、计算机视觉投融资情况

（二）中美计算机视觉投资情况

1、中国安防市场带动计算机视觉快速落地

2、美国因为国情计算机视觉发展缓慢（三）我国计算机视觉的优势

1、算法优势

2、数据优势

3、市场接受度高

（四）中国计算机视觉发展前景

1、新零售

3、医疗影像

3、保险行业

4、工业制造

2、定义

计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息，就像人类和许多其他类生物每天所做的那样。

计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的，被拍摄对象的数据与信息的学问。形象地说，就是给计算机安装上眼睛（照相机）和大脑（算法），让计算机能够感知环境。我们中国人的成语"眼见为实"和西方人常说的"One picture is worth ten thousand words"表达了视觉对人类的重要性。不难想象，具有视觉的机器的应用前景能有多么地宽广。

计算机视觉既是工程领域，也是科学领域中的一个富有挑战性重要研究领域。计算机视觉是一门综合性的学科，它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学，神经生理学和认知科学等。

3、计算机视觉与人工智能的关系

计算机视觉与人工智能有密切联系，但也有本质的不同。人工智能的目的是让计算机去看、去听和去读。图像、语音和文字的理解，这三大部分基本构成了我们现在的人工智能。而在人工智能的这些领域中，视觉又是核心。大家知道，视觉占人类所有感官输入的80%，也是最困难的一部分感知。如果说人工智能是一场革命，那么它将发轫于计算机视觉，而非别的领域。

人工智能更强调推理和决策，但至少计算机视觉目前还主要停留在图像信息表达和物体识别阶段。‚物体识别和场景理解‛也涉及从图像特征的推理与决策，但与人工智能的推理和决策有本质区别。

计算机视觉和人工智能的关系：

（1）它是一个人工智能需要解决的很重要的问题。

（2）它是目前人工智能的很强的驱动力。因为它有很多应用，很多技术是从计算机视觉诞生出来以后，再反运用到AI领域中去。

（3）计算机视觉拥有大量的量子AI的应用基础。

4、计算机视觉原理

计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段，由计算机来代替大脑完成

处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界，具有自主适应环境的能力。在实现最终目标以前，人们努力的中期目标是建立一种视觉系统，这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如，计算机视觉的一个重要应用领域就是自主车辆的视觉导航，还没有条件实现象人那样能识别和理解任何环境，完成自主导航的系统。因此，人们努力的研究目标是实现在高速公路上具有道路跟踪能力，可避免与前方车辆碰撞的视觉辅助驾驶系统。

这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用，但并不意味着计算机必

须按人类视觉的方法完成视觉信息的处理。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理。但是，人类视觉系统是迄今为止，人们所知道的功能最强大和完善的视觉系统，对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。因此，用计算机信息处理的方法研究人类视觉的机理，建立人类视觉的计算理论，也是一个非常重要和信人感兴趣的研究领域。

这一领域的深入研究是从20世纪50年代开始的，走的是三个方向——即复制人眼；复制视觉

皮层；以及复制大脑剩余部分。

（1）复制人眼——让计算机‚去看‛

目前做出最多成效的领域就是在‚复制人眼‛这一领域。在过去的几十年，科学家已经打造

了传感器和图像处理器，这些与人类的眼睛相匹配，甚至某种程度上已经超越。通过强大、光学上更加完善的镜头，以及纳米级别制造的半导体像素，现代摄像机的精确性和敏锐度达到了一个惊人的地步。它们同样可以拍下每秒数千张的图像，并十分精准地测量距离。

但是问题在于，虽然我们已经能够实现输出端极高的保真度，但是在很多方面来说，这些设

备并不比19世纪的针孔摄像机更为出色：它们充其量记录的只是相应方向上光子的分布，而即便是最优秀的摄像头传感器也无法去‚识别‛一个球，遑论将它抓住。

换而言之，在没有软件的基础上，硬件是相当受限制的。因此这一领域的软件才是要投入解

决的更加棘手的问题。不过现在摄像头的先进技术，的确为这软件提供了丰富、灵活的平台就是了。