2018年计算机视觉技术研究报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2018年计算机视觉技术研究报告
摘 要:㊀计算机视觉技术始于20世纪60年代,主要研究如何让机器对图像进行高层次理解和自动化处理㊂随着机器学习技术的
引入,特别是近几年来深度学习技术的发展,计算机视觉研
究取得了重大进展㊂数据㊁算法㊁算力和应用场景是计算机
视觉的四大核心要素㊂移动互联网和存储技术的发展,为计
算机视觉技术的研究和应用提供了海量数据㊂同时监督学习㊁
非监督学习㊁强化学习和对抗学习等各种算法形态也在近年
来取得了巨大突破㊂计算平台更是从CPU发展到现在的GPU
和TPU,算力大幅度提升㊂这三方面的发展,使得计算机视
觉技术被广泛应用于安防监控㊁金融㊁医学影像分析㊁自动
驾驶㊁智慧城市等各个应用场景中㊂
一 计算机视觉发展历程
计算机视觉主要研究的是如何让机器对图像或视频进行高层次的理解㊂
具体来说,计算机视觉致力于从单个图像或图像序列中自动提取㊁分析和理解有用的信息,实现自动化的视觉理解㊂
(一)经典视觉体系的建立
计算机视觉始于20世纪60年代后期,与当时流行的数字图像处理领域不同的是,计算机视觉希望从图像中提取三维结构,以实现全面的场景理解㊂20世纪70年代,计算机视觉体系慢慢地建立起来,主流研究包括如何进行图像中边缘的提取㊁线条的标注㊁非多面体和多面体的建模㊁光流的研究以及对运动的估计㊂在之后的十年里,更严格的数学分析被引入视觉建模,比如尺度空间的概念㊁利用阴影㊁纹理及焦点进行的形状推断以及一些轮廓模型㊂到20世纪90年代,投影三维重建的研究渐渐活跃起来,它让我们对于相机校准有了更好的理解㊂90年代末,基于计算机图形学和计算机视觉领域的交叉作用,一些新的研究慢慢涌现,包括图形渲染㊁图像变形㊁视图差值㊁全景图像拼接以及早期的光场渲染㊂
经典的计算机视觉系统主要可以分为五个步骤:图像获取㊁预处理㊁特征提取㊁检测分割和语义分析㊂图像获取由照相机或摄像机来获取图像或视频;预处理则是对图像和视频进行噪声去除和数据整合等处理;特征提取是从图像中提取线㊁边缘㊁颜色㊁方向㊁纹理等各种复杂度的特征;检测分割则是对有价值的部分进行分割提取;语义分析包括对图像进行识别或分类等过程㊂
(二)机器学习的引入和应用
机器学习主要研究计算机怎样模拟和实现人类的学习行为,通常来说,机器学习重新组织已有的知识结构来获得新的知识和技能,通过一系列的训练过程来不断提升自身的预测性能㊂机器学习的出现源于这样一个想法:一个算法的效果应该随着时间的推进越来越好㊂20世纪90年代,随着计算机硬件和软件的进步,机器学习的实际应用变得越来越广泛㊂此时,计算机视觉和机器学习的结合变为必然,机器学习技术很大程度上优化了视觉算法,
提高了视觉系统的性能㊂具体来说,机器学习为计算机视觉提供了许多有效的模式,包括自动化参数的更新和模型的训练,以及用经验主义来进行模型的生成㊁验证和修改㊂机器学习在计算机视觉中的应用主要包括:图像分割和特征提取,学习规则㊁关系㊁特征㊁判别函数和评价指标,视觉模块和任务级学习的整合,学习形状表示和表面重建策略,自组织算法模式学习等㊂
(三)由深度学习引领的新突破
到了21世纪,深度学习开始被广泛研究㊂随着数据量的上涨和运算力的提升,深度学习引领了计算机科学一次又一次的新突破㊂计算机视觉是深度学习技术最早取得突破性成就的领域㊂深度学习的鼻祖GeoffreyHinton在2012年的ImageNet大规模图像识别竞赛中以超过第二名将近10个百分点的成绩夺冠,之后深度学习真正地火热起来㊂计算机视觉中比较成功的深度学习应用,包括人脸识别㊁图片问答㊁物体检测㊁物体跟踪等㊂深度学习的引入,大大提高了这些任务的预测准确性或性能㊂
(四)计算机视觉与其他学科的协同发展
计算机视觉与人工智能㊁物理学㊁神经生物学㊁生物视觉㊁信号处理等领域的关系十分密切㊂例如,人工智能研究中的机器人需要在周围环境中导航,这时就需要计算机视觉来协助判断周围的物体环境㊂计算机视觉有时也被认为是人工智能领域的一部分㊂而在物理学中,物理中的各种测量问题可以使用计算机视觉来解决,例如流体的运动㊂另外,许多计算机视觉的方法都基于统计学㊁优化和几何学,因此,数学与计算机视觉也有着不可分割的密切关系㊂从具体的应用层面来说,医学是计算机视觉最突出的应用领域之一㊂计算机视觉可以从患者的医学图像数据中提取信息来对患者进行医学诊断㊂图像数据包括X射线图像㊁超声图像等形式,计算机视觉可以从这样的图像数据中提取肿瘤㊁动脉硬化等诊断信息㊂另外,计算机视觉在工业和农业领域也有着广泛的应用,例如,它可以从散装材料中去除不需要的事物,我们称为光学分选㊂计算机视觉也逐渐应用到军事中,如侦察敌方士
兵㊁车辆㊁飞机等工作,以及导弹制导系统的设计等㊂最新的应用则是无人驾驶系统,完全自动化的车辆可以使用计算机视觉进行导航㊂
总的来说,计算机视觉和许多领域都有着密切的关系,在许多应用领域发挥了极大的作用㊂
二 计算机视觉最新技术进展
视觉技术包含数据㊁算力㊁算法和应用场景四个核心要素㊂近年来,数据量的飞速上涨㊁运算力的大幅提升和深度学习算法的出现都极大地促进了计算机视觉技术的发展,使得其能广泛用于移动端多媒体应用㊁智慧城市㊁自动驾驶等场景㊂
如果将计算机视觉技术比喻成火箭,那么数据就是燃料㊂数据为目前以深度学习为主流的计算机视觉技术提供了驱动力,获取优质的海量数据是实现精准视觉技术的第一步㊂近年来,智能手机的普及㊁互联网技术和存储技术的发展为获取海量优质数据提供了可能,极大促进了视觉技术的发展㊂算力也是计算机视觉的一个关键因素㊂图像和视频处理都属于数据密集型问题,需要大量的矩阵计算操作㊂经历了从CPU到GPU再到TPU的演变,计算能力在一步步提升,这也大大促进了计算机视觉技术的发展㊂随着AI芯片研发的深入,未来算力还将会有更大的提升㊂算法方面,在深度学习出现之前,计算机视觉技术大多分为手工特征提取和分类(识别)两个阶段,在大多数问题上识别准确率较低㊂深度学习的出现直接合并了这两个阶段,让识别的逻辑真正变为数据驱动的学习,同时大大提高了算法的精度㊂并且,除了传统的监督学习,目前更多的研究者正在投入到无监督学习㊁强化学习㊁对抗学习和终身学习的研究中,算法形态也在不断演变㊁不断进步㊂随着视觉技术的进步和成熟,越来越多的应用场景不断涌现,这些场景一方面为视觉技术的研究提供了丰富的数据,同时也提出了更大的挑战㊂越来越多的复杂场景问题不再是单一视觉技术就可以解决的,而需要跨模态多任务联合来应对㊂