一文详解计算机视觉技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一文详解计算机视觉技术
如果有人朝你扔过来一个球,通常你会怎么办?——当然是马上把它接住。
这个问题是不是很弱智?但实际上,这一过程是最复杂的处理过程之一,实际上的过程大概如下:首先球进入人类的视网膜,一番元素分析后,发送到大脑,视觉皮层会更加彻底地去分析图像,把它发送到剩余的皮质,与已知的任何物体相比较,进行物体和纬度的归类,最终决定你下一步的行动:举起双手、拿起球(之前已经预测到它的行进轨迹)。
上述过程只在零点几秒内发生,几乎都是完全下意识的行为,也很少会出差错。
因此,重塑人类的视觉并不只是单一一个困难的课题,而是一系列、环环相扣的过程。
计算机视觉技术的概念
正像其它学科一样,一个大量人员研究了多年的学科,却很难给出一个严格的定义,模式识别如此,目前火热的人工智能如此,计算机视觉亦如此。
与计算机视觉密切相关的概念有视觉感知(visual perception),视觉认知(visual cognition),图像和视频理解( image and video understanding)。
这些概念有一些共性之处,也有本质不同。
从广义上说,计算机视觉就是“赋予机器自然视觉能力”的学科。
自然视觉能力,就是指生物视觉系统体现的视觉能力。
一则生物自然视觉无法严格定义,在加上这种广义视觉定义又“包罗万象”,同时也不太符合40多年来计算机视觉的研究状况,所以这种“广义计算机视觉定义”,虽无可挑剔,但也缺乏实质性内容,不过是一种“循环式游戏定义”而已。
实际上,计算机视觉本质上就是研究视觉感知问题。
视觉感知,根据维科百基(Wikipedia)的定义, 是指对“环境表达和理解中,对视觉信息的组织、识别和解释的过程”。
根据这种定义,计算机视觉的目标是对环境的表达和理解,核心问题是研究如何对输入的图像信息进行组织,对物体和场景进行识别,进而对图像内容给予解释。
计算机视觉(Computer Vision, CV)是一门研究如何让计算机达到人类那样“看”的学科。