2017年计算机视觉行业深度分析报告

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

训练模型
应用模型识别场景
大数据
算法模型
物体及场景识别
2000年以来,得益于互联网、社交媒体、移动设备和廉价的传感器, 这个世界产生并存储的数据量急剧增加,这为通过深度学习的方法 来训练计算机视觉技术提供很好的土壤。IDC数据显示,从2011年 起,全球所产生的数据量已达到ZB级别(1ZB约为10亿GB ),此后 仍将高速增长,预计2020年达到近40ZB。海量的数据将为计算机 视觉算法模型提供远远不断的素材,助力机器视觉的精准度提升。
数据量 运算力 算法技术 1.3 政策法规 1.4 投资热度 全球投资热度 国内投资热度 1.5 市场规模
行业驱动 · 运算力
运算力的大幅提升推进计算机视觉发展
在计算机视觉领域,图像、视频作为数据密集型问题,需要大量的 矩阵计算操作,因此特别适合使用并行运算芯片进行数据处理。而 传统的CPU一次只能同时做一两个加减法运算,无法满足并行运算 的需求。
人体识别
文字识别
物体识别
(2)物体形状和方位的确定:判断物体的形状和方位是为了让物体 在视觉的三维空间里得到记忆的重建,进而进行场景分析与判断。
(3)物体运动的判断:和物体形状方位的确定一样,对物体的运动 的判断也是一种对于场景的重建和理解,用于进行视觉主体(人或机 器)对场景的分析,乃至做出自身行动的决策,实现视觉主体和场景 的交互。
生物特征识别 光学字符识别 物体与场景识别 视频对象提取与分析
三、计算机视觉行业与创业公司梳理
3.1 产业链 3.2 全景图 3.3 商业模式 3.4 行业竞争
市场格局 创业公司分析 3.5 行业思考 商业模式 技术趋势
Chapter 1
计算机视觉行业概述
• 定义与研究意义 • 行业驱动— 数据量、运算力 、算法技术 • 政策法规 • 投资热度
要理解数据量的重要性,得先从算法说起。数据量和算法可以分别 比作人工智能的燃料和发动机。算法是计算机基于所训练的数据集 归纳出的识别逻辑,好的算法模型可以实现精准的物体和场景识别。 而数据集的丰富性和大规模性对算法的训练尤为重要。因此可以说, 实现机器精准视觉识别的第一步,就是获取海量而优质的应用场景 数据。以人脸识别为例,训练该算法模型的图片数据量至少应为百 万级别。
2017年计算机视觉行业深度分析报告
目 录 Contents
一、计算机视觉行业概述
1.1 定义与研究意义 1.2 行业驱动— 数据量、运算力、算法技术 1.3 政策法规 1.4 投资热度
全球投资热度 国内投资热度 1.5 市场规模
二、计算机视觉技术与应用场景
2.1 通用视觉识别技术流程 2.2 识别技术与应用场景简介
计算机视觉是指用计算机来模拟人的视觉系统,实现人的视觉功能, 以适应、理解外界环境和控制自身的运动。 概括的说, 视觉系统主要解决的是物体识别、物体形状和方位确认 以及物体运动判断这三个问题。而计算机视觉的研究,则是专注于让 机器代替人眼,解决这些问题。 (1)物体的识别:即理解物体是什么,对物体的识别主要体现在两 方面,第一是是将不同物体归类,第二是对同类型物体的区分与鉴别, 如不同人脸的鉴别。物体识别要求既能抽象出物体的共同属性,又能 分别出相似物体间的细微差别。
CPU
传感器 GPU
NPU
深度学习(CNN、RNN等)
路径规划
空间搜索
知识架构层
分布式存储
回归分析
最速梯度下降法
来源:36氪研究院
计算机视觉能够增强、改善人们的生活,代替人类完成更多的任务。 一方面,它为人类自身视觉提供强有力的辅助和增强,极大的改善 人与世界交互的方式。比如,我们可以通过图片搜索引擎找到与之 相关信息;另一方面,机器可以准确、客观而稳定的看见,突破人 类视觉的局限,代替人类完成更多的任务。比如,机器可以24小时 不间断、不疲倦的进行场景监控。
4
36Kr-计算机视觉行业研究报告 2016年9月
1.1 定义与研究意义 1.2 行业驱动---
数据量 运算力 算法技术 1.3 政策法规 1.4 投资热度 全球投资热度 国内投资热度 1.5 市场规模
研究意义
计算机视觉赋予机器“看”和“认知”的功能,是人工智 能的一类基础应用技术
计算机视觉作为计算机的眼睛,是机器认识世界、看懂世界的一种 方式。而认识世界、看懂世界是人工智能产品或方案不可或缺的重 要部分。唯有看见,才能够做出分析判断,进而代替人类完成更多 的任务。它与语音识别、语言识别一并构成了人工智能的感知智能, 让机器完成对外部世界的探测,进而做出判断,采取行动,让更复 杂层面的智慧决策、自主行动成为可能。
基于深度学习算法模型和CPU、GPU等关键硬件的支撑,计算机视 觉技术应用得以实现,并最终集成于多类产品和应用场景之中(如 机器人、无人驾驶等等)。
人工智能基础架构
方案集成层
产品 智慧交通 智慧家电 智慧工业
技术应用层
基础应用技术
语音识别
自然语言处理
计算机视觉
预测
计划和安排
关键硬件
算法模型
基础支撑层
5
36Kr-计算机视觉行业研究报告 2016年9月
1.1 定义与研究意义 1.2 行业驱动---
数据量 运算力 算法技术 1.3 政策法规 1.4 投资热度 全球投资热度 国内投资热度 1.5 市场规模
行业驱动 · 数据量
海量数据为计算机视觉发展提供燃料
数据量、运算力和算法模型是影响计算机视觉行业发展的三大要素。 2000年之后,数据量的上涨、运算力的提升和深度学习算法的出现 极大的促进了计算机视觉行业的发展。
全球投资热度 国内投资热度 • 市场规模
36Kr-计算机视觉行业研究报告 2016年9月
1.1 定义与研究意义 1.2 行业驱动---
数据量 运算力 算法技术 1.3 政策法规 1.4 投资热度 全球投资热度 国内投资热度 1.5 市场规模
定义
让机器之眼代替人眼,看懂所在世界
“To know what is where by looking.” (通过看去了解所在之处。) ----亚里士多德
2009-2020年全球总体数据量(单位:ZB)
50
40
30
20
10
0 2009 2010 2011 2012 2013 2014 2015 2016e 2017e 2018e 2019e 2020e 来源:IDC,36氪研究院
6
Biblioteka Baidu
36Kr-计算机视觉行业研究报告 2016年9月
1.1 定义与研究意义 1.2 行业驱动---
相关文档
最新文档