从视觉感知智能到视觉认知智能

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

邓志东教授/博士生导师

清华大学智能技术与系统国家重点实验室

清华大学计算机科学与技术系

清华大学人工智能研究院

michael@

从视觉感知智能到视觉认知智能

2019.10.31 成都2019年第七届输电技术年会

邓志东

清华大学智能技术与系统国家重点实验室教授,

人工智能研究院视觉智能研究中心主任

清华大学计算机系教授,博士生导师。现为中国

自动化学会会士,中国人工智能产业创新联盟专

家委主任,中国自动化学会智能自动化专委会主

任,新兴产业百人会专家等。

▫致力于视觉人工智能研究;

▫积极推动“智能+”的跨界融

合发展与产业落地应用实践

提纲O UTLINES

1、人工智能产业生态

2、视觉感知智能成为通用赋能工具与研究范式

3、数据驱动的视觉感知智能面临的主要挑战

4、探索结合数据与知识驱动的视觉认知智能

提纲O UTLINES

1、人工智能产业生态

2、视觉感知智能成为通用赋能工具与研究范式

3、数据驱动的视觉感知智能面临的主要挑战

4、探索结合数据与知识驱动的视觉认知智能

涉及四个维度:

大数据,大计算,算法和应用场景

上游/基础层:大数据,AI 芯片,AI 基础算法,开源代码

框架,AI 基础设施(云-边-端,5G 等)

中游/技术层:视觉引擎,语音引擎,知识引擎

下游/应用层:AI +行业或行业+AI

人工智能产业链划分:

公开评测数据集:视觉物体检测、识别与分割-ImageNet ,MS COCO ,PASCAL VOC-2007 /VOC-2012,Caltech-101,Caltech-256,CIFAR-10,CIFAR-100,MNIST ,US-PS ,SVHN 等;

人脸识别-LFW ,PubFig ,MTFL ,Caltech 人脸数据库,FDDB ,CelebA ,CK+,FER-2013,JAFFE 等;交通标识识别-GTSRB ,TRoM 等

-开放的大数据资源:公开评测数据集是完备大数据,算法性能

仅反映了深度神经网络本身达到甚至超过人类水平的感知能力

产业上游:开放的大数据资源

大数据:真实条件下

有标签的巨量数据

其重要性如同原油一样,巨头企业视之为

AI时代的战略资源!

-落地应用中,开放环境下不存在完备大数据。对大多数长尾应用场景,需要使用尽可能多的高质量大数据(数据“暴力”)。

产业上游:专有的大数据资源

-离线训练;

-基于云平台的在线推断应用;

-基于边缘平台的在线推断应用;

-终端在线推断应用

产业上游:AI加速芯片

-计算能力的大幅度提升,有力地推动新一轮人工智能的发展。大数据深度学习直接得益于计算“暴力”。

产业上游:AI基础算法

★算法:深度监督学习(如深度卷积神经网络,LSTM)★算法:深度强化学习

★算法:对抗性神经网络

★算法:图卷积神经网络,无监督学习

产业上游:开源代码框架

深度学习的开源代码框架:

-谷歌的TensorFlow;-Chollet的Keras;

-Facebook的Pytorch;-微软的CNTK;

-Amazon的MXNet;-加州伯克利的Caffe;-Bengio的Theano;-百度的PaddlePaddle;-华为的MindSpore

产业中游:视觉、语音、知识引擎/OS+平台核心技术

渗透更多垂直应用领域:智能制造,智能安防,智能交通,智能物流,智能金融,智能医疗,智能教育,智能写作,无人零售,智能家居,智能司法,智能农业,智慧城市,智能政务,智能流程自动化/RPA, 5G ,产业物联网,产业互联网,自动驾驶,智能机器人,无人自主系统,生命科学,

AI 产业生态:应用场景

产业下游:AI+

提纲O UTLINES

1、人工智能产业生态

2、视觉感知智能成为通用赋能工具与研究范式

3、数据驱动的视觉感知智能面临的主要挑战

4、探索结合数据与知识驱动的视觉认知智能

相关文档
最新文档