从视觉感知智能到视觉认知智能
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
邓志东教授/博士生导师
清华大学智能技术与系统国家重点实验室
清华大学计算机科学与技术系
清华大学人工智能研究院
michael@
从视觉感知智能到视觉认知智能
2019.10.31 成都2019年第七届输电技术年会
邓志东
清华大学智能技术与系统国家重点实验室教授,
人工智能研究院视觉智能研究中心主任
清华大学计算机系教授,博士生导师。现为中国
自动化学会会士,中国人工智能产业创新联盟专
家委主任,中国自动化学会智能自动化专委会主
任,新兴产业百人会专家等。
▫致力于视觉人工智能研究;
▫积极推动“智能+”的跨界融
合发展与产业落地应用实践
提纲O UTLINES
1、人工智能产业生态
2、视觉感知智能成为通用赋能工具与研究范式
3、数据驱动的视觉感知智能面临的主要挑战
4、探索结合数据与知识驱动的视觉认知智能
提纲O UTLINES
1、人工智能产业生态
2、视觉感知智能成为通用赋能工具与研究范式
3、数据驱动的视觉感知智能面临的主要挑战
4、探索结合数据与知识驱动的视觉认知智能
涉及四个维度:
大数据,大计算,算法和应用场景
上游/基础层:大数据,AI 芯片,AI 基础算法,开源代码
框架,AI 基础设施(云-边-端,5G 等)
中游/技术层:视觉引擎,语音引擎,知识引擎
下游/应用层:AI +行业或行业+AI
人工智能产业链划分:
公开评测数据集:视觉物体检测、识别与分割-ImageNet ,MS COCO ,PASCAL VOC-2007 /VOC-2012,Caltech-101,Caltech-256,CIFAR-10,CIFAR-100,MNIST ,US-PS ,SVHN 等;
人脸识别-LFW ,PubFig ,MTFL ,Caltech 人脸数据库,FDDB ,CelebA ,CK+,FER-2013,JAFFE 等;交通标识识别-GTSRB ,TRoM 等
-开放的大数据资源:公开评测数据集是完备大数据,算法性能
仅反映了深度神经网络本身达到甚至超过人类水平的感知能力
产业上游:开放的大数据资源
大数据:真实条件下
有标签的巨量数据
其重要性如同原油一样,巨头企业视之为
AI时代的战略资源!
-落地应用中,开放环境下不存在完备大数据。对大多数长尾应用场景,需要使用尽可能多的高质量大数据(数据“暴力”)。
产业上游:专有的大数据资源
-离线训练;
-基于云平台的在线推断应用;
-基于边缘平台的在线推断应用;
-终端在线推断应用
产业上游:AI加速芯片
-计算能力的大幅度提升,有力地推动新一轮人工智能的发展。大数据深度学习直接得益于计算“暴力”。
产业上游:AI基础算法
★算法:深度监督学习(如深度卷积神经网络,LSTM)★算法:深度强化学习
★算法:对抗性神经网络
★算法:图卷积神经网络,无监督学习
产业上游:开源代码框架
深度学习的开源代码框架:
-谷歌的TensorFlow;-Chollet的Keras;
-Facebook的Pytorch;-微软的CNTK;
-Amazon的MXNet;-加州伯克利的Caffe;-Bengio的Theano;-百度的PaddlePaddle;-华为的MindSpore
产业中游:视觉、语音、知识引擎/OS+平台核心技术
渗透更多垂直应用领域:智能制造,智能安防,智能交通,智能物流,智能金融,智能医疗,智能教育,智能写作,无人零售,智能家居,智能司法,智能农业,智慧城市,智能政务,智能流程自动化/RPA, 5G ,产业物联网,产业互联网,自动驾驶,智能机器人,无人自主系统,生命科学,
AI 产业生态:应用场景
产业下游:AI+
提纲O UTLINES
1、人工智能产业生态
2、视觉感知智能成为通用赋能工具与研究范式
3、数据驱动的视觉感知智能面临的主要挑战
4、探索结合数据与知识驱动的视觉认知智能