2017年上半年度视频内容识别行业浅析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
开发者在此基础上做进一一步开发,即可轻松实现美颜、面面部 贴图、身份验证、任务识别、照片片聚类等功能。
驾照、行行行驶证上的文文字,快速采集证件内的文文本信息。
视频内容识别典型分析
·核心心技术·
03/
人人体识别
04/
以及相应的置信度。
图像识别
通过云、硬件级解决方方案,实现对关键点实时标 注和变化的检测,完成在线上及线下场景进行行行实 名验证过程中,对照片片攻击、切换攻击、面面具攻 击、遮挡攻击的防御。 检测并定位图片片中的人人体,返回高高精度的人人体矩 形框坐标。 人人体检测是对人人体进行行行分析和处理理的 第一一步。所有检测出的人人体都可以进一一步进行行行人人 体属性分析,获取更更完整的人人体相关信息。
视频内容识别
智能安防
智能家居
直播监控
广广告营销
金金金融服务
三位分析
视频内容识别技术因为⻔门槛比比较高高,目目前在这个领域内做得比比较好的技术公司比比较少,我们对其作了了一一个统一一的整理理,一一共24 家,分别从事广广告营销、游戏、企业服务、医疗健康、金金金融、娱乐、电子子商务等领域。
视频内容识别融资规模
企
业
服
务
ቤተ መጻሕፍቲ ባይዱ
(
13
电子子商务(8%)
%)
文文娱(46%)
*所有数据根据IT桔子子公开资料料整理理
安
防
(
25
%)
目目录
4
1. 2. 3. 4. 5.
同质化公司产品对比比
人人工工智能概述 计算机视觉发展 视频内容识别发展背景及现状分析 典型公司产品对比比 未来趋势预判
视频内容识别典型分析
·大大事件·
2012年年 成立立于北北京
视频内容识别典型分析
·前端展示·
01/
动态人人脸识别
02/
证件识别
视频内容识别典型分析
·产品展示·
03/
人人体识别
04/
图像识别
视频内容识别典型分析
·典型案例例·
Face++
人人脸比比对
支支付宝 滴滴 联想
人人脸检测/关键点
美图秀秀
人人脸搜索
世纪佳缘 朋友印象
智能房产
蚂蚁金金金服大大楼
智能安防
识别证件中的关键字段内容,并支支持证件版本判断、图片片质 量量检测和真实性判断。提供身份证、驾照和行行行驶证识别。目目 前已被支支付宝、中信银行行行等 300 多家金金金融机构使用用。 身份证识别可识别二二代身份证上正反面面的文文字,并区分出临 时身份证、复印件、屏幕翻拍或后期合成图片片。同时提供身 份证照片片质量量检测,提前判断是否存在残缺、光斑暗影、⻆角 度过大大等问题,提高高识别准确度。 利利用用 Face++的OCR 技术,开发者的产品可以识别出身份证、
·核心心技术·
01/
动态人人脸识别
02/
证件识别
实现视频流中人人脸检测、关键点定位及人人脸识别功能的毫秒 级响应,使得人人脸识别技术可以在实际场景中实现非非配合式 快速处理理,可广广泛应用用于地产、安防、交通等领域。 Face++ 提供了了人人脸检测、83个关键点检测与跟踪、人人脸分 析、1:1 人人脸比比对或 1:N 人人脸搜索的能力力力,它普遍适用用于图 片片与实时视频流,能够应对复杂的光照并支支持多种人人脸姿态。 可检出不不小小于16*16像素的人人脸,并可在移动设备上实时跟踪 人人脸(20帧/秒)。
语言言计算 虚拟助理理 认知智能 计算机视觉
工工业机器器人人
从成熟度曲线来看,语音音更更靠前一一点,然后是计算机视觉,特别是安防领域,封闭的场景,有一一些孤岛化分布的大大 量量数据可以用用于训练,在这些领域它是有先发优势的。
计算机视觉发展
传统算法 时代的计 算机视觉
大大致可以分为以下4个步骤:图像预处理理、 特征提取、特征筛选、推理理预测与识别。 需要大大量量的经验,需要你对这个领域和 数据特别了了解,然后设计出来特征还需 要大大量量的调试工工作。
视频内容识别典型分析
·商业模式分析·
旷视科技为自自己己总结了了人人工工智能公司的“三段论”:作为一一家人人工工智能公司,首首先要有自自己己的平台,同 时选择一一个商业落地的方方向,最终快速地实现数据循环——
● 第一一阶段:线上技术服务主要通过企业级技术License来获得收入入。(2014年年) ● 第二二阶段:开始研发SmartID(自自研发的个人人级产品),因为它最通用用,且能够打通线上和线下。Face++涉及了了1亿人人的刷 脸,比比较有代表的客户有蚂蚁金金金服的支支付宝、Uber、中信银行行行、万科,万科是我们在线下化的体验,未来会实现一一个智能园区。 (2016年年) ● 第三阶段:逐渐深入入到智能房产、智能安防以及更更多人人工工智能领域。 Face++本身是一一个技术服务平台,所以它的定位是面面向开发者和企业级用用户。通过搭建这样的平台,积累了了人人脸核心心技术和大大量量 的人人脸数据,为核心心技术引擎的提升提供了了源源不不断的数据基础。通过这样的技术优势,Face++会通过一一体化的人人脸识别产品在 智能监控等领域做产品落地。
算法日日趋成熟
深度学习 时代的计 算机视觉
效果远超传统机器器学习算法 人人脸识别方方面面:DeepID算法 物体检测方方面面:Region CNN算法、Faster RCNN方方法、FACEBOOK提出来的YOLO网网络、 Single Shot MultiBox Detector 物体跟踪方方面面:DeepTrack算法
视频内容识别典型分析
2016年年9月月,ImageNet国际计算 机视觉挑战赛(ILSVRC)的大大规 模物体识别竞赛中,商汤科技和港 中文文团队又又一一次蝉联视频物体检测 冠军。一一举揽下物体检测、视频物 体检测和场景分析三项冠军
2017博鳌亚洲论坛 2016G20峰会
Camera360 魔漫相机
SOHO 3Q
Face++人人工工智能云开放平台的API已经服务了了近7万开发者,已被调用用 62 亿次;身份认证平台目目前已为1.2亿人人(注意 不不是1.2亿次)提供了了刷脸服务,覆盖了了85%的金金金融市场智能化应用用;智慧安防和智能商业产品也覆盖到25个省。
2013年年7月月 获得A轮 数百万美元
2015年年5月月获 得B轮 2500万美元
2016年年12月月 获得C轮 1亿美元
2012年年8月月获 得天使轮 数百万人人⺠民币
2013年年底开始,先后 在世界最权威的人人脸检 测(FDDB评测)、人人脸 关键点定位(300-W评 测),和人人脸识别 (LFW评测)获得三个世 界第一一。
视频内容识别典型分析
2012年年黑黑⻢马大大赛总决赛冠军 福布斯亚洲30位30岁以下年年轻领袖(30 under 30)(印 奇) 2013年年底开始,先后在世界最权威的人人脸检测(FDDB评测)、 人人脸关键点定位(300-W评测),和人人脸识别(LFW评测) 获得三个世界第一一。这意味着在人人脸技术三个最核心心的技 术模块,Face++都达到了了世界最高高水水平。(以人人脸识别率 0.02%的优势击败社交巨头Facebook摘得桂冠。) 入入选“2015德勤勤高高科技、高高成⻓长中国50强”(该榜单是亚太 地区最具权威、最客观、最具投资指引价值榜单) 2016中国最佳创业服务商(亿欧网网主办)
利利用用 Face++ 的图像识别技术,开发者的产品可 以识别出图片片中的文文字、场景和物体。检测图片片 中的场景与物体,返回检测出的场景与物体名称,
场景检测可以检测出照片片中的场景,包括山山川湖 海海、或是常⻅见的城市设施:电影院、图书馆、医 院、体育场、⻋车站等。物体检测可以检测出多达 200 种物体,包括⻝食食物饮料料、蔬菜花卉、猫狗宠 物、交通工工具、雨雨雪雷雷电等。
融资阶段主要集中于A轮,天使轮、B轮、C轮、IPO的公司数量量比比较平均,整个行行行业处于稳步上升中。 智能家居(4%) 智能消费(4%) 根据新浪微博年年报显示,短视频播放量量同比比增 ⻓长了了700%以上,搜索视频内容,并进行行行审查 和归类等将是许多媒体公司和平台公司必做的 功课,可以极大大的降低人人力力力成本。 因此专注于文文娱类的公司数量量遥遥领先,其中 以服务于直播监测和广广告营销为主要发力力力方方向。
以服务于直播监测和广广告营销为 主要发力力力方方向
目目录
2
1. 2. 3. 4. 5.
计算机视觉发展
人人工工智能概述 计算机视觉发展 视频内容识别发展背景及现状分析 典型公司产品对比比 未来趋势预判
计算机视觉发展
GARTNER技术成熟度曲线
市 场 认 可 度 探索期 市场启动期 发展期 应用用成熟期
2016年年11月月 获得B+轮 2000万美元
估值:最高高估值20亿美元
视频内容识别典型分析
·核心心人人才·
核心心人人才
- 首首席科学家——孙剑 微软亚洲研究院首首席研究员,带领的团队于2015年年获得图 像识别国际大大赛五项冠军(ImageNet分类,检测和定位,MS COCO 检测和分 割);2016年年7月月正式加入入旷视(Face++)担任首首席科学家。 - CTO&联合创始人人——唐文文斌 清华研究生生阶段,专注社交挖掘和图像检索,曾获 ECML best student paper runner-up和google topcoder target。百度百科:唐文文 斌 - CEO——印奇 从本科开始在MSRA(微软亚洲研究院)实习加全职工工作共四年年时 间,研发了了微软当时核心心的人人脸识别系统,被广广泛应用用在X-box和Bing等微软产品 中。
人人才比比例例
公司已经组建了了20人人的核心心研发团队,汇集了了美国哥伦比比亚、英国牛牛津、香香港中文文、 新加坡南洋理理工工等一一批出色色的机器器视觉研究人人才,团队中有6人人曾经获得过国际信息学奥 林林匹克金金金牌。全公司技术人人员超80%,开发和科研的比比例例大大约是2:8左右。
视频内容识别典型分析
2017年年上半年年度
前言言
像素的世界已经延伸到图像以外,虽然视频对于机器器学习研究人人员来说一一直都是个挑战,但 现在的技术能够使得从视频中提取信息变得跟从图像中提取信息一一样简单。人人工工智能这个新 兴“工工具”的出现,为人人类加速前往高高度智慧化形态提供能量量,重构着整个视频行行行业的结构和 协作方方式。 这份分析报告并非非针对人人工工智能领域全局观,解构视频行行行业,围绕国内视频内容识别这一一垂 直领域的创业公司展开讨论,从 市场、产品、技术、商业模式、人人才 等多个维度出发,浅 析人人工工智能技术在视频中的发展方方向,为大大家了了解整个行行行业趋势做一一点点贡献。
·奖项/榜单·
2015科博会优秀产品奖(中国国际科普产品展览会) 2016年年中国移动支支付年年会年年度创新应用用奖(⺠民邮电出版社、中 国中国通信学会普及教育工工作委员会主办)
入入选“中国最具投资价值企业50强” (清科集团主办的第十十四届 中国股权投资年年度论坛)
入入选《2016年年中国独⻆角兽企业发展报告》及“独⻆角兽”企业榜单 第17名(中国科技部火火炬中心心联合⻓长城企业战略略研究所发布) 目目前旷视的技术团队已经先后获得国际人人工工智能技术评测冠军10 余项,国际及国内信息学竞赛金金金牌70余项;
目目录
1
1. 2. 3. 4. 5.
人人工工智能概述
人人工工智能概述 计算机视觉发展 视频内容识别发展背景及现状分析 典型公司产品对比比 未来趋势预判
人人工工智能概述
从1956年年达特茅斯会议上人人工工智能的诞生生开始,到如今人人工工智能已经发展了了61年年,2017 年年能够 形成⻛风口口,却经历了了一一个快速又又曲折的转变,以云存储、大大数据为代表的技术革革命爆发,让深度 学习样本量量级得到一一个⻜飞跃算法得以施展,无无论是硬件还是软件的⻜飞速发展,都是为人人工工智能技 术的持续前进立立下不不少功劳。
目目录
3
1. 2. 3. 4. 5.
视频内容识别发展背景及现状分析
人人工工智能概述 计算机视觉发展 视频内容识别发展背景及现状分析 典型公司产品对比比 未来趋势预判
视频内容识别技术行行行业分布特点
技术要求及应用用分类 应用用详情
静态内容识别
搜索革革命(以图搜图/电商导购)
照片片管理理(标签分类检索/美颜特效)
数据样本 累积完成
存储技 术成熟
运算速度 大幅提升
算法瓶 颈突破
政策法 规推进
人人工工智能概述
下 一一 批 投 资 引 爆 点
智能 医疗
无人 驾驶
智能 安防
文娱 社交
阿
阿
阿
阿
人人工工智能已经在全球医疗影像方方 面面取得了了突破进展
传统⻋车厂厂在无无人人⻋车研发上领先 科技公司
智能安防成为人人工工智能产业化 第一一“着陆场”