2018中国智能语音助手研究报告
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
智能语音技术及其发展
语音识别、声纹识别、语音合成等
人类因为具有语言的能力而区别于其他物种,智能语音技术即研究人与计算机直接以自然语言的方式进行有效的沟通的各 种理论和方法,涉及机器翻译、阅读理解、对话问答等,因为语言在词法、句法、语义等不同层面的不确定性及数据资源 的有限性、背景知识的复杂性等各方面限制,智能语音技术仍有非常大的提升空间,仅在特定领域可取得较好的应用,鲁 棒性存在大量挑战。在自然语言处理之前,声纹识别可根据说话人的声纹特征识别出说话人,语音识别技术可赋予机器感 知能力(在深度学习的驱动下,目前近场语音识别准确率可达98%,远场、抗噪、多人等非限定或配合条件下的识别有待 改进),将声音转为文字供机器处理,在机器生成语言之后,语音合成技术可将语言转化为声音,形成完整的自然人机语 音交互,这样的语音交互系统可看作一个虚拟对话机器人,具体流程如下。
人工智能
狭义移动营销 义 (广 计 广 移 算 动动 ) 移 销机 告 营 视觉 智能语音
机器学习
ASR
TTS
NLP
中国智能语音助手行业发展背景
1
中国智能语音助手用户研究
2
咪咕灵犀案例分析
3
人工智能行业发展现状
语音识别、计算机视觉领域取得重大进展
在20世纪50年代到70年代初,人工智能的研究尚处于“推理期”,人们认为如果赋予机器逻辑推理能力,机器就能具有 智能。到了20世纪70年代,人们意识到人类之所以能够判断、决策,除了推理能力之外,还需要具备一定的知识。发展到 20世纪80年代,机器学习真正成为一个独立的学科领域,相关技术层出不穷。2010年后,“人工智能”相继在语音识别、 计算机视觉领域取得重大进展,围绕语音、图像等人工智能技术的创业大量涌现。
知识期
总结人类知识 教授给计算机系统
Hinton发表深 度学习的 Nature文章
Alph 胜人类 棋选手
人工智能分类
虚拟语音助手是人工智能的重要应用领域
计算机视觉、智能语音和机器学习是人工智能的三大核心基础技术,目前研发出的人工智能应用大多是这三种技术综合运 用的结果,只是其中的主次之分不同。依据核心基础技术类目,可以将人工智能分为两大类,即感官智能和决策智能,其 中视觉智能、语音智能和深度学习智能是感官智能和决策智能下的三大子赛道。目前,语音智能的一个重要行业应用就是 虚拟助手,即“智能语音助手”。它的核心在于人类通过纯语音信息实现与机器的交互,让智能机器“助手”帮忙完成指 派的任务。
该份案例报告通过对智能语音行业的市场动态、趋势,智能语音助手用户的行为习 惯和需求以及典型企业案例进行分析,希望为行业发展提供参考。
概念定义
人工智能,英文全称为“Artificial Intelligence”(AI),是计算机科学领域的一个分支,包涵研究、开发用于模拟、延 伸和扩展人的智能的理论、方法、技术及应用系统等。人工智能企图通过模拟人类的思考反应方式,生产出具有与人类相 似思考反应能力的机器,核心的三大基础技术是计算机视觉、智能语音和机器学习。 其中,智能语音技术目的在于实现人机语言的通信,使人与机器之间能够通过纯语音进行交互,包括语音识别(ASR)、 语音合成(TTS)和自然语言处理(NLP)三项主要技术。
智能语音助手行业现状
互联网巨头纷纷进入布局
从2010年开始,互联网巨头们纷纷通过自主研发或并购/参股的方式开始探索智能语音产业,其中,智能语音虚拟助手成 为重点布局对象,此外,为占据一定的市场先机,苹果、谷歌、微软、亚马逊、百度、腾讯、搜狗等巨头们也陆续开始在 智能车载、智能家居、智能医疗、可穿戴设备等诸多细分市场寻求突破。
推理期
将逻辑推理能力 赋予计算机系统
人工智能行业发展历程
机器学习期
深度学习在语音及 图像领域大获成功
DENDRAL—世界上 第一例成功的专家 系统诞生 早期的系统适用 于更宽的选择和 更难的问题时效 果并不理想
第五代计算机项目由 于技术路线明显背离 计算机工业的发展方 向而宣告失败
2006
2012
1956
广义移动营销
智能语音交互系统的技术流程
1
对话输入
2
ASR 语音识别
3
NLU 语音理解
4
DST 对话状态维护
8
对话输出
7
语音
TTS 语音合成
6
NLG 语音生成
NLP
5
Policy 动作候选排序
智能语音产业图谱
四大板块协同作业
智能语音产业链分为基础研究机构、语义数据提供商、语音技术提供商及智能语音应用提供商四大板块。 其中,基础研究机构包括语音合成、语音识别、声纹识别等基础技术的研发和技术输出;语义数据提供商为算法研究和技 术输出机构提供语音、语义数据库及定制化的数据采集和处理;语音技术提供商将基础技术转化为软件或行业整体解决方 案,提供嵌入式或平台是的语音软件服务、行业智能语音系统整体解决方案;智能语音应用提供商则有智能移动设备、智 能车载设备、智能家居等智能终端厂商,以及输入娱乐等各类APP或软件客户端等。
1963
2014
1942
1968
莱斯利提出 概率近似正 确模型
1992
达特茅斯会议诞 生了“人工智能 科学” 自动定理证明系统 完成数学原理第二 章的证明 美国科幻巨匠阿西 莫夫提出“机器人 三定律”
1970
1984
2016 CNN超第二名十 个百分点夺冠 ImageNewenku.baidu.com 港中文实验室DeepID 算法首次超过人眼识 别人脸率
2018中国智能语音助手研究报告
摘要
近年来,人工智能发展迅速,也得到越来越多的关注。其中,语音类人工智能中的 重要行业应用“智能语音助手”也成为了人工智能的一个主要应用领域。目前行业 里的智能语音助手通常应用于消费级产品和专业级行业应用两大领域。
智能语音助手用户多分布在经济发达地区,开始尝试使用智能语音助手的最主要原 因是想通过语音操控从而解放双手,并且智能语音助手对语音语义识别的准确性也 成为了用户选择及使用时最重要的考量因素。
人工智能行业分类
感官智能
决策智能
视觉类
计算机视觉 目前主要应用于辅助驾驶、 图像/视频编辑、图片识别、 人脸识别、文字识别、视频 监控、工业视觉检测、三维 视觉、医疗影像诊断等。
语音类
智能语音 目前主要应用于智能家居、 虚拟助手、可穿戴设备、智 能车载、智能医疗、陪伴机 器人等。
深度学习类
机器学习 目前主要应用于精准营销、 风险预估、健康监测、优化 运营、AlphaGo等。