2018年中国智能语音行业前景研究报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国智能语音行业前景研究报告
客服热线:400-666-1917
中商产业研究院
网站网址:/
前言
Introduction
数据显示,2017年中国智能语音市场规模达到105.7亿元,与2016年相比增长70%。
随着智能语音应用产业的拓展,市场需求增大,预计2018年中国智能语音市场规模将进一步增长,达到159.7亿元。
图片图片
前言
1.人工智能行业现状
目
录CONTENTS 1.3 人工智能行业市场分析
2.全球智能语音行业现状
2.1 行业发展历程
2.2 行业市场分析
3.中国智能语音行业现状
3.1 智能语音市场规模分析
3.2 智能语音市场占有率情况
2.3 智能语音市场占有率情况
1.1 人工智能行业产业链分析1.2 人工智能行业相关监管政策4.国内主要企业分析
4.1 科大讯飞
4.2 百度
4.3 苹果
4.4 腾讯4.5 搜狗
5.行业发展前景预测
01人工智能行业现状
人工智能行业产业链资料来源:中商产业研究院整理
目前,人工智能行业产业链明晰,其中包括基础技术支撑、人工智能技术及人工智能应用三个层次。
其中基础技术支撑由数据中心及运算平台构成;人工智能技术是基于基础层提供的存储资源和大数据,通过机器学习建模,开发面向不同领域的应用技术;人工智能应用主要为
人工智能与传统产业相结合实现不同场景的应用。
人工智能行业相关政策
随着人工智能的快速发展,国家相继出台一系列政策支持中国人工智能的发展,推动中国人工智能步入新阶段。
2017年7月20日,国务院印发了《新一代人工智能发展规划》。
规划中提到分三步走,第一步,到2020年人工智能总体技术和应用与世界先进水平同步,人工智能产业成为新的重要经济增长点,人工智能技术应用成为改善民生的新途径,有力支撑进入创新型国家行列和实现全面建成小康社会的奋斗目标。
第二步,到2025年人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为带动我国产业升级和经济转型的主要动力,智能社会建设取得积极进展。
第三步,到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心,智能经济、智能社会取得明显成效,为跻身创新型国家前列和经济强国奠定重要基础。
2017年12月,《促进新一代人工智能产业发展三年行动计划(2018-2020年)》的发布,它作为对7月发布的《新一代人工智能发展规划》的补充,详细规划了人工智能在未来三年的重点发展方向和目标,每个方向的目标都做了非常细致的量化,足以看出国家对人工智能产业化的重视。
中国人工智能市场分析
数据显示, 2017年中国人工智能投资事件数达到353次,与2016年的379次,下降了6.86%。
在投资金额方面,2017年投资金额为582亿元,与2016年相比增长65.34%。
2017年中国人工智能市场规模将达到152.1亿元,增长率达到51.2%。
随着人工智能技术的逐渐成熟,科技、制造业等业界巨头布局的深入,应用场景不断扩展,预计2018年中国人工智能市场规模有望突破200亿元大关,达到238.2亿元,增长率达到56.6%。
数据来源:中商产业研究院整理
02全球智能语音市场分析
智能语音行业发展历程1952年,第一个语音识
别系统Audry诞生技术萌芽阶段
(20世纪50-70年代)1984年,计算机第一次开口说
话。
1988 年,Sphinx 系统首个非
特定人、连续语音识别系统诞
生。
技术突破阶段
( 20 世纪 80 年代)产业化阶段(20世纪90年代至21世纪初)1997 年,Viavoice。
2002 年, EAR 项目。
2009年, Windows7集成语音功能00
快速应用阶段
( 2010 年以后)
苹果,2011 年Siri语音助手诞生
全国智能语音市场规模分析
随着人工智能产业的持续火热,
大量资本进入,在国际智能语音上诞
生了一批明星公司,据统计数据显示,
2017年全球智能语音市场规模达到
110.3亿美元,同比增长30%。
随着移
动互联网、智能家居、汽车、医疗、
教育等领域的应用带动智能语音产业
规模持续快速增长,预计2018年全球
智能语音市场规模将达到141.1亿美
元。
数据来源:中商产业研究院数据库
全球智能语音市场占有率情况
目前,在全球智能语音市场份额占
比情况中,Nuance全球市场占有率排名第
一,市占率达到31.6%;其次为谷歌,市
场占有率为28.4%;排名第三的是的苹果,
市占率为15.4%。
前三品牌市场份额占比
高达75.4%。
其后为微软以及科大讯飞分
别占有 8.1%以及 4.5%的市场份额。
值得
注意的是科大讯飞已经超越老牌计算机巨
头 IBM 位列全球第五。
数据来源:中商产业研究院数据局
03中国智能语音市场分析
中国智能语音市场规模分析
数据来源:中商产业研究院数据库
伴随着人工智能的快速发展,中国在智能语音技术的专利数量持续增长,通过庞大的用户群基础以及互联网系统优势明显,国内智能语音公司已经占据一席之地。
数据显示,2017年中国智能语音市场规模达到105.7亿元,与2016年相比增长70%。
随着智能语音应用产业的拓展,市场需求增大,预计2018年中国智能语音
市场规模将进一步增长,达到159.7亿元。
中国智能语音市场占有率情况
目前,中国智能语音市场的主要份额
被科大讯飞、百度以及苹果分割。
数据显示,目前为止,中国智能语音
市场,科大讯飞市场占有率排名第一,市占
率达到44.2%;其次为百度,市场占有率为
27.8%;排名第三的是的苹果,市占率为
6.9%。
其中,排名前三品牌在我国智能语音
市场占比近八成,为78.9%。
其后为Nuance以及小i机器人分别占有
均为3.0%的市场份额。
数据来源:中商产业研究院数据库
04国内主要企业分析
1.科大讯飞
科大讯飞股份有限公司,中国智能语音与人工智能产业领导者。
公司成立于1999年,在语音合成、语音识别、口语评测、语言翻译、声纹识别、人脸识别、自然语言处理等智能语音与人工智能核心技术上代表国际最高水平。
2008年在深圳证券交易所挂牌上市,股票代码:002230。
2018年第一季度财报数据显示,营业总收入达到13.98亿元,净利润为0.82亿元。
数据来源:中商产业研究院数据库
金融安防:基于深度信息进行目标检测、利用深度相机还原三维场景,获取多个目标的完整轨迹。
科大讯飞智能语音识别产品分析
科大讯飞推出的以语音交互技术为核心的人工智能
开放平台,讯飞开放平台。
科大讯飞智能语音识别主要分为语音听写、语音转写、实施语音转写、语音唤醒、声纹识别以及离线命令词识别,六种产品。
数据来源:中商产业研究院整理
金融安防:
基于深度信息进行目标检测、利用深度相机
还原三维场景,获取多个目标的完整轨迹。
序列
产品产品特点
1
语音听写
把语音(≤60秒)转换成对应的文字信息,让机器能够“听懂”人类语言,相当于给机器安装上“耳朵”,使其具备“能听”的功能
2语音转写
语音转写(Long Form ASR)基于深度全序列卷积神经网络,
将长段音频(5小时以内)数据转换成文本数据,为信息处理
和数据挖掘提供基础3
实施语音转写
实时语音转写(Real-time ASR)基于深度全序列卷积神经网
络框架,通过 WebSocket 协议,建立应用与语言转写核心引
擎的长连接,将音频流数据实时转换成文字流数据结果4
语音唤醒
设备(手机、玩具、家电等)在休眠或锁屏状态下也能检测到用户的声音(设定的语音指令,即唤醒词),让处于休眠状态下的设备直接进入到等待指令状态,开启语音交互第一步5声纹识别声纹识别(Voiceprint Recognize),是一项提取说话人声音特征和说话内容信息,自动核验说话人身份的技术
6
离线命令词识别
用户对设备(手机、玩具、家电等)说出操作指令(即“命令词”),设备即作出相应的反馈,开启语音交互
科大讯飞智能语音产品一览
2.百度
百度(纳斯达克:BIDU ),全球最大的中文搜索引擎、最大的中文网站。
2018年第一季度财报,百度一季度营收33.3亿美元,市场预期32.0亿美元。
百度第一季总营收猛增31%,33.3亿美元。
归属百度的净利润增至11亿美元,同比增长277%。
资料来源:公司官网、中商产业研究院整理
金融安防:基于深度信息进行目标检测、利用深度相机还原三维场景,获取多个目标的完整轨迹。
百度智能语音识别产品分析
百度语音识别,提供业界领先的技术,让您的应用长上耳朵。
支持车载导航、智能家居、社交聊天、应用助手、娱乐游戏等,助力企业实现多场景智能语音交互。
百度智能语音识别产品功能分为语音识别、长语音识别、远场语音识别、呼叫中心实时语音识别、呼叫中心音频文件转写五大功能。
资料来源:公司官网、中商产业研究院
金融安防:基于深度信息进行目标检测、利用深度相机还原三维场景,获取多个目标的完整轨迹。
序列产品功能介绍
1
语音识别
百度语音识别为开发者提供业界优质且免费的语音服务,通过场景识别优化,为车载导航,智能家居和社交聊天等行业提供语音解决方案,准确率达到90%以上,让您的应用绘
“声”绘色
2长语音识别
提供业界优质的长语音识别服务,在会议、教学或者媒体采
访中,百度长语音识别服务可快速准确的将长时间的语音转化为文字,方便进行拷贝和编辑等后续的工作,让您的工作、生活变得更便捷
3远场语音识别
百度语音为开发者提供业界优质的远场语音识别服务,通过麦克风阵列前端处理算法,有效消除噪音,同时对目标说话
人声音进行增强,使得智能家居、智能硬件、机器人语音交互等场景下的远场语音也可准确识别
4
呼叫中心实时语音
识别
企业可使用呼叫中心实时语音识别服务,将智能电销、智能
IVR、智能外呼、智能语音质检等场景的语音精准地转为文
字,提升企业效率并降低成本。
5
呼叫中心音频文件转写企业可使用呼叫中心音频文件转写服务,将电销业务、客服
业务、质检业务等多场景的语音精准地转为文字,提升企业
效率并降低成本。
同时也为企业呼叫中心提供智能化、标准
化服务,提升商务合作效率
百度智能语音识别产品一览
3.苹果公司
苹果公司(Apple Inc. )是美国一家高科技公司。
总部位于加利福尼亚州的库比蒂诺。
2017年苹果WWDC 开发者大会上,Siri 的更新当中,加入了实时翻译功能,支持英语、法语、德语等语言,未来将陆续进行支持,与此同时,Siri 的智能化还进一步得到提升,支持上下文的预测功能。
2018年第二季度财报,2018年二季度营收611亿美元,利润为138亿美元。
数据来源:中商产业研究院整理
金融安防:基于深度信息进行目标检测、利用深度相机还原三维场景,获取多个目标的完整轨迹。
苹果智能语音产品:Siri
Siri 是苹果公司在其产品iPhone4S ,iPad 3及以上版本手机和Mac 上应用的一项智能语音控制功能。
Siri 可以令iPhone4S 及以上手机(iPad 3以上平板)变身为一台智能化机器人,利用Siri 用户可以通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等。
2017年苹果WWDC 开发者大会上,Siri 的更新当中,加入了实时翻译功能,支持英语、法语、德语等语言。
数据来源:中商产业研究院
金融安防:基于深度信息进行目标检测、利用深度相机还原三维场景,获取多个目标的完整轨迹。
深圳市腾讯计算机系统有限公司成立于1998年11月 ,是中国最大的互联网综合服务提供商之一,也是中国服务用户最多的互联网企业之一。
2016年5月,腾讯上线智能语音服务;12月3日发布微信语音开放平台。
后者在垂直细分领域的识别率可达 90%以上。
2018年第一季度,腾讯实现营业收入735.28亿元,同比增长48%;净利润232.9亿元,同比增长65%。
数据来源:中商产业研究院数据库
金融安防:基于深度信息进行目标检测、利用深度相机还原三维场景,获取多个目标的完整轨迹。
智能语音服务AAI 由腾讯云携手微信智能团队联合推出,满足语音识别、语音合成、声纹识别等语音处理需求。
强大的垂直领域定制化服务,打造专业高效的语音大脑。
智能语音服务AAI的具备语音识别、语音合成、声纹识别以及云端+嵌入式四大功能。
资料来源:公司官网、中商产业研究院
序列
产品
功能介绍
1
语音识别
语音转文字,根据关键词列表搜索语音偏移量,情绪识别,静音监测;提供声学和语言模型定制化服务
2语音合成
将文本转成自然清晰的语音,多种音色选择,支持中文,英文,中英文混读等
3声纹识别
语音一对一识别;判断某段语音是若干人中的哪一个所说;声纹安全存储
4云端+嵌入式
云端服务可随需求弹性扩缩容,并提供持久化存储能力;嵌入式引擎满足无网络场景下智能语音需求
腾讯智能语音相关产品一览
2018 年第一季度财报。
搜狗作为上市后首个财年的开年成果,数据显示,第一季度营收达 2.48 亿美元,较去年同期增长 53%;净利润 1960 万美元,同比增长 56%,营收与利润均超 50%,超出此前预期。
3 月,搜狗发布了搭载业内最前沿机器翻译技术的智能硬件“旅行翻译宝”,具备离线翻译、拍照翻译、2
4 国语言互译等功能。
资料来源:中商产业研究院数据库
金融安防:基于深度信息进行目标检测、利用深度相机还原三维场景,获取多个目标的完整轨迹。
搜狗语音云平台
搜狗语音云平台提供业内领先的搜狗自有语音技术,目前已陆续推出在线的语音识别以及听歌识曲服务,并向开发者提供离线语音识别及离线语音合成服务, 而更多服务正在逐步集成中,力求进一步降低开发者使用语音的成本;
语音技术分为在线语音识别技术、离线语音识别技术、在线听歌识曲技术以及离线语音合成技术。
资料来源:公司官网、中商产业研究院整理
金融安防:基于深度信息进行目标检测、利用深度相机还原三维场景,
获取多个目标
的完整轨迹。
序列技术技术特点
1
在线语音识别技术通过机器将语音信号转变为相应的文本,搜狗语音
云提供的语音识别服务使用了高性能声学建模技术、
高效语言模型建模技术以及高速大规模网络动态解码技术
2
离线语音识别技术
语音识别无需联网、无需流量,方便快捷;语音识
别率业界领先;支持Android系统,便于集成;SDK
占用空间较小,耗费内存较少。
3
在线听歌识曲技术
只需录制提交音乐片段,由搜狗音乐云自动给出演
唱者和歌曲名称,用户可享受无上限的免费使用权;
云端海量曲库支持;快速、准确的听歌识曲功能。
4
离线语音合成技术离线语音合成则无需依赖网络即可在设备上合成出高音质的语音,其特点为高精度的多音字、变调处
理以及韵律层级预测;高性能的声学建模技术以及
高质量的合成器;支持Android和IOS系统,便于集
成;提供差异化sdk定制,最小不足5M,低运算、低功耗。
搜狗语音云平台技术一览
05行业发展前景预测
01
03
02
04
随着行业的快速发展,行业发展进入新阶段,监管力度持续提升。
未来促进行业规范发展以及维护市场秩序,出台多项重磅政策。
行业监管加强,行业规范化发展
随着智能语音技术的逐渐成熟,智能语音技术在口语教学、考试测评、模拟练习等环节能够代替现在很多老师的工作,大大降低人工成本。
以智能语音为突破口,人工智能可以将教育行业,教学、科研、考试、评估等教育各个环节。
技术切入教育行业核心业务
以芯片嵌入的形式,能够将智能语音更快速而广泛地应用到更多场景中。
芯片将麦克风阵列、远场语音识别等功能集成,形成完整的远场语音交互链条。
融入芯片加速规模化应用
智能音箱是语音交互式产品,语音交互技术直接影响用户体验,智能化与语音交互技术或将成为智能语音行业的核心竞争技术。
智能化与语音交互技术将成行业核心竞争技术
四大发展前景
公司介绍/版权声明
公司介绍:
中商产业研究院是中国领先的产业咨询服务机构,自成立以来,研究院专注于围绕构建“产业研究、产业规划、产业战略、产业投资、产业招商”等“五位一体”的产业咨询体系。
中商产业研究院以业内首家自建数据库“中商产业大数据库”为依托,行业覆盖传统重点行业和新兴热点领域。
如研究范围不仅涵盖文化体育、物流旅游、健康养老、生物医药、能源化工、装备制造、汽车电子等产业领域,还深入研究新制造、新能源、新材料、新消费、新金融、人工智能、“互
联网+”等新兴领域。
近二十余年来,中商产业研究院积累了一批长期合作的优质客户,主要包括国内外500强企业、各级地方政府、科研院所、金融投行等,逐步建立起稳固的市场地位。
未来,中商产业研究院将继续以前瞻性的战略视野和严谨的专业化服务,引
领中国产业咨询的创新发展。
以产业咨询力量助力中国经济变革创新,推动中国新时代的产业转型升级,使中国经济不
断跃升世界舞台!
版权说明:
本报告的所有图片、表格及文字内容的版权归中商产业研究院所有。
其中,部分文字及数据采集于公开信息,版权归属
原著作者所有。
中商产业研究院取得数据的途径来源于市场调查、公开资料和第三方采购。
未经过本公司授权许可不得
转载,如引用、刊发,需注明出处为“中商产业研究院”,且不得对本报告进行有悖原意的删减与修改。
违者将依法追
究其责任。