科大讯飞:从语音到AI的前行之路
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
科大讯飞:从语音到AI的前行之路
作者:淦凌云卫萌
来源:《中国工业和信息化》2019年第04期
从智能语音技术开始,再到人工智能技术,科大讯飞在技术领域的不断摸索中总结出了自己的路径。遵循着市场需求的导向,以产业应用为目标,科大讯飞正深入教育、医疗、政法、智慧城市、消费者、客服、汽车等多个关系社会民生福祉的行业,不断用人工智能为行业赋能。
2017年,国家出台《新一代人工智能发展规划》,首次将人工智能上升为国家战略,2018年,习近平总书记在主持中共中央政治局第九次集体学习时强调,人工智能是引领新一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应,加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源。如今在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术的驱动下,在国家政策的支持下,科大讯飞的人工智能技术与应用正在迎来价值的兑现。从智能语音技术起步,开发智能语音平台,建立中文语音交互技术标准,科大讯飞在人工智能领域逐渐成为领军者,而伴随着消费端产品持续输出,讯飞输入法、讯飞翻译机等则让越来越多人看到了中国科技企业在人工智能领域的跃进。
深度学习贯穿研发始终
上世纪90年代末,国内语音市场一片混沌,国外IBM、微软和摩托罗拉等国际巨头大兵压境、虎视眈眈觊觎市场。以刘庆峰为首的一群中国科学技术大学学生立志“技术报国”,要让“中文语音技术由中国人做到最好,中文语音产业掌握在中国人自己手中”。在导师王仁华教授的全力支持之下,科大讯飞正式成立。
回顾科大讯飞的智能语音技术研究之路,深度学习一直贯穿其中。2010年开始,中国开始进行深度神经网络(DNN)语音识别研究,科大讯飞也参与其中,并随后推出了当时在业界首个基于深度学习框架的商用中文语音识别系统。此后,为了克服语音识别系统在实验室环境准确率高、但实际场景应用准确率大大下降的问题,研发团队以1年半左右的周期持续更迭新的技术框架,勇于“革自己的命”。由于循环神经网络(RNN)开始逐渐替代传统的深度神经网络(DNN)成为主流的语音识别建模方案,2015年,全新的循环神经网络(DNN)语音识别系统全面升级。2016年,在提出前馈型序列记忆网络(FSMN)新框架后,科大讯飞结合经验再次创新性研发出深度全序列卷积神经网络(DFCNN)。在技术的不断迭代优化之下,讯飞语音识别核心效果保持每年30%的相对提升,保证了目前讯飞输入法场景识别率达到98%以上。
从智能语音技术开始,再到人工智能技术,科大讯飞在技术领域的不断摸索中总结出了自己的路径,在人工智能三个阶段中沉淀与前行:运算智能、感知智能、认知智能。
运算智能指的是机器“能存会算”,在这一阶段,机器已经远超人类了。感知智能就是让机器“能听会说”。机器想要听清人说的话,依靠的是语音识别技术。从2008年起,科大讯飞连续在国际说话人、语种识别评测大赛中名列前茅;而机器开口说话,需要的是语音合成技术,中文合成音在业界也是全世界唯一超过普通人说话水平的系统。认知智能就是让机器“能理解会思考”,认知智能也是人类所独有的,能够理解语言、进行知识表达和逻辑推理。认知智能对于机器来说,是人工智能发展的高级阶段,也是一个难点与重点。科大讯飞从2014年起就启动了“讯飞超脑”计划,专注认知智能领域的研究。
图像识别也是近年来人工智能的热门研究方向,科大讯飞虽以语音起家,但在技术方面的深度积累与互通有无的延展精神,也在计算机视觉领域收获了不俗的成果。
感知智能与认知智能紧密结合,是在实际应用中经常遇到的情况。在两方面结合的领域中,公司技术研发团队在不同領域中寻找可相互借鉴的地方,彼此成就。通过语音识别和语义理解在底层的深入融合,在语音交互上,目前已经研制完成可量产的支持远场识别、全双工、多轮交互、方言识别等特性的软硬件一体化的AIUI产品方案,显著提升了人机语音交互的成功率和人机交互开发的便捷性,已经成功在智能音箱、智能电视、智能汽车、智能家居、智能机器人等领域实现广泛的前瞻引领和规模化应用落地。在机器翻译领域,同样得益于深度学习,讯飞在多次国际机器翻译大赛中取得优异成绩。
凭借在感知智能领域的不俗实力与在认知智能领域的探索成绩,2017年,科大讯飞正式被认定承建我国首个认知智能国家重点实验室,这也是我国在认知智能领域的第一个国家级重点实验室。
保持源头核心技术的创新与领先一直是科大讯飞的立身之本,也是公司向前迈进不竭的动力源泉。技术的持续突破离不开国家政策的大力支持,对创新发自内心的热爱和敢于对研发持续大投入的魄力也缺一不可。科大讯飞董事长刘庆峰曾对员工说过:“在创业之初我们从未想过有一天语音合成效果可以做得比普通人声更好;也没想过语音识别、转写文字会超过人工记录员输入的准确率,还能实时翻译出来;更没有想过机器人能够第一个通过国家医师执业资格综合评测笔试。正是源于初心的热爱、基因里对创新的追求,还有用技术创新改变世界那种不可遏制的热情与冲劲,讯飞人才能做到这些。”在人工智能产业爆发的关键窗口期,科大讯飞也坚定不移加大人工智能技术和应用的投入力度,连续5年保持研发投入超过销售收入的20%。
源头核心技术的创新不仅要关注应用的“小波浪”——穿戴式设备、APP等,更要关注技术创新的“大波浪”——源头技术、创新算法、配套芯片等。任何时候,国家或行业发展都必须坚持“大波浪”和“小波浪”共同推进的原则。未来人工智能的突破将聚焦三个方向:一是算法突破,面对小样本、无监督、个性化问题的基础理论将持续突破;二是脑智同飞,脑科学研究和数学统计建模方法深度结合;三是人机耦合,人工智能系统和人类行为协作的人机耦合方式持续探索。在这三个方向的引领下,科大讯飞也正付诸实际行动,通过与相关高校、科研院所等长期的合作研究,力争在未来有突破的关键技术领域共同迈进。
遵循市场需求导向为产业赋能
当我们回看2016年行业对于人工智能的讨论,再对比2019年的当下,就可以发现这样的趋势——2016年人工智能相关话题还仅局限于“人工智能技术”的本体,而当时间的长河来到2019年,对于人工智能的讨论已经跨越到了人工智能技术在社会和生活中的应用。作为领先一步手握人工智能大门钥匙、提前布局扣住未来人工智能技术命脉的科大讯飞,要如何面对万物互联时代人工智能技术的全新趋势?如何探索认知智能规模应用下人工智能技术应用的布局与落地?
从自身而言,在“顶天立地”的理念下,遵循着市场需求的导向,以产业应用为目标,科大讯飞正深入教育、医疗、政法、智慧城市、消费者、客服、汽车等多个关系社会民生福祉的行业,不断用人工智能为行业赋能。
在教育领域,智慧教育产品利用自动评测和知识图谱技术,对学生课堂练习、课后作业和考试数据自动分析,为每个孩子提供各不相同的个性化作业,大幅减少无效重复训练,将“因材施教”的教育理念落到了实处。2018年科大讯飞已经为全国1000多所学校近200万高中和初中学生提供常态化个性化作业,使学生日平均每天作业时长比之前缩短了50分钟,有效提升了学生学习成绩和学习兴趣,安徽省从今年开始将建设1000所左右的智慧学校。