利用深层神经网络人工智能(AI)训练技术翻译文本
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用深层神经网络人工智能(AI)训练技术翻译文本
微软研究人员在3月14日发表博客文章称,在利用深层神经网络人工智能(AI)训练技术翻译文本方面取得了进展。他们发明了第一台机器翻译系统,可以将中文新闻的句子翻译成英文,准确率与人类不相上下。系统在一套常用的新闻报道测试集上实现了达到了人类水平,测试集名为newstest2017。
在前几期的文章里,我们介绍了神经网络和深度学习的相关内容,微软的这套翻译系统就是使用深层神经网络,帮助生成更真实、更准确的翻译。它还采用了多种不同的人工智能训练方法,包括双重学习、商议网络和联合训练,试图模仿人类的学习方式。
机器翻译
机器翻译系统是支持翻译大量文本的应用程序或在线服务,将文本从“源”语言译成另一种"目标"语言的过程。
自从2010年代早期,新的人工智能技术- 深度神经网络(又称深度学习),已经达到较高的精准度,微软翻译团队将语音识别结合其核心文本翻译技术,推出新的语音翻译技术。虽然机器翻译技术和接口技术的概念相对简单,但它背后的科技集成却是极其复杂的,集成了多项尖端技术,特别是深度学习(人工智能)、大数据、语言学、云计算和web API。
从历史上看,曾经主流的机器学习技术在行业中应用是统计机器翻译(SMT)。SMT 使用先进的统计分析,从一句话中上下文的几个词中来估计最佳可能的翻译。SMT自20 世纪中期以来的为所有主要翻译服务提供商所使用,其中包括微软。
基于深度神经网络(NN) 的翻译技术的出现,带动了机器翻译技术的突变,显著提高了翻译质量。这种新的翻译技术在2016年的下半年开始大规模部署使用。
这两种技术共同之处有两个方面︰
两者都需要大量的人工翻译的数据(高达数百万的人工翻译过的句子)用于培训翻译系统。既不作为双语词典,也不是基于翻译列表,是根据词在句子中使用的上下文来翻译。