搭建属于自己的机器翻译系统
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
搭建属于自己的机器翻译系统——MTI专业“技术小白”走进小牛翻译开源社区的心得
搭建属于自己的机器翻译系统
——MTI专业“技术小白”走进小牛翻译开源社区的心得首先,自我介绍一下。我是一个MTI(翻译硕士)专业、没有计算机编程背景、没有机器翻译理论基础的菜鸟,任职于一家网络科技公司的市场部门,之前的工作中需要做些翻译工作,有时候求助百度翻译、有道翻译等免费的机器翻译系统来解决问题,但是对于一些涉及我们商业机密的数据,由于担心泄密,只能借助于有道词典查查词,然后再自己形成翻译结果。很早之前我就想,要是能有自己的机器翻译系统就好了。
我心目中的翻译技术大牛、对外经贸大学的崔启亮老师曾在微博中给MTI的学生提建议,“学好翻译技术,有前途。对于仍在迷茫MTI的同学,我建议学机器翻译设计与开发,走出迷茫。”非常非常幸运的是,我一个东大毕业的同学告诉我,东北大学自然语言处理实验室(国内搞机器翻译最好的团队之一)联合沈阳雅译网络技术有限公司推出了“小牛翻译开源社区”,社区中有一项内容,就是教不懂机器翻译的人学习“快速搭建自己的机器翻译系统”。于是,我走进社区,按照社区里的相关说明,亲身体验了搭建过程。下面,我想谈谈这个被誉为“目前国内首个以机器翻译为核心的交流平台”的菜鸟级用户体验。
小牛翻译开源社区里提供了统计机器翻译开源系统的全部代码。我了解了一下,NiuTrans开源系统在国际上比较有名,据说是目前国际上能够支持统计机器翻译模型最全的两套统计机器翻译系统之一(另一套是爱丁堡大学的Moses)。这些内容对MT(机器翻译)的专业学者应该很有用吧,但是对于我这个非科班出身的人来说,其实会完全忽略这部分内容。我还是讲讲我在社区里的真正收获——快速搭建实用的机器翻译系统。
一、搭建过程详细说明
需要说明的是,我是在在网页指导与人工指导下才在自己的电脑(Windows7 64位系统,硬盘500G,内存8G)上成功搭建机器翻译系统的。解释一下为什么我不仅看了网页上操作指导,还需要人工指导。身为“技术小白”的我,虽然网页上的操作指导写的很规范,但是第一次接触这么“高大上”的东西,还是有点小紧张的。于是,我加入了小牛翻
译开源社区的QQ群(群号群主很热心的帮我讲解,在服务方面我的用户体验很好。下面我就与大家分享我如何一步步完成在自己电脑上搭建机器翻译系统的。
第一步,进入“小牛翻译开源社区”网站(),接着进入“搭建MT系统”界面。如图:
第二步,根据自己电脑的操作系统(Windows系统还是Linux系统),选择合
适的“NiuTrans Server工具包”(之所以叫NiuTrans Server,据说是因为这个工具包是针对单服务器的,或者说,这个工具包还不能用于搭建机器翻译云平台)。小牛翻译开源社区的群主告诉我,目前正式运行的机器翻译系统,都是在Linux操作系统下安装的,但Linux系统下没有图形界面,需要用户稍微懂一些代码。为了方便像我这样的用户,他们很贴心地研发出Windows系统下如何搭建机器翻译系统的方法(此处值得为他们点赞哦)。
第三步,点击“Windows版搭建教程,下载“NiuTrans Server工具包”。根据语言方向和电脑内存的大小,社区里提供了四个工具包。由于我的电脑内存总共只有8G,所以选择的是“中译英Windows4G版”。点击下载即可。
第四步,安装perl。我是在人工指导下完成的,一共需要四步操作才能完成。首先,点击上面网页中“运行环境准备”项中的“Perl下载地址”。如下图:
Step 1、进入“Perl-download”页面,点击“Windows”图标。
Step 2、点击页面中“DOWNLOAD ACTIVEPERL”,即页面上Windows下右面第一个图标。大家可以看一下左侧的英文说明,除了64位操作系统,32位操作系统也可以支持的。
Step 3、在新的页面中,点击“Download ActivePerl 5.22.1 forWindows (64-bit,x64)”(我的电脑是64位系统)。
Step 4、在新的页面中,会自动弹出一个下载框。经过以上操作就可以成功下载Perl。
第五步,做了以上准备工作后,接下来进入搭建步骤。搭建共分两步,
Step 2、启动机器翻译系统。点击上图文件夹中“service”文件夹,进入文件夹内,找到“(BAT脚本文件)”,双击该文件即实现启动机器翻译系统。如图:
第六步,搭建操作全部完成后,页面会出现下列提示即代表启动成功。下图是社区指导步骤中给的样图。其实操作者只要看最后一句“Server startup
in ?XXX ms”即可,代表专属于你的机器翻译系统已经搭建成功,此处特别提醒,该页面不可以关闭,要想运行机器翻译系统,要保持着该页面一直打开状态。
第七步,将该“:1517/niutrans/”网址粘贴到浏览器中,即可弹出如下图页面:
然后嘛,就可以开始使用机器翻译系统了!
以上就完成在自己电脑中搭建机器翻译系统的全过程。在“指导搭建机器翻译系统”页面中还介绍了很多小牛翻译系统的其他功能。如翻译API功能、利用自有数据训练翻译模型等,经过好一顿的研究,被社区群主告知这些功能都是为机器翻译专业人士准备的,不懂程序的人无法直接使用。特此提醒其他使用者,完成我上述七步操作,专属于你的机器翻译系统就搭建成功了,其他的小牛翻译系统各种功能就只能根据使用者自身的能力来选择使用了。
二、对小牛开源社区的建议
社区内搭建机器翻译系统的方法实现起来真的很便捷,但是对搭建过程中的某些技术指导表述不够清晰,建议以下部分应该有改进。
1)安装perl环节应该添加详细介绍。在上一部分我的搭建过程中,我详细了介绍了安装perl的步骤。安装perl的网页是全英文版,由于我是翻译硕士所以我读起来较轻松,但是对于英语水平不太高的使用者,阅读起来会比较困难,这会导致此部分的操作有一定难度。希望社区开发者会进一步详细介绍一下如何选择各个步骤的下载选项。