语音信号处理课程设计

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

武汉科技大学
语音信号处理系统
体验报告
专业：电子信息工程
班级： 1301 班
学号： 201304135050
姓名：揭璐璐
2016 年 5 月 15 日
一、系统名称：
语音合成应用系统：VoiceReader语音合成软件
二、系统基本情况：
VoiceReader使用了北京捷通华声语音技术公司灵云平台语音合成（TTS）技术能力，又称文语转换技术，能将任意文本信息实时转化为标准流畅的语音朗读，简单讲就是让“机器开口讲话”.TTS技术涉及声学、语言学、数字信号处理、计算机科学等多个学科技术，是语言信息处理领域的一项前沿技术。

通过TTS技术，计算机可以在任何时候将任意文本“轻松”转换成具有高自然度的语音，从而真正实现让机器“像人一样开口说话”。

VoiceReader 5.0.0默认支持中文、英文、粤语等语言；支持男声、女声、童声等多种音色。

将多种不常用、不适用的特效去除，仅保留最基本的音量、音高、语速进行调节等功能，使操作更加简单。

流程一目了然；还提供单次播放、循环播放等丰富的播放模式，并可自定义循环播放的间隔时间。

并且定制化后的VoiceReader 5.0.0不但提供阿拉伯语、法语、日语、韩语、俄语、西班牙语、泰语、葡萄牙语、德语、粤语、意大利语、印尼语、加拿大法语、土耳其语、荷语、希腊语、美式英语、墨西哥西班牙语等20种语言的语音合成，并有近50余种发音人可供选择。

三、体验步骤：
1.打开软件
2.在面板上输入或打开需要朗读的文本
3.设置，选择需要的语言，发音人，音量，音高和语速。

4.设置背景音乐，并设置背景音乐音量。

5.播放设置，设置循环播放模式和播放间隔，按下播放键开始播放。

按停止键停止。

最后通过合成文件按钮合成文件保存。

四、体验效果：
界面设计上用户体验度好，界面美观大方，迎合了用户的浏览习惯，吧重要的栏目位置和主要展现得的功能和信息放在显眼的位置，易于使用。

并且使用过程中操作便捷，效率高。

合成的语音准确，并且可供选择的语种和人声丰富，提高了体验的愉悦度。

但总有部分字会出现些许失真的情况，在数字，字母和汉字的变化过程中也会出现失真和语速突然变快的情况。

有些语调也不够圆滑，总会有一种机器语的感觉。

除此之外，体验效果很好，了解了语音合成应用系统的大致的功能，获益匪浅。

五、体会：
本次语音信号处理课程老师布置了语种识别应用系统，语音合成应用系统，语音情感信息处理应用系统等六个选题，我选择的是进行体验语音合成应用系统。

在体验前，虽然在课上我们学习了所有的理论知识，但在实际操作开始前依旧有一些踌躇和担忧，由于自己对寓意合成系统的了解不够深，使自己一开始有点无从下手。

在一番心理建设后，我决定从了解基础知识下手，通过查阅资料和上网搜索我了解到语音合成是利用电子计算机和一些专门装置模拟人，制造语音的技术。

并了解到到了TTS语音合成技术是实现人机语音通信关键技术之一。

使电脑具有类似于人一样的说话能力，是当今时代信息产业的重要竞争市场。

和语音识别ASR相比，语音合成的技术相对说来要成熟一些，是应用范围较广的技术。

通过这一系列的了解我对语音合成
应用系统有了大致的了解，从而着手开始进行体验。

在搜索实际的应用系统的过程中我发现这样的系统功能多样，有许多的选择，最后决定选择体验voicereader这一软件。

由于他是中文软件使用过程中容易上手，功能多样语言的选择也十分丰富，并且最后可以合成一个音频文件以供使用。

是非常人性化的功能之一。

通过本次实验我再一次体会到光学会课本上的知识是远远不够的。

我们要学会如何将理论知识应用到实践中，多动手，多动脑，这样才能做到更加牢固的掌握知识，总而言之，这一次体验，我收获颇多，是一次十分有意义的体验。

（注：可编辑下载，若有不当之处，请指正，谢谢!）。