人工语音合成处理系统简要说明
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人工语音合成处理系统
V1.0
目录
1引言 (3)
1.1背景 (3)
1.2系统特点 (3)
2系统硬件设计 (4)
2.1总体硬件设计 (4)
2.2蜂鸣器设计 (4)
2.3整体硬件设计电路图 (7)
3系统软件设计 (7)
3.1软件设计构成 (7)
3.2软件设计流程 (8)
4系统应用介绍 (9)
5参考书籍 (11)
1引言
1.1背景
现今社会人们依靠各种机电系统和计算机系统从事劳动生产、工业控制和科学研究。当人们操纵这些系统的时候,就自然地出现了人与系统的信息交流,即系统不断的报告自己的运行状态和结果,而人们根据这些状态和结果发出下一步应进入何种状态的命令。长期以来,计算机与人之间的信息交流主要依靠各种形式的键盘,按键等实现的,计算机要报告运行状态,结果只能通过各种显示装置。
语音合成技术是实现人机语音通信,建立一个有听说能力的口语系统所必需的关键技术之一。随着计算机运算速度的提高,人工智能领域的研究获得了飞速发展,而人工智能领域的最新研究成果不断地向语音研究渗透,促使语音处理技术及语音合成的研究也产生了突破性的飞跃。和语音识别相比,语音合成技术相对要成熟一些,是该领域中近期最有希望产生突破并形成产业化的一项技术。
人工语音合成处理系统V1.0(简称语音合成系统)由软件实现词汇语音合成器,使人们能够甩掉键盘,通过语言命令进行操作。系统在完成其它任务的同时具备语音输出功能,可使单片机系统成本下降,体积减小,可靠性提高。它对于解脱繁琐的事物性和危险性工作更具有现实意义!
1.2系统特点
提高合成语音的自然度
就汉语语音合成来说,目前在单字和词组一级上,合成语音的可懂度和自然度已基本解决,但是到句子乃至篇章一级时其自然度问题就比较大。基于语音数据库的语音合成方法进一步提高语音合成的自然度。因为这是一种采用自然语音波形直接拼接的方法,进行拼接的语音单元是从一个预先录下的自然语音数据库中挑选出来的,因此有可能最大限度地保留语音的自然度。
丰富合成语音的表现力
目前国内外大多数语音合成是针对文语转换系统,且只能解决以某种朗读风格将书面语言转换成口语输出,缺乏不同年龄、性别特征及语气、语速的表现,更不用说赋予个人的感情色彩。本系统对入机交互提出了更高的要求,即语音合成已开始从文字到语音的转换阶段向概念到语音的转换阶段发展。
在嵌入式系统中应用语音合成技术
在提高合成语音的质量和增强语音合成的表现力以外,在其他实用化方面也有加以改进的地方。目前高质量的汉语文语转换系统~般需要几兆字节到几十兆,甚至几百兆字节的存储容量,这在以PC机或工作站为硬件平台的应用中是没
有问题的,而对于像一些资源有限的基于嵌入式系统的设备如PDA、无线通信手机以及商务通等上就没法承受。解决的方法可以是通过语音压缩编码的方法来压缩音库所需的容量,或者采用更小的合成基元,例如用声母、韵母或双音素、半音节,以及裁减合成语音所需的音节基元个数等等。同时优化算法,降低算法的复杂度,保证合成质量的前提下,裁减音库与算法达到平衡。
2系统硬件设计
2.1总体硬件设计
语音合成系统以语音合成部分作为主电路,在单片机89C51CPU管理下,编程并通过串行口编程进行通信,产生不同定时来准确地控制乐曲节奏,也可采用EPROM芯片固化语音,保证断电后补丢失信息,最终实现蜂鸣器语音合成的过程。
2.2蜂鸣器设计
在本系统中,除了显示器件外经常用到发生器件,最重要的发声器件就是蜂鸣器。蜂鸣器一般用于一些要求不高的声音报警及发出按键操作提示音等。虽然蜂鸣器也有自己固有的频率,但是也可以对其施加不同频率的方波,使之发出对应的声音。
因为蜂鸣器是感性负载,一般不建议用单片机的I/O口直接对其进行操作,最好是加一只驱动三极管。在要求较高的场合,还要加上一只反相保护二极管。蜂鸣器最重要的特点是只要按照极性要求加上合适的直流电压就可以发出固有频率的声音,使用起来比扬声器简单。其芯片结构如下:
芯片结果详细说明如下:
电源引脚Vcc和Vss :
Vcc(40脚):电源端,为+5V。
Vss(20脚):接地端。
外接晶体引脚XTAL1和XTAL2:
XTAL2(18脚):接外部晶体和微调电容的一端。在89C51片内塔式振荡
反相放大器的输出端,振荡电路的频率就是晶体的固有频率。若须采用
外部时钟电路,则该引脚悬空。要检查89C51的振荡电路是否正常工作,
可用示波器查看XTAL2端是否有脉冲信号输出。XTAL1(19脚):接外
部晶体和微调电容的另一端,在片内,他是振荡电路反相放大器的输入
端。在采用外部时钟时,该引脚输入外部时钟脉冲。
控制信号引脚RST,ALE,PSEN和EA
RST(9脚):RST是复位信号输入端,高电平有效。当次输入端保持两
个机器周期的高电平时,就可以完成复位操作。
ALE/PROG:地址锁存允许信号端。当89C51上电正常工作后,ALE
引脚不断向外输出正脉冲信号,此频率为振荡器频率的1/6。CPU访问
片外存储器时,ALE输出信号作为锁存低8位地址的控制信号。
平时不访问片外存储器时,ALE端也以振荡频率的1/6固定输出正脉冲,
因而ALE信号可以用作对外输出时钟或定时信号。如果想确认89C51芯
片的好坏,可用示波器查看ALE端是否有脉冲信号输出。若有脉冲信
号输出,则89C51基本是好的。
ALE端的负载驱动能力为8个LS型TTL负载。
次引脚的第二功能PROG对片内带有4KB FlashROM的89C51编程写