论数字化语音存储回放系统设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
论数字化语音存储回放系统设计
摘要:近年来,随着科学技术水平的不断提高,各种高科技产品逐渐走进了人们的生活。数字化语音处理技术作为高科技应用领域当中的一个热点,其从理论到相关产品现已基本趋于完善。它与医疗卫生机构以及福利事业的生活支援系统有着十分密切的联系,并且极有可能成为下一代操作系统的用户界面。基于此点,本文就数字化语音存储回放系统的设计进行研究。
关键词:数字化单片机语音存储回放系统设计
1 数字化语音存储回放系统的基本原理
1.1 语音信号采集
通常情况下,人能够听到的声音频率范围为大于20 Hz、小于20000 Hz的信号,通常情况下的语音信号频率最高能达到3400 Hz。所谓语音信号采集是指将通过麦克风和高频放大器的语音声波信息,转换为模拟量电信号,最后转变成数字量的过程。要想确保采集信号不存在失真现象,采样频率要为模拟信号最高频率的2倍以上,即最低频率为6800 Hz,在考虑语言质量的前提下,应当将采样频率确定为8000 Hz。
1.2 语音压缩
待录制信号在输入到系统中后,先被分配到各自的预放大器,直到
放大到合适的电平后,转移到信号混合单元将信号进行混合,形成一路完整的信号,并交由低通滤波器将高频滤去,将处理后的语音送至A/D 转换器实施模数转换,将其变为频率为8 kHz的语音信号,形成特定的串行比特流,利用串行的方式将语音信号送至语音压缩单位。利用语言压缩单元20 ms为一帧的速率对语音信号实施40∶1的高倍压缩,最终生成2.4 kb/s的压缩语音,由此完成语音压缩流程。
1.3 语音生成原理
一般情况下,由于可将语音生成过程看作是语音采集过程的反向过程,所以掌握语音生成过程能够实现回放语音信号的功能。值得注意的是,语音生成过程并不是原原本本地将语音信息进行恢复,而是对原来语音可重组、可控制的地方进行实时恢复。在播放语音时,单片机要先读出储存在数据存储器中的语音数据,利用数字音量调整单元将语音信号调整到适合的电平,而后用解压缩单元将其还原成12位串行音频比特流。下一步利用D/A转换器将数字音频信号转换为模拟音频信号,并将其送至开关电容低通滤波器,使模拟音频信号的高频噪音得以滤除,最后经音频放大、功率放大,使语音从扬声器中发出,从而完成语音回放过程。
2 数字化语音存储回放系统的具体设计方法
2.1 设计方案的确定
(1)系统总体设计。通过技术性以及经济性等多方面综合考虑,最终决定选用单片机来完成人机交互和声音信号的采集、编解码等功能。选用单片机的主要原因是其具有诸多优点,如丰富的接口资源、电路结构简洁明了、可实现较为复杂的控制与运算、便于调试等等。
(2)语音信号的设计方案。经过综合考虑后,决定采用前置同相放大器,这样设计的原因是通过放大器前置能够使功效的增益变为连续可调,同时还进一步确保了比较器的精度。本系统的前置放大器采用的是同相宽带放大器,这种放大器具有频带宽、漂移低、支持满幅度运放、增益可调等优点,而且采用这种放大器还有助于实现输入电阻较大的设计要求。
(3)谐波器设计方案。为了进一步避免高、低频信号产生干扰,并增强信噪比,决定选择带通滤波器。由于系统本身的输出波形频率具有覆盖范围较大的特点,为保证整个频率覆盖范围之内的滤波效果达到最为理想的状况,并防止语音信号失真,最终决定采用4+5阶巴特沃兹滤波器,该滤波器可以实现最大平坦的频率响应。
(4)功率放大器的设计方案。本系统采用的是LM386音频功率放大器,选择该音频放大器的原因是其外接的元器件相对较少,并且电压增益可调、功率大、电路简单。
2.2 语音编码技术
目前,较为常见的语音编码主要有以下三类:参数编码、波形编码
以及混合编码。
(1)参数编码。其又被称之为声码器技术。语音本身属于短时间平稳状况,只有在非常短的时间内,才能够认为声音模型的基本特征是近似的,因而,模型特征参数在更新方面的频率相对较低,这样一来使得编码比特率大幅度降低。该编码最显著的特点是速率快,最高可达2.4 kbps以下,但其缺点是合成后的语音音质相对较差,尤其是自然度较低,对语音环境当中的噪音十分敏感,必须在较为安静的环境当中才能获得较高的可懂度。
(2)波形编码。这种编码方式最为显著的优点是语音质量好、环境适应能力超强,唯一的缺陷是需要用到的语音编码速率高。
(3)混合编码。这是一种基于上述两类编码方式的基础上形成的,由于其具备参数和波形这两种编码类型的全部优点,并克服了它们的缺陷,因此获得了广泛应用。本系统的设计采用的就是混合编码。
2.3 系统主要电路设计
(1)A/D电路。A/D电路的构成部分为A/D转换电路和模拟语音信号处理电路。模拟语音信号在输入A/D电路后,需要经过前置放大器、带通滤波器、电平范围等步骤对电路进行调整。通常情况下,麦克风的输出电平为几十毫伏,通过前置放大器进行处理后可放大至 1 V左右,从而推动后续流程操作。带通滤波器的通带为300~3400 Hz,将系统的语音采样频率确定为8 kHz,也就是说1 s内可采样8000点语
音数据,并将数据用字节进行表示。电平范围对电路进行调整是将原本具有双极性的语音信号转变到0~5 V范围,从而使其符合接口信号的要求。
(2)D/A电路在转换输出语音信号中,对语音信号杂音的处理是十分重要的。由于在没有信号输出的状态下,应当保持输出对地是零电位,所以要用两组运算放大器作为转换器,实现电流到电压的双极性转换和控制的目的。数字信号经过D/A电路以及转换器的处理后,形成模拟语音信号,最终成为输出音频。
综上所述,本系统能够实现语音拾取和数字化存储以及回放等功能,可对300~3400 Hz这一范围区间内的音频信号进行存储和回放。
参考文献
[1] 周瑗,杨丽华.基于CPLD技术的数字化语音存储与回放系统[J].北京化工大学学报(自然科学版),2010(8).
[2] 曲洪权,李柯南,张北南.基于FPGA控制的数字化语音存储与回放系统[J].电子技术,2010(12).
[3] 涂剑鹏,何尚平.基于嵌入式处理器的数字化语音存储回放及GSM语音传输系统设计[J].河南理工大学学报(自然科学版),2010(4).