语音压缩编码技术的研究及matlab的实现

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语音压缩编码技术的研究及matlab的实现
一.选题意义
网络通信的核心部分是允许语音或语音编码的数字传输技术,而语音压缩编码是高质量、高速率语音信号传输及存储的关键技术,它一般包含语音源建模、重要感知特征提取、压缩和重新合成等过程。

语音压缩编码技术是语音识别、视频会和语音通话等技术的关键组成部分,目前这些技术正处于高速发展阶段,因此研究压缩编码技术对推动语音应用的高质量发展具有重要的现实意义。

二.国内外研究动态
语音压缩编码从编码方式上分主要有波形编码、参数编码、波形及参数编
码的混合编码等方式[1]。

波形编码适用于如语音识别、高质量音频等高质量应
用和高速率传输环境,参数编码适用于如普通音频播放等低带宽和小存储容量
的应用对象[2],下面对三种压缩编码技术的发展现状进行概述。

波形编码由于编解码质量高,因而应用较广,现有的波形压缩编码技术主要有脉冲调制编码(PCM)和其衍生的一些压缩编码方式。

PCM通过对原始语音信号进行模拟信号采样和数字量化后完成对语音信号的编码,它一般采用A率或μ率压缩算法对语音信号进行对数压缩处理[3];西安邮电大学的李鲜等[4]针对PCM编码过程中出现的语音信号频率混叠现象带来的波形重建的失真问题,设计了三阶巴特沃滋滤波器,有效抑制了高频干扰,保证了语音模拟信号到数字信号的可靠编码;Mohamed等[5]针对ITU-T G.711.1标准对语音信息进行编解码过程中产生的量化噪声问题,提出采用log-PCM估计器对信号进行后置滤波,准确估计了噪声,有效减少了语音编码噪声。

差分脉冲编码(DPCM)、自适应增量调制(ADM)、自适应差分脉冲编码调制(ADPCM)等技术都是在PCM编码的基础上改进的语音压缩编码技术,这些方法均采用记录差分信号的方式,分别从减小冗余信息、降低噪声过载、自适应量化及滤波等方面对语音压缩编码技术进行改进[6]。

刘华[7]采用ADPCM编码技术对WA V语音信号进行了仿真分析,通过编码后再解码的方式较好的还原了语音信号;Jayant[8]采用ADPCM技术,根据语音信号的截止频率范围将解码器的输出连接到N个低通滤波器中的某一个,实现编码过程中的参数自适应,有效提高了信号编码质量,获得了高质量的信号语音信号重建效果。

语音参数压缩编码方式上,主要有线性预测编码(LPC)[9]、HILN参数音频编码[10]、激励线性预测语音编码(FS-ACELP)[11]、波形内插语音编码[12]等方式,其中
LPC编码方式应用较为广泛,国内外研究较多。

LPC编码是通过提取声音信号频率域或通过正交特性获得声音信号特征,通过编码器对LPC参数等信息进行信号编码传输,再到解码器中解码输出激励信号,经过LPC语音合成模型对语音信号进行合成重建[9]。

近几年,该算法的研究主要集中于仿真及滤波方面,如张明等[13]利用LPC编码技术对语音信号进行预测仿真,有效降低了编码信号的数码率,降低了传输时间,但存在计算量大、语音合成质量不高等问题;Zhao等[14]针对LPC常规噪声补偿过程中存在的噪声功率过度补偿问题,提出利用改进噪声补偿AR系数估计方法对语音信号进行降噪,并通过迭代方式对预加重噪声进行处理,获得了良好的语音压缩编码效果。

波形及参数编码的混合编码综合了两种语音压缩编码方式的优点,取得了良好的应用效果,目前该领域涵盖的主要压缩编码方式有码激励线性预测编码(CELP)[15]、多脉冲线性预测编码(MPLPC)[16]、规则脉冲语音激励编码(RPE-LPC)[17],其中CELP的压缩编码技术合成的语音质量高,因此学术上对该技术的研究较为集中。

同济大学的岳东剑等[18]将CELP技术运用于文本转语音的应用场合,建立了精细的语音编码模型,采用6000bps的编码速率实现了CELP编码与波形拼接技术的有效融合;Oshikiri等[19]提出了一种可变速率的ADP-CELP编码方式,该编码方式根据语音信号帧的性质将其划分为语音部分、非语音部分、稳定语音和非稳定语音四种模式,通过这种划分方式,有效提高了噪声背景环境下语音编码质量。

三.主要研究内容及创新点
3.1主要研究内容
本课题以计算机采集的原始语音信号为研究对象,采用波形编码方式对语音信号进行压缩编码,利用数字信号采集、信号处理及信号重建等技术手段完成语音信号的处理。

主要研究内容有:
1.语音信号的采集;
2.基于差分方式的语音信号量化压缩处理;
3.设计滤波器对语音信号中的高、低频率成分进行滤波处理;
4.基于傅里叶反变换的语音信号重建。

3.2研究内容及创新点
3.2创新点
1.采用基于差分方式的语音信号量化压缩处理方法,有效减少了语音信号的存
储消耗,同时提高了信号传输速率;
2.采用相关分析方法对语音信号中的周期性干扰频率成分进行去除,为实现语
音信号的高质量编码提供了基础;
3.通过设计高通和低通滤波器,对原始语音信号中的高低频率成分进行去除,
降低了语音扰动对语音信号重建的影响。

四.研究方案
4.1 本课题研究方案
本设计拟采用的技术路线如下
图4-1 技术路线
4.2滤波算法设计
采集的语音信号冲通常含有较多的周期性噪声,并伴随着各种高、低频率成分,通过将采集的信号进行延时相乘对原始信号进行相关分析以识别并剔除信号中所含周期性成分;对信号进行频域分析,采用低通、高通滤波器对压缩编码后的噪声进行滤波处理,得到平滑、自然的语音编码信号。

4.3信号编码及压缩处理算法设计
为了降低语音信号的存储消耗,同时又不失真,对原始信号进行分析,通过将原始信号与给定基波信号进行差分的方式降低数据的存储量;通过提取信号的幅值范围,决定信号的量化标准,实现对声音信号进行二进制编码存储。

五.进度安排
六.参考文献
[1]苏桃.浅谈语音压缩编码的发展和应用[J].图书情报导刊, 2006(22):157-158.
[2]王嵩,鲍长春,李晓明.参数音频编码回顾[J].信号处理, 2011(04):97-108.
[3]周春梅.语音压缩编码PCM[J]. 硅谷, 2012, 000(006):37-37.
[4]李鲜,徐东明. PCM语音编解码系统中抗混叠滤波器的设计[J].中国集成电路,
2014, 23(Z1):45-48.
[5]Konate M,Kabal P.Quantization noise estimation for log-PCM[C]// Proceedings of
the 24th Canadian Conference on Electrical and Computer Engineering,CCECE 2011,Niagara Falls, Ontario, Canada, 8-11 May,2011.IEEE, 2011.
[6]廖广锐,刘萍.基于ADPCM的语音压缩算法研究[J].计算机与数字工程,
2007(07):8+53-55.
[7]刘华.语音声码器模型及ADPCM声码器仿真[J]. 长春师范大学学报, 2013,
32(6):22-24.
[8]Jayant N S. Adaptive post-filtering of ADPCM speech[J]. The Bell System
Technical Journal, 2014, 60(5):707-717.
[9]籍永生. LPC-10声码器算法研究与实现[J].河南科技, 2011(23):52-53.
[10]陶峻,陈健.参数音频编码算法的改进[J].通信技术, 2002(12):41-44.
[11]唐昆,崔慧娟,刘志勇, etal.高质量4kb/sFS-ACELP语音编码算法及性能[J]. 电
子学报,1999, 27(10):22-26.
[12]薛二娟,鲍长春,李如玮.基于二维非负矩阵分解的1kb/s WI语音编码算法[J].
电子学报,2010, 38(7).
[13]张明,刘祥楼,姜峥嵘.基于LPC的语音信号预测仿真分析[J].光学仪器, 37(1).
[14]Z hao Q,Shimamura T,Suzuki J.Improvement of LPC analysis of speech by noise
compensation[J]. Electronics & Communications in Japan, 2015, 83(9):73-83. [15]M an-Tak Chu,Cheung-Fat Chan. Sample-by-sample gain adaptive celp coding of
wideband audio[C]//1996 8th European Signal Processing Conference (EUSIPCO 1996). IEEE, 2015.
[16]M a Zhen,Cao Yanyan, Zhang Jinlan. Research on MPLPC Excited-Pulse Abstract
Algorithm[C]// 2009 Second International Symposium on Computational Intelligence and Design, ISCID 2009, Changsha, Hunan, China, 12-14 December 2009, 2 V olumes. IEEE Computer Society, 2009.
[17]P. Vary, K.Hellwig, R. Hofmann,等. Speech codec for the European mobile radio
system[C]// Acoustics, Speech, and Signal Processing, 1988. ICASSP-88. 1988 International Conference on. IEEE Xplore, 1988.
[18]岳东剑,柴佩琪,宣国荣. CELP编码器的实现及其在TTS系统中的应用[J].同
济大学学报(自然科学版)(5):571-575.
[19]Oshikiri M,Akamine M.A 2.4-kbps variable-bit-rate ADP-CELP speech coder[J].
Electronics & Communications in Japan, 2015, 83(7):32-41.。

相关文档
最新文档