浅析三种常见语音编码的性能对比
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ACADEMIC RESEARCH 学术研究
一、前言
通信系统,大致可以划分为两种类型,即:第一,数字通信系统;第二,模拟通信系统。
在当前通信系统中,较为常见的类型为模拟信号的数字传输,即在数字通信系统中对模拟信号进行传输,例如在调频通信系统或者扩频通信系统中进行语音的传输。
在这种情况下,应将模拟语音信号通过通信系统的发送端转换成为数字信号,即模数转换(A/D)。
而所谓的数模转换(D/A),就是指将数字信号通过接收端转换成为模拟语音信号。
实际上 ,模数转换共包括3大步骤:采样、量化、编码。
针对语音通信系统的通信质量,在极大程度上深受编码性好坏的直接影响。
另外,编码算法、编码位数、采样率与编码性能之间存在着非常密切的关系[1]。
在各种语音编码算法中,脉冲编码调制(PCM)是最为简单的一种算法。
通过运用脉冲编码调制(PCM),能够将量化过后的采样值直接转化成为一个k位的M进制的代码,其中,常常选用二进制代码。
针对一位二进制码,无法对模拟信号的采样值进行表示,只能对两种状态进行代表,不过相邻两采样值的相对大小能够通过一位二进制码表示出来,但是模拟信号的变化规律也能够通过相邻采样值的相对大小反映出来,进而诞生了另外一种编码方式,也就是所谓的增量调制(DM)。
和脉冲编码调制(PCM)相比,增量调制(DM)的运用更为广泛,其中造成以上现象的原因为:在脉冲编码调制(PCM)中,必须要由多位代码表示一个采样值,但是在△M中,仅需要一位,造成码元输出速率的大幅度下降,所以当比特率比较低的情况下,和脉冲编码调制(PCM)的量化信噪比较,△M的量化信噪比更高一些。
增量调制(DM)具有比较高的抗误码性能,可以在误码率为10-3-10-2的信道内进行工作,但是一般情况下,脉冲编码调制(PCM)对信道误码率的要求为10-6-10-4;和脉冲编码调制(PCM)相比,△M的编译码器更为简单,能够促使硬件的实现变得更为容易。
迄今为止,使用较为广泛的增量调制方式有连续可变斜率增量调制(CVSD)、自适应脉码增量调制(ADPCM)、脉码增量调制(DPCM)、有线性增量调制(LDM)等。
基于此,本文主要对CVSD、ADPCM、LDM这三种编码算法的性能进行对比分析[2]。
二、系统仿真模型的构建
为对CVSD、ADPCM、LDM这三种编码算法的性能进行有效验证,本文在MATLAB Simulink平台上,构建了相应的系统仿真模型。
第一,对一段无损录音进行选取,将其作为语音信号源,通过运用Simulink内的From Multimedia File模块,将文件内的语言波形提取出来,同时通过运用Rate Transition模块,也可以对仿真的采样率进行有效控制。
第二,在CVSD编码器、ADPCM编码器、LDM编码器中分别送入语音信号,进行语音编码,在Transmission Channel内,传输、解调高斯噪声信道。
第三,在CVSD译码器、ADPCM译码器、LDM译码器中分别将低通滤波、译码完成,将语音信号予以恢复,向示波器模块中分别送入原语音信号,对语音信号编解码前后的波形变化情况进行深入观察,以对三种编码算法的性能进行比较分析[3]。
三、不同采样率下三种编码性能的比较分析
在一个通信系统中,如果采样率比较高,便代表着会对较大的传输带宽进行占用,码元传输速率比较高。
为能够对通信系统的抗噪性能进行有效提高,应选用更高的采样率。
不过要是想对频带进行有效节省,应选用较小的采样率,综上所述,以上对采样率的选用,二者是互相矛盾的,因此,为能够获取更好的传输性能,应选用尽量小的采样率,对编码算法进行优化。
和△M相比,脉冲编码调制(PCM)具有更高的编码位数,所以和△M相比,在低信道传输速率条件下,脉冲编码调制(PCM)的性能更弱一些,因此,针对在不同采样率下CVSD、ADPCM、LDM这三种编码算法的性能,本文对其进行重点仿真。
在实际运用过程中,针对32khit/s的ADPCM,CCITT认为32khit/s的ADPCM可以作为长途传输的语音编码方式,通过运用32khit/s传信率来对ADPCM信号机械传输,能够促使在64khit/s传信率下PCM话音质量的顺利实现。
但是在军事通信系统中,应对16khit/s传信率传输的CVSD信号进行广泛运用,通过运用较低的传信率,获取最为理想的话音质量,这样才能够对信道资源进行有效节约。
四、三种编码方式在抗突发干扰性能方面的比较
针对在干扰时段中的仿真输出波形图,通过对其进行观察分析后不难发现,CVSD、ADPCM、LDM在各种采样率条件下所输出的波形,均产生不同程度的畸变,其中畸变程度最小的就是CVSD编码,同时在干扰时段外,可以对原语音信号进行快速逼近。
综上所述,CVSD的抗突发干扰能力是比较强的。
在仿真过程中,本文共选用了4种采样率,即:8kHz、16kHz、32kHz、64kHz,且
浅析三种常见语音编码的性能对比
梁 脊
◆ 摘要:在当前语音通信系统中,语音编码是一种极为重要的环节。
和传统PCM编码方式比较,增量调
制(DM)具有一大重要优点,即节省频谱资源。
CVSD、ADPCM、LDM是当下较为常见的三种增量调制
方式。
为对CVSD、ADPCM、LDM这三种编码算法的性能进行有效验证,论文在MATLAB Simulink平台上,
构建了相应的系统仿真模型。
根据仿真结果可知,和其他两种编码方式比较,在低采样率条件下,CVSD的
可懂度、编码性能能够保持良好,同时具有一定的抗干扰能力,通过运用比较低的编码速率,CVSD编码能
够获取比较好的语音质量。
关键词:CVSD;ADPCM;LDM;编码方式;比较
信息系统工程 │ 2019.8.20141
ACADEMIC RESEARCH 学术研究
分别获取相应解调译码的输出波形。
在每一张图中,由下到上分别是CVSD、ADPCM、LDM对应的输出波形,其中解调译码波形为灰色曲线,原语音波形为黑色曲线。
在每一张波形图中,编码性能能够通过黑色曲线与灰色曲线的拟合程度充分反映出来,两条曲线的拟合程度越为接近,则意味其编码性能越好。
通过深入分析后不难发现,随着采样率的不断降低,CVSD、ADPCM、LDM 的编码性能呈不断下降趋势。
当采样率为64kHz时,LDM可以对原语音波形进行较好的恢复,而随着采样率的不断减小,LDM编码性能出现最为显著的恶化现象,当采样率为32kHz时,LDM的波形出现了明显的畸变,当采样率为16kHz时,LDM的波形现已出现严重失真现象。
和LDM比较,ADPCM的编码能够得到显著改善,当采样率为16kHz时,ADPCM的波形才会产生显著的畸变现象。
随着采样率的不断减小,CVSD的编码性能并未出现明显的恶化现象,同时在采样率为8kHz时,CVSD的波形才会产生少量的毛刺。
通过深入比较分析后,不难发现,在以上三种编码方式中,LDM的编码性能是最差的,ADPCM的编码性能次之,CVSD的编码性能是最好的。
在实际运用过程中,针对32khit/s的ADPCM,CCITT建议其作为长途传输的语音编码方式,通过运用32khit/s传信率传输的ADPCM信号,能够获取64khit/s传信率传输的PCM话音质量。
但是在军事通信系统中,普遍选用16khit/s传信率传输的CVSD信号,一对信道资源进行有效节约。
五、三种编码方式的音质比较
针对CVSD、ADPCM、LDM的编码性能,上文通过运用波形比较的方式,对其进行了深入讨论。
针对编码方式性能的好坏,波形拟合程度能够对其进行一定程度的反映,不过并不全面,所以,本文对输出信号的可懂度、音质进行了考察。
根据图1所示,通过运用Simulink内的To Multimedia File模块,分别在3个多媒体文件中储存CVSD、ADPCM、LDM译码器的输出波形,以重构语言信号。
然后便能够运用直接监听方式,对3个恢复过后语音与原语音的可懂度、音质进行比较。
通过比较后不难发现,当采样率为64kHz时,CVSD、ADPCM、LDM这3种编码方式恢复后的语音信号的可懂度、音质都是非常好的。
当采样率为32kHz时,ADPCM的可懂度、音质并未出现显著降低,LDM的可懂度出现显著降低,且出现一定的杂音。
当采样率为16kHz时,CVSD的可懂度、音质仍然保持良好,即便采样率为8kHz时,依然能够听懂。
另外,在遭受突发脉冲的干扰影响作用下,CVSD语言信号的可懂度、音质,仍然能够进行较好的恢复。
图1 语音重构程序框图
六、结语
本文在MATLAB Simulink平台上,对CVSD、ADPCM、LDM 的编译码仿真模型进行了构建,详细仿真比较了这三种编码方式在不同采样率条件下的可懂度、抗干扰能力、输出波形。
根据仿真结果可知,和其他两种编码方式比较,在低采样率条件下,CVSD的可懂度、编码性能能够保持良好,同时具有一定的抗干扰能力,通过运用比较低的编码速率,CVSD编码能够获取比较好的语音质量。
综上所述,CVSD是一种比较好的编码方式。
H 参考文献
[1] 黄建军, 曹铁勇, 张雄伟, 等.CVSD 算法研究及其语音增强[J].军事通信技术,2019(02).
[2] 董津生, 孙耀杰, 贾静蕾, 等. CVSD 语音编解码的DSP 实现[J].河北工业大学学报,2019(03).
[3] 侯灿靖, 达新宇.CVSD 仿真及其在某地空电台语音终端中的应用[J].火力与指挥控制,2018(10).
(作者单位:中国民用航空西南地区空中交通管理局贵
州分局)
(上接第140页)
用这个距离减去粒子团的加权平均半径,最后提取距离场隐式函数值为0的表面。
这样重构流体得到的表面是相对光滑、鼓包效果不明显的流体表面。
四、结语
到目前为止,国内外的研究人员已经对流体模拟重建技术进行了大量的研究,也取得了卓越的成果。
现在,计算机流体模拟已经被广泛地应用于游戏设计、动画特效、医学治疗等领域。
它不仅给人们带来心灵上的震撼和强烈的视觉享受,也取得了明显的社会效益和经济效益。
但是随着人们对模拟细节越来越高的要求,对流体表面重建的挑战也就越来越大。
在未来的研究中,还需要设计让流体模拟的表面更加光滑不鼓包,尽可能展现丰富的流体细节,加速流体表面绘制速度,加强流体表面重建的真实感等。
H
参考文献
[1] 李辉. 椭球型元球SPH 流体表面重构方法的改进研究[D]. 燕山大学,2012.
[2] Monaghan, J. J. (1992). Smoothed particle hydrodynamics. Annual review of astronomy and astrophysics, 30:543-574.
[3] 傅承彦. 流体表面重建的研究[D]. 上海交通大学,2013.
[4] MÜLLER M., CHARYPAR D., GROSS M.: Particlebased fluid simulation for interactive applications. In SCA ’03: Proceedings of the 2003 ACM SIGGRAPH/Eurographics symposium on Computer animation (Aire-la- Ville, Switzerland, Switzerland, 2003), Eurographics Association, pp. 154–159.
[5] ZHU Y., BRIDSON R.: Animating sand as a fluid. ACM Trans. Graph. 24, 3 (2005):965–972.
(作者单位:华北电力大学)
信息系统工程 │ 2019.8.20 142。