自适应差分脉冲编码调制语音编码

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

自适应差分脉冲编码调制(ADPCM)语音编

摘要:在过去的几十年中人类在语音数字化和数字化压缩领域研究摸索中取得了辉煌的成就。开

辟了崭新的信息数字化时代。

1972年CCITT制定了G.711 64kb/s PCM语音编码标准,CCITT G.711A规定的A律和μ律PCM采用非线性量化,在64kb/s的速率语音质量能够达到网络等级,当前已广泛应用于各

种数字通信系统中。由于它是一维统计语音信号,当速率进一步减小时,将达不到网络等级所

要求的话音质量。对于许多应用,尤其在长途传输系统中,64kb/s的速率所占用的频带太宽以

至通信费用昂贵,因此人们一直寻求能够在更低的速率上获得高质量语音编码质量的办法。于

是在1984年CCITT又提出了32kb/s标准的G.721 ADPCM编码。

ADPCM充分地使用了语音信号样点间的相关性,利用自适应预测和量化来解决语音信号的非平稳特点,在32kb/s速率上能够给出符合公用网的要求的网络等级语音质量。

本文对PCM、DPCM、DM、ADM以及ADPCM的编码、译码原理进行讨论,并对它们性能进行比较,然后着重阐述基于ADPCM的语音压缩算法,并介绍了ADPCM编码在蓝牙技术

上的使用,最后对ADPCM在现代通信中的应用做个总结与展望。

1 脉冲编码调制及差分脉冲编码调制

1.1脉冲编码调制(PCM)

脉冲编码调制PCM(Pulse Code Modulation)是把模拟信号变换成数字信号的一种调制方式。其功能是完成模-数转换,实现连续消息数字化。在PCM的调制过程中,将输入的模拟信号进行取样,量化和编码。经量化后的样值进一步变换为表示量化电平大小的二进制,即用二进制的大小来代表模拟信号的幅度(一个二进制码是一组有限的“0”、“1”脉冲序列)。在接收端再将这些编码的二进制数还原为原来的模拟信号。由于二进制PCM便于应用现代数字技术,且具有抗噪性能好的优点,因此是一种最常用的PCM形式。

1.2差分脉冲编码调制(DPCM)

DPCM(Differential PCM)是指采用固定预测器与固定量化器的差值脉冲调制,它是利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术,它记录的不是信号的绝对大小而是相对大小。它是分析ADPCM工作原理的基础。

DPCM采用预测编码技术,将信号抽样值与信号预测值的差值进行量化、编码后传输。在DPCM中是用n位二进码表示增量,因此它是介于DM和PCM之间的一种编码方式。DPCM 相对于PCM信噪比有所改观,与DM相比,由于增加了量化级,因此改善量化噪声方面也优于DM,DPCM的缺点是较易受到传输线路噪声的干扰。

2 增量调制及自适应增量调制

2.1 增量调制(DM)

增量调制(Delta modulation,简称为DM)是只保留每一信号样值与其预测值之差的符号,并用一位二进制数编码的差分脉冲编码调制。DM的工作原理,将信号瞬时值与前一个抽样时刻的量化值之差进行量化,而且只对这个差值的符号进行编码,而不对差值的大小编码。因此编码反映的不是原始的信号,而是差分本身。在DM中由电平的量化误差产生的噪声称为颗粒噪声。而由于输入信号的斜率过大,调制器跟踪不及而产生的噪声称为斜率过载噪声。

2.2 自适应增量调制(ADM)

自适应增量调制(Adaptive DM,简称ADM) 。为兼顾过载噪声和量化噪声,而采用了ADM,它的基本方法是检测输入信号的斜率变化,自动改变预测信号和量化台阶,使预测信号总能跟踪上输入信号的变化。近年来,在ADM体制上提出了几种实用有效的算法,例如:(1)常因子自适应增量调制(CFDM)算法;(2)高信息自适应增量调制(HIDM)算法;(3)Song算法;

(4)混合自适应增量调制(HCDM)算法;(5)CVSD算法。

3自适应差分脉冲编码调制(ADPCM)

自适应差分脉冲编码调制(Adaptive Differential Pulse Code Modulation,简称ADPCM)最早使用于数字通信系统中。目前我们所使用的IMA ADPCM算法简单实用,被广泛应用于数字录音笔和音乐盒中,更是应用于卫星通信IDR系统及小型站卫星通信系统传输语音和数据。

自适应差分脉冲编码调制用预测编码来压缩数据量。它是一种结合了ADM 的差分信号与PCM的二进制码的方法的波形编码。由于ADPCM主要用来对现有的PCM信道扩容,即把2个2Mkb/s PCM基群信号转换成一个2Mkb/s 60路ADPCM编码器输出与解码器输出都采用标准A律或μ律PCM码。而经过对数压缩后的64 kb/s PCM信号是不能直接进行一般算术运算的,进入编码前,需要将A律或μ律PCM码通过内在关系转换成线性PCM码 (即自然二进制码)。在接收端,则需要将ADPCM 码解码得到的自然二进制码重建信号变换成A律或μ律对数 PCM 信号输出。它的编码简化框图如图 1 所示:

图1. ADPCM编码示意图

其编码过程为:①为了便于数字运算,在编码器中先将输入的PCM码转换成14位线性码Sl(k),然后与预测信号Se(k)求差得到信号D(k)②将D(k)进行自适应差分量化,得到4比特ADPCM代码I(k)。③先把I(k)送到量化阶调整器,算得新的量化标度因子Y(k)。④再把I(k)送到解码器,同时将 I(k)进行本地解码得到量化后的差值信号Dq(k)与预测信号Se(k)求和得到本地重建信号Sr(k),将Sr(k)输入自适应预测器,得到二阶极点和六阶零点的混合预测系数,它利用Dq(k)、Sr(k)以及前几次运算的值对下一个输入信号S1+l(k)进行预测,计算出Se+l(k)。解码是实现解压缩功能,即编码的逆过程,解码与编码有相同的电路,只是多了一个同步编码调整,其作用是使级联工作时不产生误差累积。解码器最后输出的码是8位A律或μ律PCM码,因此在得到重建信号Se(k),还需将它转换成相应的PCM 码。解码简化框图如图 2 所示:

图2. ADPCM解码示意图

4 语音压缩编码

现代通信的重要标志是实现数字化。对模拟信号实现数字化通信首先要将模拟信号转变为数字信号。这一过程对语音信号的变换叫语音编码。衡量语音压缩编码性能的主要指标是语音编码质量、编码速率、编码算法及复杂程度和编解码延时。对这些指标的要求往往是相互矛盾的,必须根据实际情况权衡。

4.1 语音压缩编码方法

语音编码技术可以分为两大类:波形编码和参数编码。波形编码是将时间域信号直接变换为数字代码,其特点是再建信号的波形。这种方案中信号的质量较高,而其编码的比特率在64-16kb/s范围内,PCM、DM等均属于这一类。参量编码又叫模型基信源编码。它不传送信号的取样值,而是传送语音生成模型的基本参数以及适当的激励信号。在接收端则从数字代码恢复特征参量,再从参量重建语音信号。这种方法的特点是质量较前者低,但可大大压

相关文档
最新文档