语音编码和图像编码的分类及特点

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语音编码和图像编码的分类及特点

一、语音编码

一般而言,语音编码分三大类:波形编码、参数编码及混合编码。

<1>、波形编码

波形编码将时域模拟话音的波形信号进过采样、量化和编码形成数字语音信号,是将语音信号作为一般的波形信号来处理,力图使重建的波形保持原语音信号的波形形状。具有适应能力强、合成质量高的优点。但所需编码速率较高,通常在16KB/S以上,并且编码质量随着编码速率的降低显著下降,且占用的较高的带宽。

波形编码又可以分为时域上和频域上的波形编码,频域上有子带编码和自适应变换域编码,时域上PCM、DPCM、ADPCM、APC和∆M增量调制等。

①、子带编码

它首先用一组带通滤波器将输入信号按频谱分开,然后让每路子信号通过各自的自适应PCM编码器(ADPCM)编码,经过分接和解码再复合成原始信号。

特点:1、每个子带独立自适应,可按每个子带的能量调节量化阶;2、可根据各个子带对听觉的作用大小共设计最佳的比特数;3、量化噪声都限制在子带内某一频带的量化噪声串到另一频带中去。

②、自适应变换域编码

利用正交变换将信号有时域变换到另外的一个域,使变换域系数密集化,从而使信号相邻样本间冗余度得到降低。

特点:对变换域系数进行量化编码,可以降低数码率。

③、PCM(Pulse-code modulation),脉冲编码调制

对连续变化的模拟信号进行进行抽样、量化和编码产生。

特点是保真度高,解码速度快,缺点是编码后的数据量大。

④、DPCM(Differential Pulse Code Modulation)差分脉冲编码调制

是对模拟信号幅度抽样的差值进行量化编码的调制方式,是用已经过去的抽样值来预测当前的抽样值,对它们的差值进行编码。

特点:对于有些信号瞬时斜率比较大,很容易引起过载;而且瞬时斜率较大的信号也没有像话音信号那种音节特性,因而也不能采用像音节压扩那样的方法,只能采用瞬时压扩的方法;传输的比特率要比PCM低;一个典型的缺点就是易受到传输线路上噪声的干扰。

⑤、ADPCM(adaptive differential pulse code modulation),自适应差分脉冲编码调制

是DPCM的扩展,区别在于较DPCM在实现上预测器和量化器会随着相关的参数自适应的变化,达到较好的编码效果。

特点:优点在算法复杂度低,压缩比小,编解码延时最短,压缩/解压缩算法非常的简单,低空间消耗。缺点是声音的质量一般。

⑥、∆M增量调制

只保留每一信号样值与其预测值之差的符号,并用一位二进制数编码的差分脉冲编码调制。

特点:1、电路简单,而脉码调制编码器需要较多逻辑电路;2、数据率低于

40千比特/秒时,话音质量比脉码调制的好;3、抗信道误码性能好,能工作于误码率为10-3的信道,而脉码调制要求信道误码率低于10-5~10-6。

<2>、参数编码

利用人类发声系统的特性来压缩信号,对语音信号的产生赋予特点的声学模型,通过对模型参数的提取和编码,力图使重建的语音信号具有尽可能高的自然度和可懂度。

参数编码主要有两大类:线性预测编码和声码器。线性预测编码包括多脉冲激励LPC、码本激励LPC和矢量和激励LPC编码方式,声码器有四种:信道声码器、共振峰声码器、倒频谱声码器和语音激励声码器。

①、多脉冲激励LPC

激励源一律采用多脉冲序列在给定的一项N个激励样本中,保留M个,其幅度和位置是确定的。使合成语音和原始输入语言之间的感加权误差最小。

特点:MPLPC必须进行量化编码,它传输的内容包括多脉冲激励的脉冲位置和幅度,长时和短时预测器系数,音调周期,MPLPC产生的语音质量和数码率取决于脉冲的数目。一般认为在9.6kbit/s的数码率上,有较高的语音质量。它可以尖用于数字动通信、数字保密通信。

②、码本激励LPC

它是一种用码本作为激励源的编码方式,以N样值为一组,构成一个含N维磁量的码字。若以上码字又组成了一套码本,并且收发端的码本设置是相同的,而传送的是码字序号而不是N维样值序列本身,从而压缩了数据率。

特点:建立码本和搜索码字的运算量很大。

③、矢量和激励LPC

其码本(CODE BOOK)仅含少量n个基本矢量的加减组合,得到2n个码字的码本。是码本激励LPC编码的一种类型。

特点:使得VSELP与CELP相比,大大地降低了运算量,VSELP已成为北美和日本数字蜂窝移动通信系统的话音编码标准。

④、声码器

声码器在发送端对语言信号进行分析,提取出语言信号的特征参量加以编码和加密,以取得和信道的匹配,经信息道传递到接受端,再根据收到的特征参量恢复原始语言波形。分析可在频域中进行,对语言信号作频谱分析,鉴别清浊音,测定浊音基频,进而选取清-浊判断、浊音基频和频谱包络作为特征参量加以传送。分析也可在时域中进行,利用其周期性提取一些参数进行线性预测,或对语言信号作相关分析。根据工作原理,声码器可以分成:通道式声码器、共振峰声码器、图案声码器、线性预测声码器、相关声码器、正交函数声码器。

特点:声码器的明显优点是数码率低,因而适合于窄带、昂贵和劣质信道条件下的数字电话通信,能满足节约频带、节省功率和抗干扰编码的要求。低数码率对话音存储和话音加密处理也都很有利。声码器的缺点是音质不如普通数字电话好,而且工作过程较复杂,造价较高。

<2>、混合编码

是将波形编码和参数编码相结合而得到的,综合了参数编码低比特率与波形编码高语音质量优点。应用最广泛的是LPAS(基于线性预测技术的分析-合成编码方式)

LPAS(基于线性预测技术的分析-合成编码方式)

通过线性预测确定系数参数,并通过闭环和分析-合成方法来确定激励序列。

相关文档
最新文档