无线通信技术基础_10话音编码技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
fQ(x) fQ(x)
x
x
(a) 输入信号为低幅值
(b) 输入信号为高幅值
第10.4节、自适应差分脉冲编码
自适应差分脉冲编码调制(ADPCM)是一种能有效解决话音信号冗余度 的方法。话音波形的相邻抽样常常具有很强的相关性,这表明相邻话音
幅度之间差分的方差要比话音信号的方差小得多。在维持相同的话音质
第10.6节、参量编码
发声机理是进行话音数字化参量编码的基础,在参量编码中,话音特征 参数的提取是十分关键的。在实际应用中,通过细致地调整话音生成模
型的参数,可以合成出高质量的话音信号。
决定话音的基本特征参数是:基音、共振峰频率和强度以及清音/浊音判 决。发送端只需要把这些特征参数传送到接收端,接收端就可以根据这 些特征参数来合成出与发送端相同的话音信号波形。而传送这些特征参 数所需要的数据速率大大低于传送波形抽样值所需的数据速率,因此参 量编码方式的比特率与波形编码相比可以大大降低。 由于只传送了话音的主要特征参数,所以合成的话音信号波形只能保持 语言的可懂度而会失去一些自然度和声音特质。也就是说,低码率的参 量编码是以牺牲一定的声音特质为代价的。
第10.2节、话音编码的分类
波形编码是直接对模拟话音信号的时域电压波形进行取样、量化和编码, 使之变成数字话音信号。
参量编码是根据人类语言的发声机理,找出表征话音特征的参量,只对
这些特征参量进行编码的一种方法。
语音编码器
波形编码器
参量编码器
时域
频域
LPC
声码器
非差分
差分
PCM
增益
ADPCM APC
第10.2节、话音编码的分类
移动通信系统的容量大都是带宽受限的,话音编码技术对通话质量、带 宽利用率和系统容量都具有重大影响。低码率的数字话音编码可以提高
信道容量,而纠错能力强的编码可以保证系统在较低的C/N条件下的通话
质量。同时为了使话音编码具有实用价值(用于移动终端),话音编码 技术还必须消耗很少的功率。 话音编码的目的是在不超过一定的算法复杂程度和通信时延的前提下, 占用尽可能少的信道带宽来传送尽可能高质量的话音。话音编码的算法 越复杂,编码效率越高(比特率越低),但相应的时延、费用和功耗也 就越高。必须在这两个相互矛盾的因素之间寻求一个平衡点,话音编码 技术发展的目标就是使这个平衡点向更低比特率的方向移动。 各种话音编码技术在话音信号的压缩方法上有很大区别。根据压缩方式 的不同,可以把话音编码器分成两大类:波形编码器和参量编码器。
量时,ADPCM允许用32Kbps比特率的编码,是标准PCM的一半。 ADPCM编码器以一种自适应的方式,通过改变量化阶梯的大小来充分利 用信号的动态范围,量化器阶梯的大小依赖于输入信号的动态范围,即 依赖于讲话者的话音特性,并且随时间变化。 在ADPCM编码器中,编码器量化相邻抽样的差分值,解码器通过对已量 化的相邻抽样的差分值积分,来恢复原始信号。ADPCM编码器可以运用 信号预测技术来实现,预测是以话音信号的自相关特性为基础的。线性 预测器不是用来对相邻抽样的差值进行编码,而是用来预测当前的抽样 值,然后对预测值与实际抽样值之间的差值(预测误差)进行编码。
第10.3节、脉冲编码调制
压缩器
均匀量化
编码
信道
解码
扩张器
输出
输出
输入 压缩特性曲线 扩张特性曲线
输入
第10.3节、脉冲编码调制
4、自适应量化 话音信号的功率电平具有很强的自相关性,即任何抽样的幅度与前一个
抽样的幅度相关,幅度变化的速度很慢。根据这一特性可以比较容易地
设计和实现简单的自适应算法。 自适应量化器根据输入信号的功率变化,自动改变它的量化阶梯太小, 它在时间轴上的收缩和扩张就像一个手风琴。
第10.3节、脉冲编码调制
3、非均匀量化 非均匀量化就是根据输入波形幅度的非均匀概率分布密度函数(PDF)
来分布量化电平,在保持量化总级数不变(即总编码速率为64Kbit/s)
的前提下,把话音抽样的取值范围分成若干个区间,在抽样值小的区间 增加量化级数,而在抽样值大的区间减少量化级数。 一个简单而又有稳定的非均匀量化器是对数量化器,即先把模拟信号通 过一个压缩(对数)放大器,再把压缩的信号通过一个标准的均匀量化 器。在接收端,被压缩的量化抽样信号再进行扩张处理,这样量化信噪 比就得到了有效的均衡。 非均匀量化的实现方法通常有两种标准:一种是欧洲和我国等大多数国 家采用的A律压扩;另一种是北美和日本采用的μ律压扩。
本章重点
一.话音编码器的种类 二.脉冲编码调制 三.频域话音编码 四.参量编码 五.混合编码 六.话音编码的选择和性能评估
第10.1节、话音信号的特性
要实现通信系统的数字化,首先要将模拟话音信号转换成数字信号。话 音信号的波形是带限的,带宽一般在0.3 ~ 3.4KHz内。根据奈奎斯特取
样定理,有限的带宽意味着它可以用一定的速率抽样,当抽样频率大于
第10.6节、参量编码
1、参量编码的基本原理 人类的发音系统和话音产生的机理比较复杂,在对实际话音进行研究分
析的基础上,抽取其主要特征,就可以得到便于处理的数字模型。根据
发声的机制不同,人类的话音可以分为浊音和清音两大类。浊音又叫有 声音(如:m、n、v);清音又叫无声音(如:f、s、sh)。 整个发声过程可以分成两个步骤:第一步是激励,第二步是响应。 激励:激励源是由横隔膜压迫肺部产生的气流,气流通过声带的振动 产生周期性的浊音或由湍流而产生清音。可以用功率源模拟包括横隔 膜和肺部气室的作用,用激励信号模拟气管、咽喉和声带的作用。 响应:响应是由舌、唇、齿等口部器官来控制口腔及鼻腔构成的时变 有损谐振器,产生不同的频率响应。可以用线性时变滤波器来模拟。
第10.3节、脉冲编码调制
1、量化噪声 量化就是把一个信号的连续幅值分割成一系列有限的离散幅值的过程,
用一组规定的电平,将经过抽样得到的瞬时抽样值进行有限比特的编码,
也就是用一组有限长度的二进制编码来表示每一个有固定电平的量化值。 与抽样不同,量化操作是不可逆的。根据奈奎斯特取样定理,只要取样 频率大于话音波形最高频率的两倍,就可以没有失真地完全恢复话音波 形。而量化是使用有限的阶梯来描述抽样后的连续幅度值(四舍五入, 分级取整),必然会产生量化失真。量化失真的大小取决于量化阶梯的 数量,如果量化使用了n个比特,那么就会有M=2n个离散的幅度阶梯。 量化后的信号失真通常称作量化噪声。量化噪声是与信号独立的,它们 与信号的关系是相加,不管有没有信号,噪声都存在。可以通过测量输 出的量化信噪比(SQNR)来测试一个量化器的性能。
第10.3节、脉冲编码调制
最基本的波形编码是脉冲编码调制(PCM)。PCM的优点是话音质量好, 缺点是编码速率高、体积大。PCM不仅可以提供用户话音业务,还可以
提供从2M到155M速率的非话音业务。
PCM数字信号是通过对连续变化的模拟话音信号进行取样、量化和编码 产生。取样过程将时间连续、幅度连续的模拟信号变为时间离散、幅度 连续的模拟信号;量化过程将取样信号变为时间离散、幅度离散的数字 信号;编码过程将量化后的信号编码成为一个二进制码组输出。 PCM对话音信号的取样频率是8KHz,每次取样的量化值为8个比特,总 的编码速率为64Kbps(8KHz×8bit = 64Kbps)。 量化是一个非常重要的步骤,它在很大程度上决定了整个话音编码的失 真大小。PCM的量化和编码有二种标准,欧洲和我国等大多数国家使用 A律标准(E1),而北美洲及日本使用μ律标准(T1)。
第10.6节、参量编码
波形编码的话音质量很好,电路实现也比较简单,但是编码速率比较高, 需要占用较宽的频率带宽,这将会直接影响通信系统的容量。在蜂窝移
动通信系统中,为了提高系统容量,必须采用速率更低的话音编码技术。
研究低速率、高质量的话音编码一直是数字通信领域的一个重要课题。 参量编码的概念:对反映话音信号特征的参量而不是对话音信号的时域 波形本身进行编码和传输,可以大大降低话音编码的速率。 参量编码与波形编码的原理完全不同,它首先在发送端对话音信号进行 分析,得到话音信号的特征参量并进行编码,然后传输特征参量的编码 数据,在接收端根据这些特征参量来合成和恢复话音信号。 参量编码器比波形编码器要复杂得多,但是可以大幅度降低传输比特率。 它的缺点是稳定性比较差,而且其性能依赖于说话者的话音特征。
SBC
ATC
CVSDM
第10.2节、话音编码的分类
混合编码技术:混合编码是近年来随着移动通信的应用而发展起来的一 种新的高性能话音编码技术。在混合编码的信号中既包含若干话音特征
参量信息又包含部分波形编码信息。混合编码的速率一般在4 ~ 16Kbps,
当编码速率在8 ~ 16Kbps范围时,话音质量可以达到商用话音通信的标 准,因此,混合编码技术在数字移动通信中得到了广泛应用。 移动通信系统中对话音编码的要求 编码速率低。 话音质量高。 有较强的扰噪声干扰和抗误码性能。 编译码时延小,应在几十毫秒以内。 编译码器的复杂程度低,便于大规模集成化生产。 体积小、重量轻、功耗低,适应便Fra Baidu bibliotek式移动台。
低通信号频率的两倍时,就可以从抽样值中完全恢复话音波形。 话音信号的波形具有一些对编码设计有用的特性,这些特性可以使量化 操作以很高的效率实现。 概率分布密度函数:在中低幅度处的概率分布高,在幅度很高处的概 率分布低,在这两个极端之间单调递减。 自相关函数:话音相连的抽样值之间存在很大的相关性。对每一个话 音抽样,有很大的成分可以从前面的抽样值中预测。 功率谱密度函数:具有非平坦特性,在不同频域分别编码可以得到编 码增益,能够用来在频域内明显地压缩话音编码的比特率。
无线通信技术基础
第10章、话音编码技术
内容介绍
在以话音为主要业务的移动通信系统中,话音编码技术是非常重要的, 话音编码在很大程度上决定了接收到的话音质量和系统容量。
在移动通信系统中,无线信道的带宽是极其有限的资源,如何在有限的
无线信道带宽中容纳更多的用户同时通话,一直是移动通信系统的核心问题 。采用多进制调制可以提高带宽效率,但同时功率效率会降低。 低比特率的话音编码提供了解决问题的一种方法,在保证话音质量的前 提下,话音编码器的比特率越低,一定的带宽内就可以容纳更多的话音通道 。因此,产品制造商和服务提供商们一直在不断地寻求新的话音编码技术, 以便在低比特率下提供高质量的话音。
第10.3节、脉冲编码调制
2、均匀量化 把输入信号的取值范围按照等间隔分割的量化称为均匀量化。均匀量化
的幅度阶梯是等间隔的,也就是说,将整个抽样的动态范围均匀地划分
成2n个阶梯,抽样得到的瞬时抽样值根据对应的台阶分级取整进行量化。 均匀量化的好处是编码器和解码器很容易实现。主要缺点是它产生的量 化噪声也是均匀的,与信号在取样点的幅度无关,无论抽样值的大小如 何,量化噪声的均方根值都固定不变。因此,均匀量化会出现话音弱时 信噪比低、干扰大,而话音强时信噪比高、干扰小的不利情况。由于话 音大都集中在小信号范围内,均匀量化在话音幅度小的时候常常不能满 足信噪比的要求,而在话音幅度大时又会出现没有必要的很大余量,信 号的动态范围将会受到很大限制。为了克服这个缺点,实际应用中一般 采用非均匀量化。
第10.5节、频域话音编码
频域话音编码是另外一种波形编码技术,它利用了人类产生及感觉话音 的模型。在这类编码中,话音信号被分成一系列的频率成分(频带)并
对它们单独进行量化和编码。根据每个频带的感知标准,不同的频带采
用不同的编码优先权。这样,量化噪声就仅包含在本频带中,可以避免 频带以外的谐波失真。这些方案的优点是:每个频带用于编码的比特数 可以动态地改变,并且可以在不同的频带上共享。 不同的频域编码算法的复杂程度各不相同。最常用的频域编码包括子带 编码和自适应变换编码。 子带编码把话音信号分成许多小的子带,然后根据感知标准来给每个 子带编码,用来编码的比特数与各自感知的重要性成正比。 自适应变换编码是对抽样的一个加窗序列的短期变换进行编码,这是 一个更加复杂的技术,它涉及话音波形加窗输入信号段的块变换。
x
x
(a) 输入信号为低幅值
(b) 输入信号为高幅值
第10.4节、自适应差分脉冲编码
自适应差分脉冲编码调制(ADPCM)是一种能有效解决话音信号冗余度 的方法。话音波形的相邻抽样常常具有很强的相关性,这表明相邻话音
幅度之间差分的方差要比话音信号的方差小得多。在维持相同的话音质
第10.6节、参量编码
发声机理是进行话音数字化参量编码的基础,在参量编码中,话音特征 参数的提取是十分关键的。在实际应用中,通过细致地调整话音生成模
型的参数,可以合成出高质量的话音信号。
决定话音的基本特征参数是:基音、共振峰频率和强度以及清音/浊音判 决。发送端只需要把这些特征参数传送到接收端,接收端就可以根据这 些特征参数来合成出与发送端相同的话音信号波形。而传送这些特征参 数所需要的数据速率大大低于传送波形抽样值所需的数据速率,因此参 量编码方式的比特率与波形编码相比可以大大降低。 由于只传送了话音的主要特征参数,所以合成的话音信号波形只能保持 语言的可懂度而会失去一些自然度和声音特质。也就是说,低码率的参 量编码是以牺牲一定的声音特质为代价的。
第10.2节、话音编码的分类
波形编码是直接对模拟话音信号的时域电压波形进行取样、量化和编码, 使之变成数字话音信号。
参量编码是根据人类语言的发声机理,找出表征话音特征的参量,只对
这些特征参量进行编码的一种方法。
语音编码器
波形编码器
参量编码器
时域
频域
LPC
声码器
非差分
差分
PCM
增益
ADPCM APC
第10.2节、话音编码的分类
移动通信系统的容量大都是带宽受限的,话音编码技术对通话质量、带 宽利用率和系统容量都具有重大影响。低码率的数字话音编码可以提高
信道容量,而纠错能力强的编码可以保证系统在较低的C/N条件下的通话
质量。同时为了使话音编码具有实用价值(用于移动终端),话音编码 技术还必须消耗很少的功率。 话音编码的目的是在不超过一定的算法复杂程度和通信时延的前提下, 占用尽可能少的信道带宽来传送尽可能高质量的话音。话音编码的算法 越复杂,编码效率越高(比特率越低),但相应的时延、费用和功耗也 就越高。必须在这两个相互矛盾的因素之间寻求一个平衡点,话音编码 技术发展的目标就是使这个平衡点向更低比特率的方向移动。 各种话音编码技术在话音信号的压缩方法上有很大区别。根据压缩方式 的不同,可以把话音编码器分成两大类:波形编码器和参量编码器。
量时,ADPCM允许用32Kbps比特率的编码,是标准PCM的一半。 ADPCM编码器以一种自适应的方式,通过改变量化阶梯的大小来充分利 用信号的动态范围,量化器阶梯的大小依赖于输入信号的动态范围,即 依赖于讲话者的话音特性,并且随时间变化。 在ADPCM编码器中,编码器量化相邻抽样的差分值,解码器通过对已量 化的相邻抽样的差分值积分,来恢复原始信号。ADPCM编码器可以运用 信号预测技术来实现,预测是以话音信号的自相关特性为基础的。线性 预测器不是用来对相邻抽样的差值进行编码,而是用来预测当前的抽样 值,然后对预测值与实际抽样值之间的差值(预测误差)进行编码。
第10.3节、脉冲编码调制
压缩器
均匀量化
编码
信道
解码
扩张器
输出
输出
输入 压缩特性曲线 扩张特性曲线
输入
第10.3节、脉冲编码调制
4、自适应量化 话音信号的功率电平具有很强的自相关性,即任何抽样的幅度与前一个
抽样的幅度相关,幅度变化的速度很慢。根据这一特性可以比较容易地
设计和实现简单的自适应算法。 自适应量化器根据输入信号的功率变化,自动改变它的量化阶梯太小, 它在时间轴上的收缩和扩张就像一个手风琴。
第10.3节、脉冲编码调制
3、非均匀量化 非均匀量化就是根据输入波形幅度的非均匀概率分布密度函数(PDF)
来分布量化电平,在保持量化总级数不变(即总编码速率为64Kbit/s)
的前提下,把话音抽样的取值范围分成若干个区间,在抽样值小的区间 增加量化级数,而在抽样值大的区间减少量化级数。 一个简单而又有稳定的非均匀量化器是对数量化器,即先把模拟信号通 过一个压缩(对数)放大器,再把压缩的信号通过一个标准的均匀量化 器。在接收端,被压缩的量化抽样信号再进行扩张处理,这样量化信噪 比就得到了有效的均衡。 非均匀量化的实现方法通常有两种标准:一种是欧洲和我国等大多数国 家采用的A律压扩;另一种是北美和日本采用的μ律压扩。
本章重点
一.话音编码器的种类 二.脉冲编码调制 三.频域话音编码 四.参量编码 五.混合编码 六.话音编码的选择和性能评估
第10.1节、话音信号的特性
要实现通信系统的数字化,首先要将模拟话音信号转换成数字信号。话 音信号的波形是带限的,带宽一般在0.3 ~ 3.4KHz内。根据奈奎斯特取
样定理,有限的带宽意味着它可以用一定的速率抽样,当抽样频率大于
第10.6节、参量编码
1、参量编码的基本原理 人类的发音系统和话音产生的机理比较复杂,在对实际话音进行研究分
析的基础上,抽取其主要特征,就可以得到便于处理的数字模型。根据
发声的机制不同,人类的话音可以分为浊音和清音两大类。浊音又叫有 声音(如:m、n、v);清音又叫无声音(如:f、s、sh)。 整个发声过程可以分成两个步骤:第一步是激励,第二步是响应。 激励:激励源是由横隔膜压迫肺部产生的气流,气流通过声带的振动 产生周期性的浊音或由湍流而产生清音。可以用功率源模拟包括横隔 膜和肺部气室的作用,用激励信号模拟气管、咽喉和声带的作用。 响应:响应是由舌、唇、齿等口部器官来控制口腔及鼻腔构成的时变 有损谐振器,产生不同的频率响应。可以用线性时变滤波器来模拟。
第10.3节、脉冲编码调制
1、量化噪声 量化就是把一个信号的连续幅值分割成一系列有限的离散幅值的过程,
用一组规定的电平,将经过抽样得到的瞬时抽样值进行有限比特的编码,
也就是用一组有限长度的二进制编码来表示每一个有固定电平的量化值。 与抽样不同,量化操作是不可逆的。根据奈奎斯特取样定理,只要取样 频率大于话音波形最高频率的两倍,就可以没有失真地完全恢复话音波 形。而量化是使用有限的阶梯来描述抽样后的连续幅度值(四舍五入, 分级取整),必然会产生量化失真。量化失真的大小取决于量化阶梯的 数量,如果量化使用了n个比特,那么就会有M=2n个离散的幅度阶梯。 量化后的信号失真通常称作量化噪声。量化噪声是与信号独立的,它们 与信号的关系是相加,不管有没有信号,噪声都存在。可以通过测量输 出的量化信噪比(SQNR)来测试一个量化器的性能。
第10.3节、脉冲编码调制
最基本的波形编码是脉冲编码调制(PCM)。PCM的优点是话音质量好, 缺点是编码速率高、体积大。PCM不仅可以提供用户话音业务,还可以
提供从2M到155M速率的非话音业务。
PCM数字信号是通过对连续变化的模拟话音信号进行取样、量化和编码 产生。取样过程将时间连续、幅度连续的模拟信号变为时间离散、幅度 连续的模拟信号;量化过程将取样信号变为时间离散、幅度离散的数字 信号;编码过程将量化后的信号编码成为一个二进制码组输出。 PCM对话音信号的取样频率是8KHz,每次取样的量化值为8个比特,总 的编码速率为64Kbps(8KHz×8bit = 64Kbps)。 量化是一个非常重要的步骤,它在很大程度上决定了整个话音编码的失 真大小。PCM的量化和编码有二种标准,欧洲和我国等大多数国家使用 A律标准(E1),而北美洲及日本使用μ律标准(T1)。
第10.6节、参量编码
波形编码的话音质量很好,电路实现也比较简单,但是编码速率比较高, 需要占用较宽的频率带宽,这将会直接影响通信系统的容量。在蜂窝移
动通信系统中,为了提高系统容量,必须采用速率更低的话音编码技术。
研究低速率、高质量的话音编码一直是数字通信领域的一个重要课题。 参量编码的概念:对反映话音信号特征的参量而不是对话音信号的时域 波形本身进行编码和传输,可以大大降低话音编码的速率。 参量编码与波形编码的原理完全不同,它首先在发送端对话音信号进行 分析,得到话音信号的特征参量并进行编码,然后传输特征参量的编码 数据,在接收端根据这些特征参量来合成和恢复话音信号。 参量编码器比波形编码器要复杂得多,但是可以大幅度降低传输比特率。 它的缺点是稳定性比较差,而且其性能依赖于说话者的话音特征。
SBC
ATC
CVSDM
第10.2节、话音编码的分类
混合编码技术:混合编码是近年来随着移动通信的应用而发展起来的一 种新的高性能话音编码技术。在混合编码的信号中既包含若干话音特征
参量信息又包含部分波形编码信息。混合编码的速率一般在4 ~ 16Kbps,
当编码速率在8 ~ 16Kbps范围时,话音质量可以达到商用话音通信的标 准,因此,混合编码技术在数字移动通信中得到了广泛应用。 移动通信系统中对话音编码的要求 编码速率低。 话音质量高。 有较强的扰噪声干扰和抗误码性能。 编译码时延小,应在几十毫秒以内。 编译码器的复杂程度低,便于大规模集成化生产。 体积小、重量轻、功耗低,适应便Fra Baidu bibliotek式移动台。
低通信号频率的两倍时,就可以从抽样值中完全恢复话音波形。 话音信号的波形具有一些对编码设计有用的特性,这些特性可以使量化 操作以很高的效率实现。 概率分布密度函数:在中低幅度处的概率分布高,在幅度很高处的概 率分布低,在这两个极端之间单调递减。 自相关函数:话音相连的抽样值之间存在很大的相关性。对每一个话 音抽样,有很大的成分可以从前面的抽样值中预测。 功率谱密度函数:具有非平坦特性,在不同频域分别编码可以得到编 码增益,能够用来在频域内明显地压缩话音编码的比特率。
无线通信技术基础
第10章、话音编码技术
内容介绍
在以话音为主要业务的移动通信系统中,话音编码技术是非常重要的, 话音编码在很大程度上决定了接收到的话音质量和系统容量。
在移动通信系统中,无线信道的带宽是极其有限的资源,如何在有限的
无线信道带宽中容纳更多的用户同时通话,一直是移动通信系统的核心问题 。采用多进制调制可以提高带宽效率,但同时功率效率会降低。 低比特率的话音编码提供了解决问题的一种方法,在保证话音质量的前 提下,话音编码器的比特率越低,一定的带宽内就可以容纳更多的话音通道 。因此,产品制造商和服务提供商们一直在不断地寻求新的话音编码技术, 以便在低比特率下提供高质量的话音。
第10.3节、脉冲编码调制
2、均匀量化 把输入信号的取值范围按照等间隔分割的量化称为均匀量化。均匀量化
的幅度阶梯是等间隔的,也就是说,将整个抽样的动态范围均匀地划分
成2n个阶梯,抽样得到的瞬时抽样值根据对应的台阶分级取整进行量化。 均匀量化的好处是编码器和解码器很容易实现。主要缺点是它产生的量 化噪声也是均匀的,与信号在取样点的幅度无关,无论抽样值的大小如 何,量化噪声的均方根值都固定不变。因此,均匀量化会出现话音弱时 信噪比低、干扰大,而话音强时信噪比高、干扰小的不利情况。由于话 音大都集中在小信号范围内,均匀量化在话音幅度小的时候常常不能满 足信噪比的要求,而在话音幅度大时又会出现没有必要的很大余量,信 号的动态范围将会受到很大限制。为了克服这个缺点,实际应用中一般 采用非均匀量化。
第10.5节、频域话音编码
频域话音编码是另外一种波形编码技术,它利用了人类产生及感觉话音 的模型。在这类编码中,话音信号被分成一系列的频率成分(频带)并
对它们单独进行量化和编码。根据每个频带的感知标准,不同的频带采
用不同的编码优先权。这样,量化噪声就仅包含在本频带中,可以避免 频带以外的谐波失真。这些方案的优点是:每个频带用于编码的比特数 可以动态地改变,并且可以在不同的频带上共享。 不同的频域编码算法的复杂程度各不相同。最常用的频域编码包括子带 编码和自适应变换编码。 子带编码把话音信号分成许多小的子带,然后根据感知标准来给每个 子带编码,用来编码的比特数与各自感知的重要性成正比。 自适应变换编码是对抽样的一个加窗序列的短期变换进行编码,这是 一个更加复杂的技术,它涉及话音波形加窗输入信号段的块变换。