语音编码的主要方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2.3主要语音编码标准
(1)ccrrr 1972年确定64kbit/s PCM语音编码G711建议,极为广泛地应于数字通信,
数字交换机以及一切语音数字化接口。
(2)ccrllr 1984年确定32kbit/s ADPCM语音编码G721建议,它不仅与PCM有相同
重建语音质量,而且具有比PCM更优良的抗误码性能,己逐渐广泛应用于卫星,海缆 和数字语音插空设备以及可变速率编码器中。这种ADPCM算法在16kbit/s到64kbit/s 的速率范围内其重建语音质量平坦,很适宜于可变速率的应用。 (3)ccrrr 1995年5月采纳了由AT&T公司提出的一种称为低迟延码激励线性预测 (LD-CELP)语音编码方案,作为16kbit/s速率的国际标准,并定为G728建议。LD-CELP 算法特点是将语音短时谱与长时谱预测、增益因子预测等参数不是从输入语音中直接提
.7.
预测编码(APC)、子带编码(sBo及自适应变换编码(ATC)等均属于这一种。但这种方式 所需的编码速率较高,在16kbit/s~64kbit/s速率范围能得到较高的重建质量,而当速率 进一步降低时,语音重建质量就会急剧下降。
(2)参量编码
参量编码,又叫声码化编码。是在信源信号频率域或其它正交域提取特征参量并将 其变换为数字代码进行传输,以及在接收端从数字代码中恢复特征参量,并由特征参量 重建语音信号的一种编码方式。这种方式在提取语音特征参量时,往往会利用某种语音 生成模型在幅度谱七逼近原语音,以使重建语音信号有尽可能高的可懂性,即力图保持 语音的原意,但重建语音的波形与原语音信号的波形却有相当大的区别。这种方式的特 点是编码速率低(1.2kbit/s~2.4kbi怕),但只能达到合成语音的质量(即自然度、讲话者的
字插空设备:(5)存储和转发系统:(6)话音信息录音;仍数字移动无线系统;(8)分组化
话音。 (4)泛欧数字移动通信标准RPF_/LTP(13kbit/s)。这一标准从1982年到1988年经过优 选及严格试验,是从六种提案中优选并制定的。RPE/LTP是以等间隔(每3个抽样)的规
则脉冲序列柬模拟音源,以线性预测残差信号的振幅值为基准决定脉冲位置、残差信号,
(3)复杂度
复杂度决定了编码器硬件的成本和功耗以及软件实现的难度,也影响到语音数据的 实时性。一般越先进的编码器其算法复杂度越高。
(4)ቤተ መጻሕፍቲ ባይዱ音质量
语音质量是指接收端合成语音的可懂度、自然度和清晰度,他们分别反映说话人的 语义、个人信息和被噪声干扰的程度。声音的质量与声音的频率范围有关,一般来说采
样频率范围越宽、声音质量也就越高,而在口电话中,声音的质量还与语音的时延、抖 动等因素有关。
取,而是用50阶长的预测器在后向来实现。传送的信息则只是激励矢量,这就膨寓了传
输比特率。它是用分析综合方法优化出来的5个抽样为一组的激励矢量,因此,5个抽
样就是基本迟延,即5X 1.259s=0.625ms。原CCITr要求编码迟延<Sms,所以,该算法
远优于要求的指标,达到进入公众通信网的标准。LD-CELP的应用领域,CCITT建议 如下:(1)可视电话的伴音:(2)无绳电话机;(3)单路单载波卫星和海事卫星通信;(4)数
东北大学硕士学位论文
第2幸IP电话终端相关的关键技术和标准
Noise
用于确定输入信号是语音还是背景噪声:二是舒适噪声生成(CNG:Comfortable
Generation),主要用于接收端重建背景噪声。目前IP电话一般采用5kbit/s到16kbit/s的 中低速率编码器。 (2)算法时延
语音编码的算法时延指运行编码算法压缩语音信号所带来的时延。开始对语音数据 编码前必须先等待一帧语音数据采样完成,所以, 算法时延=对一帧语音编码所需时间+一帧语音的持续时问。 由于语音通信对时延比较敏感,时延太大的算法不适合于实时语音传输。
2.2.2语音编码的主要方法
目前发展出来的语音编码方法主要有三种,波形编码、参数编码和混合编码
(1)波形编码
波形编码是将时间域信号直接变换为数字代码进行传输,也就是说这种编码是将语 音信号作为一般的波形信号来处理,力图保持重建的语音波形与原语音信号波形一样;
这种编码方式的特点是适应能力强、重建语音的质量高,例如PCM,ADPCM和自适应
以包含长周期预测(LTP)的反馈型量化结果为脉冲振幅。算法亦属_F分析综合法。由于帧 长为20ms甸隔处理,在J下向提取谱包络参数和增益因子等参数,其编码迟延达25ms,
对编译码处卿则总迟延将达60n3s。RPE,l胛编码比特率为13kbit/s,若加入3kbit/s纠错
码保护其中重要参数,这种算法能在误码率为0.1时有足够的可博度,比LD.CELP在同 样速率下有更人的适应性。
可识别性都较差的语音1,当码率提高到与波形编码相当时,语音质量也不如波形编码。 利用参量编码实现语音通信的设备通常称为声码器,例如通道声码器、共振峰声码器、
.6.
东北太学硕士学位论文
第2章lP电话终端相关的关键技术和标准
同态声码器以及广泛应用的线性预测(LPC)声码器等都是典型的语音参量编码器。
∽混合编码
当前由参量编码与波形编码相结合的混合编码的编码器正在得到人们较大的关注。
这种编码器既具备了声码器的特点(利用语音生成模型提取语音参数),又具备了波形编 码的特点(优化擞励信号,使其与输入语音波形相匹配),同时还百r利用感知加权最小均 方误差的准则使编码器成为一个闭环优化的系统,从而在较低的比特率上能获得较高的 语音质量。例如,多脉冲激励线性预测(MPLPC编码),正规脉冲激励线性预测(RPE 编码和码激励线性预测(CELP)编码都属于这一种,这种编码方式能在4kbit/s~16kbit/s 中低编码的速率上得到高质量的重建语音。