全速率规则脉冲激励线性预测声码器

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

全速率规则脉冲激励线性预测声码器(RPE-LPC)

全速率规则脉冲激励线性预测声码器(RPE-LPC)语音编解码器是改良的线性预测编码器(LPC),它将人类声域建模成一系列不同宽度的圆柱体。通过迫使空气通过这些柱体,即可产生语音。LPC编码器用一组联立方程来进行建模。

标准LPC编码器不能提供电话系统所需的话音质量(虽能听清语句,但很难或不可能分辨出说话的人)。GSM系统中采用两种技术来提高LPC编码器的质量,即:长期预测(LTP)与规则脉冲激励(RPE),而全速率编解码器就被称为RPE-LTP线性预测编码器。

输入至RPE-LTP编码器的数据为包括160个采样值的20ms语音,每一个采样值都拥有13位精度。数据首先通过预加重滤波器来提高信号的高频分量,以获得更好的传输效率。滤波器一般还消除信号上的任何偏移以简化进一步的计算。

语音产生模型可看成是空气通过一组不同大小的圆柱体。短期分析级采用自动相关来计算与模型所用的8个圆柱体有关的8个反射系数,同时采用一种称为Schur递归的技术来有效地求解所得到的方程组。参数被变换成可以更少的位数来进行更佳量化的LAR(log-area ratio)。这些是传输流的前8个参数。

然后再将编码后的LAR解码成系数,并用来对输入采样值进行滤波。解码LAR的原因是为了确保编码器使用解码器上的相同信息来进行滤波。这一级上的其余采样值用于编解码器的LTP级。

160个采样值被分成4个子窗口,每一个子窗口都拥有40个采样值。长期预测器为每一子窗口产生2个参数:滞后与增益。滞后由当前帧与后两帧之间的交叉相关峰值确定,而增益则由归一化交叉相关系数决定。滞后与增益参数被应用到长期滤波器上,同时对现有短期剩余信号进行预测。

RPE级通过十取一及交错将40个剩余采样值转换成13个参数,并用APCM 将所得出的13个值编码,其中最大值用对数编码成6位,然后再将13个参数均表示成3位,总共45位。

最后一级是从计算出的长期剩余及分析信号来更新短期剩余信号,然后再用此数据来计算下一帧。

相关文档
最新文档