全速率规则脉冲激励线性预测声码器
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
全速率规则脉冲激励线性预测声码器(RPE-LPC)
全速率规则脉冲激励线性预测声码器(RPE-LPC)语音编解码器是改良的线性预测编码器(LPC),它将人类声域建模成一系列不同宽度的圆柱体。
通过迫使空气通过这些柱体,即可产生语音。
LPC编码器用一组联立方程来进行建模。
标准LPC编码器不能提供电话系统所需的话音质量(虽能听清语句,但很难或不可能分辨出说话的人)。
GSM系统中采用两种技术来提高LPC编码器的质量,即:长期预测(LTP)与规则脉冲激励(RPE),而全速率编解码器就被称为RPE-LTP线性预测编码器。
输入至RPE-LTP编码器的数据为包括160个采样值的20ms语音,每一个采样值都拥有13位精度。
数据首先通过预加重滤波器来提高信号的高频分量,以获得更好的传输效率。
滤波器一般还消除信号上的任何偏移以简化进一步的计算。
语音产生模型可看成是空气通过一组不同大小的圆柱体。
短期分析级采用自动相关来计算与模型所用的8个圆柱体有关的8个反射系数,同时采用一种称为Schur递归的技术来有效地求解所得到的方程组。
参数被变换成可以更少的位数来进行更佳量化的LAR(log-area ratio)。
这些是传输流的前8个参数。
然后再将编码后的LAR解码成系数,并用来对输入采样值进行滤波。
解码LAR的原因是为了确保编码器使用解码器上的相同信息来进行滤波。
这一级上的其余采样值用于编解码器的LTP级。
160个采样值被分成4个子窗口,每一个子窗口都拥有40个采样值。
长期预测器为每一子窗口产生2个参数:滞后与增益。
滞后由当前帧与后两帧之间的交叉相关峰值确定,而增益则由归一化交叉相关系数决定。
滞后与增益参数被应用到长期滤波器上,同时对现有短期剩余信号进行预测。
RPE级通过十取一及交错将40个剩余采样值转换成13个参数,并用APCM 将所得出的13个值编码,其中最大值用对数编码成6位,然后再将13个参数均表示成3位,总共45位。
最后一级是从计算出的长期剩余及分析信号来更新短期剩余信号,然后再用此数据来计算下一帧。