数字语音编码技术和标准介绍

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

中国新通信（技术版）２００７．７
４１
失真。若采用数字滤波器
来分裂子带，由于存在过
渡带，恢复出来的信号将
出现失真。若正交镜像滤
波器在分裂子带时出现混
叠，它可以在接受端用另
一组正交镜像滤波器来消
除。
２．２Ｇ．７２９，８ｋｂｉｔ／ｓ语音
编码
Ｇ．７２９协议定义了
８ｋｂｉｔ／ｓ码率的共扼结构代
编码标准。１９８４年又公布了Ｇ．７２１标准（１９８６年修
子带编码一般是同波形编码结合使用，如Ｇ．７２２订）。它采用的是自适应差值脉冲编码（ＡＤＰＣＭ），数
使用的是ＳＢ－ＡＤＰＣＭ技术。但子带的划分更多是对据率为３２ｋｂｉｔ／ｓ。以上两个标准实用于２００￣３４００Ｈｚ
频域系数的划分（这可以更好地利用低频带比高频窄带话音信号，已用于公共电话网。针对宽带语音
的特点，不足是编码带宽往往很难再进一步下降。到了重视。ＭＰＥＧ伴音和Ｇ．７２２．１建议中采纳了哈夫
２．预测编码
曼变长编码。
语音信号是非平稳信号，但在短时间段内（一般
衡量语音编码算法的指标很多，最基本的应该
是３０ｍｓ）具有平稳信号的特点，因而对语音信号幅综合考虑四个方面：编码质量、编码速率、编解码的
标，为了保证正常通话，当总时延超过１００ｍｓ时，一
参数编码是建立在人类语音产生的全极点模型般都需要采取回声抵消或回声抑制等措施。
的理论上，参数编码器传输的编码参数也就是全极点模型的参数－基频、线谱对、增益。对语音来说，参
表１ＭＯＳ判分五级标准及相应的描述
数编码器的编码效率最高，但对音频信号，参数编码
１音频数据的压缩技术和编码性能
音频数据是多媒体数据的一种，一般来说实用
于多媒体数据压缩编码的算法都可用于音频数据压缩，但音频信号特别是人类的语音有其自身的特点，如果能针对这些特点展开压缩其效果会更好。音频
５总结与展望
正交失效使基于瑞利散射的光纤裂缝传感失去了最优方式的工程应用，导致需在工程内部构建复
ＭＯＳ评分质量级别
失真级别
器就不太合适。典型的参数编码器有ＬＰＣ－１０、ＬＰＣ－
５
１０Ｅ，当然，Ｇ．７２９、Ｇ．７２３．１以及ＣＥＬＰ（ＦＳ－１０１６）等码
４
本激励声码器都离不开参数编码。
３
４．变换编码
２
一般认为变换编码在语音信号中作用不是很
１
大，但在音频信号中它却是主要的压缩方法。比如，
的Ａ律或 μ 律。ＡＰＣＭ、ＤＰＣＭ和ＡＤＰＣＭ也属于波起误码扩散），很少使用。对存在统计冗余的信号来
形编码的范畴，使用这些技术的标准有Ｇ．７２１、说，统计编码确实可以大大提高编码的效率，所以，
Ｇ．７２６、Ｇ．７２７等。波形编码具有实施简单、性能优良近年来出现的音频编码算法中，统计编码又重新得
数码本激励（ＣＳ－ＡＣＥＬＰ）
语音编解码算法。模拟信
号经过电话带宽滤波，以
ｋｂｉｔ／ｓ。
８ｋＨｚ采样，再转换为１６ｂｉｔＰＣＭ码，送入编码器编
图１是Ｇ．７２２原理框图。发送器将音频信号转码，输出比特流参数，解码器对比特流参数解码，以
换成１６ｋＨｚ、１４ｂｉｔ的数字序列，ＳＢ－ＡＤＰＣＭ编码器同样方式转换为模拟信号。其他格式的信号都要预
Biblioteka Baidu子带－自适应差分量化
ＬＰＣ１０－Ｅ参数编码
ＭＥＬＰ
线性预测编码混合激励ＬＰＣ
ＣＥＬＰ
码本激励ＬＰＣ
ＶＳＥＬＰ
矢量和激励ＬＰＣ
ＲＰＥ－ＬＴＰ混合编码
ＬＤ－ＣＥＬＰ
长时预测规则脉冲激励ＬＰＣ低时延码激励ＬＰＣ
ＣＳ－ＡＣＥＬＰ
共扼结构－代数码激励ＬＰＣ
ＭＰ－ＭＬＱ－ＡＣＥＬＰ多脉冲－极大似然量化－代数码激励
数字语音编码技术
和标准介绍
李娜１，３王中元２胡瑞敏１，２朱福喜１
（１．武汉大学计算机学院武汉４３００７２）（２．武汉大学国家多媒体软件工程技术研究中心武汉４３００７２）（３．武汉大学档案馆武汉４３００７２）
摘要文章对数字语音或音频编码技术进行了归纳，并比较和分析了今年来ＩＴＵ－Ｔ制订的语音编码标准，重点论述了Ｇ．７２９等几种主要的话音编码标准的基本原理。最后，对音频压缩的方展趋势进行了展望。关键词语音编码音频编码ＩＴＵ－Ｔ标准
拱坝安全监控跨越地域较大，监测点数量多，杂的特定构型的光纤监测网络。这种复杂的网络构
在汛期时要求系统通讯速率高，轮询响应时间短。监型既增加了光纤传感工程应用的困难，同时还会进
控的大部分作业点分散于野外，环境恶劣，其中还有一步降低传感光纤的工程存活率和缝宽量程，因而
许多是无人值守的设备或监测点，不适合搭建有线需进一步探索研究结构简单、工程实用的新型混凝
度进行预测编码是一种很自然的做法。最简单的预复杂程度、编解码时延。编码质量可以采用主客观评
测是相邻两个样点间求差分，编码差分信号，如价，但数学意义上的最小误差不见得有最好的感官
Ｇ．７２１。但更广为应用的是语音信号的线性预测编码质量，所以ＭＯＳ（ＭｅａｎＯｐｉｎｉｏｎＳｃｏｒｅ）判分广泛应用。
ＳＱＶＨ
标量量化矢量哈夫曼编码
变换编码ＭＰＥＧ
多子带感知编码
ＡＣ－３
感知编码
数据率
６４ｋｂｉｔ／ｓ
３２ｋｂｉｔ／ｓ１６￣４０ｋｂｉｔ／ｓ１６￣４０ｋｂｉｔ／ｓ４８￣６４ｋｂｉｔ／ｓ２．４ｋｂｉｔ／ｓ２．４ｋｂｉｔ／ｓ４．８ｋｂｉｔ／ｓ８ｋｂｉｔ／ｓ１３．２ｋｂｉｔ／ｓ１６ｋｂｉｔ／ｓ８ｋｂｉｔ／ｓ５．３／６．３ｋｂｉｔ／ｓ２４，３２ｋｂｉｔ／ｓ１２８ｋｂｉｔ／ｓ３００ｋｂｉｔ／ｓ
号。当６４ｋｂｉｔ／ｓ内要有辅助数据通道时，需要增加数按帧计算ＣＥＬＰ模型参数（ＬＰ系数、码本增益、基音
据插入装置和数据分解装置。数据插入装置在发送和码本索引），将参数编码传送。帧编码参数比特分
端，它为每８ｂｉｔ增加１或２ｂｉｔ音频数据，以提供８或配见表３。解码器将接收到的参数解码，得到激励和
带感觉重要的特点），故子带编码中，往往先要应用（５０￣７ｋＨｚ），ＣＣＩＴＴ制定了Ｇ．７２２编码标准，它的数
某种变换方法得到频域系数，在Ｇ．７２２．１中使用据率为６４ｋｂｉｔ／ｓ、５６ｋｂｉｔ／ｓ、４８ｋｂｉｔ／ｓ。它可用于综合业
ＭＬＴ变换，系数划分为１６个子带；ＭＰＥＧ伴音中用务数字网（ＩＳＤＮ）的Ｂ通道上传输音频数据。之后公
（ＬＰＣ）。几乎所有的基于语音信号产生的全极点模型ＭＯＳ得分采用五级评分标准，如表１所示。对于数字
的参数编码器都要用到ＬＰＣ，如Ｇ．７２８、Ｇ．７２９、传输系统来说，编解码的复杂程度不应该影响实时
Ｇ．７２３．１建议。
处理，否则没有意义。编解码时延也是一个重要的指
３．参数编码
中国新通信（技术版）２００７．７
３９
信号压缩的算法主要有下面几种。
ＦＦＴ或ＭＤＣＴ变换，划分的子带多达３２个。
１．波形编码
６．统计编码
波形编码是最简单也是应用最早的语音编码方
统计编码在图像编码中大量应用，但在语音编
法。最基本的一种就是ＰＣＭ编码，如Ｇ．７１１建议中码中出于对编码器整体性能的考虑（变长编码易引
优
不察觉
良
刚有察觉
可
有察觉且稍觉可厌
差
明显察觉且可厌但可忍受
坏
不可忍受
ＭＰＥＧ伴音压缩算法（含著名的ＭＰ３）用到ＦＦＴ、
２语音编码标准
ＭＤＣＴ变换，ＡＣ－３杜比立体声也用到ＭＤＣＴ，Ｇ．７２２．１
建议中采用的ＭＬＴ变换。在近年来出现的低速率语
国际电报电话咨询委员会（ＣＣＩＴＴ）和国际标准
公共网
４．２
ＣＤ
５．０
音响
５．０
布的Ｇ．７２３．１建议中码率为５．３ｋｂｉｔ／ｓ和６．３ｋｂｉｔ／ｓ，Ｇ．７２６中的码率为４０ｋｂｉｔ／ｓ、３２ｋｂｉｔ／ｓ、２４ｋｂｉｔ／ｓ、１６ｋｂｉｔ／ｓ。ＣＣＩＴＴ于１９９０年通过了１６￣４０ｋｂｉｔ／ｓ镶嵌式ＡＤＰＣＭ标准Ｇ．７２７。低码率、短时延、高质量是人们期望的目标。在ＡＴ＆ＴＢｅｌｌ实验室１６ｋｂｉｔ／ｓ短时延码激励（ＬＤ－ＣＥＬＰ）编码方案的基础上，经过优化，ＣＣＩＴＴ在１９９２年和１９９３年分别公布了浮点和定点算法的Ｇ．７２８标准。该算法时延小于２ｍｓ。话音质量可达ＭＯＳ４分以上。ＩＳＯ运动图像专家组在制定运动图像编码标准的同时，为图像伴音制定了２０ｋＨｚ带宽的１２８ｋｂｉｔ／ｓ标准。１９８８年欧洲数字移动通信ＧＳＭ指定了泛美数字移动通信网的１３ｋｂｉｔ／ｓ长时预测规则脉冲激励（ＲＰＥ－ＬＴＰ）语音编码标准。１９８９年北美蜂窝电话工业组织（ＣＴＩＡ）公布了北美数字移动通信标准，它采用自适应码本激励。日本的数字移动通信标准是６．７ｋｂｉｔ／ｓ的ＶＳＥＬＰ（矢量和激励线性预测）。国
标准
应用
质量
Ｇ．７１１
Ｇ．７２１Ｇ．７２６Ｇ．７２７Ｇ．７２２ＦＳ－１０１５
公共网ＩＳＤＮ配音
保密话音
４．０￣４．５２．５￣３．５
ＦＳ－１０１６
ＧＳＭＧ．７２８Ｇ．７２９Ｇ．７２３．１Ｇ．７２２．１
军事通信移动通信
公用网ＩＳＤＮ
３．７￣４．０
ＩＰ－Ｖｏｃ移动通信
ＰＳＴＮＨ．３２４
４０
ＣＨＩＮＡＮＥＷＴＥＬＥＣＯＭＭＵＮＩＣＡＴＩＯＮＳ（ＴｅｃｈｎｉｃａｌＥｄｉｔｉｏｎ）ＪＵＬ２００７Ｎｏ．１３
表２语音编码算法和标准
算法ＰＣＭＡ（μ）ＡＰＣＭ波形编码ＤＰＣＭ
均匀量化Ａ（μ）律自适应量化差分量化
名称
ＡＤＰＣＭ
自适应差分量化
ＳＢ－ＡＤＰＣＭ
本建议公布于１９８８年。它给出５０￣７０００Ｈｚ音频编码系统的特性，可用于各种高质量语音应用。编码系统采用子带自适应差分脉冲编码技术（ＳＢ－ＡＤ－ＰＣＭ），比特率为６４ｋｂｉｔ／ｓ。称为６４ｋｂｉｔ／ｓ（７ｋＨｚ）音频编码。应用ＳＢ－ＡＤＰＣＭ技术，整个频带被分为高低两个子带，用ＡＤＰＣＭ分别对每个子带编码。系统有三个基本工作模式，相应的比特率是６４、５６和４８
际电信联盟（ＩＴＵ）正在制定更低码率高质量短时延的音频编码标准，码率限制在４ｋｂｉｔ／ｓ，已有几家大公司和研究组织提出了竞选方案，ＩＴＵ正在组织评估测试，预计明年上半年就可以发布。
上述算法和标准广泛用于多媒体技术和通信中。如多媒体节目中的音频编码、可视电话、语音电子邮件、语音信箱、电视会议系统中。下面简单介绍几种常用的语音编码标准。２．１Ｇ．７２２，６４ｋｂｉｔ／ｓ（７ｋＨｚ）音频编码
音编码算法中，ＳＴＣ（正弦变换编码）和ＷＩ（波形插化组织（ＩＳＯ）先后提出一系列有关语音编码的建议，
值）占有重要的位置，小波变换和Ｇａｂｏｒ变换在其中表２中列出了一些流行的语音编码算法和国际标
有用武之地。
准。１９９２年首先制定了Ｇ．７１１６４ｋｂｉｔ／ｓＡ（μ）律ＰＣＭ
５．子带编码
将其降低到６４ｋｂｉｔ／ｓ。解码器执行编码器的逆操作，先化为１６ｂｉｔＰＣＭ码，解码后再转换回来。
由操作方式决定，它可对６４、５６或４８ｋｂｉｔ／ｓ音频编码
ＣＳ－ＡＣＥＬＰ编码器建立在码本激励模型的基础
解码。接收器从１４ｂｉｔ的１６ｋＨｚ抽样序列重构音频信上，８ｋＨｚ采样信号每１０ｍｓ为一帧（含８０个样本），
通讯网络，基于ＧＰＲＳ的信息监测的无线传输是新土大坝裂缝光纤监测技术。
时代通信技术的产物，是发展的趋势。
参考文献
［１］吴永红．光纤光栅水工渗压传感器封装的结构分析与实验．成都：四川大学，２００３［２］王惠文．光纤传感技术与应用．北京：国防工业出版社，２００１［３］江毅，ＬＥＵＮＧＫＹＣ．光纤裂缝传感器中裂缝宽度与光纤损耗关系分析．北京理工大学学报，２００３［４］中华人民共和国水利部国际合作与科技司．水利技术标准汇编（水利水电卷·仪器）．北京：中国水利水电出版社，２００２［５］吴永红等．混凝土高拱坝裂缝光纤监测网络构型的优化．水利水电科技进展，第２６卷第６期，２００６年１２月