数字语音编码技术和标准介绍
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国新通信(技术版) 2007.7
41
失真。若采用数字滤波器
来分裂子带,由于存在过
渡带,恢复出来的信号将
出现失真。若正交镜像滤
波器在分裂子带时出现混
叠,它可以在接受端用另
一组正交镜像滤波器来消
除。
2.2 G.729,8kbit/s 语 音
编码
G.729 协 议 定 义 了
8kbit/s 码率的共扼结构代
编码标准。1984 年又公布了 G.721 标准 (1986 年修
子带编码一般是同波形编码结合使用,如 G.722 订)。它采用的是自适应差值脉冲编码(ADPCM),数
使用的是 SB- ADPCM 技术。但子带的划分更多是对 据率为 32kbit/s。以上两个标准实用于 200 ̄3400Hz
频域系数的划分 (这可以更好地利用低频带比高频 窄带话音信号,已用于公共电话网。针对宽带语音
的特点,不足是编码带宽往往很难再进一步下降。 到了重视。MPEG 伴音和 G.722.1 建议中采纳了哈夫
2. 预测编码
曼变长编码。
语音信号是非平稳信号,但在短时间段内(一般
衡量语音编码算法的指标很多,最基本的应该
是 30ms)具有平稳信号的特点,因而对语音信号幅 综合考虑四个方面:编码质量、编码速率、编解码的
标,为了保证正常通话,当总时延超过 100ms 时,一
参数编码是建立在人类语音产生的全极点模型 般都需要采取回声抵消或回声抑制等措施。
的理论上,参数编码器传输的编码参数也就是全极 点模型的参数 - 基频、线谱对、增益。对语音来说,参
表 1 MOS 判分五级标准及相应的描述
数编码器的编码效率最高,但对音频信号,参数编码
1 音频数据的压缩技术和编码性能
音频数据是多媒体数据的一种,一般来说实用
于多媒体数据压缩编码的算法都可用于音频数据压 缩,但音频信号特别是人类的语音有其自身的特点, 如果能针对这些特点展开压缩其效果会更好。音频
5 总结与展望
正交失效使基于瑞利散射的光纤裂缝传感失去 了最优方式的工程应用,导致需在工程内部构建复
MOS 评分 质量级别
失真级别
器就不太合适。典型的参数编码器有 LPC- 10、LPC-
5
10E,当然,G.729、G.723.1 以及 CELP(FS- 1016)等码
4
本激励声码器都离不开参数编码。
3
4. 变换编码
2
一般认为变换编码在语音信号中作用不是很
1
大,但在音频信号中它却是主要的压缩方法。比如,
的 A 律或 μ 律。APCM、DPCM 和 ADPCM 也属于波 起误码扩散),很少使用。对存在统计冗余的信号来
形 编 码 的 范 畴 , 使 用 这 些 技 术 的 标 准 有 G.721、 说,统计编码确实可以大大提高编码的效率,所以,
G.726、G.727 等。波形编码具有实施简单、性能优良 近年来出现的音频编码算法中,统计编码又重新得
数码本激励(CS- ACELP)
语音编解码算法。模拟信
号经过电话带宽滤波,以
kbit/s。
8kHz 采样,再转换为 16bit PCM 码,送入编码器编
图 1 是 G.722 原理框图。发送器将音频信号转 码,输出比特流参数,解码器对比特流参数解码,以
换成 16kHz、14bit 的数字序列,SB- ADPCM 编码器 同样方式转换为模拟信号。其他格式的信号都要预
Biblioteka Baidu子带 - 自适应差分量化
LPC10- E 参数编码
MELP
线性预测编码 混合激励 LPC
CELP
码本激励 LPC
VSELP
矢量和激励 LPC
RPE- LTP 混合编码
LD- CELP
长时预测规则脉冲激励 LPC 低时延码激励 LPC
CS- ACELP
共扼结构 - 代数码激励 LPC
MP- MLQ- ACELP 多脉冲 - 极大似然量化 - 代数码激励
数字语音编码技术
和标准介绍
李 娜 1,3 王中元 2 胡瑞敏 1,2 朱福喜 1
(1. 武汉大学计算机学院 武汉 430072) (2.武汉大学国家多媒体软件工程技术研究中心 武汉 430072) (3. 武汉大学档案馆 武汉 430072)
摘 要 文章对数字语音或音频编码技术进行了归纳,并比较和分析了今年来 ITU- T 制订的语音编码 标准,重点论述了 G.729 等几种主要的话音编码标准的基本原理。最后,对音频压缩的方展趋势进行了 展望。 关键词 语音编码 音频编码 ITU- T 标准
拱坝安全监控跨越地域较大,监测点数量多, 杂的特定构型的光纤监测网络。这种复杂的网络构
在汛期时要求系统通讯速率高,轮询响应时间短。监 型既增加了光纤传感工程应用的困难,同时还会进
控的大部分作业点分散于野外,环境恶劣,其中还有 一步降低传感光纤的工程存活率和缝宽量程,因而
许多是无人值守的设备或监测点,不适合搭建有线 需进一步探索研究结构简单、工程实用的新型混凝
度进行预测编码是一种很自然的做法。最简单的预 复杂程度、编解码时延。编码质量可以采用主客观评
测是相邻两个样点间求差分,编码差分信号,如 价,但数学意义上的最小误差不见得有最好的感官
G.721。但更广为应用的是语音信号的线性预测编码 质量,所以 MOS(Mean Opinion Score)判分广泛应用。
SQVH
标量量化矢量哈夫曼编码
变换编码 MPEG
多子带感知编码
AC- 3
感知编码
数据率
64kbit/s
32kbit/s 16 ̄40kbit/s 16 ̄40kbit/s 48 ̄64kbit/s 2.4kbit/s 2.4kbit/s 4.8kbit/s 8kbit/s 13.2kbit/s 16kbit/s 8kbit/s 5.3/6.3kbit/s 24,32kbit/s 128kbit/s 300kbit/s
号。当 64kbit/s 内要有辅助数据通道时,需要增加数 按帧计算 CELP 模型参数(LP 系数、码本增益、基音
据插入装置和数据分解装置。数据插入装置在发送 和码本索引),将参数编码传送。帧编码参数比特分
端,它为每 8bit 增加 1 或 2bit 音频数据,以提供 8 或 配见表 3。解码器将接收到的参数解码,得到激励和
带感觉重要的特点),故子带编码中,往往先要应用 (50 ̄7kHz),CCITT 制定了 G.722 编码标准,它的数
某种变换方法得到频域系数,在 G.722.1 中使 用 据率为 64kbit/s 、56kbit/s、48kbit/s。它可用于综合业
MLT 变换,系数划分为 16 个子带;MPEG 伴音中用 务数字网(ISDN)的 B 通道上传输音频数据。之后公
(LPC)。几乎所有的基于语音信号产生的全极点模型 MOS 得分采用五级评分标准,如表 1 所示。对于数字
的 参 数 编 码 器 都 要 用 到 LPC, 如 G.728、G.729、 传输系统来说,编解码的复杂程度不应该影响实时
G.723.1 建议。
处理,否则没有意义。编解码时延也是一个重要的指
3. 参数编码
中国新通信(技术版) 2007.7
39
信号压缩的算法主要有下面几种。
FFT 或 MDCT 变换,划分的子带多达 32 个。
1. 波形编码
6. 统计编码
波形编码是最简单也是应用最早的语音编码方
统计编码在图像编码中大量应用,但在语音编
法。最基本的一种就是 PCM 编码,如 G.711 建议中 码中出于对编码器整体性能的考虑 (变长编码易引
优
不察觉
良
刚有察觉
可
有察觉且稍觉可厌
差
明显察觉且可厌但可忍受
坏
不可忍受
MPEG 伴音压缩算法 (含著名的 MP3) 用到 FFT、
2 语音编码标准
MDCT 变换,AC- 3 杜比立体声也用到 MDCT,G.722.1
建议中采用的 MLT 变换。在近年来出现的低速率语
国际电报电话咨询委员会(CCITT)和国际标准
公共网
4.2
CD
5.0
音响
5.0
布的 G.723.1 建议中码率为 5.3 kbit/s 和 6.3 kbit/s, G.726 中的码率为 40kbit/s、32kbit/s、24kbit/s、16kbit/s。 CCITT 于 1990 年通过了 16 ̄40kbit/s 镶嵌式 ADPCM 标准 G.727。低码率、短时延、高质量是人们期望的目 标 。 在 AT&T Bell 实 验 室 16kbit/s 短 时 延 码 激 励 (LD- CELP)编码方案的基础上,经过优化,CCITT 在 1992 年和 1993 年分别公布了浮点和定点算法的 G.728 标准。该算法时延小于 2ms。话音质量可达 MOS 4 分以上。ISO 运动图像专家组在制定运动图像 编码标准的同时,为图像伴音制定了 20kHz 带宽的 128kbit/s 标准。1988 年欧洲数字移动通信 GSM 指定 了泛美数字移动通信网的 13kbit/s 长时预测规则脉 冲激励(RPE- LTP)语音编码标准。1989 年北美蜂窝 电话工业组织 (CTIA) 公布了北美数字移动通信标 准,它采用自适应码本激励。日本的数字移动通信标 准是 6.7kbit/s 的 VSELP (矢量和激励线性预测)。国
标准
应用
质量
G.711
G.721 G.726 G.727 G.722 FS- 1015
公共网 ISDN 配音
保密话音
4.0 ̄4.5 2.5 ̄3.5
FS- 1016
GSM G.728 G.729 G.723.1 G.722.1
军事通信 移动通信
公用网 ISDN
3.7 ̄4.0
IP- Voc 移动通信
PSTN H.324
40
CHINA NEW TELECOMMUNICATIONS (Technical Edition) J UL 2007 No.13
表 2 语音编码算法和标准
算法 PCM A (μ) APCM 波形编码 DPCM
均匀量化 A (μ)律 自适应量化 差分量化
名称
ADPCM
自适应差分量化
SB- ADPCM
本建议公布于 1988 年。它给出 50 ̄7000Hz 音频 编码系统的特性,可用于各种高质量语音应用。编码 系统采用子带自适应差分脉冲编码技术(SB- AD- PCM),比特率为 64kbit/s。称为 64kbit/s(7kHz)音频 编码。应用 SB- ADPCM 技术,整个频带被分为高低 两个子带,用 ADPCM 分别对每个子带编码。系统有 三个基本工作模式,相应的比特率是 64、56 和 48
际电信联盟(ITU)正在制定更低码率高质量短时延 的音频编码标准,码率限制在 4kbit/s,已有几家大公 司和研究组织提出了竞选方案,ITU 正在组织评估 测试,预计明年上半年就可以发布。
上述算法和标准广泛用于多媒体技术和通信 中。如多媒体节目中的音频编码、可视电话、语音电 子邮件、语音信箱、电视会议系统中。下面简单介绍 几种常用的语音编码标准。 2.1 G.722,64kbit/s(7kHz)音频编码
音编码算法中,STC(正弦变换编码)和 WI(波形插 化组织(ISO)先后提出一系列有关语音编码的建议,
值)占有重要的位置,小波变换和 Gabor 变换在其中 表 2 中列出了一些流行的语音编码算法和国际标
有用武之地。
准。1992 年首先制定了 G.711 64kbit/s A(μ)律 PCM
5. 子带编码
将其降低到 64kbit/s。解码器执行编码器的逆操作, 先化为 16bit PCM 码,解码后再转换回来。
由操作方式决定,它可对 64、56 或 48kbit/s 音频编码
CS- ACELP 编码器建立在码本激励模型的基础
解码。接收器从 14bit 的 16kHz 抽样序列重构音频信 上,8kHz 采样信号每 10ms 为一帧 (含 80 个样本),
通讯网络,基于 GPRS 的信息监测的无线传输是新 土大坝裂缝光纤监测技术。
时代通信技术的产物,是发展的趋势。
参考文献
[1] 吴永红. 光纤光栅水工渗压传感器封装的结构分析与实验. 成都:四川大学,2003 [2] 王惠文. 光纤传感技术与应用 . 北京:国防工业出版社,2001 [3] 江毅,LEUNG K Y C. 光纤裂缝传感器中裂缝宽度与光纤损耗关系分析. 北京理工大学学报,2003 [4] 中华人民共和国水利部国际合作与科技司. 水利技术标准汇编(水利水电卷·仪器). 北京:中国水利水电出版社,2002 [5] 吴永红等. 混凝土高拱坝裂缝光纤监测网络构型的优化. 水利水电科技进展,第 26 卷第 6 期,2006 年 12 月