语音编码技术 G.711 G.723 G.726 G.729
Freeswitch音视频编码支持
Freeswitch音视频编码支持
1. freeswtich对高清(HD)语音编码的支持
freeswitch支持大部分高清语音编码,包括Speex,G.722,G.722.1(Siren) 及SILK,与之对比,asterisk 1.8版本之前只支持采样为8000的常用语音编码,1.10后asterisk开始从新架构其media codec模块,以全面支持高清等宽频语音编码。
2.有些语音编码以模块方式加载(G729等),有的则属于freeswitch core部分(G711),系统默认不加载所有语音编码,对于没有加载的编码,可以通过配置
modules.conf.xml配置,在fs_cli上执行 "show codec" 会显示当前系统已经加载的编码:
type,name,ikey
codec,ADPCM (IMA),mod_spandsp
codec,AMR,mod_amr
codec,G.711 alaw,CORE_PCM_MODULE
codec,G.711 ulaw,CORE_PCM_MODULE
codec,G.722,mod_spandsp
codec,G.723.1 6.3k,mod_g723_1
codec,G.726 16k,mod_spandsp
codec,G.726 16k (AAL2),mod_spandsp
codec,G.726 24k,mod_spandsp
codec,G.726 24k (AAL2),mod_spandsp
codec,G.726 32k,mod_spandsp
G.726音频编解码原理介绍
G.726音频编解码原理介绍
一、PCM
脉冲编码调制(Pulse-code modulation,PCM)是一种模拟信号的数码化方法。PCM将信号的强度依照同样的间距分成数段,然后用独特的数码记号(通常是二进制)来量化。PCM常被用于数码电信系统上,也是计算机和红皮书(数字音乐光盘(Compact Disc Digital Audio, CDDA)规格由飞利浦和Sony制订,规格文件书由于封面红色而称红皮书)中的标准形式。
在数码视频中PCM也是标准,例如使用 ITU-R BT.601。但是PCM并不流行于诸如DVD或DVR的消费性商品上,因为它需要相当大的比特率(DVD格式虽然支持PCM,不过很少使用,不过,许多蓝光光盘使用PCM作音频编码)。
模拟信号转换至4-bit PCM的取样和量化(来自维基百科)
关于采样取样细节可通过“调制(analog-to-digital converter,ADC)”、“解调(digital-to-analog converters, DAC)”相关的基本知识了解,可参照数字电路相关的基础教材,建议先看维基百科。
信息损害来源:
在任何PCM系统中,本质上有两种损害的来源:
•在量化时,取样必须迫于选择接近哪一个整数值(即量化误差)。
•在样本与样本之间没有任何数据,根据取样原理,这代表任何频率大于或等于(fs即采样率)的信号,会产生有损,或者完全消失(aliasing error)。这又称作奈奎斯特频率(Nyquist frequency)。
采样取样限制:
由于所有样本都依据时间取样,重制时至关重要的便是一个准确的振荡器。如果编码或解码时,任何一方的振荡器不稳定,频率漂移就会使输出设备的质量降低。如果两方的频率具有些微的差异,稳定的误差对于质量而言并非巨大的问题。但一旦振荡器并非稳定的(即脉动的间距不相等),不论是音频或者视频上,都将造成巨大的有损。
G.7xx视频音频压缩协议
G.7xx:视频/音频压缩协议
G.7xx:Audio/Voice Compression Protocols
G.7xx 是一组 ITU-T 标准,用于音频压缩和解压缩。它主要用于电话方面。在电话技术中,有两个主要的算法标准,分别定义在 mu-law 算法(美国使用)和 a-law 算法(欧洲及世界其他国家使用)中。两者都是基于对数关系的,但对于计算机的处理来说,后者更为简单。 G.7xx 协议组由以下协议组成:
∙G.711 ―― 64 kbps 信道上的语音频率脉冲编码调制(PCM)
∙G.721 ―― 32 kbit/s 自适应差分脉冲编码调制(ADPCM)
∙G.722 ―― 64 kbit/s 下的 7 kHz 音频编码
∙G.722.1 ――带有低帧损耗的具有免提操作的系统在 24 kbit/s 和 32 kbit/s 上的编码∙G.722.2 ――利用自适应多频率宽带(AMR-WB)以 16 kbit/s 多频率语音编码
∙G.726 ―― 40、32、24、16 kbit/s 自适应差分脉冲编码调制 ADPCM
∙G.727 ―― 5-、4-、 3-和 2-bit/s 嵌入式自适应差分脉冲编码调制 ADPCM
∙G.728 ――利用低延迟代码线性预测以 16 bit/s 进行语音编码
∙G.729 ――利用共扼结构-代数激励编码线性预测(CS-ACELP)以 8 bit/s 进行语音编码
协议结构
主要 Audio Codec 比较:
名称标准化
组织
描述
比特率
(kb/s)
取样
率
(kHz)
帧大
语音压缩编译码算法
语音压缩编译码算法
2009年05月18日星期一14:14
G.729语音压缩编译码算法支持平台:TMS320C54X 说明:G.729语音压缩采用的算法是共轭结构的代数码激励线形预测(CSACELP),是基于CELP编码模型的算法。由于G.729编译码器能够实现很高的语音质量(长话音质)和很低的算法延时,被广泛地应用于数据通信的各个领域,如IP phone和H.323系统等。特色和优点:G.729是在语音信号8KHz取样的基础上,16bit线性PCM后进行编码,压缩后数据速率为8Kbps,具有相当于16:1的高压缩率。性能:通过G.729编译码器实现解码后的语音信号经过主观测试,具有很高的语音质量,基本达到长话音质软件综述:G.729编译码软件用于语音信号的数字化压缩处理,在保证话音较高质量的条件下,降低语音信号传输比特率,减小其占用带宽,从而增加信道容量。在多媒体通信系统中,与其他图象处理软件技术结合,实现多媒体信息的传输。规格:编码时输入为16bitPCM语音信号,输出2进制比特流。译码时输入为2进制比特流,输出16bit PCM语音信号。存储器容量:程序存储器22K字,数据存储器5K字处理器能力: 22.5MIPS 对象硬件平台:TMS320C5000 硬件要求:TMS320C54x 应用软件:code composer studio 曾使用操作系统:DOS , WINDOWS 可用性:用于多媒体通信系统中ITU-T G.723低码率语音编码算法支持平台:C54X 说明:G.723语音编码器是一种用于多媒体通信,编码速率为5.3kbits/s 和6.3kbit/s的双码率编码方案。G.723标准是国际电信联盟(ITU)制定的多媒体通信标准中的一个组成部分,可以应用于IP电话等系统中。其中,5.3kbits/s码率编码器采用多脉冲最大似然量化技术(MP-MLQ),6.3kbits/s码率编码器采用代数码激励线性预测技术。特色和优点:高效实现,便于多路扩展,可利用C5402片内16kRAM实现53coder 性能:达到ITU-TG723要求的语音质量,性能稳定。存储器容量: 所有码率code-程序存储器10.3K字, 数据存储器11.0K字;53编码-程序存储器6.08K字, 数据存储器9.1K字;53解码-程序存储器5.6K, 数据存储器5.8K。处理器能力:53编码-18.7MIPS, 63编码-20.2 MIPS, D解码约2MIPS。对象硬件平台:TMS320C54X 硬件要求:PC机仿真或TM320C54X硬件平台应用软件:Assemble for C54X, C54Xsim22, evm5xxw, C54dsk, Code-Composer(demo)该算法已经应用于本实验室提供的数码录音机方案中。曾使用操作系统:DOS, Window 98 可用性:可用于IP电话语音信源编码或高效语音压缩存储许可性:完全自行开发,自主版权。自适应多码率语音编码算法支持平台:C54X 说明:数字蜂窝系统自适应多码率语音传输编解码器(Adaptive Multi-Rate Speech Codec:AMR)是欧洲电信标准化协会(ETSI)下属的SMG11(Special Mobile Group11)为GSM系统所定制的语音编解码标准,其目的是在半速率信道容量的情况下得到有线语音编解码质量。AMR作为第四代GSM语音编解码标准,提供了一种自适应的解决方法来跟踪快速变化的无线信道情况和本地流量情况。现今的GSM语音和信道编码器工作在固定码率上,这些码率在设计阶段就已经选定,是理想信道性能和信道误码鲁棒性的一个折衷。另一方面,AMR编码器实时根据信道类型(全速率或半速率)选择多种码率中的一种,从而达到语音编码和信道编码的最优组合以满足瞬时的无线信道条件和本地容量需求。AMR提供了从4.75kbits/s到12.2kbits/s的多种码率选择。AMR凭借其优异的性能成为UMTS和ITU第三代系统候选编码。特色和优点:高效实现,利于扩展多路,便于控制多种码率的切换。性能:达到ETSI要求的语音质量,性能稳定存储器容量:程序存储器:16.1K字, 数据存储器19.42K字(所有码率、编解码) 处理器能力:21.2至37.1MIPS(不同码率不同)对象硬件平台:TMS320C54X
1多媒体技术第3章 语音编码
3.1.2 三种话音编译码器
上述的所有波形编译码器完全是在时间域里开 发的,在时域里的编译码方法称为时域法 (time domain approach)。 在开发波形编译码器中,人们还使用了另一种 方法,叫做频域法(frequency domain approach)。例如,在子带编码(sub-band coding,SBC)中,输入的话音信号被分成好 几个频带(即子带),变换到每个子带中的话音 信号都进行独立编码,例如使用ADPCM编码 器编码,在接收端,每个子带中的信号单独解 码之后重新组合,然后产生重构话音信号。它 的优点是每个子带中的噪声信号仅仅与该子带 使用的编码方法有关系。
3.1.1 话音波形的特性
许多话音编码器用一个短期滤波器(short term filter)来模拟声道。但由于声道形状的变化比 较慢,模拟滤波器的传递函数的修改不需要那 么频繁,典型值在20 ms左右。 压缩空气通过声门激励声道滤波器,根据激励 方式不同,发出的话音分成三种类型:浊音 (voiced sounds),清音(unvoiced sounds) 和爆破音(plosive sounds)。
3.1.2 三种话音编译码器
另一种频域波形编码技术叫做自适应变 换编码(adaptive transform coding, ATC)。这种方法使用快速变换(例如离散 余弦变换)把话音信号分成许许多多的频 带,用来表示每个变换系数的位数取决 于话音谱的性质,获得的数据率可低到 16 kb/s。
G.726语音编解码系统的研究和实现
G.726语音编解码系统的研究和实现
随着通信和移动互联网的发展,语音编码的发展速度越来越快,国际电信联盟也在不断的更新编码方案,G.726是国际电信联盟建议的一种波形编码方式,其特点是编码语音质量高,延时短,稳定性好。G.726是基于ADPCM(自适应差分脉冲编码调制)算法的,将标准的G.711输出信号进行再压缩。
G.726是一种非常有效的语音波形编码方案,本文就旨在设计一个G.726编码系统,实现语音的采集、编解码、播放、存储、传输等功能。本文重点研究建议中的各个算法模块在DSP上的实现。
该设计将编码算法从整体上划分为自适应量化和自适应预测两个模块:在自适应量化模块中,分别实现了输入PCM格式转换、差分信号计算、量化定标因子自适应、自适应速度控制、单音信号和转移(瞬变)检测以及自适应量化6个子算法;在自适应预测模块中,实现了反向自适应量化、自适应预测和重建信号子算法。文中详细叙述了算法的硬件实现方案,并从成本,可靠性上都做了考虑,力争朝产品化和商业化上发展。
本文严格遵循ITUG.726标准,按照标准的建议用MATLAB验证了每一编码模块,并创新地对算法进行了优化,满足编码算法MOS得分,算法验证符合要求后将其移植到DSP系统中,同时在一个系统中实现多种速率编码,很好的完成了一个G.726编码系统。
国际互联网流媒体联盟_信息通信技术百科全书——打开信息通信之门_[共2页]
信息通信技术百科全书—打开信息通信之门
(2) G.721标准
G.721标准主要用于64kbit/s与32kbit/s 数字语音信号之间的转换。抽样率为8kHz,每个样
值与预测值的差值用4位编码,因此其编码速率为32kbit/s。编码速率降低了一半,从而网络的可利用空间就增加了一倍。
(3) G.722标准
G.722标准是为调幅广播质量的音频信号压缩制定的,目的是提供比G.711和G.721标准更
高的音质。抽样率为8kHz。编码速率有3种:64kbit/s,56kbit/s和48kbit/s。G.722标准多应用于视听多媒体、视频会议等。
(4) G.723.1标准
G.723.1标准是G.7xx系列标准中编码速率最低的,抽样率为8kHz,可以将一般的语音信号
压缩到5.3kbit/s和6.4kbit/s。主要用于各种网络环境(公用电话网、移动网、互联网等)中的多媒体语音通信。
(5) G.726标准
G.726标准是在G.721和G.723标准的基础上制定的,抽样率为8kHz,可以将64kbit/s的语
音信号转换为4种编码速率:40kbit/s,32kbit/s,24kbit/s和16kbit/s。其中,最为常用的方式是32kbit/s;24kbit/s和16kbit/s用于数字电路倍增设备中的语音传输;40 kbit/s用于数字电路倍增设备中的数据解调信号。
(6) G.728标准
G.728标准抽样率为8kHz,编码速率为16kbit/s,质量与32kbit/s的G.721相当。G.728标准
各种语音编码占用带宽计算
1.语音数据包封装的实现与CODEC
不论在呼叫控制信令上采用何种协议,语音包的传输基本上都基于RTP
(real-time transport protocol RFC 1889/RFC 3350)协议在网络上传输。这是一种为传输实时媒体流而由IETF制定的协议。
几乎所有的VoIP相关产品,都利用RTP收发语音信息。语音包的结构如下所示,在IP层上封装后被送出到网络上,Payload部分的信息量多少取决于所采用的编码方式。
一般说来,在VoIP的世界里采用G.729编码的较多,而在运营商提供的IP
电话服务中则是G.711较多。G.711是在ISDN网中也被使用的CODEC,音质较好,但与G.729相比信息量较多。而G.729则是一种压缩率高且音质也较好的CODEC。在传输一路语音信息时,G.711所需的带宽是64kbps,而G.729只需要8kbps。两者一般都以20msec间隔(这个间隔可变)发送数据包,因此我们可以推算出实际的包大小。
语音信息是一种模拟信号,而将语音转换成数据包首先需要将模拟信号转换为数字信号(数-模转换)。相信大家对此都有所了解,将模拟式的语音信息用数字式传输的过程大致如下图所示。
现有的电话交换网中采用的编码方式是G.711(PCM),在通话的两端必须采用同样的方式分别进行编码/解码操作才能实现语音通话,这里的编码/解码功能合称为CODEC(COder/DECoder)。
VoIP应用中常见的两种具有代表性的CODEC如下:
G.711(PCM方式:PCM=脉码调制:Pulse Code Modulation)
语音编码技术 G.711 G.723 G.726 G.729
• 語音的质量与語音的带宽有关,一般来说频率范 围越宽,語音质量也就越高,但是黨語音信號在 信道中傳輸時,我們期望在人們可接受的音質條 件下,將語音壓縮后進行傳遞。
語音壓縮的必要性
爲什麽我們需要壓縮語音信號呢? • 節省帶寬。 • 語音信號被壓縮后,通過同一帶寬能夠傳送 更多的Voice data。 • 由於語音信號被壓縮,使得原本的帶寬更有 餘量,用戶能夠享受更多的便捷服務 (data/image/video)等等。 對質量的判斷方法: • 信噪比,主观平均判分法(Mean Opinion Scope)
方式三:差分脉冲编码调制 (DPCM)
差分脉冲编码调制(DPCM)
方式四:自适应差分脉冲调制 (ADPCM)
• ADPCM综合了 综合了APCM的自适应特性和 的自适应特性和DPCM系统 综合了 的自适应特性和 系统 的差分特性。 的差分特性。 • 思想:利用自适应改变量化阶大小;用过去的样本 思想:利用自适应改变量化阶大小; 估算下一个输入样本的预测值, 估算下一个输入样本的预测值,使实际值与预测值 之间的差值尽量小. 之间的差值尽量小
• 在非线性量化中,先把模擬信號通過一個壓縮(對數)放大器,再把壓縮 信號通過一個標準的均勻量化器. • 在美國運用µ律压扩,微弱的信號被放大,強的信號被壓縮,設進入壓 擴器的語音電平為W(t),輸出電平為Vo(t),則:
µ为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,取50 <= µ <= 300 • 在歐洲,運用A律压扩
四种语音编码方法简介
四种语⾳编码⽅法简介
G.711编码
G.711 ⼀种⾳频压缩标准,⽤于数字PBX/ISDN上的数字式电话。在G.711中,经过编码的语⾳已经具有了在PSTN中或者通过PBX传输数字语⾳的正确格式。G.711使⽤的是64Kbps的带宽。符合G.711的设备可以与其他G.711设备进⾏通信,但是不能与G.723设备通信。ITU-T在它的G 系列建议中详细介绍了这项标准。
iLBC编码
iLBC 是全球著名语⾳引擎提供商Global IP Sound开发,它是低⽐特率的编码解码器,提供在丢包时具有的强⼤的健壮性。iLBC 提供的语⾳⾳质等同于或超过 G.729 和 G.723.1,并⽐其它低⽐特率的编码解码器更能阻⽌丢包。iLBC 以13.3 kb/s (每帧30毫秒)和15.2 kb/s (每帧20毫秒)速度运⾏,很适合拨号连接。
G.729编码
G.729 ITU-T的标准语⾳算法。它描述了⽤CS-ACELP⽅法以8Kbps的⽐特速率对语⾳进⾏编码/译码的⽅法。
G.723.1编码
G.723.1 ⼀种能够以⾮常低的位速率压缩语⾳或者⾳频信号的压缩技术,它是H.324标准系列的⼀部分。这种编译码⽅式可以使不同的通信设备利⽤⼀种标准化的通信协议进⾏通信。它可以⽤在以6.4或者5.3Kbps产⽣数字⾳频信号的数字式PBX/ISDN上。较⾼的⽐特速率可以提供较⾼的声⾳质量。较低的⽐特速率可以为系统设计⼈员提供更⾼的灵活性。ITU-T在它的G系列建议中详细介绍了这项标准。
Asterisk的语音编码
淺談Asterisk的語音編碼(codec)內容表格1. 1. 語音編碼有關的Asterisk CLI指令 2. 2. 設定檔的編碼名稱使用對照表3. 3. 如何規劃頻寬的需求-語音編碼是關鍵4. 4. 參考連結目前 Asterisk 支援的語音編碼型式及比較表,整理如下表:Codec Sampling Rate(KHZ) Bandwidth(kbps) Nominal Bandwidth(kbps) License RemarksG.711* 8 64 87.2 Open Source G.722 16 48/56/64 Open Source G.723.1 8 5.3/6.3 20.8/21.9 Proprietry G.726 8 16/24/32/40 ?/47.2/55.2/? Open Source G.729** 8 8 31.2 Patented GSM 8 13 Proprietry iLBC 8 15.2/13.3 Free to use Speex 8/16/32 2.15-24.6(NB) 4-44.2(WB) Open Source * G711 有兩種版本,分別稱為 u-law 及 a-law。u-law 主要使用在北美和日本,a-law 則是使用在歐系國家。如果想了解更多有關這兩個不同的差異特性,請參考這篇 G.711 A Law versus u Law。** G729 是目前最常被使用的語音編碼型式,有以下幾個不同的版本。G729: 原始版的編碼G729A: 精簡版的G729,這個相容原始版G729,由於編碼經過簡化所以語音品質較差。G729B: 此編碼有靜音抑制(silence suppression)且與上述幾項不相容。G729AB: 這是有靜音抑制的G729A版本,而且相容 G729B。語音編碼有關的Asterisk CLI指令 CLI> core show codecs [audio|video|image]系統可支援的編碼類型CLI> core show translation系統可用的語音編碼類型及不同類型間作轉換(transcoding) 所需要的時間CLI> core show translation recalc 10重新計算不同語音編碼轉換所需的時間CLI> sip show channel顯示目前的 SIP 通話所使用的語音編碼類型CLI> iax2 show channels顯示目前的 IAX2 通話所使用的語音編碼類型設定檔的編碼名稱使用對照表Codec Name Type within ConfigurationG.711 u-law ulawG.711 a-law alawG.722 g722G.723.1 g723G.726 g726G.729 g729GSM gsmiLBC ilbcSpeex speex常用的設定範例如下:disallow=allallow=ulawallow=alawallow=g729 如何規劃頻寬的需求-語音編碼是關鍵由於網路電話的語音傳遞媒介就是靠網路,所以網路頻寬及網路品質決定了電話網路化的實行效益,這裡的規劃主要指的是IPPBX主機的網路頻寬。頻寬的使用量取決於終端設備使用何種語音編碼類型以及主機容許多少個線上通話數量,所以系統在做規劃時,只要有這兩個數據就可以計算主機需求的總頻寬。以下這些網站
asterisk G711,723,729测试
1.语音编码G.711a测试
#编辑/etc/asterisk/sip_general_additional.conf文件,
+++++++++++++++++++++++++++++++++++
;allow=ulaw
allow=alaw
+++++++++++++++++++++++++++++++++++
#在cli 界面输入reload,重载配置
#用SJPHONE软电话进行通话测试,打开日志,可以观察到下面信息(红字表示使用G711.a进行编码)
Channels:
Channel Audio Input: started
Capability: undefined
Local RTP = 0.0.0.0 : 49152
Local RTCP = 0.0.0.0 : 49153
Remote RTP = 192.168.1.137 : 19072
Remote RTCP = 192.168.1.137 : 19073
RFC2833 Enabled ( Payload Type = 101 )
Channel Audio Output: started
Capability: Microsoft CCITT G.711 A-Law CODEC
Local RTP = 0.0.0.0 : 49152
Local RTCP = 0.0.0.0 : 49153
Remote RTP = 192.168.1.137 : 19072
Remote RTCP = 192.168.1.137 : 19073
2.语音编码G.711μ测试
常见语音编码格式带宽的比较
常见语音编码格式带宽的比较
1 G711u与G729编码格式比较
G711a—编解码格式为G.711 alaw
G711u—编解码格式为G.711 ulaw (the default)
G729—编解码格式为G.729
G729a—编解码格式为G.729a
上面的就是VOIP使用的编码解码格式的,我们到底选择哪个好些呢?针对不同平台包括不同,在这里包月网络电话选择顺序优先选择:G711u,在我们的使用思科linksys p2pt测试时候,使用G729时候,会出现对方自动断线一下然后再接上的情况,而使用G711u的时候很好解决了这问题,没有多次重连接的情况。
我们还有文章:包月网络电话打通但听不到声音解决方法里面说到这个编码的问题,压缩编码也是重点的问题所在,把编码选择:G729, G711u 和G711a,以便更好地提升音质,例如这里的如果使用DBL的网关,在选择语音编码标准请参照以下顺序进行排列:G729
G729a
G729ab
G711u
G711a
G723.1
就是按这上面的排序了。G711u在前,G711a在后,排序好就能相应解决听不到声音的问题。这是语音包传输的解决问题。
此次解决方案很好地解决了包月网络电话打通听不到声音解决方法。
2 G711/G723/G729占用带宽
带宽=包长度×每秒包数=包长度×(1/打包周期)=(Ethernet头+IP头+UDP头+RTP头+有效载荷)×(1/打包周期)=(208bit +160bit+64bit+96bit +有效载荷)×(1/打包周期)=(528bit+(打包周期(秒)×每秒的比特数))×(1/打包周期)=( 528 / 打包周期) +每秒比特数
sip 语音编码标准
sip 语音编码标准
SIP语音编码标准
SIP(Session Initiation Protocol)是一种用于建立、修改和终止会话的网络协议。它是VoIP(Voice over Internet Protocol)中最重要的协议之一。在SIP中,语音编
码标准起着至关重要的作用,它决定了音频数据在SIP会话中的传输和解码方式。本文将介绍常用的SIP语音编码标准以及它们的特点和优势。
1. G.711
G.711是一种用于传送模拟音频信号的语音编码标准。它是SIP中最常用的语
音编码标准之一,也被广泛应用在传统电话网络中。G.711将模拟音频信号转换为
数字信号,并使用脉冲编码调制(PCM)进行数据传输。它提供了高质量的音频
传输,但也需要较高的带宽。G.711主要有两种变种,分别是μ-law和A-law,它
们在不同的地区有不同的应用。
2. G.729
G.729是一种语音编码标准,它能够在较低的带宽下提供较好的音质表现。相
比于G.711,G.729的编码算法更加复杂,因此需要更高的计算能力,但它可以显
著减少网络带宽的占用。G.729编码标准适用于带宽有限的网络环境,比如移动通
信网络或者低速宽带网络。
3. G.722
G.722是一种高质量的语音编码标准,它可以在较低的比特率下实现高音质的
音频传输。G.722通过广泛的声频带宽扩展(Wideband Audio Extension)实现了高
保真音频的编码和解码。这种编码标准适用于需要高音质的语音通信场景,例如音乐播放、会议通话等。
4. Opus
Opus是一种开放源码的音频编码标准,它能够在低比特率和高带宽的网络环
多媒体技术030编码标准和721
Tone and transition detector
G.721-32kbit/s自适应差值脉冲编码调制(ADPCM)
编解码原理 ?自适应原理
–幅 度 自 适 应 –速 度 自 适 应
差值信号计算
Difference signal computation
d ( k ) = s I ( k ) − se ( k )
波 形 编 码
32kb/s 64kb/s
G.721 G.722
4.0~4.5
G.726 G.727 保密话声 2.5~3.5
G.711-话音的PCM编码 G.711-话音的PCM编码 PCM
本建议公布于1972年,它给出话音信号编码的推荐特性。 话音的抽样率为8000Hz。 每个样值采用8位二进制编码。 推荐使用A律和μ律量化。分别给出A律和μ律的定义: 将13位PCM码按A律、14位PCM码按μ律转换8位编码。
Log 2 d q ( k ) − y ( k )
3.32 2.91 2.52 2.13 1.66 1.05 0.031 -∞
差值逆量化
Inverse Adaptive quantizer
量化器归一化输入
I(k)
量化器归一化输出
Log 2 d (k ) − y (k )
[3.12 +∞] 7 [2.72 3.12] 6 [2.34 2.72] 5 [1.91 2.34] 4 [1.38 1.91] 3 [0.62 1.38] 2 [-0.98 0.62] 1 [-∞ -0.98] 0 当需要求解逆量化器输出 d q (k ) 时,
常见语音编码格式带宽的比较
常见语音编码格式带宽的比较
1 G711u与G729编码格式比较
G711a—编解码格式为G.711 alaw
G711u—编解码格式为G.711 ulaw (the default)
G729—编解码格式为G.729
G729a—编解码格式为G.729a
上面的就是VOIP使用的编码解码格式的,我们到底选择哪个好些呢?针对不同平台包括不同,在这里包月网络电话选择顺序优先选择:
G711u,在我们的使用思科linksysp2pt测试时候,使用G729时候,会出现对方自动断线一下然后再接上的情况,而使用G711u的时候很好解决了这问题,没有多次重连接的情况。
我们还有文章:
包月网络电话打通但听不到声音解决方法里面说到这个编码的问题,压缩编码也是重点的问题所在,把编码选择:
G729, G711u和G711a,以便更好地提升音质,例如这里的如果使用DBL的网关,在选择语音编码标准请参照以下顺序进行排列:
G729
G729a
G729ab
G711u
G711aG723.1
就是按这上面的排序了。G711u在前,G711a在后,排序好就能相应解决听不到声音的问题。这是语音包传输的解决问题。
此次解决方案很好地解决了包月网络电话打通听不到声音解决方法。
2 G711/G723/G729占用带宽
按照上面的计算公式:
G711:20ms打包,带宽为=
90.4 Kbit/s
G729:20ms打包,带宽为=
34.4 Kbit/s
G723:
5.3k,30ms打包,带宽为=
22.9 Kbit/s
业界一般按照下表提供的IP网带宽系数和以太网带宽系数来设计网络带宽:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
PCM的量化方式
均匀量化与非均匀量化
Pulse Code Modulation
PCM直接對 直接對speech signal進行編碼。 進行編碼。 直接對 進行編碼
Pulse Code Modulation
Y: 样本值;X:原始值 样本值; : E = Y – X: 量化误差
µ律压扩与A律压扩的介紹
方式二:自适应脉冲编码调制 (APCM)
• APCM是一 种根据输入 信号幅度大 小自动改变 量化阶大小 的一种波形 编码技术。
• DPCM是利用相邻样本之间冗余信息来进行编码的 一种数据压缩技术。 差分脉冲编码调制是根据过去的样本去估算下一 个样本信号的幅度大小,这个值成为预测值,然 后对实际信号值与预测值之差进行量化编码,从 而减少了表示每个样本的位数。 DPCM是对差值进行量化编码,存储或传送的是 差值.
語音壓縮的必要性
爲什麽我們需要壓縮語音信號呢? • 節省帶寬。 • 語音信號被壓縮后,通過同一帶寬能夠傳送 更多的Voice data。 • 由於語音信號被壓縮,使得原本的帶寬更有 餘量,用戶能夠享受更多的便捷服務 (data/image/video)等等。 對質量的判斷方法: • 信噪比,主观平均判分法(Mean Opinion Scope)
方式三:差分脉冲编码调制 (DPCM)
差分脉冲编码调制(DPCM)
方式四:自适应差分脉冲调制 (ADPCM)
• ADPCM综合了 综合了APCM的自适应特性和 的自适应特性和DPCM系统 综合了 的自适应特性和 系统 的差分特性。 的差分特性。 • 思想:利用自适应改变量化阶大小;用过去的样本 思想:利用自适应改变量化阶大小; 估算下一个输入样本的预测值, 估算下一个输入样本的预测值,使实际值与预测值 之间的差值尽量小. 之间的差值尽量小
自适应差分脉冲编码调制
• ADPCM是利用样本与样本之间的高度相关性和量 化阶自适应来压缩数据的一种波形编码技术,在 維持相同的語音質量下,ADPCM允許使用32Kbps 比特速率編碼,是標準64kpbs PCM的一半,CCITT为 此制定了G.721标准,及其延伸標準G.723;G.726 等等。 • ADPCM的输入信号是G.711 PCM代码,它的数据 率为64 kb/s。而ADPCM的输出是用4位表示的差 分信号,它的采样率仍然是8 kHz,它的数据率为 32 kb/s,这样就获得了2∶1的数据压缩。
方式一:脉冲编码调制(PCM)
PCM編碼 編碼: 編碼 採樣率:對於speech signal,用8000次/Second進行採樣. 1:採樣率 採樣率 2:量化 量化:就是把采集到的数值送到量化器(A/D转换器)编码成数字(數 量化 字編碼能夠讓speech signal有較小的失真),量化级数越多,量化误差 就越小,声音质量就越好。 2.1:綫性 均勻 量化 綫性(均勻 量化:採樣率為12bits/次,數據率為96kbit/s. 綫性 均勻)量化 2.2:非綫性 非均勻)量化 非綫性(非均勻 量化:採樣率為8bits/次,數據率為64kbit/s.從節約 非綫性 非均勻 量化 帶寬的角度,PCM採用非綫性量化.对小信号采用小的量化间隔,对大 信号采用大的量化间隔,这样可以用较少的位数编码。
• 在非线性量化中,先把模擬信號通過一個壓縮(對數)放大器,再把壓縮 信號通過一個標準的均勻量化器. • 在美國運用µ律压扩,微弱的信號被放大,強的信號被壓縮,設進入壓 擴器的語音電平為W(t),輸出電平為Vo(t),則:
Baidu Nhomakorabea
µ为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,取50 <= µ <= 300 • 在歐洲,運用A律压扩
各标准比较
編碼方式 64kbps/PCM 32kbps/ADPCM 8kbps/CELP 13kbps/GSM
MOS (Mean Opinion Scope) 4.3 4.1 3.7 3.54
声音类型 电话语音 调幅广播 调频广播 CD 带 宽 200Hz-3.4kHz 50Hz-7kHz 20Hz-15kHz 20Hz-20kHz
• 語音的质量与語音的带宽有关,一般来说频率范 围越宽,語音质量也就越高,但是黨語音信號在 信道中傳輸時,我們期望在人們可接受的音質條 件下,將語音壓縮后進行傳遞。
語音編碼技術
huangni85@163.com
主要内容
• • • • • • • 語音的形成及其帶寬 語音壓縮的必要性 脉冲编码调制(PCM) A-law, mu-law介紹。 自適應編碼調製(APCM) 差分脈衝编码调制(DPCM) 自适应差分脉冲编码调制(ADPCM)
• 标准
語音的帶寬
• 常用的語音信號其帶寬如下: