语音压缩方法综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字存储 媒介
调制器 传输 设备 及 信道
语音译码器
主要内容
语音压缩技术导论 编码方式分类
波形编码(PCM、 DPCM、 ADPCM)
参数编码 混合编码
语言编码的分类:
语音编码的分类:
1. 波形编码:将时域模拟话音的波形信号经过采样、量化 和编码形成数字语音信号。
1. 编码速率较高:16k~64k。 2. 包括:PCM、ADPCM、ΔM、CVSDM、APC等。 3. 占用较高带宽,适合有线。
输出。
量化
量化的过程是将信号转换成离散时间离散幅度的多电平信号。
f t V
1 .5 1.461.5 1.521.5
1 .4
1 .3
1 .2
1.221.2
1 .1
1 .0
0 .9
0.870.9 0.890.9
0 .8
0 .7
0 .6
0 .5
0 .4 0 .3
0.340.3
0 .2
0.460.5 0.220.2
如 律变换、A律变换等。
设 x ( n ) 为语音波形的采样值,则 律压缩定义为:
ln[1|x(n)|]
y(n)F[x(n)]Xm ax
Xm ax
ln(1)
sgn[x(n)]
即将输入语音压缩变换为 y ( n ) ,然后再进行均匀量
化编码。
输 1.0 出 0.8 幅 度 0.6
0.4
0.2
µ= 5 0 0 µ= 1 0 0
µ= 1 0 µ= 5 µ= 0
0.2 0.4 0.6 0.8 1.0 输 入 幅 度 µ律特性的输入输出关系
A律的压缩方法与 律相似,按如下公式进行:
A|x(n)|
|x(n)| 1
y(n)FA[x(n)]
sgn[x(n)] 1lnA
2. 参量编码:基于人类语音的产生机理建立数学模型,根 据输入语音得出模型参数并传输,在收端恢复。
1. 编码速率较低:1.2k~4.8kbps。 2. 包括各种线性预测编码(LPC)方法和余弦声码器等。 3. 语音质量中等,不满足商用要求。
3. 混合编码:波形编码+参量编码(LPAS)
包括GSM的RPE-LPC编码和VSELP编码。
译 信道 低
息源



信系统


23模.. 量散编拟随x化时码(机t) 信是 间 是号把 离 将m离 散 量xssAtt/m散 幅 化D 模 时度后t数转图间的的换x6q-1t连数信模 拟续字号信低号幅信编通的sk度号码数滤字的。形传波输抽成样一msˆqk 信个 t 号 二译D转 进/xˆAq码数t换 制模转成 码换离 组 xˆt
对语音压缩的要求:
1. 编码速率要适合在常用语音信道内传输,一 般要求编码速率在16—2kb/s范围内的情况较 多。
2. 在一定编码速率下,语音质量应尽可能高, 即译码后恢复语音的保真度要尽量高。
3. 编译码时延要小,总时延一般不要大于65ms。
4. 编译码算法复杂度不能太大,以适于用大规 模集成电路实现。
主要内容
语音压缩技术导论 编码方式分类
波形编码(PCM、 DPCM、 ADPCM)
参数编码 混合编码
1、均匀量化PCM 直接对语音信号进行A/D转换。
语音波形信号就被表示成一组用数字编码的脉冲 序列。
这 种 编 码 方 法 被 称 为 脉 冲 编 码 调 制 ( Pulse Coding Modulation,简称PCM)。
PCM编码原理如下图所示。
模拟语 音信号
抗混叠 滤波
A/D转换




编码
数字语 音编码
PCM编码原理图
模数转换要经过抽样、量化和编码三个步骤。
1m .抽t 样是PT把AtM连续时A/间D变模换拟m信q t号 转换成离散时间连干续扰
模拟信幅度的抽抽抽样样信量号。量化编
编数字码通
语音压缩方法综述
巩永稳
主要内容
语音压缩技术导论 编码方式分类
波形编码(PCM、 DPCM、 ADPCM)
参数编码 混合编码
语音压缩:
语音信号是模拟信号,不能直接在数字通信系统 中传输,必须先进行模/数转换,再进行数/模转换, 并且为了降低编码速率和提高语音质量而采用的 一些优化编码技术等这一系列语音编码过程叫做 语音压缩。
如果对小幅度样本使用小的量化间隔,进行精 确量化,而对大幅度样本使用大的量化间隔, 则既可成功地提高信噪比,又可避免大信号的 过载。
量 化 结 果
量化输入
量 化 结 果
量化输入
(a)均匀量化特性
(b)非均匀量化特性
均匀与非均匀量化特性
最常用的非均匀量化方法是对数压扩方法。编码时, 利用语音信号的幅度统计特性,对幅度按对数变换 进行压缩,然后再进行均匀量化。
5/8
4/8
3/8
2/8 1/8
0 111
1
1
1 32 16 8
4
2
128 1
64
1
xa(nT)
A律压扩编码 采用8位二进制编码:C7C6C5C4C3C2C1C0 C7: 表示信号的极性,称为极性码。0为正,1为负。 C6C5C4:表示段落序号,称为段落码。
000 001 010 011 100 101 110 111
Xm ax1ln[A 1| xl(n n)A |/Xm ax]sgn[x(n)]
0Xm ax A 1 A|X x(m na)x|1
ห้องสมุดไป่ตู้
目前,非均匀量化的PCM编码广泛地应用在数字电
话网中,北美和日本主要使用 律压缩,我国则采
用A律压缩。
FA(x)
1
7/8 6/8
5. 坚韧性要好,有较好的抗误码性能。
语音编码的意义:
1.提高通话质量(数字化+信道编码纠错) 2.提高频谱利用率(低码率编码) 3.提高系统容量 (低码率、语音激活技术)
语音压缩系统构成:
输入 语音编码器
语音
数字存储 媒介
输出
语音译码器 语音
输入 语音编码器
语音
输入 语音编码器
语音
信道编码器
0 .1 0.060.1
TS
PCM转换过程举例
原始信号
PAM脉冲
3.2
3.9 2.8
3.4
4.2
1.2
PCM 脉冲 (有量化误差)
PCM 输出
3
4
3
3
4
1
011 100 011 011 001 100
011100011011001100
2、非均匀量化 PCM
在语音信号中,样本的幅度值不是均匀分布的, 信号大量地集中在小幅度值上。
相关文档
最新文档