清华大学移动通信教程第06讲-信源编码
信源编码详解
M= 213 = 8192,n =13,即每个采样值用13 bit 表示等,
这时在很多情况下,量化精度己足够高了。 (3) M选多少?视具体要求而定。
均匀量化的缺点:
-1 , x<0
符号函数
四、A律、 µ律的数字实现 1) 13折线 实现A律;15 折线 实现µ律!
图 4.3.8 13折线A律
图 4.3.9 15折线µ律
四、A律、 µ律的数字实现 2) 12bit A/D 实现13折线, 13bit A/D ቤተ መጻሕፍቲ ባይዱ现15折线
例以说A律明为 11位A/D只 量化了一 半(正区 间),考 虑负区间---12位A/D
2)非均匀量化特性取决
t
于选取的
qi
( x)能否使
2 e
最小。
4.3.2 非均匀量化(PCM方案)
三、语音非均匀量化的实现
(1) µ律压扩
(2) A律压扩
图 4.3.5 小信号扩张,大信号压缩后
图 4.3.6 再均匀量化= 非均匀量化!
4.3.2 非均匀量化(PCM方案)
三、语音非均匀量化的实现(续)
信号功率 两采样值之间的相关系数
对于有记忆信源:
R(D)
在失真D条件下每采 样值所需的bit数
1 2
log2
2
(1 D
)
, (0 D 2 )
0
, (D > 2 )
量化噪声
假设p=0.96, 2 / D 26dB 采样频率仍为8KHZ,求得 Rb =18~22KHZ! 由 是此不可可知能,的走!波形编码的道路,要想使语音数据率压缩到18KHZ以下
移动通信原理第6次课-第6章BPSK数字调制
第6章 数字调制技术
6.1 关于数字调制的概念
• 下图表明了一个两电位数字信号序列经过短短几十米 双绞线传输后的衰减情况。
6.1.2 数字调制基本原理 • 通常余弦波信号表示为: • s(t) = a(t)cos[w(t)+j(t)] • 其中,t是时间; a(t)是幅度;w(t)是角 频率; j(t)是相位。 • 数字调制就是用基带数字信号0和1去控 制余弦信号的幅度、角频率和/或相位的 变化。随着余弦波在无线信道里传输,基 带数字信号也传输了出去。因此,这种余 弦波被称为载波;它被基带数字信号调制 后成为调制信号。
• 由于一般信道都是通频带有限的带通信道, 脉冲信号中的高频成分将受到严重衰减, 信号前沿由陡峭变得平缓,幅度也受到衰 减,数字信号将严重变形 。这些不良变化 将导致接收机在对数字信号识别时出错。 • 上述在短距离上直接传输数字信号的方法 叫做基带传输。 • 如果需要在长距离的有线信道和无线信道 上传输数字信号必须采用频带传输技术, 即由高频载波信号来载荷数字信号,这就 是数字调制。
• 分别调制载波幅度、频率和相位的2ASK(振幅 键控)、2FSK(频移键控)和2PSK(相移键控) 调 制波形如下:
6.1.3 数字调制的分类
• 数字调制的分类如下表: 不恒定 ASK(幅度键控) 包络 QAM(正交幅度键控) MQAM(星座调制) 数 字 FSK BFSK(二进制频移键控) 调 (频移键控) MFSK(多进制频移键控) 制
数字信号控制的相位,它有有限的M个不同取值,每个相位携 带的信息量I = log 2 M (bit)。 • 例如,当M=2,φk的每一相位携带1bit信息:0或1;当M=4, φk的每一相位携带2bit信息:00、01、10或11;当M=8,φk 的每一相位携带3bit信息:000、001、010、011、100、101、 110或111。 • 在发送端,数字调制器输出的载波信号相位将随输入不同的 数字信号而改变。对于一个数字信号,Sk(t)的相位φk将取一 个特定的值与之对应。
信源编码的基本原理及其应用讲课稿
信源编码的基本原理及其应用信源编码的基本原理及其应用课程名称通信原理Ⅱ专业通信工程班级 *******学号 ******学生姓名 *****论文成绩指导教师 ***********信源编码的基本原理及其应用信息论的理论定义是由当代伟大的数学家美国贝尔实验室杰出的科学家香农在他1948 年的著名论文《通信的数学理论》所定义的,它为信息论奠定了理论基础。
后来其他科学家,如哈特莱、维纳、朗格等人又对信息理论作出了更加深入的探讨。
使得信息论到现在形成了一套比较完整的理论体系。
信息通过信道传输到信宿的过程即为通信,通信中的基本问题是如何快速、准确地传送信息。
要做到既不失真又快速地通信,需要解决两个问题:一是不失真或允许一定的失真条件下,如何提高信息传输速度(如何用尽可能少的符号来传送信源信息);二是在信道受到干扰的情况下,如何增加信号的抗干扰能力,同时又使得信息传输率最大(如何尽可能地提高信息传输的可靠性)。
这样就对信源的编码有了要求,如何通过对信源的编码来实现呢?通常对于一个数字通信系统而言,信源编码位于从信源到信宿的整个传输链路中的第一个环节,其基本目地就是压缩信源产生的冗余信息,降低传递这些不必要的信息的开销,从而提高整个传输链路的有效性。
在这个过程中,对冗余信息的界定和处理是信源编码的核心问题,那么首先需要对这些冗余信息的来源进行分析,接下来才能够根据这些冗余信息的不同特点设计和采取相应的压缩处理技术进行高效的信源编码。
简言之,信息的冗余来自两个主要的方面:首先是信源的相关性和记忆性。
这类降低信源相关性和记忆性编码的典型例子有预测编码、变换编码等;其次是信宿对信源失真具有一定的容忍程度。
这类编码的直接应用有很大一部分是在对模拟信源的量化上,或连续信源的限失真编码。
可以把信源编码看成是在有效性和传递性的信息完整性(质量)之间的一种折中有段。
信源编码的基本原理:信息论的创始人香农将信源输出的平均信息量定义为单消息(符号)离散信源的信息熵:香农称信源输出的一个符号所含的平均信息量为 为信源的信息熵。
信源编码文档
信源编码概述信源编码是信息论的一个重要概念,用于将源信号转换成一系列编码的比特流。
在通信系统中,信源编码被广泛用于提高信息的传输效率和可靠性。
本文将介绍信源编码的基本概念、常见的信源编码方法和应用。
基本概念信源在通信系统中,信源是指产生信息的原始源头。
信源可以是任何可以生成离散或连续信号的设备或系统,比如人的语音、文本、图像等等。
信源编码信源编码是指将信源产生的原始信号转换成一系列编码的比特流。
它的主要目的是通过消除冗余、提高信号的压缩率以及提高传输的可靠性。
码字信源编码中的最小单位被称为码字(codeword)。
码字由编码器根据特定规则生成,每个码字可以表示一个或多个原始信号。
码长码长是指每个码字中的比特数。
它决定了编码器产生的每个码字传输所需的比特数,码长越短,传输效率就越高。
码率码率是指信源编码中每秒传输的码字数量。
它可以用比特/秒(bps)来表示,码率越高表示每秒传输的信息量越大。
常见的信源编码方法均匀编码均匀编码是一种简单的信源编码方法,它将每个原始信源符号映射到固定长度的码字上。
均匀编码适用于信源符号概率分布均匀的情况,例如二进制信源。
霍夫曼编码霍夫曼编码是一种基于信源符号概率分布的编码方法。
它通过将频率较高的信源符号映射到较短的码字,频率较低的信源符号映射到较长的码字来实现压缩。
高斯混合模型编码高斯混合模型编码是一种适用于连续信源的编码方法。
它假设源信号是由多个高斯分布组成的,通过对这些高斯分布进行建模来实现有效的压缩。
游程编码游程编码是一种用于压缩离散信号的编码方法,它基于信源连续出现相同符号的特性。
游程编码将连续出现的相同符号替换为一个计数符号和一个重复符号,从而实现压缩。
信源编码的应用数据压缩信源编码在数据压缩中起着关键作用。
通过使用有效的信源编码方法,可以大大减少传输数据的比特数,从而提高数据传输的效率和速率。
影音编码在数字媒体领域,信源编码常用于音频和视频的压缩。
通过采用适当的信源编码方法,可以减小音频和视频文件的大小,从而节省存储空间和传输带宽。
第5章-信源编码PPT课件
近于最佳编码。
.
14
5.1.2 香农编码-举例P166习题5.1
例:设信源共7个符号消息,其概率和累加概率如下表所示。
信源消 息符号ai
a1 a2 a3 a4 a5 a6 a7
符号概 率p(ai)
0.20 0.19 0.18 0.17 0.15 0.10 0.01
累加概 率Pi
0 0.2 0.39 0.57 0.74 0.89 0.99
第5章 信源编码
.
1
信源编码
如果信源输出符号序列长度L=1,信源符 号集A(a1,a2,…,an),信源概率空间为
P Xp(aa11)
a2 an p(a2) p(an)
若将信源X通过二元信道传输,就必须把信源符 号ai变换成由0,1符号组成的码符号序列,这个 过程就是信源编码 。
.
2
第5章 信源编码
.
16
5.1.2 香农编码-举例(续)
7
平均码长:K p( ai )Ki 3.14码元/符号 i 1
7
信源熵:H( X ) - p(ai )log p(ai ) 2.61比特/符号 i 1
由于信源符号之间存在分布不均匀和相关 性,使得信源存在冗余度,信源编码的主 要任务就是减少冗余,提高编码效率。
.
3
第5章 信源编码
信源编码的基本途径有两个: 使序列中的各个符号尽可能地互相独立,即解
除相关性; 使编码中各个符号出现的概率尽可能地相等,
即概率均匀化。
.
4
第5章 信源编码
信源编码的基础是信息论中的两个编码定理: 无失真编码定理 限失真编ቤተ መጻሕፍቲ ባይዱ定理
lo 2 p (x g i) K i 1 lo 2 p (x g i)
信源编码与信道编码课件
常见的熵编码算法包括哈夫曼编码和算术编码等。
算术编码原理
算术编码是一种基于概率的压缩方法,它将输入数据映射到一个实数范 围内,通过降低该实数范围来达到压缩数据的目的。
信道编码
广泛应用于通信和数据传输领域,如移动通信、卫星通信、光纤通信等。
性能指标的对比
信源编码
压缩比、解码时间、重建数据的失真程度等是其主要性能指标。
信道编码
误码率、抗干扰能力、频谱效率等是其主要性能指标。
06
信源与信道编码的未来发展
信编码的未来发展
视频编码
随着超高清视频和虚拟现实技术的普及,信源编码将更加注重视 频压缩效率,以适应更高的分辨率和帧率。
目的
提高信息传输效率和存储 空间利用率。
方法
通过去除冗余信息、减少 表示信息的比特数等方式 实现。
信源编码的分类
无损压缩
能够完全恢复原始数据的压缩方 法。
有损压缩
无法完全恢复原始数据的压缩方 法,一般用于图像、音频和视频 等多媒体数据的压缩。
信源编码的应用场景
文件压缩
用于减小文件大小,便 于存储和传输。
视频会议
对视频和音频信号进行 压缩,以减小传输带宽
和存储空间。
数字电视
对图像和声音信号进行 压缩,以减小传输带宽
和存储空间。
无线通信
对语音和数据信号进行 压缩,以减小传输带宽
和存储空间。
02
信源编码原理
熵编码原理
熵编码是一种无损数据压缩方法,它利用了数据中存在的冗余和概率分布特性,通 过编码技术去除冗余,达到压缩数据的目的。
《信源编码》课件
= 31
则有
∞
=
=−∞
∞
− = 31
=−∞
′ − 31
例题12-5
∞
= 31
′ − 31
=−∞
(3)接收网络的传输函数2()应设计为
1
2 = 1
0
此时能由()不失真地恢复 。
∞
=
=−∞
∞
− = 5
=−∞
− 5
例题12-4
其频谱图为
例题12-5
【例题12-5】已知某信号 的频谱 如题图(a)所示,将它通过传输函数为1()的滤波器(见题
图(b))后再进行理想抽样。
(1)抽样速率应为多少?
(2)若抽样速率 = 31,试画出已抽样信号()的频谱。
(3)接收网络的传输函数2()应如何设计,才能由()不失真地恢复 ?
例题12-5
解:(1) 通过1 变为 ′ , ′ 与()相乘,所以采样的对象是 ′ 。欲求采样速率,首
先须求得 ′ 的最高频率。
可见, 通过1()后的最高频率仍为1,故抽样频率为 ≥ 21。
1
= 400时
∞
= 400
其频谱图为
=−∞
− 400
例题12-4
【例题12-4】对基带信号 = 2000 + 24000进行理想抽样,为了在接收端能不失真地从已
抽样信号()中恢复 。
(1)抽样间隔应如何பைடு நூலகம்择?
(2)若抽样间隔取为0.2,试画出已抽样信号的频谱图。
0.25
《信源编码》PPT课件
器的存在性,它使输出符号的信息率与信源熵之比接
近于 1 ,即:
若要实现,取无限长 L 的
信源符号进行统一编码。
精选ppt
30
例: 设离散无记忆信源概率空间为
•
信源熵:
H
(
X
)
=
-
∑
i=
p
1
(
xi
)
log
p
(
xi
)
=
2.55
bit
/
符号
对信源符号采用定长二元编码, 要求编码效率η为 90 %
若取 L = 1 ,则
• 信源熵: H ( X ) = 2 . 55 bit / 符号
要求编码效率η为 90 % 用二进制变长编码, m = 2
精选ppt
38
例: 设离散无记忆信源概率空间为
• 信源熵: H ( X ) = 1/4 log4 +3/4 log3/4 = 0. 811 bit / 信源符号
精选ppt
存在唯一可译码
20
K1 =1 , K2 =2 , K3 =3 , K4 =3 。
注意Βιβλιοθήκη Kraft 不等式只是用来说明唯一可译码是 否存在,并不能作为唯一可译码的判据。
如码字 {0,10,010,111} 虽然满足 Kraft 不等式,
但它不是唯一可译码。
精选ppt
21
5.2 无失真信源编码
在不失真或允许失真的条件下,用
尽可能少的符号传送信源信息。
精选ppt
3
• 信道编码: – 是以提高信息传输的可靠性为目的的编码。 – 通常通过增加信源的冗余度来实现。采用的 一般方法是增大码率/带宽。
信源编码知识点总结
信源编码知识点总结一、引言信源编码是数字通信中的一个重要环节,它的作用是将源符号序列转换为码字序列,以便能够方便地存储、传输和解码。
在实际应用中,不同的信源编码算法有不同的适用领域,可以根据实际情况选择合适的编码算法。
二、基本概念1. 信源:信源是指产生消息的实体,它可以是声音、图像、文本等各种形式的信息。
2. 符号:符号是信源所产生的基本单位,它可以是0/1比特、字母、数字或其它形式的符号。
3. 离散信源和连续信源:离散信源是指符号集合有限的信源,可以通过一定的方式对其信号进行采样和量化;而连续信源是指符号集合是无限的信源,信号无法进行离散化处理。
三、信息熵信息熵是度量信源信息量大小的一种方法,它描述了信息的不确定度。
信息熵越大,表示信息的不确定度越大;而信息熵越小,表示信息的不确定度越小。
信息熵的计算公式为:H(X) = -Σp(x)log2p(x)其中,H(X)表示信源的信息熵,p(x)表示信源符号x出现的概率。
四、香农定理香农定理是描述信源编码极限的理论基础,它指出了信源编码的极限压缩率。
其中,信源编码的极限压缩率为信源的信息熵和编码方法的平均码长之间的关系:R ≥ H(X)其中,R表示平均码长。
五、熵编码熵编码是一种利用符号出现概率来确定码字长度的编码方法。
常见的熵编码方法有霍夫曼编码、算术编码等。
熵编码的特点是能够达到香农定理的极限压缩率,因此在实际应用中有着广泛的应用。
六、字典编码字典编码是一种通过查表来实现编码的方法,它可以根据出现频率的不同来确定码字的长度。
常见的字典编码算法有静态字典编码和动态字典编码。
字典编码的特点是在一定程度上可以实现压缩,但通常达不到熵编码的效率。
七、变长编码变长编码是一种根据符号出现概率来确定码字长度的编码方法。
它的特点是可以根据符号出现概率确定码字长度,从而达到一定的压缩效果。
变长编码方法包括前缀编码、霍夫曼编码等。
八、无损编码和有损编码无损编码是一种通过编码解码过程中不损失信息的编码方法,它对信源进行了完全可逆的编码。
信源及信道编码课件
BCH码与RS码
总结词
BCH码(Bose-ChaudhuriHocquenghem码)和RS码(ReedSolomon码)是两种常用的纠错码。
VS
详细描述
BCH码是一类具有循环结构的纠错码,能 够纠正多个随机错误。RS码是一种非二 进制的、具有强纠错能力的纠错码,广泛 应用于光盘、硬盘等数据存储设备。
成压缩码字。
LZ78算法则是在LZ77的基础上 进行改进,它使用字典的方式 进行压缩,能够处理更广泛的 数据类型和格式。
LZ系列算法在实际应用中具有 较高的压缩比和较快的压缩速 度,因此在许多领域都有广泛 的应用。
04
常见信道编码技术
线性分组码
总结词
线性分组码是一种纠错码,它将信息 比特分成若干组,每组包含k个比特, 然后添加r个校验比特,形成一个长度 为n的码字。
卷积码是一种将输入信 息序列分成若干个段, 并利用有限状态自动机 进行编码的方法,它能 够在纠错能力和编码效 率之间进行折衷选择。
03
常见信源编码技术
霍夫曼编码
01
霍夫曼编码是一种无损数据压缩 算法,它利用了数据的概率分布 特性进行编码。
02
在霍夫曼编码中,频繁出现的字 符使用较短的编码,而较少出现
奇偶校验是一种简单的 错误检测方法,通过在 信息码元中添加一个校 验位,使得整个码字的 二进制数中“1”的个数 为偶数(偶校验)或奇 数(奇校验)。
循环冗余校验(CRC) 是一种利用模运算和多 项式除法进行错误检测 的方法,通过生成一个 包含冗余信息的校验码 ,使得在传输过程中出 现错误时能够被检测。
信源及信道编码课件
目录 CONTENT
• 信源编码概述 • 信道编码概述 • 常见信源编码技术 • 常见信道编码技术 • 信源与信道编码的应用场景 • 信源与信道编码的未来发展
信源编码ppt课件
因为 K K L H ( X ) , L log m
所以 R log m
当K达到极限值 H ( X ) 时,编码后的信息传输率 log m
HUST --- Basis for Information Theory
信源编码(主要内容)
信源编码定理
信源编码概念 香农第一定理(变长编码) 香农第三定理
信源编码方法
离散信源编码 连续信源编码* 相关信源编码* 变换编码*
1
HUST --- Basis for Information Theory
1、克拉夫特不等式
信源符号数、码符号数和码字长度之间应满 足什么条件,才能构成即时码?
定 理 设 信 源 符 号 集 X (x1, x2, xn ) , 码 符 号 集 为 Y ( y1, y2, ym ) , 对 信 源 进 行 编 码 , 相 应 的 码 字 为 W (W1,W2, Wn ) ,其分别对应的码长为 k1, k2, kn ,则即时 码存在的充要条件是
HUST --- Basis for Information Theory
3、平均码长
定义 设信源
X P
p
x1
x1
x2
p x2
xn
p xn
编码后的码字分别为W1 ,W2,…,Wn,相应 的码长分别为k1,k2,…,kn。因为是唯一可
译码,信源符号xi和码字Wi一一对应,则平均 码长为
n
K = p(xi )ki
i 1
6
HUST --- Basis for Information Theory
4、信息传输率与信息传输速率
2010_移动通信 第6章 信源编码技术
信道质量差时,信道编码不足以纠正传输错误,此时应改进信 道编码,减小信源编码速率,提高语音质量 信道质量好时,增加信源编,…,a12,对任何速率每20ms更新一次 音调参数,不同速率更新频率不同 码表参数,不同速率更新频率不同
2010-11-17
共50页
35
QCELP不同速率的参数变化
注:1/8速率不是从码表选择,而是伪随机激励
2010-11-17 共50页 36
QCELP速率选择
根据每一帧中的能量与3个门限值的比较 3个门限值的选择基于对背景噪声的估计 每一帧中的能量由自相关函数R(0)的值决定,与门 限T1(Bi)、 T2(Bi)和T3(Bi)(Bi为背景噪声)的关系:
2010-11-17 共50页 3
语音编码分类
2010-11-17
共50页
4
语音编码方法
波形编码:将时间域信号直接变换成数字代码, 目的是尽可能精确再现原始语音波形。基本原理 是在时间轴上对模拟语音按一定速率抽样,然后 将幅度样本分层量化,并用代码表示。 参量编码:又称声源编码,是将信源信号在频域 或其它正交变换域提取特征参量,并转换成数字 代码进行传输。基本原理是以发音机制的模型为 基础,用一套模拟声带频谱特性的滤波器系数和 若干声源参数来描述这个模型,从模拟语音信号 中提取这些特征参量并量化编码 混合编码:将波形编码和参量编码结合起来
2010-11-17
共50页
27
RPE-LTP算法方案
20ms为一帧,分成4个子帧,每个子帧含 40个样点(采样率8kHz) 每个子帧预测误差信号的样点按3:1等间隔 抽取,得到13个样点(共有4种序列) 在4种序列中选择一种对语音波形贡献最 大的序列 找到序列中的最大非零点,用6比特编码 用最大非零点归一化整个序列,用APCM 编码,每个样值各用3个比特编码
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
音频编码的历史(3)
宽带语音:主要应用于会议电视,相当于调幅广播的质量
1988年CCITT制定了G.722 标准:SB-ADPCM 1996 年 左 右 , 美 国 PictureTel 公 司 提 出 PTC - PictureTel Transform Coder 1999 年 9 月 发 布 : “ ITU-T G.722.1 proposed for decision: 7 kHz Audio - Coding At 24 And 32kbit/s For Hands Free Operation In Systems With Low Frame Loss。”
混合编码器(80年代) 利用线性预测、VQ、A-B-S、感觉加权、后滤波等技术。 多脉冲激励线性预测(MPELP 1982 Atal、Remde) 规则脉冲激励线性预测(RPELP 1985 Deprettere、Kroon) 码本激励线性预测(CELP 1985 Manfred、Schroeder、Atal) 8~16kb/s高质量。话音质量高、编码速率低,但算法复杂。
音频编码的历史(4)
音频(Audio):主要应用于娱乐与鉴赏,对于重建信号的音 质有很高的要求,目前采用比特率较高的波形编码技术进 行压缩。可以直接在时域进行,也可以转到频域或其他变 换域进行。 1982年激光唱盘 (CD: Compact Disk)上市。MD:MiniDisk , 日 本 索 尼 公 司 采 用 ATRAC - Adaptive Transform Acoustic Coder压缩技术。 1987数字音频磁带录音 (DAT: Digital Audio Tape) 问 世。 DAB (Digital Audio Broadcasting) 源于欧洲。
压缩的必要性
类型 电话语音 宽带语音 调频广播 CD 光盘 DAB/DAT
带宽 KHZ 0.2~3.4 0.05~7 0.02~15 0.01~20 0.01~20
采样率 比特/样点 KHZ 8 12 16 14 32 16 44.1 16 48 16
比特率 kb/s 96 224 512 705.6 768
音频编码性能评价(1)
1) 编码速率(KBPS、KB/S) 信号带宽:可懂度、自然度、透明度。 200~3400HZ、50~7000HZ、20~15000Hz、10~20000HZ。 采样速率:8KHZ、16KHZ、32KHZ、44.1/48KHZ…。 编码位数R(b/ps) 总速率I(kb/s) 影响重建质量、存储容量、传输带宽 2) 重建语音质量 客观评价: 信噪比 分段信噪比 (一般15DB以上较好,20DB以上相当好)
音频编码的历史(2)
参数编码 波形编码通道声码器(39年,Dudly,二次大战保密电话) LPC声码器(67年,Atal、Schroeder) 同态声码器(69年,Oppenheim) 共振峰声码器(71年,Rabiner、Schafer、Elanagan) MBE声码器(88年,Griffin、Lim) 波形插值(91年,W.B. Kleijn) 2.4kb/s、1.2kb/s、较好;600~800b/s可懂。编码速率低,但自然度差。
音频编码历史(1)
语音 :主要应用于数字电话
波形编码 PCM原理(37年,法Alec Reeres) 电子管PCM(46年,Bell实验室) 晶体管PCM(62年,市话扩容,64kb/s) 单片IC PCM(70年代,微波、卫星、光纤) 增量编码原理(46年,法De Loraine) 自适应增量 CVSD(60年代末,军用,32、16kb/s) Continuously Variable Slope Delta Modulator 连续变化斜率增量调制器 其他编码(70年代,ADPCM、SubBand、ATC、APC等) 在16kb/s以上得到较好的话音质量,话音质量好,但编码速率高。
现有标准(3)
语音编码标准 采样 名称 率 KHz G.711 G.726 G.728 G.729 G.723 G.723 G.722 US1015 替 1015 US1016 GSM IS-54 JDC INMAR SAT IS-95 IS-127-1 8 8 1~8 1.2、4.8、 9.6 QCELP EVRC 95 98 ~3.7 93 8 KB/S 8 8 8 8 8 8 16 8 8 8 8 8 8 8 64 16~40 16 8 5.3 6.3 48~64 2.4 2.4 4.8 13 8 6.7 4.15 PCM ADPCM LD-CELP CS-ACELP ACELP MP-MLQ SB-ADPCM LPC-10 MELP CELP RPE-LT VSELP VSELP IMBE 72 84-88 92 95 95 95 88 82 97 89 88 89 90 91 4.3 4.1 4.1 4.1 3.8 4.0 3.7~4.1 2.5 优于 3.0 3.7 3.7 3.5 3.4 90 DOD 94 1016 95 94 94 32 KB/S 编码速率 KB/S 编码制式 年代 MOS DRT 备注
现有标准(2)
宽带语音 名称 G.722 G.722.1 采样频率 KHZ 编码速率 KB/S 16 16 64、56、48 24、32 编码方式 SB-ADPCM MLT 年代 1988 1999 MOS 分 4.1 4.0 3.7
MLT:Modulated Lapped Transform The algorithm is based on transform technology, using a modulated lapped transform (MLT). It operates on 20 ms frames (320 samples) of audio. Because the transform window (basis function length) is 640 samples and a 50% (320 samples) overlap is used between frames, the effective look-ahead buffer size is 20ms. Hence the total algorithmic delay of 40ms is the sum of the frame size plus look-ahead. All other delays are due to computational and network transmission delays.
现有标准(4)
LPC-10 : Government Standard Linear Predictive Coding Algorithm: LPC-10 MELP:Mixed Excited Linear Predictive Coding CELP:Codebook Excited Linear Predictive Coding ACELP:Algebraic Cocebook Excitation LPC QCELP:Qualcom Cocebook Excitation LPC EVRC:Enhanced Variable Rate Codec LD-CELP:Low Delay-CELP CS-ACELP:Conjugate-Structure Algebraic CELP VSELP:Vector Sum Excitation LPC RPE-LT:Long Time Predictive Regular-Pulse Excitation LPC MPLPC:Multi-Pulse Excitation LPC MP-MLQ:Multipulse Maximum Likelihood Quantization MBE:Multi-Band Excitation Speech Coder CVSD:Continuously Variable Slope Delta Modulator SB-ADPCM : Sub-Band Adaptive Differential Pulse Code Modulation PTC:PictureTel Transform Coder AC-3: Digital Audio Compression Standard, 美国 Dolby AC-2; 公司
音频压缩依据
1) 冗余度 时域样点之间相关(短时、长时) 频域谱的非平坦性(谱包络、谱离散) 统计特性 (去除可恢复) 2) 人耳听觉特性 人耳分辨能力 人耳对不同频段声音的敏感程度不同,通常对低频比对高频更敏感 人耳对语音信号的相位不敏感 人耳掩蔽效应 Masking Effect … 对人耳听不到或感知极不灵敏的声音分量都不妨视为冗余。 可利用听觉心理特性…感觉加权、量化、去除多余分量、后滤波、… (不可恢复)
现有标准(1)
宽带音频 名称 编码方式 MOS 分 Layer1 SB-DBA 4.7 Layer2 SB-DBA 4.6 layer3 SB-DBA-MDCT 3.7 SB:Sub-Band DBA:Dynamic Bit Allocation ISO/MPEG 2(1993) :将采用率扩充到 16、22.05、24KHZ,带宽分别 为 7.5、10.3、11.25KHz。 ISO/MPEGI(1991) 采样频率 KHZ 编码速率 KB/S 48 180+12 48 120+8 48 60+4
音频编码性能评价(3)
3) 编解码延时(ms) 公众网(25ms)、点对点、广播、存储 回声控制或回声抵消 正常通话秩序 与重建质量关系 4) 算法复杂度 硬件、成本 浮点、定点 MIPS、RAM、ROM 5) 其他 抗随机误码和突发误码能力 抗丢包和丢帧能力 对不同信号编码能力 级联或转接能力
音频信号分类、特性及应用
分类 频率范围 动态范围 Hz 200-3400 50-7000 48dB 84dB 采样频 率 kHz 8 16 质量 要求 清晰度 清晰度 主要应用