语音信号处理课件第七章.ppt
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
矢量量化系统通常可以分为两个映射的乘积 Q 式中:α是编码器,它是将输入矢量 信道符号集IN={i1, i2, …, iN}中的一个元素ij ;
K X R 映射为
β是译码器,它是将信道符号集 ij映射为码书中的一 个码字Yi 。即
α( X )= ij β(ij )= Yi X∈χ, ij ∈ IN ij ∈ IN Yi∈ YN
{ x n}
X1
X2
X3 X4 Xn/4
图示输入信号序列{xn},每4 个样点构成一个矢量 (取K=4),共得到n/4个4维矢量: X1,X2,X3,…,Xn/4
矢量量化就是先集体量化X1 ,然后量化X2, 依次向下量化。下面以 K=2为例说明其量化过程。
a2 Y3 Yi Si a1 Y5 Y6 (a) 图 7.2 (b) 矢量量化示意图 Y4 S1 Y1 a2 Y2 a1 Y7
(1)最佳划分
Y , Y , , Y N 1 2 N 给定码书 ,可以用最近邻准则NNR得 到最佳划分。图7.4为最佳划分示意图。
•Y3 • •Y6 •Y4 · •Y1 •Yj S1 • •X Sj • • •
S2 •Y2
•YN
•
•
图7.4 最佳划分示意图
最佳划分定义:
信源空间χ中任一点X,若X∈Sj,当且仅当矢量X与码 字Yj的失真小于X和其它码字 Yi N 失真,即:
出矢量Y=q(X)的失真平均值而定,失真平均值为: D(Q,F)=E[d(X,Y)]=E[d(X,q(X))]
补充: 矢量量化与标量量化的比较
矢量量化是把一个 K 维模拟矢量映射为一个 K
维量化矢量。标量量化实际是维数K=1的矢量量化。
一般情况下,矢量量化均指K≥2的多维量化。与标
量量化的两个主要步骤相对应,矢量量化首先要 将抽样值构成的矢量即K维空间的无穷多点划分成 有限个胞腔,然后从每一个胞腔取一个代表值, 凡是落入该胞腔的矢量均用该代表值进行量化。
d X , Y X Y W X Y
T
式中
T —— 矩பைடு நூலகம்转置符号; W —— 正定加权矩阵。
要使所选用的失真测度有实际意义,必须要 求它具有以下几个特点:
1. 必须在主观评价上有意义,即小的失真对应 好的主观质量评价;
2. 必须在数学上易于处理,能导致实际的系统 设计; 3. 必须可计算并保证平均失真D=E[D(X,Q(X))] 存在; 4. 采用的失真测度,应使系统容易用硬件实现。
矢量量化技术的发展历程
1956年 最佳矢量量化问题 1957年 1978年 1980年 如何划分量化区间 及求量化值问题 提出实际矢量量化器 LBG算法 Loyd和Max Buzo Linde,Buzo和Gray Steinhaus
7.2
(1)定义:
矢量量化基本原理
7.2.1 矢量量化的定义
矢量量化是先把信号序列的每 K个样点分成一 组,形成 K 维欧氏空间中的一个矢量,然后对 此矢量进行量化。
开
始
给定码书大小 N,初始码书 Y N(0),训练序列 TS={Xr|r = 1,2,…,m} 计算停止门限 ε, 置 n = 0, D( -1 )→∞ 用给定码书 Y n( n )划分成 N 个胞腔 Sj( n ) = {X|d(X,Yj)? d(X,Yi)
i ≠ j,Yi,Yj ∈Y
(n) } N
矢量量化定义:
把一个 K维模拟矢量的有序集(称为信源矢量集 K R 合) 中的某个矢量X∈χ映射为N个量化矢量 构成的有限集(码书或码本)中的某个矢量(码字或 码矢)Y∈ N ,这种映射称为矢量量化。
Y , Y , , Y | Y R
K N 1 2 N i
Y | i 1 , 2 , , N , Y R 码书:
与标量量化比较,矢量量化还具有如下特点:
( 1)矢量量化是把量化矢量(码字)分别存储在 编码器和译码器两端的码书中,在信道中传输的 并不是输入矢量X的量化矢量Y本身,而是码字Y的 下标j的编码信号;
( 2)在相同的速率下,矢量量化的失真比标量量 化的失真明显的小; ( 3)在相同的失真条件下,矢量量化所需要的速 率比标量量化所需的速率低的多;
min E [ d ( X , Q ( X ))] ( N ) Q Q
N
式中 QN 为所有码书大小为 N 的 K 维矢量量化器 的集合。
2.设计最佳矢量量化器的必要条件
一是在给定码书的条件下,寻找信源空间的最佳划 分,使平均失真最小; 二是在给定划分的条件下,寻找最佳码书,使平均 失真最小。
(n ) N 为已知形心,根据最佳划分原则把
( 0 ) ( 0 ) ( 0 ) 训练序列TS={ Y }划分为N个胞腔,即: , Y , , Y 1 2 N
( n ) S { X |d ( X , Y d ( X , Y } j j) i) ( n ) i jY , i, Y y X T S (= j1 , 2 , , N ) j N,
束
③ 计算平均失真与相对失真。 平均失真为
1m D min d ( X Y ) r, (n ) Y y m N r 1
( n )
r 1 ,2 ,......, m 式中 Xr TS,
相对失真为
~(n) D(n1) D(n) D D(n)
矢量量化优于标量量化,为不可逆压缩方法, 具备比特率低、解码简单、失真较小的优点。 矢量量化广泛应用于图像、语音压缩编码、移动 通信、语音识别、文献检索及数据库检索等领域。
矢量量化的理论基础是仙农的率-失真理论。 率 -失真理论指出,利用矢量量化,编码性能 有可能任意接近率-失真函数,其方法是增加维数k; 该理论指出了矢量量化的优越性。 率-失真理论在实际应用中的重要指导意义: 常作为一个理论下界与实际编码速率相比较, 分析系统还有多大的改进余地。 但是,率 -失真理论是一个存在性定理而非构 造性定理,因为它没有指出如何构造矢量量化器。
(2)几个概念
量化矢量 ( 或称重构矢量 ) :利用最小失真原则, 分别计算用量化矢量Yi(i=1,2,……7)替代X所 带来的失真,其中最小失真所对应的那个矢量Yj, 就是模拟矢量X 的量化矢量。
码书:量化矢量构成的集合称为码书 (Codebook) 。 码字:码书中的每个矢量Yj (i=1,2,……N)称 为码字(Codeword)。
N 维输入 Xi 矢量
计算最小距离 d min ( xi , y j ) 找到相应角标 jmax
jmax 信道 或存储器
jmax
从码本找出
y j min
失真 测度 定义
码本 y j j=0,1…… L-1 矢量量化原理框图
码本 y j j=0,1……L-1
矢量量化器的工作过程是:
在编码端,输入矢量 X 与码本中的每一个或 部分码字进行比较,分别计算出它们的失真。搜 索到失真最小的码字 Yj 的序号 ( 或此码字在码本 中的地址 ) ,并将 j 的编码信号通过信道传送到译 码端;在译码端,先把信道传送来的编码信号译 成序号j,再根据序号(或码字Yj 所在地址),从 码本中查出相应的码字Yj 。Yj 是输入矢量X的重 构矢量。
K Ni , i
一个矢量量化器可以表示成以下三个部分:
S , | i 1 , 2 , , N 空间划分:S= i
s 映射:q:RK N
其中,Si是Rk的一个子集且满足
K S XR ,( q XY ) i i
矢量量化器Q( N , S)的性能,以其输入矢量X和输
| 且 d ( , Y ) d ( , Y ) ij , i s J N
j j i
则Sj为最佳划分。
Voronoi划分:把信源空间划分成与码书大小相同的 N个区间Sj (j=1,2,…,N)。这种划分称为Voronoi划分。 Voronoi胞腔: Voronoi划分对应子集Sj (j=1,2,…,N) 称为Voronoi胞腔(Cell),简称胞腔。
7.2.3 矢量量化器
通常用最小失真的方法 - 最近邻准则 NNR (Nearest Neighbor Rule))来设计矢量量化器, 也就是要满足下式:
X i d ( X ,) Y d ( X ,) Y jI
i j N
式中
IN={1,2,……,i,……N};
N —码书的大小; 符号 表示充分必要条件。
7.2.2 失真测度
失真测度的选择直接影响矢量量化系统的 性能。 失真测度是以什么方法来反映用码字 Yi代 替信源矢量 X时所付出的代价。这种代价的统 计平均值 ( 平均失真 ) 描述了矢量量化器的工作 特性,即
D E [ d ( X , Q ( X ))]
式中E[· ]表示求期望。
常用的失真测度有如下几种:
⑴平方失真测度
d X , Y X Y X Y i i
2 2
这是最常用的失真测度,易于处理和计算,且 在主观评价上有意义,即小的失真值对应好的 主观评价质量。
⑵ 绝对误差失真测度
X d X ,Y Y X Y i i
i 1
k
主要优点:计算简单,硬件容易实现。 ⑶ 加权平方失真测度
1 m 计 算 D ∑ min d X , Y ~n Dn1 Dn r n D YN m r1 Y∈ n
n
D
否 求出这时 N 个胞腔的 (n+1) 形心构成新码书 YN ,
置
n = n +1
~( ) D n ≤
是
Y N = Y N(n)
结 图 7.6 已知训练序列的算法
(4)矢量量化是一种多维模式匹配、多维优化 过程,而标量量化是一维模式匹配、一维优化过 程。一般来说,用一维优化是得不到多维优化的 结果的。 (5)矢量量化的复杂度随维数成指数增加,所 以矢量量化的复杂度比标量量化的复杂度高。
归结起来,正如率 -失真理论所指出的,组编 码总是优于单个输出的逐个编码的,当编码长度 K趋于无穷大时,可以达到率失真界。
对于由训练序列定义的样点分布和常用的均 方失真测度,形心由下式给出:
1 Yi Si
X
x s i
式中 |Si| 表示集合 Si 中元素的个数(即 Si 集中 有| Si |个X)。
7.4 矢量量化器的设计算法及 MATLAB实现
7.4.1 LBG算法
设计矢量量化器的主要任务是设计码书。码字 数目 N 给定时,由 Linde , Buzo ,和 Gray 三人 1980 年首次提出矢量量化器的一个设计算法,通常称为 LBG算法。
7.3 最佳矢量量化
1. 最佳矢量量化器的概念
矢量量化器的速率定义为:
r=B/K=(logN)/K(bit/样值或每维)
式中
B=log 2 N表示每个码字的编码比特数;
N—码书的大小;
K—维数。
最佳矢量量化器的概念: 给定条件下,失真最小的矢量量化器,称 为这个条件下的最佳矢量量化器。给定矢量量 化器的码书大小N,求最小失真
第7章 矢量量化
1 2 3 4 5
7.1 概述 7.2 矢量量化基本原理 7.3 最佳矢量量化器 7.4 矢量量化器的设计算法及MATLAB实现 7.5 降低复杂度的矢量量化系统
7.1 概述
量化分为两大类:标量量化和矢量量化。
标量量化:把抽样后的信号值逐个进行量化。
矢量量化:将 k(k≥2) 个抽样值形成 K 维空间 Rk 中 的一个矢量,然后将此矢量进行量化,。
已知训练序列的LBG设计算法:
已知训练序列设计算法的具体步骤如下:
(0) ① 给定初始码书 y N ,即给定码书大小N和码字 ( 0 ) ( 0 ) ( 0 ) , Y , , Y {Y },并置n=0,设起始平均失真 1 2 N
D(-1)→∞,给定计算停止门限ε(0<ε<1)。 ② 用码书 y
(2)最佳码书
给定了划分 Si (并不是最佳划分)后,为了 使码书的平均失真最小,码字Yi 必须为相应划分Si (i=1,2,…N)的形心,即:
Y min E d X , Y X S i i k
1 Y R
式中min-1表示选取的Yi使平均失真
E[d(X,Y)|X∈Si]为最小的Y。