07第七章矢量量化

合集下载

语音信号处理课件第七章.ppt

语音信号处理课件第七章.ppt

矢量量化系统通常可以分为两个映射的乘积 Q 式中:α是编码器,它是将输入矢量 信道符号集IN={i1, i2, …, iN}中的一个元素ij ;
K X R 映射为
β是译码器,它是将信道符号集 ij映射为码书中的一 个码字Yi 。即
α( X )= ij β(ij )= Yi X∈χ, ij ∈ IN ij ∈ IN Yi∈ YN
{ x n}
X1
X2
X3 X4 Xn/4
图示输入信号序列{xn},每4 个样点构成一个矢量 (取K=4),共得到n/4个4维矢量: X1,X2,X3,…,Xn/4
矢量量化就是先集体量化X1 ,然后量化X2, 依次向下量化。下面以 K=2为例说明其量化过程。
a2 Y3 Yi Si a1 Y5 Y6 (a) 图 7.2 (b) 矢量量化示意图 Y4 S1 Y1 a2 Y2 a1 Y7
(1)最佳划分
Y , Y , , Y N 1 2 N 给定码书 ,可以用最近邻准则NNR得 到最佳划分。图7.4为最佳划分示意图。
•Y3 • •Y6 •Y4 · •Y1 •Yj S1 • •X Sj • • •
S2 •Y2
•YN


图7.4 最佳划分示意图
最佳划分定义:
信源空间χ中任一点X,若X∈Sj,当且仅当矢量X与码 字Yj的失真小于X和其它码字 Yi N 失真,即:
出矢量Y=q(X)的失真平均值而定,失真平均值为: D(Q,F)=E[d(X,Y)]=E[d(X,q(X))]
补充: 矢量量化与标量量化的比较
矢量量化是把一个 K 维模拟矢量映射为一个 K
维量化矢量。标量量化实际是维数K=1的矢量量化。
一般情况下,矢量量化均指K≥2的多维量化。与标

矢量量化编码

矢量量化编码

矢量量化编码1. 引言矢量量化是一种高效的数据压缩技术,它具有压缩比大、解码简单和失真较小等优点。

自从1980年提出矢量量化器(Vector Quantizater)码书设计的LBG算法[Linde et al(1980)]以来,矢量量化(Vector Quantization)技术[Gray(1984)]已经成功地应用到图像压缩和语音编码中。

矢量量化压缩中最核心的技术是码书的设计,码书的优化性直接影响到压缩效率和图像复原质量。

这里主要对码书设计算法进行讨论。

首先介绍了经典的LBG算法及其在图像压缩中的应用;然后,针对LBG算法的不足,结合图像处理的特点,提出了改进的覆盖聚类算法,有效改善了系统性能。

2 .码书的设计码书设计是矢量量化压缩系统的关键环节。

码书设计得越优化,矢量量化器的性能就越好。

实际中,不可能单独为每幅待编码的图像设计一个码书,因此通常是以一些代表性图像构成的训练集为基础,为一类图像设计一个最优码书。

从数学的观点看,矢量量化中的码书设计,实质是把系统的率失真函数看成目标函数,并使之在高维空间中成为最小的全局优化问题。

假设采用平方误差测度作为失真测度,训练集中的矢量数为M,目的是生成含N(N<M)个码字(码矢量)的码书。

码书设计过程就是寻求把M 个训练矢量分成N类的一种最佳方案(使均方误差最小),而把各类的质心矢量作为码书的码字。

可以证明,各种可能的码书个数为(1/ N!)Σ(一1)(N-i)CNiM,其中( 为组合数。

通过测试所有码书的性能可得到全局最优码书。

然而,在N 和M 比较大的情况下,搜索全部码书是根本不可能的。

为了克服这个困难,各种码书设计方法都采取搜索部分码书的方法得到局部最优或接近全局最优的码书。

因此,研究码书设计算法的目的就是寻求有效的算法尽可能找到全局最优或接近全局最优的码书以提高码书性能,并尽可能减少计算复杂度。

3 LBG算法描述经典的码书设计算法是LBG算法[它是Y.Linde,A.Buzo与R.M.Gray 在1980年推出的,其思想是对于一个训练序列,先找出其中心,再用分裂法产生一个初始码书A0,最后把训练序列按码书A0中的元素分组,找出每组的中心,得到新的码书,转而把新码书作为初始码书再进行上述过程,直到满意为止。

矢量量化在语音信号处理中的应用

矢量量化在语音信号处理中的应用

矢量量化在语音信号处理中的应用简介矢量量化是一种常用的数据压缩技术,旨在通过将连续信号离散化表示来减少数据传输和存储的成本。

在语音信号处理中,矢量量化广泛应用于语音编码、语音识别和语音合成等领域。

本文将深入探讨矢量量化在语音信号处理中的应用。

语音编码语音信号的特点为了更好地理解矢量量化在语音编码中的应用,首先需要了解语音信号的特点。

语音信号是一种时间连续的信号,具有较高的带宽要求和较低的信噪比。

此外,语音信号中的语音内容通常通过谐波周期、共振峰和无意义的噪声等特征进行表示。

矢量量化在语音编码中的角色在语音编码中,矢量量化被用于将连续的语音信号转换为离散表示,以实现对语音信号的压缩。

通过将语音信号分割成不同的时间段或频率帧,并将这些帧用离散的码矢量表示,矢量量化可以显著减少所需的传输和存储资源。

此外,矢量量化还能提供一种方式来描述和比较不同语音片段之间的相似性。

矢量量化的实现方法在语音编码中,有许多矢量量化的实现方法可供选择。

其中,最简单但性能相对较差的方法是基于均匀矢量量化。

该方法将矢量空间均匀划分为一系列子区域,并为每个子区域分配一个代表矢量。

然而,由于语音信号的非均匀分布特性,均匀矢量量化的效果有限。

为了克服均匀矢量量化的不足,研究人员提出了一些更高级的方法,如聚类算法和向量量化树。

聚类算法将语音帧分成几个类别,并为每个类别分配一个代表矢量。

而向量量化树则是一种层次结构,通过递归地将帧分成更小的子集,并为每个叶子节点分配一个代表矢量。

这些方法相对于均匀矢量量化能够更好地适应语音信号的分布特性,从而提高编码效果。

矢量量化的应用实例矢量量化在语音编码中的应用有很多,以下是一些常见的实例:1.无损压缩:通过高效地将连续语音信号转换为离散表示,矢量量化可以实现对语音信号的无损压缩。

这种压缩方法无需对语音信号进行任何信息损失,因此在一些对语音质量要求较高的应用中非常有用。

2.语音传输:矢量量化能够显著减少语音信号传输所需的带宽和存储资源。

语音信号处理

语音信号处理

第一部分语音信号处理第一章·绪论一···考核知识点1·语音信号处理的基本概念2·语音信号处理的发展概况二···考核要点一·语音信号处理的基本概念1.识记:(1)语音信号对人类的重要性。

(2)数字语音的优点。

(3)语音学的基本概念。

(4)语音信号处理的应用领域。

二·语音信号处理的发展概况1.识记:(1)语音信号处理的发展历史。

(2)语音编码、语音合成、语音识别的基本概念。

语音编码技术是伴随着语音的数字化而产生的,目前主要应用在数字语音通信领域。

语音合成的目的是使计算机能象人一样说话说话,而语音识别使能够听懂人说的话。

第二章·基础知识一···考核知识点一·语音产生的过程二·语音信号的特性三·语音信号产生的数字模型四·人耳的听觉特性二···考核要求一·语音产生的过程1.识记:声音是一种波,能被人耳听到,振动频率在20Hz~20kHz之间。

自然界中包含各种各样的声音,而语音是声音的一种,它是由人的发音器官发出的,具有一定语法和意义的声音。

2.领会:(1)语音产生的过程与人类发声的基本原理。

(2)清音、浊音、共振峰的基本概念。

语音由声带震动或不经声带震动产生,其中由声带震动产生的音统称为浊音,而不由声带震动而产生的音统称为清音。

声道是一个分布参数系统,它是一个谐振腔,有许多谐振频率,称为共振峰,它是声道的重要声学特征。

二·语音信号的特性1.识记:(1)语音的物理性质,包括音质、音调、音强、音长等特性。

语音是人的发音器官发出的一种声波,具有声音的物理属性。

其中音质是一种声音区别于其它声音的基本特征。

音调就是声音的高低,取决于声波的频率:频率高则音调高,频率低则音调低。

响度就是声音的强弱,又称音量。

矢量量化与语音信号处理

矢量量化与语音信号处理

x
码字c2
4 34 1
212 3 码字c3
码书
4
d ( X , C) (xi ci )2 i 1
d(x,c0)=5 d(x,c1)=11 d(x,c2)=8 d(x,c3)=8
✓ 图像编码例子: 原图象块(4灰度级,矢量维数 k=4×4=16)
x
0
1
2
3
码书C ={y0, y1 , y2, y3}
Xi
矢量
Yj
量化器
4.判断规则
当给矢量量化器输入一种任意矢量Xi进行矢 量量化时,矢量量化器首先判断它属于那个子空 间,怎样判断就是要根据一定旳规则,选择一种 合适旳失真测度,分别计算每个码字替代Xi所带 来旳失真,当拟定产生最小失真旳那个码字Yj时, 就将Xi量化成Yj, Yj就是Xi旳重构矢量(和恢复 矢量)。
码本
Y1 Y2
码本
Y1 Y2
语音
YJ
信号

特征 矢量
Xi
VQ 编码
V
形成

传播 或
V
存储
YJ
VQ Yj 译码

矢量量化在语音通信中旳应用
✓矢量量化编码与解码构造图:
编码 器
解码 器
信 输入 源 矢量
索引 近来邻 搜索
信道
索引
查表
输出 信 矢量 宿
码书
码书
用LBG(GLA)算 法生成
N个特征矢量 wen {X1 , X2 , … , XN}
xL
xa1
xak
xak+1
xaL
xaL+1
1-dimensional VQ is shown below:

矢量量化器

矢量量化器

最佳矢量量化器码本设计指导教师姓名: ×××报告提交日期: 20××年×月×日摘要矢量量化技术作为一种有损压缩编码技术在语音信号的存储和低码率传输过程中起到了巨大的推动作用。

本文主要介绍了适量量化的一些基本概念,以及矢量编码器的码本设计方法。

关键词适量量化矢量量化器矢量量化矢量量化介绍矢量量化是70年代后期发展起来的一种数据压缩技术基本思想:将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化,从而压缩了数据而不损失多少信息。

矢量量化技术是七十年代后期发展起来的一种数据压缩和编码技术,广泛应用于语音编码、语音合成、语音识别和说话人识别、图像压缩等领域。

矢量量化的基本原理是:将若干个标量数据组成一个矢量(或者是从一帧语音数据中提取的特征矢量)在多维空间给予整体量化,从而可以在信息量损失较少的情况下压缩数据量。

矢量量化有效地应用了矢量中各元素间的相关性,因此可以有比标量量更好的压缩效果。

一般来说矢量维数越大量化越优越。

矢量量化原理概述标量量化将抽样值的整个动态范围被分成若干个小区间,每个小区间有一个代表值,量化时落入小区间的信号值就用这个代表值代替,或者叫被量化为这个代表值。

这时的信号量是一维的,所以称为标量量化。

矢量量化若干个标量数据组成一个矢量,矢量量化是对矢量进行量化,和标量量化一样,它把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替,或者叫被量化为这个代表矢量。

矢量量化的要点首先设计一个好码本。

关键在于如何划分J个区域边界。

这需要大量的输入信号矢量,经过统计实验才能确定,这个过程称为“训练”或“学习”。

应用聚类算法,按照一定的失真度准则(失真测度),对训练的数据进行分类,从而把训练数据在多维空间中划分成一个以码字为中心的胞腔,常用的是LBG算法来实现。

未知矢量的量化。

07第七章矢量量化

07第七章矢量量化
K
以K=2进行说明: 当K=2时,所得到的是二维矢量。所有可 能的二维矢量就形成了一个平面。 记为(a1,a2),所有可能的(a1,a2) 就是一个二维空间。如图7-1所示
图7-1 矢量量化概念示意图
矢量量化就是将这个平面划分为M块S1, S2,…,Si…SM,然后从每一块中找出代表值 Yi(i=1,2….M),这就构成一个有M个区 间的二维矢量量化器。图(b)所示的是一个 7区间的二维矢量量化器,即K=2,M=7。 通常这些代表值Yi称为量化矢量。
N N
E d ( X, Y )

2
矢量量化的准则:在给定码本大小K时使量化所造成的 失真最小。
7.3 失真测度
前面我们讲过设计矢量量化器的关键 是编码器的设计。而在编码的过程中,就 需要引入失真测度的概念。
失真测度:是将输入矢量Xi用码本重构 矢量Yi来表征时所产生的误差或失真的度量 方法,它可以描述两个或多个模型矢量间的 相似程度。
aT Ra

2 ln 1
p
aT Ra' r (0)ra (0) 2 r (i)ra (i)
i 1
这种失真测度是针对线性预测模型、用最 大似然准则推导出来,所以特别适用于LPC参 数描述语音信号的情况,常用于LPC编码中。 我们由此又推导出两种线性预测失真测度,它 们比上述具有更好的性能,即 ①对数似然比失真测度
矢量量化的定义 将信号序列 { yi } 的每K个连续样点 分成一组,形成K维欧式空间中的一 个矢量,矢量量化就是把这个K维输 入矢量X映射成另一个K维量化矢量。 其中量化矢量构成的集合 {Yi } 称为码 书或码本,码书中的每个矢量Yi 称为 码字或者码矢。
Y {Y1 ,Y2 ,YN Yi R }

语音识别-矢量量化

语音识别-矢量量化
设置较低时迭代次数过多 三、初始码书的选择
① 随机选取法
② 分裂法
分裂法
0.01~0.05
D' D
Find centroid
m=1 Yes
yn yn (1 ) yn yn (1 ) D' 0
m=2*m
Classify vectors
Find Cnetroid
m<M
No Stop
Nearest - Neighbor search K - means chestering
数的初始化为m=1
第二步:迭代
1)根据最近邻准则将S分成N个子集 S1(m) ,
S
(m 2
)
,┅,S N(m,)
即当
X S1(m时) ,下式成
立: d ( X ,Yl(m1) d ( X ,Yi(m1) ), i, j l
2)计算失真:
N
D(m)
d( X ,Yl(m1) )
i 1 XSl( m )
2. 树形搜索的矢量量化系统
• 树形搜索是减少矢量量化计算量的一种重要方法。
• 它又分为二叉树和多叉树两种:
码字不象普通的码字那样随意放置, 而是排列在一棵树的接点上,如图所 示,码本尺寸为M=8的二叉树,它的 码本中共包含14个码字。输入矢量X 先与Y0和Y1比较,计算出失真d(X,Y0) 和d(X,Y1)。如果后者较小,则走下面 支路,同时送出“1”,同理,如果 最后达到Y101,则送出的输出角标 101。这就是矢量量化的过程。
矢量量化研究的目的?
针对特定的信息源和矢量维数,设计 出一种最优化的量化器,在R(量化速率) 一定的情况下,给出的量化失真尽可能 接近D(R)(最小量化失真)。

矢量量化

矢量量化

矢量量化有损压缩是利用人眼的视觉特性有针对地简化不重要的数据,以减少总的数据量。

量化是有损数据压缩中常用的技术。

量化可以分为两种,即标量量化与矢量量化。

标量量化每次只量化一个采样点。

而矢量量化在量化时用输出组集合中最匹配的一组输出值来代替一组输入采样值。

根据香农的速率-失真理论,即使信源是无记忆的,利用矢量编码代替标量编码总能在理论上得到更好的性能,矢量量化可以看作标量量化的推广。

基本的矢量量化器编码,传输与解码过程如图所示。

矢量量化编码器根据一定的失真测度在码书中搜索出与输入矢量最匹配的码字。

传输时仅传输该码字的索引。

解码过程很简单,只要根据接收到的码字索引在码书中查找该码字,并将它作为输入矢量的重构矢量。

码字匹配信道查表信宿信源码书码书输入矢量索引索引编码器解码器输出矢量矢量量化编码和解码示意图假定码书}|,,,{110k j N R C ∈=-y y y y ,其中N 为码书的大小,而k 维输入矢量T k x x x ),,(110-= x 与码字T k j j j j y y y ),,()1(10-= y 之间的失真测度采用平方误差测度来表示,即:22210)(),(jjl k l l j y x d y x y x -=-=∑-=则矢量量化码字搜索问题就是在码书C 中搜索与输入矢量x 最匹配的码字bm y ,使得bm y 与x 之间的失真是所有码字中最小的,即:),(min ),(10bm N bm bm d d y x y x -≤≤= 全搜索算法(FS )是一种最原始、最直观的码字搜索算法,它需要计算输入矢量与所有码字之间的失真,并通过比较找出失真最小的码字。

由于FS 算法每次失真计算需要k 次乘法,12-k 次加法,故为了对矢量进行编码需要Nk 次乘法,)12(-k N 次加法和1-N 次比较运算。

而FS 算法的计算复杂度是由码书的大小和矢量维数决定,而高效率矢量量化编码系统往往采用大码书和高维矢量,这时计算复杂度是非常大的,故减少码字搜索的计算负担是非常必要的,必须寻求快速有效的码字搜索算法。

语音信号处理第七章

语音信号处理第七章

矢量量化定义: 把一个K维模拟矢量的有序集(称为信源矢量集
合) RK中的某个矢量X∈χ映射为N个量化矢量
构成的有限集(码书或码本)中的某个矢量(码字或
码矢)Y∈ ,这种N映射称为矢量量化。
N Y1,Y2 ,,YN | Yi RK
一个矢量量化器可以表示成以下三个部分:
码书: N Yi, | i 1,2,, N,Yi RK
补充: 矢量量化与标量量化的比较
矢量量化是把一个K维模拟矢量映射为一个K 维量化矢量。标量量化实际是维数K=1的矢量量化。 一般情况下,矢量量化均指K≥2的多维量化。与标 量量化的两个主要步骤相对应,矢量量化首先要 将抽样值构成的矢量即K维空间的无穷多点划分成 有限个胞腔,然后从每一个胞腔取一个代表值, 凡是落入该胞腔的矢量均用该代表值进行量化。
Y7
Y6
(a)
(b)
图 7.2 矢量量化示意图
(2)几个概念
量化矢量(或称重构矢量):利用最小失真原则,
分别计算用量化矢量Yi(i=1,2,……7)替代X所 带来的失真,其中最小失真所对应的那个矢量Yj, 就是模拟矢量X 的量化矢量。
码书:量化矢量构成的集合称为码书(Codebook)。 码字:码书中的每个矢量Yj (i=1,2,……N)称 为码字(Codeword)。
空间划分:S= Si,| i 1,2,, N
映射:q:RK s N 其中,Si是Rk的一个子集且满足
Si X RK , q(X ) Yi
矢量量化器Q( N , S)的性能,以其输入矢量X和输 出矢量Y=q(X)的失真平均值而定,失真平均值为:
D(Q,F)=E[d(X,Y)]=E[d(X,q(X))]
d X,Y X Y 2 Xi Yi 2

矢量量化LBG算法的研究

矢量量化LBG算法的研究

矢量量化LBG算法的研究作者:孔勇平来源:《硅谷》2008年第06期[摘要]论述经典的LBG算法的基本原理、量化器设计的关键之处和存在的问题。

以矢量量化技术在图像压缩领域的应用作为研究目标,总结分析现有典型的LBG算法,并针对LBG算法的不足,提出改进的算法,减少计算复杂度,缩短程序运行时间。

通过理论推导和具体实现,证明改进方法的可行性和有效性。

[关键词]矢量量化 LBG算法中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2008)0320039-02一、引言矢量量化(VQ Vector Quantization)是70年代后期发展起来的一种数据压缩技术,是一种高效的有损数据压缩技术,它具有压缩比大、解码简单和失真较小等优点。

其基本思想是:将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化,从而压缩了数据而不损失多少信息。

矢量量化是仙农信息论在信源编码理论方面的发展,它的理论基础是仙农的率失真理论,率失真理论是一个存在性定理,并非是一个构造性定理,它未给出如何构造矢量量化器的方法,矢量量化总是优于标量量化,这是因为矢量量化能有效地应用矢量中各分量之间的4种相互关联性质来消除数据中的冗余度。

自从1980年提出矢量量化器(Vector Quantizater)码书设计的LBG算法以来,矢量量化(Vector Quantization)技术[Gray(1984)]已经成功地应用到图像压缩和语音编码中[1]。

二、LBG算法中最佳量化器的设计LBG算法中的最佳矢量量化器设计的关键是最佳划分和最佳码书的设计[2]。

一是给定码书条件下,寻找信源空间的最佳划分,使平均失真最小,由码书和NNR得最佳划分。

信源空间中的任一点矢量,,如果它和码字的失真小于它和其它码字的失真,二是在给定划分条件下,寻找最佳码书,使平均失真最小给定了划分后为了使码书的平均失真最小,码字必须为相应划分的形心(质心),即:式中表示选取的Y是使平均失真为最小的Y,对于一般的失真测度和信源分布,很难找到形心的计算方法。

矢量量化技术讲解学习

矢量量化技术讲解学习
矢量量化技术
一、矢量量化的应用
矢量量化技术技术是一种数据压缩和编码技术, 矢量量化压缩技术的应用领域非常广阔,如军事部门 和气象部门的卫星(或航天飞机)遥感照片的压缩编码 和实时传输、雷达图像和军用地图的存储与传输、数 字电视和DVD的视频压缩、医学图像的压缩与存储、 网络化测试数据的压缩和传输、语音编码、图像识别 和语音识别等等 。
Xi
矢量
Yj
量化器
4.判断规则
当给矢量量化器输入一个任意矢量Xi进行矢 量量化时,矢量量化器首先判断它属于那个子空 间,如何判断就是要依据一定的规则,选择一个 合适的失真测度,分别计算每个码字代替Xi所带 来的失真,当确定产生最小失真的那个码字Yj时, 就将Xi量化成Yj, Yj就是Xi的重构矢量(和恢复 矢量)。
d(x,y2)=25
y0
y1
y2
y3
d(x,y3)=46
码字y1最接近输入矢量图象块 x,故用索引“01”编 码
标量量化和矢量量化比较
✓ 标量量化是维数为1的矢量量化。一般矢量量化均指大 于1的多维量化。
分成J个互不相交的子空间R1,R2…RJ ,将Rj称为胞腔。 在每一个子空间Rj找一代表矢量Yj,则J个代表矢量 可以组成矢量集为:
Y={Y1,Y2,…,YJ}构成了一个矢量量化器,Y叫着 码本,J称为码本长度, Yj称为码字,有: Yj={yj1,yj2,…,yjP},j=1,2,…J。
举例 以P=2为例来说明。当P=2时,所得到的是二✓矢 Nhomakorabea量化器定义:
维数为P,码本长度为J的矢量量化器Q定义: 为从P维欧几里德空间RP到一包含J个输出(重构) 点的有限集合C的映射,
Q:RP→C,其中C={y1 ,y2 ,… ,yJ}

第07章 矢量量化

第07章 矢量量化
23
3. 初始码书的生成
如何选取初始码书,这对于最佳码书的设计有很大影响。 码书在开始时对要编码的数据来说应当有相当的代表性。达到 这一要求的方法之一是直接取输入信号矢量作为码字。由于相 邻的语音信号是高度相关的,在语音波形量化时,应使样本之 间的间隔足够大,这样才能忽略样本之间的互相关。
(1)随机选取法
最简单的方法是从训练序列中随机地选取M个矢量作为初 始码字,从而构成初始码书。
24
3. 初始码书的生成
优点: (1)不用初始化计算,可以大大减少计算时间; (2)初始码字选自训练序列中,无空胞腔问题。
缺点: (1)可能会选到一些非典型的矢量作为码字; (2)会造成在某些空间把胞腔分得过细,而有些 空间分得太大。 以上缺点会导致码字没有代表性,导致码书中有限个码 字得不到充分利用,设计的矢量量化器性能可能较差。
2
7.1 概述
语音数字通信的两个关键问题是:语音质量和传 输数码率。
这两个参数相互矛盾:
(1)要获得较高的语音质量,就必须使用较高的传 输数码率;
(2)为了实现高效地压缩传输数码率,就不能得到 良好的语音质量。 但是,矢量量化却是一种既能高效压缩数码率、 又能保证语音质量的编码方法。
3
7.1 概述
25
3. 初始码书的生成
(2)分裂法
① 先认为码书尺寸为M=1,即初始码书中只包含一个码字。计算所有 训练序列的形心,将此形心作为第一个码字 YM
(1)
( i = 0) ;
( 2) (1) ② 将它分裂为 YM ,即将一个码字加上或减去一个很小的 YM 扰动,形成两个新码字。此时码书中包含有两个码字,一个是i = 0 ,另 一个是i =1;
二是在给定划分的条件下,寻找最佳码书, 使平均失真最小。 (1)最佳划分

第9节_矢量量化_进一步

第9节_矢量量化_进一步

二.矢量量化进一步为了减少存储、运算资源的要求,及提高量化效率,可以考虑采用如下技术。

1.分裂矢量量化 (Splitted VQ)分裂矢量量化:首先将一个K 维矢量分裂成P (P>1)个子矢量,然后对各个子矢量分别独立进行矢量量化。

例1:用 20个比特对10维的LSF 参数进行量化。

全搜索方案,码本容量为20210⨯。

若实时实现,对硬件的存储容量和运算能力要求太高;分裂矢量量化方案,将10维的LSF 矢量分裂为两个5维的矢量,分别用10比特进行VQ ,这样,码本容量降为()10225⨯⨯。

分裂矢量量化可以大大降低了码本的存储量和对最佳矢量搜索的计算量。

2.多级矢量量化 (Cascaded VQ)1) 多级矢量量化器的构造多级矢量量化器可以较大幅度的降低矢量量化器的计算复杂度和存贮量。

多级矢量量化器由码本大小分别为12,,...,m N N N , 的m 个小码本构成。

图4所示的是m 级矢量量化器的编码器原理图。

e X Y i 1=-e e E m m j m ()()()---=-122112j E e e -=图4 多级矢量量化器的编码器m 级矢量量化器的量化原理:⏹ 第一级量化:原始矢量X 。

输入矢量为X ,在码本1中搜索失真最小的码字i Y ,将其索引标号i 编码输出。

(量化误差:1e )⏹ 第二级量化:矢量X 与第一级器量化输出矢量1e 的误差。

第二级输入误差矢量i Y X e -=1,在码本2中搜索与1e 失真最小的码字1j E ,并将其索引标号j1编码输出。

(量化误差:2e )⏹ 第三级量化器的输入矢量是:第二级的输入矢量1e 与第二级的输出矢量1j E 之差的误差矢量112j E e e -=。

同样在码本3中搜索与2e 失真最小的码字2j E ,并将其索引标号j2编码输出。

依此类推,第m 级量化器的输入矢量()2m e -与第(m-1)级的输出矢量()2j m E -之差的误差矢量()()()221----=m j m m E e e 。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

矢量量化是实现数据压缩的一种有效方
法,早在50和60年代就被用于语音压缩 编码。直到70年代线性预测技术被引入 语音编码后,矢量量化技术才活跃起来。 80年代初,矢量量化技术的理论和应用 研究得到迅速发展。
7.2 矢量量化的基本原理
标量量化是对信号的单个样本或参数 的幅度进行量化;标量是指被量化的变 量,为一维变量。 矢量量化的过程是将语音信号波形 的K个样点的每一帧,或有K个参数的每 一参数帧构成K维空间的一个矢量,然 后对这个矢量进行量化。
N N
E d ( X, Y )

2
矢量量化的准则:在给定码本大小K时使量化所造成的 失真最小。
7.3 失真测度
前面我们讲过设计矢量量化器的关键 是编码器的设计。而在编码的过程中,就 需要引入失真测度的概念。
失真测度:是将输入矢量Xi用码本重构 矢量Yi来表征时所产生的误差或失真的度量 方法,它可以描述两个或多个模型矢量间的 相似程度。
表7-1 二叉树与全搜索的比较
失真运算量 比较运算量 存储容量 最佳程度
全体 局部
全搜索 二叉树
K
几种其他常用的欧氏距离: 1. r方平均误差
1 d r ( X ,Y ) K
x
i 1
K
i
yi
r
2. r平均误差
1 d 'r ( X ,Y ) [ K
x
i 1
K
i
yi ]
r
1 r
3.绝对值平均误差
1 d1 ( X , Y ) K
x
i 1
K
i
yi
4.最大平均误差
d M ( X , Y ) lim d r ( X , Y )] m ax xi yi [
一、欧氏距离-均方误差
设输入信号的某个K维矢量X,与码书中某个K 维矢量Y进行比较,xi,yi分别表示X和Y中的各元 素 (1 i K ) ,则定义均方误差为欧氏距离:
1 d 2 ( X ,Y ) K ( X Y )T ( X Y ) ( xi yi ) 2 K i 1
是 Sl 中包含的矢量个数
二、LBG算法 1980年由Linde,Buzo和Gray提出, 它是标量量化器中Lloyd算法的推广,在矢 量量化中是一个基本算法。 LBG算法由于其理论上的严密性、应用上 的简便性以及较好的设计效果,得到了广泛的 应用,并常被作为各种改进算法的基础。 LBG算法是一种递推算法,从一个事先 选定的初始码本中开始进行迭代,直到系统 满足性能要求或不再有明显改进为止。
失真度选择必须具备的特性: 必须在主观评价上有意义,即小的失真应该 对应于好的主观语音质量; 必须是易于处理的,即在数学上易于实现, 这样可以用于实际的矢量量化器的设计; 平均失真存在并且可以计算; 易于硬件实现。
常见失真测度方法
均方误差失真测度(即欧氏距离)
加权的均方误差失真测度 板仓-斋藤(Itakura-Saito)似然比距离 似然比失真测度 等等
矢量量化的定义 将信号序列 { yi } 的每K个连续样点 分成一组,形成K维欧式空间中的一 个矢量,矢量量化就是把这个K维输 入矢量X映射成另一个K维量化矢量。 其中量化矢量构成的集合 {Yi } 称为码 书或码本,码书中的每个矢量Yi 称为 码字或者码矢。
Y {Y1 ,Y2 ,YN Yi R }
立: d ( X ,Yl( m1) d ( X ,Yi( m1) ),i , j l 2)计算失真:
D ( m)
N
i 1 X Sl( m )
d ( X , Yl ( m1) )
( Y1( m) , Y2( m) ,, YNm) : 3)计算新码字
Yi
( m)ห้องสมุดไป่ตู้
1 Ni
Sl {X R K : d ( X , Yl ) d ( X , Yi );i l}
2)Centroid质心条件 子空间分割固定后,Voronoi胞元 的质心就是量化器的码字
Yl E[ X Y Sl ]
对于一般的失真测度和信源分布,很难找到 质心的计算方法,但对于一般的分布和常用的 均方失真测度,可以证明 1 Yl X N l X Sl
K
以K=2进行说明: 当K=2时,所得到的是二维矢量。所有可 能的二维矢量就形成了一个平面。 记为(a1,a2),所有可能的(a1,a2) 就是一个二维空间。如图7-1所示
图7-1 矢量量化概念示意图
矢量量化就是将这个平面划分为M块S1, S2,…,Si…SM,然后从每一块中找出代表值 Yi(i=1,2….M),这就构成一个有M个区 间的二维矢量量化器。图(b)所示的是一个 7区间的二维矢量量化器,即K=2,M=7。 通常这些代表值Yi称为量化矢量。
(m) 1
,Y
(m) 2
,,Y
(m) N

以停止运算。L是限制迭代次数的参数,防止 设臵较低时迭代次数过多 三、初始码书的选择 ① 随机选取法 ② 分裂法 ③乘积码书法
7.5 降低复杂度的矢量量化系统
• 矢量量化系统主要由编码器和译码器组成:
编码器主要由码书搜索算法和码书构成,
译码器由查表方法和码书构成。 • 矢量量化器的研究主要围绕降低速率(运算量)、 减少失真和降低复杂度(存储量)展开。 •降低复杂度的设计方法大致分为两类: 一类是无记忆的矢量量化器, 另一类是有记忆的矢量量化器。
存在的问题 一、如何划分M个区域边界。 方法是:将大量欲处理的信号的矢量进行统计划分, 进一步确定这些划分边界的中心矢量值来得到码书。 二、如何确定两矢量在进行比较时的测度。 这个测度就是两矢量间的距离,或以其中某一 矢量为基准时的失真度。它描述了当输入矢量用码 书所对应的矢量来表征时所应付出的代价。
概述 矢量量化的基本原理 失真测度 最佳矢量量化器和码本设计 降低复杂度的矢量量化系统
语音参数的矢量量化
7.1 概述
矢量量化(VQ,即Vector Quantization)是一种 极其重要的信号压缩方法。VQ在语音信号处理中占 十分重要的地位。广泛应用于语音编码、语音识别 和语音合成等领域。 量化分为两类: * 标量量化:将取样后的信号值逐个地进行量化。 * 矢量量化:将若干取样信号分成一组,即构成一 个矢量,然后对此矢量一次进行量化。 凡是要用量化的地方都可以采用矢量量化。
所有M个量化矢量构成的集合 { Yi }称为 码书或码本; 把码书中的每个量化矢量Yi(i=1, 2….M)称为码字或码矢。
量化方法: 对一个矢量X进行量化,首先选择一个合 适的失真测度,然后用最小失真原理,分别 计算用量化矢量Yi替代X所带来的失真。 其中最小失真值所对应的那个量化矢量, 就是矢量X的重构矢量(或恢复矢量)。
LBG算法步骤 第一步:初始化 给出训练VQ码书所需的全部参考矢量X, X的集合用S表示;设定量化级数,失真控制门 限 ,算法最大迭代次数L以及初始码 ( {Y1( 0) ,Y2( 0) ,, YN0) } ;设总失真 D ( 0 ) ;迭代次 书 数的初始化为m=1

第二步:迭代
( 1)根据最近邻准则将S分成N个子集 S1 m ) , ( ( ) S2m ) ,┅, N ) , 即当 X S1 m 时,下式成 S (m
r 1 i K 1 r
二、线性预测失真测度
用全极模型表示的线性预测方法,广泛应用于语 音信号处理中。它在分析时得到的是模型的预测系数。 仅由预测系数的差值,不能完全表征这两个语音信息 的差别。应该直接由这些系数所描述的信号模型的功 率谱来进行比较。
当预测器的阶数 p ,信号与模型 完全匹配时,信号功率谱为:
7.4 最佳矢量量化器和码本的设计
一、矢量量化器最佳设计的两个条件 最佳设计就是使失真最小 最佳设计中,重要的问题是如何划分量 化区间和确定量化矢量。这两个条件回答 了两个问题: (1)、最佳划分 (2)、最佳码书
最佳矢量量化器满足的两个必要条件 1)Voronoi分割条件(最近邻准则) 对信号空间的分割应满足
f ( ) X (e )
信号的功率谱
j
2
2
j
预测误差能量
2
A(e )
预测逆滤波器的频率响应
相应的,设码书中某重构矢量的功率谱为
f ( ) X (e )
j
2
p 2 A(e )
j 2
则定义Itakura-Saito距离为 a
T
d IS ( f , f )
aT Ra

2 ln 1
p
aT Ra' r (0)ra (0) 2 r (i)ra (i)
i 1
这种失真测度是针对线性预测模型、用最 大似然准则推导出来,所以特别适用于LPC参 数描述语音信号的情况,常用于LPC编码中。 我们由此又推导出两种线性预测失真测度,它 们比上述具有更好的性能,即 ①对数似然比失真测度
2. 树形搜索的矢量量化系统 • 树形搜索是减少矢量量化计算量的一种重要方法。
• 它又分为二叉树和多叉树两种:
码字不象普通的码字那样随意放臵, 而是排列在一棵树的接点上,如图所 示,码本尺寸为M=8的二叉树,它的 码本中共包含14个码字。输入矢量X 先与Y0和Y1比较,计算出失真d(X,Y0) 和d(X,Y1)。如果后者较小,则走下面 支路,同时送出“1”,同理,如果 最后达到Y101,则送出的输出角标 101。这就是矢量量化的过程。

特点: 传输存储的不是矢量本身而是其序号,所以 据有高保密性能;用于传输时,其传输速率 可以进一步降低; 收发两端没有反馈回路,因此比较稳定; 矢量量化器的关键是编码器的设计,译码器 只是简单的的查表过程。
矢量量化的性能指标除了码书的大小M以外还有由 于量化而产生的平均信噪比:
相关文档
最新文档