矢量量化器
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最佳矢量量化器码本设计
指导教师姓名: ×××
报告提交日期: 20××年×月×日
摘要
矢量量化技术作为一种有损压缩编码技术在语音信号的存储和低码率传输过程中起到了巨大的推动作用。本文主要介绍了适量量化的一些基本概念,以及矢量编码器的码本设计方法。
关键词
适量量化矢量量化器
矢量量化
矢量量化介绍
矢量量化是70年代后期发展起来的一种数据压缩技术基本思想:将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化,从而压缩了数据而不损失多少信息。矢量量化技术是七十年代后期发展起来的一种数据压缩和编码技术,广泛应用于语音编码、语音合成、语音识别和说话人识别、图像压缩等领域。矢量量化的基本原理是:将若干个标量数据组成一个矢量(或者是从一帧语音数据中提取的特征矢量)在多维空间给予整体量化,从而可以在信息量损失较少的情况下压缩数据量。矢量量化有效地应用了矢量中各元素间的相关性,因此可以有比标量量更好的压缩效果。一般来说矢量维数越大量化越优越。
矢量量化原理概述
标量量化
将抽样值的整个动态范围被分成若干个小区间,每个小区间有一个代表值,量化时落入小区间的信号值就用这个代表值代替,或者叫被量化为这个代表值。这时的信号量是一维的,所以称为标量量化。
矢量量化
若干个标量数据组成一个矢量,矢量量化是对矢量进行量化,和标量量化一样,它把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替,或者叫被量化为这个代表矢量。
矢量量化的要点
首先设计一个好码本。关键在于如何划分J个区域边界。这需要大量的输入信号矢量,经过统计实验才能确定,这个过程称为“训练”或“学习”。
应用聚类算法,按照一定的失真度准则(失真测度),对训练的数据进行分类,从而把训练数据在多维空间中划分成一个以码字为中心的胞腔,常用的是LBG算法来实现。
未知矢量的量化。按照选定的失真度准则(失真测度),把未知矢量,量化为失真度最小的码字。
矢量量化的失真测度
失真测度 (距离测度 )是将输入矢量用码本重构矢量来表征时所产生的误差或失真的度量方法它可以描述两个或多个模型矢量间的相似程度。失真测度的选择好坏将直接影响到聚类效果和量化精度 ,进而影响到语音信号矢量量化处理系统的性能。,最常用的失真测度是欧氏距离测度.
欧式距离测度
K维特征矢量:
X i={x i1 , x i2 , …… , x iK}
Y j={y j1 , y j2 , …… , y jK}
均方误差欧式距离
二矢量量化器
1 矢量量化器的定义
维数为k,码本长度为J的矢量量化器Q定义为:从k维欧几里德空间R k到一包含J个输出(重构)点的有限集合C的映射,
Q:R k→C,其中C={y1 ,y2 ,… ,y J}
Y i 属于R k,i=1,…,J
集合C称作码本或码书,码本长度为J 。
码本的J个元素称作码字或码矢量,它们均为R k中的K维矢量。
三最佳矢量量化器
最佳矢量量化器的概念
根据最佳矢量量化器速率的两种定义,分别引出两种最佳矢量量化器的概念。也就是在两个不同的条件下,分别得到最小失真的矢量量化器。
(1)给定矢量量化器的码书大小N,求最小是真
试中Qx为所有码书大小为N的K维矢量量化器的集合。
(2)给定矢量量化器的输出熵限制R,求最小是真
四最佳矢量量化码本设计
所谓最佳设计,就是从大量信号样本中训练出好的码本;从实际效果出发寻找到好的失真测度定义公式;用最少的搜索及计算失真的运算量。
最佳码本的设计,就是在一定条件下,使得d(X,Y)的统计平均最小。需满足下列条件:
1 最佳划分:对给定的码书,根据最邻近准则,找出所有码书矢量的最佳区域边界,对信号空间进行最佳划分:对于任意一个矢量X如果它与矢量Yi的失真小于它和其它码字之间的失真,则X应属于某区域边界Si。
2 最佳码书:对给定的区域边界Si ,寻找出最佳码书Yi ,使码书的平均失真最小,码字Yi是Si中所有矢量的质心(形心)。
在设计码本的时候经常用到lbg算法
LBG算法是一种递推算法,从一个事先选定的初始码本开始迭代。
1 把训练序列按照码本中的元素根据最邻近准则分组.
2 对每一分组找质心,得到新的码本,又作为初始码本.
3 再进行分组,重复上述过程,直到系统性能(总失真D)满足要求和不再有明显的改进为止。
下面给出基于平方误差测度和训练矢量集的LBG 算法具体步骤:
步骤1: 给定初始码书,令代次数m = 0,平均失真 ,给定的相对门限
。
步骤2:用码书 C (m)中的各码字作为质心,根据最佳划分原则把训练
矢量集X 划分为M 个子集。即当X ∋时,下式应成立:
步骤3:计算总畸变:
判断相对误差是否满足:
若满足, 则停止算法, 码书C (m)就是所求的码书;否则,转步骤4
步骤 4: 根据最佳码书条件,计算新码字, 即:
由这个新质心, 形成新码书C( m+ 1),置 m = m + 1, 转步骤2。
初始码书的选择影响码书训练的收敛速度和最终码书的性能. 传统的初始码书生产方法有两种:一种为分裂法,一种是随机选择法。具体操作步骤就不在此赘述了。