矢量量化
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
量化时落入小区域的矢量就用这个代表矢量代替,
或者叫着被量化为这个代表矢量。例如,所有可能 的二维矢量就构成了一个平面,将平面分成7个小 区域。
x2
Y3 Y4
Y2 Y1
Y5
Y7
x1
Y6
Yi(x1i ,x2i)
3、举例说明标量量化与矢量量化的区别
假设声道滤波器传输函数用4个系数来描述,而且,
又假设声道只能为4个可能的形状之一。这意味着只存在4
码书C ={y0, y1 , y2, y3}
d(x,y3)=46 y0 y1 y2 y3 码字y1最接近输入矢量图象块 x,故用索引“01”编 码
标量量化和矢量量化比较
标量量化是维数为1的矢量量化。一般矢量量化均指
大于1的多维量化。
一个P维最佳矢量量化器的性能总是优于P个最佳标量
量化器。
在相同的编码速率下,矢量量化的失真明显比标量量
矢量量化器定义:
维数为P,码本长度为J的矢量量化器Q定义: 为从P维欧几里德空间RP到一包含J个输出(重构)
点的有限集合C的映射,
Q:RP→C,其中C={y1 ,y2 ,… ,yJ} yi
RP,i=1,…,J
集合C称作码本或码书,码本长度为J 。 码本的J个元素称作码字或码矢量,它们均
为RP中的矢量,P维矢量。
码书
N个特征矢量 wen {X , X , … , X } 1 2 N
{2 , 4, … , 1}
语 码本
文 码本 {Y1 ,Y2 ,…,YJ}
音 码本
模板库
学 码本
三、矢量量化在语音识别中的应用
先对系统中的每个字,做一个码本作ቤተ መጻሕፍቲ ባይዱ该字 的参考(标准)模板,共有M个字,故共有M个码 本,组成一个模板库。 识别时,对于任意输入的语音特征矢量序列X ={X1 , X2 , … , XN},计算该序列中每一个特 征矢量对模板库中的每个码本的总平均失真量误
音质量没有下降。
码本
Y1 Y2
码本
Y1 Y2
语音 信号 帧
YJ
YJ
特征 矢量 形成
Xi
VQ 编码 器
V
传输 V 或 存储
VQ Yj 译码 器
矢量量化在语音通信中的应用
矢量量化编码与解码结构图: 编码 器
索引 信 输入 最近邻 源 矢量 搜索 信道 解码 器
索引
输出 信 查表 矢量 宿
码书 用LBG(GLA)算 法生成
组可能的声道滤波器传输函数。
现在考虑对每一个滤波器系数单独进行标量量化,需
要2bit,每一分析帧需要8个比特来进行编码。
如果我们知道只有4种可能的声道形状,与4个可
能的声道滤波器系数组成的矢量相对应,若某一个滤 波器系数知道了,其它系数就知道了,也就是矢量中 的标量值之间是高度相关的,在这种情况下,一个分 析帧,只需要一个2bits对4个滤波器系数进行编码, 这样降低了所需的比特数。矢量量化就是利用数据之 间的相关性来降低所需的比特率。
和语音识别等等 。
二、标量量化和矢量量化的区别 1.标量量化: 整个动态范围被分成若干个小区间,每个小区间 有一个代表值,量化时落入小区间的信号值就用这个 代表值代替,或者叫被量化为这个代表值。这时的信 号量是一维的,所以称为标量量化。 xa(t) xa(nT) xk x(n) x(n)=Q[xa(nT)]。 xk+1 xL
化的失真小;而在相同的失真条件下,矢量量化所需 的码速率比标量量化所需的码速率低得多。
由于矢量量化的复杂度随矢量维数成指数形式增加,
故矢量量化的复杂度比标量量化的复杂度高。
二、矢量量化在语音通信中的应用 通信系统中有两个完全相同的码本,一个在编码
器(发送端),另一个在解码器(接收端)。每个码
本包含J个码字Yj,每个码字是一个P维矢量。VQ编码器
真测度),对训练的数据进行分类,从而把训
练数据在多维空间中划分成一个以码字为中心的 胞腔,常用的是LBG算法来实现。
LBG算法 LBG算法是一种递推算法,从一个事先选定的初 始码本开始迭代。把训练序列按照码本中的元素根 据最邻近准则分组,对每一分组找质心,得到新的 码本,又作为初始码本,再进行分组,重复上述过
采样
量化
x1 xa1
xak
xak+1
xaL
xaL+1
1-dimensional VQ is shown below:
-2 -
2 2
标量量化
2. 矢量量化:
若干个标量数据组成一个矢量,矢量量化是
对矢量进行量化,和标量量化一样,它把矢量空间
分成若干个小区域,每个小区域寻找一个代表矢量,
wen {X , X , … , X } 1 2 N
语 码本
{Y1 ,Y2 ,…,YN} 模板库
文 码本 音 码本 学 码本
四、矢量量化的关键之处
1. 首先设计一个好码本。关键在于如何划分
J个区域边界。这需要大量的输入信号矢量,经
过统计实验才能确定,这个过程称为“训练”或 “学习”。 应用聚类算法,按照一定的失真度准则(失
An example of a 2-dimensional VQ is shown below:
3.矢量量化的过程
当给矢量量化器输入一个任意矢量Xi进行矢量
量化时,矢量量化器首先判断它属于哪个子空间,
然后输出该子空间的代表矢量Yj。矢量量化过程就
是用Yj代替Xi的过程。
Yj=Q(Xi) Xi 1jJ Yj 1iN
Y1={ y11,y12,…,y1P} Xi={ai1,ai2,…,aiP} Y2={ y21,y22,…,y2P} 计算失真 Y2 最小失真
YJ={ yJ1,yJ2,…,yJP}
矢量量化器 (码本)
矢量量化 argmin[d(x,cj)] x 4
索引0
3 3 2
码字c0
3 23 1
4 4 3
3
第N帧
XN=aN1,aN2,….,aNP
N个矢量,每个矢量的维数为P 将一个P维随机矢量映射成另一个离散取值的实P 维矢量的过程。
q( X ) Y
2.矢量空间的划分
所有P维矢量构成了一个空间为RP,无遗漏地划 分成J个互不相交的子空间R1,R2…RJ ,将Rj称为胞腔。 在每一个子空间Rj找一代表矢量Yj,则J个代表矢量 可以组成矢量集为: Y={Y1,Y2,…,YJ}构成了一个矢量量化器,Y叫作 码本,J称为码本长度, Yj称为码字,有: Yj={yj1,yj2,…,yjP},j=1,2,…J。
1 1
4 码字c1 d(x,c0)=5 码字c3 d(x,c1)=11
x
码字c2
1
码书
2 2 1
4
3
d(x,c2)=8
2
d ( X , C ) ( xi ci )
i 1
d(x,c3)=8
图像编码例子: 原图象块(4灰度级,矢量维数 k=4×4=16) x 0 1 2 3 d(x,y0)=25 d(x,y1)=5 d(x,y2)=25
2 矢量量化的基本原理
一、矢量量化的基本原理 二、矢量量化在语音通信中的应用
三、矢量量化在语音识别中的应用
四、矢量量化的关键之处
一、矢量量化的基本原理
1.基础知识 若干个标量数据组成一个矢量,标量的个数就为
矢量的维数。如语音信号某一帧中提取的声道参数,
共P个,Xi={ai1,ai2,…,aiP}。则Xi是一个P维矢量。设
矢量 量化器
4.判断规则
当给矢量量化器输入一个任意矢量Xi进行矢
量量化时,矢量量化器首先判断它属于那个子空
间,如何判断就是要依据一定的规则,选择一个 合适的失真测度,分别计算每个码字代替Xi所带 来的失真,当确定产生最小失真的那个码字Yj时, 就将Xi量化成Yj, Yj就是Xi的重构矢量(和恢复
矢量)。
举例
以P=2为例来说明。当P=2时,所得到的是二维
矢量。所有可能的二维矢量就构成了一个平面。第
i个二维矢量记为: Xi={xi1,xi2}。先把这个平面 划分成J块互不相交的子区域,从每个子区域中找 出一个代表矢量。如J=7。
x2 Y3 Y4 Y1 Y2
Y5
Y7
x1
Y6
码本 Y={Y1,Y2,…,YJ} 码本长度 J=7 码字 Yj={xj1,xj2},j=1,2,…J
程,直到系统性能满足要求和不再有明显的改进为
止。
THANKS
共有N个P维矢量X={X1,X2,…,XN},其中第i个矢量为Xi,
i=1,2,…N。类比过来,N个语音帧,每帧中共有P个 声道参数,共组成N个P维矢量。 a11,a12,…,a1K aN1,aN2,…,aNK
第1帧
第N帧
第一帧 第二帧
X1=a11,a12,…,a1P X2=a21,a22,….,a2P
差,找出最小的失真误差对应的码本(代表一个
字),将对应的字输出作为识别的结果。
码本 每一个字做一 个码本,共M个字
Y1 Y2 YM
模板库
任意 语音
特征矢量 X 序列形成
计算 失真误差 判决
输出结果Yi
特征矢量序列 模板库
X={X1 , X2 , …… , XN} Y1 , Y2 , …… , YM
的运行原理是根据输入矢量Xi从编码器码本中选择一
个与之失真误差最小的码字Yj ,其输出的V就是该码 字的下标,V是一个数字,因而可以通过任何数字信 道传输或任何数字存储器来存储。如在编码速率为 2.4kbit/s的LPC声码器中,将每帧的10个预测系数加
以10维的矢量量化,编码速率降低到800bit/s,而语
矢量量化技术
(vector quantization
1 概述 2 矢量量化的基本原理
VQ)
1.1 概述
一、矢量量化的应用 二、标量量化和矢量量化的区别
一、矢量量化的应用 矢量量化技术技术是一种数据压缩和编码技术,
矢量量化压缩技术的应用领域非常广阔,如军事部门
和气象部门的卫星(或航天飞机)遥感照片的压缩编码 和实时传输、雷达图像和军用地图的存储与传输、数 字电视和DVD的视频压缩、医学图像的压缩与存储、 网络化测试数据的压缩和传输、语音编码、图像识别