矢量量化与语音信号处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
码书
N个特征矢量 wen {X , X , … , X } 1 2 N
{2 , 4, … , 1}
语 码本
文 码本 {Y1 ,Y2 ,…,YJ}
音 码本
模板库
学 码本
三、矢量量化在语音识别中的应用
先对系统中的每个字,做一个码本作为该字 的参考(标准)模板,共有M个字,故共有M个码 本,组成一个模板库。 识别时,对于任意输入的语音特征矢量序列X ={X1 , X2 , … , XN},计算该序列中每一个特 征矢量对模板库中的每个码本的总平均失真量误
矢量量化器定义:
维数为P,码本长度为J的矢量量化器Q定义: 为从P维欧几里德空间RP到一包含J个输出(重构)
点的有限集合C的映射,
Q:RP→C,其中C={y1 ,y2 ,… ,yJ} yi
RP,i=1,…,J
集合C称作码本或码书,码本长度为J 。 码本的J个元素称作码字或码矢量,它们均
为RP中的矢量,P维矢量。
T
R是输入语音信号的(p+1)×(p+1)自相关矩阵
a {1, a1 , a2 ,....a p }
T T
输入语音信号的预 测系数矢量
(a) {1, a1 , a2 ,....ap }码字预测系数矢量
§7.4 矢量量化的最佳码本设计
一、最佳码本设计的原则 二、LBG算法
三、码字搜索
矢量量化压缩技术的应用领域非常广阔,如军事部门
和气象部门的卫星(或航天飞机)遥感照片的压缩编码 和实时传输、雷达图像和军用地图的存储与传输、数 字电视和DVD的视频压缩、医学图像的压缩与存储、 网络化测试数据的压缩和传输、语音编码、图像识别
和语音识别等等 。
二、标量量化和矢量量化的区别 1.标量量化: 整个动态范围被分成若干个小区间,每个小区间 有一个代表值,量化时落入小区间的信号值就用这个 代表值代替,或者叫被量化为这个代表值。这时的信 号量是一维的,所以称为标量量化。 xa(t) xa(nT) xk x(n) x(n)=Q[xa(nT)]。 xk+1 xL
音质量没有下降。
码本
Y1 Y2
码本
Y1 Y2
语音 信号 帧
YJ
YJ
特征 矢量 形成
Xi
VQ 编码 器
V
传输 V 或 存储
VQ Yj 译码 器
矢量量化在语音通信中的应用
矢量量化编码与解码结构图: 编码 器
索引 信 输入 最近邻 源 矢量 搜索 信道 解码 器
索引
输出 信 查表 矢量 宿
码书 用LBG(GLA)算 法生成
的运行原理是根据输入矢量Xi从编码器码本中选择一
个与之失真误差最小的码字Yj ,其输出的V就是该码 字的下标,V是一个数字,因而可以通过任何数字信 道传输或任何数字存储器来存储。如在编码速率为 2.4kbit/s的LPC声码器中,将每帧的10个预测系数加
以10维的矢量量化,编码速率降低到800bit/s,而语
差,找出最小的失真误差对应的码本(代表一个
字),将对应的字输出作为识别的结果。
码本 每一个字做一 个码本,共M个字
Y1 Y2 YM
模板库
任意 语音
特征矢量 X 序列形成
计算 失真误差 判决
输出结果Yi
特征矢量序列 模板库
X={X1 , X2 , …… , XN} Y1 , Y2 , …… , YM
第七章 矢量量化技术
(vector quantization
§7.1 概述 §7.2 矢量量化的基本原理 §7.3 矢量量化的失真测度 §7.4 矢量量化的最佳码本设计
VQ)
§7.Leabharlann Baidu 概述
一、矢量量化的应用 二、标量量化和矢量量化的区别
一、矢量量化的应用 矢量量化技术技术是一种数据压缩和编码技术,
矢量 量化器
4.判断规则
当给矢量量化器输入一个任意矢量Xi进行矢
量量化时,矢量量化器首先判断它属于那个子空
间,如何判断就是要依据一定的规则,选择一个 合适的失真测度,分别计算每个码字代替Xi所带 来的失真,当确定产生最小失真的那个码字Yj时, 就将Xi量化成Yj, Yj就是Xi的重构矢量(和恢复
矢量)。
Rn (0) R (1) n R Rn ( p )
Rn ( p ) Rn (0) Rn ( p 2) Rn ( p 2) R n ( 0) Rn (1)
2. 模型失真测度
(a ) Ra d M ( X ,Y ) 1 T a Ra
在这种情况下,一个分析帧,只需要一个
2bits对4个滤波器系数进行编码,这样降低了
所需的比特数。矢量量化就是利用数据之间的
相关性来降低所需的比特率。
§4.2 矢量量化的基本原理
一、矢量量化的基本原理 二、矢量量化在语音通信中的应用
三、矢量量化在语音识别中的应用
四、矢量量化的关键之处
一、矢量量化的基本原理
意味着只存在4组可能的声道滤波器传输函数。
现在考虑对每一个滤波器系数单独进行标量量
化,需要2bit,每一分析帧需要8个比特来进行编 码。
如果我们知道只有4种可能的声道形状,与
4个可能的声道滤波器系数组成的矢量相对应,
若某一个滤波器系数知道了,其它系数就知道
了,也就是矢量中的标量值之间是高度相关的,
举例
以P=2为例来说明。当P=2时,所得到的是二维
矢量。所有可能的二维矢量就构成了一个平面。第
i个二维矢量记为: Xi={xi1,xi2}。先把这个平面 划分成J块互不相交的子区域,从每个子区域中找 出一个代表矢量。如J=7。
x2 Y3 Y4 Y1 Y2
Y5
Y7
x1
Y6
码本 Y={Y1,Y2,…,YJ} 码本长度 J=7 码字 Yj={xj1,xj2},j=1,2,…J
1.基础知识 若干个标量数据组成一个矢量,标量的个数就为
矢量的维数。如语音信号某一帧中提取的声道参数,
共P个,Xi={ai1,ai2,…,aiP}。则Xi是一个P维矢量。设
共有N个P维矢量X={X1,X2,…,XN},其中第i个矢量为Xi,
i=1,2,…N。类比过来,N个语音帧,每帧中共有P个 声道参数,共组成N个P维矢量。 a11,a12,…,a1K aN1,aN2,…,aNK
第1帧
第N帧
第一帧 第二帧
X1=a11,a12,…,a1P X2=a21,a22,….,a2P
第N帧
XN=aN1,aN2,….,aNP
N个矢量,每个矢量的维数为P 将一个P维随机矢量映射成另一个离散取值的实P 维矢量的过程。
q( X ) Y
2.矢量空间的划分
所有P维矢量构成了一个空间为RP,无遗漏地划 分成J个互不相交的子空间R1,R2…RJ ,将Rj称为胞腔。 在每一个子空间Rj找一代表矢量Yj,则J个代表矢量 可以组成矢量集为: Y={Y1,Y2,…,YJ}构成了一个矢量量化器,Y叫着 码本,J称为码本长度, Yj称为码字,有: Yj={yj1,yj2,…,yjP},j=1,2,…J。
化的失真小;而在相同的失真条件下,矢量量化所需 的码速率比标量量化所需的码速率低得多。
由于矢量量化的复杂度随矢量维数成指数形式增加,
故矢量量化的复杂度比标量量化的复杂度高。
二、矢量量化在语音通信中的应用 通信系统中有两个完全相同的码本,一个在编码
器(发送端),另一个在解码器(接收端)。每个码
本包含J个码字Yj,每个码字是一个P维矢量。VQ编码器
矢量量化的三大关键技术
码本设计 码字搜索 码字索引分配
训练集合X
码本C
.
. . . .
x
.
.
. . . . . .
y1 y2 yN
wen {X , X , … , X } 1 2 N
语 码本
{Y1 ,Y2 ,…,YN} 模板库
文 码本 音 码本 学 码本
四、矢量量化的关键之处
1. 首先设计一个好码本。关键在于如何划分
J个区域边界。这需要大量的输入信号矢量,经
过统计实验才能确定,这个过程称为“训练”或 “学习”。 应用聚类算法,按照一定的失真度准则(失
量化时落入小区域的矢量就用这个代表矢量代替,
或者叫着被量化为这个代表矢量。例如,所有可能 的二维矢量就构成了一个平面,将平面分成7个小 区域。
x2
Y3 Y4
Y2 Y1
Y5
Y7
x1
Y6
Yi(x1i ,x2i)
3、举例说明标量量化与矢量量化的区别
假设声道滤波器传输函数用4个系数来描述,
而且,又假设声道只能为4个可能的形状之一。这
3.加权欧氏距离测度
| x
i 1
K
i
yi |
1 d ( X ,Y ) K
w(i)(x
i 1
K
i
yi )
2
三、线性预测失真测度 当语音信号特征矢量使用线性预测方法求出 的LPC系数时,不宜直接用欧氏距离。应该直接 用预测系数所描述的信号模型的功率谱来进行 比较。通过推导,采用对数似然比失真测度和 模型失真测度。
三、线性预测失真测度
四、识别失真测度
一、失真测度的定义 失真测度(距离测度)就是将输入矢量Xi用码
本重构矢量Yj来表征时所产生的误差或失真的度量
方法,它可以描述两个或多个模型矢量之间的相
似程度。常用的失真测度为欧氏距离测度、加权
欧氏距离测度和识别失真测度。
K维语音特征矢量X和码本Y的失真测度d(X,Y)需 满足下列条件: (1)对称性 d(X,Y)=d(Y,X) (2)正值性 d(X,Y)>0,d(X,X)=0 (3)d(X,Y)<=d(X,Z)+d(Z,Y)
An example of a 2-dimensional VQ is shown below:
3.矢量量化的过程
当给矢量量化器输入一个任意矢量Xi进行矢量
量化时,矢量量化器首先判断它属于那个子空间,
然后输出该子空间的代表矢量Yj。矢量量化过程就
是用Yj代替Xi的过程。
Yj=Q(Xi) Xi 1jJ Yj 1iN
码书C ={y0, y1 , y2, y3}
d(x,y3)=46 y0 y1 y2 y3 码字y1最接近输入矢量图象块 x,故用索引“01”编 码
标量量化和矢量量化比较
标量量化是维数为1的矢量量化。一般矢量量化均指
大于1的多维量化。
一个P维最佳矢量量化器的性能总是优于P个最佳标量
量化器。
在相同的编码速率下,矢量量化的失真明显比标量量
采样
量化
x1 xa1
xak
xak+1
xaL
xaL+1
1-dimensional VQ is shown below:
-2 -
2 2
标量量化
2. 矢量量化:
若干个标量数据组成一个矢量,矢量量化是
对矢量进行量化,和标量量化一样,它把矢量空间
分成若干个小区域,每个小区域寻找一个代表矢量,
1 1
4 码字c1 d(x,c0)=5 码字c3 d(x,c1)=11
x
码字c2
1
码书
2 2 1
4
3
d(x,c2)=8
2
d ( X , C ) ( xi ci )
i 1
d(x,c3)=8
图像编码例子: 原图象块(4灰度级,矢量维数 k=4×4=16) x 0 1 2 3 d(x,y0)=25 d(x,y1)=5 d(x,y2)=25
真测度),对训练的数据进行分类,从而把训
练数据在多维空间中划分成一个以码字为中心的 胞腔,常用的是LBG算法来实现。
2. 未知矢量的量化。按照选定的失真度准则
(失真测度),把未知矢量,量化为失真度最
小的码字。
失真测度就是两矢量之间的距离。
§7.3 矢量量化的失真测度
一、失真测度的定义 二、欧氏距离测度
(4)对d(X,Y)有高效率的计算方法
二、欧氏距离测度
K维特征矢量:
Xi={xi1 , xi2 , …… , xiK}
Yj={yj1 , yj2 , …… , yjK} 1.均方误差欧氏距离
1 d 2 ( X ,Y ) K
(x
i 1
K
i
yi )
2
2.绝对值平均误差
1 d1 ( X , Y ) K
1.对数似然比失真测度
(a ) Ra d LLR ( X , Y ) ln T a Ra
T
R是输入语音信号的(p+1)×(p+1)自相关矩阵
a {1, a1 , a2 ,....a p }
T T
输入语音信号的预 测系数矢量
(a) {1, a1 , a2 ,....ap }码字预测系数矢量
Y1={ y11,y12,…,y1P} Xi={ai1,ai2,…,aiP} Y2={ y21,y22,…,y2P} 计算失真 Y2 最小失真
YJ={ yJ1,yJ2,…,yJP}
矢量量化器 (码本)
矢量量化 argmin[d(x,cj)] x 4
索引0
3 3 2
码字c0
3 23 1
4 4 3
3