语音信号处理第4章矢量量化
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(a1,a2)就是一个二维空间。
4.2 矢量量化的基本原理
矢量量化的码本设计:将二维平面划分为J 个互不相交的子区域,S1,S2,…,SJ,从 每一子区域中找出代表值Yi(i=1,2….J) ,构成一个有J个区间的二维矢量量化器。 图示的是一个7区间的二维矢量量化器,即 K=2,J=7。
J个量化矢量构成的集合{Yi} 称为码书或码 本
信号功率谱:
预测误差能量
信号的功率谱 预测逆滤波器的频率响应
4.3 失真测度
相应的,设码书中某重构矢量的功率谱为
定义Itakura-Saito距离为:
4.3 失真测度
两种线性预测的失真测度,即:
1.对比似然比失真测度
2.模型失真测度
4.3 失真测度
三、识别失真测度
பைடு நூலகம்
输入信号矢量的归一化能量 加权因子
码书重构矢量的归一化能量
g(x)的作用:当两矢量的能量接近时,忽略能量差异引 起的影响;当两矢量能量相差很大时,即进行线性加 权;而当能量差超过门限时,则为固定值
4.4 最佳矢量量化器和码本设计
最佳矢量量化器设计的两个必要条件
1)Voronoi分割条件(最近邻准则) 对空间的分割应满足
根据该条件可以对信号空间进行最佳划分,得到的 Sl 称为一个胞腔
收发两端没有反馈回路,因此比较稳定 矢量量化器的关键是编码器的设计,译码器只
是简单的查表过程。
4.2 矢量量化的基本原理
性能指标:码书的大小J和由于量化而产生 的平均信噪比。
矢量量化的准则:在给定码本大小时使量 化所造成的失真最小。
矢量量化的设计:从大量信号样本中训练 出好的码书,从实际效果出发寻找最好的 失真测度定义公式,设计出最佳的矢量量 化系统,以便用最少的搜索和计算失真的 计算量,来实现最大可能的平均信噪比。
4.3 失真测度
设计矢量量化器的关键是编码器的设计, 就需要引入失真测度的概念。
失真测度(距离测度):是将输入矢量Xi用 码本重构矢量Yi来表征时所产生的误差或失 真的度量方法,它可以描述两个或多个模 型矢量间的相似程度。
4.3 失真测度
失真度选择必须具备的特性
主观评价上有意义,即小的失真应该对应于好 的主观语音质量;
进行比较,分别计算出它们的失真。搜索 到失真最小的码字Yjmin 的序号j,这些序号 就作为传输或存储的参数。
在恢复时,根据此序号从恢复端的码书中 找出相应的码字Yjmin 。此时, Yjmin就是输 入矢量Xi的重构矢量。
4.2 矢量量化的基本原理
特点:
传输存储的不是矢量本身而是其序号,所以数 据有高保密性能。
4.2 矢量量化的基本原理
矢量量化过程:对一个矢量X进行量化,首 先选择一个合适的失真测度,然后用最小 失真原理,分别计算矢量X和各个量化矢量 Yi之间的失真。
最小失真值所对应的那个量化矢量,就是 矢量X的重构矢量(或恢复矢量)。
4.2 矢量量化的基本原理
存在的问题 一、如何划分M个区域边界。
矢量量化能有效的应用矢量中各分量之间的四 种相互关联性质来消除数据中的冗余度。
• 线性依赖(相关性)、 • 非线性依赖(统计不独立)、 • 概率密度函数的形状 • 矢量量化的维数
标量量化仅能利用线性依赖和概率密度函 数的形状来消除冗余度。
4.1 概述
矢量量化研究的目的:
针对特定的信息源和矢量维数,设计出一种最 优化的量化器,在R(量化速率)一定的情况 下,给出的量化失真尽可能接近D(R)(最小量化 失真)。
4.2 矢量量化的基本原理
标量量化是对信号的单个样本或参数的幅 度进行量化;标量是指被量化的变量,为 一维变量。
矢量量化的过程是将语音信号波形的K个样 点,或有K个参数构成K维空间的一个矢量 ,然后对这个矢量进行量化。
矢量量化将K维无限空间划分为M个区域边 界较,,然并后被将量输化入 为矢“距量离X”i与最这小些的边区界域进边行界比的 中心矢量值。
将大量欲处理的信号矢量进行统计划分,进一 步确定这些划分边界的中心矢量值来得到码书
二、如何确定两矢量在进行比较时的测度
测度就是两矢量间的距离,或以其中某一矢量 为基准时的失真度。
4.2 矢量量化的基本原理
图7-2 矢量量化系统的组成
4.2 矢量量化的基本原理
工作过程: 编码端:输入矢量Xi与码书中的每一个码字
语音信号处理第4章矢量量 化
4.1 概述
矢量量化(VQ,Vector Quantization)分 为两类:
标量量化:将取样后的信号值逐个地进行量化 矢量量化:将若干取样信号分成一组,即构成
一个矢量,然后对此矢量一次进行量化。
凡是要用量化的地方都可以采用矢量量化
4.1 概述
采用矢量量化的效果优于标量量化的原因
易于处理的,即在数学上易于实现; 平均失真存在并且可以计算; 易于硬件实现
4.3 失真测度
一、欧氏距离-均方误差
K维矢量X和码矢量Y的欧式距离定位: 1. 均方误差
2.r方平均误差:
4.3 失真测度
3.r平均误差:
4.绝对值误差:
5.最大平均误差:
4.3 失真测度
二、线性预测失真测度
由预测系数的差值,不能完全表征这两个语音 信息的差别,应由预测系数对应的信号功率谱 来进行比较。
4.4 最佳矢量量化器和码本设计
2)Centroid质心条件:子空间分割固定后, Voronoi胞元的质心就是量化器的码字。
码书中的每个量化矢量Yi (i=1,2….J) 称为码字或码矢。
4.2 矢量量化的基本原理
区域划分不同或者量化矢量选取不同,构 成不同的矢量量化器。
根据仙农信息论,矢量越长越好。实际中 码书是不完备的,即矢量数是有限的,而 对于任何一个实际应用来说,矢量通常是 无限的。在实际运用中,输入矢量和码书 中码字不匹配的情况下,这种失真是允许 的。
4.2 矢量量化的基本原理
将信号序列{xi}的每K个连续样点分成一组 ,形成K维欧式空间中的一个矢量,矢量量 化就是把这个K维输入矢量X映射成另一个 K维量化矢量。
量化矢量构成的集合{Yi} 称为码书或码本, 码书中的每个矢量Yi称为码字或者码矢。
4.2 矢量量化的基本原理
以K=2进行说明:所有可能的二维矢量就 形成了一个平面,记为( a1,a2 )。
4.2 矢量量化的基本原理
矢量量化的码本设计:将二维平面划分为J 个互不相交的子区域,S1,S2,…,SJ,从 每一子区域中找出代表值Yi(i=1,2….J) ,构成一个有J个区间的二维矢量量化器。 图示的是一个7区间的二维矢量量化器,即 K=2,J=7。
J个量化矢量构成的集合{Yi} 称为码书或码 本
信号功率谱:
预测误差能量
信号的功率谱 预测逆滤波器的频率响应
4.3 失真测度
相应的,设码书中某重构矢量的功率谱为
定义Itakura-Saito距离为:
4.3 失真测度
两种线性预测的失真测度,即:
1.对比似然比失真测度
2.模型失真测度
4.3 失真测度
三、识别失真测度
பைடு நூலகம்
输入信号矢量的归一化能量 加权因子
码书重构矢量的归一化能量
g(x)的作用:当两矢量的能量接近时,忽略能量差异引 起的影响;当两矢量能量相差很大时,即进行线性加 权;而当能量差超过门限时,则为固定值
4.4 最佳矢量量化器和码本设计
最佳矢量量化器设计的两个必要条件
1)Voronoi分割条件(最近邻准则) 对空间的分割应满足
根据该条件可以对信号空间进行最佳划分,得到的 Sl 称为一个胞腔
收发两端没有反馈回路,因此比较稳定 矢量量化器的关键是编码器的设计,译码器只
是简单的查表过程。
4.2 矢量量化的基本原理
性能指标:码书的大小J和由于量化而产生 的平均信噪比。
矢量量化的准则:在给定码本大小时使量 化所造成的失真最小。
矢量量化的设计:从大量信号样本中训练 出好的码书,从实际效果出发寻找最好的 失真测度定义公式,设计出最佳的矢量量 化系统,以便用最少的搜索和计算失真的 计算量,来实现最大可能的平均信噪比。
4.3 失真测度
设计矢量量化器的关键是编码器的设计, 就需要引入失真测度的概念。
失真测度(距离测度):是将输入矢量Xi用 码本重构矢量Yi来表征时所产生的误差或失 真的度量方法,它可以描述两个或多个模 型矢量间的相似程度。
4.3 失真测度
失真度选择必须具备的特性
主观评价上有意义,即小的失真应该对应于好 的主观语音质量;
进行比较,分别计算出它们的失真。搜索 到失真最小的码字Yjmin 的序号j,这些序号 就作为传输或存储的参数。
在恢复时,根据此序号从恢复端的码书中 找出相应的码字Yjmin 。此时, Yjmin就是输 入矢量Xi的重构矢量。
4.2 矢量量化的基本原理
特点:
传输存储的不是矢量本身而是其序号,所以数 据有高保密性能。
4.2 矢量量化的基本原理
矢量量化过程:对一个矢量X进行量化,首 先选择一个合适的失真测度,然后用最小 失真原理,分别计算矢量X和各个量化矢量 Yi之间的失真。
最小失真值所对应的那个量化矢量,就是 矢量X的重构矢量(或恢复矢量)。
4.2 矢量量化的基本原理
存在的问题 一、如何划分M个区域边界。
矢量量化能有效的应用矢量中各分量之间的四 种相互关联性质来消除数据中的冗余度。
• 线性依赖(相关性)、 • 非线性依赖(统计不独立)、 • 概率密度函数的形状 • 矢量量化的维数
标量量化仅能利用线性依赖和概率密度函 数的形状来消除冗余度。
4.1 概述
矢量量化研究的目的:
针对特定的信息源和矢量维数,设计出一种最 优化的量化器,在R(量化速率)一定的情况 下,给出的量化失真尽可能接近D(R)(最小量化 失真)。
4.2 矢量量化的基本原理
标量量化是对信号的单个样本或参数的幅 度进行量化;标量是指被量化的变量,为 一维变量。
矢量量化的过程是将语音信号波形的K个样 点,或有K个参数构成K维空间的一个矢量 ,然后对这个矢量进行量化。
矢量量化将K维无限空间划分为M个区域边 界较,,然并后被将量输化入 为矢“距量离X”i与最这小些的边区界域进边行界比的 中心矢量值。
将大量欲处理的信号矢量进行统计划分,进一 步确定这些划分边界的中心矢量值来得到码书
二、如何确定两矢量在进行比较时的测度
测度就是两矢量间的距离,或以其中某一矢量 为基准时的失真度。
4.2 矢量量化的基本原理
图7-2 矢量量化系统的组成
4.2 矢量量化的基本原理
工作过程: 编码端:输入矢量Xi与码书中的每一个码字
语音信号处理第4章矢量量 化
4.1 概述
矢量量化(VQ,Vector Quantization)分 为两类:
标量量化:将取样后的信号值逐个地进行量化 矢量量化:将若干取样信号分成一组,即构成
一个矢量,然后对此矢量一次进行量化。
凡是要用量化的地方都可以采用矢量量化
4.1 概述
采用矢量量化的效果优于标量量化的原因
易于处理的,即在数学上易于实现; 平均失真存在并且可以计算; 易于硬件实现
4.3 失真测度
一、欧氏距离-均方误差
K维矢量X和码矢量Y的欧式距离定位: 1. 均方误差
2.r方平均误差:
4.3 失真测度
3.r平均误差:
4.绝对值误差:
5.最大平均误差:
4.3 失真测度
二、线性预测失真测度
由预测系数的差值,不能完全表征这两个语音 信息的差别,应由预测系数对应的信号功率谱 来进行比较。
4.4 最佳矢量量化器和码本设计
2)Centroid质心条件:子空间分割固定后, Voronoi胞元的质心就是量化器的码字。
码书中的每个量化矢量Yi (i=1,2….J) 称为码字或码矢。
4.2 矢量量化的基本原理
区域划分不同或者量化矢量选取不同,构 成不同的矢量量化器。
根据仙农信息论,矢量越长越好。实际中 码书是不完备的,即矢量数是有限的,而 对于任何一个实际应用来说,矢量通常是 无限的。在实际运用中,输入矢量和码书 中码字不匹配的情况下,这种失真是允许 的。
4.2 矢量量化的基本原理
将信号序列{xi}的每K个连续样点分成一组 ,形成K维欧式空间中的一个矢量,矢量量 化就是把这个K维输入矢量X映射成另一个 K维量化矢量。
量化矢量构成的集合{Yi} 称为码书或码本, 码书中的每个矢量Yi称为码字或者码矢。
4.2 矢量量化的基本原理
以K=2进行说明:所有可能的二维矢量就 形成了一个平面,记为( a1,a2 )。