第二章 信息量化与编码

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

另一方面,我们有:
所以
从而得到平均失真的近似计算式为
• 当N很大时,每个最小量化区间Ri可近似认 为是一个均匀量化过程,由前面关于均匀 量化器的性能分析,我们可得:
2.2.6 最佳量化
• 所谓最佳量化,是指给定量化层数N时,使平均量化误差 达到最小的量化。在一般情况下,这个问题并没有显式的 理论解,但可以由数值解有效的实现。 • 量化器的结构可分为编码器跟解码器,在寻找最佳量化器 时,我们常常将问题简化,如假定其中一部分是固定的, 而另一部分则是可变的。下面我们首先从两个方面分析问 题,即在给定编码器条件下寻找最佳解码器,以及在给定 解码器条件下寻找最佳编码器。然后分析一般情况下的最 佳量化问题。最佳的原则是使均方误差最小。
• 结论2.1(压扩模型的通用性)对任何有限正规
的量化器,都存在着如图2-2-6所示的压扩模型,其中压扩 变换G及扩张变换G-1 与输入信号的概率分布有关。 证明:设输入信号分段边界点为{x1,x2,…,XN-1},(x0,xN可以是无 穷大,不考虑),输出值为{y1,y2,...y N}。我们按以下方式构 造压扩模型。首先定义两个集合: P={(yi , i△+k),i =1,2,…,N} Q= ={(xi , i△+ △/2+ k),i =1,2,…,N-1} P中包含平面上N个点,这N个点横坐标是yi, 而纵坐标则是一 系列以△为间隔的等间距点。Q的情况类似。将P及Q两个 集合代表的平面重叠在一起,则可得到平面上一个新的点 集,其中,纵坐标仍是以△为间隔的等间距点,而横坐标 则是xi , yi 交错(因为是正规量化器)。将相邻区间边界点 对应的平面上的点以线段相连,即可构成一个分段直线的 单调增曲线G(x),满足
• (3)信息量化与编码要研究的主要问题 • 从信息的角度来看,当信号由连续幅度转 换成离散幅度时,必然会有信息的损失, 因此,信息量化属于有失真编码。不过, 通过适当的设计,我们可以将这种损失减 至能接受的地步。从这种意义出发,信息 量化与编码要研究的问题便是如何进行有 效的设计,使在一定条件下,编码的失真 达到最小。
2.2.2标量量化器结构
• 量化器的特性完全取决于输入分段及输出电平集合,编码 器实现的主要是输入分段,而解码器实现的则是输出电平。 也就是说,编码器的主要功能是判定输入信号位于哪一个 信号分段之内,所以我们可以定义一个选择函数Si(x)如下:
实现选择函数Si(x) 的系统结构如图所示
• 解码器的实现直接通过下标i查表即可得到 相应的量化电平yi 。因此,我们可将量化器 的特性表示成如下形式:
第二章 信息量化与编码
• 2.1 引言 (1)什么是信息量化与编码 • 量化:在数字信号处理领域,量化指将信号的连续取值(或 者大量可能的离散取值)近似为有限多个(或较少的)离散 值的过程。量化主要应用于从连续信号到数字信号的转换中。 连续信号经过采样成为离散信号,离散信号经过量化即成为 数字信号。 • 编码:编码是信息从一种形式或格式转换为另一种形式的过 程也称为计算机编程语言的代码简称编码。用预先规定的方 法将文字、数字或其它对象编成数码,或将信息、数据转换 成规定的电脉冲信号。 • (2)为什么要进行信息量化与编码
量化器的基本结构图
2.2.3量化器性能测度
• 1.均方误差
• 量化器的功能是将未知输入值用有限精度的离散值来代替, 因此不可避免的要引起失真,如何衡量这种失真便是本节 要讨论的问题。 • 根据量化的结果,我们无法精确知道输入值的大小,只能 知道其位于某个范围内。因此通常都假设输入是一个随机 变量,概率密度函数已知,相应的每个输入值的量化误差 也是一个随机变量。量化器的性能指标应是描述所有输入 值量化误差引起的总的失真效应。因此常用统计平均的方 法来解决这类问题。 • 最常用的的失真测度是平方误差,定义为
一.给定解码器时的最佳编码器
这个问题相当于在给定解码器时,寻找对量化输入信 号的最佳分段,所谓解码器给定,即相当于输出电平集合 C={y1,y2,...y N}已知。从直观上看,对于输入信号x,量化输 出满足以下条件显然最佳:
换言之,应该有
事实上,此时的量化器的平均量化输出也的确达到最小,因 为
• 很显然当输入xi位于yi-1 与yi之间时,应选择 与 x较近的 y作为量化输出。所以对输入信 号的分段边界点应位于yi -1与yi的中点,即 xi=(yi-1+yi)/2 二.给定编码器时的最佳解码器
• 正规量化器典型量化曲线图
• 在一般情况下,输入信号都是有界的,此时,最两 端的边界点一般取为x0=min(x),xN=max(x),而量化器 的量化范围为B=xN-x1。对于输入无界的情形,相当 于x0=- ∞,xN=+ ∞,量化器的量化范围定义为B=xN-1-x1, 即量化范围为所有输入分段之和的长度。 • 从结构上看,量化器可分编码器与解码器两个部分。 编码器完成输入到数字的映射,即ε: R → I, I={1,2,…N},而解码器则是实现由数字到电平的转换, 即D:I →C.若Q(x)=yi,则有ε(x)=i, D(i)=yi ,百度文库即 Q(x)=D(ε(x))。在通信系统中,编码器只能传送所选 量化电平yi 的下标i,而不是yi 本身。解码器根据 接收到的下标i, 通过查表可得到相应的电平值。
记Q表示量化器,则Q的特性完全决定于对输入信号的分 段及输出值决定。
• (2)一个正规量化器还满足如下的条件: • ①:每个分段Ri都是一个连续的区间, 可以是开的,或半开半闭的。 • ②:每个分段Ri对应的量化值yi位于Ri中, 即yi ∈ Ri=(xi-1,xi). • 正规量化器的输入分段边界点xi及量化输 出点yi满足已下序列关系: x0<y1<x1<y2<x2<…<yN<xN
• 更为一般的是乘幂误差,定义为
其中m=1时即为绝对误差,m=2时为平方误差, 这两种情形应用得最为普遍。
设输入随机过程X的概率密度为fX (x),则输入 量化误差的期望值为
此公式所示的D是一种最常用的性能测度。而 其中又以误差测度为平方误差时最为普遍, 此时的性能测度又称为均方误差,可写为:
• 2 性噪比 性噪比是另一个常用的性能测度,定义 为 其中,D为均方误差。SNR的单位为分贝(db)
• 下面我们分析均匀量化器的均匀失真
考虑输入为有界的情形,不妨设位于区间(a , b)之 内,变化范围为B=b-a。左右两边的边界点分别为:x0=a , xN=b。假定将区间分为N等分,每个子区间为△=B/N,也就 是量化器有N级输出,每级之间相距△。
量化误差ε=Q(X)-X,所以在均匀量化时,最大的可能量 化误差为△/2,即B/2N。所以均匀量化误差是一种使最大 量化误差达到最小的量化方式。这一特点使得均匀量化在 很广泛的一类输入信号下,都能保持较好的量化性能。这 正是模拟/数字转换器大多采用均匀量化方式的原因。
• 适当选取k值,可使得G(0)=0。这在实用中是常常需要的。 从而构造了所需的压缩函数G。 从上述结论也可由图2-2-7来直观说明。
当量化层数很大时,即△i = xi-xi-1 很小时,我们近似可得:
此式意味着压缩特性曲线的斜率决定了量化器的局部阶距 的取法。
二.对数压扩
在众多的压扩器中,用得最多是对数压扩器。采用此 类压扩器的原因是实际中,大多数信号都集中在较小的幅 值附近,幅值大的机会相对小很多,因此,为保证平均的 性噪比大,应对小的信号取小的量化阶距,而对大的信号 取大的量化阶距,即保持信号幅值与量化阶距为一常数, 而不是像均匀量化器中保持量化阶距为常数。根据之前的 式子,可知G’(x)应与x的倒数成正比,也就是G(x)是对数型 曲线。 不过,严格的对数曲线在实现上是有问题的,表现 为当x→0时,G(x) →∞。为此,人们常常采用修正的对数 压扩器,如在语音信号编码中,常用的就有u律及A律曲线, 分别定义为:
给定编码器 ,即意味着输入信号的分段边界点已知。 寻找最佳解码器即求对位于分段Ri内信号的量化输出。 因为平均量化失真为:
• 令
即可得:
• 此式意味着量化输出应为信号在Ri内的重心 位置处。
三.一般情况下的最佳量化
所谓一般情况下,即仅知道量化层数N及输入信号的概率分 布函数fX (x)。量化分段边界点及量化输出均未知。 仍从量化器的平均量化出发,
2.2.4 均匀量化器
最常用的标量量化器是均匀量化器,大多数的模拟/数字转换器就属于此类。 所谓均匀量化器,是一个正规量化器,并且满足: (1)各个分段是等长的; (2)每个分段的中点即为相应的量化输出。 换言之,对于均匀量化器,我们有
当然,输入信号的左右边界可能是无限的,对于区间(-∞,y1],我 们有y1=x1-△/2,对区间[yN,+∞),有yN=xN-1 + △/2。
非均匀量化器可用均匀量化器的压扩模型表示,如图
由图可见,输入信号x首先经过单调非线性变换G,变成G(x), 然后对G(x)进行均匀量化,最后再经非线性变换G的逆变 换G-1,得到最后的非均匀量化输出。其中, G通常是一个 压缩变换,因为大多数信号的分布都是集中在某一区域内 的,对应的, G-1 为一个扩张变换。
• 当输入信号亦为均匀分布时,量化误差ε的均 值 • 总的失真为
• 在实际情况中,输入信号大多不是有界的,此时,我 们可将左右两端的区间(-∞,x1], (XN-1,+∞]单独取出来考虑。其余的区间与上述有界信号 输入时是一样的。不过在无界输入的情况下,最大量 化误差也必定是无限的,因此没有什么意义。主要的 性能测度是平均量化误差,由于多数输入信号的分布 主要集中于某一个区间,输入信号位于左右两端的区 间的机会很小,因此上述对有限输入信号的结论依然 是近似成立的,特别是当量化层数N很大时。
2.2.5 非均匀量化器
一 .压扩模型
均匀量化器有一个缺点,即当输入信号 变化范围大时,量化器量化层数也必须相应变 大,以保持一定的性能。而由于在许多实际场 合,输入信号并不是均匀分布的,且取大值的 概率相对小一些,所以,从统计的观点来看, 均匀量化器这种大小信号一视同仁均匀量化的 方法不太合理。因此产生了非均匀量化的概念。 从直观上看,当输入信号不是均匀分布时,就 应该用非均匀量化器。
其中V值是用于控制最大量化电平,而u及A值则是用来控制 压缩特性的陡峭程度,也就是最大量化阶距与最小量化阶 距之比。对于大的u及A值,可以增加信号的动态范围,但 另一方面也将减少大信号的量化性噪比。因此u及A值应综 合考虑多种因素,实际中用的较多的是u=255及A=87.6。
三.分段线性压扩
从数学的角度看,连续可导的压扩特性固然便于分析, 但在具体实现中,却不易做到低成本高精度。因此,实际 中,是采用分段线性压扩器来逼近连续可导的非线性压扩 特性。分段线性压扩器是指量化器在量化范围内分为许多 小段,每一小段相当于一个均匀量化器,但不同小段之间 量化的阶距不同。 稍作修改,即可将均匀量化的平均失真结果用到分段 均匀量化器中。设输入的概率分布是均匀分布,记△i 表 示第i段均匀量化的量化阶距,共有M段,则容易推出分段 均匀量化器的平均失真为
• 其中qi 为信号位于第i段上的概率。
四.渐进量化特性
所谓渐进量化特性,是指当量化层数非常大时量化器的性能。 非均匀量化器的平均失真为:
其中,当输入无界时,x0= -∞ ,xN=+ ∞ . 从理论上说,上式是一个精确的结果,然后它并不是很适合 于数值计算,特别是当N很大时。为了得到更加有效的计算公 式,我们采用近似方法来计算式中的积分。当N很大时,也就 是△i = xi-xi-1 很小,因此
2.2标量量化
(1)标量量化的定义: 标量量化可以视为将一段连续的实轴上的线映射成 一个离散的点集,这个离散点集的大小是受限的,若记 此离散点集为 C={y1,y2,...y N},一般我们约定下标的排列是以y值的大小为序 的,即 y1<y2<…< y N 记R表示连续实轴。当量化器为n点时,相当于将R划分 为N个区段Ri , Ri=(xi-1,xi],i=1,2,…,N,为半开半闭区间。显 然,区间的划分是充分以及不相交的。
相关文档
最新文档