4 率失真编码
信息率失真函数与限失真信源编码
§7.1:概述-4
• 实际需求特点: – 信宿对真实度的要求: • 实际语音信号: 20Hz~8KHz 人耳能够分辨: 300Hz~3400Hz • 图象色差:可达足够多 视觉分辨:256级(黑白)已足够
– 可以允许一定的失真度 • 完全保真没必要
§7.1:概述-5
• 引出的研究内容 – 限失真的信源编码问题 • 允许一定的失真度下,能将信源信息压缩到什么程度?(最少需要 多少比特才能在收端描述信源?) • 一定的信息传输率R下,可能达到的最小的平均失真是多少?
§7.2:失真的度量-3
• 失真度定义
0, ui=vj
– 离散信源:用失真矩阵描述。dij=
>0, ui≠ vj
汉明距离度量时:dij=
1, ui≠ vj
0, ui=vj
– 连续信源:用失真函数描述。d(u,v)=(u-v)2 =|u-v|
§7.2:失真的度量-4
• 平均失真度
– 单符号失真度: d(ui,vj)≥ 0,(i=1~r,j=1~s) 信源的失真矩阵可表示为:
第七章:信息率失真函数与限失真 信源编码定理
• 概述
本章研究内容
• 失真的度量
• 信息率失真函数
• 限失真信源编码定理
• 限失真信源编码定理应用
• 实用型信源编码
• 香农三大定理的关系和比较
§7.1:概述-1
• 无噪信道编码定理回顾:
– 总可以找到一种输入分布(信源编码方法),使在无 噪无损信道上,能够以信道容量C无误地传输信息。
试验信道的统计特性有关。
D
§7.2:失真的度量-7
• 平均失真度 – N维信源符号序列的平均失真度: 此时D为一 rN×sN阶的矩阵
率失真理论及经典的码率控制算法
率失真理论及经典的码率控制算法一、视频编码的率失真思想率失真理论研究的是限失真编码问题:能使限失真条件下比特数最小的编码为最佳编码。
设信源为},...,,{21m m a a a A =,经过编码后,信宿为},...,,{21n n b b b B =,定义信源、信宿概率空间分别为)}(),...,(),({Q )}(),...,(),({2121n m b Q b Q b Q a P a P a P P 、。
定义平均失真函数)(Q D 如下: ∑∑∑∑======m j j k j nk k j m j k j n k k j a b Q a P b a d b a P b a d Q D 1111)|()(),(),(),()(其中,),(k j b a d 为失真度,度量准则可是均方误差MSE 、绝对差分和SAD 或差分平方和SSD 等。
若信源概率分布)(j a P 已知,则平均失真仅仅取决于条件概率)|(j k a b Q ,从而必然存在这样一个条件概率)|(j k a b Q 使得D Q D ≤)(,即:))((D Q D Q Q D ≤=即D Q 为保证平均失真)(Q D 在允许范围D 内的条件概率集合。
进一步,定义),(Y X I 为接收端获取的平均信息量:)()|(log)|()(),(1k j k m j j k j b Q a b Q a b Q a P Y X I ∑==同样,在给定的)(j a P 前提下,),(Y X I 的大小也只取决于。
现在率失真函数)(D R 定义为在D Q 范围内寻找最起码的信息量,即:),()(min Y X I D R DQ Q ∈=该公式的含义:在允许的失真度为D 的条件下,信源编码给出的平均信息量的下界,也就是数据压缩的极限数码率。
当数码率R 小于率失真函数)(D R 时,无论采用什么编码方式,其平均失真必大于D 。
视频压缩是典型的限失真编码,率失真理论同样适应于视频编码。
第七章:限失真编码2
预测编码
最佳量化
不带量化器的DPCM线性预测编码,属于无失真编码系统; 带有量化器的DPCM线性预测编码,属于有失真编码系统。 DPCM线性预测系统是一个负反馈系统,对误差有收敛性。 发送端与接收端之间的误差等于量化误差。 最佳量化器的设计,可利用人眼的视觉可见度阈值和视 觉掩蔽效应等生理特征,来确定量化器的级数和步距,使量 化误差总处于人眼难以觉察的范围内,达到主观评定准则的 要求。
{I (U ,V )} 率失真函数公式 R( D) p (min v|u )B
D
存在符合条件的C2,使pe0
存在符合条件的C3,使D’<D
熵压缩编码
重点介绍三种有代表性的方法 1)量化 标量量化 矢量量化 2)变换编码 3)预测编码 习惯上对把矢量量化和变换编码称为熵压 缩分组编码,预测编码称为熵压缩树码 前面提到就是允许一定D,把熵率压缩最小, 即,使率失真函数最小。
0.0024 99
说法:随k增加,L一M算法明显比均匀量化好, 对无记忆高斯连续信源。标量压缩相当有效,矢 量量化性质同标量量化)(略)
变换编码:
它是熵压缩编码中的一种,还一种是什么 (矢量量化) 思想:(P243)
特点:多了两个限加:
§7.4:限失真信源编码定理-1
限失真信源编码定理
限失真信源编码定理的证明 编码定理-2
限失真信源编码定理
设R(D)为一离散无记忆平稳信源的信息率失真函数, 并且有有限的失真测度。对于任意D≥0,ε>0,δ >0以及任意足够长的码长n,则一定存在一种信源 编码C,其码字个数为: M= exp{n[R(D)+ε]} 而编码后码的平均失真度: d(C)≤D+δ 如果用二元编码,R(D)取比特为单位,则上式M可 写成: M=2{n[R(D)+ε]}
speex等级标准
speex等级标准Speex等级标准是一种失真编解码的衡量标准,主要用于评估语音编码的性能,在这种编解码中,主要考虑的是由无损编解码编码器提供的质量和效率,以及将许多因素来考虑容量限制,比如带宽限制、存储空间限制等等。
Speex是一种开源的语音处理技术,是一种针对高压缩率的可定制的特殊声道编码器。
它的特点在于可以提供快速的失真编解码,有很好的声音质量,可以在低带宽环境下实现更高的声音质量。
Speex等级标准用于衡量语音编解码器的性能,可以根据语音编解码器的结构来进行评估,它可以更加量化地衡量出语音编解码器的性能,并且可以评估它在低带宽环境中的性能。
Speex等级标准的基本原理是将声音失真程度分为5个等级,这5种类型的失真被称为品质等级。
首先来说说Speex品质等级1,它主要用于支持较低的带宽和语音码组,这使得Speex编码器的性能达到最低。
而Speex品质等级2,是一个更高级的标准,考虑到语音编码的性能和容量限制,它可以提供更高的降噪和压缩比,以及更清晰的声音。
Speex品质等级3和4,则是支持更高的带宽和更高的压缩率。
品质等级3和4可以为语音带来更优质的声音,也可以更大程度地降低失真,但是要求高带宽和存储空间,这也是它们与品质等级1和2的区别。
最后要说的就是Speex品质等级5,它的特点在于可以支持最高的带宽和压缩率,支持精确的音频失真度,同时也可以支持非常高质量的音频。
另外,它还可以在低带宽环境下提供更高的声音质量,因此能够更大程度地改善编解码的性能。
Speex等级标准的重要意义在于它为我们提供了一种可以量化的衡量语音编解码器性能的方式,通过这种方式我们可以更加客观地分析语音编解码器的性能,以及在不同的应用场景中的优劣。
Speex等级标准的出现为我们提供了一种新的方式,用来改善语音编解码器的性能,更专业地分析语音失真率,从而使得声音更加清晰,有助于提高无线通信的便捷性与效率。
Speex等级标准的发展,也是整个语音处理技术的重要组成部分,它提供了一种可量化衡量语音编解码器性能的方式,使得我们可以更加准确地评估语音编解码器的性能,并且可以更好地对其进行优化和改进,从而使得整个通信系统的效率得到大幅度提高。
信息理论与编码答案 人民邮电出版社
第一章 自我测试题一、填空题1. 在认识论层次上研究信息的时候,必须同时考虑到形式、__语义___和__语用___三个方面的因素。
2. 如果从随机不确定性的角度来定义信息,信息是用以消除__随机不确定性___的东西。
3. 信源编码的结果是__减小_冗余;而信道编码的手段是__增加___冗余。
4. _1948_年,香农发表了著名的论文__通信的数学理论__,标志着信息论诞生。
5. 信息商品是一种特殊商品,它有__保存性_性、_共享_性、_老化可能_性和 知识创造性 等特征。
二、判断题1. 信息传输系统模型表明,噪声仅仅来源于信道(×)2. 本体论层次信息表明,信息不依赖于人而存在(√)3. 信道编码与译码是一对可逆变换(×)4. 1976年,论文《密码学的新方向》的发表,标志着保密通信研究的开始(×)5. 基因组序列信息的提取和分析是生物信息学的研究内容之一(√)三、选择题1.下列表述中,属于从随机不确定性的角度来定义信息的是__D___ A . 信息是数据B . 信息是集合之间的变异度C . 信息是控制的指令D . 信息是收信者事先不知道的报道 2.___B__是最高层次的信息 A . 认识论 B . 本体论 C . 价值论 D . 唯物论 3.下列不属于狭义信息论的是__D___ A . 信息的测度 B . 信源编码 C . 信道容量 D . 计算机翻译 4.下列不属于信息论的研究内容的是__A___ A . 信息的产生 B . 信道传输能力 C . 文字的统计特性 D . 抗干扰编码 5.下列关于信息论发展历史描述不正确的是__B___A . 偶然性、熵函数引进物理学为信息论的产生提供了理论前提。
B . 1952年,香农发展了信道容量的迭代算法C . 哈特莱用消息可能数目的对数来度量消息中所含有的信息量,为香农创立信息论提供了思路。
D . 1959年,香农首先提出率失真函数和率失真信源编码定理,才发展成为信息率失真编码理论。
第五章 限失真信源编码和率失真函数修改
如果要把连续信源的消息离散化,由于信源熵为无穷大,根据无失真信源编码定理,要用无 穷多个比特数才能完全无失真地描述它,这在实际中是做不到的,因此必然会带来一定程 度的失真 .在允许一定失真程度的条件下,怎样用尽可能少的信道符号来表达信源的信息, 也就是信源熵所能压缩的极限或者说编码后信源输出的信息率压缩的极限值,这就是本章 要讨论的问题———限失真信源编码问题 .限失真信源编码也称保真度准则下的信源编 码、熵压缩编码或者称信息率失真理论,它是量化、数模转换、频带压缩和数据压缩的理 论基础 . 如果无失真的冗余度压缩编码主要是针对离散信源的,那么,有失真的熵压缩编码主 要是针对连续信源 .本章讨论的是离散无记忆信源的限失真信源编码理论,这样便于理解 率失真理论的基本概念 . 我们讨论的物理模型仍然是信源编码器,编码器的输入符号集 X = x1, x2,⋯, xr , ⋯ 输出符号集 Y = y1, y2,⋯, ys .编码器可以看作一个广义的信道, X是信道的输入, Y ⋯ 是信道的输出 .与无失真信源编码不同,这时从输入到输出的映射是一个多对一的映射, 它是不可逆的,信源符号序列和码符号序列之间的差异就是编码时引入的失真 .
≥ Dmax
ˆ x
x
由 Q (D ) 的定义必有 D ≥ Dmax 。
ˆ ˆ 反之,设 D ≥ Dmax 。由定义知,存在 x ∈ χ ,使
*
ˆ Dmax = ∑ p( x)d ( x, x * )
x
定义条件概率
1 x = x * ˆ ( x x) = ˆ ˆ Q ˆ ˆ ˆ 0 x ≠ x*
然而,实际中的信源往往是连续信源,一般来 说,不可能实现完全无失真的传输信源的信息.同 时,在实际生活中人们并不要求完全无失真地恢 复消息,只要求在一定的保真度条件下,近似地恢 复信源发出的消息.这就是本章要讨论的限失真 信源编码问题.
音频编码中的失真分析与改善方法
音频编码中的失真分析与改善方法音频编码是对音频信号进行压缩和转换的过程,以减少存储空间和传输带宽的使用。
然而,在音频编码过程中,由于信号的压缩和转换,会引入一定的失真。
本文将讨论音频编码中常见的失真类型及其原因,并介绍常用的改善方法。
I. 失真类型1. 噪音失真噪音失真是指在编码过程中引入的不相关信号,通常以噪音形式存在。
这会导致原始音频信号的某些频率成分受到破坏或隐藏。
主要原因包括量化误差、编码器设计不当等。
2. 信号丢失失真信号丢失失真是指在编码过程中丢失音频信号的部分信息。
这种失真通常发生在压缩率较高的编码算法中,导致音频信号的细节损失和声音空洞。
3. 预测误差失真预测误差失真是指通过使用预测算法对音频信号进行编码时引入的误差。
预测算法根据过去的样本来预测当前样本的值,但预测不准确会导致误差。
II. 失真分析方法1. 主观评估主观评估是一种通过人工听觉感知来评估音频失真的方法。
通过让听者评估编码后的音频质量,如清晰度、细节等,来判断失真程度。
2. 客观评估客观评估是使用特定的算法和工具来量化评估音频失真的方法。
常见的客观评估指标包括信噪比(SNR)、均方根误差(RMSE)等,这些指标通过数学计算来衡量音频质量损失的程度。
III. 失真改善方法1. 优化编码参数通过调整编码器的参数,如码率、量化步长等,可以在一定程度上减少失真。
合理地选择参数可以平衡音频质量和压缩比。
2. 采用高级编码算法采用先进的编码算法,如基于人听觉模型的编码算法,可以更好地利用人耳对音频信号的敏感度,减少对重要信息的失真。
3. 降低信号丢失失真减少信号丢失失真可以改善音频质量。
使用低压缩率的编码算法或增加编码器的带宽可以减少信号的信息丢失。
4. 加强预测方法改进预测算法可以减少预测误差失真。
使用更精确的预测模型或增加预测算法的复杂度可以提高预测的准确性。
总结:音频编码中的失真是一个不可避免的问题,但可以通过合理的分析和改善方法来减少失真的程度。
率失真编码
2
j
xi ) 1
根据[d]的对称性,假设一个反向信道(Y→X ) y1 y 2 ( x y ) x1 1 D D x2 D 1 D
反向信道的转移概率矩阵为,假设的反向信道应满足: φ(xi︱yj) 0 i, j = 1,2
(x
i 1
2
i
0 d 1 4 1 0 1 4 1 0
【例6.3】 绝对值误差失真测度 信源输出符号X = {0, 1, 2},信道输出符号Y = {0, 1, 2} ,给出失真 测度 d i j = ︱xi - yj ︱ i, j = 0, 1, 2 则失真测度矩阵为 0 1 2
输出符号yj引起的失真用 d (xi ,y j)(i =1, 2, …,I j = 1, 2, …, J )表示,简记为d i j,将所有的d i j列出来,可以得到下面的失 真测度矩阵 d d d
d d 21 d I 1
11 12
xI ,信道 q( X ) q( x1 ) q( x 2 ) q( x I ) x2
(2)D的最大值Dmax 当R (D) 达到其最小值Rmin(D)= 0时,对应的失真 最大,这种情况下D对应着R (D) 函数定义域的上界值 Dmax,如图4-1所示。 Dmax minD : RD 0 =min{D: I (X; Y ) = 0 } (4-15)
求出计算Dmax的显式:
d22 dI 2
d2J dI J
1J
(6-1)
【例6.1】 汉明(Hamming)失真测度 信源输出符号X = {x1, x2, …, xK},信道输出符号Y = {y1, y2, …, yK},约定失真测度
4限失真信源编码
限失真信源编码
●语音信号传输 ■ 语音(音频)信号的带宽 :20~20000Hz ■ 实际应用音频范围: ◆电话质量:300~3.4KHz 电话公用网 ◆调幅广播质量:50 ~7KHz 有现场感的语音传输 ◆高保真音频信号:20 ~20 KHz 高保真音响 ●图像信号传输 ■ 一路6MHz的普通电视信号数字化后,其码率将高 达167Mbps,对储存器容量要求很大,占有的带宽 将达80MHz左右。
信息率失真函数
●信息率失真函数的性质 ■ 函数R(D) 的定义域 ◆自变量D 取值的下限 ★允许失真度D是平均失真 D 的上限 , 而 D 是 非负函数d ( xi , yj ) 的数学期望 , 所以D的下 限至多只能是零。D 能否为零 , 与单个符号 的失真函数有关。 ★D = 0 即不允许失真。 ★对于离散信源 R(D) = R(0) = H(X) ★对于连续信源 R(D) = R(0) = Hc (X) = ∞
D
i 1
n
m
p ( xi y j )d ( xi , y j )
j 1
i 1
n
m
p ( xi ) p ( y j )d ( xi , y j )
j 1
满足
m
p ( y j ) 1条件的 D 中的最小值,即
j 1
D max min
m
j 1
p ( y j ) p ( xi ) d ( xi , y j )
失真函数
●定义: ■ 信源
X { x 1 , x 2 , , x n }
经过信源编码后输出
Y { y 1 , y 2 , , y m }
对于每一对( xi,yj ) , 指定一个非负函数 d (xi , yj ) ≥ 0 i = 1 , 2 , … , n j=1,2,… , m 称 d ( xi , yj ) 为单个符号的失真函数。 ●意义:表示信源发出符号 xi , 接收端再现 yj 所引起 的误差或失真。 ■ d ( xi , yj ) = 0 无失真; ■ d ( xi , yj ) > 0 有失真。
限失真信源编码精选课件
2018/8/12
14/49
信息率失真函数的性质
率失真函数的定义域
率失真函数的定义域问题就是在信源和失真函数已知 的情况下,讨论允许平均失真度D的最小和最大值问 题。 D的选取必须根据固定信源X的统计特性P(X)和选定的 失真函数d(xi , yj),在平均失真度 的可能取值范围 内。
2018/8/12
当p(xi),p(yj/xi )和d(xi,yj)给定后,平均失真度就是一个确定的量。
如果p(xi)和d(xi,yj)一定, 就只是信道统计特性的函数。信道传递 概率不同,平均失真度随之改变。
保真度准则
保真度准则:规定平均失真度 不能超过某一限定的上限值D, 即 ,则D就是允许失真的上界。该式称为保真度准则。 将保真度准则作为信道传递概率的约束条件,再求I(X;Y)的最小值就 有实际意义。
2018/8/12
16/49
信源最大平均失真度Dmax
信源最大平均失真度Dmax :容忍的失真越大,所需的 信息率就越小 。当R(D)等于0时,对应的平均失真D最 大,也就是函数R(D)定义域的上界值Dmax 。
信息率失真函数是平均互信息的极小值:
当R(D) =0时,即平均互信息的极小值等于0;
15/49
最小平均失真度Dmin
是非负函数d(xi , yj)的数学期望,也是一个非负函 数,显然其下限为0。因此允许平均失真度D的下限也 必然是0,这Leabharlann 是不允许有任何失真的情况。
允许平均失真度D能否达到其下限值0,与单个符号的 失真函数有关。 信源最小平均失真度Dmin :在失真矩阵的每一行找出 一个最小的d(xi , yj) ,对所有这些不同的最小值求数学 期望,就是信源的最小平均失真度。
H.264视频编码率失真优化和码率控制技术研究进展
H畅264视频编码率失真优化和码率控制技术研究进展崔子冠1,2,朱秀昌1,2,干宗良1,2,唐贵进1,2,刘 峰1,2(1.南京邮电大学江苏省图像处理与图像通信重点实验室,江苏南京210003;2.南京邮电大学宽带无线通信与传感网技术教育部重点实验室,江苏南京210003) 摘 要: 在H畅264率失真优化和码率控制(RC)技术研究的基础上,根据控制目的将率失真优化和RC的发展分为3个阶段:即率失真建模,考虑质量波动对主观质量的影响,以主观失真为指导的RC.分析了各阶段有代表性的RC技术及其特点,指明了RC需要进一步研究的关键和难点问题.对面向传输的错误弹性编码、可分级编码、多描述编码、以及立体与多视编码中的RC技术进行总结,分析进一步发展趋势.对下一代高性能视频编码(HEVC)中的RC应该如何发展进行了探讨.关键词: 视频编码;率失真优化;码率控制;H畅264中图分类号: TN919畅8 文献标识码: A 文章编号: 0372-2112(2013)12-2443-08电子学报URL:http://www.ejournal.org.cn DOI:10.3969/j.issn.0372-2112.2013.12.019AdvancesinRateDistortionOptimizationandRateControlTechniquesforH.264VideoCodingCUIZi-guan1,2,ZHUXiu-chang1,2,GANZong-liang1,2,TANGGui-jin1,2,LIUFeng1,2(1.ImageProcessingandImageCommunicationLab,NanjingUniversityofPostsandTelecommunications,Nanjing,Jiangsu210003,China;2.KeyLabofBroadbandWirelessCommunicationandSensorNetworkTechnology,NanjingUniversityofPostsandTelecommunications,MinistryofEducation,Nanjing,Jiangsu210003,China)Abstract: Basedontheresearchesofratedistortionoptimization(RDO)andratecontrol(RC)techniquesforH.264,thispaperdividesthedevelopmentofRDOandRCintothreephasesbasedonRCintention,namelyratedistortionmodeling,consideringtheeffectofqualityfluctuationonsubjectivequality,subjectivedistortionguidedRC;analyzesthecharacteristicsofrepresentativeRCtechniquesofeachphase,andfocusesonthekeyanddifficultissuesofRCneededtobefurtherresearched.ThensummarizestheRCschemesfortransmissionorientederrorresilientvideocoding,scalablevideocoding(SVC)andmultipledescriptioncoding(MDC)aswellasstereoandmulti-viewvideocoding,andanalyzesfurtherresearchtrends.Finally,howtodeveloptheRCschemesforhighefficiencyvideocoding(HEVC)isdiscussed.Keywords: videocoding;ratedistortionoptimization;ratecontrol;H畅2641 引言 目前主流的H畅264编码标准基于预测加变换的混合框架,采用多种帧内与帧间模式和基于率失真优化(RateDistortionOptimization,RDO)的模式选择等技术,获得了极高的压缩效率.下一代高性能视频编码(HighEf-ficiencyVideoCoding,HEVC)即H畅265在许多编码模块中进一步改进,其压缩效率比H.264又提高一倍.码率控制(RateControl,RC)是视频编码(VC)中的关键模块,根据各种约束(如目标码率、缓冲区、延迟、计算复杂度、信道状况等)自适应调节编码参数来规范输出码流使之适合信道带宽,并最优化视频质量.RC分两步:一是在收稿日期:2012-12-25;修回日期:2013-07-01;责任编辑:孙瑶基金项目:国家自然科学基金(No.61071091,No.61071166,No.61071167,No.61101105);江苏省高校自然科学基金(No.12KJB510019);南邮校科研基金(No.NY212015,No.NY212083);教育部博点基金(No.20113223120001);工业与信息化部通信软科学课题(No.2011-R-70);江苏高校优势学科建设工程—“信息与通信工程”;江苏省自然科学青年基金(No.BK20130867)第12期2013年12月电 子 学 报ACTAELECTRONICASINICAVol.41 No.12Dec. 2013约束条件下为编码单元(BasicUnit,BU)分配最优目标比特;二是根据率失真模型(RateDistortionModel,RDM)设计准确的控制技术使实际码率尽量接近目标码率.公式表述如下:min1N∑Ni=1Di(Qi),s.t.∑Ni=1Ri(Qi)尘RT(1)其中Qi为量化参数,Di(Qi)与Ri(Qi)为第i个BU的失真与码率,RT为目标码率.此有约束的最优化问题可由Lagrange乘子法转化为无约束问题,建立Lagrange代价函数,通过调节参数使代价函数最小即可,即:minJ=D+λR(2)其中λ是Lagrange乘子,J是代价函数.鉴于RC对VC的重要性,近年来针对H畅264在各种环境下的编码与传输问题,已经提出了很多有效的RC技术.文献[1]对2007年之前的RC技术进行了综述,但不断出现的新需求使RC的发展日新月异.本文主要对2007年以后RC的最新发展进行总结.第2节根据控制目的将单层VC(即一个信源编码产生一个码流)的RC分为RDM建模、考虑质量波动对主观质量的影响、以主观失真为指导的RC这3个阶段,总结各阶段有代表性的RC技术及其特点.在此基础上,第3节重点指明单层VC的RC需要进一步研究的关键和难点问题.第4节对面向传输的错误弹性编码(ErrorResilientVideoCoding,ERVC)、可分级编码(ScalableVideoCoding,SVC)、多描述编码(MultipleDescriptionCoding,MDC)、以及立体与多视编码(Multi-ViewVideoCoding,MVC)中的RC技术进行总结,分析进一步发展趋势.第5节对HEVC中的RC应该如何发展进行探讨.第6节总结全文.2 单层VC中RDO和RC研究进展2畅1 RDM建模H畅264在2003年颁布之后,由于其高效的压缩性能和网络适应性,基于H畅264的各种应用开始蓬勃发展,亟需准确的RDM和高效的RC技术以精确控制码率.H畅264基于RDO选择最优的编码模式,新技术的引入使得编码残差呈现出与以往标准不同的特性.因此这一阶段的主要任务在于考虑H畅264编码特性对残差分布准确建模,并建立准确的RDM.目前精确控制H畅264的I帧及P帧输出码率的目标已基本实现.由于I帧及P帧编码特性不同,导致RDM也不相同.下面分别对I帧及P帧的残差分布及有代表性的RDM进行对比和分析.2.1.1 P帧残差分布及有代表性的RDM残差DCT系数的分布对RDM建模非常重要,文献[2]认为DCT系数服从Laplacian分布并给出严格数学分析.目前H畅264RC中广泛使用的二次RDM就是根据Laplacian分布推导而来[3,4].文献[5]发现Laplacian分布具有指数形式,导致拖尾衰减过快,而实际DCT系数直方图常有大量的拖尾系数,因此用Cauchy分布对DCT系数进行建模更准确.文献[6]直接建立R及D与DCT系数为零的比率ρ之间的关系,也取得了准确的控制效果.基于这些统计分布提出的有代表性的RDM及其特点总结于表1.注意,这一阶段RC的目标主要是为了精确控制R,因此RDM常表现为R-量化步长(Qstep)的函数关系,而D模型常用简单的D=kQstep或D=kQ2step这种形式,即认为D与Qstep或Q2step成正比.如H畅264最有代表性的RC提案JVT-G012[3]采用线性MAD预测模型解决蛋鸡悖论,根据流量传输模型为BU分配目标比特,并用二次RDM计算Qstep,以较低的计算复杂度获得了较好的RC效果.基于RDM的RC算法具有类似的控制框架,在此框架下很多学者提出了有效的改进机制,主要集中于RDM的进一步改进[7]、BU目标比特的优化分配、BU的灵活划分、头码率的准确估计、缓冲区与延迟的有效管理、编码复杂度的有效测量、模型参数更新时历史数据点的有效选择等方面.表1 P帧残差分布及有代表性的RDM残差分布文献RDMLaplacian分布[3]R-H=a/Qstep+b/Q2step×MAD[4]R-H=A×Q2step+B×Qstep+C[8]R-H=α·SATD(Qstep)/QstepCauchy分布[5]R=aQ-αstep,D=bQβstepρ域模型[6]R(ρ)=θ×(1-ρ),D(ρ)=σ2e-α(1-ρ)2畅1畅2 I帧复杂度测量及RC编码常采用GOP结构,大部分帧都采用P帧编码,因此P帧RC研究较多而I帧RC研究较少,但I帧作为每个GOP的起始参考帧非常重要,有效进行I帧RC将有助于提高整个GOP的编码质量.文献[9]采用梯度信息测量I帧复杂度,计算简单但与I帧编码特性不符,改进效果有限.文献[10]用统计窗中所有像素与其均值的平均绝对差测量I帧复杂度,且分析4×4块是否具有水平、垂直、及左右对角线方向的条纹,若存在复杂度即设为零.此方法是想将H畅264帧内预测特性考虑进去,但只判断4种条纹方向及判断出条纹后复杂度即设为零与H畅264帧内编码特性不符,导致I帧复杂度测量仍不够准确.I帧RC要解决好3个问题:(a)准确的I帧复杂度4442 电 子 学 报2013年测量;(b)I帧目标比特最优分配;(c)准确的I帧R-Q模型.针对这3个问题,文献[11]通过边缘检测估计4×4块的预测模式和残差,用残差的平均绝对值测量I帧复杂度,之后提出一种新的R-Qstep模型,同时考虑缓冲区和序列特性为I帧分配合适的目标比特,得到了较好的I帧RC效果,IPPP方式编码时序列PSNR波动减少了60%以上.文献[11]与JVT-G012[3]及JVT-W042对Mobile序列编码的效果如图1.2畅2 考虑质量波动对主观质量的影响通过建立准确的R-Q模型精确控制输出码率的目标基本完成之后,RC研究的重点开始转向在R限制下为用户提供更好的主观感受,其中最小化失真变化的RC和基于感兴趣区域(ROI)的RC很有代表性.2畅2畅1 最小化失真变化的RC之前RC的目标都是在R限制下最小化平均失真(MINAVE),由于视频内容的多样性这种优化策略在编码时可能产生明显的质量波动,从而影响主观感受.针对R限制下对质量平稳性要求严格的应用(如视频流),就需要将最大失真(MINMAX)或失真方差(MIN-VAR)最小化,目的在于得到平滑一致的视频质量.公式表示如下:min(maxi∈1,…,NDi(Qi)),s.t.∑Ni=1Ri(Qi)尘RT(3)如文献[12],为常质量应用,基于MINMAX提出一种帧层多次编码方法,在最大失真与平均失真的控制上都好于JM算法.文献[13]在R约束下对时域滑动窗中的帧实施MINVAR准则,并用Lagrange乘子法进行求解,得到了一致的图像质量.文献[14]对质量平滑和码率(缓冲区)平稳这一矛盾问题进行研究,提出自适应窗口大小机制在保持质量平滑的同时保证缓冲区在安全水平以内.2畅2畅2 基于ROI的RC针对传统RC把图像所有区域同等看待的缺点,利用人眼对图像不同区域的关注度不同,首先检测出ROI区域如人脸、运动目标等,之后在R限制下对ROI细量化,对非ROI粗量化,以保证ROI的空时质量来优化主观感受[15].基于ROI的RC在低码率应用中(如视频会话)有广泛的应用前景.难点在于:(a)编码之前要先检测出ROI,准确地分割视频对象需要较高计算量而较小的计算量无法得到准确的检测效果;(b)根据关注度设定经验加权系数在ROI与非ROI之间进行R分配和QP调整,会产生较明显的方块效应;(c)最大问题在于RDM仍以(加权)MSE作为失真度量,其编码结果是使(加权)PSNR最优,与主观质量仍不完全一致.2畅3 以主观失真为指导的RCRC第二阶段开始考虑为用户提供更好的主观感受,但失真准则仍是客观失真.基于均方误差的峰值信噪比(PSNR)计算简单且物理意义明确,在视频质量评价中广泛应用,但PSNR与主观质量并不成正比,这是由于人类视觉系统(HVS)对视频质量的感知是高度非线性的,以PSNR为指导的RC不能得到最优的主观质量.因此如何根据HVS特性建立一种主观质量评价方法并用以指导视频编码成为一项重要的研究课题[16,17].即RC第三阶段的研究重点由第一阶段R模型的精确建模(以精确控制输出码率)转到主观D模型的有效建模(以获得最优的主观R-D性能).视频质量专家组(VQEG)和相关学者在这方面也做了初步研究,其中最具代表性的有基于视觉失真敏感度(VDS)或显著度(Saliency)的RC、基于恰可察觉失真(JND)的RC和基于结构相似性(SSIM)的质量评价与编码方法.2畅3畅1 基于VDS或Saliency的RC这类方法与基于ROI的RC有些类似,区别在于更充分地利用HVS特性建立VDS或Saliency图,以此进行优化的R分配.相比ROI与非ROI两级划分,R分配更加合理,主观质量更优.如文献[18]根据运动、纹理及空时掩模效应建立VDS图进行R分配以优化视觉质量.文献[19]融合运动、色彩、方向等多种特征建立Saliency图来指导R分配.2畅3畅2 基于JND的RCJND指人眼不能感知到的最大失真,即人眼对JND阈值以下的D不敏感.JND可对感知冗余有效建模,考虑了空时对比敏感度、亮度适应效应、对比度掩模效应等对主观失真建模及R调节具有很好的指导作用,如可对感知重要的区域细量化以保证质量而对感知冗余进行有效删除.文献[20]基于多种空时视觉特性建立JND模型以此指导视频编码.文献[21]根据视网膜的凹5442第 12 期崔子冠:H畅264视频编码率失真优化和码率控制技术研究进展性(Foveation)增强JND提出FJND模型,并用于MB层QP及λ调整.2畅3畅3 基于SSIM的质量评价与编码方法文献[22]基于HVS对结构信息更加敏感的特性提出基于块的SSIM测量,克服了PSNR基于点而忽略像素之间相关性的缺点,与主观质量非常一致且计算量较小,已被引入JM中以评价编码视频的主观质量.基于SSIM的质量评价及编码方法近年来得到广泛研究,但SSIM形式较为复杂,其与R或Q之间的闭解形式很难得到,是SSIM用于VC的难点所在.文献[23]提出SSIM失真与R存在指数关系,在BU层进行基于SSIM失真的最优R分配;之后将SSIM失真引入RDO模式选择中,发现基于SSIM的R-D曲线与基于MSE的R-D曲线相邻点处切线的坡度非常相似,使用之前关键帧的RDM和前一编码帧的R-D数据对来自适应的预测当前帧的λ.文献[24,25]将SSIM失真引入RDO框架后,先提出一种减少参考的SSIM估计模型并结合R模型提出了帧层自适应的λ,之后在MB层进一步根据运动信息和视觉速度感知的不确定性来调节λ.文献[26,27]首次提出SSIM-Qstep存在线性关系,并结合R模型进行SSIM最优的MB层RC;进一步将SSIM引入RDO框架,提出MB层自适应的分析型λ来更好地调节R和SSIM失真.相比之前算法的最大贡献在于得到了λ与Qstep以及图像特性(复杂度)之间的解析式.文献[26,27]与JVT-G012[3]对Deadline序列的编码效果如图2.3 单层VC需要进一步研究的问题 (1)对场景变换(SC)的处理及GOP变长编码.目前编码大多采用固定GOP结构,即周期性地插入I帧而不考虑序列特性.当序列包含SC或剧烈运动时编码效率很低且质量波动较大,在低码率应用中尤其严重,如果在编码时考虑SC并自适应地插入I帧则可更好地对P帧进行预测从而提高编码性能.如文献[28]基于SC检测提出了GOP长度自适应的编码机制.(2)λ自适应调整.在MB层QP确定之后,H畅264引入λ进行RDO模式选择,λ仅是QP的函数并控制着R与D之间的权衡.不同图像具有不同的率失真特性,根据图像内容自适应地调整λ有望获得更好的率失真性能.如文献[29]对基于MSE的RDO中的λ在MB层根据编码复杂度自适应调整.文献[30]发现λ与视频信号的R-D特性之间存在线性关系,提出一种启发式的不依赖于QP的λ计算方法,改进了编码效率.(3)多维RC.传统RC都是在R约束下调节QP来优化视频质量,而帧率与图像分辨率常作为预定值独立于QP.这类机制在高码率应用中性能较好,但在低码率应用中常导致空间质量很低甚至被动跳帧引起时域质量的大幅波动.如JM通过监测缓冲区,一旦超过阈值(缓冲区的80%)就跳过下一帧,这种被动跳帧在以下两种情况经常发生:一是I帧编码后由于R剧增导致后续P帧被连续跳过;二是剧烈运动或SC时,由于I宏块数增加导致后续带有重要信息的帧被跳过.HVS对低运动序列更注重空间质量而对高运动序列更注重时域连续性[31],因此低码率应用中可以根据序列特性和缓冲区联合调节帧率、空间分辨率和QP(即多维RC)以优化空时质量.如何准确估计跳过帧与编码帧的失真,并用以确定跳帧数目和下一编码帧的QP使局部窗中帧平均失真最小是研究难点.编码端自适应跳帧与解码端插帧相结合[32],以及编码端空间下采样与解码端上采样相结合[33]来提高编码效率和解码端空时质量是今后一个重要的研究课题.(4)便于硬件实现的RC.传统RC都是基于软件实现的,由于算法的复杂性不适合硬件系统采用.但近年来随着视频电话、数字摄像机等广泛应用,亟需适合硬件实现的RC机制来提高这些设备的编码性能.便于硬件实现的RC算法[34]需要具备以下特性:(a)低复杂度,考虑到计算能力和功耗;(b)较小的缓冲区需求和延迟,考虑到编码实时性;(c)算法设计上要便于硬件实现,比如指令级优化.(5)联合功率或复杂度RDO(PRDO、CRDO)的RC.随着便携设备和网络技术的发展,带宽不再是限制视频通信的唯一条件,便携设备的功耗和续航能力也是设计编码算法时要考虑的关键因素之一.功耗主要来自于编码与传输两部分,编码功耗随计算复杂度单调增加,而传输功耗与压缩码流的大小成正比.因此如何在功耗或复杂度约束下最优化视频的R-D性能成为一项重要的研究课题.目前大多数研究是将功耗约束转化为计算复杂度约束,并在传统R-D分析的基础上加上功率或复杂度约束,建立统一的功率[35]或复杂度R-D分析模型[36],通过调整复杂度控制参数达到功耗和R-D性能的联合最优.关键问题在于:(a)建立合适的功耗或计算复杂度测量方法;(b)建立简单有效的PRD或CRD分析模型;(c)对分析模型的有效求解.(6)视频流中的RC及多路复用中的RC.随着6442 电 子 学 报2013年H畅264在视频流和多路复用中的广泛应用,需要有效的RC算法在延迟受限的情况下进行常质量控制.文献[37]为视频流提出一种延迟失真优化(DDO)分析框架,以寻求延迟与失真之间的最优平衡来保证接收端连续高质量的播放.文献[38]为多路视频在共享信道中的高效传输使用双帧技术进行码流间及帧间联合最优比特分配,以最小化总体MSE失真.另外把编码端的R-D分析与网络参数联合优化以提供端到端的服务质量保证(QoS)也是将来的一个研究热点.(7)视频转码的RC.转码是指码流从一个码率转换到另一个码率,或在不同编码格式之间相互转化.其中RC是视频转码中的关键问题[39],对码率自适应、码流串连影响重大,RC的好坏直接影响转码过程中引入的质量下降程度.4 面向传输及多视中的RC进展4畅1 ERVC与联合信源信道RC无线网络中如何在编码端根据丢包特性通过调节编码参数以提高码流的抗误码性能是一项重要的研究课题.H畅264的抗误码机制主要有:帧内MB刷新,自适应参考帧,自适应冗余图像,数据分区等.帧内MB刷新主要有随机或定期刷新、基于运动信息或视觉关注度的刷新,但这类机制没有充分考虑信源与信道的状况无法达到编码效率与抗误码性能的最优平衡.由于信源和信道的时变特性,帧内MB刷新数目和位置的选择至关重要,因为帧内MB会降低压缩效率而位置不佳将不能阻止误码传播,因此有必要建立一种针对丢包环境下的RDM和RC机制在R-D最优意义下选择帧内刷新率与刷新位置[40].自适应参考帧[41]是为了解决由于信道误码造成的编码端与解码端参考帧不匹配的问题.自适应冗余图像[42]通过编码适当的冗余信息以减轻信道误码对解码质量的影响.数据分区可以将编码信息按照重要性分开传输,以便对重要数据实施更强的保护.联合信源信道RC与ERVC类似,也是基于端到端RDM联合最优地选择编码模式和QP.文献[43]针对丢包网络提出一种RDM,克服了RC与误码恢复互不相关的缺点,在R限制下能充分利用信道带宽并使得信源编码与信道传输的总失真最小.文献[44]把端到端总失真视为信源量化失真、错误传播失真和错误隐藏失真三项之和,很好地揭示了丢包环境下真正的R-D关系.无线网络鲁棒视频传输最核心的问题在于:(a)端到端失真的准确建模;(b)在编码端准确估计解码端失真;(c)用总失真指导编码参数的调整.如文献[45]的帧层失真估计尤其考虑了H.264的新特性(如分像素的运动补偿、帧内预测和去块效应滤波等内插操作)对失真建模的影响.文献[46]使用有限状态Markov链对连续丢包信道中的传输失真进行建模.最近文献[47,48]对传输失真中的截断与误码扩散两个重要特性进行建模,并根据信源与信道特性得到了传输失真的递归计算公式,相比之前的失真模型更加准确而且计算复杂度更低.4畅2 SVC的RCSVC将视频编码成一个基本层和多个增强层,解码端根据运算能力及网络状况选择解码部分码流以获得所需的视频质量.SVC中RC的关键问题在于根据各层之间相关性进行最优的R分配与控制[49,50],难点在于:(a)根据不同层的特性提出更加准确的RDM;(b)不同层之间的最优R分配;(c)如何保证SVC编码质量的平稳性.4畅3 MDC的RCMDC相比SVC的优点是每个描述均可独立解码,而SVC中基本层一旦丢失,则增强层无用.MDC中RC的关键问题在于根据不同的多描述方案[51]在多个描述之间最优分配R以最小化D.目前MDC的RC算法较少且控制效果一般,这是因为不同的MDC方案会产生不同的编码特性,导致不同描述及其之间的R-D特性难以建模.因此MDC的RC需要根据具体的多描述方案来分析R和D特性,如文献[52]为基于分层次B帧的MDC进行最优R分配以平衡编码效率和错误弹性.4畅4 立体与MVC的RC立体与MVC除了提供2D视频信息,还提供表现3D场景的深度或多视信息,丰富了用户体验,必将成为今后VC领域的研究热点.立体与MVC中RC的关键问题在于2D视频与深度之间以及多个视点之间有效分配R以最优化视频的感知质量,其中深度序列编码的R-D特性和不同视点之间相关性分析与建模是RC成功的必要条件,这也是立体与MVC中RC今后研究的热点,比如文献[53]为分别从视点层、视频/深度层、及帧层分配R,满足了信道与缓冲区的需求;文献[54]利用二次R模型和线性D模型对3DTV广播的左/右视点的R进行联合控制.另外,2DVC中基于主观质量或ERVC思想都可以推广到3DVC的RC中以改进主观R-D性能与错误鲁棒性.如文献[55]为MVC提出基于立体视觉关注度的R分配算法.文献[56]对MVC在丢包网络中传输由于随机丢帧产生的信道失真进行建模.5 HEVC的RC 针对高清视频的HEVC在2013年颁布之后,必然会在视频编码领域引发新一轮的研究热潮.但截止目前,极少有对HEVC中RC进行研究的文献出现.HEVC7442第 12 期崔子冠:H畅264视频编码率失真优化和码率控制技术研究进展中RC研究的关键问题在于:(a)考虑新的编码技术对纹理信息和头信息码率所产生的影响,建立准确的纹理与非纹理RDM来指导R的分配与控制,在准确控制R的同时提高编码R-D性能;(b)引入主观失真,在一定R下通过调节QP以最优化主观质量.文献[57]认为HEVC编码单元或变换单元预测与变换的深度不同,四叉树预测残差的统计特性也不同,用Laplacian混合分布来描述残差,得到HEVC编码的R和D模型.文献[58]同样基于Laplacian分布推导出R-Q与D-Q模型,计算QP时同时考虑了帧间质量波动和缓冲区约束,得到了一致的视频质量.6 结论 从对RC最新研究成果的分析可见,针对H畅264的基于客观质量的RDM和RC研究得已较为成熟,而主观失真建模及在RC中的应用、面向无线网络的ERVC、面向异构网络的SVC及MDC中的RC、丰富用户体验的立体与MVC中的RC、以及针对高清视频的HEVC中的RC研究成果较少,控制精度不够且复杂度高,将成为今后RC技术研究的重点和难点.参考文献[1]ChenZZ,NganKN.Recentadvancesinratecontrolforvideocoding[J].SignalProcessing:ImageCommunication,2007,22(1):19-38.[2]LamE,GoodmanJW.AmathematicalanalysisoftheDCTcoefficientdistributionsforimages[J].IEEETransactionsonImageProcessing,2000,9(10):1661-1666.[3]LiZG,PanF,LimKP.AdaptivebasicunitlayerratecontrolforJVT[A].Proceedingsofthe7thJVT-G012Meeting[C].PattayaII,Thailand:JVT,2003.1-33.[4]袁武,林守勋,牛振东,等.H.264/AVC码率控制优化算法[J].计算机学报,2008,31(2):329-339.YuanWu,LinShou-xun,NiuZhen-dong,etal.EfficientratecontrolschemesforH.264/AVC[J].ChineseJournalofCom-puters,2008,31(2):329-339.(inChinese)[5]KamaciN,AltunbasakY,MersereauRM.FramebitallocationfortheH.264/AVCvideocoderviaCauchy-density-basedrateanddistortionmodels[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2005,15(8):994-1006.[6]HeZ,MitraSK.Optimumbitallocationandaccurateratecon-trolforvideocodingviaρ-domainsourcemodeling[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2002,12(10):840-849.[7]霍炎,李生红,荆涛.基于广义拉普拉斯分布的低时延速率控制算法[J].电子学报,2010,38(5):1078-1083.HuoYan,LiSheng-hong,JingTao.Low-delayratecontrolbasedongeneralizedLaplaciandistribution[J].ActaElectroni-caSinica,2010,38(5):1078-1083.(inChinese)[8]KwonD,ChenM,KuoC.RatecontrolforH.264videowithenhancedrateanddistortionmodels[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2007,17(5):517-529.[9]YanB,SunK.JointcomplexityestimationofI-frameandP-frameforH.264/AVCratecontrol[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2012,22(5):790-798.[10]LeeG,LinH,WangM.Ratecontrolalgorithmbasedonintra-picturecomplexityforH.264/AVC[J].IETImageProcess-ing,2009,3(1):26-39.[11]崔子冠,朱秀昌.H.264图像复杂度自适应的I帧码率控制算法[J].电子与信息学报,2010,32(11):2547-2553.CuiZi-guan,ZhuXiu-chang.Imagecomplexityadaptiveintra-frameratecontrolalgorithmforH.264[J].JournalofElec-tronicsandInformationTechnology,2010,32(11):2547-2553.(inChinese)[12]CherniavskyN,ShavitG,RingenburgMF,etal.MultiStage:AMINMAXbitallocationalgorithmforvideocoders[J].IEEETransactionsonCircuitsandSystemsforVideoTech-nology,2007,17(1):59-67.[13]LeeH,SullS.AVBRvideoencodingforlocallyconsistentpicturequalitywithsmallbufferingdelayunderlimitedband-width[J].IEEETransactionsonBroadcasting,2012,58(1):47-56.[14]XuL,LiS,NganKN,etal.Consistentvisualqualitycontrolinvideocoding[J].IEEETransactionsonCircuitsandSys-temsforVideoTechnology,2013,23(6):975-989.[15]WuG,FuY,HuangS,etal.Perceptualquality-regulablevideocodingsystemwithregion-basedratecontrolscheme[J].IEEETransactionsonImageProcessing,2013,22(6):2247-2258.[16]NaccariM,PereiraF.AdvancedH.264/AVC-basedperceptu-alvideocoding:architecture,tool,andassessment[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2011,21(6):766-782.[17]WuG,WuT,ChienS.Algorithmandarchitecturedesignofperceptionengineforvideocodingapplications[J].IEEETransactionsonMultimedia,2011,13(6):1181-1194.[18]TangCW.Spatiotemporalvisualconsiderationsforvideocod-ing[J].IEEETransactionsonMultimedia,2007,9(2):231-238.[19]LiZC,QinSY,IttiL.Visualattentionguidedbitallocationinvideocompression[J].ImageandVisionComputing,2011,29(1):1-14.[20]WeiZ,NganKN.Spatio-temporaljustnoticeabledistortionprofileforgrayscaleimage/videoinDCTdomain[J].IEEE8442 电 子 学 报2013年TransactionsonCircuitsandSystemsforVideoTechnology,2009,19(3):337-346.[21]ChenZZ,GuillemotC.Perceptually-friendlyH.264/AVCvideocodingbasedonfoveatedjust-noticeable-distortionmodel[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2010,20(6):806-819.[22]WangZ,BovikAC,SheikhH,etal.Imagequalityassess-ment:fromerrorvisibilitytostructuralsimilarity[J].IEEETransactionsonImageProcessing,2004,13(4):600-612.[23]OuT,HuangYH,ChenHH.SSIM-basedperceptualratecontrolforvideocoding[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2011,21(5):682-691.[24]WangSQ,RehmanA,WangZ,etal.SSIM-motivatedrate-distortionoptimizationforvideocoding[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2012,22(4):516-529.[25]WangSQ,RehmanA,WangZ,etal.PerceptualvideocodingbasedonSSIM-inspireddivisivenormalization[J].IEEETransactionsonImageProcessing,2013,22(4):1418-1429.[26]崔子冠,朱秀昌.H.264结构相似性最优的宏块层码率控制算法[J].电子与信息学报,2011,33(6):1339-1344.CuiZi-guan,ZhuXiu-chang.StructuralsimilarityoptimalMBlayerratecontrolalgorithmforH畅264[J].JournalofElectron-icsandInformationTechnology,2011,33(6):1339-1344.(inChinese)[27]崔子冠,朱秀昌.基于结构相似的H.264主观率失真性能改进机制[J].电子与信息学报,2012,34(2):433-439.CuiZi-guan,ZhuXiu-changSubjectiverate-distortionperfor-manceimprovementschemeforH.264basedonSSIM[J].JournalofElectronicsandInformationTechnology,2012,34(2):433-439.(inChinese)[28]PaulM,LinWS,LauC,etal.ExploreandmodelbetterI-framesforvideocoding[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2011,21(9):1242-1254.[29]ZhangJ,YiXQ,LingN,etal.ContextadaptiveLagrangemultiplier(CALM)forrate-distortionoptimalmotionestima-tioninvideocoding[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2010,20(6):820-828.[30]袁武,牛振东,林守勋,等.不依赖于量化参数的视频编码控制优化技术[J].计算机学报,2011,34(8):1519-1527.YuanWu,NiuZhen-dong,LinShou-xun,etal.AnadaptableQP-independentapporachtorate-distortionoptimizationforvideocoding[J].ChineseJournalofComputers,2011,34(8):1519-1527.(inChinese)[31]MaZ,XuM,OuY,etal.Modelingofrateandperceptualqualityofcompressedvideoasfunctionsofframerateandquantizationstepsizeanditsapplications[J].IEEETransac-tionsonCircuitsandSystemsforVideoTechnology,2012,22(5):671-682.[32]CuiZG,GanZL,ZhuXC.Jointspatial-temporalqualityimprovementschemeforH.264lowbitratevideocodingviaadaptiveframeskip[J].KSIITransactionsonInternetandIn-formationSystems,2012,6(1):425-444.[33]RheeC,KimJ,LeeH.Bitratecontrolusingaheuristicspatialresolutionadjustmentforareal-timeH.264/AVCencoder[J].EURASIPJournalonAdvancesinSignalProcessing,2012,87:1-12.[34]KuoC,ChangL,FanK,etal.Hardware/softwarecodesignofalow-costratecontrolschemeforH.264/AVC[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2010,20(2):250-261.[35]HeZ,ChengW,ChenX.Energyminimizationofportablevideocommunicationdevicesbasedonpower-rate-distortionoptimization[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2008,18(5):596-608.[36]SuL,LuY,WuF,etal.Complexity-constrainedH.264videoencoding[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2009,19(4):1-15.[37]OzcelebiT,TeklapAM,CivanlarMR.Delay-distortionopti-mizationforcontent-adaptivevideostreaming[J].IEEETransactionsonMultimedia,2007,9(4):826-836.[38]TiwariM,GrovesT,CosmanPC.Delayconstrainedmulti-plexingofvideostreamsusingdual-framevideocoding[J].IEEETransactionsonCircuitsandSystemsforVideoTech-nology,2010,19(4):1022-1035.[39]XuL,KwongS,WangHL,etal.Auniversalratecontrolschemeforvideotranscoding[J].IEEETransactionsonCir-cuitsandSystemsforVideoTechnology,2012,22(4):489-501.[40]宋彬,蒋小兵,秦浩,等.基于H.264具有抗分组丢失能力的帧内刷新算法[J].电子学报,2009,37(1):221-224.SongBin,JiangXiao-bing,QinHao,etal.Apacketlossre-silientintrarefreshalgorithmbasedonH畅264[J].ActaElec-tronicaSinica,2009,37(1):221-224.(inChinese)[41]TuW,SteinbachE.Proxy-basedreferencepictureselectionforerrorresilientconversationalvideoinmobilenetworks[J].IEEETransactionsonCircuitsandSystemsforVideoTech-nology,2009,19(2):151-164.[42]ZhuC,WangY,HannukselaM,etal.Errorresilientvideocodingusingredundantpictures[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2009,19(1):3-14.[43]陈川,余松煜.联合编码模式选择的码率控制算法[J].电子学报,2004,32(5):763-768.ChenChuan,YuSong-yu.Jointcodingmodeselectionandratecontrolalgorithm[J].ActaElectronicaSinica,2004,329442第 12 期崔子冠:H畅264视频编码率失真优化和码率控制技术研究进展(5):763-768.(inChinese)[44]ZhangY,GaoW,LuY,etal.Jointsource-channelrate-distor-tionoptimizationforH畅264videocodingovererror-pronenet-works[J].IEEETransactionsonMultimedia,2007,9(3):445-454.[45]WangY,WuZ,BoyceJM.Modelingoftransmission-loss-in-duceddistortionindecodedvideo[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2006,16(6):716-732.[46]LiZC,ChakareskiJ,NiuX,etal.ModelingandanalysisofdistortioncausedbyMarkov-modelburstpacketlossesinvideotransmission[J].IEEETransactionsonCircuitsandSys-temsforVideoTechnology,2009,19(7):917-931.[47]ChenZF,PahalawattaPV,TourapisAM,etal.Improvedes-timationoftransmissiondistortionforerror-resilientvideocod-ing[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2012,22(4):636-647.[48]ChenZF,WuDP.Predictionoftransmissiondistortionforwirelessvideocommunication:Analysis[J].IEEETransac-tionsonImageProcessing,2012,21(3):1123-1137.[49]刘家瑛,郭宗明,ChoY.面向H.264/SVC空域-质量域可伸缩编码的码率分配算法[J].电子学报,2010,38(9):2112-2117.LiuJia-ying,GuoZong-ming,ChoY.BitallocationalgorithminH畅264/SVCspatial-qualitywithdependentR-Dmodeling[J].ActaElectronicaSinica,2010,38(9):2112-2117.(inChinese)[50]李晓峰,周宁,刘洪盛,等.一种基于缩减栅格算法的SVC联合信源/信道编码方法[J].电子学报,2011,39(4):859-864.LiuXiao-feng,ZhouNing,LiuHong-sheng,etal.Ajointsource/channelcodingwithreducedtrellisalgorithmforthescalableextensionofH畅264/AVC[J].ActaElectronicaSini-ca,2011,39(4):859-864.(inChinese)[51]KamnoonN,AgrafiotisD,CanagarajahC.Flexibleadaptivemultipledescriptioncodingforvideotransmission[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2012,22(1):1-11.[52]TsaiW,YouH.MultipledescriptionvideocodingbasedonhierarchicalBpicturesusingunequalredundancy[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2012,22(2):309-320.[53]LiuYW,HuangQM,MaSW,etal.Anovelratecontroltechniqueformultiviewvideoplusdepthbased3Dvideocod-ing[J].IEEETransactionsonBroadcasting,2011,57(2):562-571.[54]ChangY,KimM.Ajointratecontrolschemeinahybridstereoscopicvideocodecsystemfor3DTVbroadcasting[J].IEEETransactionsonBroadcasting,2013,59(2):265-280.[55]ZhangY,JiangGY,YuM,etal.Stereoscopicvisualatten-tion-basedregionalbitallocationoptimizationformultiviewvideocoding[J].EURASIPJournalonAdvancesinSignalProcessing,2010,60:1-24.[56]ZhouY,HouCP,XiangW,etal.Channeldistortionmodel-ingformulti-viewvideotransmissionoverpacket-switchednetworks[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2011,21(11):1679-1692.[57]LeeB,KimM.Modelingratesanddistortionsbasedonamix-tureofLaplaciandistributionsforinter-predictedresiduesinquadtreecodingofHEVC[J].IEEESignalProcessingLet-ters,2011,18(10):571-574.[58]SeoC,MoonJ,HanJ.Ratecontrolforconsistentobjectivequalityinhighefficiencyvideocoding[J].IEEETransactionsonImageProcessing,2013,22(6):2442-2454.作者简介崔子冠 男,1982年1月出生于河南郑州.2011年获南京邮电大学工学博士学位,现为南京邮电大学通信与信息工程学院讲师,主要研究方向为视频编码与传输.E-mail:cuizg@njupt.edu.cn朱秀昌 男,1947年8月出生于江苏丹徒.教授,博士生导师,江苏省图像处理与图像通信重点实验室主任,主要研究方向为图像处理与多媒体通信.干宗良 男,1979年9月出生于新疆石河子.2007年获南京邮电大学工学博士学位,现为南京邮电大学通信与信息工程学院讲师,主要研究方向为图像处理与视频通信.0542 电 子 学 报2013年。
率失真理论
我们先讨论信息率失真函数的性质, 计算一个简单的例子, 然后证明这个函数总是可达的, 即总是存在失真为 D 而码率为 R ( D ) 的率失真码。
I
ˆ ) ,则 5. 定理 4.1:对于 i.i.d 的信源 X,如果其分布为 p(x),且其有界失真度量函数为 d ( x, x
率失真函数与对应的信息率失真函数总是相等的。即:
R( D) = R I ( D) =
ˆ | x ): p( x
( x ,x )
ˆ) I(X ; X min ˆ| x ) d ( x , x ˆ )≤ D p( x) p( x ∑ ˆ
6.2 计算 1. 一个简单例子:考虑一个二元 Bernulli 信源,其输出符号 1 的概率为 p,失真度量为汉明 失真,则:
(b)是因为增加条件会降低熵 (c)是因为对于汉明失真度量函数:
3 / 8
ˆ ) = Pr( X ≠ X ˆ )d ( X , X ˆ ) + Pr( X = X ˆ )d ( X , X ˆ) Ed ( X , X ˆ )i1 + Pr( X = X ˆ ) i0 = Pr( X ≠ X ˆ) = Pr( X ≠ X ≤D
Dmax 也可以通过另一种方法来进行定义:满足 R ( D) = 0 的所有 D 中的最小值。
3. 率失真函数 R ( D ) 的性质 (1) R ( D ) 是 D 的非增函数 (2) R ( D ) 是凸函数 (3) 当 D ≥ Dmax , R ( D ) = 0
ˆ = 1 表示 x (1) 我们首先寻找率失真函数的一个下界:注意到对于 Bernolli 信源, x ⊕ x
ˆ ,类似的, x ⊕ x ˆ 。 ˆ 不相等,换句话说, x ⊕ x ˆ = 1 等价于 X ≠ X ˆ = 0 等价于 X = X 与x
第5章 有失真信源编码
第5章 有失真信源编码(信息率失真函数)离散信源有失真编码 连续信源有失真编码5.1信息率-失真函数的概念在第2章我们证明了当输入随机变量的概率分布确定时,互信道是条件转移概率的下凸函数,即互信息必存在一个最小值。
然而,在没有其它约束条件的情况下,这个最小值就是零。
因为一方面互信息总是非负的,另一方面,当输入和输出随机变量相互独立时互信息等于零。
所以研究一般情况下互信息的极小值问题没有什么意义。
无失真信源编码时,信源的熵是信息率所能达到的下限。
在很多实际情况下,要做到完全没有失真是没有必要的,特别是对连续信源编码,由于信源的绝对熵无穷大,要达到无失真编码是不可能的。
为此,我们有必要研究在满足某种失真准则下互信息的极小值问题,即信息率-失真函数。
首先看离散信源的情况。
设X和Y是定义在相同取值域},,,{21n a a a B A ==上的离散型随机变量。
失真函数d(x,y) 是定义在B A ⨯上的非负函数B y A x y Y x X d y x d ∈∈===,),,(),(例如,可定义⎩⎨⎧≠===j i j i a a d j i d j i ,,0),(),(α(5.1.1)其物理意义是当输入和输出相等时没有失真,当输入和输出不相等时失真是相同的。
显然失真函数d(x,y)是对Y代表X所引起失真的量度。
失真函数的定义由所研究的客观问题决定。
(5.1.1)式的失真函数称为汉明失真准则。
失真函数只定义了若干具体失真的数值,为了反映随机变量之间的总体失真情况,我们定义平均失真[]),(y x d E d =(5.1.2)对离散型变量∑∑=ijj i d i j p i p ),()|()( (5.1.3)如果X和Y都是L维随机矢量,可定义矢量间的失真为∑==Ll l l L y x d L Y X d 1),(1),((5.1.4)平均失真[]∑∑=====L l Ll ll l L L d L y x d E L Y X d E d 111)],([1),((5.1.5)其中l d 是第l 个分量的平均失真。
第21讲——无记忆信源的有失真编码(1)
率失真函数的基本性质
1. R(D)的定义域 0 Dmin D Dmax
Dmin min p(v u )q(u )d (u, v)
pij p D
min q(u ) p(v u )d (u, v)
pij p D
u
v
q(u ) min d (u, v)
0 1 0 0 1 0 p ( y | x) 0 1 0
率失真函数的基本性质
2. R(D)是关于平均失真度D的下凸函数
设 D1 , D2 为任意两个平均失真, 0 a 1 ,则有:
R(aD1 D2 )
失真信息速率函数
信息率失真函数
R D min I U ;V
pij B
D
失真-信息速率D(R)函数
D R min D
DDR
率失真函数给出了熵压缩编码可能达到的最小熵率与失 真的关系,其逆函数称为失真率函数,表示一定信息速 率下可能达到的最小的平均失真。
信息传输理论和率失真理论的 对偶关系
第二十一讲 无记忆信源的有失真编码 ——率失真理论(1)
失 真
由于信道的干扰,信息在传输过程中也会产生 差错或失真; 对信源无失真压缩的极限是熵,如果再继续压 缩就要失真。 信宿的灵敏度和分辨力有限,无需要求传输过 程中信息绝对无失真; 允许信息有某些失真,可以降低信息传输速率, 从而降低通信成本。 结论:失真不可避免,有时甚至必要
1 p( y | x) 0 0 0 1 0 0 0 1
1 2 3 2 1 3 d 3 2 1
Dmax min p( x)d ( x, y ) min p(a1 ) 1 p(a2 ) 2 p(a3 ) 3 ,
HM编码器代码阅读(42)——率失真优化
HM编码器代码阅读(42)——率失真优化原理一、率失真优化的目标就是:1、在一定的码率(码率也表现为数据压缩的程度,码率越低,数据压缩的越厉害)限制下,减少视频的失真(减少失真就会提高视频的主观质量,看的人就会喜欢o(*≧▽≦)ツ)!2、在允许一定的失真下,把视频压缩到最小!二、编码器的率失真优化的工作主要是按照某种策略选取最优的编码参数,以实现最优的编码性能,某个模式下的率失真代价,是通过该模式下编码的失真和占用的比特比特数来计算的三、率失真函数RD 是在假定信源在给定的情况下,在用户可以容忍的失真度内再现数据消息所必需获得的最小平均互信信息,直白一点说,就是在允许的失真内,数据可以压缩的极限!我们对数据的压缩不能超过这个极限,否则,数据在解码端就不能再现了!因此我们的工作就是,在不超过这个极限的前提下,尽量使数据压缩得更小!更多的细节参考 HEVC/H.265理论知识(10)——率失真优化代码实现某个模式下的率失真代价,是通过该模式下编码的失真和占用的比特比特数来计算的TComDataCU中有三个成员以及函数和率失真相关:1.UInt& getTotalDistortion() { return m_uiTotalDistortion; } //总的失真,某一种模式下总的失真2.Double& getT otalCost() { return m_dT otalCost; } //总的代价,某一种模式下总的代价3.UInt& getTotalBits() { return m_uiTotalBits; } //总得比特数,按照某一种模式进行编码之后的总比特数失真的计算一个像素块的总的失真就是该像素块中三个分量的失真之和。
失真是通过TComRdCost::getDistPart函数进行计算的,DistParam是失真参数结构体,用于存放计算失真的参数,以及处理计算过程的函数指针,至于使用哪个具体的率失真计算函数,可以通过DFunc枚举来指定,默认使用DF_SSE(即xGetSSE,平方误差和)。
kp4 误码率
kp4 误码率
KP4误码率是指KP4编码技术所在的通信系统中,数据传输过程中发生的误码率。
KP4编码技术是一种高效的差错控制编码技术,可以在数据传输过程中检测并纠正错误,从而提高通信系统的可靠性和稳定性。
KP4误码率的大小对通信系统的性能和可靠性影响非常大,因此在实际应用中需要通过合理的设计和优化来降低误码率。
误码率的大小受到多种因素的影响,包括信道质量、信噪比、信道带宽、编码率等,在实际应用中需要综合考虑这些因素来优化误码率。
针对KP4误码率的优化,可以采取多种措施,包括改善信道质量、提高信噪比、优化编码参数等。
另外,还可以通过加入差错控制协议、增加冗余码等方式来进一步提高通信系统的可靠性和稳定性。
总之,KP4误码率是通信系统中非常重要的一个性能指标,需要在实际应用中进行合理的设计和优化,以提高通信系统的可靠性和稳定性。
- 1 -。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.1
失真测度与平均失真
在允许一定失真的前提下,从提高传输效率的角度出发, 可以对信源信息量事先进行压缩再予传输,这章要讨论的 问题就是给定一个失真度,求出在平均失真小于给定值的 条件下,信源所能压缩的最低程度,即率失真函数R(D)。 1.失真测度 x, y ) 失真测度d( X x1 给定离散信源 =
[d ] = 1
0 1
4
1 0
【例4.3】 绝对值误差失真测度 例 信源输出符号X = {0, 1, 2},信道输出符号Y = {0, 1, 2} ,给出失真 测度 d i j = ︱xi - yj ︱ i, j = 0, 1, 2 则失真测度矩阵为 0 1 2
[d ] = 1
【例4.1】 汉明(Hamming)失真测度 例 汉明( ) 信源输出符号X = {x1, x2, …, xK},信道输出符号Y = {y1, y2, …, yK},约定失真测度
无误码 y i = xi y j = x i (i ≠ j ) 误码
d ii = 0
d ij = 1
i, j = 1,2, ⋯ , K
2
i
y j ) =1
由假设的反向信道计算平均失真,得
D=
∑∑φ ( x
i =1 j =1
2
2
i
y j )ω ( y j )d i j = [ω(y1) +ω(y2) ]D = D
。
由上式知 D = D ,满足失真条件 D ≤ D 计算条件熵:H (X Y ) = − = H2 (D)
∑∑ω ( y )φ ( x
H2 (δ) − H2(D) 0≤ D≤δ R(D) = D>δ 0
(5)要找出正向信道,可由
q(u i ) = ∑ φ (u i v j )ω (v j ) i = 1, 2
j =1
2
,
反解出ω(yj), j = 1, 2,再计算出 p ( y j x i ) = 。 q( xi ) ①δ=(1-D)ω(y1)+ Dω (y2) 1-δ = D ω(y1)+(1-D)ω (y2) 由上面方程组解出, δ −D 1−δ − D ω ( y1 ) = ω ( y2 ) = 1 − 2D 1 − 2D ② 再算出 φ ( x1 y1 )ω ( y1 ) (1 − D ) 1δ−− D (1 − D )(δ − D ) 2D p ( y1 x1 ) = = = q ( x1 ) δ δ (1 − 2 D) −δ D φ ( x1 y 2 )ω ( y 2 ) D 11− 2−D D(1 − δ − D) p ( y 2 x1 ) = = = q ( x1 ) δ δ (1 − 2 D)
0 1 2 1 0
2.平均失真
x2 ⋯ xI X x1 离散信源 = q( x ) q( x ) ⋯ q( x ) ,经有扰信 2 I q( X ) 1
道传输,信道输出符号为Y = {y1, y2, …, yJ},平均失真即对d i j(i =1, 2, …,I; j = 1, 2, …, J)求统计平均值,记为
R (D ) ∆ min I ( X ; Y ) : D ≤ D
p( y x)
{
}
式(4-12)的意义在于,选择p(y∣x)即选择某种编码方法在满足 的 D ≤ D前提下,使I (X ; Y) 达到最小值R(D) ,这就是满足平 均失真 D ≤ D 条件下的信源信息量可压缩的最低程度。
4.2.2 率失真函数的值域、定义域 率失真函数的值域、 的值域(参见图4-1) 1.R(D)的值域 率失真函数的值域为 0 ≤ R(D)≤ H(X) (4-13) 2. R(D)的定义域
D=
∑∑ p( x y
i i =1 j =1
I
J
j )d i j =
∑∑ q( x ) p( y
i i =1 j =1
I
J
j
xi )d i j (4-4)
平均失真 D 是对在给定信源分布q(x)条件下,通过有扰信道 传输而引起失真的统计平均度量。
4.2
信息率失真函数R(D) 信息率失真函数
4.2.1 率失真函数的定义 给定信源,即信源概率分布q (x) 一定,给定失真测度矩阵 [d]=[dij],寻找信道,记它的转移概率矩阵为 P = [ p ( y j xi )] ,要求满足
1 (N ) d (X ,Y ) = N
∑
k =1
N
d ( X k , Yk )
(4-2)
【例4.2】 平方误差失真测度 例 信源输出符号X = {0, 1, 2}, 信道输出符号Y = {0, 1, 2} , 给出失 真测度d i j = (xi - yj )2 i, j = 0, 1, 2 则失真测度矩阵为 0 1 4
j i =1 j =1
2
2
i
y j ) log φ ( xi y j )
= - (1-D) log (1-D) - D log D
则平均互信息量I (X; Y) = H (X) -H (X︱Y) = H2 (δ) - H2 (D ), 假设的[φ(x︱y)]确实在满足 D = 的条件下,使 D I (X; Y) = H2 (δ) - H2 ( D )。 从而有
(3)在0 ≤ D ≤δ的范围内,计算R(D ) 根据熵的性质 H(XY)≥ H (X) ≥ H (X︱Y), 又算出 H (X) = -δ log δ -(1-δ) log (1-δ) = H2 (δ ) 将这两个结果代入平均互信息量的表达式 I (X; Y) = H (X) -H (X︱Y),得到 I (X; Y ) ≥ H2 (δ) -H (XY) (4-32) 0 1 对于汉明失真测度,失真测度矩阵为 [d ] = 1 0 2 2 平均失真
x2 X x1 = p ( X ) δ 1 − δ ,δ<0.5,信道输出符号Y = {y1=0,y2=1},
失真测度为汉明(Hamming)失真测度,求率失真函数R(D)。 (1) 根据式(4-14)和(4-18)可求出R(D)的定义域 Dmin = 0·δ+0·(1-δ) = 0 D max = min {1-δ, δ}=δ (2) 求R(D)的值域 R (Dmin=0) = H(U ) = -δlogδ- (1-δ) log (1-δ) = H2 (δ) R (Dmax) = R (δ) = 0
(2)D的最大值Dmax 当R (D) 达到其最小值Rmin(D)= 0时,对应的失真 最大,这种情况下D对应着R (D) 函数定义域的上界值 Dmax,如图4-1所示。 Dmax ∆ min{D : R (D ) = 0} =min{D: I (X; Y ) = 0 } (4-15) 求出计算Dmax的显式:
上述约定可以用矩阵表示为
0 1 ⋯ 1 1 0 ⋯ 1 [d ] = ⋮ ⋮ ⋯ ⋮ 1 1 ⋯ 0
式中di j ≥ 0 i, j = 1, 2, …, K为信源方发送符号xi而信宿方判为 yj引起的失真度。 对于矢量传输情况,若信道的输入、输出均为N 长序列X = X1 X2 … XN ,Y = Y1 Y2 … YN ,定义失真测度为
D=
∑ ∑ p(x y
i i =1 j =1
j
)d i j = p ( X ≠ Y )
在R(D)的定义中,要求满足 D ≤ D ,取等号 D = D ,则 H(XY)= H2(X⊕Y)= H2 [p (X≠Y )] = H2 (D) 将这一结果代入式(4-32),得 I(X;Y)≥ H2 (δ)- H2 (D) 根据定义 R D ∆ min I X ; Y : D ≤ D
Dmax = min
j
∑ q ( x )d
i i =1
I
ij
j =1,2, …, J(4-18)
纵上所述,R(D)的定义域为: D min ≤ D ≤ D max,式中D min和D max可分 别由式(4-14)和式(4-18)求出。
4.2.3 率失真函数的性质 率失真函数有如下几条性质:: 分别给定两个失真度D1和D2(Dmin ≤ D1, D2 ≤ Dmax),则下 式成立: R (α1D1+α2D2) ≤α1R (D1)+α2 R (D2) (4-19)
∑ p( y
j =1
2
j
xi ) = 1
根据[d]的对称性,假设一个反向信道(Y→X ) y1 y 2 φ ( x y) = x1 1 − D D x2 D 1 − D
[
]
反向信道的转移概率矩阵为,假设的反向信道应满足: φ(xi︱yj) ≥ 0 i, j = 1,2
∑φ (x
i =1
D=
∑∑ q( x ) p( y
i i j
j
xi )d i j ≤ D
(4-11)
式中D是预先给定的失真度,上式称为保真度准则。
根据[定理2.2],当信源q (x)一定时,平均互信息量I (X ; Y)是 信道转移概率函数p(y∣x)的∪型凸函数,这意味着可以关于 p(y∣x)对平均互信息量I (X ; Y)求得极小值,定义这个极小 值为率失真函数 率失真函数R(D),即: (4-12)
φ ( xi y j )ω ( y j )
φ ( x 2 y1 )ω ( y1 )
D 1δ−− D 2D
x X 1 【例4.9】 信源分布 例 . =1 q( X ) 3 y y
R(D)
H(X)
Dma 0 Dmin x 图4-1 R(D)的值域
D
(1)D的最小值Dmin 在给定的失真测度矩阵中,对每一个xi,找 一个最小的 d i j ,然后对所有的i =1, 2, …,I求统 计平均值,就是D的最小值,即