信息率失真函数的绘制
第4章 信息率失真函数
原始图像和限失真图像
原始图像
红色图像
绿色图像
蓝色图像
香农首先定义了信息率失真函数R(D),并论述了关于这个 函数的基本定理。 定理指出:在允许一定失真度D的情况下,信源输出的信 息传输率可压缩到R(D)值,这就从理论上给出了信息传输率与 允许失真之间的关系,奠定了信息率失真理论的基础。 信息率失真理论是进行量化、数模转换、频带压缩和数据 压缩的理论基础。 本章主要介绍信息率失真理论的基本内容,重点讨论离散 无记忆信源。 给出信源的失真度和信息率失真函数的定义与性质; 讨论离散信源和连续信源的信息率失真函数计算; 在此基础上论述保真度准则下的信源编码定理。
XY i 1 j 1
r
s
• 若平均失真度D不大于我们所允许的失真D0,即: D D0 称此为保真度准则。
信源固定(即给定了p(x)),单个符号失真度固定时(即 给定了d(ai,bj)) ,选择不同试验信道,相当于不同的编码方 法,所得的平均失真度是不同的。 有些试验信道满足D D0,而有些试验信道D>D0。 凡满足保真度准则-----平均失真度D D0的试验信通称为 ----D失真许可的试验信道。 把所有D失真许可的试验信道组成一个集合,用符号PD表 示,则: PD={p (bj / ai): D D0}
则
0 1 D 1 0
1 2 1 2
[例3] 对称信源(s = r) 。信源X={a1,a2,…ar} ,接收Y= {b1,b2,…bs} 。若失真度定义为:
d (ai , bj ) (bj ai )2
如果信源符号代表信源输出信号的幅度值,这就是一种平 方误差失真度。它意味着幅度差值大的要比幅度差值小的所引 起的失真更为严重,其严重的程度用平方来表示。 当 r=3时, X={0,1,2},Y={0,1,2} ,则失真矩阵为:
《信号处理原理》 第4章 信息失真率
d(0,2)=d(1,2)=0.5
则得失真矩阵
d
0 1
1 0
0.5 0.5
4.1 平均失真和信息率失真函数
说明:失真函数d (xi, yj) 的数值是依据实际应 用情况,用 yj代替xi, 所导致的失真大小是人为决 定的。比如上例中,用y=2代替x=0和x=1所导致 的失真程度相同,用0.5表示;而用y=0代替x=1 所导致的失真程度要大,用1表示。失真函数d (xi, yj) 的函数形式可以根据需要任意选取,例如平方 代价函数、绝对代价函数、均匀代价函数等。
信源编码器的目的是使编码后所需的信 息传输率R尽量小,然而R越小,引起的平 均失真就越大。给出一个失真的限制值D,
在满足平均失真 D D的条件下,选择一种
编码方法使信息率R尽可能小。信息率R就 是所需输出的有关信源X的信息量。
16
4.1 平均失真和信息率失真函数
将此问题对应到信道,即为接收端Y需要 获得的有关X的信息量,也就是互信息 I(X;Y)。这样,选择信源编码方法的问题就 变成了选择假想信道的问题,符号转移概 率p(yj/xi)就对应信道转移概率。
输入符号集 X:{a1, a2, …, an}中有n种不同的符 号xi (i =1, 2, …, n) ;输出符号集Y:{b1, b2, …, bm}中有m种不同的符号yj (j =1, 2, …, m);对于 图所示的系统,对应于每一对(xi, yj)(i = 1, 2, …,n;j=1, 2, …, m),定义一个非负实值函数
平均失真D是对给定信源分布p(ai)经过某一种 转移概率分布为p(bj|ai)的有失真信源编码器后产 生失真的总体量度。
13
4.1 平均失真和信息率失真函数
第4章信息率失真函数
4.1
第4章 信息率失真函数
定义: 信源序列的失真函数
N
基
d ( x, y) d (i , j ) d (ail , bjl )
本 概
l 1
x X, y Y;i X N , j Y N ;ail X ,bjl Y
念
信源序列失真函数等于信源序列中对应的
单符号失真函数之和。也可写成rN sN阶矩阵形 式。
Page 6
4..1.1
第4章 信息率失真函数
4.1 基本概念
失 4.1.1失真函数(失真度)
真
函 为什么引入失真函数?
数
在实际问题中,信号有一定的失真是可 以容忍的,但是当失真大于某一限度后,将 丧失其实用价值。
要规定失真限度,必须先有一个定量的 失真测度。为此可引入失真函数.
Page 7
4.1.1
i1 j1
Page 19
4.1.2
第4章 信息率失真函数
(3)均方失真函数
适用于连续 信源
平 均
d(a,b) (a b)2
(a X ,b Y 或 a,b R)
失
真 在均方失真函数下,平均失真度就是均方误差。
度
rs
离散信源的均方误差 D (a b)2 P(a,b) i1 j1
连续信源的均方误差D: (a b)2 P(a, b)dxdy
1.离散信源单个符号的失真函数
定义:设离散无记忆信源输出变量X {a1, a2,L , ar},
失 真
概率分布为P(X ) [P(a1), P(a2),L , P(ar )],经过有失真的
函 数
信源编码器,输出的随机变量 Y {b1,b2,L ,bs}。
将所有的 d(ai ,bj ) 0 (ai X ,bj Y ) 排列起来,用
第4章 信息率失真理论.ppt
DD
4、实验信道
定义
满足保真度准则的所有数据处理信道
信息率失真理论
表示
离散信源的实验信道 PD (Xˆ / X) {P(Xˆ / X) : D D} 全部n×n个实验信道转移概率——实验信道矩阵
PD (xˆ 1 / x1) PD (xˆ 1 / x 2 ) ... PD (xˆ 1 / x n )
信息率失真理论
P(x i ) log P(xˆ j ) P(x i ) log PD (xˆ j / x i ) SP(x i )d(x i , xˆ j ) i 0 i 1,2,, n j 1,2,, n
log
PD (xˆ j / x i P(xˆ j )
)
Sd(xi
i1 j1
n
SD P(x i ) log i i1
信息率失真理论
2、二进制信源的信息率失真函数
二进制信源P(XX) xp1 1x2p
其中p 1 2
失真矩阵[D]
0 1
1 0
2
(1)由 i P(x i )2Sd(xi ,xˆ j) 1求含S的 i
0
i 1,2,, n j 1,2,, n
信息率失真理论
PD (xˆ j / x i ) P(xˆ j )
2Sd (xi ,xˆ j ) i
i 1,2,, n
j 1,2,, n
PD (xˆ j / x i ) iP(xˆ j )2Sd(xi ,xˆ j) i 1,2,, n j 1,2,, n
PD
(Xˆ
/
X)
PD
(xˆ 2 / ...
ch4信息率失真函数
j
/
ai
)
p 1
(b
j
/
ai
)
(1
)
p
2
(b
j
/
ai
)
nm
D
p(ai ) p(bj / ai )d (ai ,bj )
i1 j1
D1 (1 )D2
满足保真 度准则
D' (1 )D'' D
I ( X ;Y ) R ( D ) R[D ' (1 ) D '' ]
由 I ( X ;Y ) 对 p(b j ai )的下凸性: I ( X ;Y ) I ( X ;Y1 ) (1 ) I ( X ;Y2 )
nm
D(S )
p(a ) p(b )eSd(ai ,bj )d (a , b )
ii
j
ij
4
i1 j 1
(4.2.5)
n
R(S)
m
p(a
)
p(b
)eSd (ai ,bj )
ln
i
p(b )eSd(ai ,bj ) j
ii
j
i1 j1
p(b ) j
n
SD(S ) p(a ) ln
n
1
Dm a x
min j
Dj
min j
i 1
p(ai )d (ai , bj )
n
2
i p (ai )e Sd (ai ,b j ) 1
i
i 1
3
1
i
m j 1
p(b j )eSd (ai ,bj )
p(bj )
4 p(bj ai ) p(bj )ieSd(ai ,bj )
计算信息率失真函数曲线
计算信息率失真函数曲线信息率失真函数是指在给定平均失真度量下最小化信源数据率的函数。
它可以用来表示编码方案的效率。
下面是一个简单的例子,展示如何计算信息率失真函数曲线。
假设我们有一个二元信源,产生两个符号0和1,它们的出现概率分别为0.4和0.6。
我们希望将这个信源编码成另一个二元序列,用尽量小的码长来表示。
例如,我们可以用一个3位码来表示每个符号,例如0表示为000,1表示为001。
在这种情况下,我们得到的平均码长为2.4位,因为0的概率是0.4,需要3位码,1的概率是0.6,也需要3位码,所以平均码长是(0.4*3+0.6*3)=2.4位。
但是我们发现,这种编码方案并不是最优的,因为它使用了相同的码长来表示两个不同的符号,而0的概率更小,可以使用较短的码来表示。
因此,我们需要找到一种更好的编码方案,使得平均码长更小。
为了找到最优的编码方案,我们可以考虑信息率失真函数,它定义了信源数据率和失真之间的关系。
对于离散的信源,信息率失真函数定义为:R(D) = min{H(X): D(X,Y) <= D}其中,H(X)是信源的熵,D(X,Y)是表示信源X和编码后的序列Y之间的平均失真度量,D是允许的最大失真度量。
在我们的例子中,信源的熵为H(X)=-0.4*log2(0.4)-0.6*log2(0.6)=0.97095。
我们可以使用汉明码来表示这个信源,因为它是一种具有最小平均码长的编码方案。
汉明码基于两个符号之间的汉明距离,即它们不同的位数。
对于我们的信源,我们可以使用一个长度为2的汉明码。
具体来说,我们将0表示为00,将1表示为11,这样编码后的序列长度为2,平均码长为2*0.4=0.8位。
为了计算信息率失真函数曲线,我们需要计算不同的允许失真度量对应的最小信源数据率。
例如,当允许的最大失真为0.01位时,最小的信源数据率是0.8位,即汉明码的平均码长。
对于其他失真度量,我们可以使用类似的方法计算相应的信源数据率。
信道率失真函数
24
第四章 信息
率失真函数 4.1.3 信息率失真函数R(D)
n
Dmax mind ( y) min pidij
p(yj )
j 1,2,...,m i1
2
min j 1,2
i 1
p(xi )d (xi , y j )
min{1 0 2 1, 1 1 2 0}
3 j 1,2
33 3
•实际的信源常常是连续的,信息量无限大,若要无失
真传送, 要求信息率R为无穷大;
•实际信道带宽是有限的,所以信道容量受限制。要想
无失真传输,所需传输的信息率一般都大大超过信道 容量即R >> C。
2020/4/4,
3
第四章 信息
率失真函数 4.1.1 失真函数
• 实际中允许一定程度的失真
• 实际生活中,人们一般并不要求获得完全无失真的消 息,通常只要求近似地再现原始消息,即允许一定的 失真存在。
2020/4/4,
6
第四章 信息
率失真函数 4.1.1 失真函数
• 失真矩阵 • 失真度还可表示成矩阵的形式
• 称d 为失真矩阵。它是n×m阶矩阵。 • 例:4-1
2020/4/4,
7
第四章 信息
率失真函数 4.1.1 失真函数
• 信源符号X取自{0,1},编码器输出符号取自 {0,1,2}, 规定失真函数为:
2020/4/4,
5
第四章 信息
率失真函数 4.1.1 失真函数
输入 X
X∈{a1, a2,…, ai,…, an}
p( y j / xi ) 信源编码器
• 定义失真函数:
输出 Y
Y∈{b1,b2,…,bj,…,bm}
第4章 信息率失真函数 《信息论与编码》经典PPT课件
失真矩阵
d(a1,b1) d(a1,bm )
d
d(an,b1) d(an,bm )
• 例:设信源符号序列为X={0,1},接收端收到符号
序列为Y= {0,1,2},规定失真函数为
失真矩阵
d(0,0)=d(1,1)= 0 d(0,1)=d(1,0)= 1 d(0,2)=d(1,2)= 0.5
d
没有失真
0
• d(xi , y j ) 0
x ≠ y xi y ji
j
产生失真
失xi 真 yj 的大小,用一个量来表示,即失真函数d(xi,yj),
以衡量用yj代替xi所引起的失真程度。
• 失真函数定义为:
0
d(xi, yj )
xi y j
0 xi y j
4
失真函数
• 将所有的d(xi,yj)排列起来,用矩阵表示为:
• 如果对信源进行不失真编码,平均每个符号至少需 要log2n个二进制码元。
• 现在假定允许有一定失真,假设失真限度为D=1/2 设想采用下面的编码方案:
a1→a1, a2→a2, …an→an
an+1→an ,an+2→ an ,…a2n→ an
21
• 平均失真
D
i
j
p(ai
)
p(a j
|
ai
8
L长序列编码
• 如果假定离散信源输出符号序列X={X1X2… Xl… Xn},其中L长符号序列xi =[xi1xi2…xiL],经信源 编码后,输出符号序列Y={Y1Y2…Yl…Ym},其中L
长符号序列yj=[yj1yj2…yjN ],则失真函数定义为
1
dL (xi , y j ) L j d (xiL , y jL )
信息论与编码-第4章信息率失真函数PPT课件
长江大学电信学院
X
19
4.1 基本概念
d(ai,bj)d(xi1xi2xiN,yj1yj2yjN) d(xi1,yj1)d(xi2,yj2)d(xiN,yjN)
N
d(xik,yjk) k1
对应的失真矩阵为
d(a1,b1)
长江大学电信学院
X
30
4.1 基本概念
说明在保真度准则条件下的信源编码比无失 真情况得到了压缩,同时R(D)是保真度条件下 对信源进行压缩的极限值,亦即信源信息率可 压缩的最低限度,它仅取决于信源特性和保真 度要求,与信道特性无关。
长江大学电信学院
X
31
4.1 基本概念
3. R(D)与C的比较
信道容量表示信道的最大传输能力,反映的 是信道本身的特性,应该与信源无关。但平均 互信息量与信源的特性有关,为排除信源特性 对信道容量的影响,在所有的信源中以那个能 够使平均互信息量达到最大的信源为参考,从 而使信道容量仅与信道特性有关,信道不同, C亦不同。
i 1 j 1
n
nm
m
N
p( xi1 ) p( xiN ) p( y j1 | xi1 ) p( y jN | xiN ) d xik , y jk
i1 1 iN 1 j1 1 jN 1
k 1
nm
p( xi1 ) p( y j1 | xi1 )d ( xi1 , y j1 )
i1 1 j1 1
长江大学电信学院
X
27
4.1 基本概念
I (X; Y)是p(yj|xi ) 的下凸函数,故总可以在 PD集合中找到某一试验信道,使R = I (X;Y)达 到最小值,亦即找到某一个I (X;Y)而使R达到 最小,这个最小值就是R(D),称为信息率失真 函数,简称率失真函数,即
率失真函数曲线绘制
率失真函数曲线绘制
率失真函数是信息论中的一个重要概念,它描述了信源编码和信道编码中的失真与率之间的关系。
在信息论中,通常使用率失真函数来衡量信源编码和信道编码的性能。
率失真函数通常用R(D)表示,其中R表示编码率,D表示失真度量。
在绘制率失真函数的曲线时,我们需要首先选择一个合适的失真度量,比如均方误差或者信噪比。
然后,我们可以通过改变编码率来计算不同失真度量下的失真值,最终得到一组编码率和失真度量的数据点。
最后,我们可以使用这些数据点绘制出率失真函数的曲线。
在绘制率失真函数曲线时,我们可以从多个角度进行分析。
首先,我们可以观察曲线的斜率,斜率越大表示单位失真度量所需要的码率越高,这可以帮助我们理解编码的效率。
其次,我们可以观察曲线的凹凸性质,凹部分表示存在着最优的编码方案,这可以帮助我们选择最佳的编码率。
此外,我们还可以比较不同编码算法或者不同信道条件下的率失真函数曲线,从而评估它们的性能差异。
绘制率失真函数曲线需要使用数学工具和编程语言进行计算和可视化。
我们可以使用Python中的Matplotlib库或者MATLAB等工具来实现。
在代码中,我们需要定义失真度量的计算方法和不同编
码率下的编码器和解码器,然后计算出不同失真度量下的失真值,并绘制成曲线图表。
总之,绘制率失真函数曲线是信息论中的重要任务,它能够帮助我们理解编码和解码的性能,并且为我们选择合适的编码方案提供参考。
通过绘制曲线并从多个角度进行分析,我们可以更好地理解率失真函数的特性和应用。
信息率失真函数
15
第15页,幻灯片共112页
9.2.2 R(D)函数的性质
4.关于信息率失真函数的几点解释: (1)通常总希望信息通过信道传输时输入与 输出之间的互信息最大,是在信道给定情况 下的要求。而这里是在信源给定而不是信道 给定条件下的传输。信息率失真理论要解决 的问题就是计算满足失真要求的传输所需要 的最小信道容量或传输速率,以达到降低信 道的复杂度和通信成本的目的。
D E [d (x ,y ) ] p (x )p (y |x )d (x ,y )
x ,y
序列平均失真定义为: D NE[dN(x,y) ]N 1iN 1E[d(xi,yi)]
7
第7页,幻灯片共112页
§9.2 离散信源信息率失真函数
8 第8页,幻灯片共112页
9.2.1 信息率失真函数
定义信息率失真函数(rate-distortion function) 为:
J ( p i) j p i p il j p o i j q g jlq o j s g p i p id j i j i p ij
关于信息率失真函数
第1页,幻灯片共112页
§9.1 概 述
❖ 对于有失真信源编码,总希望在不大于一定编码速率 (即传送每信源符号所需的平均的二进数字数)的条件 下,使平均失真最小;或者在平均失真不大于某个值的 条件下,使编码速率最小。
❖ 仙农提出的信息率失真理论是有损数据压缩的理论基础, 该理论的核心是在保真度准则下的信源编码定理,也称 仙农第三定理
nm
(9.4.3)
pi pij d ij D
i1 j1
pij 1, i 1, , n
j
28
第28页,幻灯片共112页
9.4.1 R(D)参量表示法求解
信息率失真函数matlab
信息率失真函数matlab在信息论中,信息率失真函数(Rate-Distortion Function)是一种描述信源信号压缩过程中信息率和失真之间关系的函数。
该函数用于衡量在给定的失真限制下,信源信号的最低信息率。
在MATLAB中,可以使用以下代码计算信息率失真函数:```matlabfunction R = rate_distortion_func(D)% 定义信源信号source_signal = [1 0 1 1 0 1 0 0];% 定义失真度量函数distortion_func = @(x, y) sum(x ~= y);% 定义信息率R = [];for i = 1:length(D)% 压缩信源信号compressed_signal = compress(source_signal, D(i));% 计算失真distortion = distortion_func(source_signal, compressed_signal);% 计算信息率R(i) = length(compressed_signal) / distortion;endendfunction compressed_signal = compress(source_signal, D)% 在此处编写信源信号压缩算法% ...% 返回压缩后的信号end```在上述代码中,`rate_distortion_func`是计算信息率失真函数的函数,输入参数`D`是失真限制的向量。
`source_signal`是待压缩的信源信号,`compress`函数是信源信号压缩的算法函数。
`distortion_func`是失真度量函数,用于计算压缩后信号与原信号之间的失真。
使用时,可以调用该函数并传入失真限制的向量,例如:```matlabD = [0.1 0.2 0.3 0.4];R = rate_distortion_func(D);```上述代码将计算在失真限制为0.1、0.2、0.3和0.4时的信息率。
信息率失真函数的绘制
课程设计任务书2011—2012学年第一学期专业:通信工程学号:姓名:课程设计名称:信息论与编码课程设计设计题目:信息率失真函数的绘制完成期限:自年月日至年月日共周一.设计目的1、理解信息率失真函数的定义与物理意义;2、分析离散信源在误码失真下的信息率失真函数表达式;3、提高综合运用所学理论知识独立分析和解决问题的能力;4、使用相关软件进行曲线的绘制。
二.设计内容分析离散信源在误码失真下的信息率失真函数表达式,并绘制曲线图。
三.设计要求1、绘制曲线使用数据不能过少;2、分析曲线的特点。
四.设计条件计算机、MATLAB或其他语言环境五.参考资料[1]曹雪虹,张宗橙.信息论与编码.北京:清华大学出版社,2007.[2]王慧琴.数字图像处理.北京:北京邮电大学出版社,2007.指导教师(签字):教研室主任(签字):批准日期:年月日摘要研究信息率失真函数是为了解决在已知信源和允许失真率D 的条件下,使信源必须传送给信宿的信息率最小。
即用尽可能少的码符号尽快地传送尽可能多的信源消息,以提高通信的有效性。
首先给出信源的失真度和信息率失真函数的定义与性质;然后讨论离散信源和连续信源的信息率失真函数计算。
通过使用MATLAB软件进行对信息率失真函数曲线的绘制,直观的理解了信息率失真函数R(D)与失真率D和P的函数关系。
关键字:信息率失真函数;失真率D;MATLAB目录1信息率失真函数 (1)1.1信息率失真函数的定义 (1)1.2信息率失真函数的物理意义 (2)2信息率失真函数表达式 (3)2.1信息率失真函数的定义域 (3)2.1.1失真率D的下界 (3)2.1.2失真率D的上界 (3)2.2参数p的影响 (3)2.3信息率失真函数表达式的推导 (4)3信息率失真函数的matlab实现 (6)3.1实验程序 (6)3.2实验结果 (7)3.3图像的分析 (7)总结 (8)参考文献 (9)1信息率失真函数1.1信息率失真函数的定义研究在限定失真下为了恢复信源符号所必需的信息率,简称率失真理论。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课程设计任务书2011—2012学年第一学期专业:通信工程学号:姓名:课程设计名称:信息论与编码课程设计设计题目:信息率失真函数的绘制完成期限:自年月日至年月日共周一.设计目的1、理解信息率失真函数的定义与物理意义;2、分析离散信源在误码失真下的信息率失真函数表达式;3、提高综合运用所学理论知识独立分析和解决问题的能力;4、使用相关软件进行曲线的绘制。
二.设计内容分析离散信源在误码失真下的信息率失真函数表达式,并绘制曲线图。
三.设计要求1、绘制曲线使用数据不能过少;2、分析曲线的特点。
四.设计条件计算机、MATLAB或其他语言环境五.参考资料[1]曹雪虹,张宗橙.信息论与编码.北京:清华大学出版社,2007.[2]王慧琴.数字图像处理.北京:北京邮电大学出版社,2007.指导教师(签字):教研室主任(签字):批准日期:年月日摘要研究信息率失真函数是为了解决在已知信源和允许失真率D 的条件下,使信源必须传送给信宿的信息率最小。
即用尽可能少的码符号尽快地传送尽可能多的信源消息,以提高通信的有效性。
首先给出信源的失真度和信息率失真函数的定义与性质;然后讨论离散信源和连续信源的信息率失真函数计算。
通过使用MATLAB软件进行对信息率失真函数曲线的绘制,直观的理解了信息率失真函数R(D)与失真率D和P的函数关系。
关键字:信息率失真函数;失真率D;MATLAB目录1信息率失真函数 (1)1.1信息率失真函数的定义 (1)1.2信息率失真函数的物理意义 (2)2信息率失真函数表达式 (3)2.1信息率失真函数的定义域 (3)2.1.1失真率D的下界 (3)2.1.2失真率D的上界 (3)2.2参数p的影响 (3)2.3信息率失真函数表达式的推导 (4)3信息率失真函数的matlab实现 (6)3.1实验程序 (6)3.2实验结果 (7)3.3图像的分析 (7)总结 (8)参考文献 (9)1信息率失真函数1.1信息率失真函数的定义研究在限定失真下为了恢复信源符号所必需的信息率,简称率失真理论。
信源发出的符号传到信宿后,一般不能完全保持原样,而会产生失真。
要避免这种失真几乎是不可能,而且也无必要,因为信宿不管是人还是机器,灵敏度总是有限的,不可能觉察无穷微小的失真。
倘若在处理信源符号时允许一定限度的失真,可减小所必需的信息率,有利于传输和存储。
率失真理论就是用以计算不同类型的信源在各种失真限度下所需的最小信息率。
因此,这一理论是现代所有信息处理问题的理论基础。
香农首先定义了信息率失真函数R(D),并论述了关于这个函数的基本定理。
定理指出:在允许一定失真度D 的情况下,信源输出的信息传输率可压缩到R(D)值,这就从理论上给出了信息传输率与允许失真之间的关系,奠定了信息率失真理论的基础。
信息率失真理论是进行量化、数模转换、频带压缩和数据压缩的理论基础。
图1.1 信息率失真函数定义信源编码器的目的是使编码后所需的信息传输率R 尽量小,然而R 越小,引起的平均失真就越大。
给出一个失真的限制值D ,在满足平均失真D 的条n a a a x ,,21∈信源编码器(看做信道)}n b b b y ,,21∈XY假想信道件下,选择一种编码方法使信息率R 尽可能小。
信息率R 就是所需输出的有关信源X 的信息量。
将此问题对应到信道,即为接收端Y 需要获得的有关X 的信息量,也就是互信息I(X;Y)。
这样,选择信源编码方法的问题就变成了选择假想信道的问题,符号转移概率p(bj /ai)就对应信道转移概率。
由于互信息取决于信源分布和信道转移概率分布,当p(ai)一定时,互信息I 是关于p(bj/ai) 的下凸函数,存在极小值。
因而在上述允许信道PD 中,可以寻找一种信道p(bj /ai)使给定的信源p(ai)经过此信道传输后,互信息I(X ;Y)达到最小。
该最小的互信息就称为信息率失真函数R(D),限定失真为D 的条件下,信源输出的最小信息率。
即(1-1)在信源给定后,希望在满足一定失真的情况下,使信源传输给信宿的信息传输率R 尽可能地小。
从信宿来看,就是在满足保真度准则下,寻找再现信源消息所必须获得的最小平均信息量。
即在满足保真度准则条件下寻找平均互信息 I(X;Y)的最小值。
(1-2)1.2信息率失真函数的物理意义对于给定的信源,在满足保真度准则下,必须传送的最小信息量,它既反映了用户容忍程度,也反映了信息率允许压缩的最小值,R(D)越大,越难压缩,反之可压缩率就大.对于固定的信源分布,平均互信息量I(X;Y)是信道转移概率 p(bj/ai) 的下凸函数。
也就是说:存在一个信道使某一特定信源经过此信道传输时,信道的平均互信息达到极小值.);(min )()/(Y X I D R Di j P a b p ∈=(/)()min ()(/)log()ij D j i i j i p P i jj p b a R D p a p b a p b ∈=∑∑2信息率失真函数表达式2.1信息率失真函数的定义域率失真函数的定义域问题就是在信源和失真函数已知的情况下,讨论允许平均失真度D 的最小和最大取值问题,即[Dmin,Dmax]。
2.1.1失真率D 的下界由于平均失真度是非负实数d(xi,yj)的数学期望,因此也是非负实数,即D 的下界为0。
(2-1)Dmin =0,对应于无失真情况,相当于无噪信道,信道传输的信息量等于信源熵,即 R(D)=R(0)=H(X)允许平均失真度能否达到其下限值0,与单个符号的失真函数有关。
只有当失真矩阵的每一行至少有一个0元素时,信源的平均失真度才能达到下限值0。
2.1.2失真率D 的上界由于I(X;Y)是非负函数,而R(D)是在约束条件下的I(X;Y)的最小值,所以R(D)也是一个非负函数,即R(D)≥0,它的下限值为零。
Dmax 是满足R(D)=0时所有平均失真度中的最小值。
(2-2) 2.2参数p 的影响R(D)不仅与D 有关,还与p 有关。
概率分布不同, R(D)曲线就不一样。
当p=0.25时,如果能容忍的误码率也是0.25,不用传送信息便可达到,即R=0,这就是R(Dmax) =0的含义。
∑==ni j i jib a d ap D 1m in ),(m in )(===D D D R 0)(m ax min 1,21min ()(,)ni i j j m i D p a d a b ===∑2.3信息率失真函数表达式的推导{}⎪⎩⎪⎨⎧≤==≥=∑∑∈)();(:min )(给定速率R V U I P P d P p d D R D ji R i jij ji i P P Rji (2-3) 称D(R)为失真信息率函数,是R(D)的逆函数,它是求在允许最大速率情况下的最大失真D 。
引用拉氏乘子法,并设S 与),n 21i (i =μ分别表示(n+1)个约束条件的待定参数,则有:)log 1()log 1(0]);([=--+++-=--∂∂∑∑i ij i i ji i j jji i i ji i ji d Sp p P p q P SD P p I P μμ求得ijSd i j ji eq P λ= (2-6)由归一化条件有 ∑∑==jSd i j iji ijeq P λ1求得∑=jSd ji ije q 1λ (2-7)再将(2-6)式两边同乘p i 并对i 求和,且设qj>0,则有∑∑==iSd i j i iji i j ijeq p P p q λ∴ 1=∑iSd i i ijep λ (2-8)代(2-7)入(2-8),得:11=∑∑ijijSd jSd j ii e eq p (2-9) 当信源给定p i =p i 0,选定S 与d ij 以后,它是一个求解m 个q j 的方程组,则可按下列顺序求解:(2-4)(2-5))()(),1()2,1(S R S D P n i m j q ji i j →→−→−=−→−= λ最后求得参量方程如下:⎪⎪⎩⎪⎪⎨⎧⋅⋅==∑∑∑∑i j j Sd i j Sd i j i i j ij Sd i j i q eq e q p S R d e q p S D ij ij ij λλλlog )( )(∑+=ii i p S SD λlog () (2-11)这就是用参量S[R(D)的斜率]表达的R(D)函数形式,又称为参量方程。
由公式(2-8),有:⎩⎨⎧=+=+1)exp()exp(1)exp()exp(2222121121221111Sd p Sd p Sd p Sd p λλλλ (2-12) 求得]1)[1(1]1[121S S e p e p +-=+=λλ 将它带入式(2-7),有⎪⎪⎩⎪⎪⎨⎧=+=+222221*********)exp()exp(1)exp()exp(λλSd q Sd q Sd q Sd q (2-13)求得(2-10)SSSSe pe p q e e p p q ---=---=1)1(1)1(21 (2-14)再将2121q q ,λλ带入(2-10)式D(S)中:)ex p()ex p()(12122111111111Sd d q p Sd d q p S D λλ+=)ex p()ex p(22222222121122Sd d q p Sd d q p λλ++S S e e +=1⇒ D D S -=1log (2-15)再将它带入R(S0,有:DD S DDS p p S SD S R D R -=-=-++==1log211loglog )1(log )()()(λλ)]1log()1(log [)]1log()1(log [D D D D p p p p --++--+-=综上所述:R(D)=-p*log2(p)-(1-p)*log2(1-p)+D.*log2(D)+(1-D).*log2(1-D )(2-16)3信息率失真函数的matlab 实现3.1实验程序for p=0.1:0.1:0.5d=0.000001:0.0001:0.5;R1=-p*log2(p)-(1-p)*log2(1-p)+d.*log2(d)+(1-d).*log2(1-d); hold on ; plot(d,r); endhold off;figure;for i=2:6p=1/i;d=0.000001:0.0001:1-p;R2=-log(p)-d*log(i-1)+d.*log(d)+(1-d).*log(1-d);plot(d,r);hold on;endhold off;3.2实验结果图3.1 R(D)1图3.2 R(D)23.3图像的分析R(D)在定义域内是失真度D的U型下凸函数。