第4章 信息率失真函数
合集下载
ch04 信息率失真函数
P (Y X )
⎧0 xi = y j d ( xi , y j ) = ⎨ ⎩a xi ≠ y j
3
⎡ p ( y1 x1 ) p ( y2 x1 ) ... p ( ym x1 ) ⎤ ⎢ ⎥ ⎢ p ( y1 x2 ) p ( y2 x2 ) ... p ( ym x2 ) ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ p ( y1 xn ) p ( y2 xn ) ... p ( ym xn ) ⎦ ⎥ ⎣
⎡ d ( x1, y1 ) d ( x1, y2 ) ⎢d ( x , y ) d ( x , y ) 2 1 2 2 D= ⎢ ⎢ ⎢ ⎣d ( xn , y1 ) d ( xn , y2 )
d ( x1, ym ) ⎤ d ( x2 , ym )⎥ ⎥ ⎥ ⎥ d ( xn , ym )⎦
4
4.1 基本概念
i =1 j n
(
)
离散信源 连续信源
Dmin = ∑ p(xi )min d(xi , y j )
i=1 j
n
仅当失真矩阵每行均 有零元素时, Dmin= 0
R(Dmin ) = R(0) = H ( X )
R(Dmin ) = R(0) = H(x) =∞
12
4.1 基本概念
西华师范大学 物理与电子信息学院
失真函数d(αi,βj)
d(αi , β j ) = d(xi1 xi2
N k =1
xiN , yj1 yj2
= ∑d(xik , yjk )
D ≤ D ,D——允许失真的上界
7
平均失真度—— 单符号时的N倍
D( N ) = ND
8
4.1 基本概念
西华师范大学 物理与电子信息学院
《信号处理原理》 第4章 信息失真率
d(0,2)=d(1,2)=0.5
则得失真矩阵
d
0 1
1 0
0.5 0.5
4.1 平均失真和信息率失真函数
说明:失真函数d (xi, yj) 的数值是依据实际应 用情况,用 yj代替xi, 所导致的失真大小是人为决 定的。比如上例中,用y=2代替x=0和x=1所导致 的失真程度相同,用0.5表示;而用y=0代替x=1 所导致的失真程度要大,用1表示。失真函数d (xi, yj) 的函数形式可以根据需要任意选取,例如平方 代价函数、绝对代价函数、均匀代价函数等。
信源编码器的目的是使编码后所需的信 息传输率R尽量小,然而R越小,引起的平 均失真就越大。给出一个失真的限制值D,
在满足平均失真 D D的条件下,选择一种
编码方法使信息率R尽可能小。信息率R就 是所需输出的有关信源X的信息量。
16
4.1 平均失真和信息率失真函数
将此问题对应到信道,即为接收端Y需要 获得的有关X的信息量,也就是互信息 I(X;Y)。这样,选择信源编码方法的问题就 变成了选择假想信道的问题,符号转移概 率p(yj/xi)就对应信道转移概率。
输入符号集 X:{a1, a2, …, an}中有n种不同的符 号xi (i =1, 2, …, n) ;输出符号集Y:{b1, b2, …, bm}中有m种不同的符号yj (j =1, 2, …, m);对于 图所示的系统,对应于每一对(xi, yj)(i = 1, 2, …,n;j=1, 2, …, m),定义一个非负实值函数
平均失真D是对给定信源分布p(ai)经过某一种 转移概率分布为p(bj|ai)的有失真信源编码器后产 生失真的总体量度。
13
4.1 平均失真和信息率失真函数
第4章信息率失真函数
R( D) min p(ai ) p(b j / ai ) log
Pij PD i 1 j 1
n
m
p(b j / ai ) p(b j )
p(ai),i=1,2,…,n 是信源符号概率分布; p(bj/ai),i=1,2,…,n,j=1,2,…,m 是转移概率分布; p(bj),j=1,2,…,m 是接收端收到符号概率分布。
如果选取对压缩更为有利的编码方案,则压缩的 效果可能更好。但一旦达到最小互信息这个极限 值,就是R(D)的值,或超过这个极限值,那么失 真就要超过失真限度,如果需要压缩的信息率更 大,则可容忍的平均失真就要更大。
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
17
4.1.4 信息率失真函数的性质
1 L d L (x i , y j ) d ( xil , y jl ) L l 1
其中d(xil,yjl)是信源输出L长符号样值xi中的第l个符号xil
时,编码输出L长符号样值yj中的第l个符号yjl的失真函数。
7
普通高等教育“十五”国家级规划教材《信息论与编码》 曹雪虹等编著
4.1.2
以R(D)也是一个非负函数,它的下限值为0。当 R(D)=0意
味着什么呢? 不需传输任何信息。显然D越大,直至无限大都能满足这
样的情况。
选择所有满足R(D)=0中D的最小值,定义为R(D)定义域 的上限Dmax,即 Dmax min D
R ( D ) 0
因此可以得到R(D)的定义域为
n
D 0, Dmax
第4章
信息率失真函数
本章主要讨论在信源允许一定失真情况下所需的最少
信息率,从分析失真函数、平均失真出发,求出信息 率失真函数R(D) 。 平均失真和信息率失真函数 离散信源和连续信源的R(D)计算
第4章信息率失真函数
4.1
第4章 信息率失真函数
定义: 信源序列的失真函数
N
基
d ( x, y) d (i , j ) d (ail , bjl )
本 概
l 1
x X, y Y;i X N , j Y N ;ail X ,bjl Y
念
信源序列失真函数等于信源序列中对应的
单符号失真函数之和。也可写成rN sN阶矩阵形 式。
Page 6
4..1.1
第4章 信息率失真函数
4.1 基本概念
失 4.1.1失真函数(失真度)
真
函 为什么引入失真函数?
数
在实际问题中,信号有一定的失真是可 以容忍的,但是当失真大于某一限度后,将 丧失其实用价值。
要规定失真限度,必须先有一个定量的 失真测度。为此可引入失真函数.
Page 7
4.1.1
i1 j1
Page 19
4.1.2
第4章 信息率失真函数
(3)均方失真函数
适用于连续 信源
平 均
d(a,b) (a b)2
(a X ,b Y 或 a,b R)
失
真 在均方失真函数下,平均失真度就是均方误差。
度
rs
离散信源的均方误差 D (a b)2 P(a,b) i1 j1
连续信源的均方误差D: (a b)2 P(a, b)dxdy
1.离散信源单个符号的失真函数
定义:设离散无记忆信源输出变量X {a1, a2,L , ar},
失 真
概率分布为P(X ) [P(a1), P(a2),L , P(ar )],经过有失真的
函 数
信源编码器,输出的随机变量 Y {b1,b2,L ,bs}。
将所有的 d(ai ,bj ) 0 (ai X ,bj Y ) 排列起来,用
信息论 第四章 信息率失真函数(1)
4.1 基 本 概 念
当i=j时,X与Y的取值一样,用Y来代表X就没有误差,所以 定义失真度为0; 当i≠j时,用Y代表X就有误差。
这种定义认为对所有不同的i和j引起的误差都一样,所以定 义失真度常数a。 失真矩阵的特点是对角线上的元素均为0,对角线以外的其 它元素都为常数a。
第四章 信息率 失真函数
第1章:概述
第2章:信源熵 第3章:信道容量
第4章:信息率失真函数
第5章:信源编码
第6章:信道编码 第7章:密码体制的安全性测度
§4.1 信息率失真函数
§4.2 离散信源的信息率失真函数 §4.3 连续信息的率失真函数
§4.4 保真度准则下的信源编码定理
第四章 信息率 失真函数
基本概念
在前面几章的讨论中,其基本出发点都是如何保 证信息的无失真传输。 但在许多实际应用中,人们并不要求完全无失真 地恢复消息,而是只要满足一定的条件,近似地 恢复信源发出的消息就可以了。 然而,什么是允许的失真?如何对失真进行描 述?信源输出信息率被压缩的最大程度是多少? 信息率失真理论回答了这些问题,其中香农的限 失真编码定理定量地描述了失真,研究了信息率 与失真的关系,论述了在限失真范围内的信源编 码问题,已成为量化、数据转换、频带压缩和数 据压缩等现代通信技术的理论基础。
1 2 N 1 2 N
4.1 基 本 概 念
i ai , ai , , ai , ai , ai , , ai a1 , a2 , , an
i1 , i2 , , iN =1, 2, , n,i=1, 2, , n N
信道的输出共有mN个不同的符号
j bi , bi , , bi , bi , bi , , bi b1 , b2 , , bm
信息论基础与编码课件第四章 信息率失真函数
同样,可得Pij时的平均互信息为 I''(X;Y)0.37b9i/t符号
从此例我们可以看到,若固定P(x)不变时,平均互信息量随信
道的转移概率的变化而变化。这是因为信道受到干扰的作用 不同,传递的信息量也不同。可以证明这样一个结论:P(x)一 定时,平均互信息量I(X;Y)是关于信道的转移概率的下凸函数, 即存在一极小值。
m × n个 p i j 的值,代入平均失真的公式中,可解出随S参数值变
化的D值,即
D (S ) p ip j id ij p ip ij ie S d ijd ij (4-16)
ij
ij
25
离散信源的R(D)函数及其计算(续)
信源的信息率失真函数R(D)为
R (S ) i
j
pi p j i e Sdij
源输出符号序列 X (X 1 ,X 2 , ,X L ) ,其中L长符号序列样
值 Y(Y 1,Y 2, ,Y L) ,经信源编码后,输出符号序
列 x i (x i1 ,x i2 , ,x iL )
,其中L长符号序列样
值 y i (y i1 ,y i2 , ,y iL ),则失真函数定义为:
1L
dL(xi,yj)Ll1d(xil,yjl)
其中d(xil,yjl)是信源输出L长符号样值 x i 中的第l个符号xil时,
编码输出L长符号样值 中的y i 第l个符号yjl的失真函数。
7
平均失真
定义平均失真度为失真函数的数学期望,即 d ( xi , yj ) 在 X 和 Y的 联合概率空间 P(XY ) 中的统计平均值
nm
D E [d (x i,y j)] p (x i)p (y j|x i)d (x i,y j) (4-4) i 1j 1
信息论第四章失真率函数
【例4.8】 信源含两个消息{x1=0,x2=1},其概率分布为 失真测度 p为(XX汉)明 (x1Ha1mx2min,gδ)<失0.真5,测信度道,输求出率符失号真Y函=数{yR1=(D0,)。y2=1},
(1) 根据式(4-14)和(4-18)可求出R(D)的定义域 Dmin = 0·δ+0·(1-δ) = 0 D max = min {1-δ, δ}=δ (2) 求R(D)的值域
ij
式中D是预先给定的失真度,上式称为保真度准则。
根据[定理2.2],当信源q (x)一定时,平均互信息量I (X ; Y) 是信道转移概率函数p(y∣x)的∪型凸函数,这意味着可以 关于p(y∣x)对平均互信息量I (X ; Y)求得极小值,定义这个
极小值为率失真函数R(D),即:
RD min I X ;Y : D D p(y x)
xi )
( xi
y j )( y j )
q(xi )
。
1-δ = D (y1)+(1-D) (y2)
由上面方程组解出,
(
y1
)
D
1 2D
(
y
2
)
1
1
D 2D
② 再算出
p( y1
x1 )
(x1 y1 ) ( y1 )
q(x1 )
(1
D)
D 1 2 D
(1 D)( D) (1 2D)
d d 21 d 22
d1J
d
2
J
(4-1)
d I 1 d I 2 d I J
【例4.1】 汉明(Hamming)失真测度
信源输出符号X = {x1, x2, …, xK},信道输出符号Y = {y1, y2, …,
(1) 根据式(4-14)和(4-18)可求出R(D)的定义域 Dmin = 0·δ+0·(1-δ) = 0 D max = min {1-δ, δ}=δ (2) 求R(D)的值域
ij
式中D是预先给定的失真度,上式称为保真度准则。
根据[定理2.2],当信源q (x)一定时,平均互信息量I (X ; Y) 是信道转移概率函数p(y∣x)的∪型凸函数,这意味着可以 关于p(y∣x)对平均互信息量I (X ; Y)求得极小值,定义这个
极小值为率失真函数R(D),即:
RD min I X ;Y : D D p(y x)
xi )
( xi
y j )( y j )
q(xi )
。
1-δ = D (y1)+(1-D) (y2)
由上面方程组解出,
(
y1
)
D
1 2D
(
y
2
)
1
1
D 2D
② 再算出
p( y1
x1 )
(x1 y1 ) ( y1 )
q(x1 )
(1
D)
D 1 2 D
(1 D)( D) (1 2D)
d d 21 d 22
d1J
d
2
J
(4-1)
d I 1 d I 2 d I J
【例4.1】 汉明(Hamming)失真测度
信源输出符号X = {x1, x2, …, xK},信道输出符号Y = {y1, y2, …,
第四章 信息率失真函数
即:离散无记忆信源的N次扩展信源, 通过离散无记忆信 的N次扩展信道的平均失真度是单符号信源, 通过单符号 信道的N倍。 相应的保真度准则为:
D (N ) ND
例:设信源X取值于{0,1},失真函数数分别
为d(0,0)=d(1,1)=0,d(0,1)=d(1,0)=1.其N=3次
扩展信源的输入X=X1X2X3,经信道传导输 后,输出为Y=Y1Y2Y3,求失真矩阵[D(N)].
译码必定出错。
K L
log 2
m
H
(X
)
2
• 变长编码定理
– 若一离散无记忆信源的符号熵为H(X),对信源 符号进行m元变长编码,一定存在一种无失真
编码方法,其码字平均长度满足下列不等式
1 H(X) K H(X)
log 2 m
log 2 m
信道编码定理
• 信道编码定理:若有一离散无记忆平稳信道,其
那么在允许一定程度失真的条件下,能 够把信源信息压缩到什么程度,也就是,允 许一定程度失真的条件下,如何能快速的传 输信息,这就是本章所要讨论的问题。
1、失真函数
信源
信源 编码
信道 信道 编码
信道 译码
信源 译码
信宿
干扰
根据信道编码定理,我们可以把信道编码、信道和信道 解码等价成是一个没有任何干扰的广义信道,这样收信者收 到消息后,所产生的失真只是由信源编码带来的。我们也可
(N)
I
(X
;Y
)
RN (D) NR(D)
§4.1.3 率失真函数性质
R(D)
连续
H(X)
离散
D D Dmax D
1 定义域:0, Dmax
D=0 R(D)=H(X)
D (N ) ND
例:设信源X取值于{0,1},失真函数数分别
为d(0,0)=d(1,1)=0,d(0,1)=d(1,0)=1.其N=3次
扩展信源的输入X=X1X2X3,经信道传导输 后,输出为Y=Y1Y2Y3,求失真矩阵[D(N)].
译码必定出错。
K L
log 2
m
H
(X
)
2
• 变长编码定理
– 若一离散无记忆信源的符号熵为H(X),对信源 符号进行m元变长编码,一定存在一种无失真
编码方法,其码字平均长度满足下列不等式
1 H(X) K H(X)
log 2 m
log 2 m
信道编码定理
• 信道编码定理:若有一离散无记忆平稳信道,其
那么在允许一定程度失真的条件下,能 够把信源信息压缩到什么程度,也就是,允 许一定程度失真的条件下,如何能快速的传 输信息,这就是本章所要讨论的问题。
1、失真函数
信源
信源 编码
信道 信道 编码
信道 译码
信源 译码
信宿
干扰
根据信道编码定理,我们可以把信道编码、信道和信道 解码等价成是一个没有任何干扰的广义信道,这样收信者收 到消息后,所产生的失真只是由信源编码带来的。我们也可
(N)
I
(X
;Y
)
RN (D) NR(D)
§4.1.3 率失真函数性质
R(D)
连续
H(X)
离散
D D Dmax D
1 定义域:0, Dmax
D=0 R(D)=H(X)
第四章 信息率失真函数-习题答案2
⇒
⎡1 ⎢⎢1 ⎢⎣1
0⎤ ⎡0 0⎥⎥ OR ⎢⎢0 0⎦⎥ ⎣⎢0
1⎤ 1⎥⎥ 1⎦⎥
4.3
某二元信源
⎡X ⎢⎣P( X
⎤ )⎥⎦
=
⎧0 ⎩⎨1/ 2
Dmin和R(D)函数。
解:
1⎫ 1/ 2⎭⎬
其失真矩阵为
D
=
⎡a ⎢⎣0
0 a
⎤ ⎥⎦
求这信源的Dmax和
∑ Dj =
i
p(xi )d (xi ,
D = 1 , R(D) = ln 4 − 1 ln 16 nat / symbol
4
23
D = 1 , R(D) = ln 4 − 1 ln12 nat / symbol
2
2
D = 3 , R(D) = 0 nat / symbol 4
4.2
若
某无记忆信
源
⎡X ⎢⎣P( X
⎤ )⎥⎦
=
⎧ −1 ⎩⎨1/ 3
4.1
一个四元对称信源
⎡ ⎢ ⎣
X P( X
⎤ )⎥⎦
=
⎧0 ⎩⎨1/ 4
12 1/ 4 1/ 4
3⎫ 1/ 4⎭⎬
,接收符号Y
=
{0,
1,
2,
⎡0 1 1 1⎤
3},其失真矩阵为 ⎢⎢1 ⎢1
0 1
1 0
1⎥⎥ 1⎥
,求Dmax和Dmin及信源的R(D)函数,并画出其曲线
⎢⎣1 1 1 0⎥⎦
(取 4 至 5 个点)。
R(1) = 0.231奈特 / 符号 = 0.331比特 / 符号,因此每个信源符号最少要用 1 个二进 3
制码表示。
4.11
第四章 信道失真率函数
D( N ) E[d (ai , b j )] p(ai ) p(b j | ai )d (ai , b j )
n n
N p(ai ) k 1 p( xik ) N p(b j | ai ) k 1 p( y jk | xik )
nN m N
i1 1 m
i N 1 j1 1
6
常用的失真函数
失真函数是根据人们的实际需要和失真引起的损失、风险、 主观感觉上的差别等因素人为规定的,可以有多种形式 平方误差失真函数 d ( xi , y j ) ( y j xi )2 适用于 d ( x , y ) | y x | 绝对误差失真函数 i j j i 连续信源 相对误差失真函数 d ( xi , y j ) | y j xi | | xi |
率失真函数的定义域 (D 的下界)
允许失真度 D 是平均失真度的上限,而 D 是非负函数 d ( xi , y j ) 的数学期望,因此 D 的下界至多为 0,对应于无失真的情况, 此时信息传输率应等于信源输出的信息熵,即 Dmin 0 时: 离散信源:R( Dmin ) R(0) H ( X ) 连续信源:R( Dmin ) lim R( D )
N
由于 N 次扩展信源和 N 次扩展信道都是无记忆的,因此:
p(ai ) p( xi1 xi2
N xiN ) k 1 p( xik )
p(b j | ai ) p( y j1 y j2
y jN | xi1 xi2
N xiN ) k 1 p( y jk | xik )
9
符号序列的 平均失真度
i 1, 2, j 1, 2,
,n ,m
上述非负的失真函数共有 n m 个,可以整体表示成失真矩阵 d ( x1 , ym ) d ( x1 , y1 ) d ( x1 , y2 ) d ( x , y ) d ( x , y ) d ( x , y ) 2 1 2 2 2 m D d ( x n , ym ) d ( xn , y1 ) d ( xn , y2 ) 由于信源发出的符号 X 和信宿收到(再现)的符号 Y 均是随机 变量,因此单个符号的失真函数 d ( xi, yj ) 也是随机变量(的一 次实现)
n n
N p(ai ) k 1 p( xik ) N p(b j | ai ) k 1 p( y jk | xik )
nN m N
i1 1 m
i N 1 j1 1
6
常用的失真函数
失真函数是根据人们的实际需要和失真引起的损失、风险、 主观感觉上的差别等因素人为规定的,可以有多种形式 平方误差失真函数 d ( xi , y j ) ( y j xi )2 适用于 d ( x , y ) | y x | 绝对误差失真函数 i j j i 连续信源 相对误差失真函数 d ( xi , y j ) | y j xi | | xi |
率失真函数的定义域 (D 的下界)
允许失真度 D 是平均失真度的上限,而 D 是非负函数 d ( xi , y j ) 的数学期望,因此 D 的下界至多为 0,对应于无失真的情况, 此时信息传输率应等于信源输出的信息熵,即 Dmin 0 时: 离散信源:R( Dmin ) R(0) H ( X ) 连续信源:R( Dmin ) lim R( D )
N
由于 N 次扩展信源和 N 次扩展信道都是无记忆的,因此:
p(ai ) p( xi1 xi2
N xiN ) k 1 p( xik )
p(b j | ai ) p( y j1 y j2
y jN | xi1 xi2
N xiN ) k 1 p( y jk | xik )
9
符号序列的 平均失真度
i 1, 2, j 1, 2,
,n ,m
上述非负的失真函数共有 n m 个,可以整体表示成失真矩阵 d ( x1 , ym ) d ( x1 , y1 ) d ( x1 , y2 ) d ( x , y ) d ( x , y ) d ( x , y ) 2 1 2 2 2 m D d ( x n , ym ) d ( xn , y1 ) d ( xn , y2 ) 由于信源发出的符号 X 和信宿收到(再现)的符号 Y 均是随机 变量,因此单个符号的失真函数 d ( xi, yj ) 也是随机变量(的一 次实现)
第四章 信息率失真函数
为什么要讨论信息率失真函数R(D) ?
失真在传输中是不可避免的。
连续信源输出的信息量为无穷大,不可能实现无失真信源编码. 接收者(信宿)无论是人还是机器设备,都有一定的分辨能力与 即使信宿能分辨、能判别,但对通信质量的影响不大,也可以
灵敏度,超过分辨能力与灵敏度的信息传送过程是毫无意义的。
因此 D 取决于以下几个因素:
) i=1,2, ,n) 1)信源的统计特性,即 p(ai(
2)信道的统计特性,即 p(b j / ai ) 3)失真函数,即 d (ai , b j ) 一般情况下,人们所允许的失真指的都是平均意义 上的失真。如果规定其平均失真度 D不能超过某一限 定的值D,即D就是允许失真的上界。
称它为允许范围内的失真。
如果R>C,就必须对信源压缩,使得压缩后的R*<C,但同时要 求引入的失真不能超过规定的限度。 对于给定的信源,在允许失真的条件下信源熵所能压缩的理论 极限值就是率失真函数R(D) 。
综上所述,一般可以对信源输出的信息进行限失真
处理,降低信息率,提高传输效率。
在允许一定程度的失真条件下,能够把信息压缩到 什么程度?需要多少比特的信息率才能描述信源? 本章主要讨论一定程度的失真情况下所需的最少的 信息率,即信息率失真函数R(D) 。 思路:从分析失真函数、平均失真出发求出信息率 失真函数R(D)。
失真函数的数值是依据实际应用情况,用bj代替ai所导致的失 真大小是人为决定的。上例中用b=2代替a=0和a=1所导致的失 真程度相同,均为0.5;而用b=0代替a=1所导致的失真程度要大 些,为1。
二、平均失真度
1. 离散随机变量平均失真度定义
失真函数的数学期望称为平均失真度。
n m n m
失真在传输中是不可避免的。
连续信源输出的信息量为无穷大,不可能实现无失真信源编码. 接收者(信宿)无论是人还是机器设备,都有一定的分辨能力与 即使信宿能分辨、能判别,但对通信质量的影响不大,也可以
灵敏度,超过分辨能力与灵敏度的信息传送过程是毫无意义的。
因此 D 取决于以下几个因素:
) i=1,2, ,n) 1)信源的统计特性,即 p(ai(
2)信道的统计特性,即 p(b j / ai ) 3)失真函数,即 d (ai , b j ) 一般情况下,人们所允许的失真指的都是平均意义 上的失真。如果规定其平均失真度 D不能超过某一限 定的值D,即D就是允许失真的上界。
称它为允许范围内的失真。
如果R>C,就必须对信源压缩,使得压缩后的R*<C,但同时要 求引入的失真不能超过规定的限度。 对于给定的信源,在允许失真的条件下信源熵所能压缩的理论 极限值就是率失真函数R(D) 。
综上所述,一般可以对信源输出的信息进行限失真
处理,降低信息率,提高传输效率。
在允许一定程度的失真条件下,能够把信息压缩到 什么程度?需要多少比特的信息率才能描述信源? 本章主要讨论一定程度的失真情况下所需的最少的 信息率,即信息率失真函数R(D) 。 思路:从分析失真函数、平均失真出发求出信息率 失真函数R(D)。
失真函数的数值是依据实际应用情况,用bj代替ai所导致的失 真大小是人为决定的。上例中用b=2代替a=0和a=1所导致的失 真程度相同,均为0.5;而用b=0代替a=1所导致的失真程度要大 些,为1。
二、平均失真度
1. 离散随机变量平均失真度定义
失真函数的数学期望称为平均失真度。
n m n m
第四章:信息率失真函数
信息率失真函数
R( D)
p ( y j / xi )PD
min I ( X ;Y )
I ( X ; Y ) NR( D)
N N
对于离散无记忆信源的N次扩展信源和离散无记忆 信道的N次扩展信道:
RN ( D)
p (b j / ai )PD ( N )
min
信息率失真函数
在研究R(D)时,引用的条件概率p(y/x)并没有 实际信道的含义。只是为了求平均互信息的 最小值而引用的、假想的可变试验信道。实 际上这些信道反映的仅是不同的有失真信源 编码或信源压缩。所以改变试验信道求平均 互信息的最小值,实质上是选择一种编码方 式使信息传输率最小。
信息率失真函数的性质
基本概念
失真函数与平均失真度
失真函数 常用的失真函数 平均失真度 离散无记忆信道的N次扩展信道的平均失真
基本概念
失真函数
X {x1...xn} Y { y1... ym} P( yj / xi )
对任一 ( xi, yj ) 指定一个非负数d ( xi, yj ) 0 称 d ( xi, yj ) 为单个符号的失真度或失真函数。
p ( xi1 ) p( xiN ) p( y j1 / xi1 ) p( y jN / xiN ) d ( xik , y jk )
i1 1 n iN 1 j1 1 jN 1 k 1
n
m
m
N
p ( xi1 ) p( y j1 / xi1 )d ( xi1 , y j1 ) p( xi2 ) p( y j2 / xi2 ) d ( xi2 , y j2 )
i 1 j 1
n
m
p( xi ) p( y j / xi )d ( xi , y j )
[工学]信息论基础 --率失真函数 --练习与思考
凸函数,信息率失真函数就是在试验信道(满足保真度准则的信 道)中寻找平均互信息极小值的问题,即
2021/8/26
10
第四章 信息率失真函数
• 特性
– 信道容量 C一旦求出后,就只与信道转移概率 p(yj /xi) 有关,
反映信道特性,与信源特性无关;
– 信息率失真函数 R(D)一旦求出后,就只与信源概率分布 p(xi)
v
j
)
{
4 3
,
43}
i 1
nm
D
p(xi ) p( y j / xi )d (xi , y j )
i1 j1
Dmax min(D1, D2 ,
, Dm )
4 3
I (U,V ) 0
达到Dmax的信道为
1 1 ,0 1 1
1 0 1 0 1 0
达到Dmin的信道为 0
1 , 1
知的情况下,讨论允许平均失真度 D 的最小和最大
值问题。
• D 的选取必须根据固定信源 X 的统计特性D P(X) 和选
定的失真函数 d(xi , yj),在平均失真度
值范围内。
的可能取
2021/8/26
6
• 常用的失真函数
– 第一种
第四章 信息率失真函数
0 a a a
0
i j
d (xi , y j ) a a 0 i j
对偶问题:信道容量和信息率失真函数的问题,都是求平均互 信息极值问题。分三个方面说明:
• 求极值问题 – 平均互信息I(X;Y)是信源概率分布p(xi)(i=1,2,…,n) 的上凸函数,信
道容量就是在固定信道情况下,求平均互信息极大值的问题,即
– I(X;Y) 又是信道转移概率分布 p(yj /xi)(i=1,2,…,n;j=1,2,…,m) 的下
2021/8/26
10
第四章 信息率失真函数
• 特性
– 信道容量 C一旦求出后,就只与信道转移概率 p(yj /xi) 有关,
反映信道特性,与信源特性无关;
– 信息率失真函数 R(D)一旦求出后,就只与信源概率分布 p(xi)
v
j
)
{
4 3
,
43}
i 1
nm
D
p(xi ) p( y j / xi )d (xi , y j )
i1 j1
Dmax min(D1, D2 ,
, Dm )
4 3
I (U,V ) 0
达到Dmax的信道为
1 1 ,0 1 1
1 0 1 0 1 0
达到Dmin的信道为 0
1 , 1
知的情况下,讨论允许平均失真度 D 的最小和最大
值问题。
• D 的选取必须根据固定信源 X 的统计特性D P(X) 和选
定的失真函数 d(xi , yj),在平均失真度
值范围内。
的可能取
2021/8/26
6
• 常用的失真函数
– 第一种
第四章 信息率失真函数
0 a a a
0
i j
d (xi , y j ) a a 0 i j
对偶问题:信道容量和信息率失真函数的问题,都是求平均互 信息极值问题。分三个方面说明:
• 求极值问题 – 平均互信息I(X;Y)是信源概率分布p(xi)(i=1,2,…,n) 的上凸函数,信
道容量就是在固定信道情况下,求平均互信息极大值的问题,即
– I(X;Y) 又是信道转移概率分布 p(yj /xi)(i=1,2,…,n;j=1,2,…,m) 的下
信息论与编码(清华出版社)第4章信息率失真函数-Qtech
{
i = 1,2, L , n; j = 1,2, L , m
}
14
信息率失真函数R(D) 信息率失真函数
由于互信息取决于信源分布和信道转移概率分布, 根据2-2 由于互信息取决于信源分布和信道转移概率分布 , 根据 节所述, 一定时, 是关于p(y 型凸函数, 节所述,当p(xi)一定时,互信息 是关于 j/xi) 的U型凸函数, 一定时 互信息I是关于 型凸函数 存在极小值。因而在上述允许信道P 存在极小值。因而在上述允许信道 D中,可以寻找一种信道 pij,使给定的信源 i)经过此信道传输后,互信息 ;Y)达 使给定的信源p(x 经过此信道传输后 互信息I(X; 达 经过此信道传输后, 到最小。该最小的互信息就称为信息率失真函数R(D),即 到最小。该最小的互信息就称为信息率失真函数 ,
3
4.1 平均失真和信息率失真函数
4.1.1 4.1.2 4.1.3 4.1.4 失真函数 平均失真 信息率失真函数R(D) 信息率失真函数 信息率失真函数的性质
4
4.1 平均失真和信息率失真函数
在实际问题中, 在实际问题中,信号有一定的失真是可以容 忍的。但是当失真大于某一限度后, 忍的。但是当失真大于某一限度后,信息质量将 被严重损伤,甚至丧失其实用价值。要规定失真 被严重损伤,甚至丧失其实用价值。 限度,必须先有一个定量的失真测度。 限度,必须先有一个定量的失真测度。为此可引 入失真函数。 入失真函数。
如何减小失真,允许失真到什么程度; 如何减小失真,允许失真到什么程度; 在允许一定程度的失真条件下, 在允许一定程度的失真条件下,把信源信息压 缩到什么程度。 缩到什么程度。
2
第4章 在信源允许一定失真情况下 所需的最少信息率, 从分析失真函数、 所需的最少信息率 , 从分析失真函数 、 平 均失真出发,求出信息率失真函数R(D) 。 均失真出发,求出信息率失真函数 4.1 平均失真和信息率失真函数 4.2 离散信源的R(D)计算 离散信源的 ( )
第4章 信息率失真函数 《信息论与编码》经典PPT课件
失真矩阵
d(a1,b1) d(a1,bm )
d
d(an,b1) d(an,bm )
• 例:设信源符号序列为X={0,1},接收端收到符号
序列为Y= {0,1,2},规定失真函数为
失真矩阵
d(0,0)=d(1,1)= 0 d(0,1)=d(1,0)= 1 d(0,2)=d(1,2)= 0.5
d
没有失真
0
• d(xi , y j ) 0
x ≠ y xi y ji
j
产生失真
失xi 真 yj 的大小,用一个量来表示,即失真函数d(xi,yj),
以衡量用yj代替xi所引起的失真程度。
• 失真函数定义为:
0
d(xi, yj )
xi y j
0 xi y j
4
失真函数
• 将所有的d(xi,yj)排列起来,用矩阵表示为:
• 如果对信源进行不失真编码,平均每个符号至少需 要log2n个二进制码元。
• 现在假定允许有一定失真,假设失真限度为D=1/2 设想采用下面的编码方案:
a1→a1, a2→a2, …an→an
an+1→an ,an+2→ an ,…a2n→ an
21
• 平均失真
D
i
j
p(ai
)
p(a j
|
ai
8
L长序列编码
• 如果假定离散信源输出符号序列X={X1X2… Xl… Xn},其中L长符号序列xi =[xi1xi2…xiL],经信源 编码后,输出符号序列Y={Y1Y2…Yl…Ym},其中L
长符号序列yj=[yj1yj2…yjN ],则失真函数定义为
1
dL (xi , y j ) L j d (xiL , y jL )
信息论与编码-第4章信息率失真函数PPT课件
将定义进行扩展,可得N次扩展的信源和信 宿符号序列 a i与b j之间的失真函数为
长江大学电信学院
X
19
4.1 基本概念
d(ai,bj)d(xi1xi2xiN,yj1yj2yjN) d(xi1,yj1)d(xi2,yj2)d(xiN,yjN)
N
d(xik,yjk) k1
对应的失真矩阵为
d(a1,b1)
长江大学电信学院
X
30
4.1 基本概念
说明在保真度准则条件下的信源编码比无失 真情况得到了压缩,同时R(D)是保真度条件下 对信源进行压缩的极限值,亦即信源信息率可 压缩的最低限度,它仅取决于信源特性和保真 度要求,与信道特性无关。
长江大学电信学院
X
31
4.1 基本概念
3. R(D)与C的比较
信道容量表示信道的最大传输能力,反映的 是信道本身的特性,应该与信源无关。但平均 互信息量与信源的特性有关,为排除信源特性 对信道容量的影响,在所有的信源中以那个能 够使平均互信息量达到最大的信源为参考,从 而使信道容量仅与信道特性有关,信道不同, C亦不同。
i 1 j 1
n
nm
m
N
p( xi1 ) p( xiN ) p( y j1 | xi1 ) p( y jN | xiN ) d xik , y jk
i1 1 iN 1 j1 1 jN 1
k 1
nm
p( xi1 ) p( y j1 | xi1 )d ( xi1 , y j1 )
i1 1 j1 1
长江大学电信学院
X
27
4.1 基本概念
I (X; Y)是p(yj|xi ) 的下凸函数,故总可以在 PD集合中找到某一试验信道,使R = I (X;Y)达 到最小值,亦即找到某一个I (X;Y)而使R达到 最小,这个最小值就是R(D),称为信息率失真 函数,简称率失真函数,即
长江大学电信学院
X
19
4.1 基本概念
d(ai,bj)d(xi1xi2xiN,yj1yj2yjN) d(xi1,yj1)d(xi2,yj2)d(xiN,yjN)
N
d(xik,yjk) k1
对应的失真矩阵为
d(a1,b1)
长江大学电信学院
X
30
4.1 基本概念
说明在保真度准则条件下的信源编码比无失 真情况得到了压缩,同时R(D)是保真度条件下 对信源进行压缩的极限值,亦即信源信息率可 压缩的最低限度,它仅取决于信源特性和保真 度要求,与信道特性无关。
长江大学电信学院
X
31
4.1 基本概念
3. R(D)与C的比较
信道容量表示信道的最大传输能力,反映的 是信道本身的特性,应该与信源无关。但平均 互信息量与信源的特性有关,为排除信源特性 对信道容量的影响,在所有的信源中以那个能 够使平均互信息量达到最大的信源为参考,从 而使信道容量仅与信道特性有关,信道不同, C亦不同。
i 1 j 1
n
nm
m
N
p( xi1 ) p( xiN ) p( y j1 | xi1 ) p( y jN | xiN ) d xik , y jk
i1 1 iN 1 j1 1 jN 1
k 1
nm
p( xi1 ) p( y j1 | xi1 )d ( xi1 , y j1 )
i1 1 j1 1
长江大学电信学院
X
27
4.1 基本概念
I (X; Y)是p(yj|xi ) 的下凸函数,故总可以在 PD集合中找到某一试验信道,使R = I (X;Y)达 到最小值,亦即找到某一个I (X;Y)而使R达到 最小,这个最小值就是R(D),称为信息率失真 函数,简称率失真函数,即
信息论与编码原理_第4章_信息率失真函数
性”,实际上只要每秒放映 24 幅静态画面。
有些失真没有必要完全消除。 既然允许一定的失真存在,对信息率的要求便可降低。
返回目录
2019/1/17
Department of Electronics and Information, NCUT
Song Peng
பைடு நூலகம்
第7页
4.1.1 引
言
信息率与允许失真之间的关
4.1 基 本 概 念
(3) 常用的失真函数
第一种:
i j 0 d ( xi , y j ) a a 0 i j 0 a D a a a a a 0 a a a 0 a 0 a a 0
特点:对角线上的元素均为 0,对角线以外的其它元素都为常数
2019/1/17
Department of Electronics and Information, NCUT
Song Peng
第14页
4.1.2 失真度与平均失真度
4.1 基 本 概 念
(2) 失真度
失真矩阵
失真度还可表示成矩阵的形式
d ( x1 , y1 ) d ( x1 , y2 ) d ( x1 , ym ) d ( x , y ) d ( x , y ) d ( x , y ) 2 1 2 2 2 m D d ( x , y ) d ( x , y ) d ( x , y ) n 1 n 2 n m
以定义失真度为 0;
当 i≠j 时,用 Y 代表 X 就有误差。 这种定义认为对所有不同的 i 和 j 引起的误差都一样,所以定义
失真度常数 a。
2019/1/17
华侨大学工学院信息论Chapter 4 信息率失真函数
,
y1
)
d (x1, y2 ) d (x2 , y2 )
d (x1, y3 )
d
(
x2
,
y3
)
d (0, 0) d (0,1) d (0, 2) 0 1 0.5
d (1, 0)
d (1,1)
d
(1, 2)
1
0
0.5
注:失真函数的函数形式可以根据需要任意选取,例如平方
代价函数、绝对代价函数、均匀代价函数等。
如果预先规定的限定失真度为D,则称信源压缩后的平均失真度D 不大于D的准则为保真度准则,即保真度准则满足D D。
信息压缩问题就是对于给定的信源,在满足保真度准则的前提下, 使信息率尽可能小。
将满足保真度准则的所有信道称为失真度D许可信道
(也称D允许的试验信道),记为
PD p y | x : D D
17
4.1.3 信息率失真函数R(D)
X 信源编码器
X a1, a2 ,L an
Y
Y b1,b2 ,L bn
假想信道
将信源编码器看作信道
信源编码器的目的:使编码后所需的信息传输率 R 尽量小; 然而R越小,引起的平均失真就越大;
2020/4/13
Chapter 4 信息率失真函数
18
D失真许可信道(试验信道)
dL (xi ,
yj)
1 L
L l 1
d (xil ,
y jl )
其中d(xil,yjl)是信源输出L长符号样值xi中的第l个符号xil 时,经编码输出L长符号样值yj中的第l个符号yjl时的失真 函数。
202失0/4真/13函数矩阵共有nLC×hapmterL4个信息元率素失真。函数
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
原始图像和限失真图像
原始图像
红色图像
绿色图像
蓝色图像
香农首先定义了信息率失真函数R(D),并论述了关于这个 函数的基本定理。 定理指出:在允许一定失真度D的情况下,信源输出的信 息传输率可压缩到R(D)值,这就从理论上给出了信息传输率与 允许失真之间的关系,奠定了信息率失真理论的基础。 信息率失真理论是进行量化、数模转换、频带压缩和数据 压缩的理论基础。 本章主要介绍信息率失真理论的基本内容,重点讨论离散 无记忆信源。 给出信源的失真度和信息率失真函数的定义与性质; 讨论离散信源和连续信源的信息率失真函数计算; 在此基础上论述保真度准则下的信源编码定理。
XY i 1 j 1
r
s
• 若平均失真度D不大于我们所允许的失真D0,即: D D0 称此为保真度准则。
信源固定(即给定了p(x)),单个符号失真度固定时(即 给定了d(ai,bj)) ,选择不同试验信道,相当于不同的编码方 法,所得的平均失真度是不同的。 有些试验信道满足D D0,而有些试验信道D>D0。 凡满足保真度准则-----平均失真度D D0的试验信通称为 ----D失真许可的试验信道。 把所有D失真许可的试验信道组成一个集合,用符号PD表 示,则: PD={p (bj / ai): D D0}
则
0 1 D 1 0
1 2 1 2
[例3] 对称信源(s = r) 。信源X={a1,a2,…ar} ,接收Y= {b1,b2,…bs} 。若失真度定义为:
d (ai , bj ) (bj ai )2
如果信源符号代表信源输出信号的幅度值,这就是一种平 方误差失真度。它意味着幅度差值大的要比幅度差值小的所引 起的失真更为严重,其严重的程度用平方来表示。 当 r=3时, X={0,1,2},Y={0,1,2} ,则失真矩阵为:
4.1 失真测度
一、失真度
• 从直观感觉可知,若允许失真越大,信息传输率就可越小; 若允许失真越小,信息传输率需越大。
• 所以信息传输率与(信源)编码所引起的失真(或误差)是 有关的。
首先讨论失真的测度。 离散无记忆信源X,信源符号集X={a1,a2,…,ar},概率分 布为p(x)=[p(a1),p(a2),…p(ar)] 。 信源符号通过信道传输到接收端,接收端的接收符号集Y = {b1,b2,…bs} 。 对应于每一对(ai,bj),我们指定一个非负的函数:
4.2
信息率失真函数及其性质
一、信息率失真函数的定义
信源给定,且又具体定义了失真函数以后,总希望在满足 一定失真的情况下,使信源传输给收信者的信息传输率R尽可 能地小。-------即在满足保真度准则下,寻找信源必须传输给信 宿的信息率R的下限值------这个下限值与D有关。 从接收端来看,就是在满足保真度准则下,寻找再现信源 消息所必须获得的最低平均信息量。 而接收端获得的平均信息量可用平均互信息I(X;Y)来表示 ,这就变成了在满足保真度准则的条件下,寻找平均互信息 I(X;Y)的最小值。
p(a ) p(b
/ ai )d (ai , b j ) D
一般取等号
一、 等概率、对称失真信源的R(D)计算
对于等概、对称失真的信源,存在一个与失真矩阵具有 同样对称性的转移概率分布达到率失真R(D)。
[例5]有一个二元等概平稳无记忆信源 X 0,1 ,接收符号集为
Y 0,1,2 且失真矩阵为 :
0 1 4 D 1 0 1 4 1 0
上述例子说明了失真度的具体定义。 一般情况下根据实际信源的失真,可以定义不同的失真和 误差的度量。另外还可以按其他标准,如引起的损失、风险 、主观感觉上的差别大小等来定义失真度d(a,b)。
二、序列失真度
设 x x1, x2 ,, xN ,其中 xi 取自信源符号集A;
y y1, y2 ,, yN 其中 yi 取自信宿符号集B。
则序列失真度定义为:
1 d N ( x, y) N
d (x , y )
i 1 i i
N
三、 平均失真度
信源 X 和信宿 Y 都是随机变量,故单个符号失真度d(ai,bj) 也 是随机变量。
规定了单个符号失真度d(ai,bj) 后,传输一个符号引起的平均 失真,即信源平均失真度:
I ( X , Y ) p(ai ) p(b j / ai ) log
i 1 j 1 r s
p(b j / ai )
p(a ) p(b
i 1 i
r
j
/ ai )
其约束条件为:
p(bj / ai ) 0
s
p(b
j 1 r s i 1 j 1
j
/ ai ) 1
i j
x
p(a1 ) min(1, 2,3) p(a2 ) min(2,1,3) p(a3 ) min(3, 2,1) 令对应最小失真度 d (ai , b j )的 p(b j | ai ) 1,其它为“0”,可 得对应 min 的试验信道转移概率矩阵为: D
[例4] 设试验信道输入符号集 a1 , a2 , a3 ,各符号等概分布 , 失真矩阵如下所示,求 Dmin 和 Dmax以及相应的试验信道的转移 概率矩阵。 1 2 3 d 2 1 3 3 2 1 解: Dmin p( x) mind ( x, y)
p(bj/ai)是指一种失真算法,
有时又把 p(bj/ai) 称为试验信道的转移概率,如图所 示。 X 原始信源 p (bj/ai) 试验信道 Y 失真信源 信道
[例1] 离散对称信源(r=s),“0-1”失真。信源X={a1,a2,…ar} , 接收Y= {b1,b2,…bs}。定义单个符号失真度:
R( D)
p (b j / ai )PD
min I ( X ;Y )
R(D)-------信息率失真函数或简称率失真函数
单位是:比特/信源符号
• 率失真函数给出了熵压缩编码可能达到的最小熵率与失真的 关系; • 其逆函数D(R)称为失真率函数, D(R)表示一定信息速率下所 可能达到的最小的平均失真。
0 1 0 p ( y | x) 0 1 0 0 1 0
2、 R(D)是关于平均失真度D的下凸函数 设
0 D1 , D2 为任意两个平均失真, a 1,则有:
R[aD1 (1 a) D2 ] aR( D1 ) (1 a) R( D2 )
求率失真函数R(D) 。
解:
x y
0 1 [d ] 0 1
Dmin p( x) mind ( x, y) 0
Dmax min p( x)d ( x, y) 1
y x
第四章
信息率失真函数
无失真信源编码和有噪信道编码(香农第一定理和香 农第二定理)告诉我们:
只要信道的信息传输速率小于信道容量,总能找到一 种编码方法,使得在该信道上的信息传输的差错概率任意 小;反之,若信道的信息传输速率大于信道容量,则不可 能使信息传输差错概率任意小。
但是,无失真的编码并非总是必要的。
Dmax min p( x)d ( x, y ) min p(a1 ) 1 p(a2 ) 2 p(a3 ) 3 , y x
上式中第二项最小,所以令 p(b2 ) 1 , p(b1 ) p(b3 ) 0 ,可得对应 max D 的试验信道转移概率矩阵为:
对二元对称信源(s=r=2),信源X={0,1},接收 变量Y={0,1}。在汉明失真定义下,失真矩阵为:
[例2] 删除信源。信源X={a1,a2,…ar} ,接收Y= {b1,b2,…bs} (s = r+1) 。定义其单个符号失真度为:
0 d (ai , b j ) 1 1/ 2
0 d (ai , b j ) 1
ai b j ai b j
这种失真称为汉明失真。汉明失真矩阵是一方阵,对角线上的 元素为零,即:
0 1 ... 1 1 0 ... 1 D : : ... : 1 1 ... 0 rr
0 1 D 1 0
二、信息率失真函数的性质
1、 R(D)的定义域 R(D)的定义域为
0 Dmin D Dmax
且:
Dmin p( x) mind ( x, y)
x y
Dmax min p( x)d ( x, y) y x
• 允许失真度D的下限可以是零,这是不允许任何失真的情况。
D E[d (ai , bj )] E[d (a, b)]
在离散情况下,信源X={a1,a2,…ar} ,其概率分布p(x)= [p(a1),p(a2),…,p(ar)] ,信宿Y= {b1,b2,…bs} 。 若已知试验信道的传递概率为p(bj/ai)时,则平均失其度为:
D p(ab)d (a, b) p(ai ) p(b j / ai )d (ai , b j )
i j i j 除j=s以外所有的j和i j s 所有i
• 其中接收符号bs作为一个删除符号。
• 此时,意味着若把信源符号再现为删除符号bs时,其失真 程度要比再现为其他接收符号的失真程度少一半。
• 二元删除信源 r =2, s =3,X={0,1},Y={0,1 ,2} 。
失真度为:
d(0,0)=d(1,1)=0 d(0,1)=d(1,0)=1 d(0,2)=d(1,2)=1/2
1 0 0 p ( y | x) 0 1 0 0 0 1
y
p(a1 ) 2 p(a2 ) 1 p(a3 ) 2 , p(a1 ) 3 p(a2 ) 3 p( a3 ) 1