第10讲 信源编码的性能指标
信源编码
信息工程学院通信工程系
4.1 信源编码基本概念
信源编码模型
信源编码是对信源发出的符号按一定的数学规则进行的 一种变换。 为了分析方便和突出研究的重点,当研究信源编码时, 将信道编码和译码看成是一个整体,以突出信源编码的研究。 X=X1X2… Xi …XK
信源序列
信源编码器
Y=Y1Y2…Yj …YL
信息工程学院通信工程系
4.1 信源编码Leabharlann 本概念N次扩展码 信源符号集
S {s1 , s2 , , sq }
C {W1 ,W2 , ,Wq }
码字符号集 N次扩展信源符号集
N次扩展码字集
S N {1 , 2 , , q N }, j s j1 s j2 s jN
二元码 若码符号集为 {0,1} ,所得码字都是二进制序列,则称为二 元码。二元码是数字通信和计算机系统中最常用的一种码。 等长码(固定长度码) 若一组码中所有码字的码长都相等,称为等长码。 变长码(非固定长度码) 若一组码中码字的码长不完全相同,则称为变长码。
信息工程学院通信工程系
4.1 信源编码基本概念
C N {W1 ,W2 , ,Wq N }, W j W j1W j2 W jN
信息工程学院通信工程系
4.1 信源编码基本概念
唯一可译码
若码的任意一串有限长的码符号序列只能被唯一的译成其 对应的信源符号序列,则此码称为惟一可译码或单义可译码, 否则则称为非惟一可译码或非单义可译码。 若要所编的码是唯一可译码,不但要求编码时不同的信源 符号序列变换成不同的码序列,而且还要求任意有限长的信源 序列所对应的码符号序列各不相同。只有任意有限长的信源序 列所对应的码符号序列各不同,才能将该码符号序列惟一的分 割成一个个对应的信源序列,从而实现惟一的译码。 即时码 在译码过程中只要接收到每个码字(码序列)的最后一个 符号就可立即将该码字译出,这样的码称为即时码;否则称为 非即时码。
信源编码及信道编码
-3/61-
3.6 信道的定义和分类
1. 信道的定义:
信道是指信息传输的通道,包括空间传输和时间传输。 空间传输:利用各种物理通道将信息从一端发到另一端 时间传输:是指将信息保存,在以后读取,如磁带、光
盘等在时间上将信息进行传输的信道。
关于信道的主要问题有:
➢ 信道的建模(信道的统计特性的描述) ➢ 信道容量的计算 ➢ 在有噪信道中能不能实现可靠传输?怎样实现可靠传输?
信源编码及信道编码
学习目标
学习完本节课程,您应该能够: 掌握信道的定义和分类 掌握信道的数学模型 掌握什么是信道容量 了解信道复用 掌握信道编码及信道差错控制方法
-2/61-
课程内容
3.6 信道的定义和分类 3.7 信道的数学模型 3.8 信道容量及信道复用 3.9 信道编码基本概念 3.10 信道差错控制及编码方法
① 离散信道 ② 连续信道 ③ 半连续信道 ④ 时间离散的连续信道
按信道的记忆特性
① 无记忆信道 ② 有记忆信道
-6/61-
3.6 信道的定义和分类(续)
2. 信道的分类(续)
按输入/输出信号之间的关系分为
① 噪声信道 ② 无噪声信道
根据信道输入和输出的个数可分为
① 两端信道(单用户信道):只有一个输入端和一个输出端 的单向通信的信道。
➢ 例如短波电离层反射信道。
-8/61-
3.6 信道的定义和分类(续)
3. 通信信道实例:
随参信道举例:短波电离层反射信道
① 短波是指波长为100m-10m(频率为3-30MHz)的无线电波。 可沿地表面传播(地波传播),传播距离近;可由电离层反射 传播(天波传播)。传输几千千米,至上万千米。
② 传播路径:电离层离地面高60-600km的大气层。分为D、E、 F2 等层。
信源编码
信源编码技术为什么要进行信源编码通信系统就是将产生的信息传输到目的地。
信源有各种不同的形式,如广播的信源是语音或音乐,电视的信源是活动图像,这些信源的输出都是模拟信号,称为模拟信源。
计算机和存储器件(磁盘或光盘)输出的是离散信号,称为数字信源。
在数字系统中传输的都是数字信息,不论是模拟信源还是离散信源其输出都必须转化为可以传输的数字信息,这种转化通常是由信源编码器来完成的。
信源编码在移动通信中也称语音编码。
Ø信源编码的作用是用信道能传输的符号来表示信源发出的信息,在不失真或一定失真的条件下用尽可能少的符号传送信源消息,提高信息传输率。
信源编码(如语音)对数字传输非常重要,而且对无线通信来说显得尤其重要。
Ø随着数字电话和数据通信容量日益增长的迫切要求,而又不希望明显降低传送话音信号的质量,除了提高通信带宽之外,对话音信号进行压缩是提高通信容量的重要措施。
Ø在移动通信中,稀少而又昂贵的无线信道更一定要和必须要对传输的各种信号源进行压缩,以提高通信容量。
模拟信源(语音)编码的种类波形编码、参量编码、混合编码一般来说,波形编码器的话音质量高,但数据率也很高;参量编码器的数据率很低,产生的合成话音的音质有待提高;混合编码器同时使用参量编译码技术和波形编译码技术,数据率和音质介于它们之间。
(1)波形编码波形编码比较简单,编码前采样定理对模拟语音信号进行量化,然后进行幅度量化,再进行二进制编码。
解码器作数/模变换后再由低通滤波器恢复出现原始的模拟语音波形,这就是最简单的脉冲编码调制(PCM),也称为线性PCM。
可以通过非线性量化,前后样值的差分、自适应预测等方法实现数据压缩。
波形编码的目标是让解码器恢复出的模拟信号在波形上尽量与编码前原始波形相一致,也即失真要最小。
波形编码的方法简单,数码率较高,在64kbit/s至32kbit/s之间音质优良,当数码率低于32kbit/s的时候音质明显降低,16 kbit/s时音质非常差。
信源编码--离散信源无失真编码概述(ppt 17页)
程实用的简化?)
2020/8/22
2
§3.1 信源及其分类
离散信源 信源每隔一个定长时间段就发出一个随机变量; 随着时间的延续,信源发出的是随机变量序列
pe= P{(U1U2…UL)=(u1u2…uL) | (u1u2…uL)的码字在译码时并不译为(u1u2…uL)}。
2020/8/22
8
§3.2 离散无记忆(简单)信 源的等长编码
(关于编码速率的说明:
编码速率本来是编码设备的性能指标。这就是说,首先有 了编码设备的编码速率R0,然后选择N和L,使得实际的编 码速率NlogD/L不能超过编码设备的编码速率R0 : R=NlogD/L≤R0。
R<H(U1)≤logK。 (如果H(U1)=logK,则以上两种情形已经概括了全部情形。
但如果H(U1)<logK,则还有一种情形) 当logK>R>H(U1)时,虽然无论怎样编码都是有错编码,
但可以适当地编码和译码使译码错误的概率pe任意小。这 就是所谓“渐进无错编码”。
2020/8/22
10
2020/8/22
6
§3.2 离散无记忆(简单)信 源的等长编码
(3)如果限定码字的长度为N(即每个码字都是一个N维向 量),则称此编码为等长编码,能够选择的不同码字的个 数为DN。
(4)如果限定码字的长度为≤N(即每个码字都是一个≤N维 的向量),则称此编码为不等长编码,能够选择的不同码 字的个数为
2020/8/22
3
§3.1 信源及其分类
(总结:离散无记忆简单信源就是时间离散、事件离散、各 随机变量独立同分布的信源。课程学习所面对的信源将主 要是离散无记忆简单信源)
信源编码
每个终端节点对应的码字由从根节点出发到终端节点 走过的路径上所对应的符号组成
当第i阶的节点作为终端节点,且分配码字,则码字的 码长为i 按树图法构成的码一定满足即时码的定义 树码的各个分支都延伸到最后一级端点,则称为满树, 否则为非满树 满树码是定长码,非满树码是变长码
2013-8-12 14
适用于离散信源/数字信号编码。
限失真编码定理
对于连续信源,编成代码后就无法无失真地恢复 原来的连续值,因为取值可以有无限多个。此时 只能根据限失真编码定理进行限失真编码。 适用于连续信源/模拟信号编码。
2013-8-12 4
第5章 信源编码
5.1
5.2 5.3 5.4
2013-8-12
1
编码器
2 j m
KL长码字
Y Y Y Y
1 2 j KL
8
b , b , , b ,, b
2013-8-12
编码的定义
定长码和变长码 定长码:所有码字的长度都相同 变长码:可变长度码,码中的码字长短不一
信源符号
信源符号
出现概率
码0 00
码1 0
码 表 码2 0
码3 1
在考虑了符号出现的概率以及符号之间的依赖性后, 实际英文电报符号信源平均每个符号所提供的信息 量约等于1.4比特,大大小于5比特。 编码后,5个二元符号只携带约1.4比特信息量。
定长编码的信息传输效率极低。
2013-8-12 24
定长编码定理
定长编码定理:由L个符号组成的、每个符号的熵 为HL(X)的无记忆平稳信源符号序列X1X2…Xl…XL, 可用KL个符号Y1, Y2,…, Yk,…YKL(每个符号有m种 可能值)进行定长编码。
信源编码
6.1 信源编码概论
信源编码的基本途径有两个:
使序列中的各个符号尽可能地互相独立,即解 除相关性; 使编码中各个符号出现的概率尽可能地相等, 即概率均匀化。
信源编码的分类:离散信源编码、连续信
源编码和相关信源编码三类。
离散信源编码:独立信源编码,可做到无失真
编码;
连续信源编码:独立信源编码,只能做到限失
i 0 j 1
xi x1 x2 x3 x4 x5 x6
p(xi) 0.25 0.25 0.20 0.15 0.10 0.05
pa(xj) 0.000 0.250 0.500 0.700 0.850 0.950
ki 2 2 3 3 4 5
码字 00(0.000)2 01(0.010)2 100(0.100)2 101(0.101)2 1101(0.1101)2 111110(0.11110)2
该信源的熵为
平均码长为
H ( X ) p( xi ) log 2 p( xi ) 2.35(比特 / 符号)
i 1
6
L p( xi )li 2.4(码元 / 符号)
i 1
6
对上述信源采用费诺编码的信息率为
R L 2.4 log 2 m log 2 2 2.4(比特/符号) 这里N 1, m 2 N 1
u u2 U 1 1 1 P(U ) 2 4 u3 1 8 u4 1 16 u5 1 16
试分别求其二元霍夫曼编码和费诺编码,并求其编码效率。
第6章 信源编码
6.1 信源编码概论
6.2 变长编码方法
6.3 实用的无失真信源编码方法
通信系统的性能指标主要是有效性、可 靠性、安全性和经济性,除了经济性外, 这些指标正是信息论研究的对象。 编码的目的是为了优化通信系统,使这 些指标达到最佳; 按不同的编码目的,编码分为三类:信 源编码、信道编码和安全编码/密码。
信源编码和信源解码
信源编码和信源解码信源编码和信源解码字、符号、图形、图像、音频、视频、动画等各种数据本身的编码通常称为信源编码,信源编码标准是信息领域的基础性标准。
无论是数字电视、激光视盘机,还是多媒体通信和各种视听消费电子产品,都需要音视频信源编码这个基础性标准。
大家用电脑打字一定很熟悉,当你用WORD编辑软件把文章(DOC文件)写完,存好盘后,再用PCTOOLS工具软件把你的DOC 文件打开,你一定能看到你想象不到的东西,内容全是一些16进制的数字,这些数字叫代码,它与文章中的字符一一对应。
现在我们换一种方法,用小画板软件来写同样内容的文章。
你又会发现,用小画板软件写出来的BMP文件,占的内存(文件容量)是DOC文件的好几十倍,你知道这是为什么?原来WORD编辑软件使用的是字库和代码技术,而小画板软件使用的是点阵技术,即文字是由一些与坐标位置决定的点来组成,没有使用字库,因此,两者在工作效率上相差几十倍。
[信源]->[信源编码]->[信道编码]->[信道传输+噪声]->[信道解码]->[信源解码]->[信宿]目前模拟信号电视机图像信号处理技术就很类似小画板软件使用的点阵技术,而全数字电视机的图像信号处理技术就很类似WORD编辑软件使用的字库和代码技术。
实际上这种代码传输技术在图文电视中很早就已用过,在图文电视机中一般都安装有一个带有图文字库的译码器,对方发送图文信号的时候只需发送图文代码信息,这样可以大大地提高数据传输效率。
对于电视机,显示内容是活动图像信息,它哪来的“字库”或“图库”呢?这个就是电视图像特有的“相关性”技术问题。
原来在电视图像信号中,90%以上的图像信息是互相相关的,我们在模拟电视机中使用的Y/C(亮度信号/彩色信号)分离技术,就是利用两行图像信号的相关性,来进行Y/C分离。
如果它们之间内容不相关,Y/C 信号则无法进行分离。
全数字信号电视也一样,如果图像内容不相关,则图像信号压缩也就要免谈。
信源编码
游程编码
• 若已知二元序列以0起始,从游程序列很容易恢 复成原来的二元序列
• 游程序列是多元序列,各长度可按哈夫曼编码 或其它方法处理以达到压缩码率的目的。 • 多元序列也存在相应的游程序列 • 多元序列变换成游程序列再进行压缩编码没有 多大意义
• 游程编码只适用于二元序列,对于多元信源, 一般不能直接利用游程编码
直接编码的数码 压缩比 某种编码的数码
21
• CCITT是Commite' Consultatif International de Telegraphique et Telephonique. 的简称。 • 其英文全称是International consultative committee on telecommunications and Telegraphy 可译成中文: 国际电报电话咨询委员会 • 解释: CCITT是国际电报电话咨询委员会的简称, 它是国际电信联盟(ITU)的常设机构之一。主 要职责是研究电信的新技术、新业务和资费等问 题,并对这类问题通过建议使全世界的电信标准 化。 • 从1993年3月1日起,国际电报电话咨询委员会 (CCITT)改组为国际电信联盟(ITU)电信标 准化部门,简称ITU-T。
• “0”游程和“1”游程总是交替出现,若规定二元序列总是 从“0”开始,第一个游程是“0”游程,则第二个游程必为 “1”游程,第三个又是“0”游程……。 • 对于随机二元序列,各游程长度将是随机变量,其取值可 为1,2,3,…,直至无穷。 • 游程长度序列/游程序列:用交替出现的“0”游程和“1” 游程长度表示任意二元序列。 • 游程变换:即将二元序列变成为游程长度序列。 – 是一种一一对应的变换,也是可逆变换。 例如:二元序列000101110010001… 可变换成如下游程序列 31132131
樊昌信《通信原理》(第7版)配套题库【章节题库10-13章】【圣才出品】
10.在 PCM30/32 路基群帧结构中,TS0 用来传输______,TS16 用来传输______。 【答案】帧同步信息;信令信息 【解析】由 PCM 一次群的帧结构知,时隙 TS0 传送帧同步信息,时隙 TS16 传送信令信 息,其他 30 个时隙用于传输语音抽样值的 8b 码组。
11.A 律 PCM 二次群是由______个基群复用而成,其比特率为______Mb/s,可同时 传输______路数字电话。
综上,-753 单位的抽样脉冲值对应的 13 折线 A 律编码为 01100111。 在接收端译码时,通常将此码组转换成量化间隔的中间值输出,这里是 512+32×7= 608 单位,故量化误差为 753-736=17 单位。
5.在 PCM 系统中,某抽样值 线编码为______(段内码采用自然二进码)。
2.改善弱信号的信号量噪比,通常可采用______技术。 【答案】压扩 【解析】压扩技术在“发端”实行压缩,即对小信号值进行放大,对大信号进行压缩, 以满足量化信噪比要求;在“收端’’实行扩张,压与扩相互补偿以保证放大系数为 1,即 信号不失真,从而改善弱信号的信号量噪比。
3.已知采用 13 折线 A 律编码的 PCM 码组为 11101100,最小量化间隔为 1 个量化 单位,则该码组相对应的译码电平为______量化单位。
【答案】01100111;17 个量化单位 【解析】设编码输出为 c1c2c3c4c5c6c7c8 Is 753 0 ,故极性码为 c1 0 ;
512< | Is | <1024,故段落序号为 7,段落码为 c2c3c4 110 ;
第 7 段中总电平单位数为 512,则量化间隔 512/16=32,因 753=512+32×7+17, 故段内码 c5c6c7c8 0111 ;
《信源编码》PPT课件
器的存在性,它使输出符号的信息率与信源熵之比接
近于 1 ,即:
若要实现,取无限长 L 的
信源符号进行统一编码。
精选ppt
30
例: 设离散无记忆信源概率空间为
•
信源熵:
H
(
X
)
=
-
∑
i=
p
1
(
xi
)
log
p
(
xi
)
=
2.55
bit
/
符号
对信源符号采用定长二元编码, 要求编码效率η为 90 %
若取 L = 1 ,则
• 信源熵: H ( X ) = 2 . 55 bit / 符号
要求编码效率η为 90 % 用二进制变长编码, m = 2
精选ppt
38
例: 设离散无记忆信源概率空间为
• 信源熵: H ( X ) = 1/4 log4 +3/4 log3/4 = 0. 811 bit / 信源符号
精选ppt
存在唯一可译码
20
K1 =1 , K2 =2 , K3 =3 , K4 =3 。
注意Βιβλιοθήκη Kraft 不等式只是用来说明唯一可译码是 否存在,并不能作为唯一可译码的判据。
如码字 {0,10,010,111} 虽然满足 Kraft 不等式,
但它不是唯一可译码。
精选ppt
21
5.2 无失真信源编码
在不失真或允许失真的条件下,用
尽可能少的符号传送信源信息。
精选ppt
3
• 信道编码: – 是以提高信息传输的可靠性为目的的编码。 – 通常通过增加信源的冗余度来实现。采用的 一般方法是增大码率/带宽。
信源编码详解
应能能合成语音!
注:参见数字语音处理
4.5 语音的参量编码
4.5.1 参量编码原理
三、 语音参量编码的可能速率 # 语音参数一般有128~256个,假设为256个,用8bit/参数 表示; 假设发音速率是10参数/秒,
Rb = 8bit/参数•10参数/秒= 80 bit/s
# 当前语音参量编码(混合)达到的速率: CDMA移动通信系统(IS-95) :1.2Kb/s 实验室达到的速率:低于800 bit/s
4.5 语音的参量编码
4.5.2 语音参量编码的实现
一、参量空间
分析一段语音,提取一组参量:
A a1,a2,....ai....an 这组参量代表了这段语音,是一个整体,因而对参 量的处理必须是对这一整体进行处理,并把这组参 量视为n维空间的一点。
由某类消息参量组成的多维空间,称之为参量空间。
DPCM思想
4.4.2 脉冲差分编码调制(DPCM)
二、DPCM原理
xn 1
xni
xn2
xn
t
tn1 tn
t tn1
n2
假设 xn 与 xn 之前k 次采样有关,有:
k
x n
ai xni
ai 为一组系数
i 1
xn与真值 xn 之差为 en ,有:
k
k
x e x x x e n = n -
n=
预测值
加入平滑 量化值
xn xn en
实际参数:k=12,4比特 (16电平)量化差值,码速 率32Kb/s 。
图 4.4.4 DPCM 原理图
4.4.2 脉冲差分编码调制(DPCM)
四、ADPCM 编码-------DPCM的改进
信源编码-北邮信息论课件
信源编码贺志强信源编码:将信源符号序列按一定的数学规律映射成由码符号组成的码序列的过程。
成由码符号组成的码序列的过程信源译码:根据码序列恢复信源序列的过程。
信源译码根据码序列恢复信源序列的过程无失真信源编码:即信源符号可以通过编码序列无差错地恢复。
无差错地恢复(适用于离散信源的编码)限失真信源编码:信源符号不能通过编码序列无差错地恢复。
差错地恢复(可以把差错限制在某一个限度内)信源编码的目的:提高传输有效性,即用尽可能短的码符号序列来代表信源符号。
号序列来代表信源符号无失真信源编码定理证明,如果对信源序列进行编码,当序列长度足够长时,存在无失真编码使得传送每信源符号存在无失真编码使得传送每信源符号所需的比特数接近信源的熵。
因此,采用有效的信源编码会使信息传输效率得到提高。
会使信息传输效率得到提高概述一、信源编码器二、信源编码的分类三分组码三、分组码分组码单符号信源编码器符号集符号集AA 1{,,}q a a ii c a 编为1{,,}q c c 编码器码字集合信源序列码符号集1{,}r b b分组码单符号译码器1{,,}q c c 信源序列码字集合1{,,}q a a 译码器1{,}r b b 码符号集简单信源编码器摩尔斯信源编码器将英文字母变成摩尔斯电码将摩尔斯电码变成二进码信源编码器信源编码器(1)信源符号{英文字母英文字母}}(2)二进信道码符号集点、划、字母间隔、单词间隔信道基本符号{0,1}符号点划字母间隔单词间隔电平+ -+++ ---------二进代码 1 0111000000000摩尔斯信源编码器原信源的次扩展码原信源的N N将N个信源符号编成一个码字。
相当于对原信源的N次扩展源的信源符号进行编码。
例信源X={0,1}的二次扩展源的二次扩展源X X 2的符号集为:信源X={0,1}。
对X X2编码,即为原信源编码,即为原信源X X的二{00,01,10,11}。
对{00,01,10,11}编码即为原信源X {00011011}对即为原信源次扩展码。
信源编码
信源编码的原理、方法、优缺点及应用信源编码就是从信源产生的信号到码符号的一种映射,它把信源输出的符号变换成码元序列。
信源编码主要是利用信源的统计特性,解决信源的相关性,去掉信源冗余信息,从而达到压缩信源输出的信息率,提高系统有效性的目的。
冗余信息是指信源产生信息所用数据位数与消息中包含的实际信息数据位的数目差值。
解决信源的相关性本质就是降低信源中的冗余,常用消除信源相关性的方法:“合并法”和“预测法”。
如果信源的符号序列中,只在相邻的少数几个符号之间有相关性,而相距较远的符号之间的相关性可以忽略不计,那么,这种信源称为弱记忆信源。
在这种情况下,可以把具有较强相关性的邻近几个符号看成一个大符号。
于是,这些大符号之间的相关性就变得很小了。
实际上就是把原来的基本信源空间变换成了多重空间。
多重空间的重数越高,这种大符号之间的相关性越小,最终可以获得相互独立的情况。
这种方法称为合并法。
如果信源的符号序列之间存在较强的相关性联系,以至根据其中一部分符号能够以一定的准确性推测出其余的符号,这种信源就称为强记忆信源。
在传递这样的信息时,那些可以被精确推断出来的符号就不必传送,从而可以节省时间,提高传输的效率。
但是,大多数情况下,完全可以精确推断出来的情况是极少的,只能根据信源的统计相关性作近似的预测,这就是预测法。
信源编码的作用之一是设法减少码元数目和降低码元速率,即通常所说的数据压缩:作用之二是将信源的模拟信号转化成数字信号,以实现模拟信号的数字化传输。
最原始的信源编码就是莫尔斯电码,另外还有电报码都是信源编码,它们主要用于传输电报信息。
但现代通信应用中常见的信源编码方式有:香农编码、费诺编码、Huffman 编码、算术编码、L-Z编码等,另外还有一些有损的编码方式。
信源编码的目标就是使信源减少冗余,更加有效、经济地传输,最常见的应用形式就是压缩。
另外,在数字电视领域,信源编码包括通用的MPEG—2编码和H.264(MPEG—Part10 AVC)编码等。
(完整)通信原理习题汇总,推荐文档
通信原理习题班级:14电信姓名:王斌学号:20141151046教师:董建娥第一章绪论习题1一、填空题1、数字通信系统的主要性能指标是和。
码元速率R B定义是,单位。
信息速率定义是,单位。
2、数字通信系统的有效性用衡量,可靠性用衡量。
3、模拟通信系统的有效性用衡量,可靠性用衡量。
4、在等概条件下,八元离散信源能达到最大熵是,若该信源每秒钟发送2000个符号,则该系统的信息速率为。
5、通信系统的有效性衡量指标对于模拟通信系统为,对于数字通信系统为。
6、通信系统的可靠性衡量指标对于模拟通信系统为对于数字通信系统为。
7、一个M进制基带信号,码元周期为T S秒,则传码率为,若码元等概出现,一个码元所含信息量为。
8、通信系统模型中有两个变换,它们分别是之间的变换和之间的变换。
9、模拟信号是指信号的参量可取值的信号,数字信号是指信号的参量可取值的信号。
10、根据信道中所传输信号特征的不同,通信系统可分为通信系统和通信系统。
二、画图1、画出模拟通信系统的一般模型。
2、画出通信系统的一般模型。
三、计算题1、对于二电平数字信号,每秒传输300个码元,问此传码率R B等于多少?若该数字信号0和1出现是独立等概率的,那么传信率R b等于多少?2、现有一个由8个等概符号组成的信源消息符号集,各符号间相互独立,每个符号的宽度为0.1ms。
计算:(1)平均信息量;(2)码元速率和平均信息速率;(3)该信源工作2小时后所获得的信息量;(4)若把各符号编成二进制比特后再进行传输,在工作2小时后发现了27个差错比特(若每符号至多出错1位),求传输的误比特率和误符号率。
3、某消息源的符号集由32个等概的符号组成,每符号宽度为2ms,编为5位。
设该消息源以编组方式发送消息,每组30个符号,再间歇15ms,然后再发送下一组,试:(1)、求信息传输速率;(2)、若传输1小时后发现有72个符号出错。
若每符号至多出错1位,且间歇期无差错,求误信率和误码率。
第10讲 信源编码的性能指标
第10讲 信源编码的性能指标1. 无失真信源编码的冗余度压缩原理为了压缩冗余度,必须改造信源输出符号的统计特性。
一方面要尽量提高任一时刻输出符号的概率分布的均匀性,另一方面要尽量消除前后输出符号的统计相关性。
因此,无失真信源编码的实质是将信源尽可能地改造为均匀分布的无记忆信源。
这种信源的通信效率是最大的。
改造后的新信源是由原信源和编码器共同组成的,称为编码后的信源。
设f 是信源S 的一个编码,X 是编码后的信源,则三者之间的关系表示如下f S X −−→信源编码f 所用的码元可以与信源S 的符号不同,一般是某个信道的输入符号。
从数据处理这个角度来看,编码f 是一个数据处理器,输入信源S 的数据,输出信源X 的数据。
从通信的角度看,编码f 是一个信道,输入信源S 的数据,输出信源X 的数据。
无失真信源编码的目的是无损压缩,即用尽可能少的数据表示数据中的所有信息,不能破坏数据原有信息。
这相当于提高信息传输效率,使之接近于1。
因此,度量无失真编码的压缩性能可以看编码后信息传输效率,称为编码效率。
编码效率越接近于1,无损压缩性能越好。
下面介绍信源编码的5个性能指标,包括平均码长、码率、编码效率、编码冗余度和压缩率。
2. 平均码长平均码长是信源编码的一个关键的性能指标。
在已知信源熵的前提下,根据平均码长,可以计算出无损压缩编码的码率和编码效率。
定义2.1 设f 是一个N-分组码,各码字的码长分别记为,1i l i q ≤≤,对应的N 长分组的概率为i p ,则f 的平均码长定义为11(/ qi ii L p l N ==∑码元信源)注:在有的教材中,当平均码长的单位转化为“比特/信源”时,称为编码速率。
本课程用不到这个概念。
讨论:用平均码长估计编码后的数据长度设S 是一个离散无记忆信源,:f S C →是信源S 的一个编码,其平均码长为L 。
令12n s s s s =⋯是一个信源序列。
假设用f 对该数据进行编码,试估计编码后码元序列的长度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第10讲 信源编码的性能指标1. 无失真信源编码的冗余度压缩原理为了压缩冗余度,必须改造信源输出符号的统计特性。
一方面要尽量提高任一时刻输出符号的概率分布的均匀性,另一方面要尽量消除前后输出符号的统计相关性。
因此,无失真信源编码的实质是将信源尽可能地改造为均匀分布的无记忆信源。
这种信源的通信效率是最大的。
改造后的新信源是由原信源和编码器共同组成的,称为编码后的信源。
设f 是信源S 的一个编码,X 是编码后的信源,则三者之间的关系表示如下f S X −−→信源编码f 所用的码元可以与信源S 的符号不同,一般是某个信道的输入符号。
从数据处理这个角度来看,编码f 是一个数据处理器,输入信源S 的数据,输出信源X 的数据。
从通信的角度看,编码f 是一个信道,输入信源S 的数据,输出信源X 的数据。
无失真信源编码的目的是无损压缩,即用尽可能少的数据表示数据中的所有信息,不能破坏数据原有信息。
这相当于提高信息传输效率,使之接近于1。
因此,度量无失真编码的压缩性能可以看编码后信息传输效率,称为编码效率。
编码效率越接近于1,无损压缩性能越好。
下面介绍信源编码的5个性能指标,包括平均码长、码率、编码效率、编码冗余度和压缩率。
2. 平均码长平均码长是信源编码的一个关键的性能指标。
在已知信源熵的前提下,根据平均码长,可以计算出无损压缩编码的码率和编码效率。
定义2.1 设f 是一个N-分组码,各码字的码长分别记为,1i l i q ≤≤,对应的N 长分组的概率为i p ,则f 的平均码长定义为11(/ qi ii L p l N ==∑码元信源)注:在有的教材中,当平均码长的单位转化为“比特/信源”时,称为编码速率。
本课程用不到这个概念。
讨论:用平均码长估计编码后的数据长度设S 是一个离散无记忆信源,:f S C →是信源S 的一个编码,其平均码长为L 。
令12n s s s s =⋯是一个信源序列。
假设用f 对该数据进行编码,试估计编码后码元序列的长度。
对于信源数据12n s s s s =⋯,我们令L i 表示信源符号s i 所对应的码字f (s i )的长度,则编码后的数据长度为12+++n L L L 。
我们把L i 视为随机变量,则对于任何i ,我们有[]i E L L =。
因为S 是离散无记忆的,所以{L i }是独立同分布随机序列。
根据辛钦大数定理,我们有121+++)P n L L L L n −−→( 这表明,编码后的数据长度可以估计为nL ,并且n 越大,这个估计的越精确、可信。
我们把上述结论推广如下。
定理2.2 (无失真编码的数据长度定理)设S 是具有AEP 性质的信源,f 是S 的一个平均码长为L 的无失真N -分组码。
假设在编码f 下,某数据在编码前的长度为n 信源,在编码后的长度为m 码元,则()P m L n n−−→→∞ 意义:信源序列长度n 越大,编码后所得的码元序列的长度越有可能近似于 ()nL 码元。
3. 码率和编码效率定义3.1 码率(code rate ):编码后的信息传输率H ∞(X ),记为R ,单位是“比特/码元”。
下列定理给出了无失真编码的码率计算公式。
定理3.2 设S 是具有AEP 性质的信源,f 是信源S 的无失真编码。
若S 的熵率为H ∞,f 的平均码长为L ,则f 的码率为H R L∞= 证明:记编码后的信源为X 。
根据定义,X 的熵率为码率R 。
用S k , X k 分别表示信源S 和X 所产生的信源序列中的第k 个符号。
根据渐近等分性定理,121() (1)P n I S S S H n ∞−−→由于S 具有渐近等分割性,易知X 也具有渐近等分割性。
于是我们有121() (2)P m R I X X X m−−→ 其中12m X X X 为12n S S S 经编码后的码元序列,故有1212()()n m I S S S I X X X =. 根据依概率收敛的性质,由(1)和(2)得P H m n R ∞−−→码.再由前面的编码后数据长度定理,P m L n−−→. 于是我们得L R H ∞=码,即R H L∞=码。
证毕定义3.2 编码效率(code efficiency ):对于编码f 来说,编码后信源X 的信息传输效率称为f 的编码效率,记为f η。
因此,()()0f X H X H X ηη∞==码率和编码效率是信源编码的两个重要性能指标,其值越大,则编码的数据压缩能力越强。
注意,对于无失真信源编码来说,提高编码效率与数据压缩是一回事。
而对于限失真信源编码来说,除了通过提高编码效率来实现数据压缩之外,还通过量化方法缩小信源熵率,为后面的无失真压缩提高更大的压缩空间。
提问:(1)码率与编码效率的的最大值分别是多少?(2)试确定码率与编码效率的之间的数量关系。
答:(1)码率最大值=码元最大熵H 0(X ),从而最大编码效率= H 0(X ) /H 0(X )=1。
(2)编码效率=码率/码元最大熵。
定义3.3编码冗余度:度量信源编码与理想编码之间的差距,定义为编码冗余度=最大码率-码率编码相对冗余度=编码冗余度 / 最大码率=1-编码效率4. 压缩率根据第8讲的渐近等分割性定理,对于足够长的的数据,我们有如下近似关系:≈数据信息量数据长度信源熵率数据越长,该近似关系越准确和可信。
根据该近似关系,读者可以看出,在信息量不变的前提下,熵率越大,数据越短。
因此,提高熵率所带来的结果就是数据压缩。
压缩效果用压缩率来度量,定义为=编码后的数据长度压缩率编码前的数据长度(1)数据压缩率:对于一个数据x ,其以比特为单位的长度称为x 的比特数,记为l (x )。
x经过编码后的比特数记为L (x )。
x 的在此编码下的压缩率(也称压缩比)定义为()()()L x x l x ρ= (2)无失真信源编码压缩率:教材上都没有定义。
能否给出一个合理的定义?设f 是信源S 的无失真编码,s 是S 的一个信源序列,x 是在编码f 下所得的码元序列。
令s 的长度是n ,即nH 0(S )比特。
令x 的长度是m ,即mH 0(X )比特。
则s 在f 下的压缩率为()()00mH X nH S根据渐近等分割性,我们有()()P I s H S n ∞−−→和()()P I x H X m∞−−→ 由于编码是无失真的,故I (s )=I (x )。
因此,()()P H S m n H X ∞∞−−→ 0000()()()()()()P mH X H S H X nH S H X H S ∞∞−−→ 即00()()P S XmH X nH S ηη−−→ 其中S η是信源S 的信息传输效率, X η是编码后信源X 的信息传输效率,即编码效率。
这个收敛关系表明,当信源序列足够长时,其数据压缩率很有可能近似于信源效率比上编码效率。
因此,这个常数可以度量编码f 的压缩效果。
因此,我们定义无失真信源编码的压缩效率如下:无失真信源的压缩效率=信源效率/编码效率因此,编码效率越大,则压缩能力越强。
(3)信源的极限压缩率:数据是不可能被无限压缩下去的,总存在各自的极限。
我们讨论信源数据的压缩极限。
假设信源S 的熵率H ∞在某编码下被提高到了最大值H 0,则该编码的压缩性能达到理论允许的极限。
此时压缩率为00H I I H H H ∞∞≈=编码后的数据长度数据的信息量数据的信息量编码后的信息速率编码前的信息速率编码前的数据长度 因此,信源的相通信效率0H H ∞是信源数据的压缩率期望的极限。
我们把这个极限称为信源极限压缩率。
5.信源的最优无失真编码根据上面的计算公式,编码效率与平均码长是反比例关系。
这表明,缩短平均码长与提高编码效率是同一回事。
因此,对于无失真编码来说,数据压缩与提高编码效率是同一回事。
编码效率越接近于1,编码的压缩能力越强。
因此,在某信源的所有无失真编码中,我们把其中编码效率达到1的编码称为该信源的最优无失真编码。
这为无失真编码的设计工作指明了努力的目标。
一般来说,由于编码的离散性,这个目标是永远达不到的,但是可以无限地接近。
因此,一般来说,信源编码没有最好,但有更好。
(当编码效率=1时,编码后的信源是均匀分布的无记忆信源。
要做到这一点,信源编码必须消除原信源的记忆性,即前后输出符号之间的统计相关性,并且要让编码后的信源在任何时刻输出符号的概率分布是均匀的。
对于一般的信源来说,其任何编码都不可能完全做到这一点,绝对最优的信源编码是不存在的。
)如果把上述最优编码称为绝对最优编码的话,还有一种相对最优编码,其定义如下。
定义5.1在信源S的所有r-元N-分组无失真编码中,平均码长最小的称为S的最优r-元N-分组无失真编码。
注:(1)一个信源的r-元N-分组码是有限多的,所以其中一定存在最优码。
(2)比较两个不同元数的编码的平均码长时,其单位要化为相同的单位后才可以比较。
无失真信源编码理论的核心问题就是寻找最优无失真编码。
根据编码效率与平均码长的反比关系,要提高编码效率只需缩短平均码长即可,这是实现无失真编码的数据压缩功能的唯一途径。
下一讲我们将重点讨论这个问题。
这里我们先了解最优编码的两个简单性质。
命题5.2 最优编码是概率匹配编码,即信源符号的概率越小,对应的码字长越大。
证明设f是信源U的最优的1-分组编码。
令U的n个符号的分别为a i,对应的概率为p i,在某编码下,对应码字长为l i。
假设存在两个符号a i,a j,有p i >p j且l i > l j, 则p i l i + p j l j > p i l j+ p j l i 。
因此,对调a i与a j的码字后,可以得到平均码长更小的编码。
这与f的最优性矛盾。
证毕命题5.3最优编码充分用短字符串作为码字。
设f是某信源的最优编码,最大码字长为L,则任何长度小于L的串一定是f的某个码字的前缀。
证明留给读者。
证毕6.本讲要点小结1)平均码长的定义和物理意义。
2)平均码长的应用:(1)估计无失真编码的码元序列长度≈信源序列长度×平均码长这表明,无失真编码的平均码长越小,压缩能力越强。
(2)计算无失真编码的码率=信源熵/平均码长(3)计算无失真编码的效率=码率/码元最大熵=信源熵/(平均码长×码元最大熵)这表明,编码效率与平均码长是反比关系,从而无失真编码的数据压缩功能与提高信息传输率的功能是一致的。
3)无失真编码的绝对最优性和相对最优性:(1)绝对最优性:编码效率=1的无失真编码是该信源的绝对最优无失真编码。
一般不存在,是可以逼近的理想目标。
(2)相对最优性:在所有元数固定且分组长度也固定的无失真编码中,编码效率最大或者平均码长最小的码是相对最优无失真编码。