差错控制编码第2章 信息的统计度量

合集下载

信道编码差错控制编码课件

信道编码差错控制编码课件
其中任一码组在传输中若发现错误,则 将变成另一码组,由于是其中的一个码组, 这时传输错误在接收端就无法发现。
若将上述8种码组选择其中的4种作为许 用码组,例如选择
000 = 晴 011 = 云 101 = 阴 110 = 雨 用来传输信息,令其余4种作为禁用码组,即 001,010,100,111。
组码的结构如图5-3所示。
图5-3 分组码的结构
(4)码组重量
分组码的一个码组中“1”的数目,称为 码组重量,简称码重。
(5)码距
两个码组对应位上数字不同的位数称码 组的距离,简称码距,又称为汉明(Hamming) 距离。
例如001,010,100,111这4个码组之间, 任意两个码组的距离均为2。
5.3.2 汉明码
汉明码是1950年由美国贝尔实验室汉明 (也译为海明)提出的,是第一个用于纠正 一位错码的效率较高的线性分组码。
目前,汉明码及其变型在数字通信系统、 数据存储系统中应用广泛。
本节以汉明码为例,介绍汉明码的构造 原理以及线性分组码的一般原理。
由于S取值有两种,因此只能代表有错和
行监督码元 ↓
0101101100
1
0101010010
0
0011000011
0
1100011100
1
0011111111
0
0001001111
1
1110110000
1
列监督码元 0 0 1 1 1 0 0 0 0 1
0
5.2.3 群计数码
把信息码元中“1”的个数用二进制数字 表示,并作为监督码元放在信息码元的后面, 这样构成的码称为群计数码。
前者主要用于发生零星独立错误的信道, 如卫星信道容易出现随机性错误;而后者则 用于对付以突发错误为主的信道,如短波信 道或存储系统。

(高职精品)差错控制编码

(高职精品)差错控制编码

8.2 简单的差错控制编码 1.奇偶校验码
奇偶校验码分为奇校验码和偶校验码,其编码规则是先 将所要传输的数据码元(信息码)分组,在分组信息码元 后面附加1位监督位,使得该码组中信息码和监督码合在一 起“1”的个数为偶数(偶监督)或奇数(奇监督)。
表8-2 奇偶校验码 消息 信息位 监督位 消息 信息位 监督位
信息码元 1011000 1001101 0010011 0110110 1001100 监督码元 1 0 1 1 0 0 0
监督码元 1 0 1 0 1 1
信息码元 1011000 1101001 0110011 0110110 1001100 1011000
监督码元 1 0 1 0 1 1
(1)这种码比水平奇偶校验码有更强的检错能力。它能发 现某行或某列上奇数个错误和长度不大于方阵中行数(或 列数)的突发错误。 (2)这种码还有可能检测出一部分偶数个错误。当然,若 偶数个错误恰好分布在矩阵的4个顶点上时,这样的偶数 个错误是检测不出来的。 (3)这种码还可以纠正一些错误,例如,某行某列均不满 足监督关系而判定该行该列交叉位置的码元有错,从而纠 正这一位上的错误。
信息 编码方法 A 1位编码方法 2位编码方法 3位编码方法 0 00 000 B 1 11 111 无检、纠错能力 检错1位,不能纠错 检错2位,纠错1位 检、纠错能力
8.1.4 差错控制编码原理
1.差错控制编码的基本原理 编码效率
k nr R n n
其中,k为信息码元的数目 n为编码后码组的总数目(n=k+r,r为监督 码元的数目)。 R越大,编码效率越高,它是衡量编码性能的一个 重要参数。


00
01
0
1

差错控制编码II

差错控制编码II

Output equation:
ci.0 ai ci.1 ai ai 1 ci.2 ai ai 2 The input information blocks are kept by the registers, they are called register state.

Convolution operation
第8章 差错控制编码
The output and input of a convolutional coder follow a linear relationship, which is can be investigated by its impulse response.
k n

Example:
3,1,3
Convolutional code
第8章 差错控制编码
3,1,3 n 3, k 1, L 3
For each k 1 bit input, the coder output n 3 -bi t codeword. Coder structure
第8章 差错控制编码
The generator polynomial based on the impulse response can be defined. Example: (3,1,3) code. Its generator polynomial is defined as:
g g g
000 000 g 2,0 g 2,1 g 2,2 ...
.... ... .... ...
The Generator matrix is defined as:
g 0,0 g 0,1 g 0,2 000 G 000 ... g1,0 g1,1 g1,2 g 0,0 g 0,1 g 02 000 ... g 2,0 g 2,1 g 2,2 g1,0 g1,1 g1,2 g 0,0 g 0,1 g 02 ... 000 g 2,0 g 2,1 g 2,2 g1,0 g1,1 g1,2 ... 000 000 g 2,0 g 2,1 g 2,2 ... .... ... .... ...

差错控制编码的基本概念

差错控制编码的基本概念
这种在信息码元序列中加入监督码元的过程就称为差错 控制编码(或称纠错编码) 。 从差错控制角度来看,信道分为三类:
随机信道、突发信道、混合信道。 对不同类型的信道应该采用不同的差错控制技术。
1.2 纠错码的分类
(1)根据码的用途,可分为检错码和纠错码。检错码以检 错为目的,不一定能纠错;而纠错码以纠错为目的,一定能 检错。
(2)根据纠错码各码组信息元和监督元的函数关系,可分 为线性码和非线性码。如果函数关系是线性的,即满足一组 线性方程式,则称为线性码,否则为非线性码。
(3)按照信息码元和监督码元之间的约束方式不同,可 以将它分为分组码和卷积码。分组码的各码元仅与本码组的 信息元有关;卷积码中的码元不仅与本码组的信息元有关, 而且还与前面若干信息元有关。
特点:适合突发信道。
3 .恒比码
码字中 1 的数目与 0 的数目保持恒定比例的码称为恒比 码。接收端只要检测接收到的码组“1”的数目是否对,就可 以知道有无错误。 例:“5中取3”恒比码,有C53 =10种不同组合,表示10个阿 拉伯数字。如表 10.2 所示。 “7中取3”恒比码,有C73 =35种不同组合,表示26个英文字 母和其他符号。 而每个汉字又是以四位十进制数来代表的。。

器器 器器 介 器
调制信道
解 译 解信 调 码 密宿 器 器器
编码信道
由于数字信号传输过程中受到加性干扰和乘性干扰的影
响,会产生误码。由加性干扰引起的码间干扰,通常可以采 用信道均衡、匹配滤波器、升余弦系统特性、增加发射功率、 合理选择调制/解调方法等措施,减少误码。由于乘性干扰 影响,或采用了上述方法后,仍不能有效地抑制加性干扰的 影响时, 就要采用差错控制技术。
an1 an2 a1 a0 0

信道编码和差错控制编码

信道编码和差错控制编码

信道编码和差错控制编码信道编码和差错控制编码是通信领域中的重要概念,它们有密切的联系,但并非完全等同。

信道编码是一种广义的概念,而差错控制编码是信道编码的一种特殊形式。

信道编码是一种提高数字信号传输可靠性的有效方法。

它的主要目的是在发送端的信息码元序列中加入一定的冗余度,以增加信号的抗干扰能力。

在接收端,利用这些冗余信息来检测和纠正传输过程中可能出现的错误。

信道编码可以降低误码率,提高数字通信的可靠性。

差错控制编码是信道编码的一种特殊形式,主要目的是在发送端和接收端之间实现差错检测和纠正。

根据差错控制方式的不同,差错控制编码可以分为以下三种:1. 检错重发(ARQ):在发送端发送能够检测错误的码,接收端收到通过信道传来的码后,根据编码规则判断收到的码序列中有无错误。

若发现错误,则通过反向信道把这一判决结果反馈给发端。

发端根据这些判决信号,把接收端认为有错误的信息再次传送,直到接收端认为正确为止。

这种方式需要具备双向信道。

2. 前向纠错(FEC):发送端发送能够被纠错的码,接收端收到这些码后,通过纠错译码器不仅能自动发现错误,而且能够自动纠正接收码字传输中的错误。

这种方式不需要反向信道来传递重发指令,也不存在由于反复重发而带来的时延,实时性好。

纠错设备要比检错设备复杂,纠错能力越强,编译码设备就越复杂。

3. 混合纠错:信头差错校验法(HEC)是一种混合纠错方式,它结合了ARQ和FEC的优点。

在发送端,对信息码元添加一定的校验位;在接收端,首先利用校验位进行差错检测,若发现错误,则请求重发。

这种方式可以在一定程度上减少传输错误,提高通信质量。

总结一下,信道编码是一种广义的概念,包括差错控制编码在内。

差错控制编码是信道编码的一种特殊形式,主要目的是在发送端和接收端之间实现差错检测和纠正。

信道编码和差错控制编码都是为了提高通信系统的可靠性和抗干扰能力。

2差错控制编码

2差错控制编码

2.差错控制编码2.1. 引言什么是差错控制编码(纠错编码、信道编码)?为什么要引入差错控制编码?差错控制编码的3种方式?本章主要讲述:前向纠错编码(FEC)、常用的简单编码、线性分组码(汉明码、循环码)、简单介绍RS码*、BCH码*、FIRE码*、交织码,卷积码极其译码、TCM编码*。

一、什么是差错控制编码及为什么引入差错控制编码?在实际信道上传输数字信号时,由于信道传输特性不理想及加性噪声的影响,接收端所收到的数字信号不可避免地会发生错误。

为了在已知信噪比情况下达到一定的误比特率指标,首先应该合理设计基带信号,选择调制解调方式,采用时域、频域均衡,使误比特率尽可能降低。

但若误比特率仍不能满足要求,则必须采用信道编码(即差错控制编码),将误比特率进一步降低,以满足系统指标要求。

随着差错控制编码理论的完善和数字电路技术的发展,信道编码已经成功地应用于各种通信系统中,并且在计算机、磁记录与存储中也得到日益广泛的应用。

差错控制编码的基本思路:在发送端将被传输的信息附上一些监督码元,这些多余的码元与信息码元之间以某种确定的规则相互关联(约束)。

接收端按照既定的规则校验信息码元与监督码元之间的关系,一旦传输发生差错,则信息码元与监督码元的关系就受到破坏,从而接收端可以发现错误乃至纠正错误。

研究各种编码和译码方法是差错控制编码所要解决的问题。

二、差错控制的三种方式1、检错重发(ARQ)检错重发:在接收端根据编码规则进行检查,如果发现规则被破坏,则通过反向信道要求发送端重新发送,直到接收端检查无误为止。

ARQ系统具有各种不同的重发机制:如可以停发等候重发、协议的滑动窗口选择重发等。

ARQ系统需要反馈信道,效率较低,但是能达到很好的性能。

2、前向纠错前向纠错(FEC):发送端发送能纠正错误的编码,在接收端根据接收到的码和编码规则,能自动纠正传输中的错误。

不需要反馈信道,实时性好,但是随着纠错能力的提高,编译码设备复杂。

差错控制编码第2章 信息的统计度量

差错控制编码第2章  信息的统计度量

H(X)又可记作H(p1,p2,…,pn)
平均自信息量
含义
熵表示了集合中所有事件是否发生的平均不确 定性的大小。
熵表示了集合中事件发生,带给我们的平均信 息量的大小。
熵表示了确定集合中到底哪个事件发生时,所 需的平均信息量的大小。
熵表示了,如果用二进制数据将集合中的各个 元素表示出来,所需的二进制位的个数的平均 值。
自信息量的含义
自信息量表示了一个事件是否发生的不确 定性的大小。一旦该事件发生,就消除了 这种不确定性,带来了信息量.
自信息量表示了一个事件的发生带给我们 的信息量的大小。
自信息量表示了确定一个事件是否发生, 所需的信息量的大小。
自信息量表示了将事件的信息量表示出来, 所需的二进制位的个数。
2.1.2 条件自信息量
定义2-3 事件xi在事件yj给定的条件下的条件自 信息量定义为:
I (xi | y j ) log p(xi | y j ) 含义:知道事件yj之后,仍然保留的关于事件xi
的不确定性;或者,事件yj发生之后,事件xi再 发生,能够带来的信息量。
先验概率
p(x):x出现的概率 I(x):x的不确定性
p(x)
x:张三病了。 y:张三没来上课。
p(x | y) 1 p(x | y) p(x) p(x)

负: y的出现有助于否定x的出现 x:李四考了全班第一名。
I (x;
y)

log
p(x | y) p(x)

0
y:李四没有复习功课。 p(x | y) 1 p(x | y) p(x)
p(x)
无论正负,互信息量的绝对 回想自信息量I(x) 值越大,x和y的关系越密切。 I(x)≥0:x的出现或多或少总能

差错控制编码基础课件

差错控制编码基础课件

差错控制编码的重要性
在数据传输过程中,差错控制编 码可以有效地提高数据的可靠性

当数据传输距离较长或通信信道 质量较差时,差错控制编码可以
更好地保证数据的完整性。
通过纠正错误,差错控制编码可 以避免数据传输过程中的数据丢
失或损坏。
差错控制编码的分类
差错控制编码可以根据其实现原理分 为多种类型,例如奇偶校验码、海明 码、循环冗余校验码等。
提高存储设备性能
差错控制编码可以优化存储设备的 性能,从而提高存储和读取速度以 及降低错误率。
差错控制编码在其他领域中的应用
图像和音频处理
差错控制编码可以应用于图像和 音频处理领域,以保证图像和音
频数据的完整性和准确性。
网络安全
差错控制编码可以应用于网络安 全领域,通过纠正网络传输中的 错误,提高网络通信的安全性和
适用于不同通信协议
差错控制编码可以适用于各种通信协议,如TCP/IP、HTTP、FTP 等,为不同通信协议提供可靠的差错控制机制。
差错控制编码在数据存储中的应用
保证数据完整性
在数据存储中,差错控制编码能 够防止数据在存储和读取过程中 出现错误,确保数据的完整性和
一致性。
增强数据可靠性
差错控制编码可以通过增加冗余信 息来增强数据的可靠性,从而避免 数据损坏或丢失。
根据编码过程中是否需要发送额外的 校验码,差错控制编码可以分为简单 差错控制编码和复杂差错控制编码。
每种类型的差错控制编码都有其特定 的应用场景和优缺点。
简单差错控制编码只需要发送额外的 校验码,而复杂差错控制编码需要发 送更多的信息以便进行更复杂的错误 纠正。
02
线性分组码
线性分组码的定义
线性分组码的定义是指将消息符号序列按照一定的规律分成若干组,每组包含k 个信息符号,然后通过添加r个校验符号,使得整个码组长度为n=k+r,这样的 码组称为线性分组码。

《差错控制编码》课件

《差错控制编码》课件

01
传感器网络
利用差错控制编码提高传感器网络的数据传输可靠性。
02
无线通信
在物联网的无线通信中应用差错控制编码,确保数据传输的准确性。
差错控制编码的实现
硬件架构
介绍差错控制编码硬件实现的架构,包括编码器和解码器等主要组件。
硬件优化
探讨如何优化硬件架构,提高差错控制编码的效率。
硬件实现难点
分析差错控制编码硬件实现过程中可能遇到的难点和挑战。
介绍差错控制编码的常用算法,如奇偶校验码、汉明码等。
软件算法
详细描述差错控制编码软件实现的流程,包括数据输入、编码处理和数据输出等步骤。
图像传输中的差错控制编码概述:在图像传输过程中,由于图像数据量大、传输带宽有限等因素,容易发生传输错误。差错控制编码在图像传输中用于提高图像的传输质量和完整性。
差错控制编码的未来发展
算法优化
研究更高效的算法,提高编码和解码速度,降低计算复杂度。
03
数据存储
在物联网的数据存储中应用差错控制编码,增强数据存储的可靠性。
纠错能力
纠错能力是指纠错码能够纠正的错误比特数的最大值。不同的纠错码具有不同的纠错能力。
编码效率
编码效率是指数据比特数与校验比特数之比。编码效率越高,表示在传输同样多的数据时需要的额外比特数越少。
复杂度
复杂度是指实现纠错编码和解码所需的计算量和存储量。对于大规模集成芯片和实时系统,复杂度是一个重要的考虑因素。
软件实现流程
探讨如何优化软件算法,提高差错控制编码的准确性和效率。
软件优化
Байду номын сангаас
动态调整
探讨如何根据实际情况动态调整差错控制编码的参数,以适应不同的通信环境和数据传输需求。

差错控制编码 差错控制编码

差错控制编码 差错控制编码

差错控制编码差错控制编码
差错控制编码是一种用来检查和纠正数据传输可能出现的差错的编码技术。

它的核心思路是在传输的数据中植入一些冗余信息,以用来检查和纠正数据传输可能出现的错误。

差错控制编码有Cyclic Redundancy Check (CRC)环形冗余校验码,CRC环形冗余校验码是一种非常简单的差错控制编码,它采用多项式来进行数据传输时出现的错误监测;还有Hamming Code,它是一种常用的编码技术,通过添加一定数量的检验位来识别和纠正错误;还有纠错编码,它是一种可以检测和纠正传输的误码的编码方法,它的工作原理是利用比特错误以及二进制编码表示,以纠正和校验当前接收到的数据等等。

总的来说,差错控制编码可以有效地减少传输数据的出错率,保证传输数据的正确性,提高数据传输的稳定性,以及提升数据传输的安全性等。

差错控制编码教学课件

差错控制编码教学课件

循环冗余校验码(CRC)
总结词
广泛应用、可靠性高
详细描述
循环冗余校验码是一种广泛应用于数据传输和存储的差错控制编码方法。它通过将数据视为一段二进制数,计算 出一个冗余码附加在数据末尾,使得整个数据(包括冗余码)的模2除法结果为0。CRC能够检测出多位错误,具 有较高的可靠性。
海明 码
总结词
高效、可纠正多位错误
详细描述
海明码是一种高效的差错控制编码方法,能够纠正多位错误。它通过将数据分成多个分组,在每个分 组之间插入一些校验位,使得每个分组和校验位之间存在一定的关系。海明码能够检测和纠正多个错 误,但编码效率相对较低。
里德-所罗门码
总结词
纠错能力强、适用于通信和存储领域
VS
详细描述
里德-所罗门码是一种纠错能力较强的差 错控制编码方法,适用于通信和存储领域。 它通过将数据分成多个块,并使用多个校 验方程来检测和纠正多个错误。里德-所 罗门码具有较高的纠错能力和较低的错误 概率,但实现较为复杂。
联合信源信道编码
总结词
联合信源信道编码是一种新型的编码方式,它将信源编码和信道编码相结合,以提高通 信系统的整体性能。
详细描述
传统的信源信道编码通常分开进行,但在某些场景下,这种分离的方式可能无法充分利 用数据的信息。联合信源信道编码通过将信源编码和信道编码相结合,能够更好地利用
数据的信息,提高通信系统的性能。
差错控制编码教学课 件
• 差错控制编码概述 • 常见差错控制编码方法 • 差错控制编码原理
01
差错控制编码概述
差错控制编码的定义
差错控制编码是一种通过增加冗余信 息来检测和纠正数据传输过程中发生 的错误的编码方式。
它通过在数据中加入额外的信息,使 得接收方可以检测到数据是否发生错 误,并在必要时进行纠正。

差错控制编码摘要+结论

差错控制编码摘要+结论

摘要本文通过对数字通信的各种信道编码方式、差错控制的类型以及差错控制编码分类的总结和分析,并根据各种常用信道编码的比特差错率和码字差错率之间关系的差异,提出了差错控制编码对数字通信系统可靠性影响的定量计算结果,并用MATLAB仿真软件进行了分析和比较,又根据差错性能和信号带宽、信噪比、传输速率之间的关系,提出了评价干扰数字通信系统等级的一些方案,可以为进一步研究数字通信系统干扰效果的评估准则做一个理论基础。

另外,本文探讨了在MATLAB语言环境下差错控制系统仿真的设计和实现。

根据差错控制系统的理论基础结合SIMULINK软件包实现对控制系统的建模,并结合MATLAB 仿真达到差错控制的目的。

可以得到在不同频带利用率条件下的差错控制能力的定量结果,也可以得到在相同频带利用率条件下不同打孔(删除方案)图形的差错控制能力的定量结果。

关键词:差错控制编码;仿真;MATLAB;SIMULINK结论本文从缩短卷积码、缩短卷积码加交织、自适应均衡系统、迭代译码的级联卷积码在差错控制中所占的重要位置入手,研究了他们在MATLAB中的实现,通过讨论进一步加深了对差错控制的理解。

在其原理的基础之上,进行了系统的设计。

比如在具有检错重发和前向纠错的电路中,信源重要性信息与信道状态信息在信息传输过程中不断的地通知编码器(可变速率)和解码器,根据信源信息的重要性和解码检错的情况,被检测到的信道的状态信息,以及调整编码速率的指令,在可变速率编码器、解码器之间传达,以实现最少的差错发生。

本文在研究了差错控制的设计理论之后讨论了其在MATLAB中的实现,并结合了SIMULINK软件包,达到了差错控制的目的。

构建一个具有卷积、解卷积和打孔、插零功能以及相应的传输环境的仿真系统,就可以对各类卷积码进行缩短卷积码的仿真研究,并且可以得到在不同频带利用率条件下的差错控制能力的定量结果,也可以得到在相同频带利用率条件下不同打孔(删除方案)图形的差错控制能力的定量结果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
j i i j
H(X ) H(X |Y)
关于平均互信息I(X;Y)
互信息 I(x ; y) 代表收到某消息y后获得关于某 事件x的信息量。它可取正值,也可取负值。 I(X;Y)是I (x ; y)的统计平均,所以I(X;Y) >= 0。 若I(X;Y) = 0,表示在信道输出端接收到输出符 号Y后不获得任何关于输入符号X的信息量----全 损信道。
n

熵的意义(对通信系统)
H(X):表示信源中每个符号的平均信息量(信源熵)。
H(Y):表示信宿中每个符号的平均信息量(信宿熵)。
H(X|Y):表示在输出端接收到Y的全部符号后,发送端X
尚存的平均不确定性。这个对X尚存的不确定性是由于干扰 引起的。信道疑义度(损失熵,含糊度)
H(Y|X):表示在已知X的全部符号后,对于输出Y尚存的

熵的单位同自信息量的单位
熵的例子
串口通信 某串口的概率空间为

0 X P 1 2 1 1 2

则熵为
1 1 1 1 H ( X ) p ( xi ) log p ( xi ) log log 1 2 2 2 2 i 1
互信息量的性质2 互信息量可为0

概率乘法公式 p ( x, y ) p ( y ) p ( x | y ) 全概率公式
p( x) p( x, yi ) p( yi ) p( x | yi )
i 1 i 1 n n
当事件x、y统计独立时,互信息量为0 p(x|y)=p(x) 无论是否知道y,都对x出现的概率没有影响 x和y没有什么关系

证明:
p( x | y ) p ( x) I ( x; y ) log log log1 0 p ( x) p ( x)


含义:当两个事件相互独立时,一个事件不能提供另一个 事件的任何信息。 即一个事件发生之后,对于确定另一个事件是否发生没有 任何帮助。
互信息量的性质3 互信息量可正可负
信息论与编码理论 第2章 信息的统计度量
主要内容 从概率的角度研究问题
自信息量 互信息量 平均自信息量 平均互信息量

信息的大小
多个信息之间 关联的密切程度
2.1 自信息和条件自信息

2.1.1 自信息量
事件发生的概率越大,它发生后提供的信息量
越小。
张三今天吃饭了 事件发生的概率越小,一旦该事件发生,它提 供的信息量就越大。 美国总统的专机发生空难

举例
张三今天没来上课 张三有可能病了

为什么没来上课就会猜到生病了? 因为二者有关系 互信息衡量的就是这种关系的大小
2.2.1 互信息量
定义2-4 随机事件yj的出现给出关于事件xi 的信息量,定义为互信息量。 定义式:

I ( xi ; y j ) log

p( xi | y j ) p( xi )

2.1.2 条件自信息量
定义2-3 事件xi在事件yj给定的条件下的条件自 信息量定义为: I ( xi | y j ) log p( xi | y j ) 含义:知道事件yj之后,仍然保留的关于事件xi 的不确定性;或者,事件yj发生之后,事件xi再 发生,能够带来的信息量。

先验概率
证明:
p( x | y ) I ( x; y ) log p ( x)
p( xy ) p ( y | x) p ( x) log I ( y; x) p( y ) p( y )
p( x | y ) p( y ) log log p ( x) p ( y )

含义:由y所提供的关于x的信息量等于由x 所提供的关于y的信息量

证明
p( x | y ) 1 I ( x; y ) log log I ( x) p( x) p( x)
同理:I(x;y) = I(y;x) ≤ I(y) 互信息量=原有的不确定性-尚存在的不确定 性

2.3 离散集的平均自信息量(熵)





离散集X={x1, x2, …, xn} x2 xn 离散集的概率分布表示为 X x1 P p( x ) p ( x ) p ( x ) 1 2 n 离散集中的每一个事件 I ( x1 ) I ( x2 ) I ( xn ) 都有自己的自信息量 所有这些自信息量的均值,就是离散集的平均自 信息量 定义2-5 集X上,随机变量I(xi)的数学期望定义为 平均自信息量。 n H ( X ) E ( I ( xi )) E[ log p( xi )] p( xi ) log p( xi ) 又称作集X的信息熵,简称熵。 H(X)又可记作H(p1,p2,…,pn)

概率:

前面已求出自信息量和条件自信息量为:
I ( x) 13.2877
而x和y的互信息量为:
I ( x | y) 6.6439
p( x | y ) 1% I ( x; y ) log log log100 6.6439 p ( x) 0.01% I ( x) I ( x | y )

这表明该事件的不确 定性很小。


联合自信息量

定义2-2 二维联合集XY上的元素(xiyj) 的联 合自信息量定义为
I ( xi y j ) log p( xi y j )
联合自信息量衡量的是多个事件同时出现 的不确定性; 或者,两个事件同时发生带给我们的信息 量的大小; 或者,将该信息量表示出来,所需的二进 制位的个数。

含义:本身的不确定性,减去知道了事 件y之后仍然保留的不确定性,即由y所 提供的关于x的信息量,或者说由y所消 除的x的不确定性。
I ( x; y) I ( x) I ( x | y)
互信息量=原有的不确定性-尚存在的不确定性
互信息量的例子

事件:

x=“美国总统的专机发生空难” y=“今天是9.11” p(x)= 0.01% p(x|y)=1%
单位:同自信息量
对数的几个性质:
互信息量的含义
p( x | y ) I ( x; y ) log 还可表示为: p ( x)
1 log a log a a log log a log b b log ab log a log b
log p( x | y) log p( x) log p( x) log p( x | y) I ( x) I ( x | y)
I ( X ; Y ) p( xi y j )I ( xi ; y j ) p( xi y j ) log
j i j i j i j i
p( xi | y j ) p( xi )
p( xi y j ) log p( xi | y j ) p( xi y j ) log p( xi ) p( xi y j ) log p( xi | y j ) log p( xi ) p( xi y j )

p(x1)
p(x2)

p(xn)
1
互信息量的性质1 互信息量的互易性

概率乘法公式 p ( x, y ) p ( y ) p ( x | y ) 全概率公式
p( x) p( x, yi ) p( yi ) p( x | yi )
i 1 i 1 n n
I(x;y) = I(y;x)
x:李四考了全班第一名。 p( x | y ) y:李四没有复习功课。 1 p( x | y ) p( x)
p( x)

无论正负,互信息量的绝 对值越大,x和y的关系越密 切。
回想自信息量I(x) I(x)≥0:x的出现或多或少总能 带来一些信息
互信息量的性质4 互信息量不大于其中任一事件的自信息量
i 1


平均自信息量

含义
熵表示了集合中所有事件是否发生的平均不确
定性的大小。 熵表示了集合中事件发生,带给我们的平均信 息量的大小。 熵表示了确定集合中到底哪个事件发生时,所 需的平均信息量的大小。 熵表示了,如果用二进制数据将集合中的各个 元素表示出来,所需的二进制位的个数的平均 值。
即:互信息量表示先验的不确定性减去尚存的不确定性, 这就是收信者获得的信息量 对于无干扰信道,I(xi ; yj) = I(xi); 对于全损信道,I(xi ; yj) = 0;
平均互信息I(X; Y): I(xi ; yj)的统计平均。
它代表接收到符号集Y后平均每个符号获得的
关于X的信息量,也表示了输入与输出两个随 机变量之间的统计约束程度。
自信息量的例子

假设“张三今天吃饭 了”这个事件发生的 概率是99.99%,则该 事件的自信息量为:
log(0.9999) 0.00014428

假设“美国总统的专 机发生空难”这个事 件发生的概率是0.01%, 则该事件的自信息量 为: log(0.0001) 13.2877 这表明该事件的不确 定性很大。

事件x的自信息量为: I ( x) log p( x) log 0.01% 13.2877 事件x在事件y发生的情况下的条件自信息量为: I ( x | y) log p( x | y) log1% 6.6439
2.2 互信息量
象形字,本意:绞绳用的工具,又象握手 互相,两者或者多者相互作用 两个或者多个事件之间关联的密切程度
2.1.1 自信息


定义2-1 任意随机事件 的自信息量定义为该事 件发生概率的对数的负 值。 假设事件xi发生的概率为 p(xi),则其自信息定义 式为
相关文档
最新文档