信息熵.doc

合集下载

有关信息熵

有关信息熵（摘自互动维客：,更多内容请访问互动维客！）一、信息熵)是指信源（物理系统）某一事件发生时所包含的信息量，物理系统自信息I(xi)是一个随机变量，它不内不同事件发生时，其信息量不同，所以自信息I(xi能用来作为整个系统的信息的量度。

山农定义自信息的数学期望为信息熵，即信源的平均信息量:信息熵表征了信源整体的统计特征，是总体的平均不确定性的量度。

对某一特定的信源，其信息熵只有一个，因统计特性不同，其熵也不同。

例如，两个信源，其概率空间分别为：则信息熵为：可见，H(Y)>H(X),说明信源Y比信源X的平均不确定性要大，即在事件发生之前，分析信源Y，由于事件y1 ,y2 是等概率的，难以猜测哪一个事件会发生；而信源X，虽然也存在不确定性，但大致可以知道,x1出现的可能性要大。

正如两场足球赛，其中一场，双方势均力敌；而另一场双方实力悬殊很大。

当然,人们希望看第一场，因为胜负难卜，一旦赛完，人们获得信息量大。

也可以这样理解，信息熵H(X)表征了变量X的随机性。

如上例，变量Y取y1和y2是等概率的，所以其随机性大；而变量X取x1比x2的概率要大的多，这时变量X的随机性就小。

因此，熵反映了变量的随机性，也是表征随机变量统计特性的一个特征参数。

二、信息熵的基本性质1、对称性当概率空间中P(x1),)P(x2)…序任意互换时，熵函数的值不变，例如下面两个信源空间:其信息熵H(X)=H(Y)。

该性质说明，熵只与随机变量的总体结构有关，与信源总体的统计特性有关，同时也说明所定义的熵有其局限性，它不能描述事件本身的主观意义。

2、确定性如果信源的输出只有一个状态是必然的,即P(x1)=1, P(x2)=P(x3)=… =0,则信源的熵:这个性质表明，信源的输出虽有不同形态，但其中一种是必然的，这意味着其他状态不可能出现。

那么，这个信源是一个确知信源，其熵为零。

3、非负性即H(X)>0。

因为随机变量X的所有取值的概率分布为0<P(xi)<1。

信息熵标准

信息熵标准全文共四篇示例，供读者参考第一篇示例：信息熵是信息论中的一个重要概念，它是用来衡量信息的不确定程度的指标。

在信息论中，信息熵是一个非常重要的概念，它可以用来衡量信息的多少和质量。

通过信息熵，我们可以了解信息的不确定性程度，也可以用来优化信息传输和存储的效率。

信息熵的概念最早由克劳德·香农在1948年提出，通过信息熵的计算，可以得到信息的平均信息量。

信息熵的计算公式如下：H(X) = -Σp(x)log2p(x)H(X)表示随机变量X的信息熵，p(x)表示随机变量X的取值为x的概率。

信息熵的大小与信息的不确定性成正比，当信息熵越大时，信息的不确定性也就越大。

反之，信息熵越小，信息的不确定性越小。

信息熵的单位是比特（bit），表示一个事件的信息量平均需要多少比特来表示。

信息熵的概念在信息论中有着广泛的应用，尤其在通信领域中，信息熵可以帮助我们设计更有效的编码和解码技术，提高信息传输的效率。

通过信息熵的计算，我们可以了解信息的分布规律，优化传输过程中的数据压缩和纠错机制，提高信息传输的可靠性和稳定性。

在实际应用中，信息熵也被广泛应用于数据加密和解密的领域。

通过信息熵的计算，我们可以评估加密算法的安全性，了解信息的随机性和不确定性，帮助我们设计更加安全可靠的加密算法，保护数据的安全和隐私。

信息熵是信息论中的一个重要概念，它在各个领域都有着广泛的应用，可以帮助我们理解信息的不确定性和复杂性，优化信息传输和存储的效率，保护数据的安全和隐私，提高机器学习和数据挖掘的算法性能。

信息熵的标准是一种用来衡量信息量和信息质量的标准，通过信息熵的计算，我们可以得到信息的平均信息量，了解信息的不确定性程度，帮助我们设计更加高效和可靠的信息系统。

【这是我认为信息熵标准的相关内容，希望对您有所帮助。

】第二篇示例：信息熵是信息论中的一个重要概念，它是用来衡量信息的不确定性或者信息量的大小。

在信息论中，信息熵是一个非常重要的指标，它可以用来描述一个信息源的不确定性的大小，也可以用来衡量信息传输中的效率。

2019信息熵(informationentropy)百科物理精品教育.doc

信息熵（informationentropy）百科物理
广泛的阅读有助于学生形成良好的道德品质和健全的人格，向往真、善、美，摈弃假、恶、丑;有助于沟通个人与外部世界的联系，使学生认识丰富多彩的世界，获取信息和知识，拓展视野。

快一起来阅读信息熵(informationentropy)百科物理吧~
信息熵（informationentropy）
信息熵(informationentropy)
是信息论中信息量的统计表述。

香农(Shannon)定义信息量为：`I=-Ksum_ip_ilnp_i`，表示信息所消除的不确定性(系统有序程度)的量度，K为待定常数，pi为事件出现的概率，$sump_i=1$。

对于N个等概率事件，pi=1/N，系统的信息量为I=-Klnpi=KlnN。

平衡态时系统热力学函数熵的最大值为$S=-ksum_iW_ilnW_i=klnOmega$，k为玻尔兹曼常数，Wi=1/为系统各状态的概率，$sum_iW_i=1$，为系统状态数，熵是无序程度的量度。

信息量I与熵S具有相同的统计意义。

设K为玻尔兹曼常数k，则信息量I可称信息熵，为
$H=-ksum_ip_ilnp_i$，信息给系统带来负熵。

如取K=1，对数底取2，熵的单位为比特(bit);取底为e，则称尼特。

信息熵是生命系统(作为非平衡系统)在形成有序结构耗散结构时，所接受的负熵的一部分。

由查字典物理网独家提供信息熵(informationentropy)百
科物理，希望给大家提供帮助。

信息熵的概念及其在信息论中的应用

信息熵的概念及其在信息论中的应用信息熵是信息论中的一个重要概念，用来衡量信息的不确定性和随机性。

在信息论的发展中，信息熵被广泛应用于数据压缩、密码学和通信领域等。

本文将详细介绍信息熵的概念和其在信息论中的应用。

一、信息熵的概念信息熵是由美国科学家克劳德·香农（Claude Shannon）在1948年提出的，它是用来衡量随机变量中所包含的信息量。

香农认为，一个事件的信息量和它的不确定性是成正比的。

如果一个事件是确定的，它所包含的信息量就很小；相反，如果一个事件是完全不确定的，那么它所包含的信息量就会很大。

信息熵的计算公式如下：H(X) = -ΣP(x)log(P(x))其中，H(X)代表随机变量X的信息熵，P(x)代表随机变量X取值为x的概率，log代表以2为底的对数运算。

信息熵的单位通常用比特（bit）来表示，表示一个系统所能提供的平均信息量。

比特值越大，代表信息的不确定性越高，信息量越大。

信息熵的概念与热力学中的熵有些相似，都是用来衡量混乱程度或者不确定性的指标。

而信息熵则更加关注于信息的有序性和随机性。

二、信息熵的应用1. 数据压缩信息熵在数据压缩中发挥着重要作用。

根据信息熵的原理，如果某段数据的信息熵较高，那么这段数据中存在较多的冗余信息。

通过将冗余信息删除或者使用更简洁的编码方式表示，可以实现对数据的压缩。

在实际应用中，常用的数据压缩算法如Huffman编码和Lempel-Ziv 编码等都是基于信息熵的原理设计的。

这些算法通过对数据进行分组和编码，去除数据中的冗余信息，从而实现高效的数据压缩。

2. 密码学信息熵在密码学中也有广泛的应用。

在设计密码算法时，我们希望生成的密钥具有高度的随机性和不可预测性，以保证密码的安全性。

信息熵可以被用来评估生成密钥的质量。

如果密钥的信息熵较高，说明密钥具有较高的随机性，对于攻击者来说更加难以猜测。

因此，在密码学中，信息熵可以作为评估密钥强度的一个重要指标。

信息熵

信息熵1 概念信息是个很抽象的概念。

人们常常说信息很多，或者信息较少，但却很难说清楚信息到底有多少。

比如一本五十万字的中文书到底有多少信息量。

直到1948年，香农提出了“信息熵”的概念，才解决了对信息的量化度量问题。

信息论之父克劳德·艾尔伍德·香农第一次用数学语言阐明了概率与信息冗余度的关系。

信息论之父 C. E. Shannon 在 1948 年发表的论文“通信的数学理论（ A Mathematical Theory of Communication ）”中， Shannon 指出，任何信息都存在冗余，冗余大小与信息中每个符号（数字、字母或单词）的出现概率或者说不确定性有关。

Shannon 借鉴了热力学的概念，把信息中排除了冗余后的平均信息量称为“信息熵”，并给出了计算信息熵的数学表达式。

信息熵单位是BIT 。

2 计算公式以英文为例看如何计算信息熵。

我们都知道英文使用26个字母，如果我们把字母在所传输信息中出现的频率看做是随机的，而且具有同样的概率。

那么要传输26个字母中的任何一个就至少需要4个多BIT 才够（4位最大是16个，5位最大是32个，26个字母介于两者之间）。

当然，每个字母在传输信息中出现的概率不可能一样，比如 A 是1/16： B 是1/13： …Z 是1/126：（它们的和是1），那么通过计算可以得出英文的信息熵是4.03（根据参考文章介绍的数据）。

2n = X ：其中 X 就是传输信息所需要的字符集的大小减去它的冗余度。

公式： ()()log2i H P Pi =-∑信息熵P i ：为每个字母在信息中出现的概率：计算公式并不复杂。

取以2为底的对数的道理也很简单，因为如果： 2n = X 的话，那么logX = n ：所以可以看出所谓信息熵就二进制的字符集在去掉冗余度后的二进制编码位数。

冗余度是通过统计每个字符出现概率获得的。

英文的信息熵是4.03，而计算机最初设计时的ASCII 码是8位的，留有足够的空间。

关于信息熵的研究

信息熵和最大信息熵原理2011-04-21 10:14:37| 分类：人工智能| 标签：信息熵概率分布随机 p1 分布|字号大中小订阅1、什么是信息熵？信息的基本作用就是消除人们对事物了解的不确定性。

美国信息论创始人香农发现任何信息都存在冗余，冗余的大小与信息的每一个符号出现的概率和理想的形态有关，多数粒子组合之后，在它似像非像的形态上押上有价值的数码，那一定是给一个博弈研究者长期迷惑的问题提供了一个负熵论据，这种单相思占优的形态以及信息熵的理解，在变换策略之后并能应用在博弈中。

那些多余的策略威胁剔除之后，变成可接受的不可置信的对抗者的状态，则是博弈熵，也是对抗生物熵结，这时的对抗概率是高的。

正因为大数定理，赌场才永不停息，只要有可能出现的一定会出现。

从大数定理的角度来看，这条法则千真万确，只是它需要一个条件：这件事重复的次数足够多。

如果将这个大数引入价值，就会出现大的麻烦，所以概率和个数有关，在时间和空间合成的历史中，该发生的事情都让它发生。

只有等到足够多的事件，才是真正的平等，而博弈的赌场游戏则是永不停息。

大数定理告诉人们，在大量的随机事件的重复中，会出现多次的均衡，也会出现必然的规律。

对一个混沌系统的杂乱现象，形态上的期望和试验上的观察，会发现不同的结果，也许这是自然界的奥秘，也是人类产生兴趣的根源。

信息熵- 正文信源的平均不定度。

在信息论中信源输出是随机量，因而其不定度可以用概率分布来度量。

记 H(X)＝H(P1，P2,…,Pn)＝P(xi)logP(xi),这里P(xi),i＝1,2，…,n为信源取第i个符号的概率。

P(xi)=1,H(X)称为信源的信息熵。

熵的概念来源于热力学。

在热力学中熵的定义是系统可能状态数的对数值，称为热熵。

它是用来表达分子状态杂乱程度的一个物理量。

热力学指出，对任何已知孤立的物理系统的演化，热熵只能增加，不能减少。

然而这里的信息熵则相反，它只能减少，不能增加。

信息熵条件熵

信息熵条件熵信息熵是信息论中的一个重要概念，它衡量了一个信息源所含信息的度量标准，使得我们能够对信息的不确定程度有一个准确的认识。

与此相伴随的，还有一个概念叫做条件熵，它在决策树算法等机器学习领域中有着广泛的应用。

信息熵是信息理论中的一个基础概念，指的是从一个信息源中获取到的信息所含的不确定性大小。

它的计算方式为：$H(X) = -\sum_{i=1}^{n}p_i\log_2{p_i}$，其中$p_i$表示每个可能的事件发生概率，n表示事件的总量。

这里的负号表示信息熵为非负数。

对于一组数据来说，信息熵的计算实际上可以理解为一个求和操作，对于每个不同的事件概率来说，我们都会计算它的信息熵大小，并将不同事件的信息熵值累加。

条件熵是指在某些已知前提条件下，对一个随机变量的熵的期望。

这个概念用数学公式表达为：$H(Y|X) = \sum_{i=1}^{n}P(X=x_i)H(Y|X=x_i)$。

其中，$H(Y|X)$表示在$X$已知的条件下，$Y$的不确定熵，$x_i$表示$X$的一个取值，$P(X=x_i)$表示$X$取值为$x_i$的概率。

我们可以理解为，条件熵是在已知某些观测数据的基础上，对事件分布进行重新制定，从而重新计算信息熵的过程。

可以看出，条件熵是对未知部分进行求和，通过消除已知部分的影响，进而推算出未知的大小。

综合来看，信息熵和条件熵在信息学、机器学习等领域都有着广泛的应用，特别是在分类算法中，条件熵是决策树算法的核心概念之一。

通过对条件熵的计算，我们可以对数据样本进行深层次的剖析，并推演出以下步骤：1. 将数据集按照某些属性进行划分，形成节点。

可以选择各种方法，比如ID3算法中使用信息熵最大的属性建立节点。

2. 针对当前节点的数据，统计各自类别的数量，计算信息熵。

3. 对所有可能的结点和各自的样本计算条件熵。

4. 选择条件熵最小的节点作为下一次划分标准。

5. 循环以上步骤，重复执行直到构建好整个决策树。

第5讲信息熵

1第5讲随机变量的信息熵在概率论和统计学中，随机变量表示随机试验结果的观测值。

随机变量的取值是不确定的,但是服从一定的概率分布。

因此，每个取值都有自己的信息量.平均每个取值的信息量称为该随机变量的信息熵。

信息熵这个名称是冯诺依曼向香农推荐的。

在物理学中，熵是物理系统的状态函数，用于度量一个物理系统内部状态和运动的无序性。

物理学中的熵也称为热熵.信息熵的表达式与热熵的表达式类似，可以视为热熵的推广。

香农用信息熵度量一个物理系统内部状态和运动的不确定性。

信息熵是信息论的核心和基础概念，具有多种物理意义。

香农所创立的信息论是从定义和研究信息熵开始的。

这一讲我们学习信息熵的定义和性质。

1. 信息熵我们这里考虑离散型随机变量的信息熵，连续型随机变量的信息熵以后有时间再讨论,读者也可以看课本上的定义,先简单地了解一下。

定义1。

1 设离散型随机变量X 的概率空间为1212......n n x x x X p p p P ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦我们把X 的所有取值的自信息的期望称为X 的平均自信息量，通常称为信息熵，简称熵（entropy ），记为H(X)，即11()[()]logni i iH X E I X p p ===∑ (比特)信息熵也称为香农熵。

注意，熵H (X )是X 的概率分布P 的函数，因此也记为H (P ).定义1。

2 信息熵表达式中的对数底可取任何大于等于2的整数r,所得结果称为r —进制熵，记为H r （X )，其单位为“r-进制单位”。

我们有()()log r X H H rX =2注意，在关于熵的表达式中,我们仍然约定0log 00 0log00x==，信息熵的物理意义：信息熵可从多种不同角度来理解.（1） H （X ）是随机变量X 的取值所能提供的平均信息量。

（2）统计学中用H （X ）表征随机变量X 的不确定性,也就是随机性的大小。

例如，假设有甲乙两只箱子,每个箱子里都存放着100个球.甲里面有红蓝色球各50个，乙里面红、蓝色的球分别为99个和1个。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一些信息熵的含义(1) 信息熵的定义：假设X是一个离散随即变量，即它的取值范围R={x1，x2...}是有限可数的。

设p i=P{X=x i}，X的熵定义为：(a)若(a)式中，对数的底为2，则熵表示为H2(x)，此时以2为基底的熵单位是bits，即位。

若某一项p i=0，则定义该项的p i logp i-1为0。

(2) 设R={0,1}，并定义P{X=0}=p，P{X=1}=1-p。

则此时的H(X)=-plogp-(1-p)log(1-p)。

该H(x)非常重要，称为熵函数。

熵函数的的曲线如下图表示：再者，定义对于任意的x∈R，I(x)=-logP{X =x}。

则H(X)就是I(x)的平均值。

此时的I(x)可视为x所提供的信息量。

I(x)的曲线如下：(3) H(X)的最大值。

若X在定义域R={x1,x2,...x r}，则0<=H(X)<=logr。

(4) 条件熵：定义推导：H(X|Y=y)= ∑p(x|y)log{1/p(x,y)}H(X|Y)=∑p(y)H(X|Y=y)= ∑p(y)*∑p(x|y)log{1/p(x/y)}H(X|Y)表示得到Y后，X的平均信息量，即平均不确定度。

(5) Fano不等式：设X和Y都是离散随机变量，都取值于集合{x1,x2,...x r}。

则H(X|Y)<=H(Pe)+Pe*log(r-1)其中Pe=P{X≠Y}。

Fano表示在已经知道Y后，仍然需要通过检测X才能获得的信息量。

检测X的一个方法是先确定X=Y。

若X=Y，就知道X；若X≠Y，那么还有r-1个可能。

(6) 互信息量：I(X;Y)=H(X)-H(X|Y)。

I(X;Y)可以理解成知道了Y后对于减少X的不确定性的贡献。

I(X;Y)的公式：I(X;Y)=∑(x,y)p(x,y)log{p(y|x)/p(y)}(7)联合熵定义为两个元素同时发生的不确定度。

联合熵H(X,Y)= ∑(x,y)p(x,y)logp(x,y)=H(X)+H(Y|X)(8)信道中互信息的含义互信息的定义得：I(X,Y)=H(X)-H(X|Y)= I(Y,X)=H(Y)-H(Y|X)若信道输入为H(X)，输出为H(Y)，则条件熵H(X|Y)可以看成由于信道上存在干扰和噪声而损失掉的平均信息量。

条件熵H(X|Y)又可以看成由于信道上的干扰和噪声的缘故，接收端获得Y后还剩余的对符号X的平均不确定度，故称为疑义度。

条件熵H(Y|X)可以看作唯一地确定信道噪声所需要的平均信息量，故称为噪声熵或者散布度。

(9)I(X,Y)的重要结论互信息互信息I(X,Y)只是输入信源X的概率分布P(x i)和信道转移概率P(y j|x i)的函数，可以证明当P(x i)一定时，I是关于P(y j|x i)的∪函数，存在极小值；当P(y j|x i)一定时，I是关于P(x i)的∩函数，存在极大值。

(10)联合熵、条件熵的关系图。

H(X)>=H(X|Y)，H(Y)>=H(Y|X)。

信息熵(Information Entropy)[编辑]什么是信息熵信息熵是一个数学上颇为抽象的概念，在这里不妨把信息熵理解成某种特定信息的出现概率（离散随机事件的出现概率）。

一个系统越是有序，信息熵就越低；反之，一个系统越是混乱，信息熵就越高。

信息熵也可以说是系统有序化程度的一个度量。

[编辑]信息熵的计算根据Charles H. Bennett对Maxwell's Demon的解释，对信息的销毁是一个不可逆过程，所以销毁信息是符合热力学第二定律的。

而产生信息，则是为系统引入负（热力学）熵的过程。

所以信息熵的符号与热力学熵应该是相反的。

一般而言，当一种信息出现概率更高的时候，表明它被传播得更广泛，或者说，被引用的程度更高。

我们可以认为，从信息传播的角度来看，信息熵可以表示信息的价值。

这样我们就有一个衡量信息价值高低的标准，可以做出关于知识流通问题的更多推论。

信源的平均不定度。

在信息论中信源输出是随机量，因而其不定度可以用概率分布来度量。

记H(X)＝H(P1，P2，…，Pn)＝P(xi)logP(xi)，这里P(xi)，i＝1，2，…，n为信源取第i个符号的概率。

P(xi)=1，H(X)称为信源的信息熵。

熵的概念来源于热力学。

在热力学中熵的定义是系统可能状态数的对数值，称为热熵。

它是用来表达分子状态杂乱程度的一个物理量。

热力学指出，对任何已知孤立的物理系统的演化，热熵只能增加，不能减少。

然而这里的信息熵则相反，它只能减少，不能增加。

所以热熵和信息熵互为负量。

且已证明，任何系统要获得信息必须要增加热熵来补偿，即两者在数量上是有联系的。

可以从数学上加以证明，只要H(X)满足下列三个条件：①连续性：H(P，1－P)是P的连续函数(0≤P≤1)；②对称性：H(P1，…，Pn)与P1，…，Pn的排列次序无关；③可加性：若Pn＝Q1+Q2＞0，且Q1，Q2≥0，则有H(P1，…，Pn-1，Q1，Q2)＝H(P1，…，Pn-1)+PnH；则一定有下列唯一表达形式：H(P1，…，Pn)＝-CP(xi)logP(xi)其中C为正整数，一般取C＝1，它是信息熵的最基本表达式。

信息熵的单位与公式中对数的底有关。

最常用的是以2为底，单位为比特(bit)；在理论推导中常采用以e为底，单位为奈特(Nat)；还可以采用其他的底和单位，并可进行互换。

信息熵除了上述三条基本性质外，还具有一系列重要性质，其中最主要的有：①非负性：H(P1，…，Pn)≥0；②确定性：H(1，0)＝H(0，1)＝H(0，1，0，…)＝0；③扩张性：Hn-1(P1，…，Pn-ε，ε)＝Hn(P1，…，Pn)；④极值性：P(xi)logP(xi)≤P(xi)logQ(xi)；这里Q(xi)＝1；⑤上凸性：H[λP +(1-λ)Q]＞λH(P)+(1-λ)H(Q)，式中0＜λ＜1。

信息熵信息是个很抽象的概念。

人们常常说信息很多，或者信息较少，但却很难说清楚信息到底有多少。

比如一本五十万字的中文书到底有多少信息量。

直到1948年，香农提出了“信息熵”的概念，才解决了对信息的量化度量问题。

信息论之父克劳德·艾尔伍德·香农第一次用数学语言阐明了概率与信息冗余度的关系。

目录1理论提出2信息含义1. 2.1 现代定义2. 2.2 最初定义3. 2.3 计算公式4. 2.4 《博弈圣经》1理论提出[1]信息论之父 C. E. Shannon 在1948 年发表的论文“通信的数学理论（ A Mathematical Theory of Communication ）”中，Shannon 指出，任何信息都存在冗余，冗余大小与信息中每个符号（数字、字母或单词）的出现概率或者说不确定性有关。

Shannon 借鉴了热力学的概念，把信息中排除了冗余后的平均信息量称为“信息熵”，并给出了计算信息熵的数学表达式。

2信息含义现代定义信息是物质、能量、信息及其属性的标示。

【逆维纳信息定义】信息是确定性的增加。

【逆香农信息定义】信息是事物现象及其属性标识的集合。

【2002年】最初定义信息理论的鼻祖之一Claude E. Shannon把信息（熵）定义为离散随机事件的出现概率。

所谓信息熵，是一个数学上颇为抽象的概念，在这里不妨把信息熵理解成某种特定信息的出现概率。

而信息熵和热力学熵是紧密相关的。

根据Charles H. Bennett对Maxwell's Demon的重新解释，对信息的销毁是一个不可逆过程，所以销毁信息是符合热力学第二定律的。

而产生信息，则是为系统引入负（热力学）熵的过程。

所以信息熵的符号与热力学熵应该是相反的。

一般而言，当一种信息出现概率更高的时候，表明它被传播得更广泛，或者说，被引用的程度更高。

我们可以认为，从信息传播的角度来看，信息熵可以表示信息的价值。

这样子我们就有一个衡量信息价值高低的标准，可以做出关于知识流通问题的更多推论。

计算公式H(x)=E[I(xi)]=E[ log(2,1/p(xi)) ]=-∑p(xi)log(2,p(xi)) (i=1,2,..n)《博弈圣经》信息熵：信息的基本作用就是消除人们对事物的不确定性。

多数粒子组合之后，在它似像非像的形态上押上有价值的数码，具体地说，这就是一个在博弈对局中现象信息的混乱。

香农指出，它的准确信息量应该是-(p1*log(2,p1) + p2 * log(2,p2) +．．．+p32 *log(2,p32))，信息熵其中，p1，p2 ，．．．，p32 分别是这32 个球队夺冠的概率。

香农把它称为“信息熵” (Entropy)，一般用符号H 表示，单位是比特。

有兴趣的读者可以推算一下当32 个球队夺冠概率相同时，对应的信息熵等于五比特。

有数学基础的读者还可以证明上面公式的值不可能大于五。

对于任意一个随机变量X（比如得冠军的球队），它的熵定义如下：变量的不确定性越大，熵也就越大，把它搞清楚所需要的信息量也就越大。

信息熵是信息论中用于度量信息量的一个概念。

一个系统越是有序，信息熵就越低；反之，一个系统越是混乱，信息熵就越高。

所以，信息熵也可以说是系统有序化程度的一个度量。

熵的概念源自热物理学.假定有两种气体a、b，当两种气体完全混合时，可以达到热物理学中的稳定状态，此时熵最高。

如果要实现反向过程，即将a、b完全分离，在封闭的系统中是没有可能的。

只有外部干预（信息），也即系统外部加入某种有序化的东西（能量），使得a、b分离。

这时，系统进入另一种稳定状态，此时，信息熵最低。

热物理学证明，在一个封闭的系统中，熵总是增大，直至最大。

若使系统的熵减少（使系统更加有序化），必须有外部能量的干预。

信息熵的计算是非常复杂的。

而具有多重前置条件的信息，更是几乎不能计算的。

所以在现实世界中信息的价值大多是不能被计算出来的。

但因为信息熵和热力学熵的紧密相关性，所以信息熵是可以在衰减的过程中被测定出来的。

因此信息的价值是通过信息的传递体现出来的。

在没有引入附加价值（负熵）的情况下，传播得越广、流传时间越长的信息越有价值。

熵首先是物理学里的名词.在传播中是指信息的不确定性,一则高信息度的信息熵是很低的,低信息度的熵则高。

具体说来，凡是导致随机事件集合的肯定性，组织性，法则性或有序性等增加或减少的活动过程，都可以用信息熵的改变量这个统一的标尺来度量。

∙ 1 简介o 1.1 熵的计算∙ 2 定义∙ 3 范例∙ 4 熵的特性∙ 5 和热力学熵的联系∙ 6 参见∙7 参考简介[编辑]熵的概念最早起源于物理学，用于度量一个热力学系统的无序程度。

在信息论里面，熵是对不确定性的测量。

但是在信息世界，熵越高，则能传输越多的信息，熵越低，则意味着传输的信息越少。