海明码
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.海明码的概念
海明码是一种可以纠正一位差错的编码。
它是利用在信息位为k位,增加r位冗余位,构成一个
n=k+r位的码字,然后用r个监督关系式产生的r个校正因子来区分无错和在码字中的n个不同位置的一位错。
它必需满足以下关系式:
2^r>=n+1 或2^r>=k+r+1
海明码的编码效率为:
R=k/(k+r)
式中k为信息位位数
r为增加冗余位位数[font class="Apple-style-span" style="font-weight: bold;"
id="bks_cu2htj1g"]2.[/font][font class="Apple-style-span" style="font-family: ����; font-size: 12px; line-height: normal; " id="bks_4dxtg15k"][font]海明码的原理[/font]
在数据中间加入几个校验码,将玛距均匀拉大,将数据的每个二进制位分配在几个奇偶校验组里,当某一位出错,会引起几个校验位的值发生变化。
海明不等式:
校验码个数为K,2的K次幂个信息,1个信息用来指出“没有错误”,其余2K-1个指出错误发生在那一位,但也可能是校验位错误,故有N<=2的K次-1-K能被校验。
海明码的编码规则:
1.每个校验位Ri被分配在海明码的第2的i次的位置上,
2.海明玛的每一位(Hi)是由多个/1个校验值进行校验的,被校验玛的
位置玛是所有校验这位的校验位位置玛之和。
一个例题:
4个数据位d0,d1,d2,d3, 3个校验位r0,r1,r2,对应的位置为:
d3 d2 d1 r2 d0 r1 r0 ======b7 b6 b5 b4 b3 b2 b1
校验位的取值,就是他所能校验的数据位的异或
b1为b3,b5,b7的异或,b2为b3,b6,b7 b4为b5,b6,b7 [/font]
[font class="Apple-style-span" style="font-family: ����; font-size: 12px; line-height: normal; " id="bks_4dxtg15k"]
海明玛传送到接受方后,将上三式的右边(b1,b2,b4)的逻辑表达式分别
异或上左边的值就得到了校验方程,如果上题采用偶校验
G1=b1 b3 b5 b7的异或
G2=b2 b3 b6 b7的异或
G3=b4 b5 b6 b7的异或
若G1G2G3为001是第四位错
若为011是第六位错[/font]
[font class="Apple-style-span" style="font-family: ����; font-size: 12px; line-height: normal;"] [/font]
3.海明码的生成与接收
特注:以下的+均代表异或
方法一:
1)海明码的生成。
例1.已知:信息码为:"0010"。
海明码的监督关系式为:
S2=a2+a4+a5+a6
S1=a1+a3+a5+a6
S0=a0+a3+a4+a6
求:海明码码字。
解:1)由监督关系式知冗余码为a2a1a0。
2)冗余码与信息码合成的海明码是:"0010a2a1a0"。
设S2=S1=S0=0,由监督关系式得:
异或运算:
a2=a4+a5+a6=1
a1=a3+a5+a6=0
a0=a3+a4+a6=1
因此,海明码码字为:"0010101"
2)海明码的接收。
例2.已知:海明码的监督关系式为:
S2=a2+a4+a5+a6
S1=a1+a3+a5+a6
S0=a0+a3+a4+a6
接收码字为:"0011101"(n=7)
求:发送端的信息码。
解:1)由海明码的监督关系式计算得S2S1S0=011。
2)由监督关系式可构造出下面错码位置关系表:
S2S1S0
000
001
010
100
011
101
110
111
错码位置
无错
a0
a1
a2
a3
a4
a5
a6
3)由S2S1S0=011查表得知错码位置是a3。
4)纠错--对码字的a3位取反得正确码字:"0 0 1 0 1 0 1"
5)把冗余码a2a1a0删除得发送端的信息码:"0010"
方法二:(不用查表,方便编程)
1)海明码的生成(顺序生成法)。
例3.已知:信息码为:" 1 1 0 0 1 1 0 0 " (k=8)
求:海明码码字。
解:1)把冗余码A、B、C、…,顺序插入信息码中,得海明码
码字:" A B 1 C 1 0 0 D 1 1 0 0 "
码位: 1 2 3 4 5 6 7 8 9 10 11 12
其中A,B,C,D分别插于2的k次方位(k=0,1,2,3)。
码位分别为1,2,4,8。
2)冗余码A,B,C,D的线性码位是:(相当于监督关系式)
A->1,3,5,7,9,11;
B->2,3,6,7,10,11;
C->4,5,6,7,12;(注5=4+1;6=4+2;7=4+2+1;12=8+4)
D->8,9,10,11,12。
3)把线性码位的值的偶校验作为冗余码的值(设冗余码初值为0):
A=∑(0,1,1,0,1,0)=1
B=∑(0,1,0,0,1,0)=0
C=∑(0,1,0,0,0) =1
D=∑(0,1,1,0,0) =0
4)海明码为:"1 0 1 1 1 0 0 0 1 1 0 0"
2)海明码的接收。
例4.已知:接收的码字为:"1 0 0 1 1 0 0 0 1 1 0 0"(k=8)
求:发送端的信息码。
解:1)设错误累加器(err)初值=0
2)求出冗余码的偶校验和,并按码位累加到err中:
A=∑(1,0,1,0,1,0)=1 err=err+20=1
B=∑(0,0,0,0,1,0)=1 err=err+21=3
C=∑(1,1,0,0,0) =0 err=err+0 =3
D=∑(0,1,1,0,0) =0 err=err+0 =3
由err≠0可知接收码字有错,
3)码字的错误位置就是错误累加器(err)的值3。
4)纠错--对码字的第3位值取反得正确码字:
"1 0 1 1 1 0 0 0 1 1 0 0"
5)把位于2的k次方位的冗余码删除得信息码:"1 1 0 0 1 1 0 0"
$2.5.4海明码
海明码是由R.HmIMI1ing在1950年首次提出的,它是一种可以纠正一位差错的编码。
可以借用简单奇偶校验码的生成原理来说明海明码的构造方法。
若k(=n-1)位信息位a n-1a n-2…a1加上一位偶校验位a0,构成一个n位的码字a n-1a n-2...a1a0,则在接收端校验时,可按关系式
S=a n-1+a n-2+…+a1+a0
来计算。
若求得S=0,则表示元错;若S=1,则有错。
上式可称为监督关系式,S称为校.正因子。
.在奇偶校验情况下,只有一个监督关系式和一个校正因子,其取值只有0或1两种情.况,分别代表元错和有错两种结果,还不能指出差错所在的位置。
不难设想,若增加冗余位,也即相应地增加了监督关系式和校正因子,就能区分更多的情况。
如果有两个校正因子.
S1和S0,则S1S0取值就有00、01、10或11四种可能的组合,也即能区分四种不同的情况。
若其中一种取值用于表示无错(如00),则另外三种(01、10及11)便可以用来指出.不同情况的差错,从而可以进一步区分出是哪一位错。
设信息位为k位,增加r位冗余位,构成一个n=k+r位的码字。
若希望用r个监督关系式产生的r个校正因子来区分元错和在码字中的n个不同位置的一位错,则要求满足以下关系式:
2r>=n+1 或2r>=k+r+1
以k=4为例来说明,则要满足上述不等式,必须r>=3。
假设取r=3,则n=k+r=7,即在4位信息位a6a5a4a3后面加上3位冗余位a2a1a0,构成7位码字a6a5a4a3a2a1a0,其中a2、a1和a0分别由4位信息位中某几位半加得到,在校验时,a2、a1和a0就分别和这些位半.加构成三个不同的监督关系式。
在无错时,这三个关系式的值S2、S1和S0全为"0"。
若a2错,则S2=1,而S1=S0=0;若a1错,则S1=1,而S2=S0=0;若a0错,则s0=1,而S2=S1=0。
S2、S1和S0这三个校正因子的其它4种编码值可用来区分a3、a4、a5、a6中的一位错,其对应关系如表2.1。
当然,也可以规定成另外的对应关系,这并不影响讨论的一般性。
表2.1 S2 S1 S0 值与错码位置的对应关系
S2 S1 S0 000 001010100 011 101 110 111
错码位置无错a0 a1 a2 a3 a4 a5 a6
由表可见,a2、a4、a5或a6的一位错都应使S2=1,由此可以得到监督关系式..
S2=a2+a4+a5+a6....
同理可得:S1=a1+a3+a5+a6..
S0=a0+a3+a4+a6
在发送端编码时,信息位a6、a5、a4和句的值取决于输入信号,它们在具体的应用中有l确定的值。
冗余位电、a1和a o的值应根据信息位的取值按监督关系式来确定,使上述三式l中的S2、S1和S0取值为零,即
a2+a4+a5+a6=0
a1+a3+a5+a6=0
a0+a3+a4+a6=0
由此可求得:
a2=a4+a5+a6
a1=a3+a5+a6
a0=a3+a4+a6
已知信息位后,按上述三式即可算出各冗余位。
对于本例来说,各种信息位算出的冗余位如表2.2所示。
表2.2 由信息位算得海明码冗余位
信息位冗余位信息位冗余位
a6a5a4a3a2a1a0a6a5a4a3a2a1a0
00000001000111
00010111001100
00101011010010
00111101011001
01001101100001
01011011101010
01100111110100
0111000 1111111
在接收端收到每个码字后,按监督关系式算出S2、S1和S0,若它们全为"0",则认为无错;若不全为"0",在一位错的情况下,可查表2.1来判定是哪一位错,从而纠正之。
例如码字0010101传输中发生一位错,在接收端收到的为0011101,代入监督关系式可算得S2=0、S1=1和S0=1,由表2.1可查得S2S1S0=011对应于a3错,因而可将0011101纠正为00101010。
上述海明码的编码效率为4/7。
若K=7,按2r>=k+r+1可算得r至少为4,此时编码.效率为7/11。
可见,信息位位数越多时编码效率就越高
海明码校验
海明码是一种多重(复式)奇偶检错系统。
它将信息用逻辑形式编码,以便能够检错和纠错。
用在海明码中的全部传输码字是由原来的信息和附加的奇偶校验位组成的。
每一个这种奇偶位被编在传输码字的特定位置上。
实现得合适时,这个系统对于错误的数位无论是原有信息位中的,还是附加校验位中的都能把它分离出来。
推导并使用长度为m位的码字的海明码,所需步骤如下:
1、确定最小的校验位数k,将它们记成D1、D
2、…、Dk,每个校验位符合不同的奇偶测试规定。
2、原有信息和k个校验位一起编成长为m+k位的新码字。
选择k校验位(0或1)以满足必要的奇偶条件。
3、对所接收的信息作所需的k个奇偶检查。
4、如果所有的奇偶检查结果均为正确的,则认为信息无错误。
如果发现有一个或多个错了,则错误的位由这些检查的结果来唯一地确定。
校验位数的位数
推求海明码时的一项基本考虑是确定所需最少的校验位数k。
考虑长度为m位的信息,若附加了k个校验位,则所发送的总长度为m+k。
在接收器中要进行k个奇偶检查,每个检查结果或是真或是伪。
这个奇偶检查的结果可以表示成一个k位的二进字,它可以确定最多2k种不同状态。
这些状态中必有一个其所有奇偶测试试都是真的,它便是判定信息正确的条件。
于是剩下的(2k-1)种状态,可以用来判定误码的位置。
于是导出下一关系:
2k-1≥m+k
码字格式
从理论上讲,校验位可放在任何位置,但习惯上校验位被安排在1、2、4、8、…的位置上。
图5列出了m=4,k=3时,信息位和校验位的分布情况。
图5 海明码中校验位和信息位的定位
校验位的确定
k个校验位是通过对m+k位复合码字进行奇偶校验而确定的。
其中:P1位负责校验海明码的第1、3、5、7、…(P1、D1、D2、D4、…)位,(包括P1自己)
P2负责校验海明码的第2、3、6、7、…(P2、D1、D3、D4、…)位,(包括P2自己)
P3负责校验海明码的第4、5、6、7、…(P3、D2、D3、D4、…)位,(包括P3自己)
对m=4,k=3,偶校验的例子,只要进行式次偶性测试。
这些测试(以A、B、C表示)在图6所示各位的位置上进行。
图6 奇偶校验位置
因此可得到三个校验方程及确定校验位的三个公式:
A=B1⊕B3⊕B5⊕B7=0 得P1=D1⊕D2⊕D4
B=B2⊕B3⊕B6⊕B7=0 得P2=D1⊕D3⊕D4
C=B4⊕B5⊕B6⊕B7=0 得P3=D2⊕D3⊕D4
若四位信息码为1001,利用这三个公式可求得三个校验位P1、P2、P3值。
和海明码,如图7则表示了信息码为1001时的海明码编码的全部情况。
而图8中则列出了全部16种信息(D1D2D3D4=0000~1111)的海明码。
图7 四位信息码的海明编码
图8 未编码信息的海明码
上面是发送方的处理
在接收方,也可根据这三个校验方程对接收到的信息进行同样的奇偶测试:
A=B1⊕B3⊕B5⊕B7=0;
B=B2⊕B3⊕B6⊕B7=0;
C=B4⊕B5⊕B5⊕B7=0。
若三个校验方程都成立,即方程式右边都等于0,则说明没有错。
若不成立即方程式右边不等于0,说明有错。
从三个方程式右边的值,可以判断那一位出错。
例如,如果第3位数字反了,则C=0(此方程没有B3),A=B=1(这两个方程有B3)。
可构成二进数CBA,以A为最低有效位,则错误位置就可简单地用二进数CBA=011指出。
同样,若三个方程式右边的值为001,说明第1位出错。
若三个方程式右边的值为100,说明第4位出错。
海明码的码距应该是3,所以能纠正1位出错。
而奇偶校验码的码距才是2,只能发现1位出错,但不能纠正(不知道那一位错)。
无校验的码距是1,它出任何一位出错后还是合法代码,所以也就无法发现出错。
这是关于海明码的经典说法,即码距为3,可以发现2位,或者纠正1位错。
应满足2k-1≥m+k。
但在清华的王爱英主编的《计算机组成与结构》(该书已成为国内的权威)中还提出了一种码距为4的海明码,可以发现2位,并且纠正1位错。
应满足2(k-1)≥m+k。
海明码是在信息字段中插若干位数据,用于监督码字里的哪一位数据发生了变化。
假设信息位有k位,需要多少位监督数据才能监督并改正一位错误?假设需要r位监督数据的话,整个码字的长度就是k+r;每一位的数据只两种状态,不是1就是0,有r
位数据就应该能表示出2r种状态,如果每一种状态代表一个码元发生了错误,有k+r位码元,就要有k+r种状态来表示,另外还要有一种状态来表示数据正确的情况,所以2r要大于等于k+r+1才能监督一位错误,即2r >=k+r+1。
例如,信息数据有4位,由2r >=k+r+1得,r>=3,也就是至少需要3位监督数据才能发现并改正1位错误。
海明校验码:
构造出海明码的方式有很多,因为监督关系是自定义的。
以(7,4)海明码为例(说明:4个数据位, 3个监督位,因为要满足式子2r >=k+r+1,所以r>=3),来推导下它的构造过程。
因为有三个监督位(具体位置不确定),必然有三个监督式,假设三个监督式分别是S1、S2、S3,用S3S2S1来指示一位数据出错了,例如,我可以指定,若S3S2S1=1就表示第1位数据出错了,S3S2S1=3,就表示第3位数据出错了,……
假设最终生成的海明码是A7A6A5A4A3A2A1,我自己规定,若S3S2S1=0,表示数据传输没有出错,S3S2S1=1,表示A1出错;
S3S2S1=2,表示A2出错;S3S2S1=3,表示A3出错;S3S2S1=4,表示A4出错;S3S2S1=5,表示A5出错;S3S2S1=6,表示A6出错;S3S2S1=7,表示A7出错。
那么就是这样一张纠错表:
从上表可以看出,当S1=1时,表示A1、A3、A5、A7中有一个出错了,即S1是用来监督A1、A3、A5、A7这些位置的,所以就得到了监督关系式S1= A1⊕A3⊕A5⊕A7。
通过上表,同理得到S2= A2⊕A3⊕A6⊕A7;S3= A4⊕A5⊕A6⊕A7。
用上面三个监督关系式,就可以知道,A1、A2、A4这三个是监督位,剩下的四位A7 A6 A5 A3就是数据。
(S1⊕S2⊕S3= A1⊕A2⊕A4,所以这三位是监督位)。
那这三个位上的值应该取多少呢?数据在还没有进行传输时,数据是不会有错的,即S3S2S1=0,代入以上三个监督关系式,得
S1= A1⊕A3⊕A5⊕A7=0
S2= A2⊕A3⊕A6⊕A7=0
S3= A4⊕A5⊕A6⊕A7=0
即算得
A1= A3⊕A5⊕A7
A2= A3⊕A6⊕A7
A4= A5⊕A6⊕A7
有了以上这些准备工作,接下来就实际算一个海明码出来。