中科大编码理论chapter1
Lecture1基本概念
2020/7/15
6
错误图样
例子
➢ 发送序列C: (1111011000) ➢ 错误图样E: (1001001110) ➢ 接收序列R: (0110010110)
➢ R=C+E or E=C+R ➢ 突发图样: (100100111);突发长度:9
二进制运算规则
模2加
⊕0 1
模2乘 ⊙0 1
00 1 11 0
00 0 10 1
2020/7/15
7
差错控制的基本方式
FEC ARQ IRQ HEC
发
收
可纠正错误的码
发 能够发现错误的码 收
应答信号
发
信息信号
收
信息信号
发 能够发现和纠正错误的码 收
应答信号
FEC: Forward Error Control;ARQ: Automatic Retransmission Request HEC: Hybrid Error Control; IRQ: Information Retransmission Request
➢ BIAWGN输入输出可表示为
➢
Y=X+N
➢ 其中,N为加性高斯白噪声,其均值为零,方差为 2 。给定一个输
入 X xk , k 0,1, , q 1 ,则Y是均值为xk,方差为 2 的
《信息理论与编码》,答案,考试重点(1--3章)
《信息理论与编码》习题参考答案
1. 信息是什么信息与消息有什么区别和联系
答:信息是对事物存在和运动过程中的不确定性的描述。信息就是各种消息符号所包含的具有特定意义的抽象内容,而消息是信息这一抽象内容通过语言、文字、图像和数据等的具体表现形式。
2. 语法信息、语义信息和语用信息的定义是什么三者的关系是什么
答:语法信息是最基本最抽象的类型,它只是表现事物的现象而不考虑信息的内涵。语义信息是对客观现象的具体描述,不对现象本身做出优劣判断。语用信息是信息的最高层次。它以语法、语义信息为基础,不仅要考虑状态和状态之间关系以及它们的含义,还要进一步考察这种关系及含义对于信息使用者的效用和价值。三者之间是内涵与外延的关系。
第2章
1. 一个布袋内放100个球,其中80个球是红色的,20个球是白色的,若随机摸取一个球,猜测其颜色,求平均摸取一次所能获得的自信息量
答:依据题意,这一随机事件的概率空间为
120.80.2X x x P ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦
其中:
1
x 表示摸出的球为红球事件,
2
x 表示摸出的球是白球事件。
a)如果摸出的是红球,则获得的信息量是
()()11log log0.8
I x p x =-=-(比特)
b)如果摸出的是白球,则获得的信息量是
()()22log log0.2
I x p x =-=-(比特)
c) 如果每次摸出一个球后又放回袋中,再进行下一次摸取。则如此摸取n 次,红球出现的次数为
()
1np x 次,白球出现的次数为
()
2np x 次。随机摸取n 次后总共所获得信息量为
()()()()
编码理论第1章
模型各部分的功能
信源译码器:把估值序列V变成信源输出的估值 (原来消息的估值),并将此估值传送给用户。如 果信源是连续的,需要进行数/模转换。在一个 精心设计的系统中,除非信道(或存储煤质)的干 扰太强,否则这个估值将是信源输出的准确重现 信宿:目的地或者用户 编码理论关注的是信道编码器和信道译码器 为把注意力集中到信道编码与信道译码,将数据 传输和存储模型简化
码的类型
对消息序列处理方式:分组码、卷积码 校验元与信息元之间的关系:线性码、非线性码 纠正错误的类型:纠随机错误码、纠突发错误码、 纠同步错误码 码元的取值:二进制码、多进制码 码字的循环结构:循环码和非循环码 构造码的数学方法:代数码、几何码、算术码 码字信息组的结构:系统码和非系统码
模型各部分的功能
信道编码器:将信息序列U变换成离散的有结构 的编码序列X,这称为码字。即为了使传输有效, 人为的增加一些冗余度,使其具有自动检错和纠 错的能力。码字的结构主要用以对付传输或存储 码字的有扰信道,码字的设计和实现是本课程的 主题 调制器(或写入单元):离散符号不适合于在实际 信道上传输或记录在数字存储媒质上。调制器将 信道编码器的每个输出的离散符号,通过调制变 成适合传输(或存储)的持续时间为T的波形,此 波型进入信道(或存储媒质),并受噪声干扰
Coding and Information theory-chapter1
t—time index • symbol probability:
pm Pr(am )
M 1 m 0
PA p0 , p1,, pM 1 and
12
p
m
1
• discrete sources: represented by discrete probability space
15
Example In a typical MIT course with good students, the grade distribution might be:
A 25% B 50% C 12.5% D 10% F 2.5%
பைடு நூலகம்
Assuming this as a probability distribution, what is the information per symbol and what is the average information per symbol?
A a0 , a1 ,, a M 1 P( A) p , p ,, p 0 1 M 1
M 1
where
p
i 1
i
1
• continuous source:
X (a, b) P( X ) p ( x )
chapter1 绪论PPT课件
2020/12/4
10
通信的发展——简史
❖ 雏形:手势、对话、烽火、灯光、信鸽、邮政、旗语。
I
Love
You
❖ 现代通信:电信(Telecommunication)远距离通信
电报 电话 电视
网络 Etc……
2020/12/4
11
通信的发展——简史
❖ 1837年 ❖ 1864年 ❖ 1875年 ❖ 1887年 ❖ 1895年 ❖ 1901年 ❖ 1906年 ❖ 1918年 ❖ 1936年 ❖ 1937年 ❖ 1938年 ❖ 1940-1945
▪ 19C:船舶短波通信 ▪ 20C,40s,美国汽车电话网——蜂窝移动电话 ▪ 70s,美•无绳电话——数字无绳电话 ▪ 90s,西欧•时分多址技术,TDMA;美•CDMA ▪ 21C,3G第三代移动通信系统 ▪ 目标:5W通信
Whoever Whenever Wherever Whomever Whatever
2020/12/4
12
通信的发展——简史
❖ 1948年
❖ 1950年 ❖ 1953年 ❖ 1957年 ❖ 1958年 ❖ 1960年 ❖ 1964年 ❖ 1972年 ❖ 1976年 ❖ 1989年 ❖ 1990年
C.Shannon发表《通信的数学理论》,提出通信系统 的一般模型——信息论 W.H.Brattain发明晶体管——集成电路 时分多路通信应用于电话 第一条越洋电话电缆(36路)敷设 前苏联发射第一颗人造通信卫星 第一块集成电路问世 发明激光器 全电子电话系统问世 Motorola发明蜂窝电话 个人电脑——PC问世 便携式蜂窝电话问世 超大规模集成电路大量使用;PC与通信互补兼容;
信息与编码理论课后习题答案
2.1 莫尔斯电报系统中,若采用点长为0.2s ,1划长为0.4s ,且点和划出现的概率分别为2/3和1/3,试求它的信息速率(bits/s)。
解: 平均每个符号长为:
154
4.0312.032=⨯+⨯秒 每个符号的熵为9183.03log 3
1
23log 32=⨯+⨯比特/符号
所以,信息速率为444.34
15
9183.0=⨯比特/秒
2.2 一个8元编码系统,其码长为3,每个码字的第一个符号都相同(用于同步),若每秒产生1000个码字,试求其信息速率(bits /s)。 解: 同步信号均相同不含信息,其余认为等概,每个码字的信息量为 3*2=6 比特;
所以,信息速率为
600010006=⨯比特/秒
2.3 掷一对无偏的骰子,若告诉你得到的总的点数为:(a ) 7;(b ) 12。试问各得到了多少信息量?
解: (a)一对骰子总点数为7的概率是
36
6 所以,得到的信息量为 585.2)366(log 2= 比特
(b) 一对骰子总点数为12的概率是36
1 所以,得到的信息量为 17.5361
log 2= 比特
2.4
经过充分洗牌后的一付扑克(含52张牌),试问:(a) 任何一种特定排列所给出的信息量是多少? (b) 若从中抽取13张牌,所给出的点数都不相同时得到多少信息量?
解: (a)任一特定排列的概率为
!521, 所以,给出的信息量为 58.225!
521
log 2
=- 比特 (b) 从中任取13张牌,所给出的点数都不相同的概率为 1313
1313
5252
13!44A C ⨯=
所以,得到的信息量为 21.134
中科大实验室介绍 信息网络实验室 薛开平 con-2014
2. 什么是电路交换、分组交换? • 分组交换中的延时分析,传播延时、 传输延时、处理延时、排队延时
Chapter 4 数据链路层
4.1数据链路层的功能 4.2差错检测与校正 4.3基本数据链路协议 4.4滑动窗口(Slide Windows)协议 4.5面向位的协议HDLC 4.6 Internet中的数据链路层
IP组播
IGMP snooping
Chapter 7 Internet Protocol(3)
IPv4的可扩展性问题
地址不够用 路由表急剧膨胀,路由效率降低
划分子网步骤
子网掩码、子网数量、主机数量
原理 前缀汇聚、前缀最长匹配规则 原理和过程 局限性
CIDR
NAT(NAPT)
4. 拥塞控制,漏桶、令牌桶,(怎 样计算?见作业题) 5. 网络互连设备、作用
Chapter 7 Internet Protocol(1)
Internet服务模型 IP地址
IP地址配置方式 IP地址和MAC地址表示形式及不同之处
地址解析协议作用及过程
IP分段
查找路由表/转发表得到下一跳的IP地址,然后得到该IP地址对应 的MAC地址 ARP缓存可以避免频繁的ARP过程
笣?1章~笣?3章习颣?
第1章 绪 论
1.1 典 型 例 题
【例1-1】 进制离散信源输出四个独立符号A 、B 、C 、D 。 (1) A 、B 、C 、D 出现的概率分别为
41、81、81、2
1
,求A 、B 、C 、D 每个符号所携带的信息量和信源熵;
(2) A 、B 、C 、D 等概,求信源熵。 解 (1) 根据式(1-1),有
=)(A I (-log 241
)bit=2 bit
==)()(C I B I (-log 281
)bit=3 bit
=)(D I (-log 22
1
)bit=1 bit
根据式(1-2),有
H (X )=(
41×2+818×3+81×3+21×1)bit/符号=14
3
bit/符号 (2) 根据式(1-3),有
H (X )=(log 24)bit/符号=2 bit/符号
【例1-2】 某数字通信系统用正弦载波的四个相位0、2
π
、π、23π来传输信息,这四
个相位是互相独立的。
(1) 每秒钟内0、
2
π
、π、23π出现的次数分别为500、125、125、250,求此通信系统
的码速率和信息速率;
(2) 每秒钟内这四个相位出现的次数都为250,求此通信系统的码速率和信息速率。 解 (1) 每秒钟传输1000个相位,即每秒钟传输1000个符号,故
R B =1000 Bd
每个符号出现的概率分别为P(0)=21,P ⎪⎭⎫ ⎝⎛2π=81,P(π)=81,P ⎪⎭⎫ ⎝⎛23π=4
1,每个符号所含的平均信息量为
H (X )=(
21×1+82×3+41×2)bit/符号=143
bit/符号 信息速率R b =(1000×14
《信息理论与编码》-答案-考试重点(1--3章)
《信息理论与编码》习题参考答案
1. 信息是什么?信息与消息有什么区别和联系?
答:信息是对事物存在和运动过程中的不确定性的描述。信息就是各种消息符号所包含的具有特定意义的抽象内容,而消息是信息这一抽象内容通过语言、文字、图像和数据等的具体表现形式。
2. 语法信息、语义信息和语用信息的定义是什么?三者的关系是什么? 答:语法信息是最基本最抽象的类型,它只是表现事物的现象而不考虑信息的内涵。语义信息是对客观现象的具体描述,不对现象本身做出优劣判断。语用信息是信息的最高层次。它以语法、语义信息为基础,不仅要考虑状态和状态之间关系以及它们的含义,还要进一步考察这种关系及含义对于信息使用者的效用和价值。三者之间是内涵与外延的关系。
第2章
1. 一个布袋内放100个球,其中80个球是红色的,20个球是白色的,若随机摸取一个球,猜测其颜色,求平均摸取一次所能获得的自信息量?
答:依据题意,这一随机事件的概率空间为
120.80.2X x x P ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦
其中:
1
x 表示摸出的球为红球事件,
2
x 表示摸出的球是白球事件。
a)如果摸出的是红球,则获得的信息量是
()()11log log0.8
I x p x =-=-(比特)
b)如果摸出的是白球,则获得的信息量是
()()22log log0.2
I x p x =-=-(比特)
c) 如果每次摸出一个球后又放回袋中,再进行下一次摸取。则如此摸取n 次,红球出现的次数为
()
1np x 次,白球出现的次数为
()
2np x 次。随机摸取n 次后总共所获得信息量为
编码理论
信道,是由它的输入信号、输出信号和它 们的转移概率特性所表征的信息通道。 假定,信道输入和信道输出分别为U和V, U u1 , u 2 , u3 ,u m V v1 , v2 , v3 ,vm 即:
其信道的输入输出转移特性为:
pv1 u1 pv 2 u1 pv n u1 pv u pv u pv u 2 2 n 2 pV U 1 2 p v u p v u p v u 2 m n m 1 m
1.2.2 信道编码
信道,是指有明确信号输入和信号输出的信息通 道。
这个通道可以是空间,如通信系统把信号从一个地点传 送到另一个地点; 这个通道可以是时间,如存储系统把 信号从某个时间开始存储到下一个时间; 这个通道可以 是过程,如处理系统把信号从一个接口演变到另一个接口。 无论是哪一种通道,有输入到输出的转移过程,这个转 移过程反映了该通道的特征。 最基本、最简单的转移过程,就是什么都不改变,仅仅 把输入原封不变的搬到输出。实际上,任何信道,在我们 研究的尺度空间,都很难做到输出与输入完全一样、原封 不变,输入经过信道之后总有不同和差异。
j
:S : A
编码
解码
信源编(解)码过程
如果信源是由离散信源符号构成的,信源编码就 是针对每个离散信源符号进行处理,寻找出相应合理 码长的码字,从而构成平均码长最短的编码。这是各 种信源编码的基础。
中国科学技术大学2020年信号与系统考研真题及参考答案(一)
中国科学技术大学2020年信号与系统考研真题及参考答案
(一)
本公众号进行数字信号处理系列课程(信号与系统——数字信号处理——随机信号分析——现代数字信号处理)辅导,巩固基础与进一步提高相结合。
提倡“我为人人,人人为我”,欢迎广大朋友提供好的资料、文章、题解和学习经验,共同学习,共同进步。
考研专业课真题必练——数字信号处理王仕奎编著,北京邮电大学出版社,2020
本书是数字信号处理硕士研究生入学考试的解题指导, 对博士生入学考试也有一定的参考价值. 同时, 作为数字信号处理这门课程学习的参考书, 对于学习该课程的学生, 对讲授该课程的教师的备课、习题讲解和测试, 也有很高的参考价值.本书最初的一章对五套近年的数字信号处理考研真题进行了详细解答, 接着的八章分别介绍了数字信号处理的重要内容: 离散时间信号与系统、z变换与离散时间傅里叶变换、离散傅里叶变换、快速傅里叶变换、数字滤波器的基本结构、IIR滤波器的设计、FIR滤波器的设计、信号的抽取与插值——多抽样率数字信号处理基础. 每一章在提纲挈领地介绍基础知识点后, 辅之以大量的考研真题和著名教材习题的解答, 向学习者演示基础知识的灵活运用和答题技巧. 最后一章包含大量的各类高校考研(博)真题, 以给读者提供丰富的自我测试材料, 所有真题都包含参考解答, 解答有详有略, 以便学习者对照答案之用.
中科大2020年信号与系统考研真题我准备分四次解答完,这是第一次。请继续关注后续解答。——王仕奎
编码理论基础1
《编码理论基础》课程教学内容和方式改革实施方案
信息与计算科学专业
对课程教学内容和方式改革的认识
《编码理论基础》作为信息与计算科学专业的选修课,由于学时少,教学任务重,所以我们建设的重点是,规范教学行为,进行教学改革,提高课堂教学质量。我加深了对教案的本质内涵的认识,教案是教师以课程教学内容为载体,旨在通过教学活动,培养学生科学素质和掌握运用知识的能力所设计的方案。教案的绝大部分内容是讲稿,但教案并不等于讲稿。一名大学教师的专业素养、驾驭知识的能力、个性和教学创新能力应该在其所设计的教案中得到充分的发挥,这些是本科生的专业培养中最具有活力的因素。通过本课程的教学,使学生能够较系统地掌握编码理论的基本思想。
课程在人才培养中的定位
本课程是信息与计算科学专业的选修课,本课是纠错码理论的一个入门,它以代数理论为基础,系统介绍了纠错编码编码理论与具体方法,并且与通信工程应用实际紧密结合。通过该课程的学习将使学生掌握编码的基本原理和方法,为后续课程的学习和今后从事相关的科学技术工作打下牢固的基础。
课程教学的主要任务
《编码理论基础》是信息与计算科学专业信息安全方向的专业选修课,也是一门理论与实践相结合的课程。要求学生掌握信道编码的概念和基本原理,学会线性分组码、循环码、BCH码以及卷积码的编码和译码,掌握各种编码方式的检错和纠错能力。编码理论来源于现代通信技术与电子计算机技术中差错控制研究的实际需要,是信息论的一个专门分支。通过本理论的学习,学生应掌握信源编码的基本概念和原理,掌握线性分组码。循环码,二元双纠错BCH码及卷积码的基本原理、性质,掌握他们编码方式及检错和纠错能力。
中科大编码理论_chapter2
2REb REb 1 S 1 C C T W T log 2 1 log 2 1 log 2 1 N 2 N WT 2 N 0 0 2 REb 1 R C log 2 1 ,可得 2 N0
无信道边信息(NSI)。下面给出这两种情况下的信道容量 有信道边信息
1 C p( ) p( y | x Es , ) log 1 ( y, ) dyd y 2
其中p(α)归一化的Rayleigh分布的PDF,p(y|x, α)是均值为α,方差为σ2的
带限AWGN信道的信道容量公式为:
S S C W log 2 1 W log 2 1 N W N 0
其中W为信道带宽,噪声的双边功率谱密度为N0/2。
当编码速率为R,信息比特能量为Eb时,有
REb C log 2 1 W N W 0
sS
如果所有先验概率是相同的,该 准则可简化为: s ˆ arg max
sS
p( r | s )
最大似然判决准则
如果所有先验概率是相 同的,两者是等价的!
思考一下:最大似然准则在什么 情况下不是最优算法,为什么?
14
2.5 因子图与和积算法
在1981年Tanner的论文中,介绍了一种可以用来表示码字的图形,称为 Tanner图。Tanner图包含两类节点:码元(变量)节点和校验节点,然 后通过边连接这两种不同的节点,并且同种节点间不能有直接的边连接。 如果给定一个码字的码元数和它的校验方程,则用Tanner图可以唯一地 确定该码字。例如一个(7, 3)线性分组码,其校验方程为:
信息论与编码理论中的英文单词和短语
信息论与编码理论Theories of Information
and Coding
第一章介绍
Chapter 1 Introduction
第二章信息理论Chapter 2 Information Theory
信息论与编码理论中的英文单词和短语
第三章 离散无记忆信
道和容量成本方程
Chapter 3 Discrete Memory less Channels and their Capacity -Cost Equations
第四章 离散无记忆信
源和扭曲率方程
Chapter 4 Discrete Memoryless Sources and their Rate -Distortion Equations
第五章 高斯信道和信
源
Chapter 5 Gaussian Channel and Source
第六章 信源-信道编码
理论
Chapter 6 Source -Channel Coding Theory
第七章 第一部分访问
先进标题
Chapter 7 Survey of Advanced Topics for Part One
第八章线性码Chapter 8 Linear codes
第九章循环码Chapter 9 Cyclic Codes
第十章 香农码和相关
的码
Chapter 10 Shannon Codes and Related Codes
第十一章 卷积码
Chapter 11 Convolution Codes
第十二章变量长度源编
码
Chapter 12 Variable-length Source Coding
01-编译原理课程测试第一套卷(附解析)-编译原理试题-中国科技大学
编译原理课程测试第一套卷(附解析)
1.(20分)写出字母表∑ = {a, b}上语言L = {w | w中a的个数是偶数}的正规式,并画出接受该语言的最简DFA。
2.(15分)考虑下面的表达式文法,它包括数组访问、加和赋值:
E → E[E] | E + E | E = E | (E) | id
该文法是二义的。请写一个接受同样语言的LR(1)文法,其优先级从高到低依次是数组访问、加和赋值,并且加运算是左结合,赋值是右结合。
3.(10分)下面是产生字母表∑ = { 0, 1, 2}上数字串的一个文法:
S → D S D | 2
D → 0 | 1
写一个语法制导定义,它打印一个句子是否为回文数(一个数字串,从左向右读和从右向左读都一样时,称它为回文数)。
4.(10分)教材上7.2.1节的翻译方案
P →{offset := 0}
D
D →D ; D
D →id : T { enter(, T.type, offset); offset := offset + T.width }
T →integer {T.type := integer; T.width := 4 }
T→real{T.type := real; T.width := 8 }
使用了变量offset。请重写该翻译方案,它完成同样的事情,但只使用文法符号的属性,而不使用变量。
5.(5分)一个C语言程序如下:
void fun(struct {int x; double r;} val) { }
main()
{
struct {int x; double r;} val;
chapter1 绪论
通信的发展——方向
数字化
易于加密,无噪声积累 二战,美军24路PCM系统开始应用 70’s,商用 90’s,Internet,GSM系统促进数字化发展 发展,广播系统
远程和大容量
介质:明线——同轴电缆——光纤 技术: • 短波:容量小,通信质量差,间断; • 微波:容量大,可传输距离有限; • 卫星:地球外中继,远程、静止、稳定、质量好;
22
信道模型——调制信道
ei (t )
时变线性
eo (t )
网络
eo (t ) f [ei (t )] n(t ) k (t )ei (t ) n(t )
n(t )
——加性噪声
k(t)—乘性噪声,反映信道 特性. k (t ) 基本不随时间变化的信道,称为恒参信道。 如各种有线信道、视距/卫星中继信道。
A B C D
2015-2-26
0 1 2 3
1 T 2 T T -1 T -2 t t t t
00 01 10 11
18
1 T 1 T 1 T T 2T t 2T t 2T t 2T t
-1
数字通信——主要性能指标
数字通信系统的性能指标:传输速率
符号(码元)传输速率RB: 单位时间传送的符号数量, RB 传码率:
分析: 各符号信息量:I(x)=-log2P(x) (bit); 信源平均信息量:H(x)=∑I(x)P(x); 整段消息信息量:I= ∑I(x); I=nH(x)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
但编织码的编码结构复杂性较高,编码效率也不高,目前研究最 多的是1/3的编织卷级码,译码采用BCJR算法的迭代译码。
汉明码和Golay码的基本原理相同。它们都是将q元符号按每k个 分为一组.然后通过编码得到n-k个q元符号作为冗余校验符号, 最后由校验符号和信息符号组成有n个q元符号的码字符号。得到 的码字可以纠正t个错误,编码码率为为k/n。这种类型的码字称 为分组码,一般记为(q,n,k,t)码,二元分组码可以简记为(n,k,t)码 或者(n,k)码。汉明码和Golay码都是线性的,任何两个码字经过 模q的加操作之后,得到的码字仍旧是码集合中的一个码字。
分组码所存在的固有缺点可以通过采用其他的编码方 法来改善。这种编码方法就是卷积码。卷积码是Elias 等人在1955年提出的。卷积码与分组码的不同在于: 它充分利用了各个信息块之间的相关性。通常卷积码 记为(n,k,N)码。卷积码的编码过程是连续进行的, 依次连续将每k个信息元输入编码器,得到n个码元, 得到的码元中的检验元不仅与本码的信息元有关,还 与以前时刻输入到编码器的信息元(反映在编码寄存器 的内容上)有关。同样,在卷积码的译码过程中,不仅 要从本码中提取译码信息,还要充分利用以前和以后 时刻收到的码组.从这些码组中提取译码相关信息, 而且译码也是可以连续进行的,这样可以保证卷积码 Elias, 1923-2001 的译码延时相对比较小。通常,在系统条件相同的条 件下,在达到相同译码性能时,卷积码的信息块长度 和码字长度都要比分组码的信息块长度和码字长度小, 相应译码复杂性也小一些。
Berrou and Forney
1997 年 , Host 、 Johannesson 、 Ablov 提 出 了 编 织 卷 级 码 (Woven Convolutional Code,WCC)的概念,随后编织码 (Woven code)便发展起来了。它是一种组合码,其系统结构 可完全包容传统分组码、卷级码以及各类Turbo码,开创了编码 领域的一个新天地。
卷积码的译码通常有如下几个比较流行的译码算法:
由Wozencraft和Reiffen在1961年提出,Fano和 Jelinek分别在1963年和1969年进行改进了的序 贯译码算法。该算法是基于码字树图结构的一种 次优概率译码算法。
由Massey在1963年提出的门限译码算法。这个 算法利用码字的代数结构进行代数译码。
编码理论
ቤተ መጻሕፍቲ ባይዱ
第一章 序论
编码理论的内容包括三个方面
以保证数字信息传输和处理的可靠性为目的的差错控制编 码(error-control coding),又称为信道编码(channel coding);
以提高数字信息传输、存储处理的有效性为宗旨的信源编 码(Source coding);
以增加数字信息传输、存储的安全性为目标的数据加密编 码(data encryption);
虽然分组码在理论分析和数学描述方面已经非常成熟,并且在实 际的通信系统中也已经得到了广泛的应用,但分组码固有的缺陷 大大限制了它的进一步发展。首先,由于分组码是面向数据块的, 因此,在译码过程中必须等待整个码字全部接收到之后才能开始 进行译码。在数据块长度较大时,引入的系统延时是非常大的。 分组码的第二个缺陷是它要求精确的帧同步,即需要对接收码字 或帧的起始符号时间和相位精确同步。另外,大多数基于代数的 分组码的译码算法都是硬判决算法,而不是对解调器输出未量化 信息的软译码,从而造成了一定程度的增益损失。
出了RS码; 1962年,Gallager提出了LDPC码; 1967年,Berlekamp引入了BCH/RS码的快速译码算法; 1968年,Gallager著书《Information theory and reliable communication》; 1971年,Viterbi引入卷级码的最大似然译码; 1972年,BCJR算法的提出; 1981年,Tanner提出了用于理解信道编码理论的Tanner图; 1982年,Ungerboeck引入编码调制; 1993年,Berrou/Glaveieux/Thitimajshima提出了Turbo码; 1995年,MacKay重新发现了LDPC码; 1997年, Host/Johannesson/Ablov提出了编织卷级码。 2000年,Aji与McEliece总结了应用消息传递思想进行译码的码型; 2003年,Koetter与Vardy提出了RS码的代数软判决译码;
在RM码提出之后人们又提出了循环码的概念。循环码实际上也 是一类分组码,但它的码字具有循环移位特性,即码字比特经过 循环移位后仍然是码字集合中的码字。这种循环结构使码字的设 计范围大大增加,同时大大简化了编译码结构。循环码的另一个 特点就是它可以用一个幂次为n-k的多项式来表示,这个多项式 记为g(D),称为生成多项式,其中D为延迟算子。循环码也称为 循环冗余校验(CRC,Cyclic Redundancy Check)码,并且可 以用Meggitt译码器来实现译码。由于Meggitt译码器的译码复杂 性随着纠错能力t的增加而呈指数形式的增加,因此通常CRC码 用于纠正只有单个错误的应用情况,常用做检错码而非纠错码。
Gallager
虽然软判决译码、级联码和编码调制技术都对信道 码的设计和发展产生了重大影响,但是其增益与 Shannon理论极限始终都存在2~3dB的差距。
在 1993 年 于 瑞 士 日 内 瓦 召 开 的 国 际 通 信 会 议 (1CC'93)上,两位任教于法国不列颠通信大学的教 授 C.Berrou 、 A.Glavieux 和 他 们 的 缅 甸 籍 博 士 生 P.Thitimajshima 首 次 提 出 了 一 种 新 型 信 道 编 码 方 案 ——Turbo 码 , 由 于 它 很 好 地 应 用 了 Shannon 信 道编码定理中的随机性编、译码条件,从而获得了 几乎接近Shannon理论极限的译码性能。仿真结果 表明,在采用长度为65536的随机交织器并译码迭代 18次情况下,在信噪比Eb/N0>=0.7dB并采用二元相 移键控(BPSK)调制时,码率为1/2的Turbo码在加性 高斯白噪声信道上的误比特率(BER)<=10-5,达到了 与Shannon极限仅相差0.7dB的优异性能。(1/2码率 的Shannon极限是0dB)。
发展概括
1948年,Shannon发表开创性文章“通信的数学理论”; 1950年,Hamming发明了汉明码; 1955年,Elias引入了卷级码; 1957年,Prange提出了循环码; 1960年,Bose/Chaudhuri/ Hocquenghem发明了BCH码;Reed和Solomon提
Shannon指出了可以通过差错控制码在信息传输速率不 大于信道容量的前提下实现可靠通信,但却没有给出具体 实现差错控制编码的方法。
20世纪40年代,R.Hamming和M.Golay提出了第一 个实用的差错控制编码方案,使编码理论这个应用数 学分支的发展得到了极大的推动。通常认为是 R.Hamming提出了第一个差错控制码。当时他作为一 个数学家受雇于贝尔实验室,主要从事弹性理论的研 究。他发现计算机经常在计算过程中出现错误,而一 旦有错误发生,程序就会停止运行。这个问题促使他 编制了使计算机具有检测错误能力的程序,通过对输 入数据编码,使计算机能够纠正这些错误并继续运行。 Hamming所采用的方法就是将输入数据每4个比特分 为一组,然后通过计算这些信息比特的线性组合来得 Hamming, 1915-1998 到3个校验比特,然后将得到的7个比特送入计算机。 计算机按照一定的原则读取这些码字,通过采用一定 的算法,不仅能够检测到是否有错误发生,同时还可 以找到发生单个比特错误的比特的位置,该码可以纠 正7个比特中所发生的单个比特错误。这个编码方法 就 是 分 组 码 的 基 本 思 想 , Hamming 提 出 的 编 码 方 案 后来被命名为汉明码。
虽然汉明码的思想是比较先进的,但是它也存在许多难以接受
的缺点。首先,汉明码的编码效率比较低,它每4个比特编码就 需要3个比特的冗余校验比特。另外,在一个码组中只能纠正单 个的比特错误。M.Golay研究了汉明码的这些缺点,并提出了两 个以他自己的名字命名的高性能码字:一个是二元Golay码,在 这个码字中Golay将信息比特每12个分为一组,编码生成11个冗 余校验比特,相应的译码算法可以纠正3个错误。另外一个是三 元Golay码,它的操作对象是三元而非二元数字。三元Golay码 将每6个三元符号分为一组,编码生成5个冗余校验三元符号。这 样由11个三元符号组成的三元Golay码码字可以纠正2个错误。
在Golay码提出之后最主要的一类分组码就是Reed-Muller码。它 是Muller在1954年提出的,此后Reed在Muller提出的分组码的基 础上得到了一种新的分组码,称为Reed-Muller码,简记为RM码。 在1969年到1977年之间,RM码在火星探测方面得到了极为广泛 的应用。即使在今天,RM码也具有很大的研究价值,其快速的 译码算法非常适合于光纤通信系统。
由Viterbi在1967年提出的Viterbi算法。该算法是 基于码字格图结构的一种最大似然译码算法,是 一种最优译码算法。
在Viterbi译码算法提出之后,卷积码在通信系统中得 到了极为广泛的应用。如GSM、3G、商业卫星通信 系统等。
Viterbi, CDMA之父
近年来,在信道编码定理的指引下,人们一 直致力于寻找能满足现代通信业务要求、结 构简单、性能优越的好码,并在分组码、卷 积码等基本编码方法和最大似然译码算法的 基础上提出了许多构造好码及简化译码复杂 性的方法,提出了乘积码、代数几何码、低 密 度 校 验 码 (LDPC , Low Density Parity Check)、分组-卷积级联码等编码方法和逐 组最佳译码、软判决译码等译码方法以及编 码 与 调 制 相 结 合 的 网 格 编 码 调 制 (TCM , Trellis Coded Modulation)技术。其中对纠 错码发展贡献比较大的有级联码、软判决译 码和TCM技术等。
我们主要讨论差错控制编码技术。
差错控制编码技术是适应数字通信抗噪声干 扰的需要而诞生和发展起来的,它是于1948 年、著名的信息论创始人C. E. Shannon(香 农)在贝尔系统技术杂志发表的“A Mathematical Theory of Communication”一 文,开创了一门新兴学科和理论:信息论和 编码理论。
1.1 信道编码的历史及研究现状
1948年,Bell实验室的C.E. Shannon发表的《通信的数 学理论》,是关于现代信息理论的奠基性论文,它的发表 标志着信息与编码理论这一学科的创立。Shannon在该 文中指出,任何一个通信信道都有确定的信道容量C,如 果通信系统所要求的传输速率R小于C,则存在一种编码 方 法 , 当 码 长 n 充 分 大 并 应 用 最 大 似 然 译 码 ( MLD , Maximum Likelihood Decdoding)时,信息的错误概 率可以达到任意小。从Shannon信道编码定理可知,随 着分组码的码长n或卷积码的约束长度N的增加,系统可 以取得更好的性能(即更大的保护能力或编码增益),而 译码的最优算法是MLD,MLD算法的复杂性随n或N的增 加呈指数增加,因此当n或N较大时,MLD在物理上是不 可实现的。因此,构造物理可实现编码方案及寻找有效译 码算法一直是信道编码理论与技术研究的中心任务。
循环码的一个非常重要的子集就是分别由Hocquenghem在1959 年 、 Bose 和 Ray-Chaudhuri 研 究 组 在 1960 年 几 乎 同 时 提 出 的 BCH码(BCH,Bose Chaudhuri Hocquenghem),BCH码的码 字长度为n=qm-1,其中m为一个整数。二元BCH码(q=2)的 纠错能力限为t<(2m-1)/2。1960年,Reed和Solomon将BCH码 扩展到非二元(q>2)的情况,得到了RS(Reed-Solomon) 码。1967年,Berlekamp给出了一个非常有效的译码算法后, RS码得到了广泛的应用。此后,RS码在CD播放器、DVD播放 器中得到了很好的应用。