实用无失真信源编码之LZW压缩编码

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信源编码简介
信源编码就是把信源符号变换到码符号 的一种映射。
编码的目的就是将原始数据进行压缩, 达到提高通信效率的目的。
信源编码分为:无失真压缩编码和限失 真压缩编码两种。
常见的无失真信源编码方法
“游程编码”、“霍夫曼编码”、 “算术编 码”、“LZW编码”
概率匹配压缩原理
根据信源的统计特性,用短码来代替频 繁出现的原始数据,从而达到压缩的目的。
牛津词典共1354页,每页不超过64字,页 码用11位二进制数表示,每页第几个用6位二 进制数表示,则2个单词用34位数据表示。而 原始数据若用8位ASCII码表示,数据为 16*8=128位。压缩比为128/34=3.8倍。
2、LZW编码方法
LZW压缩有三个重要的对象:数据流、 编码流和字典(编译表)。
例如,对“Data Compression”进行编码
以牛津词典为例子,查词典发现“Data”出 现在第271页第13个字;“Compression”出 现在第213页第8个字。
Data Compression
(271,13)(8)
Data Compression
(271,13)(213,8)
1、LZW编码思想
绝大多数原始信息有很多重复数据,如文 本文档、图片、程序代码等。如果用一些简单 的编码代替这些数据,就可以实现压缩,编码 与数据的对应表就是字典。
基本思想:构造一个字典,将原始信息中 出现的字符串,以单词的形式存储在字典中, 以索引形式给出编码。解码时对根据索引,通 过查字典,转换为原始信息。
数据流
编译码器
编码流
字典
字典的产生
字典不是事先创建好的,而是根据原始 文件数据动态创建的。提取原始文本文件 数据中的不同字符,分成一段一段。将这 些段存入字典,然后用字典中段的索引来 替代原始文本文件数据中的相应分段,减 少原始数据大小。
编码步骤:
(12)新若建 现一 有个 的字 段典 与,字读典取中第的一短个语符相同号时作,为再第取一紧段跟短 语后存面入的字一典 个; 符取 号下组一成符新号的作段为,新把的该段起作点为继短续语分存段入。字 典。重复该过程直到编码结束。
二、LZW编码
在70年代末以前,以霍夫曼编码为 代表的概率匹配压缩模型在数据压缩领 域一直占据着统治地位。
这类编码属于静态概率编码,需要预 知原始消息的概率分布。但大多数信源 的概率是很难预知,甚至概率分布是变 动的。
1977 年,以色列人Ziv 和 Lempel提出了 全新的一个压缩技术被称为 LZ77 算法。 1985年由美国人Welch在LZ77算法基础上提 出LZW编码算法并进入实用阶段。
件很有效
谢谢各位!
信息理论与编码
实用的无失真信源编码
——LZW压缩编码
工程技术学院 电气与电子信息系
郭堃
课程简介
寻找信息传输过程中的共同规律,以 提高信息传输的有效性、可靠性和保密性, 使信息传输系统达到最优化。
本次课内容概要
信源编码
LZW编码
1、LZW编码思想 2、LZW编码方法
LZW编码特点
一、信源编码
莫尔斯电码
段号 短语
1A
2 AC 3D 4B 5 BA 6 ACD 7 DB
数据流
AA C DB B AA C DDB
编码流
0A 1C 0D 0B 4A 2D 3B
码字=前缀的段号+结束符号,对于单 符号的短语,相应的段号为0。
三、LZW编码特点
无损压缩,适合压缩文本和程序代码 压缩率高,在无损压缩方法中出类拔萃 不需要预先扫描数据 对反复使用具有相同文字记录和图形的文
它们的思路和字典颇为相似,因此,人 们将基于这一思路的编码方法称作字典式 编码。其在压缩效果上大大超过了霍夫曼 编码,其压缩和解压缩的速度也异常惊人 ,打破了霍夫曼编码一统天下的局面。
LZW编码实际应用 至今,几乎我们日常使用的所有通用压
缩工具最终都归结为以LZW算法为核心。 (1)图像压缩:GIF、TIFF、PNG (2)计算机数据压缩:ZIP、RAR、7-ZIP
相关文档
最新文档