第七章 图像压缩编码
图像压缩与编码
实验项目3、图像压缩与编码一、实验目的(1)理解图像压缩编码的基本原理;(2)掌握用程序代码实现DCT变换编码;(3)掌握用程序代码实现游程编码。
二、实验原理及知识点1、图像压缩编码图像信号经过数字化后,数据量相当大,很难直接进行保存。
为了提高信道利用率和在有限的信道容量下传输更多的图像信息,必须对图像进行压缩编码。
图像压缩技术标准一般可分为如下几种:JPEG压缩(JPEG Compression)、JPEG 2000、H.26X标准(H.26X standards)以及MPEG标准(MPEG standards)。
数字压缩技术的性能指标包括:压缩比、平均码字长度、编码效率、冗余度。
从信息论角度分,可以将图像的压缩编码方法分为无失真压缩编码和有限失真编码。
前者主要包括Huffman编码、算术编码和游程编码;后者主要包括预测编码、变换编码和矢量量化编码以及运动检测和运动补偿技术。
图像数据压缩的目的是在满足一定图像质量的条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量,在信息论中称为信源编码。
图像压缩是通过删除图像数据中冗余的或者不必要的部分来减小图像数据量的技术,压缩过程就是编码过程,解压缩过程就是解码过程。
2、游程编码某些图像特别是计算机生成的图像往往包含许多颜色相同的块,在这些块中,许多连续的扫描行或者同一扫描行上有许多连续的像素都具有相同的颜色值。
在这些情况下就不需要存储每一个像素的颜色值,而是仅仅存储一个像素值以及具有相同颜色的像素数目,将这种编码方法称为游程(或行程)编码,连续的具有相同颜色值的所有像素构成一个行程。
在对图像数据进行编码时,沿一定方向排列的具有相同灰度值的像素可看成是连续符号,用字串代替这些连续符号,可大幅度减少数据量。
游程编码记录方式有两种:①逐行记录每个游程的终点列号:②逐行记录每个游程的长度3、DCT变换编码变换编码是在变换域进行图像压缩的一种技术。
第7章图像编码.ppt
像素冗余
由于任何给定的像素值,原理上都可以 通过它的相邻像素预测到,单个像素携 带的信息相对是小的。对于一个图像, 很多单个像素对视觉的贡献是冗余的。 这是建立在对邻居值预测的基础上。
例:原图像数据:234 223 231 238 235 压缩后数据:234 11 -8 -7 3,我们可以
对一些接近于零的像素不进行存储,从而 减小了数据量
7.1.5 图像传输中的压缩模型
源数据编码:完成原数据的压缩。
通道编码:为了抗干扰,增加一些容错、 校验位、版权保护,实际上是增加冗余。
通道:如Internet、广播、通讯、可移动介 质。
源数据 编码
通道 编码
通道
通道 解码
源数据 解码
7.2 哈夫曼编码
1.
根据信息论中信源编码理论,当平均码长R大于等于图像熵H时,总可设 计出一种无失真编码。当平均码长远大于图像熵时,表明该编码方法效率很低; 当平均码长等于或很接近于(但不大于)图像熵时,称此编码方法为最佳编码, 此时不会引起图像失真; 当平均码长大于图像熵时,压缩比较高,但会引起图 像失真。
第七章 图像编码
7.1 图像编码概述 7.2 哈夫曼编码 7.3 香农-范诺编码 7.4 行程编码 7.5 LZW编码 7.6 算术编码 7.7 预测编码 7.8 正交变换编码 7.9 JPEG编码 7.10 编程实例
7.1 图像编码概述
7.1.1 图像编码基本原理
虽然表示图像需要大量的数据,但图像数据是高度相关的, 或者说存在冗余(Redundancy)信息,去掉这些冗余信息后可以 有效压缩图像, 同时又不会损害图像的有效信息。数字图像的 冗余主要表现为以下几种形式:空间冗余、时间冗余、视觉冗余、 信息熵冗余、结构冗余和知识冗余。
图像压缩编码方法
图像压缩编码方法图像压缩编码是一种通过减少图像数据的表示量来降低存储和传输成本的技术。
图像压缩编码方法包括有损压缩和无损压缩两种。
有损压缩是指在压缩过程中会丢失一定的图像信息,但通常可以接受的程度在人眼感知上是不可察觉的。
有损压缩编码方法主要通过利用图像中的冗余信息和人眼视觉系统的特性来实现图像的压缩,主要有几种方法:1. 颜色空间转换:将RBG图像转换为YUV或者将CMYK图像转换为RGB,通过减少颜色通道的数量来降低数据量。
2. 离散余弦变换(Discrete Cosine Transform,DCT):DCT是一种将原始图像通过变换后得到一系列频率系数的方法,低频系数所表示的信息对于人眼来说更加重要,而高频系数相对不重要,因此可以对高频系数进行压缩或丢弃。
3. 量化(Quantization):通过对DCT系数进行适当的量化,将系数的数值范围映射到较小的范围内,进一步减小数据量。
量化的精度越高,则数据量越小,但图像质量也会受到影响。
4. 预测编码(Predictive Coding):利用图像中像素之间的相关性,通过对当前像素值的预测来减少需要传输的数据。
常用的预测编码方法有差值编码(Differential Encoding)和运动补偿(Motion Compensation)。
5. 生成码字(Codebook):通过统计图像中各个像素值的频次来生成一个码本,将高频次出现的像素值用较短的码字表示,以减小数据量。
有损压缩编码方法的主要优点是压缩率高,但缺点是压缩后图像质量有损失。
适用于图像中存在较多冗余信息或对图像质量要求不高的场景,如网络传输、存储等。
无损压缩编码是指在压缩过程中不丢失任何图像信息,通过利用图像内部的冗余性来减小数据量。
常用的无损压缩编码方法有:1. 霍夫曼编码(Huffman Coding):将出现频率较高的像素值用较短的编码表示,出现频率较低的像素值用较长的编码表示,以减小数据量。
第七章图像压缩编码(JPEG 2K).
学习内容
一、行程编码 二、JPEG压缩标准 (基于DCT的有损编码算法)
三、JPEG2000压缩标准(小波变换压缩算法)
高中信息技术(选修2) 多媒体技术应用
教育科学出版社
第二章 图形、图像
2.1.4 图形、图像文件的压缩
图像压缩基本过程 变换 量化 编码
高中信息技术(选修2)
利用一滤波器组通过重复卷积的方法,经取样将
输入端信号分解为高频分量和低频分量,然后分
别对高频和低频分量用与其统计特性相匹配的编
码器进行量化和编码,解码时高频分量和低频分
量经过插值和共轭滤波综合成重建图像。
2、Mallat算法
2、Mallat算法
2、Mallat算法
一级分解 三级分解
LH HH
LL HL
H tuh 行合并
HL L
tul
H tuh
L
tul
图像分解与合并过程
(4)列合并过程
H tuh 列合并 H tuh
HL
L tul
L
tul
图像分解与合并过程
(二)一次分解过程
256 128 256
原图 tu
256
256
128 256
H tuh
列分解
128 256
HH tuh
HL tul tu15(128,128)
图像分解与合并过程
(二)一次合并过程
(3)hetu1和hetu2进行行合并
128 256
128
LH tu4
L
128
LL tu3 行合并
128 256
128
256
hetu2(128,256) 256
图像压缩编码
小波变换在图像压缩中的应用学院精密仪器与光电子工程学院专业光学工程年级2014级学号1014202009姓名孙学斌一、图像压缩编码数字图像图像是自然界景物的客观反映。
自然界的图像无论在亮度、色彩,还是空间分布上都是以模拟函数的形式出现的,无法采用数字计算机进行处理、传输和存储。
在数字图像领域,将图像看成是由许多大小相同、形状一致的像素(Picture Element简称Pixel组成)用二维矩阵表示。
图像的数字化包括取样和量化两个主要步骤。
在空间将连续坐标离散化的过程为取样,而进一步将图像的幅度值整数化的过程称为量化。
图像编码技术数据压缩就是以较少的数据量表示信源以原始形式所代表的信息,其目的在于节省存储空间、传输时间、信号频带或发送能量等。
其组成系统如图所示。
过程应尽量保证去除冗余量而不会减少或较少减少信息量,即压缩后的数据要能够完全或在一定的容差内近似恢复。
完全恢复被压缩信源信息的方法称为无损压缩或无失真压缩,近似恢复的方法称为有损压缩或有失真压缩。
图像压缩编码的必要性与可行性1.图像压缩编码的必要性采用数字技术会使信号处理技术性能大为提高,但其数据量的增加也是十分惊人的。
图像数据更是多媒体、网络通信等技术重点研究的压缩对象。
不加压缩的图像数据是计算机的处理速度、通信信道的容量等所无法承受的。
如果将上述的图像信号压缩几倍、十几倍、甚至上百倍,将十分有利于图像的存储和传输。
可见,在现有硬件设施条件下,对图像信号本身进行压缩是解决上述矛盾的主要出路。
2.图像压缩编码的可能性图像数据量大,同时冗余数据也是客观存在的。
在有些图像中可压缩的可能性很大。
一般图像中存在着以下数据冗余因素。
(1)编码冗余编码冗余也称信息熵冗余。
去除信源编码中的冗余量可以在对信息无损的前提下减少代表信息的数据量。
对图像进行编码时,要建立表达图像信息的一系列符号码本。
如果码本不能使每个像素所需的平均比特数最小,则说明存在编码冗余,就存在压缩的可能性。
图像压缩编码方法
图像压缩编码方法综述概述:近年来, 随着数字化信息时代的到来和多媒体计算机技术的发展, 使得人们所面对的各种数据量剧增, 数据压缩技术的研究受到人们越来越多的重视。
图像压缩编码就是在满足一定保真度和图像质量的前提下,对图像数据进行变换、编码和压缩,去除多余的数据以减少表示数字图像时需要的数据量,便于图像的存储和传输。
即以较少的数据量有损或无损地表示原来的像素矩阵的技术,也称图像编码。
图像压缩编码原理:图像数据的压缩机理来自两个方面:一是利用图像中存在大量冗余度可供压缩;二是利用人眼的视觉特性。
图像数据的冗余度又可以分为空间冗余、时间冗余、结构冗余、知识冗余和视觉冗余几个方面。
空间冗余:在一幅图像中规则的物体和规则的背景具有很强的相关性。
时间冗余:电视图像序列中相邻两幅图像之间有较大的相关性。
结构冗余和知识冗余:图像从大面积上看常存在有纹理结构,称之为结构冗余。
视觉冗余:人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像的变化并不都能察觉出来。
人眼的视觉特性:亮度辨别阈值:当景物的亮度在背景亮度基础上增加很少时,人眼是辨别不出的,只有当亮度增加到某一数值时,人眼才能感觉其亮度有变化。
人眼刚刚能察觉的亮度变化值称为亮度辨别阈值。
视觉阈值:视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就察觉不出来,高于它才看得出来,这是一个统计值。
空间分辨力:空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨力,视觉对于不同图像内容的分辨力不同。
掩盖效应:“掩盖效应”是指人眼对图像中量化误差的敏感程度,与图像信号变化的剧烈程度有关。
图像压缩编码的分类:根据编码过程中是否存在信息损耗可将图像编码分为:无损压缩:又称为可逆编码(Reversible Coding),解压缩时可完全回复原始数据而不引起任何失真;有损压缩:又称不可逆压缩(Non-Reversible Coding),不能完全恢复原始数据,一定的失真换来可观的压缩比。
图像压缩编码方法
图像压缩编码方法
图像压缩编码方法是通过减少图像数据的冗余部分来减小图像文件的大小,以便于存储和传输。
以下是常见的图像压缩编码方法:
1. 无损压缩:无损压缩方法可以压缩图像文件的大小,但不会丢失任何图像数据。
常见的无损压缩编码方法包括:
- Huffman编码:基于字符出现频率进行编码,将频率较低的字符用较长的编码表示,频率较高的字符用较短的编码表示。
- 预测编码:根据图像像素间的相关性进行编码,利用当前像素与附近像素的差异来表示像素值。
- 霍夫曼编码:利用霍夫曼树来对图像数据进行编码,降低数据的冗余度。
- 算术编码:根据符号的出现概率,将整个编码空间划分为不同部分,每个符号对应于不同的编码区域。
2. 有损压缩:有损压缩方法可以在压缩图像大小的同时,对图像数据进行一定的丢失,但尽量使丢失的数据对人眼不可见。
常见的有损压缩编码方法包括:
- JPEG压缩:基于离散余弦变换(DCT)的方法,将图像数据转换为频域表示,
然后根据不同频率成分的重要性进行量化和编码。
- 基于小波变换的压缩:将图像数据转换为频域表示,利用小波基函数将图像分解为低频和高频子带,然后对高频子带进行量化和编码。
- 层次编码:将原始图像数据分为不同的预测层次,然后对不同层次的误差进行编码,从而实现压缩。
需要注意的是,不同的压缩编码方法适用于不同类型的图像数据和压缩要求。
有些方法适用于需要高压缩比的情况,但会引入更多的失真,而有些方法适用于需要保留图像质量的情况,但压缩比较低。
因此,在选择图像压缩编码方法时,需要根据具体要求和应用场景进行权衡和选择。
数字图像处理图像压缩ppt课件
6
H Pxi log2 Pxi i 1 0.4log2 0.4 0.3log2 0.3 2 0.1log2 0.1
0.06log2 0.06 0.04log2 0.04
2.14bit
平均码长 N与H接近,N H
第七章 图像压缩
7.2 基础知识 7.2.1 数据冗余
• 数据冗余旳概念
数据是用来表达信息旳。假如不同旳措施为表 达给定量旳信息使用了不同旳数据量,那么使用 较多数据量旳措施中,有些数据必然是代表了无 用旳信息,或者是反复地表达了其他数据已表达 旳信息,这就是数据冗余旳概念。
第七章 图像压缩
7.2.1 数据冗余
元素
xi
x1
x2 x3 x4
x5
x6
概率 P(xi) 0.4 0.3 0.1 0.1 0.06 0.04
编码 wi 1 00 011 0100 01010 01011
第七章 图像压缩
x1 0.4
0.4
x2 0.3
0.3
x3 0.1
0.1
x4 0.1
0.1 (0100)
x5 0.06 (01010) 0.1(0101)
例如:原图像数据:234 223 231 238 235 压缩后数据:234 -11 8 7 -3
第七章 图像压缩
7.2.1 数据冗余
• 什么是心理视觉冗余?
这是因为眼睛对全部视觉信息感受旳敏捷度 不同。在正常视觉处理过程中多种信息旳相对主 要程度不同。 有些信息在一般旳视觉过程中与另 外某些信息相比并不那么主要,这些信息被以为 是心理视觉冗余旳,清除这些信息并不会明显降 低图像质量。
• 三种基本旳数据冗余
编码冗余 像素间冗余 心理视觉冗余
图像压缩编码
图像压缩编码多媒体技术实验—图像压缩编码一、实验目的1.了解有关数字图像压缩的基本概念,了解几种常用的图像压缩编码方式;2.进一步熟悉JPEG编码与离散余弦变换(DCT)变换的原理及含义;3.掌握编程实现离散余弦变换(DCT)变换及JPEG编码的方法;4.对重建图像的质量进行评价。
二、实验原理1、图像压缩基本概念及原理图像压缩主要目的是为了节省存储空间,增加传输速度。
图像压缩的理想标准是信息丢失最少,压缩比例最大。
不损失图像质量的压缩称为无损压缩,无损压缩不可能达到很高的压缩比;损失图像质量的压缩称为有损压缩,高的压缩比是以牺牲图像质量为代价的。
压缩的实现方法是对图像重新进行编码,希望用更少的数据表示图像。
应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分为以下3类:(1)无损压缩编码种类哈夫曼(Huffman)编码,算术编码,行程(RLE)编码,Lempel zev编码。
(2)有损压缩编码种类预测编码,DPCM,运动补偿;频率域方法:正交变换编码(如DCT),子带编码;空间域方法:统计分块编码;模型方法:分形编码,模型基编码;基于重要性:滤波,子采样,比特分配,向量量化;(3)混合编码JBIG,H.261,JPEG,MPEG等技术标准。
2、JPEG 压缩编码原理JPEG是一个应用广泛的静态图像数据压缩标准,其中包含两种压缩算法(DCT 和DPCM),并考虑了人眼的视觉特性,在量化和无损压缩编码方面综合权衡,达到较大的压缩比(25:1以上)。
JPEG既适用于灰度图像也适用于彩色图像。
其中最常用的是基于DCT变换的顺序式模式,又称为基本系统。
JPEG 的压缩编码大致分成三个步骤:(1)使用正向离散余弦变换(forward discrete cosine transform,FDCT)把空间域表示的图变换成频率域表示的图。
(2)使用加权函数对DCT系数进行量化,该加权函数使得压缩效果对于人的视觉系统最佳。
图像压缩编码原理ppt-课件
× DCT
在图像的运动处理中主要有两个过程。
对于函数Ψ(x)∈L2(R),当且仅当其傅立叶变换Φ(ω)满足条件
DCT 第一个过程为运动估计(Motion Estimation,ME)。 视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就察觉不出来,高于它才看得出来,这是一个统计值。
8 的
把图像分成若干子块,设子块图像是由N×N个像素组成的像块,并假设一个像块内的所有像素作一致的平移运动。 图像数据的压缩机理来自两个方面:一是利用图像中存在大量冗余度可供压缩;
p(xi ) 1,
则符号xi所携带的信息量定义为i1
I(xi)=log2(1/p(xi))
2.信息“熵”
如果将信源所有可能时间的信息量进 行平均,就得到了信源中每个符号的平均 信息量,又称为信息的熵,可表示为
N
N
H (X )p (x i)lo 2 ( 1 /g p (x i) )p (x i)lo 2p (x g i)
f(x,y)2F(u,v)2
x0y0
u0v0
2 . 能 量 集 中 性 ( Energy
Compaction)
大部分正交变换趋向将图像的大部分 能量集中到相对少数几个系数上,由于整 个能量守恒,因此这意味着许多变换系数 只含有很少的能量。
3.去相关性(Decorrelation)
当输入的像素高度相关时,变换系数 趋向于不相关。
图像压缩编码原理
3.1 压缩编码基础 3.2 预 测 编 码 3.3 正交变换编码 3.4 统 计 编 码 3.5 子 带 编 码 3.6 小波变换编码
3.1 压缩编码基础
图像数据的压缩机理来自两个方面: 一是利用图像中存在大量冗余度可供压缩; 二是利用人眼的视觉特性。
《图像的编码与压缩》课件
图像压缩技术
离散余弦变换(DCT)
定义:离散余弦变换是一种将图像从空间域转换到频域的算法
特点:DCT具有较好的能量压缩能力,能够去除图像中的冗余信息
应用:在图像压缩领域,DCT被广泛应用于JPEG等标准中
压缩原理:通过将图像分成8x8的块,对每个块进行DCT变换,将变换后的系数进行量 化,最后进行逆变换得到压缩后的图像
《图像的编码与压缩》PPT课 件
汇报人:
单击输入目录标题 图像编码与压缩概述 图像编码技术 图像压缩技术 图像编码与压缩的应用 图像编码与压缩的未来发展
添加章节标题
图像编码与压缩概述
图像编码与压缩的定义
图像编码:将图像信息转换为数字信号的过程 图像压缩:通过去除冗余信息来减小图像文件大小的过程 编码与压缩的目的:提高存储效率、降低传输带宽、节省存储空间等 常见图像编码与压缩标准:JPEG、PNG、GIF等
图像编码与压缩的目的
减少图像数据存储空间 提高图像传输效率 便于图像的编辑与处理 适应不同的应用需求
图像编码与压缩的分类
图像编码的分类:有损压缩和无损压缩 图像压缩的分类:有损压缩和无损压缩 有损压缩:去除图像中的冗余信息,减小文件大小 无损压缩:保留图像中的所有信息,不改变文件大小
图像编码技术
数字电视广播具有抗干扰能力强、 传输距离远等优点
添加标题
添加标题
添加标题
添加标题
数字电视广播采用高效压缩技术, 提高了图像传输效率和图像质量
数字电视广播已经成为现代社会重 要的信息传播方式之一
数字相机和手机
数字相机和手机中常用的图像编码与压缩技术 这些技术在数字相机和手机中的应用场景和优势 数字相机和手机中图像编码与压缩技术的具体实现方式 未来数字相机和手机中图像编码与压缩技术的发展趋势
图像压缩编码ppt课件
7.1.3、 图像压缩编码分类 (Coding methods of Image Compression
数字图像压缩编码分类方法有很多,但从不同的角度,可以有 不同的划分。从信息论角度分,可以将图像的压缩编码方法分为无 失真压缩编码和有限失真编码。
无失真图像压缩编码利用图像信源概率分布的不均匀性, 通过变长编码来减少信源数据冗余,使编码后的图像数据接 近其信息熵而不产生失真,因而也通常被称为熵编码。
图7.3 时间冗余
8
7.1.2、图像数据冗余 (Image data redundancy)
3. 信息熵冗余
信息熵冗余是针对数据的信息量而言的。设某种编码的平均码长 为
k 1
L p(si )l(si ) i0
式中,l(si )为分配给第符号 si 的比特数,p(si为) 符号出现的概率。
这种压缩的目的就是要使L接近 H X
随着人们认识的深入,某些图像所具有的先验知识,如人脸 图像的固有结构(包括眼、耳、鼻、口等)为人们所熟悉。这些由 先验知识得到的规律结构就是知识冗余。
6. 视觉冗余
由于人眼的视觉特性所限,人眼不能完全感觉到图像画面的所有细 小的变化。例如人眼的视觉对图像边缘的剧烈变化不敏感,而对图 像的亮度信息非常敏感,因此经过图像压缩后,虽然丢了一些信息, 但从人眼的视觉上并未感到其中的变化,而仍认为图像具有良好的 质量。
有限失真编码则是根据人眼视觉特性,在允许图像产生一 定失真的情况下(尽管这种失真常常不为人眼所觉察),利用 图像信源在空间和时间上具有较大的相关性这一特点,通过某 一种信号变换来消除信源的相关性、减少信号方差,达到压缩 编码的目的。
12
7.1.4、压缩技术的性能指标(Evaluation Index of Image Compression approaches)
电视原理课件之图像压缩编码原理
电视原理课件之图像压缩编码原理2023-10-27CATALOGUE目录•图像压缩编码概述•图像压缩编码技术分类•图像压缩编码原理及实现方法•图像压缩编码性能评估及优化方法•JPEG压缩编码算法详解及实例演示•H.264视频压缩编码技术详解及实例演示01图像压缩编码概述图像压缩编码的概念图像压缩编码是一种通过特定算法对图像数据进行压缩的技术。
它可以将图像数据的大小和存储需求降低,以便在有限的存储空间内存储更多的图像数据。
压缩后的图像数据可以通过解压缩算法进行还原,以便在显示或传输过程中使用。
010203图像压缩编码的必要性通过图像压缩编码技术,可以大大降低图像数据的存储空间和传输成本。
图像数据量巨大,占用存储空间大,传输成本高。
同时,图像压缩编码技术还可以提高图像数据的处理速度和效率。
图像压缩编码技术的发展历程基于DCT(离散余弦变换)的压缩技术这是最早的图像压缩技术之一,它通过对图像数据进行DCT变换,将图像数据从空间域转换到频域,并对频域数据进行量化,从而实现图像数据的压缩。
基于小波变换的压缩技术小波变换是一种信号分析方法,它可以将信号分解成多个频带,并对每个频带进行精细的分析。
基于小波变换的压缩技术利用小波变换的特性,对图像数据进行多级分解,并对每个频带进行压缩,从而实现图像数据的压缩。
基于神经网络的压缩技术神经网络是一种模拟人脑神经元网络结构的计算模型,它可以自动学习并识别图像中的特征和模式。
基于神经网络的压缩技术利用神经网络的特性,对图像数据进行自动编码和解码,从而实现图像数据的压缩和解压缩。
02图像压缩编码技术分类基于像素的压缩编码预测编码利用像素之间的相关性进行预测,然后对预测误差进行编码,例如差分脉冲编码(DPCM)。
变换编码将图像数据进行频率变换,例如傅里叶变换、离散余弦变换(DCT),然后将变换后的数据进行量化和编码。
统计编码利用图像数据的统计特性进行编码,例如游程编码、算术编码等。
第7章 图像编码与压缩
思考:该图像的熵是多少?
2.77(bit)
(2) 象素间冗余 图像内部相邻像素之间存在较强的相关性所造成 的冗余 规则 冗余大
1 0.8 0.6 0.4 0.2 0 0 5 10 15 20 25
不规则 冗余小
1 0.8 0.6 0.4 0.2 0 0 5 10 15 20 25
(3)心理视觉冗余
信息熵
H pi log2 pi
i 0
L 1
压缩后平均码长
B i pi
i 0
L 1
i 是灰度级i的编码长度,pi是灰度级i出现的概率
冗余度定义为:
编码效率为:
B r 1 H H 1 B 1 r
当经过编码压缩后,图像信息的冗余度接近于零,或 编码效率接近于1,这类编码方法称为高效编码。
ˆ ( x, y) f ( x, y) e( x, y) f
M 1 N 1
图误差
均方根误差
x 0 y 0
fˆ ( x, y) f ( x, y)
1 M 1 MN x 0
N 1 y 0
erms
2 ˆ f ( x, y ) f ( x, y )
排序
输入 输入概率 0.22 6 0.20 5 0.16 7 0.14 4 0.12 3 0.09 2 0.05 1 0.02 0
Huffman编码
输入概率 第1步 第2步 6 0.22 0.22 0.22 5 0.20 0.20 0.20 7 0.16 0.16 0.16 4 0.14 0.14 0.16 3 0.12 0.12 0.14 2 0.09 0.09 0.12 1 0.05 0.07 0 0.02
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
技术准备:什么是熵
熵——来源于40年代由Claude Shannon创立的信息论中的一条定理,这 一定理借用了热力学中的名词“熵”( Entropy )来表示一条信息中真正 需要编码的信息量: 考虑用 0 和 1 组成的二进制数码为含有 n 个符号的某条信息编码, 假设符号 Fn 在整条信息中重复出现的概率为 Pn,则该符号的熵也即 表示该符号所需的二进制位数为: En = - log2( Pn ) 整条信息的熵也即表示整条信息所需的二进制位数为: E = ∑knEn 例:对信息aabbaccbaa,字符串长度为 10,字符a、b、c分别出现了5、 3、2次,则 Ea=-log2(0.5)=1 Eb=-log2(0.3)=1.737 Ec=-log2(0.2)=2.322 E= 5Ea + 3Eb + 2Ec =14.855 位 对比一下,我们用ASCII编码表示该信息需要80位
算术编码对整条信息(无论信息有多么长),其输出仅仅 是一个数,而且是一个介于0和1之间的二进制小数。 例如算术编码对某条信息的输出为1010001111,那么它 表示小数0.1010001111,也即十进制数0.64
算术编码
例:考虑某条信息中可能出现的字符仅有 a b c 三种,我们要压 缩保存的原始信息为 bccb 第一步:在没有开始压缩进程之前,假设我们对 a b c 三者在信息中 第一步 的出现概率一无所知(我们采用的是自适应模型),即认为三者的出现 概率相等,也就是都为1/3,我们将0-1区间按照概率的比例分配给三个 字符,即a从0.0000到0.3333,b从0.3333到0.6667,c从0.6667到 1.0000。用图形表示就是: 1.0000 Pc = 1/3 0.6667 Pb = 1/3 Pa = 1/3 0.3333 0.0000
a b c d e
– – – – -
16 7 6 6 5
例子中的信息编码为: 例子中的信息编码为: 11 00 01 11 101 100 101 00 11 00 11 ...... 码长共91位 而使用ASCII编码表示上述信息共需要 编码表示上述信息共需要240位 码长共 位,而使用 编码表示上述信息共需要 位
第七章图象数据压缩技术
压缩技术简史 压缩技术基础 Huffman编码 编码 算术编码 LZ77和LZW算法 和 算法 JPEG算法 算法 小波分析用于静止图像编码
压缩技术分类
通用数据压缩(均为无损压缩) 多媒体数据压缩(无损和有损压缩)
基于统计模型 的压缩技术
基于字典模型 的压缩技术
图像压缩
音频和视频压缩 MPEG等 MPEG等
信息论
信息存在冗余 通过采用一定 的模型和编码方法, 的模型和编码方法, 可以降低这种冗余度
贝尔实验室的 Claude Shannon 和 MIT 的 R.M.Fano 几乎同时提出了最早的对符号进行有效编码 从而实现数据压缩的 Shannon-Fano 编码方法。
D.A.Huffman
1952 年 发表论文:“最小冗余度代码的构造方法” A Method for the Construction of Minimum Redundancy Codes UNIX 系统上一个不太为现代人熟知的压缩程序 COMPACT 就是 Huffman 0 阶自适应编码的具体实现 80 年代初,Huffman 编码又在 CP/M 和 DOS 系统 中实现,其代表程序叫 SQ Huffman时代:60 年代、70 年代乃至 80 年代的早期 时代: 年代、
算术编码
例:考虑某条信息中可能出现的字符仅有 a b c 三种,我们要压 缩保存的原始信息为 bccb 第二步:现在我们拿到第一个字符b,让我们把目光投向b对应的区间 第二步 0.3333-0.6667。这时由于多了字符b,三个字符的概率分布变成: Pa=1/4,Pb=2/4,Pc=1/4。好,让我们按照新的概率分布比例划分 0.3333-0.6667这一区间,划分的结果可以用图形表示为: Pc = 1/4 Pb = 2/4 0.4167 Pa = 1/4 0.3333 0.6667 0.5834
通用数据压缩
80年代中期以后,对LZ77算法进行改进
Haruyasu Yoshizaki(Yoshi) 的 LHarc Robert Jung 的 ARJ
从PKZip到WinZip: 通用数据压缩格式标准 —— ZIP
LZ77、LZ78、LZW 一起垄断当今的通用数据压缩领域
多媒体数据压缩
国际电报电话咨询委员会( CCITT ) :针对二值图像的一系列压缩标 准,如 CCITT Group3、CCITT Group4 等 (此外还包括CCITT与ISO共 同制订的JBIG标准) 。 70 年代末 80 年代初:数学家们提出了损失压缩精度以换取压缩 ( ) 率的崭新思路。国际标准化组织( ISO )和 CCITT 联合组成了两个 委员会:静态图像联合专家小组( JPEG )和动态图像联合专家小组 ( MPEG )。诞生了 JPEG、MPEG-1、MPEG-2、MPEG-4、MPEG-7 等 系列标准。 PostScript矢量图形格式:起源于 1976 年的 Evans & Sutherland 计算机 公司,当时的名字是 Design System。1978 年,John Warnock 和 Martin Newel 将其演变为 JAM 语言。1982 年,John Warnock 和 Chuck Geschke 创建了著名的 Adobe System 公司,第三次设计和实现 了这个语言,并称其为 PostScript。
接近极限——熵
80年代早期,数学家们设计出算术编码方法(Arithmetic Coding) 算术编码是部分匹配预测(Predication by Partial matching, )技术的变体 可以证明,算术编码得到的压缩效果可以最大地减小 信息的冗余度,用最少量的符号精确表达原始信息内容 但是,在同样的计算机系统上,算术编码虽然可以得到 最好的压缩效果,却要消耗也许几十倍的计算时间
字典编码时代:LZ77和LZ78压缩算法 字典编码时代:
LZW算法
Terry Welch
1984 年 发表论文:“高性能数据压缩技术” A Technique for High-Performance Data Compression Welch 实现了 LZ78 算法的一个变种 —— LZW算法 LZW算法 UNIX:使用 LZW 算法的 Compress 程序 MS-DOS:ARC 程序,以及PKWare、PKARC 等仿制品。
Huffman编码
cabcedeacacdeddaaabaababaaabbacdebaceada root a b c d e – – – – 16 7 6 6 5 0 0 0 b c 1 0 d e 1 1 1 a a b c d e – – – – – 1 000 001 010 011
例子中的信息编码为: 例子中的信息编码为: 001 1 000 001 011 010 011 1 001 1 001 ...... 码长88位 码长 位,比Shannon-Fano编码略短一些 编码略短一些
技术准备:模型
使用模型:得到字符或单词在信息中出现的概率 静态/半静态模型 统计模型 自适应模型 静态字典模型 字典模型 自适应字典模型
Claude Shannon的“聚会游戏”(party game): 他每次向听众公布一条被他隐藏起一个字符的消息,让听众来猜下 一个字符,一次猜一个,直到猜对为止。然后,Shannon 使用猜测 次数来确定整个信息的熵。(人的语言经验)
Huffman 编码
算术编码
二值图像 CCITT JBIG等 JBIG等 LZW 灰度图像 FELICS JPEG等 JPEG等
彩色图像 RLE编码 RLE编码 JPEG等 JPEG等
LZ77
LZ78
矢量图像 PostScript WMF CAD等 CAD等
压缩技术的应用
编译(JAVA)
人工智能(专家系统/知识树) 程序设计(算法/空间和时间效率)
以色列人
Jacob Ziv 和 Abraham Lempel
1977 年 发表论文:“顺序数据压缩的一个通用算法” A Universal Algorithm for Sequential Data Compression 1978 年 发表论文:“通过可变比率编码的独立序列的压缩” Compression of Individual Sequences via Variable-Rate Coding
Huffman编码的模型选择
奇怪的段落 If Youth,throughout all history,had had a champion to stand up for it;to show a doubting world that a child can think;and, possibly,do it practically;you wouldn't constantly run across folks today who claim that "a child don't know anything.“ - Gadsby by E.V.Wright, 1939.
全文索引(倒排索引表) 密码学(消除数据的原始特征) 文件系统(压缩扇区) 音频(MP3) 数据库(B+树) 归档(TAR/ZIP) 图像(GIF/TIFF/JPEG) 存储(压缩池) 电报、传真(CCITT) 通讯(Modem/网络协议) 视频(MPEG/RM)
压缩技术起源
信息压缩技术的起源…… 比计算机的发明早几千年……
另:Huffman编码还有一个变种——范式Huffman编码,可以有 效减少编码字典的存储空间。
算术编码
假设某个字符的出现概率为 80%,该字符事实上只需要 -log2(0.8) = 0.322 个二进制位进行编码 难道真的能只输出 0.322 个 0 或 0.322 个 1 吗?