第三章 图像压缩编码 (2)

合集下载

图像编码与压缩的关系解析(二)

图像编码与压缩的关系解析(二)

图像编码与压缩的关系解析引言:随着科技的不断发展,图像在日常生活中的应用越来越普遍。

然而,高清图片通常占用较大的存储空间,不利于传输和存储。

为了解决这个问题,图像编码与压缩技术应运而生。

本文将从理论、算法和应用三个方面,探讨图像编码与压缩之间的关系。

一、图像编码的原理与方法1. 图像编码的基本原理图像编码是将图像通过某种数学模型进行数值表示,从而实现对图片信息的压缩。

这一过程主要包括采样、量化和编码三个步骤。

采样将连续的图像转换为离散的信号,量化将连续的信号转换为离散的数值,而编码则是利用特定的编码方式将数值进行压缩存储。

2. 图像编码的方法常用的图像编码方法包括无损编码和有损编码。

无损编码保持图像质量不变,包括RLE(Run Length Encoding)、Huffman编码和LZW (Lempel-Ziv-Welch)编码等。

而有损编码则通过牺牲一定的细节和精度来实现更高的压缩率,代表性的有损编码方式有JPEG、以及WebP 等。

二、图像压缩的原理与方法1. 图像压缩的基本原理图像压缩是对图像数据进行有损或无损的压缩,以减小图像数据的体积。

图像压缩技术主要包括空域压缩和变换域压缩两种方法。

空域压缩利用空间冗余性进行数据压缩,该方法通常使用预测编码或差分编码等技术。

变换域压缩则通过将图像转换到频域进行压缩,常用的方式有离散余弦变换(DCT)。

2. 图像压缩的方法图像压缩方法可以分为无损压缩和有损压缩两类。

无损压缩通过减小冗余和利用编码等技术实现图像数据的压缩,以保持图像质量不变。

有损压缩则根据人眼对图像细节的敏感度,通过舍弃部分细节信息来实现更高的压缩率。

常见的图像压缩算法有LZ77、LZ78、DEFLATE 以及JPEG、HEVC等。

三、图像编码与压缩的关系1. 编码与压缩的异同编码和压缩都是对图像数据进行处理以实现压缩效果,但两者有不同的侧重点。

编码主要集中在信号表示的优化,通过数值表达来压缩图像数据及降低存储和传输成本;而压缩则更注重图像数据的压缩率,旨在减小数据量的同时保持较高的图像质量。

图像压缩与编码

图像压缩与编码

实验项目3、图像压缩与编码一、实验目的(1)理解图像压缩编码的基本原理;(2)掌握用程序代码实现DCT变换编码;(3)掌握用程序代码实现游程编码。

二、实验原理及知识点1、图像压缩编码图像信号经过数字化后,数据量相当大,很难直接进行保存。

为了提高信道利用率和在有限的信道容量下传输更多的图像信息,必须对图像进行压缩编码。

图像压缩技术标准一般可分为如下几种:JPEG压缩(JPEG Compression)、JPEG 2000、H.26X标准(H.26X standards)以及MPEG标准(MPEG standards)。

数字压缩技术的性能指标包括:压缩比、平均码字长度、编码效率、冗余度。

从信息论角度分,可以将图像的压缩编码方法分为无失真压缩编码和有限失真编码。

前者主要包括Huffman编码、算术编码和游程编码;后者主要包括预测编码、变换编码和矢量量化编码以及运动检测和运动补偿技术。

图像数据压缩的目的是在满足一定图像质量的条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量,在信息论中称为信源编码。

图像压缩是通过删除图像数据中冗余的或者不必要的部分来减小图像数据量的技术,压缩过程就是编码过程,解压缩过程就是解码过程。

2、游程编码某些图像特别是计算机生成的图像往往包含许多颜色相同的块,在这些块中,许多连续的扫描行或者同一扫描行上有许多连续的像素都具有相同的颜色值。

在这些情况下就不需要存储每一个像素的颜色值,而是仅仅存储一个像素值以及具有相同颜色的像素数目,将这种编码方法称为游程(或行程)编码,连续的具有相同颜色值的所有像素构成一个行程。

在对图像数据进行编码时,沿一定方向排列的具有相同灰度值的像素可看成是连续符号,用字串代替这些连续符号,可大幅度减少数据量。

游程编码记录方式有两种:①逐行记录每个游程的终点列号:②逐行记录每个游程的长度3、DCT变换编码变换编码是在变换域进行图像压缩的一种技术。

4-图像压缩与编码2算术编码等

4-图像压缩与编码2算术编码等

5
[0.5143, 0.51442]
10
0.51439在间隔[0.514, 0.5146)的第5个1/10
6
[0.514384, 0.51442]
11
0.51439在间隔[0.5143, 0.51442)的第7个1/10
7
[0.51439, 0.5143948]
01
0.51439在间隔[0.51439, 0.5143948]的第1个1/10
(1)首先在1和0之间给每个符号分配一个初 始子间隔,子间隔的长度等于它的概率, 初始子间隔的范围用I1=[l1,r1]=[Σpi-1,Σpi] 表示。令d1=r1-l1,L=l1和R=r1。 (2)L和R的二进制表达式分别表示为: L=Σμk2-k和R=Συk2-k 其中μ k和υ k等于“1”或者“0”。 比较u1和v1,若不等,不发送任何数据, 转到步骤3,若相等,就发送二进制符号 u1
算术编码可以是静态的或者自适应的。 在静态算术编码中,信源符号的概率是固 定的。在自适应算术编码中,信源符号的 概率根据编码时符号出现的频繁程度动 态地进行修改,在编码期间估算信源符号 概率的过程叫做建模。需要开发动态算 术编码的原因是因为事先知道精确的信 源概率是很难的,而且是不切实际的。当 压缩消息时,我们不能期待一个算术编码 器获得最大的效率,所能做的最有效的方 法是在编码过程中估算概率。因此动态 建模就成为确定编码器压缩效率的关键。
LZ77算法
LZ77编码算法的核心是查找从前向缓冲存储器开始的最长的匹配串。编码算 法的具体执行步骤如下:
(1) 把编码位置设置到输入数据流的开始位置。 (2) 查找窗口中最长的匹配串。 (3) 以“(Pointer, Length) Characters”的格式输出,

图像压缩编码方法

图像压缩编码方法

图像压缩编码方法图像压缩编码是一种通过减少图像数据的表示量来降低存储和传输成本的技术。

图像压缩编码方法包括有损压缩和无损压缩两种。

有损压缩是指在压缩过程中会丢失一定的图像信息,但通常可以接受的程度在人眼感知上是不可察觉的。

有损压缩编码方法主要通过利用图像中的冗余信息和人眼视觉系统的特性来实现图像的压缩,主要有几种方法:1. 颜色空间转换:将RBG图像转换为YUV或者将CMYK图像转换为RGB,通过减少颜色通道的数量来降低数据量。

2. 离散余弦变换(Discrete Cosine Transform,DCT):DCT是一种将原始图像通过变换后得到一系列频率系数的方法,低频系数所表示的信息对于人眼来说更加重要,而高频系数相对不重要,因此可以对高频系数进行压缩或丢弃。

3. 量化(Quantization):通过对DCT系数进行适当的量化,将系数的数值范围映射到较小的范围内,进一步减小数据量。

量化的精度越高,则数据量越小,但图像质量也会受到影响。

4. 预测编码(Predictive Coding):利用图像中像素之间的相关性,通过对当前像素值的预测来减少需要传输的数据。

常用的预测编码方法有差值编码(Differential Encoding)和运动补偿(Motion Compensation)。

5. 生成码字(Codebook):通过统计图像中各个像素值的频次来生成一个码本,将高频次出现的像素值用较短的码字表示,以减小数据量。

有损压缩编码方法的主要优点是压缩率高,但缺点是压缩后图像质量有损失。

适用于图像中存在较多冗余信息或对图像质量要求不高的场景,如网络传输、存储等。

无损压缩编码是指在压缩过程中不丢失任何图像信息,通过利用图像内部的冗余性来减小数据量。

常用的无损压缩编码方法有:1. 霍夫曼编码(Huffman Coding):将出现频率较高的像素值用较短的编码表示,出现频率较低的像素值用较长的编码表示,以减小数据量。

图像压缩编码方法

图像压缩编码方法

图像压缩编码方法综述概述:近年来, 随着数字化信息时代的到来和多媒体计算机技术的发展, 使得人们所面对的各种数据量剧增, 数据压缩技术的研究受到人们越来越多的重视。

图像压缩编码就是在满足一定保真度和图像质量的前提下,对图像数据进行变换、编码和压缩,去除多余的数据以减少表示数字图像时需要的数据量,便于图像的存储和传输。

即以较少的数据量有损或无损地表示原来的像素矩阵的技术,也称图像编码。

图像压缩编码原理:图像数据的压缩机理来自两个方面:一是利用图像中存在大量冗余度可供压缩;二是利用人眼的视觉特性。

图像数据的冗余度又可以分为空间冗余、时间冗余、结构冗余、知识冗余和视觉冗余几个方面。

空间冗余:在一幅图像中规则的物体和规则的背景具有很强的相关性。

时间冗余:电视图像序列中相邻两幅图像之间有较大的相关性。

结构冗余和知识冗余:图像从大面积上看常存在有纹理结构,称之为结构冗余。

视觉冗余:人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像的变化并不都能察觉出来。

人眼的视觉特性:亮度辨别阈值:当景物的亮度在背景亮度基础上增加很少时,人眼是辨别不出的,只有当亮度增加到某一数值时,人眼才能感觉其亮度有变化。

人眼刚刚能察觉的亮度变化值称为亮度辨别阈值。

视觉阈值:视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就察觉不出来,高于它才看得出来,这是一个统计值。

空间分辨力:空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨力,视觉对于不同图像内容的分辨力不同。

掩盖效应:“掩盖效应”是指人眼对图像中量化误差的敏感程度,与图像信号变化的剧烈程度有关。

图像压缩编码的分类:根据编码过程中是否存在信息损耗可将图像编码分为:无损压缩:又称为可逆编码(Reversible Coding),解压缩时可完全回复原始数据而不引起任何失真;有损压缩:又称不可逆压缩(Non-Reversible Coding),不能完全恢复原始数据,一定的失真换来可观的压缩比。

图像压缩编码方法

图像压缩编码方法

图像压缩编码方法
图像压缩编码方法是通过减少图像数据的冗余部分来减小图像文件的大小,以便于存储和传输。

以下是常见的图像压缩编码方法:
1. 无损压缩:无损压缩方法可以压缩图像文件的大小,但不会丢失任何图像数据。

常见的无损压缩编码方法包括:
- Huffman编码:基于字符出现频率进行编码,将频率较低的字符用较长的编码表示,频率较高的字符用较短的编码表示。

- 预测编码:根据图像像素间的相关性进行编码,利用当前像素与附近像素的差异来表示像素值。

- 霍夫曼编码:利用霍夫曼树来对图像数据进行编码,降低数据的冗余度。

- 算术编码:根据符号的出现概率,将整个编码空间划分为不同部分,每个符号对应于不同的编码区域。

2. 有损压缩:有损压缩方法可以在压缩图像大小的同时,对图像数据进行一定的丢失,但尽量使丢失的数据对人眼不可见。

常见的有损压缩编码方法包括:
- JPEG压缩:基于离散余弦变换(DCT)的方法,将图像数据转换为频域表示,
然后根据不同频率成分的重要性进行量化和编码。

- 基于小波变换的压缩:将图像数据转换为频域表示,利用小波基函数将图像分解为低频和高频子带,然后对高频子带进行量化和编码。

- 层次编码:将原始图像数据分为不同的预测层次,然后对不同层次的误差进行编码,从而实现压缩。

需要注意的是,不同的压缩编码方法适用于不同类型的图像数据和压缩要求。

有些方法适用于需要高压缩比的情况,但会引入更多的失真,而有些方法适用于需要保留图像质量的情况,但压缩比较低。

因此,在选择图像压缩编码方法时,需要根据具体要求和应用场景进行权衡和选择。

图像压缩编码

图像压缩编码

图像压缩编码多媒体技术实验—图像压缩编码一、实验目的1.了解有关数字图像压缩的基本概念,了解几种常用的图像压缩编码方式;2.进一步熟悉JPEG编码与离散余弦变换(DCT)变换的原理及含义;3.掌握编程实现离散余弦变换(DCT)变换及JPEG编码的方法;4.对重建图像的质量进行评价。

二、实验原理1、图像压缩基本概念及原理图像压缩主要目的是为了节省存储空间,增加传输速度。

图像压缩的理想标准是信息丢失最少,压缩比例最大。

不损失图像质量的压缩称为无损压缩,无损压缩不可能达到很高的压缩比;损失图像质量的压缩称为有损压缩,高的压缩比是以牺牲图像质量为代价的。

压缩的实现方法是对图像重新进行编码,希望用更少的数据表示图像。

应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分为以下3类:(1)无损压缩编码种类哈夫曼(Huffman)编码,算术编码,行程(RLE)编码,Lempel zev编码。

(2)有损压缩编码种类预测编码,DPCM,运动补偿;频率域方法:正交变换编码(如DCT),子带编码;空间域方法:统计分块编码;模型方法:分形编码,模型基编码;基于重要性:滤波,子采样,比特分配,向量量化;(3)混合编码JBIG,H.261,JPEG,MPEG等技术标准。

2、JPEG 压缩编码原理JPEG是一个应用广泛的静态图像数据压缩标准,其中包含两种压缩算法(DCT 和DPCM),并考虑了人眼的视觉特性,在量化和无损压缩编码方面综合权衡,达到较大的压缩比(25:1以上)。

JPEG既适用于灰度图像也适用于彩色图像。

其中最常用的是基于DCT变换的顺序式模式,又称为基本系统。

JPEG 的压缩编码大致分成三个步骤:(1)使用正向离散余弦变换(forward discrete cosine transform,FDCT)把空间域表示的图变换成频率域表示的图。

(2)使用加权函数对DCT系数进行量化,该加权函数使得压缩效果对于人的视觉系统最佳。

数字图像处理第三章 图象处理中的压缩编码

数字图像处理第三章 图象处理中的压缩编码

小波分解的不同分辨级或不同尺度和不同方 向的系数有一定对应关系,可以构成小波树, 如图3-4所示小波三级分解树结构。阴影部分 低频区每一根节点分出水平,垂直和对角三 个节点。这三个节点再向各自方向生长出四 个分支,各分支再向各自方向生长出四个分 支,直到结束。按照各自方向生长出分支形 成的树结构如图3-4 (b)所示,每个树分支的节 点数为 21个(1+4+16),定义垂直和水平矢量 量化为21维矢量。
矢量激励编码在语音压缩编码中获得成功地运 用。矢量激励编码保持了VQ矢量的高效性, 并且使码本大小大为减少。在码激励线性预测 (CELP)中,操作处理是一个时变滤波器。滤波 器的参数是对输入矢量X(n)的线性预测分析来 确定。把每个m个输入矢量集对应的滤波器参 数进行量化,并把它和剩余量化矢量的码本传 输给接收机。在闭环的CELP中,滤波器的参 数经过量化后,可以获得最佳重建的剩余项被 确定和传输。闭环的CELP技术在语音数据编 码中获得非常成功的应用。二维图象的CELP 可以使预测后的剩余量的矢量量化码本减小, 其操作过程正如语音中的闭环的CELP技术。
3. 根据各子图象的空间与频率对应关系,只 对低频(亮度)子图象计算均值。因为 WT 能 使信号能量集中于低频子图象,低频子图象变 化相对缓慢,其均值可能会在较大范围内变化, 必须传送。而对各高频子图象,能量相对分散, 通过大量的统计研究表明,均值接近于零。所 以可不对各个子块进行均值计算,直接对各个 子块进行标量量化形成传送的码流。这样对这 几个高频子带可进行一步提高压缩比。
3.3小波树结构快速矢量量化编码方 法
本节提出基于人眼视觉属性和应用小波树结 构快速图象编码的矢量量化图象编码方法, 简称为树结构快速矢量量化编码。本树结构 快速矢量量化编码方法与传统的树结构快速 矢量量化编码方法最大不同是引入小波零树, 以零树为树结构矢量量化的树结构,可实行 预测,从而极大地提高了效率。树结构快速 矢量量化编码方法能获得40倍压缩比,峰值 信噪比为36.21dB, 综合性能指标优于其它方 法,有可能实现实时数据压缩。

CH3 图像压缩编码

CH3 图像压缩编码



变长编码方法中,表示符号的码字的长 度不是固定不变的,而是随符号出现的 概率而变化:给出现概率高的符号分配 较短的码字,给出现概率低的符号分配 较长的码字。 可以证明,在非均匀符号概率分布的情 况下,变长编码总的编码效率要高于等 字长编码。


但是,变长码在编码时要预先知道各种消 息符号出现的概率,而解码也远比等长码 复杂:对于等长码只要使不同的消息对应 不同的码字,而收端只要能正确识别出一 个码字的起始位置就能正确译码; 但对变长码要正确识别码字起点就不那么 容易,并且还存在唯一可译性、译码实时 性及与匀速输入输出匹配的缓存问题。
3.4.2 一维游程编码

下面介绍传真三类机(G3)所采用的改 进型 Huffman编码(Modified Huffman) 觉特性
根据一维游程编码原理,一维游长编码规则如下: ① 当RL=0~63,用一个相应的终止码表示; ② 当RL=64~l728,用一个终止码加一个起始码。 ③ 规定每行都从白游程开始,若实际扫描行由黑开 始,则需在行首加零长度白游程; 行结束要加行同步码EOL(见表3-2)。
(2)信息量压缩方法,也称有损压缩、失真 度编码或熵压缩编码。 该方法利用了人类视觉对图像中的某些 频率成分不敏感的特性,允许压缩过程 中损失一定的信息。

常用的有损压缩方法有:脉冲编码调制 (PCM)、预测编码(DPCM 、运动补偿)、 变换编码(DFT、DCT、K-L变换、 Walsh-Hadamard变换、小波变换)等, 以及灰度图像的方块编码、比特平面分 层编码及抖动编码等。
图3-2 图像压缩编码系统组成框图
图3-3 信源编码器与解码器的组成框图
• 在以上框图中,不同的图像编码系统可能采用 上述框图中的不同组合,变换器和编码器是可逆 的,而量化器是不可逆的。 • 所以,无失真的信源编码器不能包含量化器, 在大多数实用情况下,为了得到期望的比特率, 必须允许图像质量有少许的下降,有损压缩方法 既利用了图像的结构冗余和统计冗余,同时又利 用了其视觉冗余特性。

图像编码的原理与流程详解(二)

图像编码的原理与流程详解(二)

图像编码的原理与流程详解第一节:引言图像编码是一种将图像数据转换为压缩格式的技术,旨在减少图像数据的存储空间和传输带宽。

图像编码通常使用各种算法和技术,以提高图像传输的效率和质量。

本文将详细介绍图像编码的原理与流程。

第二节:图像编码的原理图像编码的原理主要是利用图像的统计特性和人眼对图像的感知特征。

首先,图像编码会分析图像中的冗余信息,如空间冗余、像素冗余和统计冗余等。

其次,利用变换编码和预测编码等方法,将图像数据转换为更紧凑和高效的表示形式。

最后,根据图像的重要性和传输损耗等因素,采用不同的编码策略进行编码。

第三节:图像编码的流程图像编码的流程通常包括三个主要阶段:预处理、编码和解码。

预处理预处理阶段包括图像获取、采样、量化和归一化等步骤。

首先,图像通过摄像设备或扫描仪等设备获取,然后对图像进行采样,将连续的图像转换为离散的图像。

接下来,通过量化操作将采样到的图像数据映射为一组有限的离散值,以减少数据量。

最后,对图像进行归一化操作,将图像数据映射到一定的数值范围内,以便后续编码处理。

编码编码阶段是将预处理后的图像数据转换为编码数据的过程。

常用的编码方法包括无损编码和有损编码两种。

无损编码无损编码主要用于要求图像传输和存储过程中不出现任何失真的场景。

常见的无损编码方法有霍夫曼编码、算术编码和LZW编码等。

这些编码方法通过构建特定的编码表,将原始的图像数据映射为更高效的二进制码流。

有损编码有损编码主要用于图像传输和存储场景中可以接受一定程度失真的情况。

常见的有损编码方法有JPEG、MPEG和等。

这些编码方法通过利用图像的统计特性和人眼对图像的感知特征,采用预测编码、变换编码和量化编码等技术,将图像数据转换为压缩的码流。

解码解码阶段是将编码后的数据反过来转换为原始图像数据的过程。

解码过程与编码过程相反,主要包括解码、逆量化和逆变换等步骤。

解码器根据编码时生成的编码表,将编码后的数据解码为离散的图像数据。

《图像的编码与压缩》课件

《图像的编码与压缩》课件

图像压缩技术
离散余弦变换(DCT)
定义:离散余弦变换是一种将图像从空间域转换到频域的算法
特点:DCT具有较好的能量压缩能力,能够去除图像中的冗余信息
应用:在图像压缩领域,DCT被广泛应用于JPEG等标准中
压缩原理:通过将图像分成8x8的块,对每个块进行DCT变换,将变换后的系数进行量 化,最后进行逆变换得到压缩后的图像
《图像的编码与压缩》PPT课 件
汇报人:
单击输入目录标题 图像编码与压缩概述 图像编码技术 图像压缩技术 图像编码与压缩的应用 图像编码与压缩的未来发展
添加章节标题
图像编码与压缩概述
图像编码与压缩的定义
图像编码:将图像信息转换为数字信号的过程 图像压缩:通过去除冗余信息来减小图像文件大小的过程 编码与压缩的目的:提高存储效率、降低传输带宽、节省存储空间等 常见图像编码与压缩标准:JPEG、PNG、GIF等
图像编码与压缩的目的
减少图像数据存储空间 提高图像传输效率 便于图像的编辑与处理 适应不同的应用需求
图像编码与压缩的分类
图像编码的分类:有损压缩和无损压缩 图像压缩的分类:有损压缩和无损压缩 有损压缩:去除图像中的冗余信息,减小文件大小 无损压缩:保留图像中的所有信息,不改变文件大小
图像编码技术
数字电视广播具有抗干扰能力强、 传输距离远等优点
添加标题
添加标题
添加标题
添加标题
数字电视广播采用高效压缩技术, 提高了图像传输效率和图像质量
数字电视广播已经成为现代社会重 要的信息传播方式之一
数字相机和手机
数字相机和手机中常用的图像编码与压缩技术 这些技术在数字相机和手机中的应用场景和优势 数字相机和手机中图像编码与压缩技术的具体实现方式 未来数字相机和手机中图像编码与压缩技术的发展趋势

第三章 图像编码范文

第三章 图像编码范文

第九章图像的编码技术3.1 研究背景一、信息传输方式发生了很大的改变通信方式的改变文字+语音◊图像+文字+语音通信对象的改变人与人◊人与机器,机器与机器二、图像传输与存储需要的信息量空间图像的传输与存储中,问题最多的,也是最常用的包括了数字视频信号和传真信号。

下面我们对其分别进行讨论。

1. 彩色视频信息对于电视画面的分辨率640*480的彩色图像,每秒30帧,则一秒钟的数据量为:640*480*24*30=221.12M所以播放时,需要221Mbps的通信回路。

实时传输:在宽带网上(10M)实时传输的话,需要压缩到原来数据量的0.045。

即0.36bit/pixel。

存储:1张CD可存640M如果不进行压缩,1张CD则仅可以存放2.89秒的数据。

存2小时的信息则需要压缩到原来数据量的0.0004,即:0.003bit/pixel。

2.传真如果只传送2值图像,以200dpi的分辨率传输,一张A4稿纸的数据量为:1654*2337*1=bit按目前14.4K的电话线传输速率,需要传送的时间是:270秒(4.5分)按每分钟4元计算:18元由于通信方式和通信对象的改变带来的最大问题是:传输带宽、速度、存储器容量的限制。

给我们带来的一个难题,也给了我们一个机会:如何用软件的手段来解决硬件上的物理极限。

图像通信系统模型3.2 数据冗余的概念3.4 图像中数据冗余压缩原理由于一幅图像存在数据冗余和主观视觉冗余,我们的压缩方式就可以从这两方面着手开展。

因为有数据冗余,当我们将图像信息的描述方式改变之后,可以压缩掉这些冗余。

因为有主观视觉冗余,当我们忽略一些视觉不太明显的微小差异,可以进行所谓的“有损”压缩。

3.5 图像的压缩编码第一代压缩编码八十年代以前,主要是根据传统的信源编码方法。

第二代压缩编码八十年代以后,突破信源编码理论,结合分形、模型基、神经网络、小波变换等数学工具,充分利用视觉系统生理心理特性和图像信源的各种特性。

第03章 图像压缩编码原理 51页 0.4M

第03章 图像压缩编码原理 51页 0.4M
3.去相关性(Decorrelation)
当输入的像素高度相关时,变换系数 趋向于不相关。
4.
如果把f(x,y)看作是一个具有一定熵值 的随机函数,那么变换系数F(u,v)的熵值和 原来图像信号f(x,y)的熵值相等。
3.3.2
1.一维DCT
2.二维DCT
(1)二维DCT
一 个 N×N 像 块 f(x,y)(x,y=0,1,…,N-1) 的二维DCT定义为
3.6.2 基于子带编码的快速小波变换
下面介绍基于子带编码的快速小波变 换(Fast Wavelet Transform,FWT)。
图3-26中,(a)图表示原始图像矩阵, (b)图表示一层分解的小波变换,(c)图表示 将低频图像LL小区域再分解的小波变换。
图3-26小波分解示意图
有了子带编码,我们可以用迭代 的方式使用双带子带编码并自底向上 地建立小波变换。
(3)像块的划分使相邻像块人为地造成 亮度不连续,即块效应。
3.4 统 计 编 码
3.4.1
1.
对于某一离散无记忆信源X的符号集
xi(i=1,2,…,N),假设每个符号x 独立的,出现的概率为p(xi), 则符号xi所携带的信息量定义为
I(xi)=log2(1/p(xi))
i是统计 ,
2.信息“熵”
3.2.2
1.
帧内预测利用图像信号的空间相关性 来压缩图像的空间冗余,根据前面已经传 送的同一帧内的像素来预测当前像素。
2.
电视图像在相邻帧之间存在很强的相 关性。
3.
预测系数的选择通常采用最优线性预 测法,选择预测系数a1,a2,…,an-1使误 差信号en的均方值最小。
4.
自适应预测又称为非线性预测。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

可变长编码:对于每个符号,表示符号的码字的 长度不是固定不变的,而是随符号出现概率而变 化:对出现概率高的符号分配较短码字,对出现 概率低的符号分配较长码字。
在非均匀符号概率分布情况下,变长编码效率高于 等长编码。
定理1:若编码时,对出现概率较大的符号用较少
比特数(短码)表示,对出现概率较小的符号用较 多比特数(长码)表示,则其平均码字长度L要比等 长编码时所需码字少。
⑷ 分配码字。原则为从最后一步开始反向进行 ,以 二进制码元(0,1)赋值,构成Huffman码字;
注意:码字分配从最后一步开始反向进行。对最后 两个概率一个赋予“0”码,一个赋予“1”码,这里 赋予0和1完全随机,不影响结束。 2、举例1:
设有一图像序列,含8个灰度级x1,x2,,x8,概率 分别为:P1=0.04,P2=0.06,P3=0.10,P4=0.10, P5=0.07,P6=0.18,P7=0.05,P8=0.40。 试进行Huffman编码,并计算编码效率、压缩比及冗 余度。

通信方式的改变
文字+语音图像+文字+语音

通信对象的改变
人与人人与机器,机器与机器
要求图像的保真度和传输的实时性。
2.图像传输与存储需要的信息量空间:
如一部90分钟的彩色电影,每秒放映24帧。把
它数字化,每帧512512像素,每像素的R、G、B三
分量分别占8bit,则总比特数为
90602435125128bit=97,200M。
这就是说每个像素用2.196位表示,40个像素需要用 87.84位。 可看出,通过求图像的熵对图像编码,可起到压缩 图像数据作用。
二、无失真编码理论(可变长最佳编码定理) 等长编码:对于每个符号,如经过量化后的图 像数据,如果对它们每个值都是以相同长度的二 进制码表示的,称之为等长编码或均匀编码。 等长编码是将所有符号当作等概率事件处理的。
k 1
则其编码效率为:
H 2.55 100 % 100 % 97.8% R 2.61
则其冗余度为:
r 1 1 0.978 2.2%
如果压缩前8个符号需要3个比特量化,经压缩后平 均码字长度为2.61,则压缩比为:
3 C 1.15 2.61
3. 讨论:试对图像字符序列 aaaa bbb cc d eeeee fffffff 进行Huffman编码。
如一张CD光盘可存600兆字节数据,这部电影光 图像(还有声音)就需要160张CD光盘用来存储。
因此,传输带宽、速度、存储器容量的限 制使得对图象数据进行压缩显得非常必要。
二、图像编码技术的可能性:
1、从信息论观点来看,图像作为一信源,描 述图像信源数据是有效信息量和冗余量两部分 组成。
去除冗余量可节省存储和传输中的开销,同时 不损害图像信源中有效信息量。
4
3 4 4 3 5 1
则其平均码字长度为:
R k pk 0.4 1 0.18 3 0.1 3 0.1 4
k 1 8
0.07 4 0.06 4 0.05 5 0.04 5 2.61 比 特/ 字 符
则其熵为: 8 H p k log2 pk 2.55 比 特/ 字 符
16
RGB
从原来的16*3*8=284bits压缩为: (1+3)*8=32bits
• 图像冗余有损压缩的原理
36 34 33 34 34 35 34 37 34 35 34 32 30 34 34 34 34 34 34 34 34 34 34 34 31 34 34 34 34 34
34
34 34 34
应用方关心图像区域有限,可对其余部分图像可 采用空间和灰度级上的粗化。
对于识别,图像特征抽取和描述也是数据压缩。
3.2 数据压缩与信息论基础
3.2.2 图像压缩编码系统的基本构成
图 像 信 息 源 信 源 编 码 器 信 道 编 码 器


信 道 解 码 器
信 源 解 码 器
图 像 输 出
1 I (ai ) log 2 log 2 p(ai ) p(ai )
如果对数字图像X像素分布各灰度级作平均度量,则 可得平均信息量:
H ( X ) p(ai ). I (ai ) p(ai ).log 2 p(ai )
i 1 i 1 m m
则称H(X)为数字图像X的熵,单位为bit/像素。 可看出,图像的熵H是表示其各个灰度级比特数的 统计平均值。
定理2:在变字长编码中,如果码字长度严格按
照对应符号出现的概率大小逆序排列,则其平均 码字长度为最小。
三、描述图像压缩性能的指标:
b1 压缩前图像每像素的平 均比特数 压缩比:c b2 压缩后图像每像素的平 均比特数
一般情况下压缩比c1,c愈大则压缩程度愈高。 平均码字长度R: R k pk
0.09
1
0
p5 0.07
p2 0.06
0.09
0.07
0
0.10
1
p7 0.05
p1 0.04
1
0
0.06
1
统一:概率大的赋予码 字为“0”,概率小的赋 予码字为“1”。
则有:
分配码字 x1 00011 码长 5
x2
x3 x4 x5 x6 x7 x8
0101
011 0000 0100 001 00010 1
1、Huffman编码方法 ⑴ 概率统计(如对一幅图像作灰度信号统计 ),得到 n个不同概率的灰度信息符号; ⑵ 将 n 个灰度信息符号出现的 概率由大到小排序 , 概率相同的可以任意放;
⑶ 将两个最小概率相加(概率个数减为n-1个),形成 新的概率集合 ;再按第⑵步方法重排, 如此重复直 到仅有两个概率为止;
什么是数据冗余呢? 如果不同的方法表示给定量的信息用了不同的 数据量,那么使用较多数据量的方法中,有些数据 必然代表无用的信息,或者为重复地表示了其它数 据已表示的信息,这为数据冗余的概念。 一幅图像中像素灰度出现的不均匀性。如果用同 样长度比特表示每一个灰度,则必然存在冗余。
图像能量在变换域内分布的不均匀性,大部分能 量集中在低频部分,而小部分能量集中在高和较 高的频率部分。则高频能量为数据冗余。 图像像素在时间和空间上的相关性造成信息冗余。
符号 概率 p8 p6 0.40 0.18 0.40 0.18 0.10 0.10 0.40 0.18 0.13 0.40 0.19 0.18 0.13
0
0.40 0.23 0.19 0.18
1 0
0.40 0.37 0.23
1 0
0.60 0.40
1
0
p3 0.10 p4 0.10
0.10 0.10
统计编码
统计编码是一种无损编码,是建立在图像的统计特性 基础之上的压缩编码。 信源统计编码方法关键在于去除冗余度。 Huffman编码 香农编码 游程编码 算术编码
统计编码 (无损编码)
LZW字典编码
3.3 霍夫曼编码(Huffman Coding)
这为Huffman于1952年提出的一种编码方法,是 一种最佳编码方法。所谓最佳编码方法是指采用 Huffman编码方法得到的单元像素的比特数最接近图 像的实际熵值。而熵为进行无失真编码的理论极限。 Huffman编码是根据可变长最佳编码定理,应用 哈夫曼算法而产生的一种编码方法。
第三章 图像压缩编码
中国矿业大学 信电学院
主要内容

3.1 图像编码理论分类


3.2 数据压缩与信息论基础
3.3 霍夫曼编码 3.4 游程长度编码 3.5 算术编码 3.6 LZW字典编码
3.1 图像压缩编码分类
一般从信息论角度出发分为两大类:
冗余度压缩方法
信息量压缩方法
1、冗余度压缩方法:也称无损压缩,信息保 持编码或熵编码。具体讲为解码图像和压缩编码
3.2 数据压缩与信息论基础
3.2.3 信息论基础 一、图像的信息熵:
熵是信息量的度量方法,表达一个信源平均信息 量的大小。它表示某一事件出现的消息越多,事件发 生的可能性越小,数学上为概率越小. 出现概率小的事件(符号)比出现概率大的事 件能提供更多的信息量。
设数字图像X中包含的像素的分布灰度级的集合为 A={ai|i=1,2,…,m},ai在统计上是无关的,且ai出现概 率为p(ai),则定义各灰度级ai所包含信息I(ai)为:
前图像严格相同,没有失真。
冗余度压缩方法的核心是基于统计模型,减少或完 全去除源数据流中的冗余,同时保持信息不变。可 实现编码与解码互逆。 (第3章压缩方法)
2、信息量压缩方法:
也称有损压缩,失真度编码或熵压缩编码。
即解码图像和原始图像是有差别的,允许有一定失 真。 信息量压缩方法是以牺牲部分信息量为代价而换取 缩短平均码长的编码压缩方法。由于在压缩过程中 在允许前提下丢失一部分信息,所以图像还原后与 压缩前不会完全一致。 (第4、5章压缩方法) 信息量压缩方法不能实现编码与解码互逆。
例如:
有一幅40个像素组成的灰度图像,灰度共有5级,分 别用 A 、 B 、 C 、 D 、 E 表示。 40 个像素中出现灰度 A 的 像素数有 15 个;出现灰度 B 的像素数有 7 个;出现灰 度C的像素数有7个等等,如下表所示。
灰度等级 像素数 概率 A 15 15/40 B 7 7/40 C 7 7/40 D 6 6/40 E 5 5/40
假设每个像素占3位表示,则编码这幅图像 共需403=120位。 求这幅图象的熵为:
H ( S ) (15/ 40) log 2 (40/15) (7 / 40) log 2 (40/ 7) (5/ 40) log 2 (40/ 5) 2.196位 / 像素
相关文档
最新文档