第八章 图像压缩
数字图像处理_第八章_图像压缩
数字图像处理
Chapter 8 Image Compression
8.1 基础 8.1.2 像素间冗
余
先看右边 两幅图a,b,c,d,而 e,f为相关系数→45 间隔联系。
数字图像处理
Chapter 8 Image Compression
8.1 基础
8.1.2 像素间冗余 如上页图示:
(n)
H ( z)
H ( z) P(a j )log P(a j )
j 1 J
Z P(a1 ), P(a2 ) P(a j )
J
以信源的熵(或不确定度),是观察单个信源输出得到的平 均信息量。
数字图像处理
Chapter 8 Image Compression
8.3 信息论要素 8.3.2 信息信道(信道)
数字图像处理
Chapter 8 Image Compression
8.1 基础 8.1.3 心理视觉冗余 例8.3通过量化进行压缩。
数字图像处理
Chapter 8 Image Compression
8.1 基础 8.1.3 心理视觉冗余 IGS量化方法:为减少颗粒状纹路用相邻像素灰度的低 位产生—随机数,加到当前像素。 IGS量化过程:
数字图像处理
Chapter 8 Image Compression
8.3 信息论要素
8.3 信息论要素
显示一幅图像究竟需多大的数据量? 8.3.1 测量信息 信息的产生可以被模拟为一个概率过程,发生概率为P (E)的随机事件E包含。
I ( E ) log 1 log P( E ) 的信息, T ( E ) 也叫自信息,底 P( E )
8.1 基础
图像压缩原理
图像压缩原理
图像压缩原理是通过减少图像数据的存储量来实现的。
具体来说,图像压缩原理涉及到以下几个方面。
1. 去除冗余信息:图像中通常存在大量冗余信息,例如连续相同颜色的像素或者相似颜色的像素。
通过将这些冗余信息进行去除或者压缩,可以达到减少图像存储量的目的。
2. 空间域压缩:在空间域压缩中,通过减少像素的数量或者减少像素的位数来减少图像文件的大小。
一种常见的空间域压缩算法是基于四色彩色的量化压缩方法,通过降低每个像素颜色的位数来减少存储空间。
3. 频域压缩:频域压缩是将图像从空间域转换为频域,利用图像在频域中的特性来进行压缩。
其中一种常见的频域压缩方法是基于离散余弦变换(DCT)的压缩方法,它将图像转换为频域信号,并利用频域信号中较小的系数来表示图像。
4. 熵编码:熵编码是一种无损压缩方法,通过对图像数据进行统计分析,利用出现频率较高的数据用较短的码字表示,从而减少图像文件的存储大小。
综上所述,图像压缩通过去除冗余信息、空间域压缩、频域压缩和熵编码等方法来减少图像数据的存储量。
这些方法可以单独应用,也可以结合使用,以达到更好的压缩效果。
第8章 图像压缩(1)
SNRms
x 0 y 0 M 1 N 1 x 0 y 0
ˆ f ( x, y) 2
2
[ fˆ ( x, y) f ( x, y)]
主观保真度准则:
8.2 图像压缩模型
信源 编码 信道 编码 编码器 信道 信道 解码 信源 解码 解码器
图8.5 一个常用的图像压缩系统模型
则,各信源符号自信息量:
I (a) 1.152,I (b) 2, I (c) 2.4739 I (d ) 3.0589 ,
信源熵
H ( X ) 0.45*1.152 0.25* 2 0.18* 2.4739 0.12 * 3.0589 1.8308
用例8.5第二种编码方法 ,平均码长为1.85,大于信源熵
如果找到一个非零值,则解码器只需简单地在校验字指出的位置补充码字比特.解码的 二进制h3h5h6h7就能从纠正后的码字中提取出来.
8.3 信息理论基础与熵编码
信息理论是图像编码的主要理论依据之一,它给出无失真编码所需比特数的下限, 为逼近这些下限提出了一系列熵编码算法.
(1) 离散信源的熵表示:
设一个离散信源X: x1 , x2 ,, x N ) ( 其概率分布: { p1 , p2 ,, p N } 满足
数据中存在信息冗余,就有可能对图像数据量进行压缩,针对数据冗余的类型 不同,可以有多种不同的数据压缩方法.
8.1 图像压缩基础
编码冗余: 图像灰度可用不同的编码表示
若用[0,1]内的一个随机变量rk 表示图像的灰度级, 则每个灰度级rk出现的概率为 : n pr (rk ) k k 0,1, 2,..., L 1 n
平均码长大于信源的熵
第八章__JPEG2000压缩标准简介
8.1 JPEG2000 简介 8.2 JPEG 2000的核心编码系统 8.3 RO I 编码
8.4 JPEG2000与JPEG的比较
参考:David S. Taubman; Michael W. Marcellin ,JPEG2000 图像压缩基础、标准和实践,电子工业出版社,2004
8.1.2 JPEG 2000标准的组织结构
JPEG2000 标准可分为7大部分:
PART 1 ,J PEG2000 图像编码系统, 是JPEG2000 标准的核
心系统;
PART 2 ,扩展系统,在核心系统上,添加了一些功能;
PART 3 ,运动JPEG2000 ,针对运动图像提出的解决方案;
正变换: 精确式:根据人眼对RGB三种颜色分量的感知特性, 设各颜色的权重为: ,满足 R 0.299, G 0.587, B 0.114
R G B 1
0.5 Cb (B Y ) 1B 0.5 Cr (R Y ) 1R 近似式:
则: Y R R G G B B
0.587 0.114 R Y 0.299 0. 5 Cb 0.168736 0.331264 G Cr B 0 . 5 0 . 418688 0 . 081312
一、图像分块与拼接
不需要将图像强制分成8×8的小块。
为了降低对内存的需求和方便压缩域中可能的分块处理, 可以将图像分割成若干互不重叠的矩形块(tile)。
分块的大小任意,可以整个图像是一个块,也可以一个像素是一
个块。 一般分成64×64~1024×1024大小的方块,边缘部分的块可能小一 些,而且不一定是方的。
第八章 图像压缩
数据压缩指减少表示给定信息量所需的数据量;
图像压缩所解决的问题是尽量减少表示数字图像时所需的数据量;
压缩率:
CR
n1 n2
相对数据冗余:
RD
1 1
CR
在数字图像压缩中,可以确定三种基本的数据冗余: 编码冗余、像 素间冗余和心理视觉冗余.
数据中存在信息冗余,就有可能对图像数据量进行压缩,针对数据冗 余的类型不同,可以有多种不同的数据压缩方法.
信源熵
H (X ) 1/ 2 *11/ 4 * 2 1/ 8*3 1/ 8*3 1.75
a,b,c,d用码字00,01,10,11来编码
lavg 1/ 2 * 2 1/ 4 * 2 1/ 8 * 2 1/ 8 * 2 2
a,b,c,d分别用码字0,10,110,111来编码
由于人眼对所有视觉信息感受的灵敏度的不同,因 此,在正常的视觉处理过程中,各种信息的相对重要 程度不同。那些不重要的信息称为心理视觉冗余.
消除视觉冗余会导致一定量的信息丢失,这一过程常 称为”量化”
例8.3 通过量化进行压缩 出现假轮廓
(a)256个灰度级的原图像 (b)均匀量化为16个灰度级 (c)用IGS量化为16个灰度级
其平均码长lavg满足 H(X)≤lavg <H(X)+1
由此可以看出,信源的熵是作无失真二元变长字编码时 平均码长的下限,这中变字长的统计编码又称为熵编码
离散、有记忆信源的无失真编码定理
设单符号、离散、有记忆信源的熵为H(z/v),若用二元码 对其作变字长、非延续编码,一定可以找到一种编码方
式,其平均码长lavg满足 H(z/v)≤lavg <H(z/v)+1
8.3信息论要素
图像压缩
图像数据的冗余主要表现为:图像中相邻像素
间的相关性引起的空间冗余;图像序列中不同帧之 间存在相关性引起的时间冗余;不同彩色平面或频 谱带的相关性引起的频谱冗余。数据压缩的目的就 是通过去除这些数据冗余来减少表示数据所需的比 特数。
图像压缩方法的介绍:有损压缩和无损压缩。
无损压缩又称冗余度压缩,信息保持编码或熵编码,是 一种可逆编码方法。该方法利用数据统计冗余度压缩,解码 时可完全恢复,但压缩率受到数据统计冗余度理论限制。常 见的无损压缩方法如下。
Huffman编码
无损压缩
算术编码 行程编码 LZW编码
有损压缩,又称信息量压缩,失真度编码或熵压缩 编码。该方法利用了人类视觉和听觉对某些频率成 分不敏感特性,允许压缩过程中损失一定的信息。 解码时,丢掉一些数据不会影响对声音或者图像的 理解。常见的有损压缩方法如下。
有损压缩
预测编码 变换编码 小波编码 分形编码 基于模型的编码
物体基编码
语义基编码
霍夫曼编码(Huffman coding)
1.根据给定数据集中霍夫曼(D.A. Huffman)在 1952年提出和描述的“从下到上”的熵编码方 法 2.各元素所出现的频率来压缩数据的一种统计 压缩编码方法。这些元素(如字母)出现的次数 越多,其编码的位数就越少 3.广泛用在JPEG, MPEG, H.26X等各种信息编码 标准中
行程编Байду номын сангаас:
一幅图像中对具有相同像素的颜色值 只存储具有相同颜色的像素数目或者存储一 个像素的颜色值,以及具有相同颜色值的行 数。
预测编码:
分析信号的相关性,利用已处理的信 号预测待处理的信号,得到预测值;然后 仅对真实值与预测值之间的差值信号进行 编码处理和传输,达到压缩的目的并能够 正确恢复。
第8章 图像压缩
数据压缩:减少表示给定信息量所需的数据量。 表示相同信息的数据集合n1和n2
相对数据冗余RD可以定义为:
压缩率CR定义为
当n2=n1,CR=1,RD=0,表示n1不包含冗余 数据。 当n2«n1时,CR→∞,RD→1,表示显著的压 缩和大量的冗余数据。 当n2»n1时, CR →0, RD →∞,数据扩展 (不希望) 一般, CR 和RD分别在开区间(0,∞)和(-∞,1) 内取值。 比如n1/n2=10,相应的冗余度为0.9,这表示
8.2.2 信道编码器和解码器 通过向信源编码数据中插入预制的冗余数 据来减少信道噪声的影响。 Hammning编码的基本思想,向被编码数据中 加入足够的位数以确保可用的码字间变化的 位数最小。 例如,将3位冗余码加到4位字上,则所有的一 位错误都可以检测出来并得到纠正 。
为了将汉明(Hamming)编码结果进行解 码,信道解码器必须为先前设立的偶校验的 各个位字段进行奇校验并检查译码值。一位 错误由一个非零奇偶校验字c4c2c1给出:
数据冗余包括: 编码冗余、像素间冗余和心理视觉冗余。
8.1.1 编码冗余
表达每个像素所需的平均比特数为:
其中,l(rk)是灰度值rk值的比特数,rk出现的概率为pr(rk)
使用m比特自然二进制编码表示图像的灰度级 ,则Lavg=m比特。
变长编码:用尽量少的比特数表达尽可能多的灰度级 以实现数据的压缩。
霍夫曼编码
这个编码的平均长度为: Lavg=(0.4)(1)+(0.3)(2)+(0.1)(3)+(0.1)(4) +(0.06)(5)+(0.04)(5)=2.2比特/符号
图像压缩原理
图像压缩原理图像压缩是一种将图像文件的大小减小的技术,它可以通过减少图像文件的存储空间来节省存储和传输成本。
图像压缩可以分为有损压缩和无损压缩两种类型。
有损压缩是在图像文件中去除一些细节信息,以减小文件大小,而无损压缩则是在不损失图像质量的情况下减小文件大小。
图像压缩技术在数字图像处理中起着非常重要的作用,它不仅可以减小文件大小,还可以提高图像传输的速度和效率。
图像压缩的原理主要包括了空间域压缩和频域压缩两种方法。
空间域压缩是指在像素级别上对图像进行压缩,而频域压缩是指在频率域上对图像进行压缩。
下面将分别介绍这两种压缩原理。
空间域压缩是最常见的图像压缩方法之一,它主要通过减少图像中像素的数量来减小文件大小。
在空间域压缩中,最常见的方法是通过减少图像的分辨率来实现。
分辨率是指图像中像素的数量,减小分辨率意味着减少图像中像素的数量,从而减小文件大小。
另外,空间域压缩还可以通过图像的子采样和量化来实现。
子采样是指在图像中隔行或隔列地去除像素,从而减小文件大小,而量化则是指将图像中的像素值近似为较小的值,也可以减小文件大小。
频域压缩是另一种常见的图像压缩方法,它主要是通过将图像转换到频率域上进行压缩。
在频域压缩中,最常见的方法是使用离散余弦变换(DCT)来将图像转换到频率域上,然后再对频率域上的系数进行量化和编码来实现压缩。
DCT是一种将图像转换到频率域上的数学变换方法,它可以将图像分解为不同频率的分量,从而可以更好地利用图像的频率信息来进行压缩。
除了空间域压缩和频域压缩外,图像压缩还可以通过预测编码、熵编码和字典编码等方法来实现。
预测编码是指利用图像中像素之间的相关性来进行压缩,而熵编码和字典编码则是利用信息论和数据压缩理论来进行压缩。
总的来说,图像压缩是一种非常重要的图像处理技术,它可以通过不同的方法来减小图像文件的大小,从而节省存储和传输成本。
空间域压缩和频域压缩是图像压缩的两种主要方法,它们可以通过减少图像的分辨率、子采样、量化、DCT变换等方法来实现压缩。
图像压缩原理资料课件
三维立体图像压缩
总结词
三维立体图像提供了更真实的视觉体验,但其数据量巨大,对压缩技术提出了更高的要求。
详细描述
三维立体图像的压缩需要同时考虑空间和深度信息,目前主要采用基于深度学习的方法进行压缩,同时还需要解 决如何保留立体感的问题。
人工智能辅助的图像压缩
总结词
人工智能技术的发展为图像压缩提供了新的思路和方法。
图像压缩的应用
数字电视广播
数字电视广播需要传输大量的视频数 据,图像压缩技术可以有效减少数据 量,提高传输效率和图像质量。
数字电视广播采用MPEG、H.264等图 像压缩标准,实现高效的数据压缩和 传输,满足大规模广播覆盖的需求。
互联网图像传
在互联网上传输图像时,由于带宽限制和网络拥堵,需要采 用图像压缩技术来减小图像文件的大小,加快传输速度。
常见的互联网图像传输格式包括JPEG、PNG等,这些格式采 用不同的压缩算法,以在保证图像质量的前提下尽可能减小 文件大小。
医学影像存储与传
医学影像如CT、MRI等包含大量的数据信息,直接存储和传输成本较高,因此需 要采用图像压缩技术进行压缩。
医学影像压缩对于远程诊断、会诊和医学教育等方面具有重要意义,可以降低存 储成本、加快传输速度并提高图像质量。
有损压缩
有损压缩会丢失一些数据,但压 缩率较高,常用的算法有JPEG、 MPEG等。
图像压缩标准
01
02
03
JPEG
主要用于静态图像压缩, 广泛应用于网络传输和数 字相机等领域。
JPEG2000
相对于JPEG有更高的压缩 比和更好的图像质量,尤 其在处理医学图像和遥感 图像方面有优势。
MPEG
主要用于视频压缩,包括 MPEG-1、MPEG-2、 MPEG-4等,广泛应用于 音视频存储、传输和播放 。
图像压缩教学设计
图像压缩教学设计摘要:本文是关于图像压缩的教学设计,旨在帮助学习者了解图像压缩的基本概念、原理和常见方法。
通过本教学设计,学习者将能够掌握图像压缩的基本技术,并了解其在数字图像处理中的应用。
一、引言图像压缩是数字图像处理中的一项重要技术,它能够减少图像数据的存储空间并降低传输所需的带宽。
图像压缩在许多领域有着广泛的应用,例如数字摄影、视频通话和网络传输等。
本教学设计将以简明扼要的方式介绍图像压缩的基本概念和原理,并探讨常用的图像压缩方法。
二、图像压缩的基本概念1. 图像压缩的定义:图像压缩是指通过压缩算法对图像数据进行处理,使其占据更少的存储空间或传输带宽。
2. 像素与图像:像素是图像的基本单元,它们构成了图像的二维矩阵,每个像素代表了图像上的一个点的亮度或颜色信息。
3. 颜色空间:颜色空间是用于描述图像中颜色信息的一种方式。
常见的颜色空间包括RGB、CMYK和YCbCr等。
三、图像压缩的原理1. 冗余性:图像中存在不同类型的冗余,包括空间冗余、视觉冗余和编码冗余。
图像压缩的原理是通过利用这些冗余来减少数据的存储和传输量。
2. 无损压缩和有损压缩:图像压缩可以分为无损压缩和有损压缩两种。
无损压缩保留了图像的所有细节,而有损压缩在压缩过程中会有一定的信息损失。
四、常用的图像压缩方法1. 无损压缩方法:无损压缩方法主要通过编码和预测来减少图像的冗余。
常见的无损压缩方法包括Run-Length Encoding(RLE)、Huffman编码和Lempel-Ziv-Welch(LZW)编码等。
2. 有损压缩方法:有损压缩方法主要通过量化和编码来减少图像的冗余,并在此过程中引入一定的信息损失。
常见的有损压缩方法包括JPEG、JPEG 2000和WebP等。
五、教学设计1. 教学目标:通过本教学设计,学习者将能够理解图像压缩的基本概念和原理,掌握常见的图像压缩方法,并了解其应用。
2. 教学内容:通过课堂讲授和实例演示,依次介绍图像压缩的基本概念、原理和常用方法。
8.1 图像压缩概述
医学图像处理专题1图像数据的压缩编码专题1 图像数据的压缩编码•9.1引言•9.2图像压缩的基本概念•9.3无损压缩•有损压缩•压缩标准数字图象通常要求很大的比特数这给图•数字图象通常要求很大的比特数,这给图象的传输和存储带来相当大的困难。
要占用很多的资源,花很高的费用。
多的资源花很高的费用•如一幅512x512的黑白图象的比特数为•512x512x8=2,097,152 bit=256k。
再如部90分钟的彩色电影,每秒放映24•再如一部90分钟的彩色电影,每秒放映24帧。
把它数字化,每帧512x512象素,每象素的R R、G G、B B三分量分别占8 bit,总比特数为三分量分别占8bit,总比特数为90x60x24x3x512x512x8bit=97,200M。
如一张CD光盘可存600兆字节数据这部电影如张CD光盘可存600兆字节数据,这部电影光图象(还有声音)就需要160张CD光盘用来存储。
•对图象数据进行压缩显得非常必要图像数据量举例:视频图像:512512××512512××8×25bits/s≈150Mbit/s≈19MByte/s≈70,000MB/hrVCD VCD::650M 650M,,74Min, 74Min, 约需要压缩约需要压缩100100倍!倍!传输带宽:播放速度:Cable 1.51.5~~10Mbs 传输带宽10Kbs 10Kbs~~1MbsATMMobil communication Up to 34Mbs 目的:在可能的情况下尽量减少图像数据的尺寸,以便于传输、存储、管处和应管理、处理和应用。
学像图像数医学图像:图像种类图像特征/检查数据量/检查核医学128×128×1230~601~2 MB MRI256×256×12608 MB 超声512×521×820~2305~60 MB 数字减影血管造影DSA512×512×815~404~10 MB CT512×512×124020 MB 计算机放射成像2048×2048×12216 MB 数字化X 线摄影2048×2048×12216 MB 数字化X 线乳腺摄影4096×4096×124128 MBPACS 系统的需求•本章讨论的问题:在满足一定条件下,能否减小图象bit数,以及用什么样的编数以及用什么样的编码方法使之减少。
图像压缩 毕业论文
图像压缩毕业论文图像压缩毕业论文引言:图像压缩是一项重要的技术,它在数字图像处理中起着至关重要的作用。
随着互联网的普及和数字图像的广泛应用,图像压缩成为了必不可少的环节。
本篇论文将探讨图像压缩的原理、方法以及应用,并对图像压缩技术的未来发展进行展望。
一、图像压缩的原理图像压缩的原理是通过减少图像数据的冗余性来实现的。
图像数据中存在着很多冗余信息,如空间冗余、频域冗余和视觉冗余等。
通过对这些冗余信息的处理,可以实现对图像的压缩。
1. 空间冗余在图像中,相邻像素之间往往存在着很强的相关性。
通过利用这种相关性,可以采用像素间差值编码、预测编码等方法来减少冗余信息,从而实现对图像的压缩。
2. 频域冗余图像在频域上存在着一定的冗余性。
通过对图像进行傅里叶变换,可以将其转换到频域中,然后利用频域的特性对图像进行压缩。
常用的方法有离散余弦变换(DCT)和小波变换等。
3. 视觉冗余人眼对图像的感知是有限的,对于一些细节信息的损失往往并不敏感。
通过利用人眼对图像的感知特性,可以对图像进行适当的压缩,从而减少冗余信息。
二、图像压缩的方法图像压缩的方法主要分为有损压缩和无损压缩两种。
1. 有损压缩有损压缩是指在压缩过程中对图像进行一定程度的信息丢失。
这种方法可以在一定程度上减小图像的数据量,从而实现对图像的高效压缩。
常用的有损压缩方法有JPEG、MPEG等。
2. 无损压缩无损压缩是指在压缩过程中不对图像的信息进行任何丢失。
这种方法可以保持图像的完整性,但相应地,压缩率较低。
常用的无损压缩方法有GIF、PNG等。
三、图像压缩的应用图像压缩技术广泛应用于各个领域,如图像传输、存储和显示等。
1. 图像传输在网络传输中,图像压缩可以减小图像的数据量,从而提高传输效率。
特别是在移动通信领域,图像压缩技术可以减少数据流量,提高用户体验。
2. 图像存储随着数码相机的普及,人们对图像存储的需求也越来越大。
图像压缩技术可以将大容量的图像数据压缩成较小的文件,从而节省存储空间。
第8章 图像压缩
•
•
8.1 基础知识
�
客观保真度准则
客观保真度准则
�
输入图和输出图之间的均方根误差
客观保真度准则
�
输入图和输出图之间的均方根误差
客观保真度准则
�
输出图的均方信噪比
8.1 基础知识
�
主观保真度准则
评价 优秀 良好 可用 说明 图像质量非常好 图像质量高,观看舒服,有干扰但不影响 观看 图像质量可接受,有干扰但不太影响观看
例:原图像数据: 234 223 231 238 235 压缩后数据: 234 11 -8 -7 3
例:两幅图像的直方图与归一化自相关系数
8.1 基础知识
视觉心理冗余:
视觉心理冗余:
�
由于消除心理视觉冗余数据会导致一定 量信息的丢失,所以这一过程通常称为 量化 心理视冗余压缩是不可恢复的,量化的 结果导致了数据有损压缩
图像压缩的方法
�
压缩数据的重要方法是消除冗余数据,从统计学 的角度看就是将原始图像尽可能转换成不相关的 数据集。 在数字图像压缩中,有3种基本的数据冗余:编码 冗余、像素间冗余、心理视觉冗余。如果能减少 或消除其中的一种或多种冗余,就能取得数据压 缩的效果。
�
图像压缩的方法
无损压缩:在压缩和解压缩过程中没有信 息损失 � 有损压缩:能取得较高的压缩率,但压缩 后不能通过解压缩恢复原状 � 其它:如根据需要,即可进行无损,也可 进行有损压缩的技术;准无损技术
� 符号编码器:减少编码冗余,一般采用变长
8.2 图像压缩模型
�
图像编码标准
图像编码这一经典的研究课题,经50余年的 研究已有多种成熟的方法得到应用,特别是第一 代编码更是如此。 随着多媒体技术的发展,已有若干编码标准由 ITU-T(国际电信联盟远程通信标准化组)制定出 来。如JPEG、H.261、H.263、MPEG1、 MPEG2、MPEG3、MPEG7、JBIG等。
第八章图像压缩1
8.2.2 信道编码器和解码器
• 当信道带有噪声或易于出现错误时,信 道编码器和解码器就在整个译码解码处 理中扮演了重要的角色。 • 通过向信源编码器数据中插入预制的冗 余数据来减少信道噪声的影响。
8.3 信息论要素
• 8.3.1 测量信息 • I(E)称为E的自信息
1 I ( E ) = log = − log P( E ) P( E ) (8.3.1)
输入图和输出图之间的均方根误差 • 两个图像之间的误差 • 两个图像之间的总误差:
均方根误差(rms)
均方信噪比
保真度标准
2.
主观保真度标准
通过视觉比较两个图像,给出一个定性的 评价,如很粗、粗、稍粗、相同、稍好、 较好、很好,这种评价被称为主观保真 度标准。
评分 1 2 3
评价 优秀 良好 可用
• 图像压缩的基本概念
设:n1 和n2 是在两个表达相同信息的数据集中,所携 带的单位信息量。
– 压缩率(压缩比):——描述压缩算法性能
CR = n1 / n2 其中,n1是压缩前的数据量,n2是压缩后的数据量
– 相对数据冗余:
RD = 1 – 1/CR 例:CR=20; RD = 19/20
基本概念:数据冗余
RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB
16
RGB
从原来的8 * 3 * 16=284bits压缩为: (1+3)*8=32bits
图像中的数据冗余的概念
• 图像冗余有损压缩的原理
36 34 33 34 34 35 34 37 34 35 34 32 30 34 34 34 34 34 34 34 34 34 34 34 31 34 34 34 34 34 34 34 34 34 34 25 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)“第一代”编码技术
三大经典编码方法
“熵值编码” “预测编码” “变换编码”
“熵值编码”
(概率匹配编码) 主要针对无记忆信源,根据信息码字出 现概率的分布特征,寻找概率与码字长 度间的最优匹配,从而进行压缩编码, 又称为统计编码。 游程编码、Huffman编码和算术编码等 多种。 熵值编码是信息编码的基础,也是各种 实用算法的一个基本组成部分。
图像压缩编码方案),只能用于特定图像场景(如人
的头肩像场景)的压缩。
算法的复杂度
算法的复杂度即指完成图像压缩和解压缩所需的
运算量和硬件实现该算法的难易程度。优秀的压缩算 法要求有较高的压缩比,压缩和解压缩快,算法简单 ,易于硬件实现,还要求解压缩后的图像质量较好。 选用编码方法时一定要考虑图像信源本身的统计特性
从本质上来说就是一种“混合编码”方 案,它在不同阶段根据图像的不同特征 将变换编码、预测编码、无误差编码等 各种方案的优势综合利用起来。 关键是识别图像的特征。 多种方案的复用缩标准JPEG、MPEG等在设计中就 利用了这种思路。
(2)第二代编码技术
“变换编码”
进行某种正交变换来消除像素间的相关性。 可分为最佳变换编码,如K-L变换,以及次 优变换编码,如离散余弦变换(DCT)等。 在实施时,辅助以区域变换编码、门限变换 编码。 基于离散余弦变换的静止图像压缩标准jpeg 和运动图像压缩标准mpeg等一系列标准。
“自适应编码”
3. 编码方法的分类
由压缩恢复的图像与原始图像的差别
“可逆压缩”:编码的数据可完全恢复出原始图 像 “熵编码”(Entropy Coding), “无失真编 码”、“无误差编码”(Error Free Coding) 、无噪声编码”(Noiseless)、“冗 余度压缩 ”(Redundancy Reduction)、 “数据紧缩”( DATA Compaction Lossless Bit-Preserving)。 “不可逆压缩”: “有失真编码”(lossy Coding),采用这类编码方法,由编码数据恢复 的图像与原始图像有区别,图像编码产生的误差 与编码的方法以及压缩比等因素有关。
PCM 预测 编码 编码 算法
固定 固定
自适应 自适应
离散余弦变换 变换编 码
统计 编码 付立叶变换 LZW Huffman编码
KL变换
斜变换
沃尔什 哈达马 小波变换
Harr变换
算术编码
游程编码
方块 静态图像 编码
比特平面 帧内预测
抖动
逐渐浮现 逐层内插
视频 图像
运动估计 帧间编码 内插
帧间预测
运动补偿
3.心理视觉冗余
人类的视觉系统对于图像场的注意是非均匀和非线 性的,特别是视觉系统并不是对于图像场的任何变 化都能感知,即眼睛并不是对所有信息都有相同的 敏感度,有些信息在通常的视觉感觉过程中与另外 一些信息相比来说并不那么重要,这些信息可认为 是心理视觉冗余的,去除这些信息并不会明显地降 低所感受到的图像的质量。 心理视觉冗余的存在是与人观察图像的方式有关的, 人在观察图像时主要是寻找某些比较明显的目标特 征,而不是定量地分析图像中每个像素的亮度,或 至少不是对每个像素等同地分析,人通过在脑子里 分析这些特征并与先验知识结合以完成对图像的解 释过程,由于每个人所具有的先验知识不同,对同 一幅图像的心理视觉冗余也就因人而异。 动态图像的视觉延迟现象
、多媒体系统的适应能力、应用环境以及技术标准。
8.3 信息论要素
Cr= n1/ n2
冗余量 Rd 可表示为:
Rd=1-1/Cr
数据冗余的类型
编码冗余 像素间冗余 心理视觉冗余
1、编码冗余(信息熵冗余)
“码本”是表示一组信息或一组事件的一系列 符号(如字母、数字等)。其中对每个信息或 事件所赋予的符号成为“码字”,每个码字含 有的基本符号的个数称为“码长”。 设l(rk)为码字rk的码长,在二进制表示时称为 “比特数(bits)”,Pr(rk)为码字的出现概率。 若编码系统共有L种不同的码字,则系统可获得 的平均比特数为: L 1
0.16 0.08
0.21 0.03 0.19
011 100
101 110 111
3 3
3 3 3 3
1100 1101
1110 111100 111101
4 4
4 6 6 3.78
1100 1101
01 111100 10
4 4
2 6 2 2.8
2、像素间冗余
像素的灰度级和颜色之间具 有相关性,随机场模型 (1)空间冗余:规则物体和规 则背景的表面物理特性具有相 关性。 (2)时间冗余:序列图像
第八章 图像压缩 Image compression
图像编码
Image Coding
压缩目的 基本原理 基本方法 图像编码标准
减少数据量:存储量、传输时间
例1:一般彩色电视信号,YIQ色空间中各分量的带宽 分别为4.2MHz、1.5MHz、0.5MHz,采样原理, 采样频率>=2倍原始信号频率,量化为8bit,1秒 钟的数据量为(4.2+1.5+0.5)*2*8=99.2MBits, 约为100Mbits/S。 HDTV数据量约为1.2GBits/S, 彩色静止图像:3*1024*1024*8=3MB,
码字以二进制形式表示,比特(bit)
D((101),(110))=2
汉明:将3个比特位的冗余加到4比特的码字上,任意 两个正确码字间的距离为3,可发现和校正错误。
2. 图像编码压缩要研究的主要内容
信源压缩方法
信源模型有关 编码模型
逼真度准则或失真度准则
平方误差准则 基于主观感受的逼真度准则
1/ 2
原图像编码每个像素平均所需bit数 / 压缩后像素平均所需bit数
主观保真度准则
尽管客观保真度准则提供了一种简单方便的信息损 失的方法,但是很多解压图像最终是供人观看的,有 时单用某一个或几个解析式来度量图像品质,甚至得 到与主观评估相反的结果,这样就造成采用这些解析 公式得到的定量的逼真度的可信度低,造成逼真度不 能从理论上完满解决的根本原因在于人眼视觉感知得 到的信息传输到神经系统的处理、判别过程不清楚, 而这又涉及到生物物理学、生物化学以及生态光学等 领域的成就,至今还不能提供这一过程的满意回答 (这也是当今计算机视觉的一个前沿课题,目前正在 研究发展中)。
2 [ g ( x , y ) f ( x , y )] x 0 y 0
N 1 N 1
(2)均方根信噪比:
( SNR) rms
(3)压缩比=
N 1 N 1 2 g ( x, y ) x 0 y 0 N 1 N 1 [ g ( x, y ) f ( x, y )]2 x 0 y 0
空间冗余
时间冗余
(3)结构冗余:纹理结构有些图像存在较强的纹理
结构,如墙纸、草席等图像,称之存在结构冗余
(4)知识冗余:人脸的固定结构。有许多图像的理
解与某些基础知识有相当大的相关性,例如人脸的图 像有固定的结构,比如说嘴的上方有鼻子,鼻子的上 方有眼睛,鼻子位于正脸图像的中线上等等,这类规 律性的结构可由先验知识和背景知识得到,称此类冗 余为知识冗余。
8.2 图像压缩模型
编码器
图像 采集
图像 显示或 存储
信源 编码
信道 编码
图 像 通信
信源 解码
信道 解码
解码器
1. 基本概念
信源
需要传输或存储的原始信息称为“信源”。包括 语音、图像、视频等信息源。 “信源编码”的主要任务是利用一定的编码方法 降低数码率,即比特率。 信息传输的通路; 信息在传输中要增加可靠性、抗干扰能力,就要 进行“信道编码”,此时要进行奇偶校验等检测, 需要增加比特数。抗干扰能力越强,增加的比特 数就越多。
的大体上的优劣,而对“内行”人即具有图像处理经验的人来 说,更多的是注意图像中细节的退化程度,所以这种主观评估 法应使“外行”和“内行”分开进行。
主观保真度准则标准
评分 评价 说明
1
2 3 4 5 6
极好
好 可用
图像质量非常好,和希望的一样好
图像质量高,观看舒服,有干扰但不 影响观看
图像质量可接受,有干扰但不太影响 观看 勉强可 图像质量差,干扰有些影响观看,希 以 望改进 差 图像质量很差,干扰严重妨碍观看 不能用 图像质量极差,不能使用
rk r0=0 r1=1/7 r2=2/7 pr(rk) 0.02 0.25 0.06 编码1 000 001 010 L1(rk) 3 3 3 编码2 00 01 10 L2 (rk) 2 2 2 编码3 111101 00 1110 L3 (rk) 6 2 4
r3=3/7 r4=4/7
r5=5/7 r6=6/7 r7=1 平均码长
要充分利用人的视觉生理、心理特征和图 像信源的各种特征,实现从“波形”编码 到“模型”编码的转变,以便获得更高压 缩比。 向量量化编码、基于分形的编码、基于模 型的编码、基于区域分割的编码、基于神 经网络的编码以及识别编码和基于知识的 编码等。
(3)过渡编码技术
充分利用人类视觉特性的“多分辨率编码” 方法,如子带编码、金字塔形编码和基于 小波变换的编码。 这类方法原理上仍属于线性处理,属于 “波形”编码,可归入经典编码方法,但 它们又紧密结合人类视觉系统的特性,因 此可以被看作是“第一代”编码技术向 “第二代”编码技术过渡的桥梁。