静态影像压缩介绍
静态图像压缩方法综述概要
经典图像压缩方法
行程编码举例:
abbbccccddd 1a3b4c3d
经典图像压缩方法
(二)预测编码
(1)DPCM(差分脉冲编码调制)编码
预测编码是根据某一模型利用以往的样本值,对于新 样本值进行预测,然后将样本的实际值与其预测值相 减得到一个误差值,对这一误差值进行编码,如果模 型足够好且样本序列在时间上的相关性较强,那么误 差信号的幅度将远小于原始信号。 优点:编码过程直观、简捷、易于实现 不足:压缩能力有限。
经典图像压缩方法
DCT编码举例:
Lena上8*8的一块:
149 153 160 162 161 161 161 161 153 156 163 160 162 161 163 161 155 159 158 160 162 160 162 163 155 156 156 159 155 157 157 158 155 156 156 159 155 157 157 158 155 1260 1 12 23 17 6 156 11 9 2 156 7 2 0 159 F u, v 1 1 1 155 0 2 157 2 1 0 0 157 2 4 158 3
典型的统计编码法有哈夫曼编码(Huffman)、 算术编码和行程编码等。
经典图像压缩方法
(1)哈夫曼编码(Huffman)
哈夫曼编码根据信源中各种符号出现的概率进行编码, 出现概率越高的符号为其设计的码字越短,出现概率 越小的符号,则对应的码字越长,从而达到较少的平 均码长。 优点:哈夫曼编码是接近于信源熵的编码方法。 不足:哈夫曼编码要对原始数据扫描两遍,数据压缩 和还原速度都较慢。
静态影像压缩
靜態影像壓縮電機四b90901084 林建邑I. 簡介:影像壓縮的目的主要是為了節省電腦空間。
對於未壓縮過的BMP圖檔而言,其大小為56(header)+寬度*高度*3 (bytes),其中3 bytes各代表由0 ~ 255的R,G,B數值。
以一800*600的BMP為例,其大小為1,440,056 bytes=1.37Mb,而同大小的JPEG檔大約只需80 ~ 120Kb不等(視圖形的輪廓與顏色複雜度而定),其間的大小差距在10倍以上!!因此,即使是在電腦容量越來越大的今天,影響壓縮依然有其非常的必要性;而在頻寬有限的多媒體網路傳輸上,影像壓縮更是具有舉足輕重的地位。
影像壓縮的流程主要是先將原始資料(raw data)做適當的編碼(encode)和壓縮,再將之做傳輸或儲存等動作;要實際展現影像時,用適當的演算法對資料做解碼(decode)即可。
不同的影像格式會用不同的演算法來進行編碼、壓縮,以及解碼。
影像壓縮的技術主要分為下列兩類:(1)失真(lossy)壓縮:經過壓縮後的原始資料,不論使用何種演算法解碼還原,得到的影像和原始資料相比會有失真現象產生。
因為允許部分資訊的流失,因此這類壓縮技術通常擁有較高的壓縮率。
(2)無失真(lossless)壓縮:經過壓縮後的原始資料,可使用適當的演算法解碼還原,得到和原始資料完全一樣的影像。
由於壓縮後的資料仍保有所有必要的資訊,因此這類壓縮技術的壓縮率通常較低。
II. 影像編碼:影像編碼的流程依影像格式不同而有不同的作法,以下介紹的是JPEG格式的主要流程:(1)傅立葉轉換(Fourier Transform):將影像由space domain( 單位為長度,如cm),轉換到frequency domain(單位為1/長度,如cm-1)。
(2)量化(quantization):對不同的頻率成分做weighting,刪除掉不重要的訊息成分,以減小資料的大小。
静态图像压缩JPEG2000标准
4) JPEG2000能方便的实现对码流的随机存取与处理,保证位错误的鲁棒性。
5) JPEG2000支持所谓的感兴趣区域特性,你可以任意指定图像上你感兴趣区域的压缩质量,还可以选择指定的部份先解压缩,这样我们就可以很方便的突出图片中的重点进行浏览。
(3)JPEG2000图片的压缩
目前有很多公司、机构提供了JPEG2000的压缩工具及编解码器。主要有LuraWave SmartCompress Freeware for Windows、Elecard Wavelet Image Compressor等。其中以LuraTech的LuraWave SmartCompress 及相应编码器生成的LuraWave(lwf)格式最有名。
2. JPEG2000标准
随着多媒体应用领域的激增,传统JPEG压缩技术已无法满足人们对多媒体图像资料的要求。因此,更高压缩率以及更多新功能的新一代静态图像压缩技术 JPEG 2000 随之诞生。
JPEG2000标准同样由JPEG 组织负责制定。自1997年3月开始筹划,于2000年3月出台。其标准号为ISO 15444。
(1)JPEG标准的组成部分
JPEG标准包括基于DPCM(差分脉冲编码调制)的无损压缩编码,基于DCT(离散余弦变换)和Fuffman编码的有损压缩算法两个部分。前者不会产生失真,但压缩比很小;后一种算法进行图像压缩信息虽有损失,但压缩比可以很大,例如压缩20倍左右时,人眼基本上看不出失真。目前我们对JPEG标准的应用主要是步骤
JPEG算法操作可分成以下三个基本步骤:
1) 通过离散余弦变换(DCT)去除数据冗余。
2) 使用量化表对DCT系数进行量化,量化表是根据人类视觉系统和压缩图像类型的特点进行优化的量化系数矩阵。
非对称双重压缩静态图像压缩技术研究
非对称双重压缩静态图像压缩技术研究一、引言图像是信息科学和计算机科学中的重要领域之一,随着高清晰度图像和大型图像的广泛使用,压缩技术变得越来越重要。
压缩图像可以节省存储空间,提高传输速度,节省带宽。
非对称双重压缩静态图像压缩技术是一种新型压缩技术,相对于其他压缩技术,它具有很多优点。
本文将着重探讨非对称双重压缩静态图像压缩技术的原理、流程及其在实际应用中的优缺点。
二、非对称双重压缩静态图像压缩技术的原理非对称双重压缩静态图像压缩技术是一种结合了无损和有损压缩技术的新型压缩技术,其原理基于信源编码和信道编码。
该技术利用了图像灰度值的稀疏性,在保证图像质量的前提下,通过控制位图和压缩率达到了无损和有损压缩的平衡。
图像压缩的一般方法有两种:无损压缩和有损压缩。
无损压缩不会降低图像质量,它是指压缩的结果与原图像完全一致。
一般来说,无损压缩比有损压缩的压缩率低。
有损压缩是指压缩后输出图像的品质低于原始图像,它可以实现更高的压缩比。
非对称双重压缩静态图像压缩技术就是将无损压缩和有损压缩结合起来,实现压缩比和图像质量的平衡。
三、非对称双重压缩静态图像压缩技术的流程非对称双重压缩静态图像压缩技术的主要流程分为四个部分:预处理、灰度变换、非对称双重压缩和解压缩。
具体流程如下:1. 预处理:原始图像经过灰度处理后再进行对比拉普拉斯增强滤波,这一步主要用于增加图像的对比度和锐度。
2. 灰度变换:图像经过灰度变换后,把图像划分为不同的块。
块的大小取决于压缩率和图像质量的平衡需要。
3. 非对称双重压缩:将每个块分别进行无损和有损压缩。
其中有损压缩采用比特平面实现,将比特流分类压缩。
通过特殊的编码算法,可以在保证压缩率的前提下,减少由于有损压缩引起的伪像。
无损压缩采用哈夫曼编码实现,实现压缩率高、压缩速度快的目的。
4. 解压缩:将压缩后的图像进行解压缩,实现恢复原始图像。
解压缩的过程主要就是对压缩后的块进行解压缩。
四、非对称双重压缩静态图像压缩技术的优缺点非对称双重压缩静态图像压缩技术相对于其他压缩技术具有以下优点:1. 高压缩比:与其他压缩技术相比,非对称双重压缩静态图像压缩技术可以达到更高的压缩比。
静态图象压缩标准JPEG
1.基于DPCM的无失真编码 1.基于DPCM的无失真编码
为了满足无失真压缩的需要, JPEG 选择的一种简单的预测编码方式。 优点:硬件容易实现,图象重建质量好 缺点:压缩比太低(2:1)
2.基于DCT的有失真压缩编码 2.基于DCT的有失真压缩编码 (重点)
包括两种不同的系统,基本系统和增强 系统,增强系统是基本系统的扩充。 基于DCT编码器的工作原理框图见图2.9 。
为什么会有如此大的差距呢?
JPEG采用了图象压缩的技术 采用了图象压缩的技术 采用了图象压缩
本节重点内容
JPEG标准的基本系统中压缩过程有哪几 步,以及各步的工作原理是什么?
2.3.1 JPEG标准的主要内容 JPEG标准的主要内容
JPEG标准选定ADCT作为静态图象压缩 的标准化算法 本标准有两大分类。
(3).量化处理 (3).量化处理
输入: 输入:对FDCT输出的DCT系数进行量化处 理 关键:找最小量化失真(误差)的量化器。 关键 作用:在一定主观保真度图象质量前提下, 作用 丢掉那些对视觉影响不大的信息,通过量化 可调节数据压缩比。 输出:DC系数(直流)和AC系数(交流)
JPEG采用线性均匀量化器,定义 为对64个DCT系数除以量化步长,再四舍 五入取整。 F (u,v) = Integer Round [F(u,v) / Q(u,v)] Q(u,v):量化器步长,是量化表的元素。
直流分量DC (1).64个变换系数经量化后,坐标 u=v=0 的 F(0,0) 称 DC 系数,即直流分 量。是64个空域图象采样值的平均值。 (2).JPEG的量化后的DC系数采用 DPCM编码,即对DIFF=DC i –DC i-1编码。 如图:教材29页,图2.11。 (3).采用这种编码方式的原因:相 邻8*8块之间DC系数有较强相关性。
静态图像压缩标准
静态图像压缩标准静态图像压缩是数字图像处理中的重要技术,它可以减小图像文件的大小,从而节省存储空间和传输带宽。
在图像处理、网页设计、移动应用等领域都有着广泛的应用。
本文将介绍静态图像压缩的标准,包括JPEG、PNG和GIF等常见的压缩格式,以及它们的特点和应用场景。
JPEG压缩是最常见的图像压缩格式之一,它采用了一种有损压缩的算法,可以在一定程度上减小图像文件的大小,同时保持较高的图像质量。
JPEG压缩适用于照片、真彩色图像等复杂图像的压缩,但对于简单的图像或者带有文本、线条的图像,JPEG的压缩效果并不理想。
此外,JPEG压缩的图像文件在多次编辑和保存后会出现压缩失真的问题,因此在需要频繁编辑的图像上不宜使用JPEG格式。
PNG压缩是一种无损压缩的格式,它可以保持图像的原始质量,适用于简单图像、带有透明通道的图像以及需要频繁编辑的图像。
PNG格式的图像文件通常比JPEG格式的大,但在保持图像质量的同时,可以减小文件大小。
因此,PNG格式适用于需要保持图像质量的场景,比如网页设计、图像编辑等领域。
GIF压缩是一种特殊的压缩格式,它主要用于动画图像的压缩。
GIF格式采用了一种无损压缩的算法,可以将多幅图像合成为一个GIF动画文件。
GIF格式的图像文件通常比JPEG和PNG格式的小,适用于网页动画、表情包等场景。
除了上述几种常见的压缩格式外,还有一些新兴的压缩算法和格式,比如WebP、HEIC等,它们在一定程度上优化了图像压缩的效果和文件大小。
在选择图像压缩格式时,需要根据具体的应用场景和要求来进行选择,以达到最佳的压缩效果。
总的来说,静态图像压缩标准包括了JPEG、PNG、GIF等常见的压缩格式,它们各自有着不同的特点和适用场景。
在实际应用中,需要根据具体的需求来选择合适的压缩格式,以达到最佳的压缩效果和图像质量。
希望本文能够对静态图像压缩标准有所帮助,谢谢阅读!。
静态图像压缩标准JPEG
跨学科工作坊
基于DCT的渐进编码模式
与顺序模式编码步骤基本一致
图像分量编码经过多次扫描完成 按频段渐进
一次扫描中,只对DCT变换中的某些频段的系数进行编码传送,然后累进
的方式对其他频段进行编码与传送,直至将全部系数传递完毕
按位渐进
对DCT系数按照其数位由高至低分成若干段,依次对各段进行压缩编码, 先对最有效位的N位进行编码传送,直至将全部系数传递完毕
跨学科工作坊
编码方式
跨学科工作坊
熵编码
为了进一步压缩数据,需对DC码和AC行程编码的码字再做基于统计特性的
熵编码
JPEG建议的熵编码是Huffman编码和自适应二进制编码 Huffman编码:依据字符出现概率来构造异字头的平均长度最短的码字 自适应二进制编码:把整个输入的消息编码为一个数,一个满足(0.0 ≤ n < 1.0)的小数,自适应算术编码中,信源符号的概率根据编码时符号出现 的频繁程度动态地进行修改
把整个输入的消息编码为一个数一个满足0010的小数自适应算术编码中信源符号的概率根据编码时符号出现的频繁程度动态地进行修改学科工作坊基于dct的渐进编码模式按频段渐进一次扫描中只对dct变换中的某些频段的系数进行编码传送然后累进的方式对其他频段进行编码与传送直至将全部系数传递完毕按位渐进对dct系数按照其数位由高至低分成若干段依次对各段进行压缩编码先对最有效位的n位进行编码传送直至将全部系数传递完毕跨学科工作坊基于dct的渐进编码模式跨学科工作坊基于dct的分层编码模式1降低原始图像的空间分辨率
源图像 数据
预测器
熵编码器
压缩的图 像数据
跨学科工作坊
基于DPCM的无损编码模式
二维预测编码
JPEG及JPEG2000
DCi-1
DCi
根据这个特点,JPEG算法使用了差分脉冲调制编码 (DPCM)技术,对相邻图像块之间量化DC系数的差 值进行编码 。∆DCi=DCi -DCi-1
(2)AC交流系数的编码 Z字形编排。对于量化后的二维数组,我们还要对其进行线 性化,然后再进行压缩加以传输。为保证低频分量先出现, 高频分量后出现,以增加行程中连续“0”的个数,63个AC系 数采用z字形排列。
新一代静态图像压缩标准---JPEG2000
1. JPEG2000概述 概述
虽然JPEG 标准是一个非常成功的标准,但在一些新的 应用如高清图像、数字图书馆、高精确彩色图像、多 媒体和因特网的应用、无线、医学图像等方面,JPEG 表现出不足,因此弥补JPEG对连续色调静止图像的无 损压缩和近无损压缩效率不高的缺陷,最终提出了 JPEG2000标准。 该标准采用了先进的压缩技术并在可伸缩压缩图像及 灵活性方面有许多先进的特征,其系统功能比JPEG 标 准优越,尤其JPEG2000 采用的是离散小波变换 (DWT)替代了JPEG 中采用的离散余弦变换DCT), 并采用了最新的编码算法来支持灵活性,这样许多应 用只需用单一码流提供。JPEG2000 可广泛应用于通信、 图像处理、信号处理、信息理论和多媒体等领域中。
尺寸分类(符号1 ) 0 1 2 3 4 5 6 7 8 9 10 11
码长 2 3 3 3 3 3 4 5 6 7 8 9 00 010 011 100 101 110 1110 11110 111110 1111110 11111110 111111110
码字
亮度DC系数表
行程/尺寸(符号1) 0/0(EOB) 0/1 0/2 0/3 0/4 0/5 0/6 0/7 0/8 0/9 0/A 1/1 1/2 …
静态图像压缩标准
静态图像压缩标准静态图像压缩是指通过某种算法或技术对图像文件进行处理,以减小文件的体积,同时尽量保持图像质量的技术。
在数字图像处理领域,静态图像压缩是一项非常重要的技术,它涉及到图像文件的存储、传输和显示等方面。
本文将介绍静态图像压缩的标准,包括常见的压缩算法、压缩标准以及其应用。
一、静态图像压缩的基本原理。
静态图像压缩的基本原理是利用图像中的冗余信息和人眼对图像的感知特性,通过一定的算法将图像文件的体积减小,同时尽量保持图像质量。
常见的静态图像压缩算法包括JPEG、PNG、GIF等,它们都采用了不同的压缩原理和方法。
二、静态图像压缩的标准。
1. JPEG压缩标准。
JPEG(Joint Photographic Experts Group)是一种广泛应用的图像压缩标准,它采用了基于DCT(Discrete Cosine Transform)的压缩算法。
JPEG压缩标准在保持图像质量的同时,能够将图像文件的体积减小到较小的程度,适合用于存储和传输静态图像文件。
2. PNG压缩标准。
PNG(Portable Network Graphics)是一种无损压缩的图像格式,它采用了DEFLATE压缩算法。
相比于JPEG,PNG能够更好地保持图像的质量,但文件体积通常会更大一些。
PNG格式适合用于对图像质量要求较高的场景,如图像编辑和网页设计等领域。
3. GIF压缩标准。
GIF(Graphics Interchange Format)是一种支持动画的图像格式,它采用了LZW压缩算法。
GIF格式在保持图像质量的同时,能够实现较高的压缩比,适合用于制作简单的动画和图标等场景。
三、静态图像压缩标准的应用。
静态图像压缩标准在各个领域都有着广泛的应用。
在数字摄影、图像编辑和网页设计等领域,人们经常会用到JPEG和PNG格式的图像文件。
而在制作简单动画和图标时,GIF格式也是一种常见的选择。
总结。
静态图像压缩标准是数字图像处理领域中的重要技术,它通过一定的算法和方法,能够将图像文件的体积减小,同时尽量保持图像质量。
静态图像的国际压缩标准JPEG.
数组T中每个元素称为变换系数,这些系数都有明确 的物理意义:
- i=0,j=0的值称为DC系数,它与数组的平均值有关。 - 其余的值称为AC系数。随着i和j值的增加,相应系数分别 代表逐步增加的水平空间频率分量和垂直空间频率分量的 大小。
Hale Waihona Puke 离散余弦变换方法研究较早,技术成熟,图像压缩实践证明 DCT是许多图像的最佳变换,将88图像的空间表达式转换为 频率域,只需要少量的数据点来表示图像。 DCT算法的性能很好,可以进行高效的运算,在硬件和软件中 都容易实现。它的快速算法已可由专用芯片来实现,因而被 广泛采用。
量化
DCT变换的作用是使空间域的能量重新分布, 降低图像的相关性。DCT变换本身并不能达到 数据压缩的作用。 要实现图像压缩,需要选择适当的比特分配方 案和量化方法。 量化的作用是在保证主观图像质量的前提下, 丢掉那些对视觉效果影响不大的信息。 量化是一种降低精度的过程,所以是有损的。
JPEG标准中采用线性均匀量化器,量化过程为 对64个DCT系数除以量化步长并取整,量化步 长由量化表(量化矩阵)决定。 量化的计算公式: 量化值(i,j)=T(i,j)/量化矩阵(i,j) 由公式可见,当量化值较大时,可以保证所有 较高频率的分量实际上都将被四舍五入为0。 仅在高频系数很大时才将其编码为非0值,但 这种情况很少出现。
N 1 N 1
T (i, j )
C (i ), C ( j )
1 2
, 当i, j 0
C (i), C ( j ) 1 否则
The pixel values are shifted into the zero-centered interval (–128, 127). 在逆向离散余弦变换后,对重 构图像中的每个样本值数据要加上128。 This transformation must be carried out 64 times per data unit. The result is 64 coefficients. DCT对一 个8×8的矩阵P进行处理,得到一个8×8的频率系 数矩阵。 物理意义:将信号从一种表达形式(空间域,即图 像的像素值)变成另一种等同的表达形式(频率域, 即频率系数),并且这种变换过程是可逆的。
mpeg是静态图像的压缩标准
mpeg是静态图像的压缩标准MPEG是静态图像的压缩标准。
MPEG(Moving Picture Experts Group)是一种数字视频和音频压缩标准,它不仅适用于动态图像,也适用于静态图像的压缩。
在数字图像处理领域,MPEG已经成为了一种非常流行的压缩标准,能够有效地减小图像文件的大小,同时保持图像质量。
本文将介绍MPEG在静态图像压缩方面的应用和特点。
MPEG标准的应用范围非常广泛,不仅包括了视频压缩,也包括了静态图像的压缩。
在静态图像的压缩方面,MPEG主要应用在数字相机、数字摄像机、数字电视等领域。
它能够将图像文件的大小减小到原来的几十分之一甚至更小,同时保持图像的清晰度和细节,这对于存储和传输静态图像来说是非常重要的。
MPEG标准的静态图像压缩是基于DCT(Discrete Cosine Transform)的,它采用了一种叫做“基于区块的压缩”技术。
在这种技术下,图像被分割成许多小的区块,每个区块都可以被独立地压缩。
这种方法不仅能够提高压缩的效率,还能够保持图像的清晰度和细节。
另外,MPEG还采用了一种叫做“运动补偿”的技术,它能够进一步提高压缩的效率,特别是对于连续的静态图像来说,这种技术能够显著地减小图像文件的大小。
MPEG标准的静态图像压缩还采用了一种叫做“量化”的技术,它能够将图像的颜色和亮度信息表示成数字,然后再进行压缩。
通过这种技术,MPEG能够将图像的文件大小减小到原来的几十分之一,同时保持图像的清晰度和细节。
这种技术对于存储和传输静态图像来说非常重要,它能够大大提高存储和传输的效率。
总的来说,MPEG是一种非常流行的静态图像压缩标准,它能够将图像文件的大小减小到原来的几十分之一甚至更小,同时保持图像的清晰度和细节。
它的应用范围非常广泛,不仅包括了数字相机、数字摄像机、数字电视等领域,还包括了许多其他领域。
通过采用DCT、基于区块的压缩、运动补偿和量化等技术,MPEG能够提高压缩的效率,特别是对于连续的静态图像来说,这些技术能够显著地减小图像文件的大小。
静态图像压缩标准JPEG
02
JPEG压缩算法原理
离散余弦变换(DCT)
离散余弦变换(DCT)是一种将图像从空间域变换到频域的算法,通过将图像分解 为余弦函数的和,实现图像数据的压缩。
DCT将图像分为8x8的块,对每个块进行DCT变换,将每个像素点的灰度值转换 为一系列余弦函数的系数,保留主要的低频分量,去除次要的细节分量,达到压 缩的目的。
2
JPEG压缩算法能够有效地去除图像中的冗余信息, 减小图像文件大小,同时保持较高的图像质量。
3
在数字相机中,JPEG压缩技术广泛应用于各种型 号和品牌的相机中,成为存储图像的默认格式之 一。
网络传输中的JPEG图像压缩
01
在网络传输中,由于带宽限制 和传输效率的需求,需要对图 像进行压缩以减小传输时间和 数据量。
逐行采样(Progressive mode)
图像从粗糙到精细的顺序进行采样,先输出低分辨率的图像,然后逐渐增加分辨率。
顺序采样(Sequential mode)
图像按照像素的顺序逐行进行采样,每一行都采样一次。
分层采样(Tiled mode)
将图像分成若干个小的区域,每个区域独立进行采样。
量化表(Quantization Table)
静态图像压缩标准JPEG
• JPEG标准概述 • JPEG压缩算法原理 • JPEG标准的主要技术参数 • JPEG标准与其他图像压缩标准的比较 • JPEG标准的应用案例
01
JPEG标准概述
JPEG标准的发展历程
01
02
03
1986年
JPEG标准第一版发布,支 持基本压缩算法。
第11章 静态图像压缩标准JPEG
DCT变换频率域的理解
多媒体技术基础与应用
JPEG的量化
DCT变换的作用是使空间域的能量重新分布, 降低图像的相关性。DCT变换本身并不能达到数 据压缩的作用,而要实现图像压缩,就要选择适 当的比特分配方案和量化方法。 量化的作用是在保证主观图像质量的前提下, 丢掉那些对视觉效果影响不大的信息。量化是一 种降低精度的过程,所以是有损的。
多媒体技术基础与应用
RG体技术基础与应用
各分量的采样
颜色空间的转换后,然后进行各分量的采样,其
目的是使采集到的图像数据有所减少。也就是减 少色度的成份(称为"缩减采样"或"色度采样"。 在JPEG上这种缩减取样的比例可以是4:4:4(无 缩减取样),4:2:2(即Y取4个8×8的宏块, CbCr各取2个8×8的宏块)。
相邻的子块DC系数的差值可用公式 表示为:
多媒体技术基础与应用
交流系数(AC)编码与Z形扫描
频率矩阵中有63个元素是交流(AC)系 数,可采用行程编码进行压缩。需要考虑 的问题是:这63个系数应该按照怎么样的 顺序排列?为了保证低频分量先出现,高 频分量后出现,这63个元素采用了“之” 字型(Zig-Zag)的排列方法,称之为Z形扫描。
多媒体技术基础与应用
JPEG2000图像不同压缩示例
多媒体技术基础与应用
支持“感兴趣区域”
多媒体技术基础与应用
多媒体技术基础与应用
熵编码
量化仅生成了DCT系数的一种有效的离 散表示,实际传输前,还须对其进行比特 流编码,产生用于传输的数字比特流。简 单的编码方法是采用定长码,即每个量化 值以同样数目的比特表示,但这种方法的 效率较低。而采用熵编码可以提高编码效 率。熵编码中使用较多的一种是霍夫曼编 码。
CCSDS静态图像压缩算法实现的开题报告
CCSDS静态图像压缩算法实现的开题报告一、选题背景与意义随着科技的不断发展,图像技术得到了迅速的发展。
应用广泛,例如:远程医疗、监控系统、卫星图像传输等。
但是随着图像的增加,数据的大小与传输时间也随之增加。
因此为了压缩数据体积,静态图像压缩技术被广泛应用。
在许多应用中,压缩算法可以极大地减少传输时间和存储成本。
二、选题的主要研究内容和任务CCSDS是“Consultative Committee for Space Data Systems”的缩写。
该算法是一个经典的静态图像压缩算法,是CCSDS标准中包含的一个无损压缩算法。
本次选题旨在通过研究CCSDS算法并实现它,来掌握静态图像压缩基础知识,并理解CCSDS算法的原理及实现方法。
主要研究内容如下:1、掌握静态图像压缩算法基础知识。
2、深入了解CCSDS算法的原理。
3、分析CCSDS的实现方法,并设计相应的程序。
4、通过实验比较CCSDS算法与其他压缩算法的压缩效果。
三、研究方法本次选题主要采用以下方法:1、查阅相关文献,理解静态图像压缩算法基础知识及CCSDS算法的原理和实现方法。
2、对CCSDS算法的编程实现,并通过实验来验证算法的正确性。
3、对比CCSDS算法与其他压缩算法的压缩效果。
四、研究步骤计划(1) 阅读相关文献,学习静态图像压缩算法的基础知识,掌握CCSDS算法的原理。
(2) 实现CCSDS算法,包括压缩和解压缩。
(3) 设计压缩算法效果评估实验。
(4) 比较CCSDS算法与其他算法的压缩效果,并分析其优缺点。
(5) 撰写论文。
五、预期成果及意义预期成果:完成CCSDS算法的编程实现,并开展实验验证,得出实验数据并进行分析,形成一篇系统性较强、具有一定创新性的论文,并取得一定的结果和结论。
意义:本篇论文对于研究图像压缩算法有较高的参考价值,有助于提高图像压缩效率和压缩质量,对有关领域的研究和应用都有一定参考价值。
MATLAB实现JPEG标准下的静态图像压缩
MATLAB实现JPEG标准下的静态图像压缩1引言众所周知,原始图像数据会占用大量的存储空间,对于需要大量存储和传输图像的应用领域,需要有效的方法来存储及传输这些图像文件。
因此,对图像信息进行一定的压缩处理成为一个不可或缺的重要环节。
图像数据压缩是指在满足一定图像质量的情况下,用尽可能少的数据量来表示图像。
通常情况下,图像中含有大量的冗余信息,图像压缩的目的就是通过消除这种冗余性,减少图像的存储空间,即保留不确定的信息,去掉确定的信息,也就是用一种更接近信息本质的描述来代替原有冗余的描述。
2图像数据压缩系统2.1图像数据压缩系统的组成典型的图像数据压缩系统的组成如下:(1)变换器由于图像中大量冗余信息的存在,去除图像相关性是提高编码效率的一个很重要的步骤。
变换器是无损变换过程,变换后的图像可以无失真恢复原始图像。
(2)量化器生成一组有限个离散符号来表示压缩的图像。
量化过程是一个幅值离散的过程,它是不可逆的,也是有损耗的。
(3)编码器给量化器输出的每个符号指定一个码字,即二进制位流。
编码器可以使用定长编码或变长编码,变长编码又称为熵编码。
图像符号的编码过程和变换过程一样是无损耗的,即编码和解码过程是可逆过程。
2.2图像压缩系统评价不同的图像压缩系统,由于其应用环境与处理目标不尽相同,因此系统结构和具体算法的选择是千变万化的。
为了对图像系统的性能有一个统一和全面的评价,我们通常从恢复图像质量,压缩率,算法复杂度以及通信时延几个方面来考察一个图像处理系统的压缩效果和可实现性及实用性。
压缩比就是原始图像大小与采用某种算法压缩后的图像大小的比值。
恢复图像的高质量与高压缩比总是一对矛盾,因此这一对矛盾解决得好坏就成了评判压缩算法优劣的重要标准。
3 JPEG标准由国际标准化组织(ISO/IEC)与国际电报电话咨询委员会(CCITT)联合发起的联合图像专家组,在图像编码研究成果的基础上于20世纪90年代初制定了静止图像的编码标准,简称JPEG(Joint Photographic Expert Group)标准[1]。
静态图像压缩标准JPEG
其余63个交流系数采用行程编码,使用Z字
形扫描方式可以增加连续零系数的个数,也就是
增加零值的游程长度。图1-9为Z字形扫描轨迹图。 从左上方AC01开始,沿对角线方向,直到AC77 扫描结束。63个AC系数行程编码的码字,可用2 个字节来表示,如图1-10所示。
1.2 JPEG压缩基本处理算法
图1-9 Z字形扫描
经过DCT变换后,DCT系数间的相关性
已经显现出来,即左上角的系数值大,而右下
角的系数值小,为数据压缩创造了必要条件。
但这种相关性还不是十分明显,要最终实现数
据压缩,还需要进一步降低非零系数的幅值,
增加零值系数的数量,从而进一步提高F矩阵的 相关性。为此还要对变换后的DCT系数进行量 化,来减少表示每个DCT系数所使用的位数, 另外可以增加零值系数,提高压缩比。
1.2 JPEG压缩基本处理算法
表1-1 亮度量化表
表1-2 色度量化表
1.2 JPEG压缩基本处理算法
对DCT系数的量化是基于限失真编码理
论进行的,量化是造成图像质量下降的最主要
的原因。其作用是在一定的主观保真度图像质
量的前提下,丢掉那些对视觉效果影响不大的
信息,失真度在人的视觉所能接受的容限之内。
专家组开发的算法称为JPEG算法,并于1991年
正式成为国际标准,编号为ISO/IEC10918,现
常称为JPEG标准。JPEG是一个使用范围很广
的静态图像数据压缩标准,既可用于灰度图像
又可用于彩色图像。
1.1 JPEG压缩算法简介
JPEG的目的是为了给出一个连续色调图像的压
缩方法使之满足以下要求:
1.2 JPEG压缩基本处理算法
4.DC系数差值编码和AC系数的行程编码
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
靜態影像壓縮介紹(作者吳和弟)前言顧名思義,靜態影像(still image)即是指靜止不動的單張影像圖片,例如一張彩色圖片。
而有靜態就會有動態,動態影像 (motion image)則是連續性的動作,例如電視與電影畫面等。
本文將只針對靜態影像壓縮(still image compression)技術作一概略性的介紹。
影像壓縮的優點通常一般我們所見的單張彩色靜態影像,它是由很多一個點一個點的像素(pixel) 所組成,而每一個像素主要由R(紅)、G(綠 )、B(藍 )三原色所構成,每一個原色用一個字元(byte)來表示。
例如:欲儲存一張長 512 pixel 、寬 512 pixel 的彩色圖片需要的記憶體為:512 x 512 x 3 bytes = 768 kbytes由上例中可以看出:未經壓縮的影像在儲存時,會佔用非常大量的儲存空間,且未經壓縮的影像資料透過通訊網路傳送時,所需的傳輸時間也將相對地拉長。
為解決上述的問題,使用者如能將影像予以壓縮,即可達到減少儲存空間、縮短傳輸時間的雙重效能。
靜態影像壓縮的國際標準由於有感於靜態影像壓縮需要一個大家可以共同遵循的國際標準,因此由國際標準組織 (International Standardization Organization; ISO) 與國際電報電話諮詢委員會(Consultative Committee on International Telegraph and Telephone; CCITT)兩邊人員共同成立聯合影像專家群(Joint Photographic Expert Group; JPEG ) ,他們共同制定了一個稱為JPEG 的靜態影像壓縮之國際標準。
JPEG 的分類JPEG 根據壓縮技術的不同,而把靜態影像壓縮的方式分為兩種,一種是有失真模式 (Information Loss),另一種是無失真模式(Information Lossless)。
茲將此兩種壓縮模式分述如下:1. 有失真模式:‧採用離散餘弦轉換 (Discrete Cosine Transform; DCT) 的技術。
‧經過壓縮與解壓縮還原之後的影像會有失真產生,幸好人的眼睛對於少許失真不易察覺。
‧壓縮率高,壓縮 30 倍仍能獲得高品質。
‧應用於一般圖片、多媒體。
‧應用廣泛,目前的應用絕大部份都是採用此種模式。
2. 無失真模式:‧採用差值訊號編碼 (Differential Pulse Code Modulation;DPCM) 的技術。
‧經過壓縮與解壓縮還原之後的影像與原始影像相比完全沒有失真產生。
‧壓縮率低,通常在 10 倍以下。
‧主要應用於醫學影像,因為醫學上寧可壓縮率低確保影像品質,而不願高壓縮率引起的影像失真造成誤診。
‧因為壓縮率不高,除了醫學影像之外,目前的應用很少採用此種模式。
壓縮原理因為目前靜態影像壓縮大部份採用有失真模式,因此,以下將針對有失真模式進行介紹。
圖一是整個影像壓縮 (Compression) 的方塊圖,圖二則是解壓縮(Decompression)的方塊圖。
透過此二圖我們可以知道:壓縮與解壓縮的過程類似,僅是執行的順序相反而已,因此,對於解壓縮文中將不再贅述。
圖一壓縮 (Compression) 方塊圖圖二解壓縮 (Decompression) 方塊圖A. RASTER -> BLOCK如圖三所示,把整個圖片分割成多個 8 x 8 點的小方塊(block),每個小方塊有64 點也就是 64 個像素。
整個壓縮的過程是以小方塊為單位作處理。
圖三整個圖片分割成多個 8x8 點的小方塊B. RGB -> YUV原始影像每一個點 (像素) 是由紅 (R)、綠 (G)、藍 (B)三原色所構成,在此把它轉換成一個亮度訊號 (Luminance) Y 與二個色差訊號 (Chrominance) U、V。
R、G、B 轉換為 Y、U、V 的公式如下:Y = 77/256R + 150/256G + 29/256BU = -44/256R - 87/256G + 131/256B + 128V = 131/256R - 110/256G - 21/256B + 128C. DCT (Discrete Cosine Transform;離散餘弦轉換)離散餘弦轉換的輸入是 8 x 8 個點,輸出則是 8 x 8 個係數(coefficients)。
此轉換把影像由空間定義域 (space domain) 轉換到頻率定義域 (frequency domain),每個 8 x 8 小方塊裡面係數的位置愈靠近左上角,它代表的頻率愈低,愈靠近右下角,則它代表的頻率愈高。
一般而言,大部份的影像能量會集中在低頻部份,也就是轉換之後的輸出係數在低頻部份的值較大,而輸出係數在高頻部份的值很小。
所以當輸出係數經過量化 (quantization) 之後,高頻部份的值大部份都會變為 0。
文中所描述的靜態影像壓縮是採用離散餘弦轉換的壓縮技術,它的主要精神在於:能量集中。
離散餘弦轉換的公式如下:離散餘弦轉換需要冗長的運算,所以它是整個影像壓縮過程最花時間的部份。
如果以純軟體實現影像壓縮,約 75% 的時間花在離散餘弦轉換的計算。
D. QUANTIZATION此處的量化(quantization)是採用線性量化(linear quantization) 的方式,對於相同頻率的輸入值都除以一固定值。
根據測試,人的眼睛對不同頻率之敏感度不同,對低頻較敏感,然而對高頻較不敏感,因此低頻的失真應該儘量降低,而對於高頻部份則可允許有較多的失真。
所以在低頻採用小的量化位準(quantization level);而在高頻採用大的量化位準。
表一是對應於 8 x 8小方塊裡面各個不同頻率之亮度的量化位準,表二是色差的量化位準。
一般而言,人的眼睛對於亮度的失真較色差的失真敏感,因此表一比表二採用較小的量化位準。
表一亮度的量化位準 (quantization level)┌─┬─┬─┬─┬──┬──┬──┬──┐│16│11│10│16│24 │40 │51 │61 │├─┼─┼─┼─┼──┼──┼──┼──┤│12│12│14│19│26 │58 │60 │55 │├─┼─┼─┼─┼──┼──┼──┼──┤│14│13│16│24│40 │57 │69 │56 │├─┼─┼─┼─┼──┼──┼──┼──┤│14│17│22│29│51 │87 │80 │62 │ ├─┼─┼─┼─┼──┼──┼──┼──┤│18│22│37│56│68 │109 │103 │77 │ ├─┼─┼─┼─┼──┼──┼──┼──┤│24│35│55│64│81 │104 │113 │92 │ ├─┼─┼─┼─┼──┼──┼──┼──┤│49│64│78│87│103 │121 │120 │101 │ ├─┼─┼─┼─┼──┼──┼──┼──┤│72│92│95│98│112 │100 │103 │99 │ └─┴─┴─┴─┴──┴──┴──┴──┘表二色差的量化位準 (quantization level)┌─┬─┬─┬─┬─┬─┬─┬─┐│17│18│24│47│66│99│99│99│├─┼─┼─┼─┼─┼─┼─┼─┤│18│21│26│66│99│99│99│99│├─┼─┼─┼─┼─┼─┼─┼─┤│24│26│56│99│99│99│99│99│├─┼─┼─┼─┼─┼─┼─┼─┤│47│66│99│99│99│99│99│99│├─┼─┼─┼─┼─┼─┼─┼─┤│99│99│99│99│99│99│99│99│├─┼─┼─┼─┼─┼─┼─┼─┤│99│99│99│99│99│99│99│99│├─┼─┼─┼─┼─┼─┼─┼─┤│99│99│99│99│99│99│99│99│├─┼─┼─┼─┼─┼─┼─┼─┤│99│99│99│99│99│99│99│99│└─┴─┴─┴─┴─┴─┴─┴─┘表三鋸齒狀掃描 (zigzag scan) 的順序D. RUN LENGTH ENCODE經過量化之後,每個 8 x 8 的小方塊裡面除了左上角區域以外其它部份幾乎都會變為0。
為了把連續 0 的個數予以編碼,對每個 8 x 8 的小方塊做鋸齒狀掃描 (zigzag scan ) ,使得二維變成一維,掃描的順序如表三所示。
在經過掃描之後,對連續零的個數做編碼 (run length encode),以達到壓縮的目的。
E. HUFFMAN ENCODE我們可以使用哈夫曼編碼 (Huffman coding)使得資料量再一次降低。
哈夫曼編碼的主要精神是:出現機率大的符號用長度短的碼表示,出現機率小的符號用長度長的碼表示,因而其平均使用的資料量較小。
舉一個例子說明:符號 A、B 、C 、D 出現的機率分別為 0.7、0.1、0.1 、0.1。
一般編碼如表四所示,2x0.7+2x0.1+2x0.1+2x0.1=2.0平均每個符號需用 2 個位元 (bits) 表示。
表四一般編碼┌──┬─┐│符號│碼│├──┼─┤│ A │00││ B │01││ C │10││ D │11│└──┴─┘哈夫曼編碼如表五所示,1x0.7+2x0.1+3x0.1+3x0.1=1.5平均每個符號需用 1.5 個位元 (bits) 表示。
表五哈夫曼編碼┌──┬──┐│符號│ 碼│├──┼──┤│ A │ 0 ││ B │ 11 ││ C │100 ││ D │101 │└──┴──┘由上面的例子可以看出哈夫曼編碼會把需要的資料量降低。
實現方式前述的靜態影像壓縮,它的實現方式有純粹軟體、純粹硬體以及軟體加硬體三種,分述如下:1.純粹軟體使用計算機軟體程式來完成全部的工作,此方式速度最慢但是並不需要額外的硬體電路,所以成本最低。
動態影像對速度的要求較高,因為速度慢會演變成慢動作,這並不是原來所要的。
而靜態影像對於速度的要求並不是很嚴苛,因為速度慢使用者只是多等一下,並不影響整個靜態影像的品質。
同時也由於計算機的速度愈來愈快,使用純粹軟體的方式來實現靜態影像壓縮可以預料將是大勢所趨。
2.純粹硬體此方式乃整個靜態影像壓縮架構全部使用硬體電路實現,速度最快,但是相對成本也最高。
此種方式適合用在大量的影像圖片的處理。
3.軟體加硬體此乃是將靜態影像壓縮架構裡面比較花費時間的部分使用硬體電路實現,而比較不花費時間的部分使用計算機軟體程式來完成。