数字图像处理(冈萨雷斯)-8 有损压缩
合集下载
北京大学数字图像处理(冈萨雷斯)课件

法是图像增强和复原过程 的核心
图像的采样和量化
• 大多数传感器的输出是连续电压波形 • 为了产生一幅数字图像,需要把连续的 感知数据转化为数字形式 • 这包括两种处理:取样和量化 • 取样:图像空间坐标的数字化 • 量化:图像函数值(灰度值)的数字化
图像采样 • 空间坐标(x,y)的数字化被称为图像采样 • 确定水平和垂直方向上的像素个数N、M
教材及参考书
• 教材
✓Rafael C. Gonzalez, Richard E. Woods 著 ,阮秋琦、阮宇智等译,数字图像处理(第 二版),电子工业出版社,2003年。
✓Rafael C. Gonzalez, Richard E. Woods, Digital Image Processing(Second Edition) ,Prentice Hall,2003。
SAN与NAS比较
SAN
NAS
块级共享
文件级共享
远程存储访问
远程文件访问
存储专用网
共享LAN
存储协议(如FCP) 网络协议(如TCP/IP)
集中式管理
分散式管理
无限的扩展能力
有限的扩展能力
更高的连接速度和处理能力 较低的连接速度和处理能力
数字图像处理基础
• 图像的采样和量化 • 数字图像的表示 • 数字图像的质量 • 像素间的一些基本关系 邻域处理方
✓ 彩色图像可以用红、绿、蓝三元组的二维矩阵来表示。 通常,三元组的每个数值也是在0到255之间,0表示相应 的基色在该像素中没有,而255则代表相应的基色在该像 素中取得最大值
数字图像的像素表示
什么是像素?
数字图像由二维的元素组成,每一个元素具有一个 特定的位置(x,y)和幅值f(x,y),这些元素就称为像 素
图像的采样和量化
• 大多数传感器的输出是连续电压波形 • 为了产生一幅数字图像,需要把连续的 感知数据转化为数字形式 • 这包括两种处理:取样和量化 • 取样:图像空间坐标的数字化 • 量化:图像函数值(灰度值)的数字化
图像采样 • 空间坐标(x,y)的数字化被称为图像采样 • 确定水平和垂直方向上的像素个数N、M
教材及参考书
• 教材
✓Rafael C. Gonzalez, Richard E. Woods 著 ,阮秋琦、阮宇智等译,数字图像处理(第 二版),电子工业出版社,2003年。
✓Rafael C. Gonzalez, Richard E. Woods, Digital Image Processing(Second Edition) ,Prentice Hall,2003。
SAN与NAS比较
SAN
NAS
块级共享
文件级共享
远程存储访问
远程文件访问
存储专用网
共享LAN
存储协议(如FCP) 网络协议(如TCP/IP)
集中式管理
分散式管理
无限的扩展能力
有限的扩展能力
更高的连接速度和处理能力 较低的连接速度和处理能力
数字图像处理基础
• 图像的采样和量化 • 数字图像的表示 • 数字图像的质量 • 像素间的一些基本关系 邻域处理方
✓ 彩色图像可以用红、绿、蓝三元组的二维矩阵来表示。 通常,三元组的每个数值也是在0到255之间,0表示相应 的基色在该像素中没有,而255则代表相应的基色在该像 素中取得最大值
数字图像的像素表示
什么是像素?
数字图像由二维的元素组成,每一个元素具有一个 特定的位置(x,y)和幅值f(x,y),这些元素就称为像 素
数字图像处理(冈萨雷斯)课件

y
y
x
彩色图像可以用红、绿、蓝三元组的二维矩阵来表示。 通常,三元组的每个数值也是在0到255之间,0表示相应 的基色在该像素中没有,而255则代表相应的基色在该像 素中取得最大值
数字图像的像素表示
什么是像素?
数字图像由二维的元素组成,每一个元素具有一个 特定的位置(x,y)和幅值f(x,y),这些元素就称为像素
考试内容
平时作业50%,考试成绩50% 平时作业选择下列两个之一:
分组完成一个大作业 其(基本概念、原理和算法)
助教老师
曹磊 E_mail: caolei@ 电 话:82529384
注意:有不懂的地方多问助教老师,充分发挥助教老师的 指导作用
上课主要内容(续)
9. 图像压缩(2) 10. 形态学图像处理 11. 图像分割 12. 表示与描述 13. 基于内容的视频分析和检索技术(补充) 14. 考试复习
课程目的与要求
掌握数字图像处理的基本概念、原理和 方法
初步运用所学知识解决实际问题 为图像处理及相关领域的研究打下基础
图像处理 计算机视觉 基于内容的图像、视频检索 人脸识别、指纹识别、掌纹识别、虹膜识别 图像分类、图像和视频的语义概念检测、……
Rafael C. Gonzalez, Richard E. Woods, Digital Image Processing(Second Edition) ,Prentice Hall,2003。
教材及参考书(续)
参考书
Kenneth R. Castleman著,朱志刚、林学訚、石定 机等译,数字图像处理,电子工业出版社,2002年。 章毓晋,图象工程上册—图象处理和分析,清华大 学出版社,2003年。
数字图像处理(冈萨雷斯)-8 无损压缩

•表示不同的信息符号; •B2码代表每一延续比特位后有2个 信息位;
a 11 a 2 a 7
1 01
0 00 0 10
a 11 a 2 a 7
或者
0 01 0 10
1 00 1 10 0 01
1 01 1 10
B编码
a1 a5 a8
B 1码 : 0 0
C 代 表 延 续 比 特 , 取 “ 0” 或 “ 1”
用自然二进制编码需3位,所以用S3
C5
100
C2
001
C3
010
C4
011
C6
101
C7
110
C8
111
C 1 ~ C 7分 配 给 符 号 a1 ~ a 7
, C 8作 为 移 位 符 号
表8.5中的霍夫曼平移码可以类似获得。 只是基准块的7个单独符号 a 1 ~ a 7 用huffman编码;
a 8 ~ a 2 1 所有概率相加,得0.39,移位符号是具有最大概
无损压缩的压缩率一般为2~10 无误差压缩技术
①减少像素间冗余:
建立一种可替代的图像表达方式 ②减少编码冗余: 对这种表达方式进行编码
变长编码
霍夫曼(Huffman)编码 其它变长编码 算术编码
LZW编码
位平面编码
无损预测编码
8.4.1 变长编码
8.4 无损压缩
无误差图像压缩的最简单方法就是减少仅有的编
o a1 o p1
o a2 o p2
为止;
8.4.1
变长编码
(一)霍夫曼编码信源化简
大
大
大
大
小
数字图像处理(冈萨雷斯)-8 图像和视频的压缩标准

JPEG基本系统编码压缩过程:
3.DC系数编码和AC系数编码;
8.6.2 静止图像压缩标准
在左上角的低频分量中,F(0,0)代表了直流(DC)系数,即8×8子块的平均值。 由于两个相邻图像块(有较大的相关性)的DC系数相差很小,所以采用差 分编码DPCM对DC系数单独编码,其它63个元素是交流(AC)系数,采用“z” 字型(zig-zag)顺序进行行程编码,使系数为0的值更集中;
4.在得到DC码字和AC行程码字后,为了进一步提高压缩比,可以 再进行熵编码,采用了Huffman编码; JPEG基本系统解码过程:
压缩图像 熵解码 反化器 IDCT 重建图象
图像应用系统要想与JPEG兼容,必须要支持其基本系统。在视觉效果不
受到严重损失的前提下,对灰度图像压缩算法可以达到15~20的压缩比。 如果在图像质量上稍微牺牲一点,可以达到40:1或更高的压缩比。
v
u
ˆ T ( u, v )
k:
0
1 AC0,1
2
63
zz(k ) : DC0,0
DC系数的编码
AC1,0 AC7,7
JPEG对DC系数 zz (0)单独编码,用同一分量刚刚
编码的前一块 zzi 1 (0) 作为对本块 zzi (0) 的预测值 ,再对差值 DIFF zzi (0) zzi 1 (0)进行无失真编码。 在扫描起点和其他编码器重新启动的初始化时刻,规定预测值 zz0 (0) 0 ˆˆ 如果 zz(0) 动态范围为-1024~1023 则DIFF动态范围为-2047~2047
如果处理的是彩色图像,JPEG算法首先将RGB分量转化成亮度分量和色差
分量,同时丢失一半的色彩信息(空间分辨率减半)。然后,用离散余弦 变换来进行变换编码,舍弃高频的系数,并对余下的系数进行量化,以
冈萨雷斯版_图像压缩讲解

SNRms
x0 M 1 N 1
y0
[ fˆ (x, y) f (x, y)]2
x0 y0
电视图像的等级量表
图像压缩系统的模型
1. 图像f(x,y)输入到编码器(Encoder)中,编码器可以根 据输入数据生成一组符号
2. 通过信道(Channel)进行传输 3. 编码后的表达符号送入解码器(Decoder),经过重构
就生成了输出图像 fˆ ( x, y)
信息量与熵(Entropy)
•中某国个举事重件队x的夺信得息奥量运I用冠事军件发!生概率p(x)的倒数的对数表 中示国男子足球队勇夺奥运冠军!!!
I ( x) log 1 log p( x) p( x)
• 对数以2底时,信息量表示记录信息所用的最小位 数
无误差压缩之一:变长编码
• 码字长度是变化的、不均匀的 • 出现概率较大的信源符号 → 较短的字长 • 出现概率小的信源符号 → 较长的字长
霍夫曼(Huffman)编码
• Huffman编码完全依据信源字符出现的 概率进行编码
• Huffman编码有时也称为最佳编码
Huffman编码用不同码字代表 不同灰度,并非量化灰度值
首先,将信源符号按出现频率由大到小排列
符号 出现概率
• 按压缩过程的可逆性分类: 1) 无误差压缩: 去除原数据中的重复和冗余部分,不丢失任何有用信息 还原后与压缩前的原数据完全一致,又称无失真编码 主要用于文本、程序文件,不允许出现任何数据失真 2) 有误差压缩: 不可逆,损失部分信息,又称率失真编码或限失真编码 丢弃信息造成的失真应限制在规定范围内 主要用于图像和语音数据的压缩
• 能够产生信息的事物称为信源
数字图像处理(冈萨雷斯)-8 图像压缩的理论基础

压缩率为2:1 存在假轮廓效应
c)利用人类视觉特性进行量化后图像 采用IGS量化方法
8.1.3 心理视觉冗余
改进的灰度级(IGS)量化方法
IGS利用眼睛对边缘固有的敏感性,通过一个伪随机数加到每个像素上 将这些边缘拆散。这个伪随机数是在对结果进行量化之前,根据表示相 邻像素灰度级的原编码的低位生成的。由于低位完全是随机的,所以这 样做等于增加了通常与伪轮廓相关的人工边缘随机性的灰度级。
②变长编码:
用尽量少的比特数表达尽可能多的灰度级(以实现数据压缩); 如何实现:短码字赋给出现频率高(高概率)的灰度级;
参考page 328的例8.1
8.1.2 空间和时间冗余
反映静止图像中像素之间的空间相关(结构、几何关系 等)和视频序列中相邻帧之间的时间相关; 如果图像中像素之间存在空间相关,则任何给定像素的
在正常视觉处理过程中各种信息的相对重要程度不同有些信息在通常的视觉过程中与另外一些信息相比并不那么重要不那么重要这些信息被认为是心理信息被认为是心理视觉冗余的视觉冗余的去除这些信息并不会明显降低图像质量由于消除心理视觉冗余数据会导致一定量信息的丢失所以这一过程通常称为量化量化心理视觉冗余压缩是不可恢复的它表示从一个范围很宽的输入集合到一个有限个输出值的集合的映射这种映射是不可逆的这种映射是不可逆的所以结果导致了数据的有损压缩
对第n次扩充后得到的信源输出进行编码所需的平均码长定义为:
Lavg ,n
i1
J
n
P ( i ) l ( i )
②
将①代入②可得: H ( z ) L a vg , n 1 H ( z ) n H ( z ) L a vg , n 1 n H ( z )
数字图像处理课件(冈萨雷斯第三版)_图文

图像数据文件主要是用光栅形式,即图像是一些图像点 的集合,比较适合变化复杂的图像。它的主要缺点是缺少 对象和像素点之间的联系,且在伸缩图像的过程中图像会 改变。例如,常见的图象文件类型有bmp,jpg等等。图象 处理的程序必须考虑图象文件的格式,否则无法正确地打 开和保存图象文件。
pgm格式
美国的许多大学用pgm格式,避免使用压缩文件格式,对 初学者来说是很方便的。下面是一幅该格式的图象。
补充:图象和视觉基础
2.1 概论和综述 2.2 人眼与亮度视觉 2.3 颜色视觉 2.4 光度学和成象模型 2.5 成象变换 2.6 采样和量化 2.7 象素间联系 2.8 算术和逻辑运算 2.9 坐标变换
第2章 图象和视觉基础
2.1 概论和综述
该基础包括视觉基础、成像基础和图像基础三部分 :
0x36 0x34 0x30 0x20 0x34
0x38 0x30 0x0A 表示640(SP)480(LF);
0x32 0x35 0x35 0x0A ………………………………… 表示255(LF) ………………………………… 0x27 0x27 …
表示23, 23,…(像素灰度值)
这幅图象文件的解码:
下面是一个Matlab程序
% 打开蝴蝶图象,进行Fourier变换 h=imread('butterfly.jpg'); % open an image figure; imshow(h); % 因为图像的格式uint8不能做加减法, % 所以需要把格式uint8变成格式double h=double(h); [m,n,p]=size(h); hf=fftshift(fft2(h)); % 2D Fourier变换, 得到2D复数值图像 hfa=log(abs(hf)); % 模的图像,用log来调整灰度的对比度 % 求出模的灰度最大值,从而把其灰度的值域变为[0,255] m=max(max(max(hfa))); hfa=hfa*255/m; figure; imshow(uint8(hfa)); Imwrite(uint8(hfa),’butterfly_fft.jpg’,’jpg’);
数字图像处理课件冈萨雷斯第三版

绍图像复原的概念和方法,如逆滤波、最小二乘法等,以修复受损的图像。
形状分析
介绍形状分析的方法和技术,如周长、面积、轮廓等,以量化和比较图像中的不同形状。
图像压缩基础
讲解图像压缩的基本原理和方法,如有损压缩、无损压缩等,以降低图像文件的大小。
离散傅立叶变换及其应用
探索离散傅立叶变换(DFT)的概念和应用,如频域滤波、图像复原等。
频域滤波
讨论频域滤波的方法和技巧,如低通滤波、高通滤波等,以增强或去除特定频率的图像信息。
灰度变换
介绍灰度变换的概念和方法,如对比度调整、亮度调整等,以改善图像的可视化效果。
直方图均衡化
讲解直方图均衡化的原理和应用,以增强图像的对比度和细节。
灰度变换的应用
探讨灰度变换在图像增强、图像分割和特征提取等方面的应用,以及潜在的 挑战。
线性滤波
介绍线性滤波的基本原理和常用滤波器,如平滑滤波器、锐化滤波器等。
数字图像处理课件冈萨雷 斯第三版
数字图像处理课件冈萨雷斯第三版PPT大纲:
数字图像基础知识
介绍数字图像的基本概念和背景,包括像素、色彩空间、图像分辨率等。
采样和量化
解释图像采样和量化的概念和方法,探讨图像质量和文件大小之间的平衡。
像素与分辨率
讨论像素和分辨率的关系,以及它们对图像质量和打印输出的影响。
非线性滤波
讲解非线性滤波的概念和应用,如中值滤波、自适应滤波等,以处理图像中 的噪声和模糊。
图像增强
探索图像增强的技术和方法,如直方图匹配、空域增强等,以提高图像的质 量和可视化效果。
边缘检测
讨论边缘检测的原理和常用算法,如Sobel算子、Canny边缘检测等。
霍夫变换
介绍霍夫变换的概念和应用,如直线检测、圆检测等,以在图像中检测特定的形状。
形状分析
介绍形状分析的方法和技术,如周长、面积、轮廓等,以量化和比较图像中的不同形状。
图像压缩基础
讲解图像压缩的基本原理和方法,如有损压缩、无损压缩等,以降低图像文件的大小。
离散傅立叶变换及其应用
探索离散傅立叶变换(DFT)的概念和应用,如频域滤波、图像复原等。
频域滤波
讨论频域滤波的方法和技巧,如低通滤波、高通滤波等,以增强或去除特定频率的图像信息。
灰度变换
介绍灰度变换的概念和方法,如对比度调整、亮度调整等,以改善图像的可视化效果。
直方图均衡化
讲解直方图均衡化的原理和应用,以增强图像的对比度和细节。
灰度变换的应用
探讨灰度变换在图像增强、图像分割和特征提取等方面的应用,以及潜在的 挑战。
线性滤波
介绍线性滤波的基本原理和常用滤波器,如平滑滤波器、锐化滤波器等。
数字图像处理课件冈萨雷 斯第三版
数字图像处理课件冈萨雷斯第三版PPT大纲:
数字图像基础知识
介绍数字图像的基本概念和背景,包括像素、色彩空间、图像分辨率等。
采样和量化
解释图像采样和量化的概念和方法,探讨图像质量和文件大小之间的平衡。
像素与分辨率
讨论像素和分辨率的关系,以及它们对图像质量和打印输出的影响。
非线性滤波
讲解非线性滤波的概念和应用,如中值滤波、自适应滤波等,以处理图像中 的噪声和模糊。
图像增强
探索图像增强的技术和方法,如直方图匹配、空域增强等,以提高图像的质 量和可视化效果。
边缘检测
讨论边缘检测的原理和常用算法,如Sobel算子、Canny边缘检测等。
霍夫变换
介绍霍夫变换的概念和应用,如直线检测、圆检测等,以在图像中检测特定的形状。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i 1
i
m
(以保证预测器的输出落在灰度级允许的范围内,并减少传输噪声) 1
来预测;则最优系数为: 1 h,2 v v,3 v,4 0
减小DPCM解码器对输入噪声的敏感性是很重要的,因为单个差 错会传播到所有以后的输出。这样,解码器的输出会变得不稳定
8.5.1
8.5.1
有损预测编码
a)每个决策级si正好落在两个相邻重构级ti 、ti+1的中点。 0 i0 L t i t i 1 si i 1, 2, , 1 (8.5.21) s i si t i t i (8.5.22) 2 2 t output L t(L/2) i 2 t = q(s) t3 =8 b)每个重构级 ti 落在两个相 继决策级si区间的 p(s)(概率 密度函数)的质心上。
有损预测编码
m 2 2 E{en } E [ f n i f n1 ] (8.5.7) i 1 就是选择m个预测系数以使上式最小化,对上式每个系数求导并令
其等于0,并设 f n 均值为0,方差为 2 得到: R1r
(8.5.8)
E { f n 1 f n 1 } E { f n 1 f n 2 } E { f n 1 f n m } E{ f f n 1 } n 2 ——自相关系数阵 R E { f n m f n 1 } E { f n m f n m } r [ E { f n f n 1 } E{ f n f n 2 } E{ f n f n m }]T
续性,被称为量化器的判 决和重构级
si ——判别电平;ti ——重构电平;
映射 ( si , si 1 ]内,s t
②最优量化函数
8.5.1
有损预测编码
量化器的设计就是要在给定优化准则和输入概率密度函数p(s) 的条件下选择最优的si和ti。 优化准则可以是统计的或心理视觉的准则
第8章 图像压缩
8.1 基本概念 8.2 图像压缩模型 8.3 信息论基础 8.4 无损压缩
8.5 有损压缩
8.6 图像压缩标准
8.7 视频压缩标准
8.5 有损压缩
概述
牺牲图像复原的准确度以换取压缩能力的增加; 如果产生的失真可以容忍,则压缩能力的增加是有效的; 压缩率较大,有损压缩编码技术可达100:1压缩率,并且 做到10:1~50:1之间,图像无本质区别(单色图像);
8层Lloyd-Max量化器
8层自适应量化器
DPCM结果图像
例8.18 量化和重构的例子
表8.11给出了用预测器和量化器的不同组 合对同一幅图像编码所得的均方根误差。
图a 图b 图c 图d 图e 图f
图a到f中差异图像的rms误差 注明了不同的预测器和量化器 2层自适应量化器的均方误差与4层 Lloyd-Max量化器相近 4层自适应量化器的均方误差小于8层 Lloyd-Max量化器
预测器
• 预测器基本思想:
8.5.1
有损预测编码
– 选择最小化均方预测误差作为预测的最佳准则
2 ˆ min E{en } E{[ f n f n ]2 } m
ˆ ˆ s.t 1) f en f n en f n f n
ˆ 2) f n a i f n i
E ( s t i )2 作为准则,且p(s)是个偶函数, 如果用最小均方量化误差
si
那么最小误差条件为:
0 i0 L t i t i 1 si i 1, 2, , 1 (8.5.21) s i si t i t i 2 2 L i 2 对于任意的L,满足上列公式的si和ti在均方误差意义下是最佳的; 相应的量化器称为L层的Lloyd-Max(劳埃德· 马克斯)量化器
8.5.1
有损预测编码
例如:考虑1个具有可分离自相关函数的2-D马尔可夫信源:
E{ f ( x, y) f ( x i , y j )}
2 i v
j h
(8.5.12)
其中 h , v 是图像的水平和垂直相关系数。 用4阶线性预测器:
ˆ f ( x , y ) 1 f ( x , y 1) 2 f ( x 1, y 1) 3 f ( x 1, y ) 4 f ( x 1, y 1) s.t
例8.18 量化和重构的例子
使用3阶预测器 f x, y 0.75f x, y10.75f x1, y0.5f x1, y1 自适应量化方法: 在4个可能的量化器 中选择最好的一个 2层自适应量化器
2层Lloyd-Max量化器
4层Lloyd-Max量化器
4层自适应量化器
1阶
2阶
3阶
4阶
结论:随着预测器阶数的增加误差减少了
量化器
• 量化器基本思想:
8.5.1
有损预测编码
– 减少数据量的最简单的办法是将图像量化成较少的灰度级, 通过减少图像的灰度级来实现图像的压缩。
– 这种量化是不可逆的,因而解码时图像有损失。
①阶梯量化函数
t=q(s)是s的奇函数
断点定义了函数的不连
Delta调制
颗粒噪声
预测器
缓变区 斜率过载
ˆ f n f n 1
量化器
n e
这里:
(8.5.2)
en 0 其它
(8.5.3)
1, 6.5
快变区
失真对所有有损预测编码都是很普遍的。失真的严重性取决于所使用的量化和 预测方法之间互相作用。一般,预测器和量化器在设计中独立进行的。预测器 在设计中认为量化器没有误差。而量化器在设计中则需要最小化自身的误差。
判定电平si 是2个重构电平的中值 重建电平ti是给定判别区间内p(s)曲线下面积的重心 q是一个奇函数的结果
L ( s ti ) p( s )ds 0, i 1, 2, , 2 (8.5.20) si 1
(8.5.22)
Lloyd_Max量化器
1)要达到最小误差的条件有两个:
h f ( x 1, y ) f ( x 1, y 1) v f ( x, y 1) f ( x 1, y 1)
最佳预测器:选择最小化均方预测误差为最佳准则
8.5.1
有损预测编码
例:预测技术的对比
ˆ en ( x, y) fn ( x, y) fn ( x, y)
ˆ f 预测器3:( x, y) 0.75 f ( x, y 1) 0.75 f ( x 1, y) 0.5 f ( x 1, y 1)
预测器4:
ˆ ( x, y) 0.97 f ( x, y 1) h v f 其它 0.97 f ( x 1, y)
水平梯度 垂直梯度
预测编码器
ˆ en fn fn
f ( x, y )
8.5.1
有损预测编码
fn
en +
-
量化器
en 符号
编码
压缩图像
g( x , y )
预测器
fn
量化器将预测误差映射成有限范围内的输出 en ,确定 了与有损预测编码相联系的压缩量和失真量。
修正后的预测编码器
输入图像
8.5.1
有损预测编码
fn
+ -
en
量化器
en
符号 编码
压缩图像
ˆ f n ai f i
fn
预测器
f n +
+
ˆ fn en fn (8.5.1)
fn
解压缩图像
预ห้องสมุดไป่ตู้解码器
压缩图像
符号 解码
en +
+
fn
预测器
8.5.1
有损预测编码
3.预测编码/解码步骤:
L ( s t i ) p( s )ds 0 i 1,2, 2 si 1
si
t2=4
S-[(L/2)-1]
t1
s1 s2=6
-t(L/2)
S(L/2)-1
s input
8.5.1
有损预测编码
2)以上两个条件构成一个方程组,必须通过迭代才能求解决策级si 和重构级ti。 3)对于任何满足两个最小误差条件有的L、si和ti,在均方误差意 义上是最优的,相应的量化器被称为:L级 Lloyd_Max量化器
① 对头解压缩 ② 对每一个预测误差的编码解码,得到预测误差 e( x , y ) 。 ˆ ③ 由前面的值,得到预测值 f ( x, y) 。
ˆ ④ 误差 e( x , y ) ,与预测值 f ( x, y) 相加,得到解码 f ( x, y)
⑤ 重复②、③、④步
。
8.5.1
有损预测编码
例8.16
[1 , 2 m ]T
可推导出,最优时,预测误差的方差为: r E{ f n f n i } i (8.5.11)
2 e 2 T 2 i 1
m
上述表达式形式简单,但要获得R,r所需的自相关计算需很困难。实际中 逐幅图像计算预测系数的方法很少用,一般都假设1个简单的图像模型,并 将其对应的自相关代入R,r,α表达式中以计算全局(所有图)系数。
8.5.1 有损预测编码 8.5.2 变换编码
8.5.1 有损预测编码
8.5 有损压缩
在各类编码方法中,预测编码是比较易于实现的,如 微分(差分)脉冲编码调制(DPCM)方法。在这种方法中, 每一个象素灰度值,用先前扫描过的象素灰度值去减,求出 他们的差值,此差值称为预测误差,预测误差被量化和编码
i
m
(以保证预测器的输出落在灰度级允许的范围内,并减少传输噪声) 1
来预测;则最优系数为: 1 h,2 v v,3 v,4 0
减小DPCM解码器对输入噪声的敏感性是很重要的,因为单个差 错会传播到所有以后的输出。这样,解码器的输出会变得不稳定
8.5.1
8.5.1
有损预测编码
a)每个决策级si正好落在两个相邻重构级ti 、ti+1的中点。 0 i0 L t i t i 1 si i 1, 2, , 1 (8.5.21) s i si t i t i (8.5.22) 2 2 t output L t(L/2) i 2 t = q(s) t3 =8 b)每个重构级 ti 落在两个相 继决策级si区间的 p(s)(概率 密度函数)的质心上。
有损预测编码
m 2 2 E{en } E [ f n i f n1 ] (8.5.7) i 1 就是选择m个预测系数以使上式最小化,对上式每个系数求导并令
其等于0,并设 f n 均值为0,方差为 2 得到: R1r
(8.5.8)
E { f n 1 f n 1 } E { f n 1 f n 2 } E { f n 1 f n m } E{ f f n 1 } n 2 ——自相关系数阵 R E { f n m f n 1 } E { f n m f n m } r [ E { f n f n 1 } E{ f n f n 2 } E{ f n f n m }]T
续性,被称为量化器的判 决和重构级
si ——判别电平;ti ——重构电平;
映射 ( si , si 1 ]内,s t
②最优量化函数
8.5.1
有损预测编码
量化器的设计就是要在给定优化准则和输入概率密度函数p(s) 的条件下选择最优的si和ti。 优化准则可以是统计的或心理视觉的准则
第8章 图像压缩
8.1 基本概念 8.2 图像压缩模型 8.3 信息论基础 8.4 无损压缩
8.5 有损压缩
8.6 图像压缩标准
8.7 视频压缩标准
8.5 有损压缩
概述
牺牲图像复原的准确度以换取压缩能力的增加; 如果产生的失真可以容忍,则压缩能力的增加是有效的; 压缩率较大,有损压缩编码技术可达100:1压缩率,并且 做到10:1~50:1之间,图像无本质区别(单色图像);
8层Lloyd-Max量化器
8层自适应量化器
DPCM结果图像
例8.18 量化和重构的例子
表8.11给出了用预测器和量化器的不同组 合对同一幅图像编码所得的均方根误差。
图a 图b 图c 图d 图e 图f
图a到f中差异图像的rms误差 注明了不同的预测器和量化器 2层自适应量化器的均方误差与4层 Lloyd-Max量化器相近 4层自适应量化器的均方误差小于8层 Lloyd-Max量化器
预测器
• 预测器基本思想:
8.5.1
有损预测编码
– 选择最小化均方预测误差作为预测的最佳准则
2 ˆ min E{en } E{[ f n f n ]2 } m
ˆ ˆ s.t 1) f en f n en f n f n
ˆ 2) f n a i f n i
E ( s t i )2 作为准则,且p(s)是个偶函数, 如果用最小均方量化误差
si
那么最小误差条件为:
0 i0 L t i t i 1 si i 1, 2, , 1 (8.5.21) s i si t i t i 2 2 L i 2 对于任意的L,满足上列公式的si和ti在均方误差意义下是最佳的; 相应的量化器称为L层的Lloyd-Max(劳埃德· 马克斯)量化器
8.5.1
有损预测编码
例如:考虑1个具有可分离自相关函数的2-D马尔可夫信源:
E{ f ( x, y) f ( x i , y j )}
2 i v
j h
(8.5.12)
其中 h , v 是图像的水平和垂直相关系数。 用4阶线性预测器:
ˆ f ( x , y ) 1 f ( x , y 1) 2 f ( x 1, y 1) 3 f ( x 1, y ) 4 f ( x 1, y 1) s.t
例8.18 量化和重构的例子
使用3阶预测器 f x, y 0.75f x, y10.75f x1, y0.5f x1, y1 自适应量化方法: 在4个可能的量化器 中选择最好的一个 2层自适应量化器
2层Lloyd-Max量化器
4层Lloyd-Max量化器
4层自适应量化器
1阶
2阶
3阶
4阶
结论:随着预测器阶数的增加误差减少了
量化器
• 量化器基本思想:
8.5.1
有损预测编码
– 减少数据量的最简单的办法是将图像量化成较少的灰度级, 通过减少图像的灰度级来实现图像的压缩。
– 这种量化是不可逆的,因而解码时图像有损失。
①阶梯量化函数
t=q(s)是s的奇函数
断点定义了函数的不连
Delta调制
颗粒噪声
预测器
缓变区 斜率过载
ˆ f n f n 1
量化器
n e
这里:
(8.5.2)
en 0 其它
(8.5.3)
1, 6.5
快变区
失真对所有有损预测编码都是很普遍的。失真的严重性取决于所使用的量化和 预测方法之间互相作用。一般,预测器和量化器在设计中独立进行的。预测器 在设计中认为量化器没有误差。而量化器在设计中则需要最小化自身的误差。
判定电平si 是2个重构电平的中值 重建电平ti是给定判别区间内p(s)曲线下面积的重心 q是一个奇函数的结果
L ( s ti ) p( s )ds 0, i 1, 2, , 2 (8.5.20) si 1
(8.5.22)
Lloyd_Max量化器
1)要达到最小误差的条件有两个:
h f ( x 1, y ) f ( x 1, y 1) v f ( x, y 1) f ( x 1, y 1)
最佳预测器:选择最小化均方预测误差为最佳准则
8.5.1
有损预测编码
例:预测技术的对比
ˆ en ( x, y) fn ( x, y) fn ( x, y)
ˆ f 预测器3:( x, y) 0.75 f ( x, y 1) 0.75 f ( x 1, y) 0.5 f ( x 1, y 1)
预测器4:
ˆ ( x, y) 0.97 f ( x, y 1) h v f 其它 0.97 f ( x 1, y)
水平梯度 垂直梯度
预测编码器
ˆ en fn fn
f ( x, y )
8.5.1
有损预测编码
fn
en +
-
量化器
en 符号
编码
压缩图像
g( x , y )
预测器
fn
量化器将预测误差映射成有限范围内的输出 en ,确定 了与有损预测编码相联系的压缩量和失真量。
修正后的预测编码器
输入图像
8.5.1
有损预测编码
fn
+ -
en
量化器
en
符号 编码
压缩图像
ˆ f n ai f i
fn
预测器
f n +
+
ˆ fn en fn (8.5.1)
fn
解压缩图像
预ห้องสมุดไป่ตู้解码器
压缩图像
符号 解码
en +
+
fn
预测器
8.5.1
有损预测编码
3.预测编码/解码步骤:
L ( s t i ) p( s )ds 0 i 1,2, 2 si 1
si
t2=4
S-[(L/2)-1]
t1
s1 s2=6
-t(L/2)
S(L/2)-1
s input
8.5.1
有损预测编码
2)以上两个条件构成一个方程组,必须通过迭代才能求解决策级si 和重构级ti。 3)对于任何满足两个最小误差条件有的L、si和ti,在均方误差意 义上是最优的,相应的量化器被称为:L级 Lloyd_Max量化器
① 对头解压缩 ② 对每一个预测误差的编码解码,得到预测误差 e( x , y ) 。 ˆ ③ 由前面的值,得到预测值 f ( x, y) 。
ˆ ④ 误差 e( x , y ) ,与预测值 f ( x, y) 相加,得到解码 f ( x, y)
⑤ 重复②、③、④步
。
8.5.1
有损预测编码
例8.16
[1 , 2 m ]T
可推导出,最优时,预测误差的方差为: r E{ f n f n i } i (8.5.11)
2 e 2 T 2 i 1
m
上述表达式形式简单,但要获得R,r所需的自相关计算需很困难。实际中 逐幅图像计算预测系数的方法很少用,一般都假设1个简单的图像模型,并 将其对应的自相关代入R,r,α表达式中以计算全局(所有图)系数。
8.5.1 有损预测编码 8.5.2 变换编码
8.5.1 有损预测编码
8.5 有损压缩
在各类编码方法中,预测编码是比较易于实现的,如 微分(差分)脉冲编码调制(DPCM)方法。在这种方法中, 每一个象素灰度值,用先前扫描过的象素灰度值去减,求出 他们的差值,此差值称为预测误差,预测误差被量化和编码