23887《数字图像处理(第3版)》习题解答(上传)(1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

23887《数字图像处理(第3版)》习题解答(上传)(1)
胡学龙编著
《数字图像处理(第 3 版)》
思考题与习题参考答案
目录
第1章概述 (1)
第2章图像处理基本知识 (4)
第3章图像的数字化与显示 (7)
第4章图像变换与二维数字滤波 (10)
第5章图像编码与压缩 (16)
第6章图像增强 (20)
第7章图像复原 (25)
第8章图像分割 (27)
第9章数学形态学及其应用 (31)
第10章彩色图像处理 (32)
第1章概述
1.1连续图像和数字图像如何相互转换?
答:数字图像将图像看成是许多大小相同、形状一致的像素组成。

这样,数字图像可以
用二维矩阵表示。

将自然界的图像通过光学系统成像并由电子器件或系统转化为模拟图像
(连续图像)信号,再由模拟/数字转化器(ADC)得到原始的数字图像信号。

图像的数字
化包括离散和量化两个主要步骤。

在空间将连续坐标过程称为离散化,而进一步将图像的幅
度值(可能是灰度或色彩)整数化的过程称为量化。

1.2采用数字图像处理有何优点?
答:数字图像处理与光学等模拟方式相比具有以下鲜明的特点:
1.具有数字信号处理技术共有的特点。

(1)处理精度高。

(2)
重现性能好。

(3)灵活性高。

2.数字图像处理后的图像是供人观察和评价的,也可能作为机器视觉的预处理结果。

3.数字图像处理技术适用面宽。

4.数字图像处理技术综合性强。

1.3数字图像处理主要包括哪些研究内容?
答:图像处理的任务是将客观世界的景象进行获取并转化为数字图像、进行增强、变换、
编码、恢复、重建、编码和压缩、分割等处理,它将一幅图像转化为另一幅具有新的意义的
图像。

1.4 说出图像、视频(video)、图形(drawing)及动画(animation)等视觉信息之间
的联系和区别。

答:图像是用成像技术形成的静态画面;视频用摄像技术获取动态连续画面,每一帧可
以看成是静态的图像。

图形是人工或计算机生成的图案,而动画则是通过把人物的表情、动
作、变化等分解后画成许多动作瞬间的画幅,再用摄影机连续拍摄成一系列画面,给视觉造
成连续变化的图画。

视频和动画都利用了视觉暂留原理。

1.5如何在你的显示器上观测图像的像素?1台笔记本的屏幕分辨率为1366×768,长宽
比例是4:3、16:9还是16:10?屏幕分辨率(以像素每英寸(DPI)为单位)是多少?选择一
个高分辨率图像、一个低分辨率图像,比较分别观察到像素时图像的放大倍数的差异。

答:可先拷屏,按照图 1.2放大局部图像的方法观测图像。

屏幕分辨率为1366×768,表
示宽高比为1.7786:1,而4:3 = 1.3333:1,16:9 = 1.7778:1,
16:10 = 1.6:1。

可见,此屏幕的宽高
比最接近16:9。

1.6如何在你的计算机上查看图像文件的各种属性?
答:在Windows操作系统下,鼠标指针指向文件名,可看到图像文件的“项目类型”、标记”、“分级”、“尺寸”、“大小”和“标题”属性(图1.6a)。

右击图像文件名,单击弹出菜单的“属性”命令,可以看到“常规”和“详细信息”两个标签,其中“常规”标签指出文件
名、存放“位置”、“时间”、文件“属性”等信息。

“详细信息”指出“说明”、“来源”、“图像”、“照相机”、“高级照片”、“文件”等信息。

((a )鼠标指针指向文件名
(b )常规
(c )详细信息
题 1.6 图图像属性
1.7 讨论在你的智能手机中哪些功能应用了图像处理技术。

答:根据手机功能和智能程度的不同,有彩信、视频、相机、游戏、二维码扫描、名片
识别等。

1.8 设图 1.17 的文件名为“microscopic.jp2”或“microscopic.jpg ”,尺寸为4140×3096。

针对本图像,讨论可以进行哪些图像处理和图像分析操作?
答:处理方面:(1)对图像进行二维变换,观察图像的频谱;(2)图像增强:由于光照不均匀,可以通过增强手段,图像暗处得到照度补偿; 3)图像编码:可以用 DCT 编码的 JPEG 格式存放 JPEG 图像,也可用 DWT 编码存放 JPEG2000 图像;(4)图像分割:将感兴趣的目标从背景中分割出来,以便做进一步分析处理。

图像分析:(1)对观测对象进行形状分析;(2)对不同大小的颗粒做分布分析。

1.9
讨论数字图像处理的主要应用。

进一步查找资料,写一篇关于你感兴趣的应用方面的短文。

答:图像处理的应用几乎渗透科学研究、工程技术和人类社会生活的各个领域。

教师可以分组对学生布置以下 6 个方面的课题,通过阅读参考文献、网络资源等手段写数字图像处
理的主要应用的短文,并安排交流机会。

1.航天和航空技术方面的应用
2.生物医学工程方面的应用
3.通信工程方面的应用
4.工业自动化和机器人视觉方面的应用
5.军事和公安方面的应用
6.生活和娱乐方面的应用
(第 2 章
图像处理基本知识
2.1 如何表示图像中一点的彩色值?颜色模型起什么作用?
答:图像中一点的彩色值颜色三维空间中的一个点来表示,每个点有三个分量,不同的颜色空间各分量的含义不同。

颜色模型规定了颜色的建立、描述和观察方式。

颜色模型都是建立在三维空间中的,所以与颜色空间密不可分。

2.2 色调、色饱和度和亮度的定义是什么?在表征图像中一点的颜色时,各起什么作用?答:HSV 模型由色度(H ),饱和度(S ),亮度(V )三个分量组成的,与人的视觉特性比较接近。

HSV 颜色模型用 Munsell 三维空间坐标系统表示。

色调(H )表示颜色的种类,用角度来标定,用-1800~1800 或00~3600 度量。

色饱和度(S )表示颜色的深浅,在径向方向上的用离开中心线的距离表示。

用百分比来度量,从0%到完全饱和的100%。

亮度(V )表示颜色的明亮程度,用垂直轴表示。

也通常用百分比度量,从 0%(黑)到 100%(白)。

2.3 按照波段的成像图像讨论图像的分类。

答:人们常见的是可见光成像,但在科学研究等领域,其他一些不同波段的电磁波成像技术会起到可见光成像无法替代的作用。

下面是电磁波谱分布情况:
1、不可见光线:伽马射线、X 射线、紫外线;
2、可见光线:紫、蓝、青、绿、黄、橙、红;
3、不可见光线:近红外线、中间红外线、远红外线、微波、工业电波。

按波长从短到长有:(1)伽马射线图像:伽马射线是由原子核受激产生的波长极短、能量极高的射线。

天文学上利用伽马射线获取伽马射线暴图像。

2)X 射线图像:X 射线是由原子受激产生的,具有很强的穿透能力,其图像在医疗、探伤、物质结构分析等方面具有重要作用。

(3)紫外线(UV )图像:红外线波长短于可见光。

230-
400 nm 的 UV 传感器可用于天文学、火灾检测、细胞的医学成像等。

(4)红外线图像:红外线波长长于可见光。

红外遥感器接收地物反射或自身发射的红外线而形成的图像,可以解决在夜间观察目标光强不足及对比度差的困难。

由于高于绝对零度的物体都会发出红外线,所以红外图像可以描述某个区域的温度分布,这在遥感技术中广泛使用,在医学成像和火灾监测等方面也有实际应用。

(5)无线电波图像:波长范围很宽,从 mm 到 km 。

常用射频成像法。

由高频发射机发射的高频电磁波在传播过程中遇到具有不同电学性质的物体时,电磁波的传播规律将大大改变。

根据无线电波测量的结果可以绘出物体内的结构图像,
如毫米波人体安检成像技术。

另一个获得重要应用的是 SAR (合成孔径雷达)成像技术。

SAR 传感器波长通常在厘米级。

SAR 图像则只记录了一个波段的回波信息,以二进制复数形式记录下来。

振幅信息通常对应于地面目标对雷达波的后向散射强度,与目标介质、含水量以及
粗糙程度密切相关,而相位信息则对应于传感器平台与地面目标的往返传播距离。

2.4 设有大小为32×32 的图标,图标的每个像素有 8 种颜色,共有多少种不同的图标?如果每 100 万个可能的图标中有一个有意义,识别一个有意义的图标需要0.1 s ,则选出所有有意义的图标需要多长时间?解:图标数为
832×32 = 10925 种
有意义的图标数10925/106 = 10919种
选择有意义图标的时间10919×0.1 = 10918 s
可见随机图像的复杂度是非常高的。

2.5 讨论数字图像处理系
统的组成。

列举你熟悉的图像处
理系统并分析它们的组成和功能。

答:如教材图 2.6,数字图像
处理系统是应用计算机或专用数
字设备对图像信息进行处理的信
息系统。

图像处理系统包括图像
处理硬件和图像处理软件。

图像
处理硬件主要由图像输入设备、
图像运算处理设备(微计算机)、
图像存储器、图像输出设备等组
成。

软件系统包括操作系统、控
制软件及应用软件等。

教材图 2.6数字图像处理系统结构图
2.6常见的数字图像处理开发工具有哪些?各有什么特点?
答.目前图像处理系统开发的主流工具为Visual C++(面向对象可视化集成工具)和MATLAB的图像处理工具箱(Image Processing Tool box)。

两种开发工具各有所长且有相互间的软件接口。

Microsoft公司的VC++是一种具有高度综合性能的面向对象可视化集成工具,用它开发出来的Win 32程序有着运行速度快、可移植能力强等优点。

VC++所提供的Microsoft基础类库MFC对大部分与用户设计有关的Win 32应用程序接口API进行了封装,提高了代码的可重用性,大大缩短了应用程序开发周期,降低了开发成本。

由于图像格式多且复杂,为了减轻程序员将主要精力放在特定问题的图像处理算法上,VC++ 6.0提供的动态链接库ImageLoad.dll支持BMP、JPG、TIF等常用6种格式的读写功能。

MATLAB的图像处理工具箱MATLAB是由MathWorks公司推出的用于数值计算的有力工具,是一种第四代计算机语言,它具有相当强大的矩阵运算和操作功能,力求使人们摆脱繁杂的程序代码。

MATLAB图像处理工具箱提供了丰富的图像处理函数,灵活运用这些函数可以完成大部分图像处理工作,从而大大节省编写低层算法代码的时间,避免程序设计中的重复劳动。

MATLAB图像处理工具箱涵盖了在工程实践中经常遇到的图像处理手段和
算法,如图形句柄、图像的表示、图像变换、二维滤波器、图像增强、四叉树分解域边缘检测、二值图像处理、小波分析、分形几何、图形用户界面等。

但是,MATLAB也存在不足
之处限制了其在图像处理软件中实际应用。

首先,强大的功能只能在安装有MATLAB系统的机器上使用图像处理工具箱中的函数或自编的m文件来实现。

其次,MATLAB使用行解释方式执行代码,执行速度很慢。

第三,MATLAB擅长矩阵运算,但对于循环处理和图形界面的处理不及C++等语言。

为此,通应用程序接口API和编译器与其他高级语言(如C、C++、Java等)混合编程将会发挥各种程序设计语言之长协同完成图像处理任务。

API支持MATLAB与外部数据与程序的交互。

编译器产生独立于MATLAB环境的程序,从而使其他语言的应用程序使用MATLAB。

2.7常见的数字图像应用软件有哪些?各有什么特点?
∑∑[ f (x , y ) - f )][g (x , y ) - g ]
f
答:图像应用软件是可直接供用户使用的商品化软件。

用户从使用功能出发,只要了解软件的操作方法就可以完成图像处理的任务。

对大部分用户来说,商品化的图像应用软件无需用户进行编程,操作方便,功能齐全,已经能满足一般需求,因而得到广泛应用。

常用图像处理应用软件有以下几种:
1.PHOTOSHOP :当今世界上一流的图像设计与制作工具,其优越性能令其产品望尘莫及。

PHOTOSHOP 已成为出版界中图像处理的专业标准。

高版本的PHOTOSHOP 支持多达20 多种图像格式和TWAIN 接口,接受一般扫描仪、数码相机等图像输入设备采集的图像。

PHOTOSHOP 支持多图层的工作方式,只是 PHOTOSHOP 的最大特色。

使用图层功能可以很方便地编辑和修改图像,使平面设计充满创意。

利用PHOTOSHOP 还可以方便地对图像进行各种平面处理、绘制简单的几何图形、对文字进行艺术加工、进行图像格式和颜色模式的转换、改变图像的尺寸和分辨率、制作网页图像等。

2.CorelDRAW :一种基于矢量绘图、功能强大的图形图像制作与设计软件。

位图式图像是由象素组成的,与其相对,矢量式图像以几何、色彩参数描述图像,其内容以线条和色块为主。

可见,采用不
同的技术手段可以满足用户的设计要求。

位图式图像善于表现连续、丰富色调的自然景物,数据量较大;而矢量式图像强于表现线条、色块的图案,数据量较小。

合理的利用两种不同类型的图像表现方式,往往会收到意想不到的艺术效果。

CorelDraw 是当今流行的图像处理软件中为数不多的特点明显、功能强大的基于矢量绘图的软件包。

利用它,可以方便地制作精美的名片、贺卡、书签、图书封面、广告、宣传画等作品。

3.ACDSee :快速、高性能的看图程序,是目前最享盛名的图片浏览器。

它能广泛应用于图片的获取、管理、浏览和优化,支持BMP 、GIF 、JPG 、TGA 、TIF 等超过 50 种常见的图形文件格式,图片打开速度极快,可以直接查看动画 GIF ,处理如 Mpeg 之类常用的视频文件,还可以为每一个目录建立一个相册。

ACDSee 可以从数码相机和扫描仪高效获取图片,并进行便捷的查找、组织和预览。

ACDSee 还是得心应手的图片编辑工具,轻松处理数码影像,拥有去红眼、剪切图像、锐化、浮雕特效、曝光调整、旋转、镜像等功能,还能进行批量处理。

2.8 调用函数 Cfg = cov(f, g)计算出图像 f 和图像 g 的协方差矩阵是一个2×2 的矩阵。

说明该矩阵各个元素的含义,数值大小对图像特性的影响。

答:设 f (x ,y )和 g (x ,y )是大小为M ×N 的两幅图像,则两幅图像之间的协方差矩阵为 C fg :
C fg =
1
MN
M -1 N -1
x =0 y =0
协方差矩阵 C fg 是两幅图像之间的相关程度的一种度量。

协方差矩阵为零时表明两图像之间相互独立,反之表示两幅图像之间相互依赖。

C fg 越大,相关程度越强。

C fg 是2×2 矩阵:
σ 2 cov( f , g )?
C fg = ? ?
cov( g , f ) ? 式中,σ 2f 和σ g 2 分别是图像 f 和 g 的方差,cov(f ,g )和 cov(g ,f ) 是图像 f 和 g 的协方差。

第3章图像的数字化与显示
3.1光圈越大,摄取的画面是否越亮?光圈的数字越小是否代表光圈越小?2.8的光圈与5.6的光圈,哪个画面更亮?光圈越小,画面是否越有立体感?
答:光圈越大,光学镜头进光量越大,摄取的画面也越亮。

光圈系数(F)反映镜头的通光量,以焦距f和通光孔径D表示。

通光量与F值的平方成反比。

所以光圈的数字越小代表光圈越大。

2.8的光圈比5.6的光圈更亮。

景深(depth of field)是对某景物调焦,以形成前后清晰区域。

景深与三个因素有关:光圈、焦距和物距。

光圈越小,景深越深。

3.2换一幅图像,重新演算图3.6中实际图像量化的运行结果。

解:以将灰度为256降低为8(图d)为例编程并运行程序。

level1 = 256;
level2 = 8;
ratio = level1/level2;
I1 = imread('cameraman.tif');
subplot(121);imshow(I1);
S = size(I1);
for m = 1: S(1)
for n = 1: S(2)
I2(m,n) = uint8(round(double(I1(m,n))/ratio));
I2(m,n) = uint8(ratio*double(I2(m,n)));
end
end
subplot(122);imshow(I2);
imwrite(I2,'cameraman_d.tif')
程序运行结果如下:
(a)原始图像(灰度级为256)(d)灰度级为8
教材图3.6 不同量化级别对图像质量的影响
3.3如何合理选取采样率和量化等级数?
答:一般,当限定数字图像的大小时,为了得到质量较好的图像,可采用如下原则:
(1)对缓变的图像,应该细量化,粗采样,以避免出现假轮廓。

(2)对细节丰富的图像,应细采样,粗量化,以避免模糊。

3.4讨论基于二维采样定理,根据图像采集设备的分辨率计算最大像素数。

答:采集设备的分辨率反映了其采集图像时的细节效果。

高分辨率才采集是保证图像高
分辨率的基础。

应该根据二维采样定理选择合适分辨率的采集设备,这样既能保证所需的图
像质量,又能做到物尽其用。

Nyquist定理表明,为了正确判定信号频率,信号在一个周期内至少被采样两次。

二维采
样定理应用在实际图像的采集中,意味着如果要达到一个采集设备(如数码相机或扫描仪)
最小的空间分辨率,至少需要采两个点。

3.5验证图3.8一维向量量化的误差d(X, C i)的正确性。

解:d(X, C0) = [ (4-3)2+(2-1)2+(3-2)2+(1-3)2]/4= [1+1+1+4]/4= 7/4
d(X, C1) = (4-1)2+(2-3)2+(3-1)2+(1-4)2 = [9+1+4+9]/4 = 23/4
d(X, C2) = (4-4)2+(2-3)2+(3-4)2+(1-1)2 = [0+1+1+0]/4 = 2/4
d(X, C3) = (4-2)2+(2-1)2+(3-2)2+(1-3)2 = [4+1+1+4]/4 = 10/4
3.6计算图3.9图像X与图3.10码书C码字的误差,验证选择码字Y1作为X的二维向量量化编码的合理性。

解:原始图像块X是一个4灰度级的16维向量[1 0 0 0 1 1 0 0 2 2 1 0 3 2 1 1],如教材图3.9所示。

码书:
Y0 = [0 2 0 0 1 2 1 1 0 3 2 0 0 3 2 1]
Y2 = [1 1 2 2 2 2 1 2 3 3 1 0 1 1 0 0]
Y1 = [1 1 0 0 1 1 1 0 2 2 1 0 3 3 1 1]
Y3 = [0 2 3 3 0 1 3 2 1 1 3 1 1 1 1 0]
均方误差为:d(X, Y0) = 25/16;d(X, Y1) = 3/16;d(X, Y2) = 25/16;d(X, Y3) = 47/16。

X Y0 Y1 Y2 Y3 教材图3.9 原始图像和灰度级教材图3.10 码书C ={ Y0, Y1, Y2, Y3}
如图 3.10所示。

经均方误差准则计算可以发现码字Y1离X最近,故用索引01进行编码。

3.7 根据“电视行(TV line)”或扫描线的概念,摄像机的清晰度常用扫描线的线数表
示。

如果画面是4:3的,540线的像素分辨率多少?720p是720线(p代表逐行扫描,i是隔
行扫描),帧型为16:9,像素分辨率为1280×720。

解:如果画面是4:3的,540线的像素分辨率是[540×4/3]×540 = 720×540
3.8 摄像机和数码相机分辨率受到哪些因素限制?是否越高越好?如何进一步提高分辨
率?
答:分辨率往往是用户最关心的指标,但其上限受到像素极限尺寸、CCD制造工艺、设
备性价比等因素限制,并不能无限提高。

人们正在研究采用信号处理的超分辨率技术力求解
决这些问题。

3.9扫描仪的光学分辨率是600×1200线,一个具有5000个感光单元的CCD器件,用
于A4幅面扫描仪,A4幅面的纸张宽度是21 cm,该扫描仪的光学分辨率是多少dpi?
解:(1)600×1200线,其中前一个数字代表扫描仪的横向分辨率,后一数字则代表纵
向分辨率。

(2)dpi是指单位面积内像素的多少,也就是扫描精度,目前国际上都是计算一英寸面积内像素的多少。

光学分辨率是扫描仪的光学部件在每平方英寸面积内所能捕捉到的实际的光点数,是指扫描仪CCD 的物理分辨率,也是扫描仪的真实分辨率,它的数值是由CCD 的像素点除以扫描仪水平最大可扫尺寸得到的数值。

每一个感光单元对应一个像素。

由于CCD感光单元个数为5000,21 cm = 8.3英寸,所以该扫描仪的光学分辨率是5000/8.3=602 dpi,规格化为600 dpi。

1 1 0 ? ?0 0 0
0 ? ,按 x 方向进行 FFT ,得到列变换 F (u , y )= ?1 - j 1 - j ?1 + j 1 + j ∑ ∑ f ( x , y ) ,并说明其物理意义。

∑=x 0

=y 0
f (x , y )e - j2π(ux / M +vy / N ) ,取(u ,v )=(0,0)
∑=x 0

=y 0
f (x , y ) 。

∑=x 0

=y 0
f (x, y)e - j2π(ux / M +vy / N ) ,
∑ ∑ f *(x, y)e - j2π(ux/M +vy/ N )
第 4 章
图像变换与二维数字滤波
4.1 二维傅里叶变换的分离性有什么实际意义?
解:该性质表明,一个二维傅里叶变换可由连续两次一维傅里叶变换(先行变换后列变
换或反之)来实现。

实现的方法如下图所示:
教材图 3.3 用两次一维 DFT 计算二维 DFT
4.2 图像处理中正交变换的目的是什么?图像变换主要用于哪些方面?
解:正交变换可以使得图像能量主要集中分布在低频率成分上,边缘和线信息反映在高频率成分上。

因此正交变换广泛应用在图像增强、图像恢复、特征提取、图像编码压缩和形状分析等方面。

4.3 ?1 1 0
已知 f ( x ,y ) =
0 0 0 ?0 ? 2 2
0? ? 0 0 ? ?
0?
0 0
0 0 ?

为什么 f (x ,y )的前 2 行数值一样,但 F (u ,y )的前 2 行却不一样?
4.4
证明:f (x , y )的直流成分为 F (0,0) =
1 N -1 N
2 x =0 N -1
y =0
证明:根据 F (u , v ) =
1
MN
M -1 N -1

F (0,0) =
1
MN
M -1 N -1
得证。

其物理意义为 f (x , y )的直流成分为图像灰度的平均值。

4.5
由 DFT 的定义直接证明 DFT 的共轭对称性。

证明:由于 F (u, v) =
1
MN
M -1 N -1
所以
f *(x, y) ?
1 MN
M -1 N -1 x =0 y =0
M -1 N -1
∑ ∑ f (x, y)e =F *(-u, -v)
∑ - ? ?(2n + 1)k ?
∑ f (n)cos ? ?。

63
I = ??
85
68 104 126 88 68 70?
64 59 55 58 65 83?
1
= ?
MN
得证。

4.6本章的例2中,在求解图像频谱的程序中为了增强显示效果,用对数对DFT的幅度
进行压缩,然后将频谱幅度的对数值用在0~10之间的值进行显示。

研究:(1)对上述结果
与不进行上述处理的直接显示效果进行比较。

(2)对将频谱幅度的对数值用不同范围的值进
行显示的结果进行比较。

对研究的结果做出结论。

解:(1)适当修改例2的程序,即可得到进行对数处理(显示范围[0 10])和未进行处理(显示范围[0 255])的显示效果:(a)对数处理(b)直接显示
(2)可见整体显示效果相差很大,特别在频谱的中心区域视觉效果有较大差别,而中心
区域集中了图像的绝大部分能量,对图像分析和处理至关重要。

4.7 对0到2N–1的2N个点的离散周期序列f c (n)做DFT,设W2 N = e
k
N -1
2 N -1
f c (n)W2nkN = W2 N2
n=0 ?2N ?
-27n=0
-
2 π
2 N ,证明F c (k ) =
证明:这里是一维DCT问题,可参考一般的数字信号处理教材中的推导。

4.8利用MATLAB函数dct2对一幅8×8的图像进行DCT变换和反变换,进行原始图
像和重建图像的误差比较分析。

变换的参考图像为:
52
62
63
67
79
87
55
59
59
58
61
65
71
79
61 66 70 61 64 73?
65 90 109 85 69 72??
68 113 144 104 66 73?
71 122 154 106 70 69?
60 70 77 68 58 75?
69 68 65 65 78 94??。

采用Z扫描方式(参见第5章 5.15)保留20个DCT变换系数进行重构图像,即将第21个以后的变换系数置为0。

计算重建图像J与原始图像I的均方误差,比较两者的差异。

如果保留
横向与纵向的坐标之和小于8的系数,比较上述结果。

如果保留所有变换系数,再比较上述
63 解:参考图像为: ?
85 64 59 55 58 65 83? 2 ? N -1 M -1 ? ∑=j 0 ∑=i 0 ?? ?)j,(f i ? ??
f (i, j) -
52 ?
62 ?
63 ?67 ?
79 ?
87
55 59 59 58 61 65 71 79
61 66 70 61 64 73? 65 90 109 85 69 72?? 68 113 144 104 66 73? ? 71 122 154 106 70 69?
68 104 126 88 68 70? ? 60 70 77 68 58 75? ?
69 68 65 65 78 94??
参考图 5.15,采用 Z 扫描,取前 20 个系数,其余系数为 0 重构图像。

)
设原图像为 f ,重建图像为 f ,则均方误差计算公式:
1 ERR EMS = ?
MN
)
1/2
MATLAB 程序如下: I = [52
63 62 63 67 79 85 87
55 61 66 70 61 64 73; 59 65 90 109 85 69 72; 59 68 113 144 104 66 73; 58 71 122 154 106 70 69; 61 68 104 126 88 68 70; 65 60 70 77 68 58 75; 71 64 59 55 61 65 83; 79 69 68 65 76 78 94 ]
J = dct2(I)
J(1,6) = 0; %第 21 个变换系数置于 0 for i = 1:8
for j = 1:8
if i+j>=7 J(i,j) = 0; end end end
K = round(idct2(J)) ERR = 0; for i = 1:8
for j = 1:8
ERR = ERR + pow2((K(i,j)-I(i,j))); end end
ERR = sqrt(ERR/64) 程序运行结果如下:
变换系数为 J ,复原图像为 K ,均方误差为 ERR : J=
609.8750 -29.2036 -61.8736 25.5055 54.8750 -19.7503 -0.7544 1.9317
-46.1580 -48.8798 10.8750 -9.4685 -2.6639 -1.1475
7.9021
11.7974
-7.5356
1.5432
-1.1001
-0.6300
76.7633
34.2864
-12.5196
3.3181
1.3007
-0.5400
-25.5003 -14.2811 -2.2176 -3.5345 -0.1502 -2.8307 -29.5882 -9.8957 -0.6250 -0.6440 0.7554 -0.1882 10.1202 6.2008 1.4004 0.4630 -3.4699 -0.3687 6.3007 1.3806 -4.4204 2.0384 1.9867 -0.7819 -4.8535 1.5404 1.6654 -0.1900 -2.5824 0.5206
K=
63 48 51 74 83 70 60 64
62 52 62 91 102 85 70 70
62 59 78 113 124 102 81 76
62 62 85 122 131 106 80 73
62 59 77 108 114 90 68 64
69 58 62 83 87 69 59 64
87 66 56 66 69 61 66 82
105 77 58 61 64 64 79 102
ERR = 74.0502
当忽略i + j≥8的系数,这时有29个非0系数,均方误差明显减少,
K=
62 51 49 68 78 60 56 79
61 57 65 95 108 83 64 74
57 58 78 118 137 107 72 68
59 60 78 119 141 113 75 66
69 64 69 98 117 97 70 68
78 66 58 70 82 70 60 70
83 71 58 60 65 58 62 83
89 80 68 67 70 65 76 102
ERR = 8.5746
对取舍的系数不加限制,由于变换、反变换、重新量化产生的误差是很小的。

运算结果如下:
J=
609.8750 -29.2036 -61.8736 5.9354 -20.7026 -61.5535 25.5055 54.8750
8.2149 11.6753
-19.7503
-6.6819
-6.6150
1.9317
6.6052
-46.1580 7.9021 76.7633 -25.5003 -29.5882 10.1202 6.3007 -4.8535 -48.8798 11.7974 34.2864 -14.2811 -9.8957 6.2008 1.3806 1.5404 10.8750 -7.5356 -12.5196 -2.2176 -0.6250 1.4004 -4.4204 1.6654 -9.4685 1.5432 3.3181 -3.5345 -0.6440 0.4630 2.0384 -0.1900
-2.6639 -1.1475 -1.1001
-0.6300
1.3007
-0.5400
-0.1502
-2.8307
0.7554
-0.1882
-3.4699
-0.3687
1.9867
-0.7819
-2.5824
0.5206
K=
52 55 61 66 70 61 64 73
63 59 65 90 109 85 69 72
62 59 68 113 144 104 66 73
63 58 71 122 154 106 70 69
67 61 68 104 126 88 68 70
∏(-1)b i n b)x( (i-1-
1 3
∑=x 0 f (x) i∏=0(-1)b i ( x)b1-i (u )
1
1 1
∑=x 0 f (x) i∏=0(-1)b i ( x)b1-i (0) = 4 [ f (0) + f (1) + f (2) + f (3)]
[1 1 1 1]g?? ??
1
1 1
W (1) = ∑ f (x) ∏(-1)b i ( x)b1-i (1) = [ f (0) + f (1) - f (2) - f (3)]
4 x=0
f (1) ?
1
1 1
W (2) = ∑ f (x) ∏(-1)b i ( x)b1-i (2) = [ f (0) - f (1) + f (2) - f (3)]
4 x=0
[1 -1 -1 1]g?? ??
1
1 1
W (3) = ∑ f (x) ∏(-1)b i ( x)b1-i (3) = [ f (0) - f (1) - f (2) + f (3)]
4 x=0
[1 -1 1 -1]g?? ??
79 65 60 70 77 68 58 75
85 71 64 59 55 61 65 83
87 79 69 68 65 76 78 94
ERR =1,可见只有2个加黑的高频系数有误差。

3.9在沃尔什变换中,当N = 8时,如果z = 6,求b i(z)。

解:b i(z)代表z的二进制表示的第i位值。

N = 2n,故n = 3。

z = 6用二进制表示为0110,则b0(z ) = 0,b1(z ) = 1,b2(z )
= 1,b3(z ) = 0。

4.10离散的沃尔什变换与哈达玛变换之间有那些异同?
解:哈达玛(Hadamard)变换和沃尔什(Walsh)变换的变换核都是由1,-1组成的正交方阵。

它们不同的地方在于变换矩阵的行列排列次序不同。

哈达玛变换每行的列率排列是没有规则的,沃尔什变换的列率是由小到大。

4.11求N = 8对应的沃尔什变换核矩阵。

解:N = 8偏大,以N = 4试验之。

一维沃尔什变换的正变换核为g(x, u) = 1 n-1
N i =0
,则一维沃尔什变换为
W (u) = 1 N -1
N
n-1
f (x) ∏(-1)b i ( x)b n -1-i (u )。

当N = 4时W (u) =
i =0 N
1
W (0) =
4
3
=
1
4
f (0)?
f (1) ?
f (2)
f (3) ?
3
i =0 4
=
1
4
f (0)?
f (2)?
f (3)?
3
i =0 4
=
1
4
f (0)?
f (1) ?
f (2)
f (3)?
3
i =0 4
=
1
4
f (0)?
f (1) ?
f (2)
f (3)?
W (1) ? ?1 1 -1 -1? ? f (1) ? ? ? = 1 ? ?g ? ? W (3) 1 -1 1 -1 G g
f = G
g f ,所以,变换核矩阵 G 为
1 1 -1 -1? ?1 -1 1 -1?
1 -1? 1 ?
3 已知二维数字图像矩阵为 f = ?

W (0)? ?1 1 1 1 ? ? f (0)? ?W (2)? 4 ?1 -1 -1 1 ? ? f (2)? ? ? ? ?? ? ? ? ? ?? f (3) ?
变换的矩阵形式为 W = 1 1
N 4
G =
1 1 1 1 ? ? ?
1 -1 -1 1 ? ? ?
根据图 3.11,可以看出当 N = 8 时,变换核矩阵 G 为
1
1 ?
1 ?1 ?
1 ?
1 1
1 1 1 -1 -1 -1 -1
1 1
-1 -1 -1 -1 1 1
1 1 -1 -1 1 1 -1 -1 1 -1 -1 1 1 -1 -1 1
1 -1 -1 1 -1 1 1 -1
1 -1 1 -1 -1 1 -1 1
1 ? -1??
1 ?
1 ?
-1? ? -1??
3 ?
3 3 3 3 3 3 3 3
3
,求此图像的二维沃尔什变换。

解:程序为
f = [3 3 3 3; 3 3 3 3; 3 3 3 3; 3 3 3 3]; G = [1 1 1 1; 1 1 -1 -1; 1 -1 -1 1; 1 -1 1 -1]; W = (1/16)*G*f*G 运行结果为 W=
3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
4.13 小波基函数和傅里叶变换基函数有何区别?
解:小波信号的非零点是有限的。

它与傅里叶变换的基函数(三角函数、指数信号)是不同的,傅里叶变换的基函数从负无穷到正无穷都是等幅振荡的。

4.14 一维小波变换如何同时实现时间-频率分析功能?如何扩展到在二维图像的空间-频率分析?
解:对照一维小波变换和二维图像的定义加以说明。

第5章图像编码与压缩
5.1从哪些方面说明数据压缩的必要性?
答:采用数字技术会使信号处理的性能大为提高,但其数据量的增加也是十分惊人的。

图像数据更是多媒体、网络通信等技术重点研究的压缩对象。

不加压缩的图像数据是计算机
的处理速度、通信信道的容量等所无法承受的。

这样的数据率是与当前信息存储介质的容量、计算机的总线速度以及网络的传输率不相
匹配的。

尽管人们在存储介质、总线结构和网络性能等方面不断有新的突破,但数据量的增
长速度远超过硬件设施的提高水平,以上的矛盾仍然无法缓解。

如果将上述图像信号压缩几倍、十几倍,甚至上百倍,将十分有
利于图像的传输和存储。

可见,在现有硬件设施条件下,对图像信号本身进行压缩是解决上述矛盾的主要出路。

5.2数据没有冗余度能否压缩?为什么?
答:图像数据量大,同时冗余数据也是客观存在的。

一般图像中存在着以下数据冗余因
素:(1)编码冗余;(2)像素间的相关性形成的冗余;(3)视觉特性和显示设备引起的冗余。

理论上,数据没有冗余度是不压缩的,否则无法解码出原始数据。

但在大部分应用场合
下采用有损压缩,数据没有冗余度也可以进行压缩。

5.3如何衡量图像编码压缩方法的性能?
答:一般地,图像压缩应能做到压缩比大、算法简单、易于用硬件和软件实现、压缩和
解压缩实时性好、解压缩恢复的图像失真小等。

但这些指标对同一压缩方法很难统一,在实
际系统中往往需要抓住主要矛盾,全面权衡。

常用的图像压缩技术指标有:(1)图像熵与平
均码长;(2)图像冗余度与编码效率;(3)压缩比;(4)客观评价SNR;(5)主观评价。

图像的主客观两种评价之间存在着密切的联系。

但一般来说,客观评价高的主观评价也高,因
此在图像编码的质量评价时,首先作客观评价,以主观评价为参考。

5.5一图像大小为640×480,256色。

用软件工具SEA(version 1.3)将其分别转成24位色BMP,24位色JPEG,GIF(只能转成256色)压缩格式,24位色TIFF压缩格式,24位色TGA压缩格式,得到的文件大小分别为:921,654字节;17,707字节;177,152字节;923,044 字节;768,136字节。

分别计算每种压缩图像的压缩比。

解:不计算较小的文件头和彩色查找表(LTU)的数据量,原始图像的数据量为:640×480×1 byte=307,200 byte。

经转换后各种格式的压缩比如下:。

相关文档
最新文档