数据压缩与信源编码第五章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章
1、(a)人类视觉特性中空间频率灵敏度、对比度灵敏度和色彩灵敏度分别表示什么意思?答:空间:从空间频率域来看,人眼是一个低通型线性系统,分辨景物的能力是有限的。由于瞳孔有一定的几何尺寸和一定的光学像差,视觉细胞有一定的大小,所以人眼的分辨率不可能是无穷的,HVS对太高的频率不敏感。对比度:它是相对于亮度变化的一种量度,一般来讲它与激励信号的相对亮度幅度成正比,它与激励的颜色、空间频率和时间频率有关。色彩:这是人类的一中明视觉,基本参数有色调。亮度和饱和度。
(b)JPEG编码算法是如何利用这些灵敏度特性的?
答:JPEG压缩编码算法的主要计算步骤如下:用正向离散余弦变换(FDCT)把空间域图变成频率域图;用加权函数对DCT系数量化,以使人的视觉系统最佳,Z字形扫描(zigzag scan);用差分脉冲编码调制(DPCM)对直流系数(DC)编码;用行程长度编码(RLE)对交流系数(AC)编码;熵编码:使用霍夫曼可变字长编码器进行编码;组成位数据流,以形成帧图像
2、(a)图像编码算法常用的知名算法有那些?
答:行程编码压缩算法、哈夫曼编码压缩算法、LZW压缩算法及离散余弦变换
(b)图像编码算法的关键技术有那些?
答:
(c)为什么图像可以进行压缩?
答:数字图像如果不进行压缩,数据量是比较大的,这无疑对图像的存储、处理、传送带来很大的困难。事实上,在图像像素之间,无论在行方向还是列方向,都存在一定的相关性。也就是说,在一般图像中都存在很大的相关性,即冗余度。静态图像数据的冗余包括:空间冗余、时间冗余、结构冗余、知识冗余和视觉冗余、图像区域的相同性冗余、纹理的统计冗余等。图像压缩编码技术就是利用图像数据固有的冗余性和相干性,将一个大的图像数据文件转换为较小的同性质的文件。根据压缩后文件能否准确恢复原文件,将图像压缩编码技术分为无失真编码技术和有失真编码技术。
(d)就现有图像压缩技术而言,压缩比多大时仍然可以保持良好的图像质量?
答:5:1
3、(a)画出JPEG图像编解码算法的框图,并详细解释其算法;
答:图片共享到群里
详解:1)整个文件的大体结构JFIF格式的JPEG文件(*.jpg)的一般顺序为:SOI(0xFFD8) APP0(0xFFE0) [APPn(0xFFEn)]可选DQT(0xFFDB) SOF0(0xFFC0) DHT(0xFFC4) SOS(0xFFDA) 压缩数据EOI(0xFFD9) 2)字的高低位问题JPEG文件格式中,一个字(16位)的存储使用的是Motorola 格式, 而不是Intel 格式。也就是说, 一个字的高字节(高8位)在数据流的前面, 低字节(低8位)在数据流的后面,与平时习惯的Intel格式不一样。. 3)读出哈夫曼表数据a)理论说明在标记段DHT内,包含了一个或者多个的哈夫曼表。对于单一个哈夫曼表,应该包括了三部分:1哈夫曼表ID和表类型这个字节的值为一般只有四个0x00、0x01、0x10、0x11。0x00表示DC直流0号表;0x01表示DC直流1号表;0x10表示AC交流0号表;0x11表示AC交流1号表。2不同位数的码字数量,JPEG文件的哈夫曼编码只能是1~16位。这个字段的16个字节分别表示1~16位的编码码字在哈夫曼树中的个数。3编码内容这个字段记录了哈夫曼树中各个叶子结点
的权。所以,上一字段(不同位数的码字数量)的16个数值之和就应该是本字段的长度,也就是哈夫曼树中叶子结点个数。4)建立哈夫曼树
(b)说明JPEG的Baseline算法与Progressive算法的异同。
答:Baseline JPEG:这种类型的JPEG文件存储方式是按从上到下的扫描方式,把每一行顺序的保存在JPEG文件中。打开这个文件显示它的内容时,数据将按照存储时的顺序从上到下一行一行的被显示出来,直到所有的数据都被读完,就完成了整张图片的显示。如果文件较大或者网络下载速度较慢,那么就会看到图片被一行行加载的效果,这种格式的JPEG没有什么优点,因此,一般都推荐使用Progressive JPEG
Progressive JPEG:和Baseline一遍扫描不同,Progressive JPEG文件包含多次扫描,这些扫描顺寻的存储在JPEG文件中。打开文件过程中,会先显示整个图片的模糊轮廓,随着扫描次数的增加,图片变得越来越清晰。这种格式的主要优点是在网络较慢的情况下,可以看到图片的轮廓知道正在加载的图片大概是什么。在一些网站打开较大图片时,你就会注意到这种技术。