数据压缩
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释
1、数据压缩:以最小的数码表示信源所发的信号,减少容纳给定消息集合或数据采样集合的信号空间。
2、数据压缩比:将压缩前每个信源符号(取样)的编码位数(mlog)与压缩后平均每符号的编码位数(l)之比,定义为数据压缩比。
3、均匀量化:把输入信号的取值域按等距离分割的量化称为均匀量化。
4、最优量化(MMSE准则):使均方误差最小的编码器设计方法称为最小均方误差(MMSE)设计。以波形编码器的输入样值与波形解码器的输出样值之差的均方
误差作为信号质量的客观评判标准和MMSE的设计准则。(能使量化误差最小的所谓最佳量化器,应该是非均匀的。)
5、信息熵定义:信息量的概率平均值,即随机变量的数学期望值,叫做信息熵或者简称熵。
6、统计编码定义:主要利用消息或消息序列出现概率的分布特性,注重寻找概率与码字长度间的最优匹配,叫做统计编码或概率匹配编码,统称熵编码。
7、变长编码:与等长编码相对应,对一个消息集合中的不同消息,也可以用不同长度码字来表示,这就叫做不等长编码或变长编码。
8、非续长码:若W中任一码字都不是另一个码字的字头,换句换说,任何一个码字都不是由另一个码字加上若干码元所构成,则W称为非续长码、异字头码或前缀码。
9、游程长度:是指字符(或信号采样值)构成的数据流中各字符重复出现而形成字符串的长度。
10、电视图像的取向:我国彩色电视制式采用逐行倒相的PAL-D制。
11、HVS的时间掩蔽特性:指随着时间变化频率的提高,人眼对细节分辨能力下降的特性。
12、HVS的空间掩蔽特性:指随着空间变化频率的提高,人眼对细节分辨能力下降的特性。
13、HVS的亮度掩蔽特性:指在背景较亮或较暗时,人眼对亮度不敏感的特性。
14、CIF格式:是常用的标准图像格式。是一种规范Y、Cb、Cr色差分量视频信号的像素分辨率的标准格式。像素。
15、SIF格式:是一种用于数字视频的存储和传输的视频格式。
16、压扩量化:由于低电平信号出现概率大、量化噪声小;高电平信号虽然量化噪声变大,但因为出现概率小,总的量化噪声还是变小了,从而提高量化信噪比。这种方法叫做压缩扩张量化。(压扩量化用一个非线性函数变换先将信号“压缩”后再均匀量化,它和非线性量化器完全等效。)
17、信号压缩系统的复杂度:指实现编解码算法所需的硬件设备量,典型地可用算法的运算量及需要的存储量来度量。
18、离散信源:被假设为由一系列随机变量所代表,往往用随机出现的符号表示,称输出这些符号集的源为信源,如果取值于某一离散集合,就叫做离散信源。
19、互信息量:对两个离散随机时间集X和Y,事件yj的出现给出关于xi的信息量,即为互信息量。
20、联合熵:两个变量X和 Y 的联合熵定义为:
,即平均互信息量表示信源X的平均不确定性与其在信源Y被确定条件下仍保留的平均不确定性之差。(联合熵是联合概率分布所具有信息量的概率平均值,表示两个事件集联合发生时所能得到的总的平均信息量。)
21、极限熵:如果把n个信源符号当作一个n维随机矢量X。n越大,所得到的熵就越接近
于实际信源所含有的熵,而式 ,称
为极限熵或极限信息量,用H∞表示。
22、等长编码:对于一个消息集合中的不同消息,若采用相同长度的不同码字去代表(即W 中任一个码字都由同样多个码元构成),就叫做等长编码或定长编码。
23、前值预测编码:前值预测是最简单的一种预测编码方式,这种方式只考虑前后两个相邻像素的相关性,仅传送两者之间的差值,又称差分脉冲调制编码(DPCM)。
24、算术编码:从全序列出发,采用递推形式的连续编码。(就是将被编码的信息表示成实数0和1之间的一个间隔,信息越大,编码表示它的间隔越小,表示这一间隔所需二进制位就越多)
25、信源的冗余度和其来源:表示预测编码是最简单的一种预测编码方式。这种方式只考虑前后两个相邻像素的相关性,仅传送两者之间的差值,又称差分脉冲调制编码。
26、主观SNR:将编码器输出与某个带加性噪声的参考信号相比较,调节噪声能量使实验者对二者具有相同的偏爱度。此时含噪声参考源的信噪比ASNR,就可定义为编码器输出信号的等效加性噪声SNR或主观SNR。
27、编码效率:信息码元数与码长之比定义为编码效率,通常用来表示。(编码运行的速度、效率)
28、正交变换:正交变换是保持图形形状的大小不变的几何变换,包含旋转、平移、轴对称及上述交换的集合。
29、4:1:1格式:在各扫描线上每4个连续的取样点取4个Y样本、一个Cb和一个Cr样本,平均每像素用1.5个样本(12bit)表示。可用于图像信号源及特殊的高质量视频信号。30、帧间编码:利用序列图像在时间轴方向的相关性进行的压缩编码,称为帧间编码。
2、MPEG中将 GOP中图像分为哪几种类型?并对各类型图像做简单解释。
答:MPEG-1将GOP中的图像划分为I图像(帧内编码图像)、P图像(预测编码图像)、B 图像(双向预测编码图像)和D图像(直流编码图像)4种类型。
3、请说明JEPG基本系统的源图像的数据组织?
答:JPEG基本系统的源图像以帧为单位,每帧最多可有4个分量图像,把每个分量图像都顺序分割成一个个8×8样值的相邻像块(Block),块内的64个数据组成一个数据单元(DU),
图像按DU分割完毕后可以MCU为单位顺序将DU送入JPEG基本系统进行2D-FDCT处理,将各DU转换成8×8的DCT系数列阵。
4、正交变换编码之所以能压缩数据,最主要因为它有哪些性质?
答:正交变换的性质:熵保持,不丢失信息;能量保持(parseval定理);能量重新分
配;去相关性,可将高度相关的空间样值变为相关性较弱的变换系数。
5、语音预测编码技术从总体分为哪几类?
答:可分为波形编码、参数编码、混合编码。波形编码通常将语音信号作为一般的波形信号来处理;参数编码的基本原理使提取信源信号的特征参数并以数字代码传输,接收端从数字代码中恢复特征参数,由特征参数重建语音信号;混合编码结合了原有波形编码器质量好和声码器速率低的特点,克服了它们各自弱点。
6、语音参数编码的基本原理。
答:提取信源信号的特征参数并以数字代码传输;接收端从数字代码中恢复特征参数,由特征参数重建语音信号。
7、LPC语音合成要点。
答:
8、电视信号的冗余度主要体现在哪里?
答:主要体现在空间相关性、时间相关性和色度空间表示上的相关性几方面。 9、语音信号的时域冗余度表现在那几个方面?
答:①时域冗余度:幅度非均匀分布、样本间的相关、周期之间的相关、基音之间的相关、静止系数、长时自相关函数。
②频域冗余度:非均匀的长时功率频谱密度、语音特有的短时功率谱密度。
11、电视信号的非相关压缩。
答:如果能充分利用人类视觉系统(HVS)的生理特性,适当降低对某些参数的分辨率要求,就可望进一步降低数码率。因为电视图像最终是给人观看的,而HVS在某些条件下往往可容忍一些失真,有些失真人眼根本辨别不出来,因此,超过视觉分辨能力的高保真度要求就没有必要。由于这样做并未涉及电视信号内在的相关性,故又称为非相关性压缩或统称视觉心理——心理压缩。
12、正交变换实现数据压缩的物理本质是什么?
答:经过多维坐标系中适当的旋转和变换,能够把散布在各个坐标轴上的原始数据,在新的、适当的坐标系中集中到少数坐标轴上,因此可能用较少的编码位数来表示一组信号样本,实现高效率的压缩编码。
14、模拟信号的数字化包括哪几个步骤?
答:分为三个步骤:取样、量化和编码。取样,就是将连续信号在时间、空间上离散化;量化,就是将取样信号在幅度上也离散化;编码,就是按一定规律把量化后的脉冲取样值按幅度大小变换成相应的二进制码。