天大《多媒体技术》学习笔记五

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

天大《多媒体技术》学习笔记五
主题：《多媒体技术》学习笔记
内容：
《多媒体技术》学习笔记五
——多媒体数据压缩技术
一、数据压缩基本原理
数据压缩的目的是在传送和处理信息时尽量减少数据量，数据压缩的对象是数据而不是信息。

多媒体技术面临的最大难题是海量数据问题不进行数据压缩，将限制多媒体技术的发展。

1、多媒体信息的数据量
文本：设屏幕显示分辨率为1024×768，字符为16×16点阵，每个字符用4个字节表示，则显示一屏字符所需要的存储空间为：(1024/16)×(768/16)×4B = 12288B(约12KB)
图像：假定图像显示在1024×768分辨率的屏幕上，则满屏幕像点所占用的空间为：
1024×768×log2256 = 768KB
音频：假定模拟声音频率22050Hz，其数字采样频率44100Hz，采样精度为16bit，双声道立体声模式，则1min所需数据量为：44100Hz×2B×2×60s = 10MB/min
2、数据压缩的条件
数据冗余度（包括重复数据、可忽略数据）
人类不敏感因素（包括颜色、声音、亮度等）
3、数据冗余
冗余基本概念：
冗余——信息所具有的各种性质中多余的无用空间
冗余度——多余的无用空间的程度
信息量与冗余的关系：
I = D－du 其中I为信息量；D为数据量；du为冗余量，包含D
中
冗余分类：
空间冗余——规则物体的物理相关性
时间冗余——视频与动画画面间的相关性
统计冗余——具有空间冗余和时间冗余
结构冗余——规则纹理、相互重叠的结构表面
信息熵冗余—编码冗余，数据与携带的信息
视觉冗余——视觉、听觉敏感度和非线性感觉
知识冗余——凭借经验识别
其他冗余——上述7种以外的冗余
二、数据压缩算法
数据压缩算法分为：无损压缩编码（压缩数据还原后，与原始数据一致，无损失），如霍夫曼编码、行程编码、算术编码等；有损压缩编码（压缩后再还原的数据有损失），如预测编码、变换编码、统计编码、行程编码、算数编码、LZW编码等。

三、静态图像JPEG压缩编码技术
1、JPEG标准
该标准为“多灰度静止图像的数字压缩编码标准”。

1991年，联合专家组提出了ISO CD建议草案，后经过国际电子技术委员会ISO/IEC 的批准，正式成为第10918号标准，并正式命名为“JPEG高质量静止图像压缩编码标准”，简称“JPEG标准”。

2、JPEG压缩算法
适用于连续色调、多级灰度、彩色或黑白图像的数据压缩。

无损压缩比大约为4：1；
有损压缩比在10：1~100：1之间。

JPEG压缩算法的特点：
⑴对图像帧内编码，每帧色调连续，随机存取
⑵ 在宽范围内调节图像的压缩比和保真度，解码器可参数化
⑶ 对图像进行压缩时，可随意选择压缩比值
⑷ 对硬件要求不高，一般CPU运算速度即可
⑸ 可运行DCT顺序模式、DCT递增模式、无失真编码模式和分层编码模式。

四、动态图像MPEG压缩编码技术
1、基本原理
动态图像压缩主要解决的问题：
⑴正确区分静止图像和动态图像。

⑵ 提取动态图像中的活动成分。

⑶ 进行帧之间的预测，提供压缩的依据。

帧的预测编码：
⑴条件像素补充法——比较两帧对应位置的像素亮度，若亮度差超过预先规定的阀
值，则认为两个像素有变化，传送像素。

若亮度差未超过阀值，不处理。

⑵ 运动补偿法——跟踪画面上的活动元素，并进行向量计算，加以补偿，然后再利
用帧间预测进行压缩。

适用于活动元素少的可视电话和电视会议。

图像的分类，MPEG标准把图像分成以下三类：
⑴帧内图像（Intra pictures）——又称“I图像”，JPEG标准按照静止图像的模式进
行压缩处理。

主要利用静止图像自身的相关性进行编码，实现数据压缩的目的。

帧内图像的压缩比属于中度压缩，典型的压缩像素编码为2bit。

⑵ 预测图像（Predicted pictures）——又称“P图像”，通过对最近的前一帧I图像或
者P图像进行预测的“前向预测” 过程，把前面图像作为预测下一帧图像的参照物，使图像编码的数据量减少。

预测图像有较高的压缩比，但会增加失真。

⑶ 双向图像（Bidirestional pictures）——又称“B图像”，可使用前一帧图像和后一
帧图像作参照物，进行双向预测。

双向预测可以采用四种编码技
术，即帧内图像编码、前向预测编码、后向预测编码、双向预测编码。

2、MPEG技术标准
MPE G-Ⅰ标准，诞生于1991年，主要特点：
◆以1.5Mb/s的速率传输压缩视频信号。

◆以单通道64kb/s、128kb/s和192kb/s的传输速率传输音频信号。

◆可在352×240画面分辨率上显示活动图像。

◆分三个组成部分：视频、音频和系统。

◆对于帧内图像，采用多种编码进行压缩。

◆帧间压缩采用运动补偿预测、内插编码。

MPEG-Ⅱ标准，主要特点
◆压缩信号带宽，即信号传输速率为4~15Mb/s
◆适用于高质量电视信号的传送与播放
◆解码器同时支持MPEG-Ⅰ和MPEG-Ⅱ标准
◆视频信号的传输速率为30帧/s，音频信号的质量达到CD级。

◆最高压缩比为200：1。

◆MPEG-Ⅱ用于DVD视频信号的压缩，DVD音频信号的压缩随制式的不同而不同。

注：有关本章更详细和需要重点掌握的内容请参见课件和教材。