天大《多媒体技术》学习笔记五
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
天大《多媒体技术》学习笔记五
主题:《多媒体技术》学习笔记
内容:
《多媒体技术》学习笔记五
——多媒体数据压缩技术
一、数据压缩基本原理
数据压缩的目的是在传送和处理信息时尽量减少数据量,数据压缩的对象是数据而不是信息。
多媒体技术面临的最大难题是海量数据问题不进行数据压缩,将限制多媒体技术的发展。
1、多媒体信息的数据量
文本:设屏幕显示分辨率为1024×768,字符为16×16点阵,每个字符用4个字节表示,则显示一屏字符所需要的存储空间为:(1024/16)×(768/16)×4B = 12288B(约12KB)
图像:假定图像显示在1024×768分辨率的屏幕上,则满屏幕像点所占用的空间为:
1024×768×log2256 = 768KB
音频:假定模拟声音频率22050Hz,其数字采样频率44100Hz,采样精度为16bit,双声道立体声模式,则1min所需数据量为:44100Hz×2B×2×60s = 10MB/min
2、数据压缩的条件
数据冗余度(包括重复数据、可忽略数据)
人类不敏感因素(包括颜色、声音、亮度等)
3、数据冗余
冗余基本概念:
冗余——信息所具有的各种性质中多余的无用空间
冗余度——多余的无用空间的程度
信息量与冗余的关系:
I = D-du 其中I为信息量;D为数据量;du为冗余量,包含D
中
冗余分类:
空间冗余——规则物体的物理相关性
时间冗余——视频与动画画面间的相关性
统计冗余——具有空间冗余和时间冗余
结构冗余——规则纹理、相互重叠的结构表面
信息熵冗余—编码冗余,数据与携带的信息
视觉冗余——视觉、听觉敏感度和非线性感觉
知识冗余——凭借经验识别
其他冗余——上述7种以外的冗余
二、数据压缩算法
数据压缩算法分为:无损压缩编码(压缩数据还原后,与原始数据一致,无损失),如霍夫曼编码、行程编码、算术编码等;有损压缩编码(压缩后再还原的数据有损失),如预测编码、变换编码、统计编码、行程编码、算数编码、LZW编码等。
三、静态图像JPEG压缩编码技术
1、JPEG标准
该标准为“多灰度静止图像的数字压缩编码标准”。
1991年,联合专家组提出了ISO CD建议草案,后经过国际电子技术委员会ISO/IEC 的批准,正式成为第10918号标准,并正式命名为“JPEG高质量静止图像压缩编码标准”,简称“JPEG标准”。
2、JPEG压缩算法
适用于连续色调、多级灰度、彩色或黑白图像的数据压缩。
无损压缩比大约为4:1;
有损压缩比在10:1~100:1之间。
JPEG压缩算法的特点:
⑴对图像帧内编码,每帧色调连续,随机存取
⑵ 在宽范围内调节图像的压缩比和保真度,解码器可参数化
⑶ 对图像进行压缩时,可随意选择压缩比值
⑷ 对硬件要求不高,一般CPU运算速度即可
⑸ 可运行DCT顺序模式、DCT递增模式、无失真编码模式和分层编码模式。
四、动态图像MPEG压缩编码技术
1、基本原理
动态图像压缩主要解决的问题:
⑴正确区分静止图像和动态图像。
⑵ 提取动态图像中的活动成分。
⑶ 进行帧之间的预测,提供压缩的依据。
帧的预测编码:
⑴条件像素补充法——比较两帧对应位置的像素亮度,若亮度差超过预先规定的阀
值,则认为两个像素有变化,传送像素。
若亮度差未超过阀值,不处理。
⑵ 运动补偿法——跟踪画面上的活动元素,并进行向量计算,加以补偿,然后再利
用帧间预测进行压缩。
适用于活动元素少的可视电话和电视会议。
图像的分类,MPEG标准把图像分成以下三类:
⑴帧内图像(Intra pictures)——又称“I图像”,JPEG标准按照静止图像的模式进
行压缩处理。
主要利用静止图像自身的相关性进行编码,实现数据压缩的目的。
帧内图像的压缩比属于中度压缩,典型的压缩像素编码为2bit。
⑵ 预测图像(Predicted pictures)——又称“P图像”,通过对最近的前一帧I图像或
者P图像进行预测的“前向预测” 过程,把前面图像作为预测下一帧图像的参照物,使图像编码的数据量减少。
预测图像有较高的压缩比,但会增加失真。
⑶ 双向图像(Bidirestional pictures)——又称“B图像”,可使用前一帧图像和后一
帧图像作参照物,进行双向预测。
双向预测可以采用四种编码技
术,即帧内图像编码、前向预测编码、后向预测编码、双向预测编码。
2、MPEG技术标准
MPE G-Ⅰ标准,诞生于1991年,主要特点:
◆以1.5Mb/s的速率传输压缩视频信号。
◆以单通道64kb/s、128kb/s和192kb/s的传输速率传输音频信号。
◆可在352×240画面分辨率上显示活动图像。
◆分三个组成部分:视频、音频和系统。
◆对于帧内图像,采用多种编码进行压缩。
◆帧间压缩采用运动补偿预测、内插编码。
MPEG-Ⅱ标准,主要特点
◆压缩信号带宽,即信号传输速率为4~15Mb/s
◆适用于高质量电视信号的传送与播放
◆解码器同时支持MPEG-Ⅰ和MPEG-Ⅱ标准
◆视频信号的传输速率为30帧/s,音频信号的质量达到CD级。
◆最高压缩比为200:1。
◆MPEG-Ⅱ用于DVD视频信号的压缩,DVD音频信号的压缩随制式的不同而不同。
注:有关本章更详细和需要重点掌握的内容请参见课件和教材。