《多媒体技术与应用》 第三章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多媒体技术与应用
3.3 多媒体数据压缩的国际标准
3.3.1 JPEG标准
JPEG标准有两种基本的压缩算法,一种是基于离散余弦变换DCT的有损压缩 算法;另一种是基于空间预测的无损压缩算法。在压缩比为25:1的有损压缩
算法下,压缩还原后得到的图像与原始图像相比较几乎没有区别,因此基于
离散余弦变换DCT的有损压缩算法得到了广泛的应用。
图3-1 图像和视频压缩方法
多媒体技术与应用
3.2.1 有损压缩编码
预测编码
预测编码方法是根据某一模型,利用以往的样本值进行预测。预测编码方法在图
像数据和语音信号数据压缩中都得到广泛应用,它是针对数据的统计冗余进行压 缩的一种方法。
变换编码
变换编码也是一种对统计冗余进行压缩的方法。变换编码并不直接对信号进行压 缩编码,而首先将信号映射到另一个域中,产生一组变换系数,然后对这些系数 进行量化、编码、传输。一般在空间上具有强相关性的信号,反映在频域上则是 能量被集中在某些特定的区域内,或是变换系数的分布具有规律性。利用这些规 律,在不同的频率区域上分配不同的量化比特数,可以达到压缩数据的目的。
多媒体技术与应用
8×8图像块
DCT基编码器
FDCT
源图像数据
量化器
熵编码器
压缩图像数据
量化表
图3- 5 DCT基压缩编码步骤
熵编码表
DCT基解码器
压缩图像数据
熵解码器
逆量化器
IDCT 重构图像数据
熵编码表Hale Waihona Puke Baidu
量化表 图3-7 DCT基解压缩步骤
多媒体技术与应用
3.3.2 MPEG标准
MPEG-1标准:称为多媒体运动图像和伴音的数据压缩编码标准。 MPEG-2标准:称为“活动图像及有关声音信息的通用编码”标准。 MPEG-4标准:是为解决多媒体计算机技术中对数据压缩编、解码技术及 其遵循标准的高需求而推出的新的国际标准。 MPEG-7标准:称作“多媒体内容描述接口”。它为各种类型的多媒体信 息规定一种标准化的描述。
多媒体技术与应用
MPEG音频压缩标准有以下特点: 1. 音频信号采样率可以是22KHz,44.1 KHz或48KHz。 2. 压缩后的比特流可以按以下3种模式之一支持单声道或双声道: (1) 提供给单音频通道的单声道模式。 (2) 提供给两个独立的单音频通道的双—单声道模式。 (3) 提供给立体声通道的立体声模式。 3. 提供3个独立的压缩层次:(MP1,MP2,MP3) 4. 编码后的比特流支持循环冗余校验CRC。 5. 还支持在比特流中携带附加信息。
MPEG-21 标准:正式名称为多媒体框架。试图用多媒体框架将各种服务
综合在一起并进行标准化。
多媒体技术与应用
视频压缩和音频压缩标准 视频压缩标准 视频压缩算法用使用了帧间预测编码技术、运动补偿技术、空间压缩(帧 内压缩)技术以及上一节介绍到的哈夫曼熵编码技术。
帧间预测编码技术 I运动补偿技术 空间压缩(帧内压缩)技术
多媒体技术与应用
变换编码原理如图3-3所示。
输入端
变换 G U
A 量化
A’ 编码器 发 送 端 解码器 信 道
输出端
逆变换
U’′ 图3-3 变换编码原理图
G’
多媒体技术与应用
3.2.2 无损压缩编码
哈夫曼编码属于一种变字长码,把信息源事件按概率大小顺序排列,对出现概 率大的信息源事件赋予短码字,而对于概率小的信息源事件赋予长码,只要码 字长度按照信息出现的概率大小逆顺序排列,则平均码字长度一定小于其它任 何事件顺序的排列方式。 实现哈夫曼编码的步骤是: 1. 将信息源事件按概率递减顺序排列: 如P(1)>P(2)>…>P(Sm-1)>P(Sm) 2. 把其中两个最小的概率P(Sm-1)、P(Sm)挑出来,且将事件“1”赋给其中 最小的即 3. 把两个最小概率相加作为新事件的概率,即求出: P(Si) =P(Sm-1) 十 P(Sm)。P(Si)是对应于一个新的消息的概率。 4. 将P(Si)与上面未处理的(m-2)个消息P(Sm-2)的概率重新由大到小再排 列,构成一个新的概率序列。 5. 重复步骤2)、3)、4),在每次合并信息源时,将被合并的信源分别赋 “0”和“1”直到所有m个事件的概率均已全部合并处理为止。 6. 寻找从每一个信息源事件到概率总和为1处的路径,对每一信息源事件写出 “1”、“0”序列(从树根到信息源事件节点)作为码字。
第三章
多媒体数据压缩编码 技术
多媒体技术与应用
3.1 多媒体数据压缩的重要性
3.1.1 多媒体数据压缩的必要性
信息时代的重要特征是信息的数字化。早期的信息用模拟方式表示,模拟 存在着明显的缺点:在信息的传输过程中会产生噪音和信号丢失;信息在 复制过程中其噪音和误差会逐步积累;模拟信号不适合数字计算机加工处
理。信号的数字化克服了上述缺点,但数字化后未经压缩的视频和音频等
媒体信息的数据量是非常大的。 在多媒体系统中,如果不进行数字信息的压缩处理,计算机系统几乎无法
对多媒体数据进行存取和传输。对多媒体数据进行压缩是非常必要的。
多媒体技术与应用
3.1.2 多媒体数据压缩的可行性
可以根据不同的冗余设计相应的数据压缩技术。 时间冗余 空间冗余 空间冗余和时间冗余是将图像信号看作为随机信号时所反映出的 统计特征,因此有时把这两种冗余称为统计冗余。 结构冗余 知识冗余 视觉冗余 听觉冗余
多媒体技术与应用
3.2 多媒体数据压缩方法
数据压缩技术的性能指标有三个: 压缩比: 图象质量: 压缩和解压的速度:
图像和视频压缩方法
无损压缩
有损压缩
哈夫曼编码
行程编码
预测编码
变换编码 DCT编码 小波变换
模型编码
混合编码 JPEG
算术编码 LZW编码
分形编码
MPEG
运动补偿
子带编码
H.261
音频压缩标准 MPEG-1 音 频 编 码 是 国 际 上 制 定 的 第 一 个 高 保 真 立 体 声 音 频 编 码 标 准
(ISO11172-3) 。 通 过 对 14 种音 频 编 码 方 案的 比 较 测 试, 最 后 选 定 了 以
MUSICAM为基础的三层编码结构。根据不同的应用要求,使用不同的层来构 成其音频编码器。