第12章 运动图像压缩标准MPEG

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多媒体技术基础与应用
基于块匹配的运动补偿
多媒体技术基础与应用
基于块匹配的运动估计编码器的结构
多媒体技术基础与应用
运动估计与补偿解码器的结构
多媒体技术基础与应用
12.3 MPEG-4:基于对象的视频编码技术
▪ MPEG-4 采用了新一代视频编码技术,它在视
频编码发展史上第一次把编码对象从图像帧拓展 到具有实际意义的任意形状视频对象,从而实现 了从基于像素的传统编码向基于对象和内容的现 代编码的转变,是视频编码技术突破性的飞跃。
多媒体技术基础与应用
MPEG-2
MPEG-2是一个直接与数字电视广播有关 的高质量图像和声音编码标准。MPEG2所能提 供的传输率在3~10Mbit/s之间,在NTSC制式 下的分辨率可达720×486,可提供广播级的 图像质量和CD级的音质。MPEG-2主要针对高 清晰度电视(HDTV)所需要的视频及伴音信号, 与MPEG-1兼容。
基于视频平面对象(VOP)的编码
多媒体技术基础与应用
基于视频平面对象(VOP)的编码 ▪ 视频对象平面(VOP,Video Object
Plane)是MPEG-4视频编码的核心概念。 因此视频对象提取即视频对象分割,是 MPEG-4视频编码的关键技术,也是新一代 视频编码的研究热点和难点.
多媒体技术基础与应用
多媒体技术基础与应用
第二代压缩编码技术
▪ MPEG-4则代表了基于模型/对象的第二代
压缩编码技术,它充分利用了人眼视觉特 性,抓住了图像信息传输的本质,以对象 的轮廓、纹理、位移特征,支持基于视觉 内容的交互功能,适应了多媒体信息的应 用由播放型转向基于内容的访问、检索的 发展趋势。
多媒体技术基础与应用
第12章 运动图像压缩标准MPEG与 H.26X
▪ 12.1 视频编码标准概述 ▪ 12.2 第一代的视频编码技术:MPEG ▪ 12.3 MPEG-4:基于对象的视频编码技术 ▪ 12.4 基于内容的信息存取与MPEG-7
多媒体技术基础与应用
MPEG家族 与H.26X家族
▪ ITU-T(国际电信联盟远程通信标准化组织)
多媒体技术基础与应用
MPEG-4的对象
▪ 传统的视频压缩技术都是以一帧画面作为压缩
的单位,而MPEG-4将输入视频系列每一帧分割 成相应形状的图形区域(即视频对象),以便每 一视频对象代表语义上有意义的对象或感兴趣的 视频内容。视频对象是构成内容的基本要素。因 此原本是一张张画面的视频序列被分割成数个以 对象为主的视频序列。
多媒体技术基础与应用
MPEG的流结构
▪ 图像(Image)是独立的显示单位,也是基本编 码单位。
▪ 宏块(Macro block)是进行运动补偿的基本 单位。由一个1616像素的亮度信息和两个88 像素的色度信息组成的块称为宏块。
▪ 块(Block)是由88像素组成的基本单位,是 进行DCT运算的单位,块可分为亮度块或色度 块。
▪ 以H.264和MPEG-4标准代表了基于对象的
第二代压缩编码技术。它以视听媒体对象 为基本单元,采用基于内容的压缩编码, 充分利用了人眼视觉特性,抓住了图像信 息传输的本质,从轮廓、纹理思路出发, 支持基于视觉内容的交互功能,这适应了 多媒体信息的应用由播放型转向基于内容 的访问、检索及操作的发展趋势。
与ISO/IEC(国际标准化组织/国际电工委员会)是 制定视频编码标准的两大国际组织。ITU-T的标准 包括H.261,H.262、H.263、H.264、H.265,主 要应用于实时视频通信领域,如会议电视。 MPEG系统标准由ISO/IEC制定,制定的标准主 要有MPEG-1、MPEG-2、MPEG-4和MPEG-7等。 主要应用于视频存储(DVD)、广播电视、因特网 和流媒体以及内容服务与管理等方面
▪ 可以通过运动物体的特征来观察分析物
体的运动。运动物体特征是指物体形状或 表面特征,如尖锐点、边缘线等。在这里 主要是指运动物体在二维图像平面上的投 影坐标的对应关系。
多媒体技术基础与应用
运动估计与运动矢量
▪ 设t1→t2时,物体由P运动至P',即: ▪ 空间坐标: P(X,Y,Z) → P'(X',Y',Z') ▪ 像平面坐标: p(x,y) → p'(x',y') ▪ 二维位移(△x,△y)称为二维运动矢量,标记
▪ 运动估计技术是帧间压缩模块的核心环 节,因此受到人们的广泛关注。运动矢量 (Motion Vector,MV)和运动补偿 (Motion Compensation,MC)是帧间 预测编码中两个最重要的概念。
多媒体技术基础与应用
运动估计与运动矢量
▪ 运动估计研究的是视频序列图像中投影 坐标在像平面上的变化,获取运动参数, 估计运动前后相邻时刻两幅图像上对应点 坐标之间的差值,即运动矢量。
为d(dx,dy)
▪ 对于一组点,二维空间位移记为d(dxi,dyi)
多媒体技术基础与应用
运动估计与运动矢量
多媒体技术基础与应用
运动预测与补偿
▪ 运动补偿算法是当前视频图像压缩技术 中使用最普遍的方法之一。运动补偿工作 于宏块一级,主要是消除预测图与插补图 在时间上的冗余,以提高压缩比。运动补 偿是一种预测,它不是对每个像素预测, 而是以1616的图像宏块为单位的预测。
多媒体技术基础与应用
MPEG-7

MPEG-7作为MPEG家庭中的一个新
成员,正式名称叫作“多媒体内容描述接
口” ,它将为各种类型的多媒体信息规定
一种标准化的描述,这种描述与多媒体信
息的内容本身一起,支持用户对其感兴趣
的各种"资料"进行快速、有效的检索。
多媒体技术基础与应用
MPEG-7
▪ MPEG-7既不同于基于波形和基于压缩
▪ B图像(双向预测 Bidirectional Prediction), 它参照前一幅和后一幅I或P图像做双向运动补 偿编码。
多媒体技术基础与应用
MPEG定义的三种帧类型图像
多媒体技术基础与应用
典型的MPEG帧序列
▪ MPEG的I帧、P帧和B帧是由MPEG编码器生
成的。当第一帧编码完成后,编码器将其数据进 行存储和传送,这就是I帧。紧接着第二帧输入, 并以同样的过程和方法对其进行处理,但编码器 并非将第二帧完整的数据进行存储和传送,而是 将它与第一帧进行比较运算。
多媒体技术基础与应用
MPEG流的分层结构

MPEG为更好地表示编码数据,规定了一个分
层的结构,自上到下分别是 :
▪ MPEG流(MPEG stream)
▪ 图像组(GOP,Group of Pictures)
▪ 图像(Image)
▪ 宏块(Macro block)
▪ 块(Block)
多媒体技术基础与应用
多媒体技术基础与应用
基于块匹配的运动补偿
▪ 基于块匹配算法(Block Matching
Algorithm) 的运动估计就是在参考帧(可能是 前一帧)的搜索窗口中找到和目标帧中的当前块 的最匹配的块。其基本思想是首先要将目标帧和 参考帧图像分块,一般宏块为16×16 像素大小。 然后确定搜索范围大小,最后在参考图像相应搜 索区域中寻找最匹配的宏块,运动矢量(包括位 移和方向)从参考宏块位置指向当前宏块位置。
▪ 按此方法对其后的帧进行处理,直到找到某一帧
与第一帧的差别超过规定值,则将此帧与第一帧 的差别(包括位移量和差值)存储起来,并将此 帧排列在第一帧后传送出去,这就是P帧。
多媒体技术基础与应用
典型的MPEG帧序列
帧内图像I的距离为N=9,预测图像(P)的距离为 M=3
多媒体技术基础与应用
帧间预测编码:运动估计与运动补偿
12.2 基于第一代的视频编码技术-MPEG
MPEG的数据分为MPEG视频、MPEG音频和 同步信号三个部分,视频流包含画面信息, 音频流包含伴音信息,所有播放MPEG图像和 伴音数据所需的时钟信息都包含在同步信号 流中。
多媒体技术基础与应用
MPEG系统的编码过程
多媒体技术基础与应用
MPEG系统的解码过程
多媒体技术基础与应用
基于对象编码技术的场景示例
多媒体技术基础与应用
基于对象编码技术的场景示例
▪ 在这个场景中,对象主要包含了三大类: ▪ 静态图像(Still images,如场景中的背景) ▪ 视频对象(Video Objects,如场景中的节目
主持人,不含背景)
▪ 音频对像(Audio Objects,如场景中节目主
持人声音)
多媒体技术基础与应用
场景中的音视频对象
▪ 音视频对象即(AVO:Audio visual Object)
对象是MPEG-4为支持基于内容编码而提出的重 要概念。对象是指在一个场景中能够访问和操纵 的实体,AV对象是听觉、视觉、或者视听内容的 表示单元,它可以是自然的或合成的声音、图像。 原始AV对象具有高效编码、高效存储与传输以及 可交互操作的特性,它又可进一步组成复合AV对 象。
第一代视频压缩编码技术
▪ 第一代视频压缩编码也可称之为传统的压缩编码
方式,它建立在Shannon信息论的基础上,以经 典的集合论为基础,用概率统计模型来描述信源, 压缩就是去掉数据的冗余。
多媒体技术基础与应用
第一代视频压缩编码技术
▪ MPEG-1、MPEG-2、H.261、H.262、H.263都
的表示方式如MPEG-1和MPEG-2,又不同 于基于对象的表示方式如MPEG-4,而是将 对各种不同类型的多媒体信息进行标准化 描述,并将该描述与所描述的内容相联系, 以实现快速有效的搜索。MPEG-7的功能与 其他MPEG标准互为补充。
多媒体技术基础与应用
视频编码技术的发展的三个阶段
多媒体技术基础与应用
多媒体技术基础与应用
MPEG-1
MPEG-1标准 1992年公布,其任务是在一 种可接受的质量下,把视频和伴音信号压缩 到速率大约为1.5Mb/s或更高的单一的MPEG数 据流。它可对SIF(标准交换格式)分辨率 (NTSC制式为352×240;PAL制式为352×288) 的图像进行压缩,每秒播放30帧,具有CD音 质,图像质量基本与VHS家用录像机相当。
多媒体技术基础与应用
宏块由1个亮度块和两个色度块组成
多媒体技术基础与应用
MPEG图像的类型
▪ I图(帧内图Intra Picture)是对整幅图像采 用JPEG编码的图像,它是一个独立的帧,其信 息由自身画面决定,不需要参照其他画面而产 生,它是P图和B图的参考图。
▪ P图(前向预测帧Predicted Picture),它参 照前一幅I或P图像做运动补偿编码。
是采用第一代压缩编码技术,着眼于图像信号的 统计特性来设计编码器。空间域的压缩依赖于图 像大块区域中相邻象素间的相似之处。在帧间编 码的情况下,每一帧图像划分成宏块以进行运动 补偿和编码以压缩时间冗余度。
多媒体技术基础与应用
第一代视频编码技术: 基于块的编码与运动源自文库偿
多媒体技术基础与应用
第二代压缩编码技术
多媒体技术基础与应用
H.26x与MPEG标准的发展演进
多媒体技术基础与应用
MPEG标准简述
▪ 视频能够压缩的根本原因在于视频数据具有
较高的冗余度。压缩就是指冗余的消除,主要基 于两种技术:统计学和心理 视觉。消除统计冗 余的基本依据是视频数字化过程在时间和 空间 上采用了规则的采样过程。视频画面数字化为规 则的像 素阵列,其密集程度适于表征每点最高 的空间频率,而绝大多数画面帧包含非常少甚至 不含这种最高频率的细节。
多媒体技术基础与应用
MPEG-4
▪ MPEG-4采用第一代视频编码的核心技术,如
变换编码、运动估计与运动补偿、量化、熵编码 外,还提出了一些新的有创见性的关键技术,并 在第一代视频编码技术基础上进行了卓有成效的 完善和改进。
▪ MPEG-4实现基于内容交互的首要任务就是
把视频/图像分割成不同对象或者把运动对象从背 景中分离出来,然后针对不同对象采用相应编码 方法,以实现高效压缩。因此视频对象提取即视 频对象分割,是MPEG-4视频编码的关键技术, 也是新一代视频编码的研究热点和难点。
MPEG流的分层结构
多媒体技术基础与应用
MPEG的流结构
▪ MPEG流(MPEG stream)包含音频流和视 频流。视频流是由图像组(GOP)构成的图像 序列,有表示开始的图像序列头和表示结束的 图像终止码。
▪ 图像组(GOP)是为方便随机存取而加的, 其结构和长度均可变。图像组是随机存取视频 单位。一个GOP由一串IBP帧组成,起始为I帧。 GOP的长度是一个I帧到下一个I 帧的间隔。
相关文档
最新文档