视频编码国际标准
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
双向预测图(bidirectional picture,B帧)——传送I、P 帧间的画面,只反映运动主体变化情况,重放时即参考I
也参考P,本身不做参考帧使用,不能用作预测参考;
Logo §3.2 MPEG-1视频编码和解码
Logo §3.2 MPEG-1视频编码和解码
Logo §3.2 MPEG-1视频编码和解码
此时压缩比降到5:1~7:1,所以延时与压缩倍数是互相
矛盾的。
H.261颁布于1990年,主要用于双向视频通信,允许的最大 编码延迟为150ms。它的输入图象格式为通用(同时适用于 625线和525线的视频标准)中间格式CIF (352x288),低端 可用其四分之一大小的QCIF (176x144)格式,桢率为 30,15,10,7.5四种,隔行(interlaced)视频,宽高比4:3。
MPEG-1
MPEG-2
1.5Mbps
4~100Mbps
VCD,CD-ROM
DVD,HDTV,VOD,DAB
H.263
MPEG-4 MPEG-7 H.264/AVC
低于64kbps
小于64kbps 64~384kbps 384kbps~4Mbps
远程视频监控,可视 电话,电视会议 Internet通信,无线通 信,2D/3D计算机图像 交互式视频
忽略水平和垂直空白间隔
量化10bits到8bits
Logo §3.2 MPEG-1视频编码和解码
DPCM
DCT+量化
Z扫描+VLC Huffman编码
进一步数据压缩
Logo §3.2 MPEG-1视频编码和解码
五、MPEG-1视频编码器 1、MPEG标准并没有定义特定的编码过程,只是定义了编 码比特流的语法和解码过程。
面向电视电话、电视会议和Internet多媒体的新一代国际视 频编码标准; 具有较强的抗误码特性,可适应丢包率高、干扰严重的信 道中的视频传输; 支持不同网络资源下的分级编码传输,在图像主观质量和 码率方面有大幅改进,是目前综合性能最优、应用前景最广 泛的编码标准。
Logo §3.1 视频图像编码标准
上进行存储,也可在局域网、ISDN上进行视频与伴音信息
的传输;
应用:
目前市场上用的MP3和VCD以及数字电话网络上的视频传输为 MPEG-1。
Logo §3.2 MPEG-1视频编码和解码
二、标准组成 MPEG-1系统—这部分是有关同步和多路复合的技术,用来 把数字视频和声音复合成单一的数据位流。标准名是 ISO/IEC11172-1。 MPEG-1视频—这部分是有关电视图像的压缩技术,标准名 是ISO/IEC11172-2。 MPEG-1音频—这部分是关于声音的压缩编码技术。标准名 是ISO/IEC11172-3。 MPEG-1一致性测试—这个标准详细说明了如何测试比特数 据流和解码器是否满足MPEG-1前3个部分中所规定的要求。这 些测试可由厂商和用户实施。标准名是ISO/IEC11172-4。 MPEG-1软件模拟—这部分内容不是标准,而是一个技术报 告,给出了用软件执行前3个部分的结果。标准名是 ISO/IEC11172-5。
Logo §3.2 MPEG-1视频编码和解码
三、输入图像格式 MPEG-1输入视频信号采用源输入格式(SIF, Source Input Format),采用YCrCb色空间; 采样格式4:2:0; MPEG-1最大的图像尺寸只能是352×288(对应25Hz帧 频)。
Logo §3.2 MPEG-1视频编码和解码
Logo §3.2 MPEG-1视频编码和解码
2、关键技术 (1)帧序重排 在编码器端需要对输入图像重新排序,对按显示顺序输入
的序列,经过帧序重排后成为按编码顺序排列,然后按I
、B、P帧分别进行编码;
(2)运动估计和补偿
(3)比特流缓冲器
Logo §3.2 MPEG-1视频编码和解码
图像压缩首先处理I帧图像,然后是P帧,最后在两者的基 础上才处理B帧; MPEG编码器算法允许选择I图像频率(指每秒钟出现I图 像的次数)和位置(时间方向上帧所在的位置); 一个典型的I、P、B图像排列如下:I的距离为15;P的距 离为3;
Logo §3.1 视频图像编码标准
H.261的编码方案是基于DCT和DPCM的预测编码算法, 运动每帧图象分成8x8的子块,再组成宏块、块组,宏块 由4个8x8的亮度块和2个8x8的色度块组成,每个块组由 3x11个宏块组成。
每幅QCIF图象有3个块组;
每幅CIF图象有12个块组,形成一个多层次的块结构。
Logo §3.2 MPEG-1视频编码和解码
“开放性”的视频码源自文库:
I 帧在码流中出现的位置和频率,可根据图像序列中随机存取和 景物切换的需要进行选择。
相邻最近的I与P帧或P帧之间的B帧数目可以选择。
I,P,B三种图象的数据压缩比: 2~5:1, 5~10:1, 20~30:1
图象的编码顺序和显示顺序不相同。
Logo §3.2 MPEG-1视频编码和解码
Logo
§3.2 MPEG-1视频编码和解码
显示顺序上在前的B帧图像,由于预测时参照靠后的P帧
图像,在传输存储和解码是必须先处理P帧图像,因此在 编码顺序上P帧图像反而在B帧图像之前;
由于编码顺序和显示顺序之间的差异,带来编、解码总延
时达0.8~1s;
Logo §3.1 视频图像编码标准
四、MPEG-2/H.262
MPEG-2是1993年通过的视频压缩标准,用于高清晰度视
频和音频的编码,也包含用于可视电话中的超低码率(832kbps)的压缩编码; MPEG-2是MPEG-1的兼容扩展,广泛应用于各种速率( 2-20Mbps)和各种分辨率情况下的场合;
二、H.263
H.263是在H.261的基础上针对低码率(低于64kbp)视频 压缩提出的标准,与之不同的是采用半象素精度运动补偿 算法和变长编码,并引进了16种可协商的编码选项用于提 高压缩性能和支持新增加的功能。
Logo §3.1 视频图像编码标准
三、MPEG-1 MPEG-1是1992年通过的视频压缩标准,用于CIF格式的 视频在速率约1.5Mbps的各种数字存储介质(如CDROM,DAT,硬盘及光驱等)上的编码表示,主要应用在 交互式多媒体系统中; MPEG-1算法与H.261算法相似,它在1.2Mbps(视频信号 )速率下压缩和解压缩CIF格式的视频质量与VHS记录的 模拟视频质量相当; 它是一种通用标准,规定了编码位流的表示语法和解码方 法,提供的支持操作有运动估计、运动补偿预测、DCT、 量化和变长编码。 MPEG-1的特点有:(1)随机存取,(2)支持快速双向搜索 ,(3)允许大约1秒的编码/解码延迟,比H.261的150ms内 的严格限制松得多。
这种延时对广播性质的图像传输不会带来任何影响,因为 用户并不能发现发射端与接收端信号起始时间的差异; 对于交互性质的图像传输,如数字会议电视会带来不便, 如甲方向乙方提问,由于双向延时则会1.8~2s以后得到回 答;
Logo §3.2 MPEG-1视频编码和解码
为减小延时采用方法: 通过减少B帧使两个I帧之间的帧数减少,则编、解码 总延时下降; 为进一步减小延时,可以把B帧、P帧全部去掉。这样 可得零延时,此方式称M-JPEG方式;
MPEG-2不仅接受逐行扫描视频,也可以接受隔行扫描视
频,高清晰度视频,提供可伸缩调节的位流,提供改进的 量化和编码选项。
Logo §3.1 视频图像编码标准
五、MPEG-4 低于64kbps的低数据率,交互式多媒体应用标准; MPEG-4利用了人眼视觉特性,抓住了图像信息传输的 本质,从轮廓、纹理思路出发,基于对内容的访问; AV对象(AVO,Audio Visual Object)是MPEG-4为支 持基于内容编码而提出的重要概念;视音频已不再是图 像帧的概念,而是一个个视听场景;把编码对象从图像 帧到任意形状的视频对象,实现从基于像素的传统编码 到基于对象和内容的现代编码。 采用开放的编码系统,可随时加入新的编码算法模块, 同时也可根据不同应用需求现场配置解码器,以支持多 种多媒体应用;
(10-8)/10=2/10=20%
不相关性消除
接收端不能恢复原始信号
Logo §3.2 MPEG-1视频编码和解码
2~6Mbit/s
124.5Mbit/s -25% 166Mbit/s -25% 216Mbit/s -20% 270Mbit/s
进一步数据压缩步骤
降低垂直色度分辨率(4:2:0)
数字电视原理与应用
Logo
10bits量化降为8bits量化
模拟电视中,视频信号的信噪比大于48dB时,噪声恰好人眼 不可见。 A/D转换器中8bit分辨率的量化噪声已经不可见,因此在演 播室以外,对Y,CB和CR信号不必要采用10bit分辨率。 演播室中最好采用10bit,更容易进行后处理,质量更好。 10bit降为8bit可节省20%码率
基于语义
对象特征
提取
MPEG-7
基于对象
MPEG-4
对象形成及 跟踪
基于像素
MPEG-1
MPEG-2
Logo §3.1 视频图像编码标准
编码标准 H.261 全 称 传输码率
P×64kbps P=1~30
主要应用
ISDN视频会议
P×64kbps的音/视频服 务的编/解码 面向数字存储的运动图 像及伴音编码 运动图像及伴音的通用 编码 低比特率通信的视频编 码 音/视频对象的通用编 码 多媒体内容描述接口 高级视频编码算法
一、 H.261 H.261是用于视频会议和可视电话业务的以p×64kbps, p=1,…,30的速率在综合业务数字网(ISDN)上传送视频信 号的压缩标准。
64kbps (p=1) 用于低端的可视电话业务,其中视频信号传输占用48 kbps的带宽,剩下的16 kbps用于音频信号; 384 kbps(p=6)或更高的速率用于高端的视频会议业务; 在ISDN信道上最高传输率为19.2Mbps (p=30),足以传送VHS质量的 视频信号。
Logo §3.1 视频图像编码标准
MPEG-7:多媒体内容描述标准,支持对多媒体资源的组织 管理、搜索、过滤和检索;
MPEG-21:多媒体框架和综合应用方面的框架。目标是建立 一个交互的多媒体框架该标准致力于在大范围的网络上实现 透明的传输和对多媒体资源的充分利用。 六、H.264/AVC
数字视频技术
第 3章 视频编码国际标准 2011年11月
Logo 主要内容
视频图像编码标准 MPEG-1视频编码和解码 MPEG-2视频编码和解码 MPEG-4视频编码和解码 H.263视频编码和解码 H.264/AVC视频编码和解码
Logo §3.1 视频图像编码标准
Logo §3.1 视频图像编码标准
任意 任意
多媒体检索 未来视频编码工业标 准
Logo §3.2 MPEG-1视频编码和解码
一、标准简介 编号为ISO/IEC 11172; 规定视频信息与伴音信息经压缩之后的数据速率上限为 1.5Mbps(其中视频约为1.2Mbps,音频约为0.3Mbps); 可以在CD-ROM、硬盘、可写光盘、数字音频磁带等介质
四、视频帧类型
帧内图(intra picture,I帧)——对I帧的编码类似于
JPEG,支持随机存取,压缩比低; 预测图(predicted picture,P帧)——是运动主体在与I 帧相隔一定时间,在同一背景上已有明显变化的画面。以 前面I帧为参考,相同信息不发送只发送主体变化差值,
进行具有运动补偿的前向预测;
1 2 3 量化从10bits降为8bits 省略水平和垂直空白间隔 降低垂直方向色度分辨率(4:2:0) 有损 无损 有损
4 5
6 7
活动图像的DPCM (Differential Pulse Code
Modulation)差分脉冲编码调制,简称差值编码
无损 有损
无损 无损
DCT和量化
Z扫描和零序列的游程编码 Huffman编码
也参考P,本身不做参考帧使用,不能用作预测参考;
Logo §3.2 MPEG-1视频编码和解码
Logo §3.2 MPEG-1视频编码和解码
Logo §3.2 MPEG-1视频编码和解码
此时压缩比降到5:1~7:1,所以延时与压缩倍数是互相
矛盾的。
H.261颁布于1990年,主要用于双向视频通信,允许的最大 编码延迟为150ms。它的输入图象格式为通用(同时适用于 625线和525线的视频标准)中间格式CIF (352x288),低端 可用其四分之一大小的QCIF (176x144)格式,桢率为 30,15,10,7.5四种,隔行(interlaced)视频,宽高比4:3。
MPEG-1
MPEG-2
1.5Mbps
4~100Mbps
VCD,CD-ROM
DVD,HDTV,VOD,DAB
H.263
MPEG-4 MPEG-7 H.264/AVC
低于64kbps
小于64kbps 64~384kbps 384kbps~4Mbps
远程视频监控,可视 电话,电视会议 Internet通信,无线通 信,2D/3D计算机图像 交互式视频
忽略水平和垂直空白间隔
量化10bits到8bits
Logo §3.2 MPEG-1视频编码和解码
DPCM
DCT+量化
Z扫描+VLC Huffman编码
进一步数据压缩
Logo §3.2 MPEG-1视频编码和解码
五、MPEG-1视频编码器 1、MPEG标准并没有定义特定的编码过程,只是定义了编 码比特流的语法和解码过程。
面向电视电话、电视会议和Internet多媒体的新一代国际视 频编码标准; 具有较强的抗误码特性,可适应丢包率高、干扰严重的信 道中的视频传输; 支持不同网络资源下的分级编码传输,在图像主观质量和 码率方面有大幅改进,是目前综合性能最优、应用前景最广 泛的编码标准。
Logo §3.1 视频图像编码标准
上进行存储,也可在局域网、ISDN上进行视频与伴音信息
的传输;
应用:
目前市场上用的MP3和VCD以及数字电话网络上的视频传输为 MPEG-1。
Logo §3.2 MPEG-1视频编码和解码
二、标准组成 MPEG-1系统—这部分是有关同步和多路复合的技术,用来 把数字视频和声音复合成单一的数据位流。标准名是 ISO/IEC11172-1。 MPEG-1视频—这部分是有关电视图像的压缩技术,标准名 是ISO/IEC11172-2。 MPEG-1音频—这部分是关于声音的压缩编码技术。标准名 是ISO/IEC11172-3。 MPEG-1一致性测试—这个标准详细说明了如何测试比特数 据流和解码器是否满足MPEG-1前3个部分中所规定的要求。这 些测试可由厂商和用户实施。标准名是ISO/IEC11172-4。 MPEG-1软件模拟—这部分内容不是标准,而是一个技术报 告,给出了用软件执行前3个部分的结果。标准名是 ISO/IEC11172-5。
Logo §3.2 MPEG-1视频编码和解码
三、输入图像格式 MPEG-1输入视频信号采用源输入格式(SIF, Source Input Format),采用YCrCb色空间; 采样格式4:2:0; MPEG-1最大的图像尺寸只能是352×288(对应25Hz帧 频)。
Logo §3.2 MPEG-1视频编码和解码
Logo §3.2 MPEG-1视频编码和解码
2、关键技术 (1)帧序重排 在编码器端需要对输入图像重新排序,对按显示顺序输入
的序列,经过帧序重排后成为按编码顺序排列,然后按I
、B、P帧分别进行编码;
(2)运动估计和补偿
(3)比特流缓冲器
Logo §3.2 MPEG-1视频编码和解码
图像压缩首先处理I帧图像,然后是P帧,最后在两者的基 础上才处理B帧; MPEG编码器算法允许选择I图像频率(指每秒钟出现I图 像的次数)和位置(时间方向上帧所在的位置); 一个典型的I、P、B图像排列如下:I的距离为15;P的距 离为3;
Logo §3.1 视频图像编码标准
H.261的编码方案是基于DCT和DPCM的预测编码算法, 运动每帧图象分成8x8的子块,再组成宏块、块组,宏块 由4个8x8的亮度块和2个8x8的色度块组成,每个块组由 3x11个宏块组成。
每幅QCIF图象有3个块组;
每幅CIF图象有12个块组,形成一个多层次的块结构。
Logo §3.2 MPEG-1视频编码和解码
“开放性”的视频码源自文库:
I 帧在码流中出现的位置和频率,可根据图像序列中随机存取和 景物切换的需要进行选择。
相邻最近的I与P帧或P帧之间的B帧数目可以选择。
I,P,B三种图象的数据压缩比: 2~5:1, 5~10:1, 20~30:1
图象的编码顺序和显示顺序不相同。
Logo §3.2 MPEG-1视频编码和解码
Logo
§3.2 MPEG-1视频编码和解码
显示顺序上在前的B帧图像,由于预测时参照靠后的P帧
图像,在传输存储和解码是必须先处理P帧图像,因此在 编码顺序上P帧图像反而在B帧图像之前;
由于编码顺序和显示顺序之间的差异,带来编、解码总延
时达0.8~1s;
Logo §3.1 视频图像编码标准
四、MPEG-2/H.262
MPEG-2是1993年通过的视频压缩标准,用于高清晰度视
频和音频的编码,也包含用于可视电话中的超低码率(832kbps)的压缩编码; MPEG-2是MPEG-1的兼容扩展,广泛应用于各种速率( 2-20Mbps)和各种分辨率情况下的场合;
二、H.263
H.263是在H.261的基础上针对低码率(低于64kbp)视频 压缩提出的标准,与之不同的是采用半象素精度运动补偿 算法和变长编码,并引进了16种可协商的编码选项用于提 高压缩性能和支持新增加的功能。
Logo §3.1 视频图像编码标准
三、MPEG-1 MPEG-1是1992年通过的视频压缩标准,用于CIF格式的 视频在速率约1.5Mbps的各种数字存储介质(如CDROM,DAT,硬盘及光驱等)上的编码表示,主要应用在 交互式多媒体系统中; MPEG-1算法与H.261算法相似,它在1.2Mbps(视频信号 )速率下压缩和解压缩CIF格式的视频质量与VHS记录的 模拟视频质量相当; 它是一种通用标准,规定了编码位流的表示语法和解码方 法,提供的支持操作有运动估计、运动补偿预测、DCT、 量化和变长编码。 MPEG-1的特点有:(1)随机存取,(2)支持快速双向搜索 ,(3)允许大约1秒的编码/解码延迟,比H.261的150ms内 的严格限制松得多。
这种延时对广播性质的图像传输不会带来任何影响,因为 用户并不能发现发射端与接收端信号起始时间的差异; 对于交互性质的图像传输,如数字会议电视会带来不便, 如甲方向乙方提问,由于双向延时则会1.8~2s以后得到回 答;
Logo §3.2 MPEG-1视频编码和解码
为减小延时采用方法: 通过减少B帧使两个I帧之间的帧数减少,则编、解码 总延时下降; 为进一步减小延时,可以把B帧、P帧全部去掉。这样 可得零延时,此方式称M-JPEG方式;
MPEG-2不仅接受逐行扫描视频,也可以接受隔行扫描视
频,高清晰度视频,提供可伸缩调节的位流,提供改进的 量化和编码选项。
Logo §3.1 视频图像编码标准
五、MPEG-4 低于64kbps的低数据率,交互式多媒体应用标准; MPEG-4利用了人眼视觉特性,抓住了图像信息传输的 本质,从轮廓、纹理思路出发,基于对内容的访问; AV对象(AVO,Audio Visual Object)是MPEG-4为支 持基于内容编码而提出的重要概念;视音频已不再是图 像帧的概念,而是一个个视听场景;把编码对象从图像 帧到任意形状的视频对象,实现从基于像素的传统编码 到基于对象和内容的现代编码。 采用开放的编码系统,可随时加入新的编码算法模块, 同时也可根据不同应用需求现场配置解码器,以支持多 种多媒体应用;
(10-8)/10=2/10=20%
不相关性消除
接收端不能恢复原始信号
Logo §3.2 MPEG-1视频编码和解码
2~6Mbit/s
124.5Mbit/s -25% 166Mbit/s -25% 216Mbit/s -20% 270Mbit/s
进一步数据压缩步骤
降低垂直色度分辨率(4:2:0)
数字电视原理与应用
Logo
10bits量化降为8bits量化
模拟电视中,视频信号的信噪比大于48dB时,噪声恰好人眼 不可见。 A/D转换器中8bit分辨率的量化噪声已经不可见,因此在演 播室以外,对Y,CB和CR信号不必要采用10bit分辨率。 演播室中最好采用10bit,更容易进行后处理,质量更好。 10bit降为8bit可节省20%码率
基于语义
对象特征
提取
MPEG-7
基于对象
MPEG-4
对象形成及 跟踪
基于像素
MPEG-1
MPEG-2
Logo §3.1 视频图像编码标准
编码标准 H.261 全 称 传输码率
P×64kbps P=1~30
主要应用
ISDN视频会议
P×64kbps的音/视频服 务的编/解码 面向数字存储的运动图 像及伴音编码 运动图像及伴音的通用 编码 低比特率通信的视频编 码 音/视频对象的通用编 码 多媒体内容描述接口 高级视频编码算法
一、 H.261 H.261是用于视频会议和可视电话业务的以p×64kbps, p=1,…,30的速率在综合业务数字网(ISDN)上传送视频信 号的压缩标准。
64kbps (p=1) 用于低端的可视电话业务,其中视频信号传输占用48 kbps的带宽,剩下的16 kbps用于音频信号; 384 kbps(p=6)或更高的速率用于高端的视频会议业务; 在ISDN信道上最高传输率为19.2Mbps (p=30),足以传送VHS质量的 视频信号。
Logo §3.1 视频图像编码标准
MPEG-7:多媒体内容描述标准,支持对多媒体资源的组织 管理、搜索、过滤和检索;
MPEG-21:多媒体框架和综合应用方面的框架。目标是建立 一个交互的多媒体框架该标准致力于在大范围的网络上实现 透明的传输和对多媒体资源的充分利用。 六、H.264/AVC
数字视频技术
第 3章 视频编码国际标准 2011年11月
Logo 主要内容
视频图像编码标准 MPEG-1视频编码和解码 MPEG-2视频编码和解码 MPEG-4视频编码和解码 H.263视频编码和解码 H.264/AVC视频编码和解码
Logo §3.1 视频图像编码标准
Logo §3.1 视频图像编码标准
任意 任意
多媒体检索 未来视频编码工业标 准
Logo §3.2 MPEG-1视频编码和解码
一、标准简介 编号为ISO/IEC 11172; 规定视频信息与伴音信息经压缩之后的数据速率上限为 1.5Mbps(其中视频约为1.2Mbps,音频约为0.3Mbps); 可以在CD-ROM、硬盘、可写光盘、数字音频磁带等介质
四、视频帧类型
帧内图(intra picture,I帧)——对I帧的编码类似于
JPEG,支持随机存取,压缩比低; 预测图(predicted picture,P帧)——是运动主体在与I 帧相隔一定时间,在同一背景上已有明显变化的画面。以 前面I帧为参考,相同信息不发送只发送主体变化差值,
进行具有运动补偿的前向预测;
1 2 3 量化从10bits降为8bits 省略水平和垂直空白间隔 降低垂直方向色度分辨率(4:2:0) 有损 无损 有损
4 5
6 7
活动图像的DPCM (Differential Pulse Code
Modulation)差分脉冲编码调制,简称差值编码
无损 有损
无损 无损
DCT和量化
Z扫描和零序列的游程编码 Huffman编码