第二章 视频压缩标准及应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3、标准视频NTSC(美国国家电视系统委员会)和PAL(Phase lternating Line)逐行倒相格式,SECAM(Sequential Color and memory)串行色彩存储格式。 标准 NTSC PAL 行数/帧 行数/场 525 625 262.5 312.5 活动视频行 场速率 480 576 59.94 50 水平同步脉冲速率 15734 15625
2、数字化
常见数字视频格式(PAL)
图像格式 水平样点数 垂直样点数(行 数) 典型应 用
亮度
4:2:2 704
色度
352
亮度
576
色度
576 MPEG2
4:2:0
HHF CIF
704
352 352
352
176 176
576
576 288
288
288 144
MPEG2
S-VCD VCD
QCIF SQCIF
计算机
图象存储 光盘 数据流带 录像带 磁盘
数字图象处理系统的基本组成
1、图象获取 利用各种传感器把相应波长的信号检索出 来,对信号进行数字化处理并在计算机中存储起来。 2、存储 一是供处理过程中使用的短暂存储器,计算机的内存和专用 图形图象处理板卡上的帧缓冲区; 二是在线存储区,能提供较快的存取速度,有磁盘、优盘、 光盘等存储介质; 三是图象档案的存储区,存储量大,访问频率低,常用磁带 和光盘等存储介质。 3、图象处理 图象的增强和恢复、分析、重建和压缩等。 软件实现较慢,硬件快。 4、通信 局部和远程 必须压缩传输后解压。 5、显示输出 监视器是常用的,录像机,胶片记录仪等输 出设备。
Y10 Y20
Y11 Y21
Y12 Y22
Y13 Y23
U10 U11 U12 U13
U20 U21 U22 U23 V10 V11 V12 V13 V20 V21 V22 V23
U10 U20 V10 V20 4:2:2
U11 U21 V11 V21
U10 U20
U(12)0 U(12)1
V10 V20 4:1:1
13.5MHz
4:2:0 8 DV 5:1
13.5MHz
4:2:2 8 DV 3.3:1
数据率
音频
18Mb/s
16b/48KHz
4声道
25 Mb/s
16b/48KHz
2声道
50 Mb/s
16b/48KHz
4声道
25 Mb/s
16b/48KHz
2声道
50 Mb/s
16b/48KHz
4声道
第三节
基于DCT的图象压缩编码
每条扫描线每4个连 续的采样点取4个Y、 1个Cr、1个Cb样本, 每一个像素用1.5个样 本表示。 是子采样格式
V(12)0 V(12)1
4:4:4
每条扫描线每4个连 续的采样点取4个Y、 4个Cr、4个Cb样本, 每一个像素用3个样 本表示。 不是子采样格式
4:2:0
在水平和垂直方向每2个连 续的采样点取4个Y、 1个Cr、1个Cb样本, 每一个像素用1.5个样 本表示。 是子采样格式
4、SIF(source input format)格式定义两种位流格式
PAL 352像素*288行*25Hz NTSC 352像素*240行*30Hz 因为SIF帧速率是NTSC和PAL场速率的1/2,所有视频显示硬件必须把每 个SIF帧显示两次。 5、ITU-R601编码方案 国际电信联盟无线电通信部门以演播室质 量标准,把模拟的Y U V与分量编码使用的Y Cb Cr在彩色空间具有数字等 价性。
数字化AV信号的取样频率fs ,量化位数为R,则其二进制编 码的传输速率(或称位率、码率、比特率、数据率)I= fs × R bps(b bit; ps per second) 数字电话的fs= 8 kHz, R = 8 bit,I= 8 × 8=64 kbps; CD-DA的音频信号的每一路fs= 44.1 kHz, R = 16 bit, I= 44.1 × 16=705.6 kbps,立体声信号为; I= 1.4112 Mbps; 视频信号的带宽为6M, 采样定理要求,取样频率 应是信号带宽的2倍以上。 CCIR规定采样频率13.5MHz, 13.5MHz/15625=864=13.5MHz×64 μs, 色度信号的带宽为1.3MHz,取样频率为6.75MHz。
速率控制 输入 图象分块 — DCT 量化 熵编码 缓冲器 输出
运动估计与运动补偿 DCT图象压缩编码原理框图
一、MPEG—1视频压缩技术 MPEG—1是第一个标准,主要应用于视频信号的数字化压缩 存储。码率为1.5Mbps, 图象质量相当于VHS的水平。其主要特点: 1、 MPEG—1将电视图象帧分三类 I、B、P 2、 MPEG—1的码流语法结构 这个语法结构把图象压缩数据码流分为六层,每层或者支 持一种信号处理过程,或者支持一种系统功能。 块: MPEG算法中最小的编码单位,包含8×8个像素,是 图象信息之一:Y、U、V。块是帧内编码的 基本单元。 宏块: MPEG算法中基本编码单元。包含16 ×16个图象块。 宏块由四个亮度块、若干个色差块及附加数据构成。附加数据 包括宏块的编号、编码类型、量化参数、运动矢量等信息。
352x240
360x480
352x240
一、图象和视频数据的处理 1、图象的数据模型 图象信息在数学上可表示为 I=f (x,y,z,t,λ) 其中 ( x,y,z)是三维空间坐标;t 代表时间,形成活动图象; λ 是波长,它对图象 类型产生影响。 Fr=25/30Hz 帧速率 一般用于电视的隔行扫描,每帧由奇、偶两场组成。 HDTV系统Fr=50-60Hz , 当Fr=50-60Hz 时基本上没有闪烁现象,高质量的工 作站显示器通常使用这种帧率。
几种数字录象机记录格式技术参数比较
格式 参 数
BetacamSX 25
DVCPRO 50
DVCAM
Digital-S
亮度信号(Y)取样率
Y/R-Y、B-Y取样比 量化比特 压缩方式 压缩比
13.5MHz
4:2:2 8 MPEG-Ⅱ 10:1
13.5MHz
4:1:1 8 DV 5:1
13.5MHz
4:2:2 8 DV 3.3:1
4:2:2方案中的编码参数植
参数 编码信号 Y,Cr, Cb 每行的样本数: Y Cr, Cb 采样频率: Y 13.5MHz 13.5MHz 858 429 864 432 525行/59.94Hz场速率系统 (NTSC) 从加玛预校正信号中获得 625行/50Hz场速率系统 (PAL) 从加玛预校正信号中获得
三、视频信号的数字化
1、模拟视频信号行场结构 PAL制:行频 15625Hz,场频 50Hz ,25帧,每帧2场; 一行扫描时间64 μs (=1/15625 s),其中12 μs是行消隐, (4.7 μs同步头);有效显示时间52 μs。 一帧(副)画面扫描行 625行(=15625/25) 其中50行为场消 隐,有效行为575行这样有效行场数只占总数的75%。
二、MPEG ( Moving Picture Expert Group) MPEG分系统、视频、音频三部分 MPEG-1 位率1.5Mbps, 用于家用视音频处理标准,VCD。 MPEG-2位率4-10Mbps,图象质量近于演播室质量,DVD。 MPEG-4、MPEG-7概述 4.7G DVD-R/RW记录视频的规格
离散余玄变换是一种正交变化,从空间领域或时域获取样 点序列,并通过特定运算将其变换到频率域。对于图象而言, X、Y坐标轴分别代表屏幕的两个方向,信号的幅度就是屏幕上 像素的样值,由此形成的矩阵就是信号的空间表示。DCT将空 间信息转换为频率和频谱信息,变换后的X、Y轴分别代表两个 方向上的频率分量。
每条扫描线每4个连 续的采样点取4个Y、 2个Cr、2个Cb样本, 每一个像素用2个样 本表示。 是子采样格式
4、数字视频的比特率和所需存储容量
比特bit(位):计算机中信息的最小量。数据速率/码流 常用bps(比特/秒)。 字节Byte:存储一个字符所需存储量。通常表示磁盘容量和文件大小。 1Byte=8bite 常用单位及换算: 1KB=1024B; 1MB=1024KB; 1GB=1024MB; 1TB=1024GB; 1PB=1024TB; 1EB=1024PB; 以PAL ITU-R601标准,625/50电视系统的一帧D1质量的电视图象,采用 Y:U:V=4:2:2,8bit量化,数据速率: 720×576 × (1+0.5 +0.5) × 8 × 25=165888000bit/s(bps)=20736000B/s=19.78MB/s; 每帧图象的数据为: 720 × 576 × (1+0.5 +0.5) × 8=6635520bit=0.791M B. DV格式:速率25 Mbits/s ,一小时节目所需要的容量为: 25 × 3600/8=11250MB=10.986328125GB=11GB. 1394/DV接口速率 100/200/400 Mbits/s SDI 接口速率 270 Mbits/s
第二章 视频压缩标准及应用
第一节 压缩技术 (压缩/解压是NLE的核心) 一、JPEG(Joint Photographic Experts Group)国际组织建 立联合图片专家组,建立一个适用于连续图像压缩的国际标准。 这一标准的要求: 1、先进的压缩技术 压缩与质量同时考虑,失真程度要在 一定的范围之内,编码器的参数中包括控制压缩比和图象质量 的成分。 2、适用于所有的连续色调图象,不应对图象的尺寸、色彩 空间和像素纵横比等特性进行限制,也不应对图象的场景内容 (如复杂性、色彩范围或统计特性)没有任何限制。 3、具有适中的计算复杂性,从而使得压缩算法既可以用软 件来实现,也可用硬件来实现,并且具有较好的性能。 4、具有4种操作模式:顺序/累进/无失真/层次 编码
Cr, Cb
编码形式 每个数字活动行的样本数
6.75MHz
正规PCM,8位/样本
6.75MHz
正规PCM,8位/样本
Y
Cr, Cb 模拟与数字水平时序关系: 从数字活动行结束到行同步的 上升沿
720
360 16个色度时钟周期
720
360 12个色度时钟周期
二、数字图象处理系统
图象通信
图象获取 摄像机 照相机 扫描仪 图象处理 显示输出 TV彩色监视器 打印机
NTSC M/4.7G
720x480 720x480 480x480
项目 模式 1 2 HQ SP
速率
9.17Mbps 5.07Mbps 3.38Mbps
PAL
720x576 720x576 480x576
60 120
3 4
5
LP EP
SLP
180 240
360
2.54Mbps
1.69Mbps
360x480
176 128
88 64
144 96
72 48
可视电 话 Internet
科学实验表明:人眼对从纯黑到纯白分辨灰度级为64级,用 6比特来表示图象的灰度级就够了,实际中为提高质量,减低噪声, 采样过程中,最低用256级取样电平,即每个取样点需要用 8比特 来表示,广播级的图象处理采用10、12、14比特。 活动图象数字化后数据速率: 13.5×8(Y) + 6.75 ×8(U) + 6.75 ×8(V)=216Mbps=27MB/s CCIR601建议 规定正程扫描52 μs ,一行采样点数 52 ×13.5=702点,压缩算法要求水平方向上的采样点必须为32或 16的倍数,通常704取720点。有效行625-50=575取576。 4:2:2格式数字图象数据速率: (704 ×576+352 ×576 +352 ×576) ×8 ×25=162201600bit/s=162.2Mbit/s 162.2/216=75%
3、图象子采样
对彩色电视信号采样时,有两种方法:一是用同一种采样频率对图象的亮度、色差 信号进行采样;二是对色差信号采用比亮度信号低的频率采样,这就是图象子采样。
Y10 Y11 Y12 Y13 Y20 Y21 Y22 Y23
Y10 Y11 Y12 Y13 Y20 Y21 Y22 Y23
Y10 Y11 Y12 Y13 Y20 Y21 Y22 Y23
第二节
数字视频信号分析
2、彩色空间 RGB 和YUV转换关系
Y U V
R G B
0.299 0.587 0Hale Waihona Puke Baidu144 = -0.1678 -0.3313 -0.5 0.5 -0.4187 -0.0813
= 1 1 1 0 -0.34414 1.1772 1.042 -0.71414 0
R G B
Y U V