视频编解码-帧内预测和帧间预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

运动矢量中值预测
• 对于除了块尺寸为 16×8 和 8×16 的块来说, MVp 是块 A、 B 和 C 的运动矢量的中值; • 对于 16×8 块来说, 上方的 16×8 块的 MVp 根据 B 预测得到, 下方的 16×8 块的 MVp 根 据 A得到; • 对于 8×16 块来说, 左侧的 16×8 块的 MVp 根据 A 预测得到, 右侧的 16×8 块的 MVp 根 据 C得到
帧间预测方法
单向预测、双向预测和重叠块补偿
有时,不只是利用前一帧像素预测, 还需利用后一帧像素。特别是 t-1 帧 尚未暴露而 t+1 帧已呈现出来的区域
采用 OBMC 时,一个像素的预测不 仅基于它所属的 MV 估计,还基于 其相邻的 MV 估计
运动矢量的预测
MV
如果对每个块的运动矢量进行编码,那 么将花费相当数目的比特数,特别是如 果选择小尺寸的块的时候。由于一个运 动物体会覆盖多个分块,所以空间域相 邻块的运动矢量具有很强的相关性,因 此,每个运动矢量可以根据邻近先前已 编码的块进行预测。
三步搜索法(绝对误差均值(MAD)最小准则)
一个 16×16 搜索区中心点,以搜索区最大搜索长度的一半为步长,计算 中心点及周围8个邻近点的 MAD 值,再以最小MAD点为中心,步长减为 原来的一半,依次类推,到了第三步,再把步长减半,计算 MAD 值,其 中 MAD 最小点运动矢量即为所求的值。
X(n) 为当前像素的实际值, p(n) 为其预测 值, d(n) 为差值。该差值经量化后得到残差 量化值 q(n)。预测值 p(n)经预测器得到,预 测器输入为已存储在预测器内前面的各像素, 和当前值,它们的加权和即为下一个预测器 输出。
帧内预测编码
解码输出 e’(n)与原始信号 e(n)之间有个因量化而产生的量化误差
视频编解码学习报告
为什么需要视频编码?
一秒钟1080P视频的数据量
帧率 30帧/s 每帧大小 1920*1080像素 Bit/像素 24(R/G/B) 数据量 177.9M
为什么可以视频编码?
空间冗余:
时间冗余:
为什么可以视频编码?
结构冗余: 结构冗余是在某些场景中,存在着明显的图像分布模式。 出现或相近的纹理结构,结构可以通过特定的过程来生成。 例如:方格状的地板,蜂窝,砖墙,草席等图结构上存在 冗余。 视觉冗余: 视觉冗余是人类的视觉系统对图像场的敏感性是非均匀和 非线性的。对亮度变化敏感,而对色度的变化相对不敏感; 对物体边缘敏感,内部区域相对不敏感;对整体结构敏感, 而对内部细节相对不敏感。可以根据这些视觉特性对图像 信息进行取舍。
编码端: X – P = q 解码端: P + q = X
帧内预测编码
C: 200 A: 201 B:202 X:202 D:204 E:198 F:203
编码端: X – P = q 解码端: P + q = X 1 11001001
帧内预测编码
编码端: X – P = q 解码端: P + q = X
帧内预测编码
左图给出了大量统计后差值信号 的概率分布,一般说图像中平坦 区域比突变区域多得多,例如人 脸中,只有眼睛、鼻子、嘴等少 量地方细节出现,其余则为平坦 或缓变区域。
帧内预测编码
人眼视觉特性实验表明,在亮度突变 部分,量化误差大些不会使人眼敏感, 可采取粗量化(量化节距大);反之, 在亮度变化缓慢区域,则应取细量化。 总之,利用人眼这种掩盖效应采用非 线性(不均匀)量化,可使总码率有 所下降。
帧内预测编码
预测编码,是在压缩编码后传输的并不是 像素本身的取样幅值,而是该取样的预测值和实 际值之差。 例如:当前像素为 X,其左邻近像素为 A, 上邻近像素为 B,上左邻近像素为 C 等。显然 与 X 之间的距离近的像素,相关性强。按与 X 的距离不同给以不同的权值,把这些像素的加权 和作为 X的预测值P,与实际值相减,得到差值 q。由于临近像素之间相关性强, q 值非常小, 达到压缩编码的目的。
帧内预测编码
帧间预测编码
• 宏块分割:两帧之差的物体运动一般是刚体的平移运动,位移量 不大,往往把一帧图像分成若干个M*N的块。 • 运动估计:为当前图像的每个像素块在之前已编码图像中寻找一 个最佳匹配块。 • 运动补偿:根据运动矢量和帧间预测方法,求得当前帧的估计值。
全局搜索法
MV
在一个预先定义的搜索区域内,把它与参考帧中所有的候选块进行比较, 并且寻找具有最小匹配误差的一个。这两个块之间的位移就是所估计的 MV(Motion Vection,运动矢量)
上层块模式运动矢量
H.264标准中提供的可用块尺寸 有16×16 ,8×16,16×8,8×8 , 8×4 ,4×8 ,4×4 ,共七个, 可以看ቤተ መጻሕፍቲ ባይዱ7种分块模式
根据以上原则,找到它的上层块。然后用上 层块的运动矢量作为当前块的预测值
谢谢! 2018/7/23
相关文档
最新文档