视频编解码-帧内预测和帧间预测

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

运动矢量中值预测
• 对于除了块尺寸为 16×8 和 8×16 的块来说， MVp 是块 A、 B 和 C 的运动矢量的中值； • 对于 16×8 块来说，上方的 16×8 块的 MVp 根据 B 预测得到，下方的 16×8 块的 MVp 根据 A得到； • 对于 8×16 块来说，左侧的 16×8 块的 MVp 根据 A 预测得到，右侧的 16×8 块的 MVp 根据 C得到
帧间预测方法
单向预测、双向预测和重叠块补偿
有时，不只是利用前一帧像素预测，还需利用后一帧像素。特别是 t-1 帧尚未暴露而 t+1 帧已呈现出来的区域
采用 OBMC 时，一个像素的预测不仅基于它所属的 MV 估计，还基于其相邻的 MV 估计
运动矢量的预测
MV
如果对每个块的运动矢量进行编码，那么将花费相当数目的比特数，特别是如果选择小尺寸的块的时候。由于一个运动物体会覆盖多个分块，所以空间域相邻块的运动矢量具有很强的相关性，因此，每个运动矢量可以根据邻近先前已编码的块进行预测。
三步搜索法（绝对误差均值(MAD)最小准则)
一个 16×16 搜索区中心点，以搜索区最大搜索长度的一半为步长，计算中心点及周围8个邻近点的 MAD 值，再以最小MAD点为中心，步长减为原来的一半，依次类推，到了第三步，再把步长减半，计算 MAD 值，其中 MAD 最小点运动矢量即为所求的值。
X(n) 为当前像素的实际值， p(n) 为其预测值， d(n) 为差值。该差值经量化后得到残差量化值 q(n)。预测值 p(n)经预测器得到，预测器输入为已存储在预测器内前面的各像素，和当前值，它们的加权和即为下一个预测器输出。
帧内预测编码
解码输出 e’(n)与原始信号 e(n)之间有个因量化而产生的量化误差
视频编解码学习报告
为什么需要视频编码？
一秒钟1080P视频的数据量
帧率 30帧/s 每帧大小 1920*1080像素 Bit/像素 24（R/G/B）数据量 177.9M
为什么可以视频编码？
空间冗余：
时间冗余：
为什么可以视频编码？
结构冗余：结构冗余是在某些场景中，存在着明显的图像分布模式。出现或相近的纹理结构，结构可以通过特定的过程来生成。例如：方格状的地板，蜂窝，砖墙，草席等图结构上存在冗余。视觉冗余：视觉冗余是人类的视觉系统对图像场的敏感性是非均匀和非线性的。对亮度变化敏感，而对色度的变化相对不敏感；对物体边缘敏感，内部区域相对不敏感；对整体结构敏感，而对内部细节相对不敏感。可以根据这些视觉特性对图像信息进行取舍。
编码端： X – P = q 解码端： P + q = X
帧内预测编码
C: 200 A: 201 B:202 X:202 D:204 E:198 F:203
编码端： X – P = q 解码端： P + q = X 1 11001001
帧内预测编码
编码端： X – P = q 解码端： P + q = X
帧内预测编码
左图给出了大量统计后差值信号的概率分布，一般说图像中平坦区域比突变区域多得多，例如人脸中，只有眼睛、鼻子、嘴等少量地方细节出现，其余则为平坦或缓变区域。
帧内预测编码
人眼视觉特性实验表明，在亮度突变部分，量化误差大些不会使人眼敏感，可采取粗量化（量化节距大）；反之，在亮度变化缓慢区域，则应取细量化。总之，利用人眼这种掩盖效应采用非线性（不均匀）量化，可使总码率有所下降。
帧内预测编码
预测编码，是在压缩编码后传输的并不是像素本身的取样幅值，而是该取样的预测值和实际值之差。例如：当前像素为 X，其左邻近像素为 A，上邻近像素为 B，上左邻近像素为 C 等。显然与 X 之间的距离近的像素，相关性强。按与 X 的距离不同给以不同的权值，把这些像素的加权和作为 X的预测值P，与实际值相减，得到差值 q。由于临近像素之间相关性强， q 值非常小，达到压缩编码的目的。
帧内预测编码
帧间预测编码
• 宏块分割：两帧之差的物体运动一般是刚体的平移运动，位移量不大，往往把一帧图像分成若干个M*N的块。 • 运动估计：为当前图像的每个像素块在之前已编码图像中寻找一个最佳匹配块。 • 运动补偿：根据运动矢量和帧间预测方法，求得当前帧的估计值。
全局搜索法
MV
在一个预先定义的搜索区域内，把它与参考帧中所有的候选块进行比较，并且寻找具有最小匹配误差的一个。这两个块之间的位移就是所估计的 MV（Motion Vection，运动矢量）
上层块模式运动矢量
H.264标准中提供的可用块尺寸有16×16 ，8×16，16×8，8×8 ， 8×4 ，4×8 ，4×4 ，共七个，可以看ቤተ መጻሕፍቲ ባይዱ7种分块模式
根据以上原则，找到它的上层块。然后用上层块的运动矢量作为当前块的预测值
谢谢! 2018/7/23