第三章 视频基础知识
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.3 视频压缩的一些基本概念
• 视频压缩(compression)的目标是在尽可 能保证视觉效果的前提下减少视频数据率。 视频压缩比一般指压缩后的数据量与压缩 前的数据量之比。由于视频是连续的静态 图像,因此其压缩编码算法与静态图像的 压缩编码算法有某些共同之处,但是运动 的视频还有其自身的特性,因此在压缩时 还应考虑其运动特性才能达到高压缩的目 标。
3.2 数字视频的生成
• 数字视频有两种生成方式:
– 一是使用视频采集卡将模拟视频信号经计算机 模/数转换后,生成数字视频文件,对这些数 字视频文件进行数字化视频编辑,制作成数字 视频文件,利用这种方式处理后的图像和原图 像相比,信号有一定的损失; – 二是利用数字摄像机(硬盘式、光盘式和存储 卡式数字摄像机)将视频图像拍摄下来,从信 号源开始,就是无失真的数字视频,输入计算 机后,通过使用的编辑软件制作成数字视频文
• MPEG-2制定于1994年,是为高级工业标 准的图像质量以及更高的传输率而设计的。 这种格式主要应用在DVD和SVCD的制作 (压缩)方面,同时在一些HDTV(高清晰 电视广播)和一些高要求视频编辑、处理 上面也有较广的应用。使用MPEG-2的压缩 算法,可以把一部时长120分钟的电影压缩 到4~8GB。这种数字视频格式的文件扩展 名包括. mpg、.mpe、.mpeg、.m2V及
第三章 数字视频基础知识
3.1 视频的基础知识
在人类接受的信息中,有70%来自视觉, 其中视频是最直观、最具体、信息量最丰 富的。我们在日常生活中看到的电视、电 影、VCD、DVD以及用摄像机、手机等拍 摄的活动图像等都属于视频的范畴。
摄影机是指用胶片拍摄电影的机器,摄 像机是用磁带、光盘、硬盘等作为界质记 录活动影像的机器,广泛用于电视节目制 作、家庭及其他各个方面。 摄影机使用胶片和机械装置记录活动 影像,所采用的是光学和化学记录方式, 摄象机是采用电子记录方式。
4.RMVB格式
• RMVB格式是一种由RM视频格式升级延伸 出的新视频格式,它的先进之处在于RMVB 视频格式打破了原先RM格式那种平均压缩 采样的方式,在保证平均压缩比的基础上 合理利用比特率资源,也就是说,静止和 动作场面少的画面场景采用较低的编码速 率,这样可以留出更多的带宽空间,而这 些带宽会在出现快速运动的画面场景时被 利用。这样在保证了静止画面质量的前提
• 帧内和帧间压缩
– 帧内压缩也称为空间压缩。当压缩一帧图像时,仅 考虑本帧的数据而不考虑相邻帧之间的冗余信息, 这实际上与静态图像压缩类似。帧内一般采用有损 压缩算法,由于帧内压缩时各个帧之间没有相互关 系,所以压缩后的视频数据仍可以以帧为单位进行 编辑。帧内压缩一般达不到很高的压缩。 – 采用帧间压缩是基于许多视频或动画的连续前后两 帧具有很大的相关性,或者说前后两帧信息变化很 小的特点。也即连续的视频其相邻帧之间具有冗余 信息,根据这一特性,压缩相邻帧之间的冗余量就 可以进一步提高压缩量,减小压缩比。帧间压缩也 称为时间压缩,它通过比较时间轴上不同帧之间的 数据进行压缩。帧间压缩一般是无损的。帧差值算 法是一种典型的时间压缩法,它通过比较本帧与相
• 3.对称和不对称编码
– 对称性是压缩编码的一个关键特征。对称意味 着压缩和解压缩占用相同的计算处理能力和时 间,对称算法适合于实时压缩和传送视频,如 视频会议应用就以采用对称的压缩编码算法为 好。而在电子出版和其它多媒体应用中,一般 是把视频预先压缩处理好,尔后再播放,因此 可以采用不对称编码。不对称或非对称意味着 压缩时需要花费大量的处理能力和时间,而解 压缩时则能较好地实时回放,也即以不同的速 度进行压缩和解压缩。一般地说,压缩一段视 频的时间比回放(解压缩)该视频的时间要多 得多。例如,压缩一段三分钟的视频片断可能
• MPEG-1制定于1992年,它是针对1.5Mbps 以下数据传输率的数字存储媒体运动图像 及其伴音编码而设计的国际标准。使用 MPEG-1的压缩算法,可以把一部时长120 分钟的电影(视频文件)压缩到1.2GB左右。 这种数字视频格式的文件扩展名包 括.mpg、.mlv、.mpe、.mpeg以及VCD光 盘中的.dat等。
三种彩色电视制式的主要技术指标
TV制式 帧频(Hz) 行/帧
亮度带宽(MHz)
NTSC 30 525 4.2
PAL 25 625 6.0 4.43
SECAM 25 625 6.0 4.25
彩色幅载波 3.58 (Hz)
声音载波 (MHz)
4.5
6.5
6.5
4.视频分辨率
• 视频分辨率指的是视频的画面大小,常用 图像的“水平像素×垂直像素”来表示。
2.MPEG格式
• MPEG(Moving Pictures Experts Group, 动态图像专家组)是1988年成立的一个专 家组,其任务是负责制订有关运动图像和 声音的压缩、解压缩、处理以及编码表示 的国际标准。MPEG格式是采用了有损压缩 方法从而减少运动图像中的冗余信息的数 字视频文件格式。目前MPEG格式有三个压 缩标准,分别是MPEG -1 、MPEG-2、和 MPEG-4。
– VCD视频光盘的标准分辨率为352×288(PAL) 或352×240(NTSC); – SVCD视频光盘的标准分辨率为480×576 (PAL)或480×480(NTSC); – DVD视频光盘的标准分辨率为720×576(PAL) 或720×480(NTSC)。 – 普通电视信号的分辨率为640×480;标清电视 信号分辨率为720×576;
• 有损和无损压缩
– 在视频压缩中有损和无损的概念与静态图像中 基本类似。无损压缩也即压缩前和解压缩后的 数据完全一致。多数的无损压缩都采用RLE行 程编码算法。有损压缩意味着解压缩后的数据 与压缩前的数据不一致。在压缩的过程中要丢 失一些人眼和人耳所不敏感的图像或音频信息, 而且丢失的信息不可恢复。几乎所有高压缩的 算法都采用有损压缩,这样才能达到低数据率 的目标。丢失的数据率与压缩比有关,压缩比 越小,丢失的数据越多,解压缩后的效果一般 越差。此外,某些有损压缩算法采用多次重复 压缩的方式,这样还会引起额外的数据丢失。
• 视频信号具有以下特点:
–内容随时间而变化 –有与画面动作同步的声音(伴音)
• 图像与视频是两个既有联系又有区别的概 念:静止的图片称为图像(Image),运动的 图像称为视频(Video)。 • 图像与视频两者的信源方式不同,图像的 输入靠扫描仪、数字照相机等设备;视频 的输入是电视接收机、摄象机、录象机、 影碟机以及可以输出连续图像信号的设备。
直接广播卫星(DBS)
数字化视频的优点 • 适合于网络应用
– 在网络环境中,视频信息可方便地实现资源共 享。视频数字信号便于长距离传输。
• 再现性好
– 模拟信号由于是连续变化的,所以不管复制时 精确度多高,失真不可避免,经多次复制后, 误差就很大。数字视频可不失真地进行无限次 拷贝,其抗干扰能力是模拟图像无法比拟的。 它不会因存储、传输和复制而产生图像质量的 退化,能准确再现图像。
• 便于计算机编辑处理
– 模拟信号只能简单调整亮度、对比度和颜色等, 限制了处理手段和应用范围。而数字视频信号 可以传送到计算机内进行存储、处理,很容易 进行创造性地编辑与合成,并进行交互。
数字视频的不足 • 数字视频的缺陷是处理速度慢,数据存储 空间大,数字图像处理成本高。 • 通过对数字视频的压缩,可以节省大量存 储空间,光盘技术的应用也使得大量视频 信息的存储成为可能。
• MPEG-4制定于1998年,是为播放流式媒 体的高质量视频而专门设计的,它可利用 很窄的带度,通过帧重建技术,压缩和传 输数据,以求使用最少的数据获得最佳的 图像质量。MPEG-4能够保存接近于DVD画 质的小体积视频文件,还包括了以前MPEG 压缩标准所不具备的比特率的可伸缩性、 动画精灵、交互性甚至版权保护等一些特 殊功能。使用MPEG-4的压缩算法的ASF格
模拟视频的数字化过程
• 首先将来自录像机、摄像机、激光视盘的 模拟视频信号通过模数(A/D)转换器的变 换,使模拟信号变换为一系列由0、1组成 的二进制数,送到多制式数字解码器进行 解码得到Y、U、V数据,然后通过控制软 件的视频窗口进行参数设置后存储在硬盘 上。 • 通过这个过程得到的视频信号称之为数字 视频,这是一次革命性的变化,因为视频
数字视频
• 要使计算机能对视频进行处理,必须把视 频源即来自于电视机、模拟摄像机、录像 机、影碟机等设备的模拟视频信号转换成 计算机要求的数字视频形式,这个过程称 为视频的数字化过程。
– 数字视频可大大降低视频的传输和存储费用、 增加交互性、带来精确稳定的图像。 – 如今,数字视频的应用已非常广泛。包括直接 广播卫星(DBS)、有线电视(如图5.2)、数字电 视在内的各种通信应用均需要采用数字视频。
• 模拟视频的特点:
– 以模拟电信号的形式来记录 – 依靠模拟调幅的手段在空间传播 – 使用磁带录象机将视频作为模拟信号存放在磁 带上
• 传统视频信号以模拟方式进行存储和传送 然而模拟视频不适合网络传输,在传输效 率方面先天不足,而且图像随时间和频道 的衰减较大,不便于分类、检索和编辑。
传统的模拟信号处理设备
3.RM格式
• RM(RealMedia)格式是Networks公司所 制定的音频视频压缩规范。用户可以使用 RealPlayer或 RealOnePlayer对符合 RealMedia技术规范的网络音频/视频资源 进行实况转播,并且RealMedia还可以根据 不同的网络传输速率制定出不同的压缩比 率,从而实现在低速率的网络上进行影像 数据实时传送和播放。这种数字视频格式 的文件扩展名包括.rm、.ra和.ram。
1 视频的定义
• 视频(Video)就其本质而言,是源自文库容随时间 变化的一组动态图像(25或30帧/秒),所以 视频又叫作运动图像或活动图像。 • 一帧就是一幅静态画面,快速连续地显示 帧,便能形运动的图像,每秒钟显示帧数 越多,即帧频越高,所显示的动作就会越 流畅。
pal: 25帧/秒 ntsc:30帧/秒
『视觉暂留现象』
• 人眼在观察景物时,光信号传人大脑神经, 需经过一段短暂的时间,光的作用结束后, 视觉形象并不立即消失,这种残留的视觉 称“后像”,视觉的这一现象则被称为 “视觉暂留现象”。
– 具体应用是电影的拍摄和放映。 – 人眼的视觉视觉暂留时间一般约为0.1秒。 – 根据实验人们发现要想看到连续不闪烁的画面, 帧与帧之间的时间间隔最少要达到是二十四分
2.视频的分类
• 按照处理方式的不同,视频分为模拟视频 和数字视频。 • 模拟视频(Analog Video)
– 模拟视频是用于传输图像和声音的随时间连续 变化的电信号。早期视频的记录、存储和传输 都采用模拟方式,如在电视上所见到的视频图 像是以一种模拟电信号的形式来记录的,并依 靠模拟调幅的手段在空间传播,再用盒式磁带 录像机将其作为模拟信号存放在磁带上。
3.4 常见的数字视频文件格式
1. AVI格式
AVI(Audio Video Interleaved ,音频 视频交错)格式是一种可以将视频和音频交 织在一起进行同步播放的数字视频文件格式。 AVI格式由Microsoft公司于1992年推出,随 Windows3.1一起被人们所认识和熟知。它采 用的压缩算法没有统一的标准,除Microsoft 公司之外,其他公司也推出有自己的压缩算 法,只要把该算法的驱动加到Windows系统 中,就可以播放该算法压缩的AVI文件。AVI 格式的优点是图像质量好,可以跨多个平台
3.视频的制式
NTSC制式
电视 制式
PAL制式
SECAM制式
• NTSC制在美国、日本和加拿大被广为使用, NTSC制式的视频图像为每秒30帧,每帧525 行; • PAL制主要被中国、澳大利亚和大部分西欧 国家采用,PAL制式的视频画面为每秒25帧, 每帧625行; • SECAM制主要在法国、中东和东欧一些国家 使用,SECAM制式的视频画面为每秒25帧, 每帧625行。