第三章视频基础知识

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

3.3 视频压缩的一些基本概念
• 视频压缩（compression）的目标是在尽可能保证视觉效果的前提下减少视频数据率。视频压缩比一般指压缩后的数据量与压缩前的数据量之比。由于视频是连续的静态图像，因此其压缩编码算法与静态图像的压缩编码算法有某些共同之处，但是运动的视频还有其自身的特性，因此在压缩时还应考虑其运动特性才能达到高压缩的目标。
3.2 数字视频的生成
• 数字视频有两种生成方式：
– 一是使用视频采集卡将模拟视频信号经计算机模／数转换后，生成数字视频文件，对这些数字视频文件进行数字化视频编辑，制作成数字视频文件，利用这种方式处理后的图像和原图像相比，信号有一定的损失； – 二是利用数字摄像机（硬盘式、光盘式和存储卡式数字摄像机）将视频图像拍摄下来，从信号源开始，就是无失真的数字视频，输入计算机后，通过使用的编辑软件制作成数字视频文
• MPEG-2制定于1994年，是为高级工业标准的图像质量以及更高的传输率而设计的。这种格式主要应用在DVD和SVCD的制作（压缩）方面，同时在一些HDTV（高清晰电视广播）和一些高要求视频编辑、处理上面也有较广的应用。使用MPEG-2的压缩算法，可以把一部时长120分钟的电影压缩到4～8GB。这种数字视频格式的文件扩展名包括. mpg、．mpe、.mpeg、.m2V及
第三章数字视频基础知识
3.1 视频的基础知识
在人类接受的信息中，有70%来自视觉，其中视频是最直观、最具体、信息量最丰富的。我们在日常生活中看到的电视、电影、VCD、DVD以及用摄像机、手机等拍摄的活动图像等都属于视频的范畴。
摄影机是指用胶片拍摄电影的机器，摄像机是用磁带、光盘、硬盘等作为界质记录活动影像的机器，广泛用于电视节目制作、家庭及其他各个方面。摄影机使用胶片和机械装置记录活动影像，所采用的是光学和化学记录方式，摄象机是采用电子记录方式。
4.RMVB格式
• RMVB格式是一种由RM视频格式升级延伸出的新视频格式，它的先进之处在于RMVB 视频格式打破了原先RM格式那种平均压缩采样的方式，在保证平均压缩比的基础上合理利用比特率资源，也就是说，静止和动作场面少的画面场景采用较低的编码速率，这样可以留出更多的带宽空间，而这些带宽会在出现快速运动的画面场景时被利用。这样在保证了静止画面质量的前提
• 帧内和帧间压缩
– 帧内压缩也称为空间压缩。当压缩一帧图像时，仅考虑本帧的数据而不考虑相邻帧之间的冗余信息，这实际上与静态图像压缩类似。帧内一般采用有损压缩算法，由于帧内压缩时各个帧之间没有相互关系，所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩。 – 采用帧间压缩是基于许多视频或动画的连续前后两帧具有很大的相关性，或者说前后两帧信息变化很小的特点。也即连续的视频其相邻帧之间具有冗余信息，根据这一特性，压缩相邻帧之间的冗余量就可以进一步提高压缩量，减小压缩比。帧间压缩也称为时间压缩，它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。帧差值算法是一种典型的时间压缩法，它通过比较本帧与相
• 3.对称和不对称编码
– 对称性是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间，对称算法适合于实时压缩和传送视频，如视频会议应用就以采用对称的压缩编码算法为好。而在电子出版和其它多媒体应用中，一般是把视频预先压缩处理好，尔后再播放，因此可以采用不对称编码。不对称或非对称意味着压缩时需要花费大量的处理能力和时间，而解压缩时则能较好地实时回放，也即以不同的速度进行压缩和解压缩。一般地说，压缩一段视频的时间比回放（解压缩）该视频的时间要多得多。例如，压缩一段三分钟的视频片断可能
• MPEG-1制定于1992年，它是针对1.5Mbps 以下数据传输率的数字存储媒体运动图像及其伴音编码而设计的国际标准。使用 MPEG-1的压缩算法，可以把一部时长120 分钟的电影（视频文件）压缩到1.2GB左右。这种数字视频格式的文件扩展名包括.mpg、.mlv、.mpe、.mpeg以及VCD光盘中的.dat等。
三种彩色电视制式的主要技术指标
TV制式帧频(Hz) 行/帧
亮度带宽(MHz)
NTSC 30 525 4.2
PAL 25 625 6.0 4.43
SECAM 25 625 6.0 4.25
彩色幅载波 3.58 (Hz)
声音载波 (MHz)
4.5
6.5
6.5
4.视频分辨率
• 视频分辨率指的是视频的画面大小，常用图像的“水平像素×垂直像素”来表示。
2.MPEG格式
• MPEG（Moving Pictures Experts Group，动态图像专家组）是1988年成立的一个专家组，其任务是负责制订有关运动图像和声音的压缩、解压缩、处理以及编码表示的国际标准。MPEG格式是采用了有损压缩方法从而减少运动图像中的冗余信息的数字视频文件格式。目前MPEG格式有三个压缩标准，分别是MPEG -1 、MPEG-2、和 MPEG-4。
– VCD视频光盘的标准分辨率为352×288（PAL）或352×240(NTSC)； – SVCD视频光盘的标准分辨率为480×576 （PAL）或480×480（NTSC）； – DVD视频光盘的标准分辨率为720×576（PAL）或720×480(NTSC)。 – 普通电视信号的分辨率为640×480；标清电视信号分辨率为720×576；
• 有损和无损压缩
– 在视频压缩中有损和无损的概念与静态图像中基本类似。无损压缩也即压缩前和解压缩后的数据完全一致。多数的无损压缩都采用RLE行程编码算法。有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息，而且丢失的信息不可恢复。几乎所有高压缩的算法都采用有损压缩，这样才能达到低数据率的目标。丢失的数据率与压缩比有关，压缩比越小，丢失的数据越多，解压缩后的效果一般越差。此外，某些有损压缩算法采用多次重复压缩的方式，这样还会引起额外的数据丢失。
• 视频信号具有以下特点：
–内容随时间而变化 –有与画面动作同步的声音(伴音)
• 图像与视频是两个既有联系又有区别的概念：静止的图片称为图像(Image)，运动的图像称为视频(Video)。 • 图像与视频两者的信源方式不同，图像的输入靠扫描仪、数字照相机等设备；视频的输入是电视接收机、摄象机、录象机、影碟机以及可以输出连续图像信号的设备。
直接广播卫星(DBS)
数字化视频的优点 • 适合于网络应用
– 在网络环境中，视频信息可方便地实现资源共享。视频数字信号便于长距离传输。
• 再现性好
– 模拟信号由于是连续变化的，所以不管复制时精确度多高，失真不可避免，经多次复制后，误差就很大。数字视频可不失真地进行无限次拷贝，其抗干扰能力是模拟图像无法比拟的。它不会因存储、传输和复制而产生图像质量的退化，能准确再现图像。
• 便于计算机编辑处理
– 模拟信号只能简单调整亮度、对比度和颜色等，限制了处理手段和应用范围。而数字视频信号可以传送到计算机内进行存储、处理，很容易进行创造性地编辑与合成，并进行交互。
数字视频的不足 • 数字视频的缺陷是处理速度慢，数据存储空间大，数字图像处理成本高。 • 通过对数字视频的压缩，可以节省大量存储空间，光盘技术的应用也使得大量视频信息的存储成为可能。
• MPEG-4制定于1998年，是为播放流式媒体的高质量视频而专门设计的，它可利用很窄的带度，通过帧重建技术，压缩和传输数据，以求使用最少的数据获得最佳的图像质量。MPEG-4能够保存接近于DVD画质的小体积视频文件，还包括了以前MPEG 压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权保护等一些特殊功能。使用MPEG-4的压缩算法的ASF格
模拟视频的数字化过程
• 首先将来自录像机、摄像机、激光视盘的模拟视频信号通过模数（A/D）转换器的变换，使模拟信号变换为一系列由0、1组成的二进制数，送到多制式数字解码器进行解码得到Y、U、V数据，然后通过控制软件的视频窗口进行参数设置后存储在硬盘上。 • 通过这个过程得到的视频信号称之为数字视频，这是一次革命性的变化，因为视频
数字视频
• 要使计算机能对视频进行处理，必须把视频源即来自于电视机、模拟摄像机、录像机、影碟机等设备的模拟视频信号转换成计算机要求的数字视频形式，这个过程称为视频的数字化过程。
– 数字视频可大大降低视频的传输和存储费用、增加交互性、带来精确稳定的图像。 – 如今，数字视频的应用已非常广泛。包括直接广播卫星(DBS)、有线电视(如图5.2)、数字电视在内的各种通信应用均需要采用数字视频。
• 模拟视频的特点：
– 以模拟电信号的形式来记录 – 依靠模拟调幅的手段在空间传播 – 使用磁带录象机将视频作为模拟信号存放在磁带上
• 传统视频信号以模拟方式进行存储和传送然而模拟视频不适合网络传输，在传输效率方面先天不足，而且图像随时间和频道的衰减较大，不便于分类、检索和编辑。
传统的模拟信号处理设备
3.RM格式
• RM（RealMedia）格式是Networks公司所制定的音频视频压缩规范。用户可以使用 RealPlayer或 RealOnePlayer对符合 RealMedia技术规范的网络音频/视频资源进行实况转播，并且RealMedia还可以根据不同的网络传输速率制定出不同的压缩比率，从而实现在低速率的网络上进行影像数据实时传送和播放。这种数字视频格式的文件扩展名包括.rm、.ra和.ram。
1 视频的定义
• 视频(Video)就其本质而言，是源自文库容随时间变化的一组动态图像(25或30帧/秒)，所以视频又叫作运动图像或活动图像。 • 一帧就是一幅静态画面，快速连续地显示帧，便能形运动的图像，每秒钟显示帧数越多，即帧频越高，所显示的动作就会越流畅。
pal: 25帧/秒 ntsc:30帧/秒
『视觉暂留现象』
• 人眼在观察景物时，光信号传人大脑神经，需经过一段短暂的时间，光的作用结束后，视觉形象并不立即消失，这种残留的视觉称“后像”，视觉的这一现象则被称为 “视觉暂留现象”。
– 具体应用是电影的拍摄和放映。 – 人眼的视觉视觉暂留时间一般约为0.1秒。 – 根据实验人们发现要想看到连续不闪烁的画面，帧与帧之间的时间间隔最少要达到是二十四分
2.视频的分类
• 按照处理方式的不同，视频分为模拟视频和数字视频。 • 模拟视频（Analog Video）
– 模拟视频是用于传输图像和声音的随时间连续变化的电信号。早期视频的记录、存储和传输都采用模拟方式，如在电视上所见到的视频图像是以一种模拟电信号的形式来记录的，并依靠模拟调幅的手段在空间传播，再用盒式磁带录像机将其作为模拟信号存放在磁带上。
3.4 常见的数字视频文件格式
1. AVI格式
AVI（Audio Video Interleaved ，音频视频交错）格式是一种可以将视频和音频交织在一起进行同步播放的数字视频文件格式。 AVI格式由Microsoft公司于1992年推出，随 Windows3.1一起被人们所认识和熟知。它采用的压缩算法没有统一的标准，除Microsoft 公司之外，其他公司也推出有自己的压缩算法，只要把该算法的驱动加到Windows系统中，就可以播放该算法压缩的AVI文件。AVI 格式的优点是图像质量好，可以跨多个平台
3.视频的制式
NTSC制式
电视制式
PAL制式
SECAM制式
• NTSC制在美国、日本和加拿大被广为使用， NTSC制式的视频图像为每秒30帧，每帧525 行； • PAL制主要被中国、澳大利亚和大部分西欧国家采用，PAL制式的视频画面为每秒25帧，每帧625行； • SECAM制主要在法国、中东和东欧一些国家使用，SECAM制式的视频画面为每秒25帧，每帧625行。

第三章 视频基础知识

第三章视频基础知识