多媒体介绍

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

MultiMedia(多媒体)
一般理解为多种媒体的综合。

多媒体是计算机和视频技术的结合,实际上它是两个媒体,图像和声音,即图像和声音的数字化。

图片数字化:
像数是构成影像的最小单位,每个图片都是由若干个像数所组成。

每个像素的颜色可以用它的色调,饱和度,和亮度来表示,但是通常用红绿蓝(RGB)来表示。

一个像素所能表达的不同颜色数取决于比特每像素(BPP)。

这个最大数可以通过取二的色彩深度次幂来得到。

比如8 bpp [2^8=256;(256色)]; 16 bpp [2^16=65536; (65,536色,称为高彩色)]; 24 bpp [2^24=16777216; (16,777,216色,称为真彩色)];
常见的图像格式有:
BMP:Windows 位图,BMP 不支持压缩,所以文件比较大,PC机上最常用的位图格式。

JPG: 是一种有损压缩格式,支持多种压缩级别,对于同一幅画面,JPG格式存储的文件是其他类型图形文件的1/10到1/20,而且色彩数最高可达到24位.是目前网络上最流行的图像格式。

PNG:是网上接受的最新图像文件格式,支持高级别无损耗压缩。

GIF:GIF的图像深度从1bit到8bit,即GIF最多支持256种色彩的图像。

GIF格式的另一个特点是其在一个GIF文件中可以存多幅彩色图像,如果把存于一个文件中的多幅图像数据逐幅读出并显示到屏幕上,就可构成一种最简单的动画。

PCD(Photo CD):由KODAK公司开发,其它软件系统对其只能读取。

PSD(Photoshop standard):Photoshop中的标准文件格式,专门为Photoshop而优化的格式。

CDR(CorelDraw):CorelDraw的文件格式。

其他的格式还有:DIB , PCP, DIF , WMF ,TIF , EPS , IFF , TGA , MPT 等。

音频数字化:
通常我们采用的是脉冲代码调制编码,即PCM(Pulse Code Modulation)编码。

PCM 通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。

采样精度:即一秒钟的采样次数,最常用的采样精度是44.1kHz,它的意思是每秒取样44100次,有时还会使用48kHz甚至96kHz。

比特率:比特率反映声音的响度级别。

最常用的有16比特、20比特或24比特。

16比特就是指把波形的振幅划为2^16即65536个等级。

码率:采样率值×采样大小值×声道数 bps
常见的音频编码格式:
CDDA: 一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息。

标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数. WAV :是微软公司开发的一种声音文件格式,支持多种音频位数、采样频率和声道,标准格式的WAV文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数。

有损音频压缩:
采用CDDA的PCM编码的音频流码率为44.1K×16×2 =1411.2 Kbps,将码率除
以8,就可以得到这个音频流的数据速率,即176.4KB/s。

这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB 的空间,1分钟则约为10.34M。

这对大部分用户是不可接受的,所以需要压缩。

DOLBY:
AC3:DOLBY公司研发的一种音频编码技术,支持5.1CH。

常用于DVD碟片中的音频编码,成为DVD音频中的标准。

Dolby Digital Plus:简称DD Plus或者DD+,DD+音轨相比AC3主要是支持了
7.1音轨,而且最高码率进行了提高。

DD True HD:是DOLBY公司最新的一种无损压缩音轨。

DTS:
DTS是“Digital Theatre System”的缩写,是“数字化影院系统”的意思, 同样支持5.1CH,而最新的DTS-HD则支持7.1音轨,码率可以做得非常高。

现在这些音频编码技术也常用于高清的视频当中,如数字电视节目上。

MPEG:
Moving Picture Experts Group,是动态图象专家组的英文缩写。

这个专家组始建于1988年,专门负责为CD建立视频和音频压缩标准, MPEG音频文件指的是MPEG标准中的声音部分即MPEG音频层,分为3层,分别对应“*.mp1”/“*.mp2”
/“*.mp3”这3种声音文件。

VCD上的音频编码就是MPEG Audio Layer-2.
MP3:
即MEPG Audio Layer-3, 是MPEG1的衍生编码方案,目前最为普及的音频压缩格式, MP3可以做到12:1的惊人压缩比并保持基本可听的音质,MP3的音频压缩是一种有损压缩,MP3的码率有很多种,可以用64Kbp来节省空间,也可以用320Kbps 的标准达到极高的音质。

采用缺省的CBR(固定采样频率)技术可以以固定的频率采样一首歌曲,而VBR(可变采样频率)则可以在音乐“忙”的时候加大采样的频率获取更高的音质。

WMA:
全称Windows Media Audio,来自微软,WMA的压缩率一般都可以达到1:18左右,和以往的编码不同,WMA支持防复制功能,她支持通过Windows Media Rights Manager 加入保护,可以限制播放时间和播放次数甚至于播放的机器等等.
RA:
RA就是RealAudio格式.
OGG:
全称应该是OGG Vorbis,是一种新的音频压缩格式,类似于MP3等音乐格式。

但有一点不同的是,它是完全免费、开放和没有专利限制的。

OGG有一个特点是支持多声道,OGG也是对音频进行有损压缩编码,但通过使用更加先进的声学模型去减少损失,因此,相同码率编码OGG比MP3音质更好一些,文件也更小一些。

无损音频压缩:
FLAC:自由无损音频格式
APE:最有前途的网络无损格式
其它的音频编码格式还有:AU, MIDI, MPC等。

视频编解码技术:
即用于实现模拟信息与数字信号之间的转换
编码(Encode)是将模拟信息转换为数字信号的过程,通常采用脉码调制技术
(PCM)予以实现。

解码(Decode)则指将数字信号还原为模拟信息的逆过程。

所谓视频编码方式就是指通过特定的压缩技术,将某个视频格式的文件转换成另
一种视频格式文件的方式。

前视频流传输中最为重要的编解码标准有国际电联的
H.261、H.263、H.264,运动静止图像专家组的M-JPEG和国际标准化组织运动图
像专家组的MPEG系列标准,此外在互联网上被广泛应用的还有Real-Networks
的RealVideo、微软公司的WMV以及Apple公司的QuickTime等。

首先要分清楚媒体文件和编码的区别:文件是既包括视频又包括音频、甚至还
带有脚本的一个集合,也可以叫容器;
文件当中的视频和音频的压缩算法才是具体的编码。

也就是说一个.avi文件,
当中的视频可能是编码a,也可能是编码b,音频可能是编码5,也可能是编码6,具体的用那种编码的解码器,则由播放器按照avi文件格式读取信息去调用了。

音频视频编码方案有很多,目前常见的音频视频编码有以下几类:
MPEG系列
(由ISO[国际标准组织机构]下属的MPEG[运动图像专家组]开发)视频编码方
面主要是Mpeg1(VCD用的就是它)、Mpeg2(DVD使用)、Mpeg4(现在的DVDRIP
使用的都是它的变种,如:DIVX,XVID等)、Mpeg4 AVC(现在正热门);音频
编码方面主要是MPEG Audio Layer 1/2、MPEG Audio Layer 3(大名鼎鼎的mp3)、MPEG-2 AAC 、MPEG-4 AAC等等。

注意:DVD音频没有采用Mpeg的。

H.26X系列
(由ITU[国际电信联盟远程通信标准化组织]主导,侧重网络传输,注意:只是
视频编码)
包括H.261、H.262、H.263、H.263+、H.263++、H.264(就是MPEG4 AVC-合作的
结晶)
MPEG1: 早期VCD使用,分辨率是352*288,压缩比低.
MPEG2: 一般DVD使用,有NTSC(720*480)和PAL (720*576)压缩比高于mpeg1 MPEG3:原本针对于HDTV(1920×1080),后来被MPEG-2代替。

MPEG4:目前使用最多的技术,AVI文件始祖,大大提高压缩比,而质量堪比DVD. DIVX:基于MPEG4开发的,有一定算法优化,DIVX 3.11(DRM),专利保护。

XVID:DIVX技术封锁之后被人破解开发的,也是基于mpeg4的,编码技术更先进,采用开放源码,画质更好。

其中H.262/MPEG-2和H.264/MPEG-4 AVC由ITU-T与MPEG联合制定
H.262和MPEG-2第二部分内容相同, H.264和MPEG-4第十部分内容相同
H.264
是由ITU-T 的VCEG(视频编码专家组)和ISO/IEC 的MPEG(活动图像编码专家
组)联合组建的联合视频组(JVT:joint video team)提出的一个新的数字视
频编码标准,它既是ITU-T 的H.264,又是ISO/IEC 的MPEG-4 的第10 部分。

而国内业界通常所说的MPEG-4 是MPEG-4 的第2 部分。

即:
H.264=MPEG-4(第十部分,也叫ISO/IEC 14496-10)=MPEG-4 AVC
因此,不论是MPEG-4 AVC、MPEG-4 Part 10,还是ISO/IEC 14496-10,都是指
H.264。

H.264也是MPEG-4的一部分。

H.264 使图像压缩技术上升到了一个更高的阶段,能够在较低带宽上提供高质量
的图像传输,该优点非常适合运营商用户量大、接入网/骨干网带宽相对有限的
状况。

在同等的画质下,H.264 比上一代编码标准MPEG2 平均节约64%的传输
码流,而比MPEG4 ASP 要平均节约39%的传输码流,所以现在十分火热,应用也
非常广泛:
蓝光DVD——新一代高清DVD标准,以H.264进行视频压缩。

高清电视——日本广播电视公司、欧洲DVB Steering Board、美国数字电视的
卫星传送等机构都已决定采纳H.264标准,中国电信也将H.264作为其网络数字
电视平台的编解码标准。

移动电视——正在我国全面铺开的CMMB移动电视采用H.264视频压缩解码。

网络视频——全球最大的视频2.0网站YouTube正在逐渐将其视频转换为H.264
编码,土豆网高清版采用H.264标准,Adobe发布的Flash最新版宣布支持H.264。

中国互联网广泛传播的高清电影、电视剧中,H.264为使用最广泛的压缩编码,
几乎占高清总视频量的一半.
此外由于SONY PSP、苹果的iPod系列等中终端设备支持H.264解码,所以网上
还流行着大批非高清H.264影视节目视频文件。

Real-Networks公司的RealVideo编码:
RV10 RV13 RV20 RV30 RV40 RV50, RV60, RM8, RM9, RM10等。

Microsoft公司的WMV编码:
WMV3, WMV4, WMV 7、WMV 8、WMV 9、WPV 10等。

Apple公司的Quicktime编码。

封装格式:
所谓封装格式就是将已经编码压缩好的视频轨和音频轨按照一定的格式放到一
个文件中,也就是说仅仅是一个外壳,或者大家把它当成一个放视频轨和音频轨
的文件夹也可以。

说得通俗点,视频轨相当于饭,而音频轨相当于菜,封装格式
就是一个碗,或者一个锅,用来盛放饭菜的容器。

常用的封装格式有:
AVI:
AVI是微软1992年推出用于对抗苹果Quicktime的技术,尽管国际学术界公认
AVI已经属于被淘汰的技术,但是由于windows的通用性,和简单易懂的开发API,
还在被广泛使用。

AVI的文件结构、分为头部, 主体和索引三部分. 主体中图像
数据和声音数据是交互存放的。

从尾部的索引可以索引跳到自己想放的位置。

AVI
本身只是提供了这么一个框架,内部的图像数据和声音顺据格式可以是任意的编
码形式。

因为索引放在了文件尾部,所以在播internet流媒体时已属力不从心。

很简单的例子,从网络上下载的片子,如果没有下载完成,是很难正常播放出来。

TS:
原始的模拟视频采用MPEG2数字化编码后,你可以采用TS流格式封装成TS流文
件,也可以采用PS流格式封装成PS流文件,选择权在于你,TS流是称为实时
流,他把视频信息分成很多很小的包,损坏了一个包,你解码回放时只是看不见
一小部分(例如出现马赛克),但是PS流是文件流,文件损害的话,整个文件都
看不了了。

再形象的说,一段视频资源用TS流封装就是把这段视频切成10个部
分,放到10个盒子里,一个盒子一个盒子的按照顺序打开,你就能看完这段视
频;而PS流式把整个视频放到1个盒子里,它会自动按照顺序播放出来给您观看;
如果有一个盒子坏了,TS流可以看到9个盒子,PS你就都看不见了。

我们着重
说一下TS封装的格式,电视节目是你任何时候打开电视机都能解码(收看)的,
所以,MPEG2-TS格式的特点就是要求从视频流的任一片段开始都是可以独立解
码的。

从结构上来说,TS是由头文件和主体所组成的,扩充过的TS流还包括时
间戳。

这样不管是什么格式的VBR音轨,都很容易通过时间戳来同步图像。

当然,
对新的声音格式来说,需要新的分离器,解码器来实现解码。

目前在不断改进开
发中。

TS不像AVI,从诞生那天起,就考虑到了网络播放,所以很快成为了世界
标准并广泛应用于电视台数字播放,手机等各个领域。

WMV:Microsoft推出的封装格式。

MOV:是APPLE推出的QuickTime封装格式。

Rmvb/rm:由RealNetworks推出的封装格式。

3GP:目前主要应用于H.263的封装,主要在3G手机上使用
MPG
MPEG编码采用的音频视频容器,具有流的特性。

里面又分为 PS,TS 等,PS 主
要用于 DVD 存储。

TS 主要用于 HDTV
VOB
DVD采用的音频视频容器格式(即视频MPEG-2,音频用AC3或者DTS),支持多
视频多音轨多字幕章节等。

民间标准但应用十分广泛的封装格式:
OGM:
OGM起源于一个互联网上的黑客推出,OGM作为一个全新的多媒体容器,在视频
上可以使用DivX/XviD的编码画面,音频上可以使用ogg
vorbis/AC3/(CBR/ABR/VBR)MP3等,文本上可以使用srt字幕,支持Chapetr。


为重要的一点是OGM可以方便的嵌入多个音轨和字幕。

MKV:
MKV是Matroska的简称,是由俄罗斯的程序员开发的,开源,是一种新的文件封
装格式,主要特点有:
1:可变帧率:这需要编码的配合,试想一下在回放变化比较慢(比如说静物)时
以比较低的FPS来代替,可以节省不少资源。

2:错误检测以及修复:这无提供了纠错和容错性,在网络传输的今天尤为需要。

3:软字幕:经常看DVDrip以及HDrip的朋友了解到,字幕一般都是以其它文件
形式存在,在MKV里它可以内嵌在封装里,但不会和视频混淆,也可以多字幕随
意选择。

这样在传输保存时比较方便。

4:流式传输:这和TS流的原因基本一致,通过时间戳来管理视频以及音频的同
步问题,做到即下即看。

5:菜单:交互式的操作使得MKV更加人性化。

6:强大的兼容性:MKV最大的特点就是能容纳多种不同类型编码的视频、音频
及字幕流,即使是非常封闭的RealMedia及QuickTime也被它包括进去了,堪称
万能的媒体容器。

7:开放性和跨平台性:Matroska使用的是一种开放的架构,拥有众多的先进特
性,并且能跨平台使用。

基于以上这些优点,所以在互联网上应用也是一份广泛。

不过Matroska相对于以上我们介绍的缺点也是显而易见的,它没有深厚的背景
可以依托,这决定了它不可能在商业领域里有所作为。

相关文档
最新文档