多媒体虚拟现实及人工智能

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2 音频数据的压缩 在多媒体中,音频有很多压缩编码标准: (1) MP3音频 MP3的全名是MPEG Audio Layer-3,简单地 说就是一种声音文件的压缩格式。是目前最普 及的音频压缩格式,是典型的有损压缩。 MPEG-1音频压缩标准里包括了三个使用高性 能音频数据压缩方法的感知编码方案 ,按照压 缩质量(每Bit的声音效果)和编码方案的复杂程 度分别是Layer1、Layer2、Layer3。
2. MP3PRO •MP3PRO文件在播放上完全与MP3兼容,经过 mp3Pro压缩的文件,扩展名仍旧是.mp3 •也就是说,老的MP3文件可以在新的MP3PRO播 放器上进行播放,同时,新的MP3PRO可以在标 准的MP3软件和设备上播放,但效果可能较差, 因为两者录制方式不同。 •mp3pro在相应的播放软件中才能达到最高音质, 而且mp3pro的制作比较麻烦,目前还没有批量 压制的好方法。
4. WMA • WMA还支持音频流技术,适合在网络上在线 播放,更方便的是不用象MP3那样需要安装额外 的播放器,而Windows操作系统和 WindowsMediaPlayer的无缝捆绑让你只要安装 了windows操作系统就可以直接播放WMA音乐, 新版本的WindowsMediaPlayer7.0更是增加了直 接把CD光盘转换为WMA声音格式的功能,在新出 品的操作系统WindowsXP中,WMA是默认的编码 格式. • 音质好的可与CD媲美,压缩率较高,可用于 网络广播。
多媒体数据压缩编码小结
多媒体数据压缩的必要性和可能性 多媒体数据压缩技术及其标准
1 数据压缩概述
衡量一种数据压缩技术的好坏有三个重要的指标
– 压缩比
– 图像质量或音质 – 压缩和解压的速度
数据压缩原理
– 原始的多媒体信源数据存在着客观上的大量冗余。信 息理论认为:若信源编码的熵大于信源的实际熵,该 信源中一定存在冗余度。去掉冗余不会减少信息量, 仍可原样恢复数据;但若减少了熵,数据则不能完全
础上使编码器采用带有运动估计的DCT和DPCM
(差分脉冲编码调制)的混合方式,H.261是最早 的运动图像压缩标准。
2 音频数据的压缩 音频信号压缩编码的主要依据是人耳的听 觉特性,主要有两点: • 1.人的听觉系统中存在一个听觉阈值电平, 低于这个电平的声音信号人耳听不到 .次声、可听声
和超声
• 2.人的听觉存在屏蔽效应。当几个强弱不同 的声音同时存在时,强声使弱声难以听到,并 且两者之间的关系与其相对频率的大小有关 . 声音编码算法就是通过这些特性来去掉更 多的冗余数据,来达到压缩数据的目的。
1 数据压缩概述
数据压缩方法
Baidu Nhomakorabea
– 无损压缩:
• 利用数据的统计冗余进行压缩,可完全恢复原始数据而
不引入任何失真,但压缩率受到统计冗余度理论限制,
一般为2:1到5:1。 • 无损压缩所使用的编码技术常使用熵编码,它把已压缩 的数据流看做是简单的数字序列,而忽略该数据的语义, 适用于不必考虑其自身具体特点的媒体。
的光盘只能存放大约25s的动态图像 – 一幅640×480分辨率的24位真彩色图像的数据量约为900KB;
一个100MB的硬盘只能存储约100幅静止图像画面
解决办法之一就是进行数据压缩,压缩后再进行存储和传输,到需要时 再解压、还原。
– 以目前常用的位图格式的图像存储方式为例,像素与像素之间 无论是在行方向还是在列方向都具有很大的相关性,因而整体 上数据的冗余度很大,在允许一定限度失真的前提下,能够对 图像数据进行很大程度的压缩。
数据压缩方法
1 数据压缩概述
有损压缩:
– 利用了人类视觉和听觉器官对图像或声音中的某些频率 成分不敏感的特性,允许在压缩过程中损失一定的信息; 虽然不能完全恢复原始数据,但是所损失的部分对理解 原始图像或声音的影响较小,却换来了大得多的压缩比。 有损压缩广泛应用于语音、图像和视频数据的压缩。
– 常用的有损压缩编码技术为源编码(考虑原始数据的语 义)和混合编码(熵编码和源编码技术)。 – 常用工具:JPEG、MPEG等
有1MB左右大小,这样每首歌的大小只有3-4兆字节。
而且还非常好的保持了原来的音质。使用MP3播 放器对MP3文件进行实时的解压缩(解码),这样, 高品质的MP3音乐就播放出来了。
2 音频数据的压缩
(2) MP3PRO • MP3PRO,它是 Thomson Multimedia多媒体 公司推出的一个MP3格式的升级版本,MP3PRO可 以把声音文件压缩到原有MP3格式的一半大小, 但却可以保持相同的音质。
2 音频数据的压缩
音频数据的压缩
mp3PRO Audio Player mp3PRO音乐文件的播放、制作功能
2 音频数据的压缩 3. WMA • WMA (Windows MediaAudio)格式是来自于 微软的重量级选手,后台强硬,音质要强于MP3 格式,更远胜于RA格式,它是以减少数据流量 但保持音质的方法来达到比MP3压缩率更高的目 的,WMA的压缩率一般都可以达到1:18左右. •
l0Mbps,40Mbps传输速率下对图像编码,分别命名为
MPEG-1,MPEG-2,MPEG-3。l992年,MPEG-2适用范围扩大 到HDTV(高清晰数字电视输出技术 ),能支持MPEG-3的
所有功能,因而MFEG-3被取消。
主要有: MPEG-1、 MPEG-2、 MPEG-4、 MPEG-7、 MPEG-21
3.3 网络多媒体技术及应用
计算机网络与多媒体技术
网络多媒体技术及应用
1 多媒体关键技术
2 流媒体技术技术
多媒体关键技术
1
2 3
数据压缩概述
音频数据的压缩
静态图像的数据压缩
4
运动图像的数据压缩
1 数据压缩概述
由于多媒体数据量非常大,造成计算机的存储和网络传输负担
–若帧速率为25帧/秒,则1s的数据量大约为25MB,一个640MB
•MPEG-2 是DVD视频的压缩标准。每秒30帧704*480的分辨率
MPEG-4 标准
4 运动图像的数据压缩
• MPEG-4标准于1998年公布,是为了播放流式媒体的
高质量视频而专门设计的,它可利用很窄的带度, 采用了全新的压缩理念,通过帧重建技术,压缩和 传输数据,以求使用最少的数据获得最佳的图像质 量,并将之作为网络上传送之用。
4 运动图像的数据压缩
视频:运动图像即静止图像的连续播放状态 压缩目标:尽可能保证视觉效果的前提下减少视频数据率。
压缩比:压缩后的数据量与压缩前的数据量之比。
运动图像的数据压缩方法
有损和无损压缩 帧内和帧间压缩
对称和不对称压缩
4 运动图像的数据压缩
MPEG(运动图像专家组—Moving Pictures Experts Group)标准是一系列视频、音频、数 据的压缩标准。分成MPEG视频、MPEG音频和 MPEG系统三大部分。 MPEG算法除了对单幅图像进行编码外(帧 内编码),还利用图像序列的相关特性去除帧间 图像冗余,大大提高了视频图像的压缩比。
MPEG-1音频的层次与压缩比率
Layer1(相当于384kbps立体声信号)
4:1
Layer2(相当于192~256kbps立体声信号)
6:1~8:1
Layer3 (相当于112~154kbps立体声信号)
10:1~12:1
MP3音频
MP3是利用 MPEG Audio Layer 3 的技术, 将音乐以1:10 甚至 1:12 的压缩率,压缩成容 量较小的文件,能够在音质丢失很小的情况下 把文件压缩到更小的程度。每分钟音乐的MP3格式只
4 运动图像的数据压缩
MPEG-2标准 • MPEG-2标准于1994年公布,包括系统部分、视频部分、 音频部分及符合性测试部分。 • MPEG-2编码标准希望囊括数字电视、图象通信各领域的 编码标准,MPEG-2按压缩比大小的不同分成五个档次 (profile),每一个档次又按图象清晰度的不同分成四种图象 格式,或称为级别(level)。五个档次四种级别共有20种组合, 但实际应用中有些组合不太可能出现,较常用的是11种组合。
• MPEG-4 可把DVD内MPEG-2的视频文件转换为体积更
小的文件。还包含了以前MPEG压缩标准所不具备的
比特率的可伸缩性、动画精灵、交互性甚至版权保
护等一些特殊功能。
4 运动图像的数据压缩 RM/RMVB • RM (Real Media)是RealNetworks公司所制定 的音频视频压缩规范,是一种流媒体格式。 用户可以使用RealPlayer或RealOne Player 对符合RealMedia技术规范的网络音频/视频资 源进行实况转播,并且RealMedia还可以根据不 同的网络传输速率制定出不同的压缩比率,从 而实现在低速率的网络上进行影像数据实时传 送和播放。这种格式的另一个特点是用户使用 RealPlayer播放器可以在不下载音频/视频内容 的条件下实现在线播放。
4 运动图像的数据压缩
MPEG-1 标准
MPEG-1即“用于数字存储媒体运动图像及其伴音速率
为1.5Mbps的压缩编码”,于1992年正式出版。 MPEG-1提供每秒30帧352*240分辨率的图像,MPEG-1
是VCD视频的压缩标准。
MPEG-1的任务主要是,将视频信号及其伴音以可接收 的重建质量压缩到约1.5Mbps的码率,并复合成一 个单一的MPEG位流,同时保证视频和音频的同步。
4 运动图像的数据压缩
压缩的基本方法:在单位时间内采集并保存第一帧 信息,然后就只存储其余帧相对第一帧发生变化的部 分,以达到压缩的目的。MPEG压缩标准可实现帧之 间的压缩。 压缩比可达到50:1,同时图像和音频的质量也非常 高。
4 运动图像的数据压缩
最初MPEG专家组的工作项目是3个,即在1.5Mbps,
• 常用工具:WinRar、WinZip、ARC等
行程编码
多数无损压缩采用行程编码。 行程编码又称“运行长度编码”或“游程编码”,是 一种统计编码,该编码属于无损压缩编码。行程编码 的基本原理是:用一个符号值或串长代替具有相同值 的连续符号算法。连续符号构成了一段连续的“行 程”。行程编码因此而得名,使符号长度少于原始数 据的长度。 例如:5555557777733322221llllll行程编码 为:(5,6)(7,5)(3,3)(2,4)(l,7)。 可见,行程编码的位数远远少于原始字符串的位数。
2 音频数据的压缩
2 音频数据的压缩
5. WAVE WAV格式是微软公司开发的一种声音文件 格式,也叫波形声音文件,是最早的数字音频 格式,被Windows平台及其应用程序广泛支持。 WAV格式支持许多压缩算法,支持多种音频位 数、采样频率和声道,采用44.1kHz的采样频率, 16位量化位数,因此WAV的音质与CD相差无几, 但WAV格式对存储空间需求太大不便于交流和 传播
3 静态图像的数据压缩
静态图像压缩技术主要是对空间信息进行压缩,
目的是在满足一定图像质量的条件下,缩小图像文件
所占用的存储空间,从而减小存储容量和占用尽量小
的网络带宽。
3 静态图像的数据压缩 JPEG标准 • 国际标准化组织(ISO)和国际电报电话咨 询委员会(CCITT)联合成立的“联合图像专家 组”JPEG(Joint Photograph coding Experts Group)于1991年提出的“多灰度静 止图像的数字压缩编码”(简称JPEG标准)。 • 这是一个适应于彩色和单色多灰度或连续 色调静止数字图像的压缩标准,是最常用的 图像文件格式,是一种有损压缩,压缩比很 大。
恢复。不过在允许的范围内损失一定的熵,数据仍然
可以近似恢复。
1 数据压缩概述
数据压缩原理 – 因为人的感觉的某些不敏感性,多媒体数据中还存 在着从主观感受角度看去的大量冗余,即:在人眼 允许的误差范围之内,压缩前后的图像如果不做非 常细致的对比是很难觉察出两者的差别的。
1 数据压缩概述
数据压缩技术标准 – H.261:是为在综合业务数字网(ISDN)上开展双 向声像业务(可视电话、视频会议)而制定的,速 率为64kb/s的整数倍。它使用两种类型的压缩:一 帧中的有损压缩和帧间压缩的无损编码,并在此基
相关文档
最新文档