多媒体虚拟现实及人工智能.ppt

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

恢复。不过在允许的范围内损失一定的熵,数据仍然
可以近似恢复。
1 数据压缩概述
数据压缩原理 – 因为人的感觉的某些不敏感性,多媒体数据中还存 在着从主观感受角度看去的大量冗余,即:在人眼 允许的误差范围之内,压缩前后的图像如果不做非 常细致的对比是很难觉察出两者的差别的。
1 数据压缩概述
数据压缩技术标准 – H.261:是为在综合业务数字网(ISDN)上开展双 向声像业务(可视电话、视频会议)而制定的,速 率为64kb/s的整数倍。它使用两种类型的压缩:一 帧中的有损压缩和帧间压缩的无损编码,并在此基
的光盘只能存放大约25s的动态图像 – 一幅640×480分辨率的24位真彩色图像的数据量约为900KB;
一个100MB的硬盘只能存储约100幅静止图像画面
解决办法之一就是进行数据压缩,压缩后再进行存储和传输,到需要时 再解压、还原。
– 以目前常用的位图格式的图像存储方式为例,像素与像素之间 无论是在行方向还是在列方向都具有很大的相关性,因而整体 上数据的冗余度很大,在允许一定限度失真的前提下,能够对 图像数据进行很大程度的压缩。
数据压缩方法
1 数据压缩概述
有损压缩:
– 利用了人类视觉和听觉器官对图像或声音中的某些频率 成分不敏感的特性,允许在压缩过程中损失一定的信息; 虽然不能完全恢复原始数据,但是所损失的部分对理解 原始图像或声音的影响较小,却换来了大得多的压缩比。 有损压缩广泛应用于语音、图像和视频数据的压缩。
– 常用的有损压缩编码技术为源编码(考虑原始数据的语 义)和混合编码(熵编码和源编码技术)。 – 常用工具:JPEG、MPEG等
2 音频数据的压缩 在多媒体中,音频有很多压缩编码标准: (1) MP3音频 MP3的全名是MPEG Audio Layer-3,简单地 说就是一种声音文件的压缩格式。是目前最普 及的音频压缩格式,是典型的有损压缩。 MPEG-1音频压缩标准里包括了三个使用高性 能音频数据压缩方法的感知编码方案 ,按照压 缩质量(每Bit的声音效果)和编码方案的复杂程 度分别是Layer1、Layer2、Layer3。
2. MP3PRO •MP3PRO文件在播放上完全与MP3兼容,经过 mp3Pro压缩的文件,扩展名仍旧是.mp3 •也就是说,老的MP3文件可以在新的MP3PRO播 放器上进行播放,同时,新的MP3PRO可以在标 准的MP3软件和设备上播放,但效果可能较差, Baidu Nhomakorabea为两者录制方式不同。 •mp3pro在相应的播放软件中才能达到最高音质, 而且mp3pro的制作比较麻烦,目前还没有批量 压制的好方法。
3.3 网络多媒体技术及应用
计算机网络与多媒体技术
网络多媒体技术及应用
1 多媒体关键技术
2 流媒体技术技术
多媒体关键技术
1
2 3
数据压缩概述
音频数据的压缩
静态图像的数据压缩
4
运动图像的数据压缩
1 数据压缩概述
由于多媒体数据量非常大,造成计算机的存储和网络传输负担
–若帧速率为25帧/秒,则1s的数据量大约为25MB,一个640MB
有1MB左右大小,这样每首歌的大小只有3-4兆字节。
而且还非常好的保持了原来的音质。使用MP3播 放器对MP3文件进行实时的解压缩(解码),这样, 高品质的MP3音乐就播放出来了。
2 音频数据的压缩
(2) MP3PRO • MP3PRO,它是 Thomson Multimedia多媒体 公司推出的一个MP3格式的升级版本,MP3PRO可 以把声音文件压缩到原有MP3格式的一半大小, 但却可以保持相同的音质。
MPEG-1音频的层次与压缩比率
Layer1(相当于384kbps立体声信号)
4:1
Layer2(相当于192~256kbps立体声信号)
6:1~8:1
Layer3 (相当于112~154kbps立体声信号)
10:1~12:1
MP3音频
MP3是利用 MPEG Audio Layer 3 的技术, 将音乐以1:10 甚至 1:12 的压缩率,压缩成容 量较小的文件,能够在音质丢失很小的情况下 把文件压缩到更小的程度。每分钟音乐的MP3格式只
• 常用工具:WinRar、WinZip、ARC等
行程编码
多数无损压缩采用行程编码。 行程编码又称“运行长度编码”或“游程编码”,是 一种统计编码,该编码属于无损压缩编码。行程编码 的基本原理是:用一个符号值或串长代替具有相同值 的连续符号算法。连续符号构成了一段连续的“行 程”。行程编码因此而得名,使符号长度少于原始数 据的长度。 例如:5555557777733322221llllll行程编码 为:(5,6)(7,5)(3,3)(2,4)(l,7)。 可见,行程编码的位数远远少于原始字符串的位数。
础上使编码器采用带有运动估计的DCT和DPCM
(差分脉冲编码调制)的混合方式,H.261是最早 的运动图像压缩标准。
2 音频数据的压缩 音频信号压缩编码的主要依据是人耳的听 觉特性,主要有两点: • 1.人的听觉系统中存在一个听觉阈值电平, 低于这个电平的声音信号人耳听不到 .次声、可听声
和超声
• 2.人的听觉存在屏蔽效应。当几个强弱不同 的声音同时存在时,强声使弱声难以听到,并 且两者之间的关系与其相对频率的大小有关 . 声音编码算法就是通过这些特性来去掉更 多的冗余数据,来达到压缩数据的目的。
1 数据压缩概述
数据压缩方法
– 无损压缩:
• 利用数据的统计冗余进行压缩,可完全恢复原始数据而
不引入任何失真,但压缩率受到统计冗余度理论限制,
一般为2:1到5:1。 • 无损压缩所使用的编码技术常使用熵编码,它把已压缩 的数据流看做是简单的数字序列,而忽略该数据的语义, 适用于不必考虑其自身具体特点的媒体。
1 数据压缩概述
衡量一种数据压缩技术的好坏有三个重要的指标
– 压缩比
– 图像质量或音质 – 压缩和解压的速度
数据压缩原理
– 原始的多媒体信源数据存在着客观上的大量冗余。信 息理论认为:若信源编码的熵大于信源的实际熵,该 信源中一定存在冗余度。去掉冗余不会减少信息量, 仍可原样恢复数据;但若减少了熵,数据则不能完全
相关文档
最新文档