第三章多媒体数据压缩技术.pptx
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如草席图结构上存在冗余。
二、多媒体数据压缩的可能性
4. 知识冗余
有许多图像的理解与某些基础知识有相当大的 相关性。这类规律性的结构可由先验知识和背景知 识得到,我们称此类冗余为知识冗余。
例:人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上 方有眼睛,鼻子在中线上……
5. 视觉冗余
人类视觉系统对图像场的敏感性是非均匀和非 线性的,人眼并不能察觉图像场的所有变化,人类 视觉系统的分辨能力约为64灰度等级,而一般图像 量化采用256灰度等级,这类冗余称视觉冗余。
44.1×1000×16×2÷8=176.4KB
一个650MB的CD—ROM,大约可存1小时 的音乐。
一、多媒体数据压缩编码的必要性
3. 对动态图形和视频图像。例如 对 于 彩色电视信号,设代表光强Y的带宽为 4.2MHz 、 色彩I为1.5MHz和色饱和度Q为 0.5MHz , 采样频率>2倍原始信号频率, 各分量均被数字量化为8位,从而1秒钟 电视信号的数据量为:
二、多媒体数据压缩的可能性
2. 时间冗余
图像序列中的相邻帧图像往往包含相同的背 景和移动物体,只不过移动物体所在的空间位 置略有不同。我们把一帧图像中的某物体或场 景可以由其他帧图像中的物体或场景进行处理 后重构出来,可以大大减少时间冗余。
3. 结构冗余
有些图像从大体上看存在着非常强的纹理结 构,这些纹理具有较强的相似性称此为结构冗 余。
1.压缩比
压缩性能常常用压缩比定义(输入数据 和输出数据比)
例:512×480, 24bit/pixel(bpp)
输出15000byte 输入=737280byte 压缩比=737280/15000=49
2.图象质量
压缩方法:
无损压缩 (图象质量不变) 有损压缩
有损压缩:失真情况很难量化,只能对测 试的图象进行估计。
(4.2+1.5+0.5)×2×8×1000000÷8 =12.3 MB
ห้องสมุดไป่ตู้
容量为650MB的CD—ROM仅能存1分钟 的原始电视数据。若为高清晰度电视
(HDTV ) 其1秒钟数据量约为150MB (1.2Gbps÷8),一张CD—ROM还存不下 5秒钟的HDTV图像。
巨大数字化信息的数据量对计算机存储 资源和网络带宽有很高的要求 , 解决的办 法就是要对视、音频的数据进行大量的压 缩。播放时,传输少量被压缩的数据,接 收后再对数据进行解压缩并复原。
1.图像数据量的大小可用下面的公式来计 算:
图像数据量=图像的总像素×色彩深度
÷8
(单位为Byte , 简写为B )
例如,一幅640×480、24位(bit ) 真彩
色的图像,其文件大小为:
640×480×24÷ 8 =921.6KB
一、多媒体数据压缩编码的必要性
2. 双通道立体声激光唱盘,采用脉冲 码调制采样,采样频率为44.1KHz , 采样 精度16位,其一秒钟时间内的采样数据 量为:
一、多媒体数据压缩编码的必要性
信息时代的重要特征是信息的数字化。 早期的计算机系统采用模拟方式表示信息 , 但 存在着明显的缺点:
①经常会产生噪音和信号丢失,并且在复 制过程中逐步积累噪音和误差。
②模拟信号不适合数字计算机加工处理。
一、多媒体数据压缩编码的必要性
数字化后未经压缩的视频和音频等媒 体信息的数据量是非常大的。
二、多媒体数据压缩的可能性
6. 听觉冗余
人耳对不同频率的声音的敏感性是不同的, 并不能察觉所有频率的变化,对某些频率不必 特别关注,因此存在听觉冗余。
三、数据压缩技术的分类
根据多媒体数据冗余类型的不同,解码后数据 与原始数据是否完全一致、质量有无损失来进行 分类,压缩方法可被分为有失真编码和无失真编 码两大类。 无失真压缩法也称无损压缩,一般是利用数 据的统计特性来进行数据压缩,对数据流中出 现的各种数据进行概率统计编码,使得数据流 经压缩后形成的代码流总位数大大减少。 无失真压缩的特点是压缩比较小,大约在2∶l 至5∶l之间,主要用于文本数据、程序代码和 某些要求严格不丢失信息的环境中,常用的无 失真压缩编码有如哈夫曼编码等。
模型编码 分形编码
混合编码 JPEG MPEG H. 261
四、数据压缩技术的性能指标
节省图象或视频的存储容量,增加访问速 度,使数字视频能在PC机上实现,需要进行视 频和图象的压缩。
有三个关键参数评价一个压缩系统 压缩比 图象质量 压缩和解压的速度 另外也必须考虑每个压缩算法所需的硬
件和软件。
二、多媒体数据压缩的可能性
1. 空间冗余
一幅图像中一般都有连续的有规则物体和规 则背景的颜色分布,使图像数据在空间上表现 出相关性,我们可以通过改变物体表面颜色的 像素存储方式来利用空间相关性,达到减少数 据量的目的。
例: 图象中的“A”是一个规则物体。光的亮 度、饱 和度及颜色都一样,因此,数据A有很大的冗余。
– 模拟图象质量的指标:信噪比、分辨率 – 必须观察实际图象以后估计。
三、数据压缩技术的分类
有失真压缩法也称有损压缩,允许一定程 度的失真,会丢失一些人眼和人耳所不敏感 的图像或音频信息,而且丢失的信息不可恢 复,即解压缩后并不能完全恢复成原来的数 据,但是根据人的视觉和听觉的主观评价是 可以接受的,有失真压缩法的冗余压缩取决 于初始信号的类型、前后的相关性、信号的 语义内容等,压缩比可以从几到几百倍。
常用的有失真压缩编码技术有预测编码、变 换编码、模型编码、混合编码方法等。
主要用于压缩图像、声音等信息。
三、数据压缩技术的分类
常用的图像和视频压缩方法如图2-1所示:
图像和视频压缩方法
无失真压缩
有失真压缩
哈夫曼编码 行程编码 算术编码 LZW编码
预测编码 运动补偿
变换编码 DCT编码 小波变换 子带编码
第三章 多媒体数据压缩技术
第一节 多媒体数据压缩技术概述 第二节 静态图像压缩编码国际标准—JPEG 第三节 运动图像压缩编码国际标准—MPEG
第一节 多媒体数据压缩技术概述
一、多媒体数据压缩编码的必要性 二、多媒体数据压缩的可能性 三、数据压缩技术的分类 四、数据压缩技术的性能指标
二、多媒体数据压缩的可能性
4. 知识冗余
有许多图像的理解与某些基础知识有相当大的 相关性。这类规律性的结构可由先验知识和背景知 识得到,我们称此类冗余为知识冗余。
例:人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上 方有眼睛,鼻子在中线上……
5. 视觉冗余
人类视觉系统对图像场的敏感性是非均匀和非 线性的,人眼并不能察觉图像场的所有变化,人类 视觉系统的分辨能力约为64灰度等级,而一般图像 量化采用256灰度等级,这类冗余称视觉冗余。
44.1×1000×16×2÷8=176.4KB
一个650MB的CD—ROM,大约可存1小时 的音乐。
一、多媒体数据压缩编码的必要性
3. 对动态图形和视频图像。例如 对 于 彩色电视信号,设代表光强Y的带宽为 4.2MHz 、 色彩I为1.5MHz和色饱和度Q为 0.5MHz , 采样频率>2倍原始信号频率, 各分量均被数字量化为8位,从而1秒钟 电视信号的数据量为:
二、多媒体数据压缩的可能性
2. 时间冗余
图像序列中的相邻帧图像往往包含相同的背 景和移动物体,只不过移动物体所在的空间位 置略有不同。我们把一帧图像中的某物体或场 景可以由其他帧图像中的物体或场景进行处理 后重构出来,可以大大减少时间冗余。
3. 结构冗余
有些图像从大体上看存在着非常强的纹理结 构,这些纹理具有较强的相似性称此为结构冗 余。
1.压缩比
压缩性能常常用压缩比定义(输入数据 和输出数据比)
例:512×480, 24bit/pixel(bpp)
输出15000byte 输入=737280byte 压缩比=737280/15000=49
2.图象质量
压缩方法:
无损压缩 (图象质量不变) 有损压缩
有损压缩:失真情况很难量化,只能对测 试的图象进行估计。
(4.2+1.5+0.5)×2×8×1000000÷8 =12.3 MB
ห้องสมุดไป่ตู้
容量为650MB的CD—ROM仅能存1分钟 的原始电视数据。若为高清晰度电视
(HDTV ) 其1秒钟数据量约为150MB (1.2Gbps÷8),一张CD—ROM还存不下 5秒钟的HDTV图像。
巨大数字化信息的数据量对计算机存储 资源和网络带宽有很高的要求 , 解决的办 法就是要对视、音频的数据进行大量的压 缩。播放时,传输少量被压缩的数据,接 收后再对数据进行解压缩并复原。
1.图像数据量的大小可用下面的公式来计 算:
图像数据量=图像的总像素×色彩深度
÷8
(单位为Byte , 简写为B )
例如,一幅640×480、24位(bit ) 真彩
色的图像,其文件大小为:
640×480×24÷ 8 =921.6KB
一、多媒体数据压缩编码的必要性
2. 双通道立体声激光唱盘,采用脉冲 码调制采样,采样频率为44.1KHz , 采样 精度16位,其一秒钟时间内的采样数据 量为:
一、多媒体数据压缩编码的必要性
信息时代的重要特征是信息的数字化。 早期的计算机系统采用模拟方式表示信息 , 但 存在着明显的缺点:
①经常会产生噪音和信号丢失,并且在复 制过程中逐步积累噪音和误差。
②模拟信号不适合数字计算机加工处理。
一、多媒体数据压缩编码的必要性
数字化后未经压缩的视频和音频等媒 体信息的数据量是非常大的。
二、多媒体数据压缩的可能性
6. 听觉冗余
人耳对不同频率的声音的敏感性是不同的, 并不能察觉所有频率的变化,对某些频率不必 特别关注,因此存在听觉冗余。
三、数据压缩技术的分类
根据多媒体数据冗余类型的不同,解码后数据 与原始数据是否完全一致、质量有无损失来进行 分类,压缩方法可被分为有失真编码和无失真编 码两大类。 无失真压缩法也称无损压缩,一般是利用数 据的统计特性来进行数据压缩,对数据流中出 现的各种数据进行概率统计编码,使得数据流 经压缩后形成的代码流总位数大大减少。 无失真压缩的特点是压缩比较小,大约在2∶l 至5∶l之间,主要用于文本数据、程序代码和 某些要求严格不丢失信息的环境中,常用的无 失真压缩编码有如哈夫曼编码等。
模型编码 分形编码
混合编码 JPEG MPEG H. 261
四、数据压缩技术的性能指标
节省图象或视频的存储容量,增加访问速 度,使数字视频能在PC机上实现,需要进行视 频和图象的压缩。
有三个关键参数评价一个压缩系统 压缩比 图象质量 压缩和解压的速度 另外也必须考虑每个压缩算法所需的硬
件和软件。
二、多媒体数据压缩的可能性
1. 空间冗余
一幅图像中一般都有连续的有规则物体和规 则背景的颜色分布,使图像数据在空间上表现 出相关性,我们可以通过改变物体表面颜色的 像素存储方式来利用空间相关性,达到减少数 据量的目的。
例: 图象中的“A”是一个规则物体。光的亮 度、饱 和度及颜色都一样,因此,数据A有很大的冗余。
– 模拟图象质量的指标:信噪比、分辨率 – 必须观察实际图象以后估计。
三、数据压缩技术的分类
有失真压缩法也称有损压缩,允许一定程 度的失真,会丢失一些人眼和人耳所不敏感 的图像或音频信息,而且丢失的信息不可恢 复,即解压缩后并不能完全恢复成原来的数 据,但是根据人的视觉和听觉的主观评价是 可以接受的,有失真压缩法的冗余压缩取决 于初始信号的类型、前后的相关性、信号的 语义内容等,压缩比可以从几到几百倍。
常用的有失真压缩编码技术有预测编码、变 换编码、模型编码、混合编码方法等。
主要用于压缩图像、声音等信息。
三、数据压缩技术的分类
常用的图像和视频压缩方法如图2-1所示:
图像和视频压缩方法
无失真压缩
有失真压缩
哈夫曼编码 行程编码 算术编码 LZW编码
预测编码 运动补偿
变换编码 DCT编码 小波变换 子带编码
第三章 多媒体数据压缩技术
第一节 多媒体数据压缩技术概述 第二节 静态图像压缩编码国际标准—JPEG 第三节 运动图像压缩编码国际标准—MPEG
第一节 多媒体数据压缩技术概述
一、多媒体数据压缩编码的必要性 二、多媒体数据压缩的可能性 三、数据压缩技术的分类 四、数据压缩技术的性能指标