多媒体技术基础第3版数据无损压缩-73页PPT资料
合集下载
河北科技大学多媒体通信技术基础 第三章PPT课件
第3章 数据压缩的基本技术 数据压缩处理一般由两个过程组成:
编码过程:对原始数据进行编码压缩,以便存储和传输; 解码过程:对压缩的数据进行解压,恢复成可用的数据。
根据解压后数据的保真度,数据压缩技术可分为
无损压缩编码:解码后的数据与原始数据完全相同,无任 何偏差。这种编码通常基于信息熵原理,常用的编码有 哈夫曼编码、算术编码、行程编码等。压缩比比较低, 一般在2:1-5:1。主要用于要求数据无损压缩存储和传输 的场合,如传真机
18
3.5.1差分脉冲编码调制 DPCM的简化原理方框图
通过预测和差分, 将x(n)转化为差分信息 e(n),降低了信息冗余
输入图像
xn + en -
量化器
ên
预测器 xn
压缩图像 编码
压缩图像 解码 ên +
+
yn
解压缩图像
xn
预测器
19
• 图中预测器的输出:
N
x(n) aix(ni) i1
ên
Q->DQ
-
符号 压缩图像 编码
•
xn
预测器
xn
+ +
•
^
xn = ên + xn
21
• 几个概念: • 一维预测:被预测的样值与用作预测的样值在同
一行内 • 二维预测:用作预测的样值位于相邻的不同行上
一维预测利用像素之间在水平方向上的相关性。 在水平方向亮度变化缓慢的图像,有较好的预测 效果。
3
3.2 数据3压.2缩的数理据论依压据缩的理论依据
• 数据压缩的理论基础为Shannon信息论。 它一方面给出了数据压缩的理论极限,另 一方面又指明了数据压缩的技术途径。
编码过程:对原始数据进行编码压缩,以便存储和传输; 解码过程:对压缩的数据进行解压,恢复成可用的数据。
根据解压后数据的保真度,数据压缩技术可分为
无损压缩编码:解码后的数据与原始数据完全相同,无任 何偏差。这种编码通常基于信息熵原理,常用的编码有 哈夫曼编码、算术编码、行程编码等。压缩比比较低, 一般在2:1-5:1。主要用于要求数据无损压缩存储和传输 的场合,如传真机
18
3.5.1差分脉冲编码调制 DPCM的简化原理方框图
通过预测和差分, 将x(n)转化为差分信息 e(n),降低了信息冗余
输入图像
xn + en -
量化器
ên
预测器 xn
压缩图像 编码
压缩图像 解码 ên +
+
yn
解压缩图像
xn
预测器
19
• 图中预测器的输出:
N
x(n) aix(ni) i1
ên
Q->DQ
-
符号 压缩图像 编码
•
xn
预测器
xn
+ +
•
^
xn = ên + xn
21
• 几个概念: • 一维预测:被预测的样值与用作预测的样值在同
一行内 • 二维预测:用作预测的样值位于相邻的不同行上
一维预测利用像素之间在水平方向上的相关性。 在水平方向亮度变化缓慢的图像,有较好的预测 效果。
3
3.2 数据3压.2缩的数理据论依压据缩的理论依据
• 数据压缩的理论基础为Shannon信息论。 它一方面给出了数据压缩的理论极限,另 一方面又指明了数据压缩的技术途径。
多媒体数据压缩技术ppt课件
多媒体数据压缩技术
• PCM是概念上最简单、理论上最完善的编 码系统,是最早研制成功、使用最为广泛 的编码系统,它仅仅是对输入信号进行采 样和量化,但也是数据量最大的编码系统
• 下图中的“防失真滤波器”是一个低通滤 波器,用来滤除声音频带以外的信号; “波形编码器”可暂时理解为“采样器”, “量化器”可理解为“量化阶大小(stepsize)”生成器或者称为“量化间隔”生成 器。
• 利用子带编码达到既压缩声音数据又尽可 能保留声音原有质量的目的。
• 这种方法的具体思想是首先把时域中的声 音数据变换到频域中的多个子带当中,对 每个子带里的信号分别进行量化和编码, 根据心理声学模型确定样本的精度,从而 达到压缩数据量的目的。
完整最新ppt Tianjin University
SLIDE 16
③ 层3的编码器最为复杂,编码器的输出数 据率为64 kb/s,广泛用于INTERNET传播。
完整最新ppt Tianjin University
SLIDE 14
音频压缩标准
• MPEG-1 Audio (ISO/IEC 11172-3)压缩算 法是世界上第一个高保真声音数据压缩国 际标准,并且得到了极其广泛的应用。虽 然MPEG声音标准是MPEG标准的一部分,但 它也完全可以独立应用。数据的输入/输 出图如下:
SLIDE 1
频域分析
信号频谱X(f)代表了信号在不同频率分量成分的大小,能够 提供比时域信号波形更直观,丰富的信息。
幅值
时域分析
频域分析
完整最新ppt Tianjin University
SLIDE 2
频域分析
时域和频域的 对应关系
完整最新ppt Tianjin University
多媒体技术应用基础第3章
第3章 多媒体的数据压缩技术
除量化器的量化区间划分为非线性之外,还可对于各区间 的代表值(码字的长短)作非等步长的处理,使概率密度大的区 间的码字用较少的比特数表示,反之码字取较多的比特数。
目前,量化器主要有以下 3 类:一是均匀量化器, 其量 化间隔是等长的; 二是非均匀量化器,其量化间隔是不等长 的;三是自适应量化器, 变化。
第3章 多媒体的数据压缩技术
第 3 章多媒体的数据压缩技术
3.1 概述 3.2 数据压缩的基本方法 3.3 JPEG彩色静止图像编码标准 3.4 MPEG运动图像编码标准 3.5 音频的数字化与压缩编码技术
返回主目录
第3章 多媒体的数据压缩技术
第3章 多媒体数据压缩技术
3.1 概述
多媒体是先进的计算机技术和视频、音频及通信等技术 集成的产物。多媒体计算机涉及的信息包括:文字、语音、 音乐、 静止图像、 电视图像、 电影、 动画、图形等等。
这些信息经数字化处理后的数据量非常大,那么如何在 多媒体系统中有效地保存和传送这些数据就成了多媒体计算 机面临的一个最基本的问题, 也是最大的难题之一。
以彩色电视信号为例,设Y、I、Q色空间各分量均被数字 化为8 bit,它的数据量约为100 Mbit/s,用现在1GB容量的CD -ROM光盘,也仅能保存约1分钟的原始电视数据。
第3章 多媒体的数据压缩技术
此外,彩色静止图像、文件图像以及语音等等的数据量 也是非常巨大的,特别是电视图像的数据量,在相同条件下 要比语音的数据量大1 000倍以上。况且, 现在个人电脑的传 输率一般是150 Mbit/s, 无法处理更大的数据量。因此, 要 把这些视频、音频等信号在有限的空间上存储和在目前的电 脑总线上正确传输,必须采取数据压缩技术。可见,数据压 缩技术是多媒体计算机(MPC)发展的关键性技术。
多媒体技术基础无损压缩
xp (t) x(t) p(t)
x(t) (t nT ) n
x(nT ) (t nT )
n
采样分析
原连续时间信号:x(t) X ( j )
采样函数频谱:
P( j) 2 ( k 2 )
T k
T
已采样信号的频谱:
X
P
(
j
)
1
2
X
(
j )
P(
j )
1 T
X
k
(
j(
ks
)
采样
❖此外,对同一个连续时间信号,当采样间 隔不同时也会得到不同的样本序列。
结论:没有任何条件限制的情况下,从连续时间信号 采样所得到的样本序列,不能唯一地确定原来的连续 时间信号,即:一个连续时间信号必须在某一种条件 下才能由其样本来表示。
采样分析
采样函数: p(t) (t nT ) n 采样样本:
香农信息论
传输理论
保密理论
有失真信源编码 无失真信源编码
率失真理论
等长编码 变长编码
定理
定理
有噪声 信道编码理论
网络信道
保密系统的 信息理论
网络信息理论
压缩编码
最优码构成 码 码
码构成 纠错码
网络最佳码
保密码
代数编码 卷积码
信息论之父
❖ —— ❖ : 30 1916 , , ❖ : 24 2001 , ,
s M M s M M
采样分析
对连续时间信号在时域理想采样,就相当 于在频域以采样频率 s为周期延拓,幅值减 小1。要使频谱不混迭,就必须使信号带限, 且
s M M s 2M
上述即为时域采样的约束条件
从而我们得到怎样抽取样本,样本才能唯一地表征原信 号的取样条件,下面为上述分析的一个完整总结--采样 定理。
x(t) (t nT ) n
x(nT ) (t nT )
n
采样分析
原连续时间信号:x(t) X ( j )
采样函数频谱:
P( j) 2 ( k 2 )
T k
T
已采样信号的频谱:
X
P
(
j
)
1
2
X
(
j )
P(
j )
1 T
X
k
(
j(
ks
)
采样
❖此外,对同一个连续时间信号,当采样间 隔不同时也会得到不同的样本序列。
结论:没有任何条件限制的情况下,从连续时间信号 采样所得到的样本序列,不能唯一地确定原来的连续 时间信号,即:一个连续时间信号必须在某一种条件 下才能由其样本来表示。
采样分析
采样函数: p(t) (t nT ) n 采样样本:
香农信息论
传输理论
保密理论
有失真信源编码 无失真信源编码
率失真理论
等长编码 变长编码
定理
定理
有噪声 信道编码理论
网络信道
保密系统的 信息理论
网络信息理论
压缩编码
最优码构成 码 码
码构成 纠错码
网络最佳码
保密码
代数编码 卷积码
信息论之父
❖ —— ❖ : 30 1916 , , ❖ : 24 2001 , ,
s M M s M M
采样分析
对连续时间信号在时域理想采样,就相当 于在频域以采样频率 s为周期延拓,幅值减 小1。要使频谱不混迭,就必须使信号带限, 且
s M M s 2M
上述即为时域采样的约束条件
从而我们得到怎样抽取样本,样本才能唯一地表征原信 号的取样条件,下面为上述分析的一个完整总结--采样 定理。
多媒体技术之数据无损压缩PPT课件
多媒体技术பைடு நூலகம்础(第3版)
第2章 数据无损压缩
2008年9月
第2章 数据无损压缩目录
2.1 数据的冗余
2.1.1 冗余概念 2.1.2 决策量 2.1.3 信息量 2.1.4 熵 2.1.5 数据冗余量
2.2 统计编码
2.2.1 香农-范诺编码 2.2.2 霍夫曼编码 2.2.3 算术编码
2.3 RLE编码 2.4 词典编码
三种多媒体数据类型
➢ 文字 (text)数据——无损压缩
根据数据本身的冗余(Based on data redundancy)
➢ 声音(audio)数据——有损压缩
根据数据本身的冗余(Based on data redundancy) 根据人的听觉系统特性( Based on human hearing system)
➢ 视听冗余
由于人的视觉系统和听觉系统的局限性,在图像数据和声 音数据中,有些数据确实是多余的,使用算法将其去掉后 并不会丢失实质性的信息或含义,对理解数据表达的信息 几乎没有影响
➢ 数据冗余
不考虑数据来源时,单纯数据集中也可能存在多余的数据, 去掉这些多余数据并不会丢失任何信息,这种冗余称为数 据冗余,而且还可定量表达
➢ 1948年创建的数学理论的一个分支学科,研究信息的编码、 传输和存储
➢ 该术语源于Claude Shannon (香农)发表的“A Mathematical Theory of Communication”论文题目,提议用二进制数据对信 息进行编码
➢ 最初只应用于通信工程领域,后来扩展到包括计算在内的其 他多个领域,如信息的存储、信息的检索等。在通信方面, 主要研究数据量、传输速率、信道容量、传输正确率等问题。
第2章 数据无损压缩
2008年9月
第2章 数据无损压缩目录
2.1 数据的冗余
2.1.1 冗余概念 2.1.2 决策量 2.1.3 信息量 2.1.4 熵 2.1.5 数据冗余量
2.2 统计编码
2.2.1 香农-范诺编码 2.2.2 霍夫曼编码 2.2.3 算术编码
2.3 RLE编码 2.4 词典编码
三种多媒体数据类型
➢ 文字 (text)数据——无损压缩
根据数据本身的冗余(Based on data redundancy)
➢ 声音(audio)数据——有损压缩
根据数据本身的冗余(Based on data redundancy) 根据人的听觉系统特性( Based on human hearing system)
➢ 视听冗余
由于人的视觉系统和听觉系统的局限性,在图像数据和声 音数据中,有些数据确实是多余的,使用算法将其去掉后 并不会丢失实质性的信息或含义,对理解数据表达的信息 几乎没有影响
➢ 数据冗余
不考虑数据来源时,单纯数据集中也可能存在多余的数据, 去掉这些多余数据并不会丢失任何信息,这种冗余称为数 据冗余,而且还可定量表达
➢ 1948年创建的数学理论的一个分支学科,研究信息的编码、 传输和存储
➢ 该术语源于Claude Shannon (香农)发表的“A Mathematical Theory of Communication”论文题目,提议用二进制数据对信 息进行编码
➢ 最初只应用于通信工程领域,后来扩展到包括计算在内的其 他多个领域,如信息的存储、信息的检索等。在通信方面, 主要研究数据量、传输速率、信道容量、传输正确率等问题。
多媒体技术基础 ppt课件
第1节 多媒体基础知识
第2节 多媒体计算机 第3节 多媒体信息的数字化和压缩技术 第4节 多媒体相关软件简介
第1节 多媒体基础知识
一、任务
某医院儿科护理部要在全市医疗卫生工作会议上做工作报 告,院长要求张护士长一定要全方位立体化、“有声有色” 的把儿科护理部和全院的形象在报告中表现出来。张护士 长犯愁了,自己一个医务工作者,如何“有声有色”的来 完成汇报工作呐?
小刘是某学校的音乐老师,拥有一台普通的计算 机。最近他开通了博客,想录制并合成一些自创 歌曲上传到博客里。考虑到去录音棚的费用太高, 小刘想自己动手录制。那么在现有条件下,小刘 还需要怎么做才能实现自己的愿望?
二、 相关知识与技能
(一) 多媒体计算机系统组成
(二) 多媒体计算机的功能 (三) 多媒体计算机硬件系统 (四) 多媒体计算机软件系统
(二)多媒体信息的数字化(续)
2. 图形/图像的数字化
图形和图像:图形文件中存放的是描述图形的指令,以矢 量图形文件形式存储;图像数字化后以位图形式存储。 动画和视频:图形和图像的动态形式,并配以同步的声音。
计算机应用基础
(第三版) 多媒体技术基础
第 8章
多媒体技术基础
E学习目标
1.了解多媒体信息处理技术与一些常用的软件 2. 理解多媒体信息的数字化过程与数据压缩技术 3.理解并掌握多媒体计算机系统的组成 4. 掌握多媒体的概念、特点与多媒体信息类型 5.掌握多媒体计算机的功能特点
第8章 多媒体计算机基础
第 3节多媒体信息的数字化和压缩技术 一、任务
一对新婚夫妇,决定把他们的结婚录像进行以下几种处理: 1.刻录一张DVD光盘,以供随时在DVD影碟机中播放;2. 在自己的计算机硬盘上保存一份,可随时打开观看;3.上 传到互联网上一份,供朋友们在线观看。他们要实现这个 愿望应该怎么做?
多媒体数据压缩技术.ppt
的最主要的一种数据冗余。同
一景物表面上采样点的颜色之间往往存在着空 间连贯性,但是基于离散像素采样来表示物体 颜色的方式通常没有利用这种连贯性。例如: 图像中有一片连续的区域,其像素为相同的颜 色,空间冗余产生。
2020年10月12日星期一
6.1.3 冗余的种类
2.时间冗余 序列图像中经常包含的冗余。一组连续的画面
之间往往存在着时间和空间的相关性,但是基 于离散时间采样来表示运动图像的方式通常没 有利用这种连贯性。例如:房间里的两个人在 聊天,在这个聊天的过程中,背景(房间和家 具)一直是相同的,同时也没有移动,而且是 同样的两个人在聊天,只有动作和位置的变化。
2020年10月12日星期一
6.1.5 压缩方法分类
2.变换编码
变换编码不是直接对空域图像信号进行编码,而是首 先将空域图像信号映射变换到另一个正交矢量空间 (变换域或频域),产生一批变换系数,然后对这些 变换系数进行编码处理。其中关键问题是在时域或空 域描述时,数据之间相关性大,数据冗余度大,经过 变换在变换域中描述,数据相关性大大减少,数据冗 余量减少,参数独立,数据量少,这样再进行量化, 编码就能得到较大的压缩比。 目前常用的正交变换有: 傅立叶 (Fouries)变换、沃尔什(Walsh)变换、哈尔(Haar) 变 换 、 斜 (Slant) 变 换 、 余 弦 变 换 、 正 弦 变 换 、 KL(Karhunen-Loeve)变换等。
有损压缩法,是指使用压缩后的数据进行解压缩, 解压之后的数据与原来的数据有所不同,但不会让 人对原始资料表达的信息造成误解。常用的有变换 编码和预测编码。
2020年10月12日星期一
6.1.4 压缩原理
数据压缩方法的分类
2020年10月12日星期一
一景物表面上采样点的颜色之间往往存在着空 间连贯性,但是基于离散像素采样来表示物体 颜色的方式通常没有利用这种连贯性。例如: 图像中有一片连续的区域,其像素为相同的颜 色,空间冗余产生。
2020年10月12日星期一
6.1.3 冗余的种类
2.时间冗余 序列图像中经常包含的冗余。一组连续的画面
之间往往存在着时间和空间的相关性,但是基 于离散时间采样来表示运动图像的方式通常没 有利用这种连贯性。例如:房间里的两个人在 聊天,在这个聊天的过程中,背景(房间和家 具)一直是相同的,同时也没有移动,而且是 同样的两个人在聊天,只有动作和位置的变化。
2020年10月12日星期一
6.1.5 压缩方法分类
2.变换编码
变换编码不是直接对空域图像信号进行编码,而是首 先将空域图像信号映射变换到另一个正交矢量空间 (变换域或频域),产生一批变换系数,然后对这些 变换系数进行编码处理。其中关键问题是在时域或空 域描述时,数据之间相关性大,数据冗余度大,经过 变换在变换域中描述,数据相关性大大减少,数据冗 余量减少,参数独立,数据量少,这样再进行量化, 编码就能得到较大的压缩比。 目前常用的正交变换有: 傅立叶 (Fouries)变换、沃尔什(Walsh)变换、哈尔(Haar) 变 换 、 斜 (Slant) 变 换 、 余 弦 变 换 、 正 弦 变 换 、 KL(Karhunen-Loeve)变换等。
有损压缩法,是指使用压缩后的数据进行解压缩, 解压之后的数据与原来的数据有所不同,但不会让 人对原始资料表达的信息造成误解。常用的有变换 编码和预测编码。
2020年10月12日星期一
6.1.4 压缩原理
数据压缩方法的分类
2020年10月12日星期一
三多媒体信息的压缩PPT优秀资料
频分辨率和视频显示分辨率(显示的像素点数)。 颜色数:指视频中最多能使用的颜色数。颜色位数越多,色彩越逼真,
数据量也越大。 压缩比:压缩比较小时对图像质量不会有太大影响,而超过一定倍数后,
将会明显看出图像质量下降,而且压缩比越大在回放时花费在解压的时 间越长。 关键帧:视频数据具有很强的帧间相关性,动态视频压缩正是利用帧间 相关性的特点,通过前后两个关键帧动态合成中间的视频帧。因此对于 含有频繁运动的视频图像序列,关键帧数少就会出现图像不稳定的现象。
JPEG主要不同的地方。而JPEG X2
0.
创作环境:用于创作的整套硬件、固化软件(永久性内建在硬件里的软件)和软件。
MPEG采用了帧间数据压缩、运动补偿和双向预测,这是和JPEG主要不同的地方。
分析合成方法,如LPC
和 MPEG 相 同 的 地 方 均 采 用 了 (2)模拟音频信号幅度太大,超过了量化器范围。
音频冗余主要表现为时域冗余度、频域冗 余度。
音频信号的编码方式大致分为三大类: 1).波形编码,如PCM、APC、SDC、ATC 2).分析合成方法,如LPC 3).混合编码方法
6.了解音频信号压缩编码标准,影响音频 信号质量的因素
7.视频信号压缩编码的标准(JPEG、 MPEG)
1).多媒体系统中图像压缩方法主要利用消除图像在空间上和时间上很强的相 关性带来的数据冗余度来满足应用要求。分为有损压缩和无损压缩两种类型。
另外,MPEG中视频信号包含有静止画面(帧内图)和运动 信息(帧间预测图)等不同的内容,量化器的设计比JPEG 压缩算法中量化器的设计考虑的因素要多。
难点分析2:
关于压缩比 衡量一个压缩算法好坏的标准,除了解压后的数据有无失真
或失真程度之外,是看压缩比的大小。压缩比常用的定义有 两种: 采样压缩比 采样压缩比=压缩前输入的总采样数/压缩后输出的总采样数 由于计算机中信号都是数字信号,通常要增加一些信息,以 便顺利解压。因此,下面的比特压缩比更实用。 比特压缩比 比特压缩比=压缩前输入的总比特数/压缩后输出的总比特数 不管具体采用哪种定义来计算压缩比,显然这两种定义都能 反映压缩前数据同压缩后数据之比。
数据量也越大。 压缩比:压缩比较小时对图像质量不会有太大影响,而超过一定倍数后,
将会明显看出图像质量下降,而且压缩比越大在回放时花费在解压的时 间越长。 关键帧:视频数据具有很强的帧间相关性,动态视频压缩正是利用帧间 相关性的特点,通过前后两个关键帧动态合成中间的视频帧。因此对于 含有频繁运动的视频图像序列,关键帧数少就会出现图像不稳定的现象。
JPEG主要不同的地方。而JPEG X2
0.
创作环境:用于创作的整套硬件、固化软件(永久性内建在硬件里的软件)和软件。
MPEG采用了帧间数据压缩、运动补偿和双向预测,这是和JPEG主要不同的地方。
分析合成方法,如LPC
和 MPEG 相 同 的 地 方 均 采 用 了 (2)模拟音频信号幅度太大,超过了量化器范围。
音频冗余主要表现为时域冗余度、频域冗 余度。
音频信号的编码方式大致分为三大类: 1).波形编码,如PCM、APC、SDC、ATC 2).分析合成方法,如LPC 3).混合编码方法
6.了解音频信号压缩编码标准,影响音频 信号质量的因素
7.视频信号压缩编码的标准(JPEG、 MPEG)
1).多媒体系统中图像压缩方法主要利用消除图像在空间上和时间上很强的相 关性带来的数据冗余度来满足应用要求。分为有损压缩和无损压缩两种类型。
另外,MPEG中视频信号包含有静止画面(帧内图)和运动 信息(帧间预测图)等不同的内容,量化器的设计比JPEG 压缩算法中量化器的设计考虑的因素要多。
难点分析2:
关于压缩比 衡量一个压缩算法好坏的标准,除了解压后的数据有无失真
或失真程度之外,是看压缩比的大小。压缩比常用的定义有 两种: 采样压缩比 采样压缩比=压缩前输入的总采样数/压缩后输出的总采样数 由于计算机中信号都是数字信号,通常要增加一些信息,以 便顺利解压。因此,下面的比特压缩比更实用。 比特压缩比 比特压缩比=压缩前输入的总比特数/压缩后输出的总比特数 不管具体采用哪种定义来计算压缩比,显然这两种定义都能 反映压缩前数据同压缩后数据之比。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图像(image)/视像(video) 数据——有损压缩
根据数据本身的冗余(Based on data redunased on human visual system)
2020/1/24
第2章 数据无损压缩
3
2.0 数据无损压缩概述(续1)
数据无损压缩的理论——信息论(information theory)
信息论之父介绍
The Father of Information Theory—— Claude Elwood Shannon
Born: 30 April 1916 in Gaylord, Michigan, USA
Died: 24 Feb 2019 in Medford, Massachusetts, USA
bell-labs/news/2019/february/26/1.html
2020/1/24
第2章 数据无损压缩
5
2.0 数据无损压缩概述(续3)
Claude Shannon ——The founding father of electronic communications age; American mathematical engineer In 1936~1940, MIT:
举例:假设X={a,b,c}是由3个事件构成的集合, p(a)=0.5,p(b)=0.25,p(b)=0.25分别是事件a, b和c出 现的概率,这些事件的信息量分别为,
I(a)=log2(1/0.50)=1 sh I(b)=log2(1/0.25)=2 sh I(c)=log2(1/0.25)=2 sh
三种多媒体数据类型
文字 (text)数据——无损压缩
根据数据本身的冗余(Based on data redundancy)
声音(audio)数据——有损压缩
根据数据本身的冗余(Based on data redundancy) 根据人的听觉系统特性( Based on human hearing system)
2.3 RLE编码 2.4 词典编码
2.4.1 词典编码的思想 2.4.2 LZ77算法 2.4.3 LZSS算法 2.4.4 LZ78算法 2.4.5 LZW算法
参考文献和站点
2020/1/24
第2章 数据无损压缩
2
2.0 数据无损压缩概述
数据可被压缩的依据
数据本身存在冗余 听觉系统的敏感度有限 视觉系统的敏感度有限
视听冗余
由于人的视觉系统和听觉系统的局限性,在图像数据和声 音数据中,有些数据确实是多余的,使用算法将其去掉后 并不会丢失实质性的信息或含义,对理解数据表达的信息 几乎没有影响
数据冗余
不考虑数据来源时,单纯数据集中也可能存在多余的数据, 去掉这些多余数据并不会丢失任何信息,这种冗余称为数 据冗余,而且还可定量表达
1948年创建的数学理论的一个分支学科,研究信息的编码、 传输和存储
该术语源于Claude Shannon (香农)发表的“A Mathematical Theory of Communication”论文题目,提议用二进制数据对信 息进行编码
最初只应用于通信工程领域,后来扩展到包括计算在内的其 他多个领域,如信息的存储、信息的检索等。在通信方面, 主要研究数据量、传输速率、信道容量、传输正确率等问题。
2020/1/24
第2章 数据无损压缩
6
2.1 数据的冗余
冗余概念
人为冗余
在信息处理系统中,使用两台计算机做同样的工作是提高 系统可靠性的一种措施
在数据存储和传输中,为了检测和恢复在数据存储或数据 传输过程中出现的错误,根据使用的算法的要求,在数据 存储或数据传输之前把额外的数据添加到用户数据中,这 个额外的数据就是冗余数据
多媒体技术基础(第3版)
第2章数据无损压缩
张奇
复旦大学 计算机科学技术学院 2019年4月
第2章 数据无损压缩目录
2.1 数据的冗余
2.1.1 冗余概念 2.1.2 决策量 2.1.3 信息量 2.1.4 熵 2.1.5 数据冗余量
2.2 统计编码
2.2.1 香农-范诺编码 2.2.2 霍夫曼编码 2.2.3 算术编码
2020/1/24
第2章 数据无损压缩
8
2.1 数据的冗余(续2)
信息量(information content)
具有确定概率事件的信息的定量度量
在数学上定义为
I( x ) lo g 2 [ 1 /p ( x ) ] lo g 2 p ( x )
其中, p ( x ) 是事件出现的概率
2020/1/24
第2章 数据无损压缩
7
2.1 数据的冗余(续1)
决策量(decision content)
在有限数目的互斥事件集合中,决策量是事 件数的对数值
在数学上表示为
H0=log(n) 其中,n是事件数
决策量的单位由对数的底数决定
Sh (Shannon): 用于以2为底的对数 Nat (natural unit): 用于以e为底的对数 Hart (hartley):用于以10为底的对数
Master's thesis, A symbolic analysis of relay and switching circuits
Doctoral thesis: on theoretical genetics
In 1948:
A mathematical theory of communication, landmark, climax (An important feature of Shannon's theory: concept of entropy )
数据无损压缩的方法
霍夫曼编码(Huffman coding ) 算术编码(arithmetic coding) 行程长度编码(run-length coding) 词典编码(dictionary coding)
……
2020/1/24
第2章 数据无损压缩
4
2.0 数据无损压缩概述(续2)
根据数据本身的冗余(Based on data redunased on human visual system)
2020/1/24
第2章 数据无损压缩
3
2.0 数据无损压缩概述(续1)
数据无损压缩的理论——信息论(information theory)
信息论之父介绍
The Father of Information Theory—— Claude Elwood Shannon
Born: 30 April 1916 in Gaylord, Michigan, USA
Died: 24 Feb 2019 in Medford, Massachusetts, USA
bell-labs/news/2019/february/26/1.html
2020/1/24
第2章 数据无损压缩
5
2.0 数据无损压缩概述(续3)
Claude Shannon ——The founding father of electronic communications age; American mathematical engineer In 1936~1940, MIT:
举例:假设X={a,b,c}是由3个事件构成的集合, p(a)=0.5,p(b)=0.25,p(b)=0.25分别是事件a, b和c出 现的概率,这些事件的信息量分别为,
I(a)=log2(1/0.50)=1 sh I(b)=log2(1/0.25)=2 sh I(c)=log2(1/0.25)=2 sh
三种多媒体数据类型
文字 (text)数据——无损压缩
根据数据本身的冗余(Based on data redundancy)
声音(audio)数据——有损压缩
根据数据本身的冗余(Based on data redundancy) 根据人的听觉系统特性( Based on human hearing system)
2.3 RLE编码 2.4 词典编码
2.4.1 词典编码的思想 2.4.2 LZ77算法 2.4.3 LZSS算法 2.4.4 LZ78算法 2.4.5 LZW算法
参考文献和站点
2020/1/24
第2章 数据无损压缩
2
2.0 数据无损压缩概述
数据可被压缩的依据
数据本身存在冗余 听觉系统的敏感度有限 视觉系统的敏感度有限
视听冗余
由于人的视觉系统和听觉系统的局限性,在图像数据和声 音数据中,有些数据确实是多余的,使用算法将其去掉后 并不会丢失实质性的信息或含义,对理解数据表达的信息 几乎没有影响
数据冗余
不考虑数据来源时,单纯数据集中也可能存在多余的数据, 去掉这些多余数据并不会丢失任何信息,这种冗余称为数 据冗余,而且还可定量表达
1948年创建的数学理论的一个分支学科,研究信息的编码、 传输和存储
该术语源于Claude Shannon (香农)发表的“A Mathematical Theory of Communication”论文题目,提议用二进制数据对信 息进行编码
最初只应用于通信工程领域,后来扩展到包括计算在内的其 他多个领域,如信息的存储、信息的检索等。在通信方面, 主要研究数据量、传输速率、信道容量、传输正确率等问题。
2020/1/24
第2章 数据无损压缩
6
2.1 数据的冗余
冗余概念
人为冗余
在信息处理系统中,使用两台计算机做同样的工作是提高 系统可靠性的一种措施
在数据存储和传输中,为了检测和恢复在数据存储或数据 传输过程中出现的错误,根据使用的算法的要求,在数据 存储或数据传输之前把额外的数据添加到用户数据中,这 个额外的数据就是冗余数据
多媒体技术基础(第3版)
第2章数据无损压缩
张奇
复旦大学 计算机科学技术学院 2019年4月
第2章 数据无损压缩目录
2.1 数据的冗余
2.1.1 冗余概念 2.1.2 决策量 2.1.3 信息量 2.1.4 熵 2.1.5 数据冗余量
2.2 统计编码
2.2.1 香农-范诺编码 2.2.2 霍夫曼编码 2.2.3 算术编码
2020/1/24
第2章 数据无损压缩
8
2.1 数据的冗余(续2)
信息量(information content)
具有确定概率事件的信息的定量度量
在数学上定义为
I( x ) lo g 2 [ 1 /p ( x ) ] lo g 2 p ( x )
其中, p ( x ) 是事件出现的概率
2020/1/24
第2章 数据无损压缩
7
2.1 数据的冗余(续1)
决策量(decision content)
在有限数目的互斥事件集合中,决策量是事 件数的对数值
在数学上表示为
H0=log(n) 其中,n是事件数
决策量的单位由对数的底数决定
Sh (Shannon): 用于以2为底的对数 Nat (natural unit): 用于以e为底的对数 Hart (hartley):用于以10为底的对数
Master's thesis, A symbolic analysis of relay and switching circuits
Doctoral thesis: on theoretical genetics
In 1948:
A mathematical theory of communication, landmark, climax (An important feature of Shannon's theory: concept of entropy )
数据无损压缩的方法
霍夫曼编码(Huffman coding ) 算术编码(arithmetic coding) 行程长度编码(run-length coding) 词典编码(dictionary coding)
……
2020/1/24
第2章 数据无损压缩
4
2.0 数据无损压缩概述(续2)