数字媒体压缩技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
? 在源数据中出现概率大的信号,分配的码字越 短;出现概率越小的信号,其码字越长,从而 达到用尽可能少的码表示源数据。
霍夫曼编码的算法
1. 初始化,根据符号概率的大小顺序对符号进行排序。
2. 把概率最小的两个符号组成一个新符号(节点),即 新符号的概率等于这两个符号概率之和。
3. 重复第2步,直到形成一个符号为止(树),其概率和 等于1。
? 不定长编码
– 变长行程编码是指对不同范围的行程长度使用不同位 数的二进制位数进行编码。使用变长行程编码需要增 加标志位来表明所使用的二进制位数。
? 行程编码的原理是在给定的图像数据中寻找连 续重复的数值,然后用两个字符取代这些连续 值。即将具有相同值的连续串用其串长和一个 代表值来代替,该连续串就称为行程,串长称 为行程长度。
行程编码
? 如图,假定一幅灰度图像,第 n行的像素值为:
1111 888 …… 888 1111 00000000000000
数据压缩分类
数据压缩分类
数据压缩方法分类
数字媒体压缩标准分类
统
预
变
分
计
测
换
析
编
编
编
—
码
码
码
合
成
编
码
图像压缩
视音频压缩
JPEG 等
运动图像
声音
MPEG
H.26x 系列
M AVS P
3
按信息压缩前后比较是否有损失进行划分
? 按信息压缩前后比较是否有损失,可以划分有 损压缩和无损压缩。
– 无损压缩指使用压缩后的数据进行重构,重构后的数 据与原来的数据完全相同。常用的无损压缩算法有霍 夫曼(Huffman)算法和LZW算法 。
第八章 数字媒体压缩技术
学习目标
? 1.了解数字媒体数据压缩的原因。 ? 2.理解数字媒体数据压缩技术的不同分类。 ? 3.了解通用的数据压缩编码算法,如霍夫曼编
码、词典编码、 PCM、DM算法。 ? 4. 掌握常见数字媒体编码标准的含义和目标
第八章 数字媒体压缩技术
? 8.1数据压缩及分类
– 8.1.1压缩的可能性与信息冗余 – 8.1.2数据压缩分类
? 设从N个数中选定任一个数xj的概率为p(xj),假定选定任 意一个数的概率都相等,即p(xj) =1/N,则
[ I(xj)=log2N=-log2 1/N =-log2p(xj)=I p(xj)]
上式中,p(xj)是信源X发出xj的概率,I(xj)的含义是信源X 发出xj这个消息(随机事件)后,接收端收到信息量的 量度。 ? 香农把它称为“信息熵” (Entropy),用符号 H 表示, 单位是比特。
? 通用压缩方法具有压缩比低、通用性强等特点
8.2.1编码的理论基础
? 数据压缩技术的理论基础是信息论 。
? 根据信息论的原理,可以找到最佳数据压缩编 码方法,数据压缩的理论极限是信息熵。
? 熵是信息量的度量方法,它表示某一事件出现 的消息越多,事件发生的可能性就越小,数学 上就是概率越小 。
信息与信息量
? 8.2通用的数据压缩技术
– 8.2.1编码的理论基础 – 8.2.2霍夫曼编码 – 8.2.3行程编码 – 8.2.4词典编码 – 8.2.5脉冲编码调制 – 8.2.6增量调制(DM) – 8.2.7差分脉冲编码调制
第八章 数字媒体压缩技术
? 8.3数字媒体压缩标准
– 8.3.1声音压缩标准 – 8.3.2图像压缩标准 – 8.3.3运动图象压缩标准
4. 分配码字。码字分配从最后一步开始反向进行,即从 最后两个概率开始逐渐向前进行编码,对于每次相加 的两个概率,给概率大的赋“0”,概率小的赋“1” (也可以全部相反,如果两个概率相等,则从中任选 一个赋“0”,另一个赋“1”)。
行程编码
? 行程编码又称行程长度编码( Run Length Encoding ,RLE),是一种熵编码。 这种编码方 法广泛地应用于各种图像格式的数据压缩处理 中。
为:
n
? P(xj)L(xj)
L c= j?1
(j=1,2,…, n )
? 其中:P(xj) 是信源X发出xj的概率,L(xj)为xj的 编码长。即 平均码长=∑概率*码长
8.2.2霍夫曼编码
? 霍夫曼编码( Huffman )是运用信息熵原理的一 种无损编码方法,这种编码方法根据源数据各 信号发生的概率进行编码。
? 8.3.3.1 MPEG标准 ? 8.3.3.2 H.26X系列视频标准 ? 8.3.3.3 AVS标准
8.1.1压缩的源自文库能性与信息冗余
? 数据能够被压缩的主要原因在于媒体数据中存 在数据的信息冗余 。信息量包含在数据之中, 一般的数据冗余主要体现在:
– 空间冗余 – 结构冗余 – 时间冗余 – 视觉冗余 – 知识冗余 – 信息熵冗余
信息熵(续)
? 信源X发出的 n个随机事件 xj(j=1,2,…,n)的平均 信息量为
n
H(X)=E{I(xj)}= ? ? P( xj) ?log2 P( xj) j?1
? 由上可得熵的范围为:
0≤ H(X) ≤ log 2 N
信息熵(续)
? 在编码中用熵值来衡量是否为最佳编码。若以 Lc 表示编码器输出码字的平均码长,其计算公式
? 信息量是指信源中某种事件的信息度量或含量。 一个事件出现的可能性愈小,其信息量愈多, 反之亦然。
? 若pi为第i个事件的概率为 0≤ pi ≤1,则该事件 的信息量为
? 一个信源包括的所有数据叫数据量,而数据量 中包含有冗余信息。 信息量 = 数据量-冗余量
信息熵
? 信息熵是信源所有可能事件的平均信息量 。
– 有损压缩是指使用压缩后的数据进行重构,重构后的 数据与原来的数据有所不同,但不影响人对原始资料 表达的信息造成误解。
按照媒体的类型进行压缩划分
? 图像压缩标准 ? 声音压缩标准 ? 运动图象压缩标准
8.2通用的数据压缩技术
? 通用数据压缩技术:
– 行程编码 – 字典编码 – 熵编码等 – PCM(脉冲调制编码) – DM(增量调制编码) – DPCM(自适应脉冲调制编码)
4 个 1 60 个 8
3个1
13 个 0
? 用RLE编码方法得到的代码为: 4160831130。代 码斜黑体表示的数字是行程长度,黑体字后面 的数字代表像素的颜色值。例如黑体字 60代表 有连续 60个像素具有相同的颜色值,它的颜色 值是8。
行程编码分类
? 定长编码
– 定长编码是指编码的行程长度所用的二进制位数固定
霍夫曼编码的算法
1. 初始化,根据符号概率的大小顺序对符号进行排序。
2. 把概率最小的两个符号组成一个新符号(节点),即 新符号的概率等于这两个符号概率之和。
3. 重复第2步,直到形成一个符号为止(树),其概率和 等于1。
? 不定长编码
– 变长行程编码是指对不同范围的行程长度使用不同位 数的二进制位数进行编码。使用变长行程编码需要增 加标志位来表明所使用的二进制位数。
? 行程编码的原理是在给定的图像数据中寻找连 续重复的数值,然后用两个字符取代这些连续 值。即将具有相同值的连续串用其串长和一个 代表值来代替,该连续串就称为行程,串长称 为行程长度。
行程编码
? 如图,假定一幅灰度图像,第 n行的像素值为:
1111 888 …… 888 1111 00000000000000
数据压缩分类
数据压缩分类
数据压缩方法分类
数字媒体压缩标准分类
统
预
变
分
计
测
换
析
编
编
编
—
码
码
码
合
成
编
码
图像压缩
视音频压缩
JPEG 等
运动图像
声音
MPEG
H.26x 系列
M AVS P
3
按信息压缩前后比较是否有损失进行划分
? 按信息压缩前后比较是否有损失,可以划分有 损压缩和无损压缩。
– 无损压缩指使用压缩后的数据进行重构,重构后的数 据与原来的数据完全相同。常用的无损压缩算法有霍 夫曼(Huffman)算法和LZW算法 。
第八章 数字媒体压缩技术
学习目标
? 1.了解数字媒体数据压缩的原因。 ? 2.理解数字媒体数据压缩技术的不同分类。 ? 3.了解通用的数据压缩编码算法,如霍夫曼编
码、词典编码、 PCM、DM算法。 ? 4. 掌握常见数字媒体编码标准的含义和目标
第八章 数字媒体压缩技术
? 8.1数据压缩及分类
– 8.1.1压缩的可能性与信息冗余 – 8.1.2数据压缩分类
? 设从N个数中选定任一个数xj的概率为p(xj),假定选定任 意一个数的概率都相等,即p(xj) =1/N,则
[ I(xj)=log2N=-log2 1/N =-log2p(xj)=I p(xj)]
上式中,p(xj)是信源X发出xj的概率,I(xj)的含义是信源X 发出xj这个消息(随机事件)后,接收端收到信息量的 量度。 ? 香农把它称为“信息熵” (Entropy),用符号 H 表示, 单位是比特。
? 通用压缩方法具有压缩比低、通用性强等特点
8.2.1编码的理论基础
? 数据压缩技术的理论基础是信息论 。
? 根据信息论的原理,可以找到最佳数据压缩编 码方法,数据压缩的理论极限是信息熵。
? 熵是信息量的度量方法,它表示某一事件出现 的消息越多,事件发生的可能性就越小,数学 上就是概率越小 。
信息与信息量
? 8.2通用的数据压缩技术
– 8.2.1编码的理论基础 – 8.2.2霍夫曼编码 – 8.2.3行程编码 – 8.2.4词典编码 – 8.2.5脉冲编码调制 – 8.2.6增量调制(DM) – 8.2.7差分脉冲编码调制
第八章 数字媒体压缩技术
? 8.3数字媒体压缩标准
– 8.3.1声音压缩标准 – 8.3.2图像压缩标准 – 8.3.3运动图象压缩标准
4. 分配码字。码字分配从最后一步开始反向进行,即从 最后两个概率开始逐渐向前进行编码,对于每次相加 的两个概率,给概率大的赋“0”,概率小的赋“1” (也可以全部相反,如果两个概率相等,则从中任选 一个赋“0”,另一个赋“1”)。
行程编码
? 行程编码又称行程长度编码( Run Length Encoding ,RLE),是一种熵编码。 这种编码方 法广泛地应用于各种图像格式的数据压缩处理 中。
为:
n
? P(xj)L(xj)
L c= j?1
(j=1,2,…, n )
? 其中:P(xj) 是信源X发出xj的概率,L(xj)为xj的 编码长。即 平均码长=∑概率*码长
8.2.2霍夫曼编码
? 霍夫曼编码( Huffman )是运用信息熵原理的一 种无损编码方法,这种编码方法根据源数据各 信号发生的概率进行编码。
? 8.3.3.1 MPEG标准 ? 8.3.3.2 H.26X系列视频标准 ? 8.3.3.3 AVS标准
8.1.1压缩的源自文库能性与信息冗余
? 数据能够被压缩的主要原因在于媒体数据中存 在数据的信息冗余 。信息量包含在数据之中, 一般的数据冗余主要体现在:
– 空间冗余 – 结构冗余 – 时间冗余 – 视觉冗余 – 知识冗余 – 信息熵冗余
信息熵(续)
? 信源X发出的 n个随机事件 xj(j=1,2,…,n)的平均 信息量为
n
H(X)=E{I(xj)}= ? ? P( xj) ?log2 P( xj) j?1
? 由上可得熵的范围为:
0≤ H(X) ≤ log 2 N
信息熵(续)
? 在编码中用熵值来衡量是否为最佳编码。若以 Lc 表示编码器输出码字的平均码长,其计算公式
? 信息量是指信源中某种事件的信息度量或含量。 一个事件出现的可能性愈小,其信息量愈多, 反之亦然。
? 若pi为第i个事件的概率为 0≤ pi ≤1,则该事件 的信息量为
? 一个信源包括的所有数据叫数据量,而数据量 中包含有冗余信息。 信息量 = 数据量-冗余量
信息熵
? 信息熵是信源所有可能事件的平均信息量 。
– 有损压缩是指使用压缩后的数据进行重构,重构后的 数据与原来的数据有所不同,但不影响人对原始资料 表达的信息造成误解。
按照媒体的类型进行压缩划分
? 图像压缩标准 ? 声音压缩标准 ? 运动图象压缩标准
8.2通用的数据压缩技术
? 通用数据压缩技术:
– 行程编码 – 字典编码 – 熵编码等 – PCM(脉冲调制编码) – DM(增量调制编码) – DPCM(自适应脉冲调制编码)
4 个 1 60 个 8
3个1
13 个 0
? 用RLE编码方法得到的代码为: 4160831130。代 码斜黑体表示的数字是行程长度,黑体字后面 的数字代表像素的颜色值。例如黑体字 60代表 有连续 60个像素具有相同的颜色值,它的颜色 值是8。
行程编码分类
? 定长编码
– 定长编码是指编码的行程长度所用的二进制位数固定