第4章 信源编码原理1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
空间和时间子抽样编码 预测编码 变换编码
熵编码 矢量量化 子带编码
混合编码方案(MPEG-1,MPEG-2)
① 空间和时间子抽样
② 统计编码
③ 基于运动估计和补偿的DPCM ④ 游程长度编码
⑤ 二维DCT
2019/5/17
通信工程系
30
4.2.3 图像编码算法的分类 2.新一代编码压缩算法
模型基编码 分形编码 小波变换编码 神经网络编码
2019/5/17
通信工程系
9
人耳对3 kHz-4 kHz范围的信号最为敏感
2019/5/17
通信工程系
10
人耳的特性2—对音高(音调)的感知
客观上用频率来表示声音的音高,其单位是Hz 主观感觉的音高单位则是“美(Mel)”,这也是
两个既不相同又有联系的单位。 人耳对频率的感觉也有一个范围。人耳可以听
熵编码的终极目的:使得最终的平均码长最短
常用的熵编码方法:
• Huffman编码
• 游程编码RLE(run-length coding)
• 算术编码
2019/5/17
通信工程系
42
游程编码主要用于量化后出现大量零系数的情 形,利用游程来表示连零码,以降低为表示零码所 用的数据量。
算术编码是20世纪80年代发展起来的一种熵编码 方法,它已渐渐受到人们的注意。它的基本原理是, 任何一个数据序列均可表示成0和1之间的一个间隔, 该间隔的位置与输入数据的概率分布有关。有关的实 验数据表明,在未知信源概率分布的大部分情形下, 算术编码要优于Huffman编码。
①在250 Hz、1 kHz、4 kHz和8 kHz纯音附近 ,对其他纯音的掩蔽效果最明显;
②低频纯音可以有效地掩蔽高频纯音,但高频纯 音对低频纯音的掩蔽作用则不明显。
2019/5/17
通信工程系
14
2) 时域掩蔽 时间上相邻的声音之间也有掩蔽现象,并且称
为时域掩蔽,或异时掩蔽。 时域掩蔽又分为超前掩蔽(pre-masking)和滞
2019/5/17
通信工程系
31
4.2.3 图像编码算法的分类 3.总结(1)
--无损压缩方法仅仅删除图像数据中的冗 余信息,回放压缩文件时,能够准确无 误地恢复原始数据。它可分为两大类: 基于统计概率的方法和基于字典的方法。
2019/5/17
通信工程系
32
基于统计概率的方法
基于统计概率的方法是依据信息论中的变长编 码定理和信息熵的有关知识,用较短代码代表出现概 率大的符号,用较长代码代表出现概率小的符号。
200~3400 50~7000 20~15000 20~20000 20~20000
音频信号数字化后必须要进行压缩编码。
2019/5/17
通信工程系
4
音频信号压缩编码的可能性
1)时间域冗余
---样值幅度分布的非均匀性 ---相邻样值的强相关性 ---主要信号之间的周期相关性 ---信号长周期内的相关性、静音的相关性
统计概率编码方法中最有代表性的是霍夫曼 (Huffman)编码方法。在H.264标准中,采用了基于上 下文自适应变字长编码,压缩效率得到了进一步提高。 另外算术编码是利用字符序列而不是单个字符进行编 码,其效率比Huffman编码方法高。
2019/5/17
通信工程系
33
基于字典的方法
基于字典的方法的数据压缩有两种: 一种是游程编码(Runing Length Coding,RLC),在 MPEG标准中使用; 另一种是LZW(Lampel、Ziv、Welch,三个人名)编 码。采用LZW编码时,可将数据文件生成特定字符 序列的表以及它们对应的代码。LZW编码对二值图 像可以得到非常显著的压缩效果,但对灰度图像压缩 效果不显著,其压缩比一般在1∶1.5~1∶3以内。
2019/5/17
通信工程系
43
4.3.1 预备知识-前缀码
设有一个由K个信源符号(以下简称符号)组成的离散、 无记忆符号集:
{a1, a2 ,, ak ,, aK }
图像信号帧内相关性
×8倍
2019/5/17
通信工程系
23
4.2.1 视频数据压缩基理
图像信号帧间相关性
2019/5/17
通信工程系
24
4.2.1 视频数据压缩基理
② 信号统计上的冗余度来源于被编码信号概率密 度分布的不均匀
预测编码:不直接传送图像信号,而传送图象 信号之间的差值。这种差值呈拉普拉斯分布。
2019/5/17
通信工程系
34
4.2.3 图像编码算法的分类 3.总结(2) --有损压缩算法靠丢掉大量冗余信息来降
低数字图像所占的空间,回放时也不能 完整地恢复原始图像,而将有选择地损 失一些细节,损失多少信息由需要多高 的压缩率决定。
2019/5/17
通信工程系
35
有损压缩最常用的方法是空间和时间亚抽样编码。 在某些(如VCD和电视电话等)应用中,高分辨率不是必需 的。这时,我们可以使用空间和时间亚抽样来降低数据速率。 在编码器中,从每几个像素中选择一个像素,从一帧的两场 中取一场,或从每几帧中选择一帧,然后加以传输。在译码 器中,可根据接收的像素和帧内插丢失的像素、场和帧,再 生出分辨率较低的原始视频序列。 如果像素是由色度和亮度分量表示的,那么可以以较高 的比率(如2∶1或4∶1)对色度分量进行亚抽样,量化更粗略 一些,这是因为人眼对色度分量的高频分量敏感性较低。
2019/5/17
通信工程系
28
4.2.2 图像编码过程
信号映射和统计编码是可逆的过程,而量 化是不可逆的。
当不加入量化时,通过解码端的反映射和 统计解码可无失真地恢复原始信号;加入量化 后,编解码过程造成的失真完全由量化引起。
2019/5/17
通信工程系
29
4.2.3 图像编码算法的分类
1.传统的图像编码技术
1) 频域掩蔽
强纯音会掩蔽在其附近同时发声的弱纯音,这
种特性称为频域掩蔽,也称同时掩蔽。
2019/5/17
通信工程系
12
声强为60 dB、频率为1000 Hz纯音的掩蔽效应
2019/5/17
通信工程系
13
频率为250 Hz、1 kHz、4 kHz和8 kHz纯音的 掩蔽效应,它们的声强均为60 dB。
2019/5/17
通信工程系
20
4.2.1 视频数据压缩基理
1.视频图像数据压缩基理主要来自两个方面: 1) 图像信号中存在大量冗余度可供压缩,且这种
冗余度在解码后还可无失真地恢复; 2) 利用人的视觉特性,在不被主观视觉察觉的容
限内,通过减少表示信号的精度,以一定的客 观失真换取数据压缩。
2019/5/17
2019/5/17
通信工程系
17
3)量化噪声使得不必对原始信号的全幅度进行编码。
2019/5/17
通信工程系
18
4)通过子带分割来进行优化、编码。
2019/5/17
通信工程系
19
4.2 视频压缩编码概述
视频压缩编码技术是学习数字电视的重点内容
为什么要进行视频压缩?
一路彩色DVD电视未经压缩时的数据量为: Y 13.5MHz×8bit=108Mb/s U 6.75MHz×8bit=54Mb/s V 6.75MHz×8bit=54Mb/s 合计=216Mb/s 图像是有必要也有可能被压缩。
2019/5/17
通信工程系
25
4.2.1 视频数据压缩基理
预测编码时, 出现概率高的预测误差信号(0及小误差) -短码, 出现概率低的大预测误差-长码, 总的平均码长要比用固定码长编码短很多。
2019/5/17
通信工程系
26
4.2.1 视频数据压缩基理
3.利用人眼的视觉特性进行压缩 人眼对图像的细节分辨率、运动分辨率
2019/5/17
通信工程系
36
4.2.3 图像编码算法的分类
2019/5/17
通信工程系
37
4.2.3 图像编码算法的分类
2019/5/17
通信工程系
38
4.2.4 图像编码压缩比
压缩比= 未压缩前的总数据 压缩后的总数据
由于压缩技术层出不穷,图像编码的压缩比不 断提高,它遵循Musmann定律。Musmann 定律是 以德国著名图像专家Musmann教授命名的。
通信工程系
21
4.2.1 视频数据压缩基理
2.图像信号的冗余度
图像信号的冗余度存在于结构和统计两方面。 ① 图像信号的结构冗余度 图像信号结构上的冗余度表现为很强的空间
(帧内的)和时间(帧间的)Biblioteka Baidu关性
帧内相邻点的相关性
帧间相邻点的相关性
2019/5/17
通信工程系
22
4.2.1 视频数据压缩基理
和对比度分辨率都有一定的限度
2019/5/17
通信工程系
27
4.2.2 图像编码过程
图像编码过程分三步完成: ① 映射:即变换一下描写信号的方式。
目的:去除相关性,降低图像的结构冗 余度。
② 量化:在满足对图像质量一定要求的前 提下,减小表示信号的精度 目的:利用人眼主观视觉特性压缩图像
③ 统计编码 目的:消除图像的统计冗余度。
叫做“零方等响度级”曲线,也称“绝对听
阈”曲线,即在安静环境中,能被人耳听到
的纯音的最小值。
另一种极端的情况是音频强到使人耳感到疼 痛。实验表明,如果频率为1 kHz的纯音的 声强级达到120 dB左右时,人的耳朵就感到 疼痛,这个阈值称为“痛阈”。
2019/5/17
通信工程系
8
“听阈-频率”曲线
2019/5/17
通信工程系
5
音频信号压缩编码的可能性
2)频率域冗余: --- 长时功率谱密度的非均匀性 --- 话音特有的短时功率谱密度
3)听觉冗余 --- 人耳对信号幅度的分辨能力是有限的 --- 人耳对频率的分辨能力是有限的
2019/5/17
通信工程系
6
人耳的特性1—对响度的感知
声音的响度就是声音的强弱。 在物理上(客观),声音的响度使用客观测量
2019/5/17
通信工程系
39
2006年4月,Musmann教授在北京主持了“图像编码的 过去与未来”专题讨论会,并首先发言,对图像编码压缩技 术的过去几十年工作作了总结,他认为广播质量的视频编码 的压缩比大约每5年翻一番,被公认为Musmann定律。
2019/5/17
通信工程系
40
4.3 熵编码 熵
数字电视技术
第四章 信源编码原理
信源编码: 对原始信号进行压缩编码表示,实现 比特率压缩的过程。
电视的原始信号:声音和图像
2019/5/17
通信工程系
2
4.1 数字音频编码的基本原理
音频信号数字化后可以: 1)避免模拟信号容易受噪声和干扰的影响; 2)可以扩大音频的动态范围; 3)可以利用计算机进行数据处理; 4)可以不失真地远距离传输; 5)可以与图像、视频等媒体信息进行多路复用。
到的最低频率约20 Hz,最高频率约20000 Hz
2019/5/17
通信工程系
11
人耳的特性3—掩蔽效应
一种频率的声音阻碍听觉系统感受另一种频率 的声音的现象称为掩蔽效应。前者称为掩蔽声 音 (masking tone) , 后 者 称 为 被 掩 蔽 声 音 (masked tone)。
掩蔽可分成频域掩蔽和时域掩蔽。
——来自于信息论 ——信息论中信源编码的两个主要问题:
1)数据压缩的理论极限 2)数据压缩的方法和途径
——去除图像信源像素值的概率分布不均匀性 ——基于图像的统计特性,故也称为统计编码
2019/5/17
通信工程系
41
4.3 熵编码
熵编码的基本原理:给出现概率较大的符号一 个短码字,而给出现概率较小的符号一个长码 字
2019/5/17
通信工程系
3
质量 等级
电话 话音 AM
采样频率 /kHz
8
量化 精度 /bit
8
11.025
8
FM
22.05
16
CD
44.1
16
DAT
48
16
声道数 数码率(未压缩) 频带/ Hz / kbit/s
单声道 单声道 双声道 双声道 双声道
64 88.2 705.6 1411.2 1536
单位来度量,即dyn/cm2(达因/平方厘米)(声 压)或W/cm2(瓦特/平方厘米)(声强)。 在心理上(主观),主观感觉的声音强弱使用 “方(phon)” 来度量。
2019/5/17
通信工程系
7
当音频弱到人的耳朵刚刚可以听见时,我们 称此时的音频强度为“听阈”。
实验表明,听阈是随频率变化的。测出的“ 听阈-频率”曲线图中最靠下面的一根曲线
后掩蔽(post-masking)。 超前掩蔽较短,只有大约5~20 ms,而滞后
掩蔽可以持续50~200 ms。
2019/5/17
通信工程系
15
4、听觉感知编码的编码思路 1)根据听觉域度对可闻信号进行编码。
听觉域度对编码的作用
2019/5/17
通信工程系
16
2)根据掩蔽效应,只对幅度强的掩蔽信号进行编码。