压缩编码标准.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用什么原理来进行压缩?
数据中存在冗余 空间冗余(前后图象之间存在相关性) 结构冗余(具有纹理结构的图象区域) 知识冗余(具有规律性的结构,用于图象理解上,如人脸) 视觉或听觉冗余(人眼或人耳具有一定的掩蔽效应) 统计冗余(出现的频率具有一定的规律性,如元音多,有些辅音很少出现) 信息熵冗余(又叫编码冗余,用相同位数进行编码产生的冗余)
正交变换前两个样本的联合事件 正交变换后两个样本的联合事件
百度文库
原始信号为:s,预测器产生的预测值为: 编码器 s” 预测误差:e=s-s” 发送端:发送经过量化的误差e’ 接收端:用相同的预测器获得预测值s”, 输出s’=s”+e’
输入 s + + e
量化器
e’
编码器
信道
s”
+
预测器
s’
最终误差为: s’-s = s”+e’-s = e’ – (s-s”) = e’-e
基本概念
多媒体数据为什么要压缩?
声音、图像、视频和动画的数据量太大 1分钟立体声音乐(采样频率为44.1KHZ,16位量化精度)的数据量: 44.1 * 1000 * 16 * 2 *60 / 8 =10.09MB 存储一首4分钟的歌曲约需40MB 1副640*480的彩色图像(RGB颜色模式)的存储容量为: 640*480 * 24 / 8 = 900KB 那么1秒钟(25帧/秒)的视频数据量为 25*900KB = 21.97 MB 1张650MB的CD ROM光盘只能存储约 650 / 21.97 = 29.59 秒的视频数据
2. 行程编码(游程编码)
原理:将连续相同的数据序列用重复次数和单个数据来表示。 编码格式:控制符+重复次数+被重复字符 应用:用于图像文件的压缩(尤其适合于由计算机生成的图像) 如bmp和tif等图像格式。 例:字符串为:atttefppppppddddss 行程编码为:a*3tef*6p*4d*2s 其中:* 为控制字符(重复次数在3次以上才有压缩的意 义,重复次数越多压缩比越高)
3. 变换编码: 将图像信号从一个域(如时间域)变换到另外一个域(如频率域),然后
对变换后的信号进行量化与编码。
原始信号输入 变换 量化 编码 编码信号输出
例:有两个相邻的数据样本x1和x2,每 个样本采用3bit编码,各自都有23=8个 幅度等级,两个样本的联合事件共有 23×23 =64 种可能,如下左图用64个 坐标点表示,对一般的像来说,两个相 邻的数据样本很有可能出现近似的幅 度,即很可能出现在x1=x2直线附近。
补充:多媒体数据压缩技术.
1. 多媒体数据压缩的基本概念和方法
压缩的基本概念 数据压缩分类 数据压缩的评价标准
2. 数据压缩的常用编码方法
PCM编码 预测编码 变换编码 行程编码 霍夫曼编码
3. 多媒体数据压缩编码的国际标准
音频压缩编码标准
静态图像压缩标准 动态图像压缩标准 视频压缩编码标准
2
预测编码
3
变换编码
1. PCM(Pulse Code Modulation,脉冲编码调制)
(1) (2) (3) 采样:按固定时间间隔获取一个样本值 量化:按允许的误差将样本对应到近似的数值(幅度上的离散 化) 。有均匀量化和非均匀量化。 编码:用二进制代码表示采样量化后的样本值。
2.预测编码 (1)DPCM(差分脉冲编码调制)
例1:字母A B C D E出现的概率分别为0.15、0.25、0.1、0.37和0.13,其霍夫曼编码为: A: 00 B: 10
0 P(ACEBD)=1 1
C: 010 D: 11 E: 011
0 1 P(ACE)=0.38
P(BD)=0.62
0 1
假设共有100个字符,若采用等长编码, 每个字符至少需要3位二进制,100个字 母需要300位,采用霍夫曼编码则只需要 15*2+25*2+10*3+37*2+13*3=223位。 压缩比为 300:223 = 1.34:1
若采用等长编码,至少需要3位二进 制,100个字母需要300位,采用霍 夫曼编码则需要: 53*1+25*2+7*4+5*4+10*3=181位 压缩比为 300:181 = 1.65:1
P(EDC)=0.22 0 P(E)=0.1 1
P(DC)=0.12 0 P(D)=0.05 1 P(C)=0.07 0
解码信号输出 反变换 解码
编码信号输入
变换编码的工作原理图
对该数据进行正交变换,将坐标系逆时针 旋转45度,如下右图所示,在新坐标系中 y1对应到x1=x2这条直线,那么变换后的 数据样本集中在y1轴上,对这部分集中的 数据进行量化、编码和传输,其他数据不 做处理,这样就达到了压缩数据的目的。
常用的变换编码方法有: 1、K-L变换 2、傅立叶变换 3、离散余弦变换等
编码方法
霍夫曼编码
2
行程编码
3
算术编码
1. 霍夫曼(Huffman)编码
算法步骤:
(1)按照符号出现的概率大小进行排序 (2)把最小的两个概率值相加,得到一个新的概率序列 (3)重复上述两个步骤,直到概率值为1 (4)从后往前进行编码,概率大的赋予1,概率小的赋予0。 (反过来也可以) (5)写出每个符号的码字
(3)帧间预测编码
利用视频图像各帧之间的时间相关性,减少帧内图像信号的冗余,即不直接传送 当前帧的像素值,而是传送x和其前一帧或后一帧对应像素x’之间的差值。
运动补偿的帧间预测 帧间内插法
(4) 线性预测编码(Linear Predictive Coding,LPC)
是一种类似于人类语音产生方式、采用周期性的脉冲激活过滤器的语音编码方案。 采用过去的样本值,以一种前向反馈的方式预测当前采样值,预测值可以用过去p 个样本值的线性组合来表示。该方法被广泛应用于语音处理。
(即量化器产生的量化误差)
解码器 输出
s’
+ e’
编码器
+
信道
预测器
s”
(2)ADPCM(自适应脉冲编码调制)
1)自适应量化:当信号分布不均匀时,能随输入信号的变化改变量化区间的大小。 2)自适应预测:采用过去的样本值估算下一个输入样本的预测值,得到最小的实际 样本值与预测值之间的差值。(避免DPCM方法中的误差扩散)
数据压缩的分类
无损压缩 有损压缩
霍夫曼编码
行程编码
算术编码
PCM编码
预测编码
变换编码
混合编码
DPCM编码
离散余弦变换 K-L变换 小波变换
JPEG MPEG H.261
数据压缩的评价标准
ADPCM编码
压缩比:越大越好 压缩质量:数据失真越小越好 压缩与解压缩的速度:速度越快越好
帧间预测编码
常用的压缩编码方法
二、有损压缩:压缩时会丢失部分数据,且丢失的数据无法 恢复。是不可逆的压缩,即解压缩以后的数据与原始数据不 完全一致。
序号 编码方法 基本原理
1
PCM编码 将模拟量经过采样、量化和编码得到其数字编码。 (脉冲编码调制) 根据算法模型,用已有的样本值对新样本进行预测, 得到一个预测值,将实际值与预测值相减得到预测 误差,再对该误差值进行编码,如果预测越准确, 误差值就越小(那误差的幅度肯定小于原始信号), 那编码所需的位数就可以减少,达到压缩的目的。 将原始信号从一个域(如时间域)变换到另一个域 (如频率域),然后对变换后的信号进行编码。主 要用于图像数据的压缩。
P(A)=0.15
P(CE)=0.23
0 P(C)=0.1 1 P(E)=0.13
P(B)=0.25
P(D)=0.37
例2:字母A B C D E出现的概率分别为0.53、0.25、0.07、0.05和0.1,其霍 夫曼编码为:
A: 1 B: 01 C: 0011 D: 0010 E: 000
0 P(EDCB)=0.47 1 P(B)=0.25 P(A)=0.53 0 P(EDCBA)=1 1
一、无损压缩:减少或去除数据中的冗余,可以无失真地还原成原来的数据,
一般适合压缩数据或程序,但是压缩比较小,一般在2:1到5:1之间。 序号 1 基本原理 利用不同码字出现的概率不同,出现概率大的码 字短,出现概率小的码字长。 将重复出现的数值序列采用出现次数和单个数值 来表示 将编码的消息表示成0到1之间的一个间隔,消息 越长,间隔就越小,编码所需二进制位数越多。