压缩编码标准.

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

利用什么原理来进行压缩?
数据中存在冗余空间冗余（前后图象之间存在相关性）结构冗余（具有纹理结构的图象区域）知识冗余（具有规律性的结构，用于图象理解上，如人脸）视觉或听觉冗余（人眼或人耳具有一定的掩蔽效应）统计冗余（出现的频率具有一定的规律性，如元音多，有些辅音很少出现）信息熵冗余（又叫编码冗余，用相同位数进行编码产生的冗余）
正交变换前两个样本的联合事件正交变换后两个样本的联合事件
百度文库
原始信号为：s，预测器产生的预测值为：编码器 s” 预测误差：e=s-s” 发送端：发送经过量化的误差e’ 接收端：用相同的预测器获得预测值s”, 输出s’=s”+e’
输入 s + + e
量化器
e’
编码器
信道
s”
+
预测器
s’
最终误差为： s’-s = s”+e’-s = e’ – (s-s”) = e’-e

基本概念
多媒体数据为什么要压缩?
声音、图像、视频和动画的数据量太大 1分钟立体声音乐（采样频率为44.1KHZ，16位量化精度）的数据量： 44.1 * 1000 * 16 * 2 *60 / 8 =10.09MB 存储一首4分钟的歌曲约需40MB 1副640*480的彩色图像（RGB颜色模式）的存储容量为： 640*480 * 24 / 8 = 900KB 那么1秒钟（25帧/秒）的视频数据量为 25*900KB = 21.97 MB 1张650MB的CD ROM光盘只能存储约 650 / 21.97 = 29.59 秒的视频数据
2. 行程编码（游程编码）
原理:将连续相同的数据序列用重复次数和单个数据来表示。编码格式：控制符+重复次数+被重复字符应用：用于图像文件的压缩（尤其适合于由计算机生成的图像）如bmp和tif等图像格式。例：字符串为：atttefppppppddddss 行程编码为：a*3tef*6p*4d*2s 其中：* 为控制字符（重复次数在3次以上才有压缩的意义，重复次数越多压缩比越高）
3. 变换编码: 将图像信号从一个域（如时间域）变换到另外一个域（如频率域），然后
对变换后的信号进行量化与编码。
原始信号输入变换量化编码编码信号输出
例:有两个相邻的数据样本x1和x2,每个样本采用3bit编码,各自都有23=8个幅度等级,两个样本的联合事件共有 23×23 =64 种可能,如下左图用64个坐标点表示,对一般的像来说,两个相邻的数据样本很有可能出现近似的幅度,即很可能出现在x1=x2直线附近。
补充:多媒体数据压缩技术.
1. 多媒体数据压缩的基本概念和方法
压缩的基本概念数据压缩分类数据压缩的评价标准
2. 数据压缩的常用编码方法
PCM编码预测编码变换编码行程编码霍夫曼编码
3. 多媒体数据压缩编码的国际标准
音频压缩编码标准
静态图像压缩标准动态图像压缩标准视频压缩编码标准
2
预测编码
3
变换编码
1. PCM（Pulse Code Modulation,脉冲编码调制）
(1) (2) (3) 采样：按固定时间间隔获取一个样本值量化：按允许的误差将样本对应到近似的数值（幅度上的离散化）。有均匀量化和非均匀量化。编码：用二进制代码表示采样量化后的样本值。
2.预测编码（1）DPCM(差分脉冲编码调制)
例1：字母A B C D E出现的概率分别为0.15、0.25、0.1、0.37和0.13，其霍夫曼编码为： A: 00 B: 10
0 P(ACEBD)=1 1
C: 010 D: 11 E: 011
0 1 P(ACE)=0.38
P(BD)=0.62
0 1
假设共有100个字符,若采用等长编码，每个字符至少需要3位二进制，100个字母需要300位，采用霍夫曼编码则只需要 15*2+25*2+10*3+37*2+13*3=223位。压缩比为 300：223 = 1.34：1
若采用等长编码，至少需要3位二进制，100个字母需要300位，采用霍夫曼编码则需要: 53*1+25*2+7*4+5*4+10*3=181位压缩比为 300：181 = 1.65:1
P(EDC)=0.22 0 P(E)=0.1 1
P(DC)=0.12 0 P(D)=0.05 1 P(C)=0.07 0
解码信号输出反变换解码
编码信号输入
变换编码的工作原理图
对该数据进行正交变换，将坐标系逆时针旋转45度，如下右图所示，在新坐标系中 y1对应到x1=x2这条直线，那么变换后的数据样本集中在y1轴上，对这部分集中的数据进行量化、编码和传输，其他数据不做处理，这样就达到了压缩数据的目的。
常用的变换编码方法有： 1、K-L变换 2、傅立叶变换 3、离散余弦变换等
编码方法
霍夫曼编码
2
行程编码
3
算术编码
1. 霍夫曼（Huffman）编码
算法步骤：

（1）按照符号出现的概率大小进行排序（2）把最小的两个概率值相加，得到一个新的概率序列（3）重复上述两个步骤，直到概率值为1 （4）从后往前进行编码，概率大的赋予1，概率小的赋予0。（反过来也可以) （5）写出每个符号的码字
（3）帧间预测编码
利用视频图像各帧之间的时间相关性，减少帧内图像信号的冗余，即不直接传送当前帧的像素值，而是传送x和其前一帧或后一帧对应像素x’之间的差值。
运动补偿的帧间预测帧间内插法
（4）线性预测编码（Linear Predictive Coding,LPC）
是一种类似于人类语音产生方式、采用周期性的脉冲激活过滤器的语音编码方案。采用过去的样本值，以一种前向反馈的方式预测当前采样值，预测值可以用过去p 个样本值的线性组合来表示。该方法被广泛应用于语音处理。
（即量化器产生的量化误差）
解码器输出
s’
+ e’
编码器
+
信道
预测器
s”
（2）ADPCM（自适应脉冲编码调制）
1）自适应量化：当信号分布不均匀时，能随输入信号的变化改变量化区间的大小。 2）自适应预测：采用过去的样本值估算下一个输入样本的预测值，得到最小的实际样本值与预测值之间的差值。（避免DPCM方法中的误差扩散）
数据压缩的分类
无损压缩有损压缩
霍夫曼编码
行程编码
算术编码
PCM编码
预测编码
变换编码
混合编码
DPCM编码
离散余弦变换 K-L变换小波变换
JPEG MPEG H.261
数据压缩的评价标准
ADPCM编码
压缩比：越大越好压缩质量：数据失真越小越好压缩与解压缩的速度：速度越快越好
帧间预测编码
常用的压缩编码方法
二、有损压缩：压缩时会丢失部分数据，且丢失的数据无法恢复。是不可逆的压缩，即解压缩以后的数据与原始数据不完全一致。
序号编码方法基本原理
1
PCM编码将模拟量经过采样、量化和编码得到其数字编码。（脉冲编码调制）根据算法模型，用已有的样本值对新样本进行预测，得到一个预测值，将实际值与预测值相减得到预测误差，再对该误差值进行编码，如果预测越准确，误差值就越小（那误差的幅度肯定小于原始信号），那编码所需的位数就可以减少，达到压缩的目的。将原始信号从一个域（如时间域）变换到另一个域（如频率域），然后对变换后的信号进行编码。主要用于图像数据的压缩。
P(A)=0.15
P(CE)=0.23
0 P(C)=0.1 1 P(E)=0.13
P(B)=0.25
P(D)=0.37
例2：字母A B C D E出现的概率分别为0.53、0.25、0.07、0.05和0.1，其霍夫曼编码为：
A: 1 B: 01 C: 0011 D: 0010 E: 000
0 P(EDCB)=0.47 1 P(B)=0.25 P(A)=0.53 0 P(EDCBA)=1 1
一、无损压缩：减少或去除数据中的冗余，可以无失真地还原成原来的数据，
一般适合压缩数据或程序，但是压缩比较小，一般在2：1到5：1之间。序号 1 基本原理利用不同码字出现的概率不同，出现概率大的码字短，出现概率小的码字长。将重复出现的数值序列采用出现次数和单个数值来表示将编码的消息表示成0到1之间的一个间隔，消息越长，间隔就越小，编码所需二进制位数越多。