数据压缩预测编码

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
19
5.6 视频信号与视觉感知
二、数字化格式
CCIT601:对彩色电视信号的亮度和色差采样编码
采样频率:13.5MHz(亮度)
20
5.6 视频信号与视觉感知
采样频率:13.5MHz(亮度) 1) 采样定理 2) 行频的整数倍 3) 兼容三种国际标准制式 取样结构:4:4:4 4:2:2 4:1:1
当 {xk }广义平稳时有
R(k i, k j) R(i j) R( j i)
4
5.2 最佳线性预测
得到 R(0)
R(1)
R(1)
R(0)
R(N 1) R(N 2)
R(N 1) a1 R(1)
R( N
2)a2
R(2)
R(0)
aN
R(N )
实对称的 Toeplitz矩阵,正定,可逆。
一、语音信号的时域冗余度
1、幅度非均匀分布 2、样本间的相关性 3、基音之间的相关性 语音 浊音(嗓音)
清音(非嗓音) 4、话音间隔 5、长时自相关函数
8
5.3 音频信号与听觉感知
二、语音信号的频域冗余度
1、非均匀的长时功率谱密度
2、语音特有的短时功率谱密度
9
5.3 音频信号与听觉感知
三、单音的听觉感知
1986-1990 ITU-T 制定的语音编码标准技术基础
4)LPC声码器: 不传送预测误差,传送参数
波形编码
参数编码
13
5.4 语音信号的预测编码
5)混合编码
RELP: 残差激励线性预测 CELP:码激励线性预测(1984 提出) LD-CELP:低时延的码激励线性预测(G.728建议,1992) ACELP:代数码激励线性预测(G.723.1建议,1996) CS-ACELP:共轭结构代数码激励线性预测(G.729建议,1996)
近无损、无损压缩标准,1998正式公布 JPEG-LS编码系统
1)基于上下文的建模 计算其邻域点变化量 判断进入预测还是游程
17
5.5 静止图像的预测编码
2)预测 自适应非线性预测 =
3)常规模式的误差编码 4)游程模式
18
5.6 视频信号与视觉感知
一、电视信号概述
PAL 25帧/s 625行 视频带宽6M
若{xk }为N 阶马尔克夫过程,则用N 阶预测。
例5-2 设 {为xk }一阶马尔克夫序列,其相关系数
求解 a的i 公式
若N =1,则
6
5.2 最佳线性预测
误差:
2 em
in

若加大N =2,
与N =1时的预测表达式完全相等。
7
5.3 音频信号与听觉感知
人耳可听到的声音频率范围:20Hz~20KHz
14
5.5 静止图像的预测编码
一、预测器设计
1、预测器 一维预测: 二维预测: 三维预测:
2、相关性的强弱
3、阶数选择 4、预测器实现
5、系数确定
15
5.5 静止图像的预测编码
二、JPEG无损压缩模式
空间域无量化DPCM,Huffman或算术编码
16
5.5 静止图像的预测编码
三、JPEG-LS压缩标准
如果{xk } 各态历经的且N 足够大
R(k)
1 N
N
xi xik
i 1
由上述方法求出的最佳预测系数得到的最小均方误差
N
2 m in
R(0)
ai R(i)
i 1
5
5.2 最佳线性预测
二、预测阶数的选择
当N 足够大使预测误差不相关 E{ekek j} 0( j 0) 再增大N 不会使均方误差在减小。
E{xk xki} E{xˆk xki}
3
5.2 最佳线性预测
定义自相关函数 R(i, j) E{xi x j}
得到
N
R(k, k i) E{xˆk xki} E{ ai xk j xki}
N
j 1
ai R(k j, k i)
j 1
由于自相关函数满足
R(k j, k i) R(k i, k j)
第5章 预测编码
预测
具有M 种取值的符号序列{xk},第L 符号的熵满足:
log 2 M H (xL ) H (xL | xL1) H (xL | xL1, xL2 ) H (xL | xL1, xL2 , , x1) H
1
第5章 预测编码
5.1 DPCM基本原理
工作过程:1)先发送 x0 ~ xN 1 2)在 x0 ~ xN1基础上进行预测,得到预测值; 3)差分,量化和编码 4)重复一样的过程,预测器必须相同
波形编码:被编码的语音信号与重建信号波形基 本相同。
语声编码:重建信号听起来与原始声音基本一样 混合编码:综合两种方法 。 几个阶段: 1)增量调制 DM, Delta modulation
ek xk xˆk xk xk1
12
5.4 语音信号的预测编码
2)DPCM
3)ADPCM
预测器或量化器中引入自适应调节
2~4kHZ 低 <40Hz或>16kHz高 3)相位:对相位感知不敏感
10
5.3 音频信号与听觉感知 三、多音的掩蔽效应
掩蔽效应:一个声音的存在会影响人耳对另一 个声音的听觉能力。
掩蔽阈:单音都有一个掩蔽阈 其声压级越高,对其周围频率声音的 掩蔽效应越强。
11
5.4 语音信号的预测编码
一、基于预测的语音压缩技术
2
5.2 最佳线性预测
非时变线性预测:
wk.baidu.com
N
xˆk ai xki i 1
预测误差:
N
ek xk xˆk xk ai xki i 1
一、MMSE线性预测
预测误差的均方值
2 e
E{( xk
xˆk )2}
MSE最小的必要条件
2 e
ai
E{2(xk
xˆk
)
xˆk ai
}
0
E{( xk xˆk )xki} 0
数码率:r=(13.5+6.75+6.75)*8=216Mb/s r=3*13.5*8=324Mb/s
21
5.6 视频信号与视觉感知
三、电视信号的冗余度
空间冗余: 时间冗余(帧间冗余):
帧间差值 d (m, n) x (m, n) x 1(m, n)
对相邻两帧图像进行测试 黑白图像:帧间差值超过3的像素不到4% 变化剧烈的彩色序列:亮度>6 只有7.5% 色度 只有千分之7.5
人类听觉系统(HAS,Human Auditory System) 带通滤波器组,一系列带宽递增的带通滤波器组成
可闻阈(听觉阈):人耳刚能听见的声压级 疼痛阈:使人耳有痛感的声压级 听觉范围:疼痛阈和可闻阈之差 HAS表现特性(纯音) 1)响度:与频率有关 1kHz/10dB 200Hz/30dB 2)频率:可闻阈与频率有关
相关文档
最新文档