图像编码方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
qn为 化 的 化 差, n为 化 输 信 。 e′ 量 器 出 号 量 器 量 误 ′ qn = en −en 接 端 出 fn 收 输 为 ′ ′ ˆ ′ fn = fn + en 那 在 收 复 的 素 fn与 送 的 输 么 接 端 原 像 值′ 发 端 原 入 值 n之 的 差 f 间 误 为 ˆ ˆ ′ ′ ′ ′ fn − fn = fn −( fn + en ) = ( fn − fn ) −en = en −en = qn 由 可 : D 此 见 在 PCM系 中 误 来 是 送 的 统 的 差 源 发 端 ′ 量 器 而 接 端 关 若 掉 化 则en = en , 化 , 与 收 无 , 去 量 器 ′ 则 n = 0 fn − fn = 0, 这 就 以 全 失 地 复 q , 样 可 完 不 真 恢 输 信 fn , 从 实 信 保 编 ( 损 测 。 入 号 而 现 息 持 码 无 预 )
0 .0 − 5 .5 0 .0 − 5 .5 L 2 .0 3 .5 7 .0 15.5 22.0 17.5 L
§12.2 变换编码 一、变换编码系统 原理:将在空间域里描述的图像在某种变换 域里进行描述(通常采用正交变换,如傅 立叶变换、沃尔什变换、DCT等),将图 立叶变换、沃尔什变换、DCT等),将图 像映射成一组变换系数,然后将这些系数 量化和编码。
T
2 ()
r =[E{ fn fn−1} E{ fn fn−2} L E{ fn fn−m}]
( 3 )
预测误差的方差为:
2 σe = σ 2 − aT r
=σ 2 −
∑E{f
i =1
m
n
fn−i }ai
但 R和 计 相 困 。 际 一 都 设 个 是 r 算 当 难 实 中 般 假 一 简 的 像 型 将 相 的 相 代 式 2 单 图 模 并 其 应 自 关 入 () ( 以 算 局 所 图) 数 3 ) 计 全 ( 有 系 。
n n n
为 其 小 分 对 个 i求 微 。 使 最 需 别 每 a 偏 分 即 ∂ ˆ ]2} E{[ fn − fn ∂ai ∂ = E{[ fn −(a1 fn−1 + a2 fn−2 +L+ am fn−m)]2} ∂ai = −2E{[ fn −(a1 fn−1 + a2 fn−2 +L+ am fn−m)] fn−i } i =1 2,Lm ,
由此可获得 m 个表达式,再根据极值条件, m 令此 个表达式等于0 个表达式等于0,即可由 个方 m 程式组成的一个线性方程组, 即
E{[ fn −(a1 fn−1 + a2 fn−2 +L+ am fn−m)] fn−1} = 0 M E{[ fn −(a1 fn−1 + a2 fn−2 +L+ am fn−m)] fn−i} = 0( 1 ) M E{[ fn −(a1 fn−1 + a2 fn−2 +L+ am fn−m)] fn−m} = 0
2、JBIG 由JBIG于1991年制定,采用自适应编码技术, JBIG于1991年制定,采用自适应编码技术, 压缩比比 G3 和 G4 高。 二、静止图像压缩标准 1、JPEG 用于对静止灰度或彩色图像的压缩标准。 定义了三种编码系统 基于DCT的有损编码基本系统,可用于绝 基于DCT的有损编码基本系统,可用于绝 大多数压缩应用场合; 用于高压缩比,高精度或渐进重建应用的 扩展编码系统。 用于无失真应用场合的无损系统。
E{ fn−1 fn−1} E{ f f } n−2 n−1 R= E{ fn−3 fn−1} E{ fn−4 fn−1}
E{ fn−1 fn−2} E{ fn−1 fn−3} E{ fn−1 fn−4} E{ fn−2 fn−2} E{ fn−2 fn−3} E{ fn−2 fn−4} E{ fn−3 fn−2} E{ fn−3 fn−3} E{ fn−3 fn−4} E{ fn−4 fn−2} E{ fn−4 fn−3} E{ fn−4 fn−4}
14.0 20.5 14.0 20.5 L 27.0 33.5 40.0 46.5 53.0 59.5 L
− 14.0 20.5 14.0 L 20.5 27.0 33.5 40.0 46.5 53.0 L
14.0 20.5 14.0 20.5 L 27.0 33.5 40.0 46.5 53.0 59.5 L
2 2 2 σ2 σ ρv σ ρv ρh σ ρv 2 2 2 2 2 σ σ ρh σ ρv σ ρv = 2 2 2 2 σ ρv ρh σ 2ρh σ σ ρv ρh 2 2 2 2 2 2 σ σ ρv σ ρv σ ρv ρh
r =[E{ fn fn−1} E{ fn fn−2} E{ fn fn−3} E{ fn fn−1}] =[σ ρh σ ρv ρh σ ρv σ ρv ρh ]
简单表示为:
ˆ E{[ fn − fn ] fn−i } = 0 Rij = E{ fn−i fn− j } 则 1 式 改 为 ( ) 可 写 : r = Ra ⇒a = R r
−1
i = 1,2,Lm ( , j = 1,2,Lm) i
令 fn−i 和 n− j的 方 Rij 为 f 协 差
其中 R 为
i n−i
其 ai (i = 1,2,Lm)为 性 测 数 都 一 特 中 线 预 系 , 是 些 定 的 数 与fn−i 无 。 常 , 关
对 ai的 算 一 采 最 均 误 准 于 计 , 般 用 小 方 差 则 定 fn的 方 差 义 均 误 为 ˆ E{e2} = E{[ f − f ]2}
三、变换的选择 1、重建均方误差 2、变换选择讨论 KLT 信息集中能力最优,但计算复杂; WHT 计算最简单,但信息集中能力最差; DCT 目前用得较多; DWT 小波变换
四、比特分配 保留系数选择根据 最大方差准则 称为分区编码 最大幅度准则 称为阈值编码 分区编码:具有最大方差的变换系数带有最 多的图像信息,一般集中于接近图像变换 的原点处(左上角); 阈值编码:有三种取阈值方法。 对所有子图像用一个全局阈值; 对所有子图像分别用不同的阈值; 根据子图像中各系数的位置选取阈值。
输入
fn
en
e′ n
fˆn
−
量化器
+ +
f n′
编码值
预测值
信 道
′ en
输出
f n′
解码器
ˆ fn
预测值
预测编码框图
设输入信号 fn 为 tn 时刻的取样值 ˆ fn 为根据 tn 时刻以前已知的像素取样值 时所作的预测值。 en 为差值信号,也称误差信号。
ˆ en = fn − fn
f1 f2 Lfn−1
0 0
等 计 : 式 算 & ˆ f = af
n
1 n−
ˆ en = fn − fn & & ˆ fn = en + fn
e + c 对 n > 0 & en = 其 他 −c
输入 n f
编码器
ˆ f
e
& e
& f
解码器 ˆ & f f
误差 & f − f
0 1 2 3 L 14 15 16 17 18 19 L
国际压缩标准简介 大多由国际标准化组织ISO和国际电信联盟 大多由国际标准化组织ISO和国际电信联盟 ITU制定 ITU制定 一、二值图像压缩标准 G3 和 G 4 由CCITT的两个小组(Group3和Group4)负 CCITT的两个小组(Group3和Group4)负 责制定。最初为传真设计,采用了非自适 应,1 应,1-D游程编码技术。 G3 的压缩比为15:1 的压缩比为15:1 G 的压缩比为30:1 4 的压缩比为30:1
例题:12.1.1 DM编码示例 例题:12.1.1 DM编码示例
设 a =1 c = 6.5 输 序 为141514151315 , 入 列 { ,,,,, , ,,,,,,,,,,,,,,,, 1514 20 26 27 28 27 27 29 37 47 62 75 75 78 79 ,,,, 。 80 818182 82} 编 开 时 将 一 输 像 直 传 编 码 始 先 第 个 入 素 接 给 码 器 在 码 和 码 两 都 立 初 条 。 编 器 解 器 端 建 了 始 件 & & f 分 用 下 f = f =14后 其 的ˆ, e, e, 和& 可 别 以 , 余 f
若 n ≠ 0 则 入 号fn和 原 出fn之 就 定 q , 输 信 复 输 ′ 间 一 存 误 , 而 生 像 量 某 降 , 样 在 差 从 产 图 质 的 种 质 这 D PCM系 实 的 保 度 码 有 预 ) 统 现 是 真 编 ( 损 测 二、最佳线性预测
ˆ fn =
∑a f
i=1
m
例:设一个2 例:设一个2-D马尔可夫源,具有可分离自相 关函数
E{ f (x, y) f பைடு நூலகம்x −i, y − j)}= σ ρ ρ
2 i v
j h
并设一个四阶线性预测器
ˆ f (x, y) = a1 f (x, y −1) + a2 f (x −1, y −1) + a3 f (x −1, y) + a4 f (x +1, y −1)
输入图像 构造子图像 正变换 量化 符号编码 压缩图像 解压图像 合并子图像 反变换 符号解码
注: 变换后的图像系数相关性降低,可以获 得较高压缩比。 有 自适应变换编码和非自适应变换编码。 二、子图像尺寸选择 将图像分成满足以下条件的子图像 相邻子图像之间的相关(冗余)减少到某 个可接受的水平 子图像的长和宽都是2 子图像的长和宽都是2的整数次方 常见的有8 常见的有8×8和16×16。 16×16。
第十二章 图像编码方法
§12.1预测编码 12.1预测编码
一、预测编码 DPCM基本原理:基于图像中相邻像素之间 DPCM基本原理:基于图像中相邻像素之间 具有较强的相关性,每个像素可以根据已 知的几个像素值来作预测。即在预测编码 中,编码和传输的并不是像素取样值本身, 而是这个取样值的预测值(也称估计值) 与其实际值之间的差值。
2、JPEG2000 采用小波变换。 三、序列图像压缩标准 1、H.261 主要用于电视会议。 2、MPEG-I VCD MPEG主要用于数字媒体上压缩图像数据的储存 和提取。 3、MPEG-II DVD MPEG主要用于视频传输,适用于从普通电视到 高清电视
4、MPEG-IV 基于对象 MPEG用于窄带宽(64kbit/s)动态图像。 用于窄带宽(64kbit/s)动态图像。 5、MPEG-VII 基于内容的描述 MPEG可用于数字图书馆(图像目录、音乐字典 等)多媒体名录服务(如网页) 6、MPEG-21 MPEG-
E{ fn−1 fn−1} E{ fn−1 fn−2} E{ f f } E{ f f } n−2 n−1 n−2 n−2 R= M M E{ fn−m fn−1} E{ fn−m fn−2} r和 都 有 个 素 矩 a 具 m 元 的 阵 a =[a1 a2 L am]T L E{ fn−1 fn−m} L E{ fn−2 fn−m} O M L E{ fn−m fn−m}
14 15 14 15 L 29 37 47 62 75 77 L
− 14.0 20.5 14.0 L 20.5 27.0 33.5 40.0 46.5 53.0 L
− 1 .0 − 6.5 1 .0 L 8.5 10.0 13.5 22.0 28.5 24.0 L
− 6 .5 − 6 .5 6 .5 L 6 .5 6 .5 6 .5 6 .5 6 .5 6 .5 L
2 2 2 2 T
T
可 出 解 a1 = ρh a2 = −ρv ρh a3 = ρv a4 = 0 其 : h和 v分 是 像 水 和 直 关 数 中 ρ ρ 别 图 的 平 垂 相 系 。 三 德 塔 制 D ) 、 尔 调 ( M ) & f = af
n n−1
e + c 对 n > 0 & e= 其 他 −c 其 a是 测 数 一 a ≤1 , 是 个 的 数 中 预 系 ( 般 ) c 一 正 常 。