K-L 变换与图像压缩
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例
3、因
A
=
⎡1 ⎢⎣2
2⎤ 1⎥⎦
为对称矩阵,这时
⎡1⎤ A⎢⎣1⎥⎦
=
⎡1 ⎢⎣2
2⎤⎡1⎤ 1⎥⎦⎢⎣1⎥⎦
=
⎡3⎤ ⎢⎣3⎥⎦
=
⎡1⎤ 3⎢⎣1⎥⎦
⇒
Ae1 = 3e1
[ ] 故,3 是 A 的特征值,特征向量为 e1 = 1,1 T
A
⎡1⎤ ⎢⎣−1⎥⎦
=
⎡1 ⎢⎣2
2⎤ 1⎥⎦
⎡1⎤ ⎢⎣−1⎥⎦
存在一个正交矩阵 Q,使得
⎡λ1 0 "
QΣQ−1 = QΣQT = diag [λ1
λ2
"
λN
]
=
⎢ ⎢ ⎢
0 #
λ2 #
" %
0⎤
0 #
⎥ ⎥ ⎥
=
Λ
⎢⎢⎣ 0 0 " λN ⎥⎥⎦
其中对角矩阵 Λ 中的 λ1 λ2 " λN 是实对角矩阵 Σ 的 N 个特征根。这
给我们一个重要启示:
通过正交变换能够将协方差矩阵(实对称矩阵)Σ 对角化,从而
4
16 16
( ) 1
σ12 = 4
x11x12 + x12 x22 + x13 x23 + x14 x24
−
m 1
m2
= 1 [0*0+1*0+1*1+1*0] − 3*1= 1
4
16 16
( ) 1
σ32 = 4
x31x12 + x32 x22 + x33 x23 + x34 x24
− m3m2
。
2.6.2 K-L 变换[2]
一种基于特征向量(Eigenvectors)的变换。
特征分析(Eigenanalysis)复习
Δ 特征值 (Eigenvalues)
对 N × N 的矩阵 A,有 N 个标量 λi , i = 1,2,", N ,能写出如下的特 征方程
A − λi I = 0 ,
= 1 [0*0+0*0+1*0+0*1] − 1*1 = − 1
4
16 16
σ 33
=
1 4
[0*0+0*0+0*0+1*1]
−
1*1 16
=
3 16
σ
23
=
1 4
[0*0+0*0+1*0+0*1]
−
1*1 16
=
−
1 16
2
第二章 图像变换
⎡σ 11 ΣX = ⎢⎢σ 21
⎢⎣σ 31
σ 12 σ 22 σ 32
Y
=
AX
=
⎢ ⎢
0.333
⎢⎣− 0.217
0.392 − 0.667 0.634
− 0.067⎤⎡ 2 ⎤ ⎡ 2.234 ⎤
0.667
⎥⎢ ⎥⎢
1
⎥ ⎥
=
⎢⎢−
0.067⎥⎥
0.742 ⎥⎦⎢⎣− 0.1⎥⎦ ⎢⎣ 0.127 ⎥⎦
第二章 图像变换
2.6 K-L 变换与图像压缩
KARHUNEN LOEVE (KL) TRANSFORM (HOTELLING TRANSFORM)
K-L 变换是建立在图像统计特性的基础上的一种变换方法。假如 分批处理的图像的统计性质不同,就对应不同的变换核矩阵但以前介 绍各种变换的变换核是固定不变的。
6
第二章 图像变换
式,其意义是:变换后的图像是由中心化图像向量 X − M X 与变换矩阵 A 相乘的结果,
{ } 变换矩阵 A 的构成法:由 ΣX = E ( X − M X )( X − M X )T 的特征向量
ei i = 1, 2,...N 构成 A 的行向量,按相应特征值 λi , i = 1, 2,...N 幅值大小 递减的顺序排列各行:即取 A 的第一行为对应最大特征值的特征向 量,A 的最后一行为对应最小特征值的特征向量。
σ σ σ
13 23 33
⎤ ⎥ ⎥ ⎥⎦
=
1 16
⎡⎢3 ⎢1 ⎣⎢⎢1
1 3 −1
1
⎤ ⎥
⎡⎢a
−1⎥ ≠ ⎢0
3
⎥ ⎥⎦
⎢⎢⎣0
0 b 0
0⎤⎥
0⎥
c
⎥ ⎦⎥
可见:
♥ 由各随机向量对应 3 个分量组成的 3 个新向量具有相同的方
差;
♥ 新向量 x1 和 x2 , x1 和 x3 是正相关; ♥ x2 和 x3 是负相关。
k
X
T k
k =1
−
M
X
M
T X
⎡ σ11 σ12 " σ1N ⎤
=
⎢ ⎢
σ
21
⎢#
σ 22 #
"
σ2N
⎥ ⎥
#⎥
⎢⎣σ N1
σN2
"
σ
NN
⎥ ⎦
元素σii : 各向量的第 i 个分量组成的向量 Xi 的方差;
元素σ ij : 第 i 个分量组成的向量 Xi 和第 j 个分量组成的向量 X j
之间的协方差;如果 Xi 和 X j 不相关,他们的协方差为
其均值向量可以写为:
∑ M X
=
E{X} =
1 L
L k =1
Xk
=
1 [3
4
1
1]T
{ } 其中 E . 表示“求期望”,下标 x 表示 MX 所对应的一组随机向量。
与该组随机向量对应的协方差矩阵为
1
第二章 图像变换
{ } ∑ ( )( ) ΣX = E X − M X
X −MX T
=
1 L
L
X
⎢ ⎣
y
2
⎤ ⎥ ⎦
=
⎡cosθ ⎢⎣ sin θ
− sinθ ⎤⎡ x1 ⎤
cosθ
⎥⎦
⎢ ⎣
x
2
⎥ ⎦
即 Y = TX ,将向量旋转了θ角。
取θ=450,则变换为
4
第二章 图像变换
⎡ ⎢ ⎣
y1 y2
⎤ ⎥ ⎦
=
⎡cosθ ⎢⎣ sin θ
⎡2
− sinθ ⎤⎡ x1 ⎤
cosθ
⎥⎦
⎢ ⎣
x
2
2⎤
2 2
⎥ ⎥ ⎥
=
⎡0 ⎢⎣0
0⎤ 2a⎥⎦
2 ⎥⎦
可见, y1 和 y2 完全不相关了;但协方差 ΣX 不同,则变换后 Y 的协方
差也就不一样。
本问题的逆变换为
⎡ x1
⎢ ⎣
x2
⎤ ⎥ ⎦
=
⎡ cosθ ⎢⎣− sinθ
sinθ ⎤⎡ y1 ⎤
cos
ϑ
⎥ ⎦
⎢ ⎣
y
2
⎥ ⎦
即 X = T −1Y
⎡λ 0 0⎤ ⎡6 2 0 ⎤
⎢ ⎢
0
λ
0
⎥ ⎥
−
⎢⎢2
2
−1⎥⎥ = 0
⇒
⎢⎣0 0 λ⎥⎦ ⎢⎣0 −1 1 ⎥⎦
λ − 6 −2 0 −2 λ − 2 1 = 0 ⇒ 0 1 λ −1
λ1 = 6.854 λ2 = 2 λ3 = 0.146
⑵ 求 λi 的特征向量,即按 Σxei = λiei 求 ei 。
矩阵的秩 rank = 非零的特征值个数
Δ 特征向量 (Eigenvectors)
设每个 ei 是 N ×1维的(N by one vectors),通过满足 Aei = λiei
对应一个特征值 λi ,则称 ei 为 A 的特征向量。N 个这样的特征向量
构成一个正交基集。
如果 A 是实对称矩阵,那么 λk 也是实数。
=
⎡−1⎤ ⎢⎣ 1 ⎥⎦
=
−1 ⎡⎢⎣−11⎤⎥⎦
⇒ Ae2 = −e2
so,-1 是 A 的特征值,特征向量 e2 = [1,−1]T
One Dimension K-L Transform 定义一个线性变换 A,它可由任何 X 向量产生一个新向量 Y: Y = A( X − M X ) ,
这里 M X 为由 L 个样本向量估计的均值向量,这就是 K-L 变换的变换
其中 T 为正交矩阵; ΣX 为实对称矩阵。
表明:
向量 X 通过正交变换后的向量 Y 的协方差矩阵为 λ 的对角矩阵,
说明向量 X 的分量间的相关性已被消除,即正交变换能消除存在相
关性的冗余度,这是采用正交变换消除图像相关性的一个数学依据。
例、 二维坐标系统中的一个向量旋转――最简单的线性变换。
⎡ y1
K-L 变换优点是相关性好,应用在数据压缩和图像旋转等方面。
2.6.1 正交变换和消除相关性[2,6]
设 L 个如下形式表示的随机向量:
X k = ⎡⎣ x1k x2k " xNk ⎤⎦T k=1,2,...,L 。
已知如下 4 个样本向量:
X 1 = [0 0 0]T X 2 = [1 0 0]T X 3 = [1 1 0]T X 4 = [1 0 1]T
,
⎢⎢⎣σ n1 σ n2 " σ nn ⎥⎥⎦
也就是
{ } ΣY = E (Y − E (Y ))(Y − E (Y ))T { } = E (TX − E (TX ))(TX − E (TX ))T { } = TE ( X − E ( X ))( X − E ( X ))T TT
= T ΣXT T = diag [λ1 λ2 " λN ] = Λ
零,对应σij = σ ji = 0 。
X 是 N 阶的,所以 ΣX 是 N×N 阶的。这个矩阵是实对称矩阵。
对本例的 5 个元素:
故有:
( ) 1
σ11= 4
x11x11 + x12 x12 + x13 x13 + x14 x14
−
m 1
m1
= 1 [0*0+1*1+1*1+1*1] − 3*3 = 3
③ 求 λi 对应的 ΣX 的特征向量 ei ;
④ 用 Σ X 的特征向量构成正交矩阵 A。
Example 1 to KL Transform:
8
第二章 图像变换
⎡6 2 0 ⎤
若已知随机向量 X 的协方差矩阵为 ΣX = ⎢⎢2 2 −1⎥⎥ ,求正交矩阵?
⎢⎣0 −1 1 ⎥⎦
⑴ 由 λI − ΣX = 0 , 求 Σ X 的特征值 λi
量,所以 ∑Y = A ∑X AT 是一个对角阵。
Δ 协方差矩阵 ΣY 是对角型矩阵
7
第二章 图像变换
⎡λ1 0
"
0⎤
⎢ ⎢
0
λ2
⎥ ⎥
⎢
%
#⎥
ΣY
=
⎢ ⎢
#
λi
⎥ ⎥
⎢
% 0⎥
⎢ ⎢⎣ 0
"
⎥ 0 λ N 2 ⎥⎦
ΣY
为对角矩阵,特征值即沿着特征向量
K ei
方向上
Y
的第
i
个元素
的方差。
上式主对角线上以外的元素为 0,即 y 向量的各元素是不相关
3
消除图像的相关性!!
第二章 图像变换
通过正交矩阵 T 对向量 X 作正交变换
Y = TX
那么,根据协方差矩阵的定义,Y 的协方差矩阵为:
⎡σ11 σ12 " σ1n ⎤
{ } ( ) ΣY = E
Y − E (Y ) (Y − E(Y ))T
=
⎢⎢σ 21 ⎢#
σ 22 #
"
σ 2n #
⎥ ⎥ ⎥
⇒
e2 = ⎢⎢− 0.667⎥⎥ ,
e1 = ⎢⎢0.392
⎥ ⎥
,
e3 = ⎢⎢0.634
⎥ ⎥
⎢⎣0.667 ⎥⎦
⎢⎣− 0.067⎥⎦
⎢⎣0.742 ⎥⎦
用 e1 ,e2 ,e3 的转置向量作为正交矩阵 A 的行向量,那么对任
一向量 X=(2 1 -0.1)T 的 K-L 变换为
⎡ 0.918
的。也就是说,随机向量 Y 是由互不相关的随机变量组成的,因此,
线性变换 A 起到了消除变量间相关性的作用。即每个 λi 都是变换后第 i 个变量 yi 的方差。
2.6.3 K-L 变换计算举例
构造正交矩阵 A 的步骤: ① 求随机向量 X 的协方差矩阵 ΣX ;
② 求协方差矩阵 ΣX 的特征值 λi ;
协方差矩阵对角化
用统计学方法描述图像,各分量之间的相关性将会大大增加图像
生成和图像处理过程中的误差。有效消除这些相关性是一个基本的任
务。也就是说,我们应该设法将协方差矩阵的非对称元素化为零元素,
就是设法将协方差矩阵对角化。
如何做???
线性代数证明,对于一个实对称矩阵 Σ (即 Σ = ΣT )的矩阵,必
(M Y = 0)
= {Y Y T }
{ } = E
(AX
−
AM
X )(A X
−
AM
)T
X
{ } = E
A (X
− M X )( X
−M
)T
X
AT
{ } = A E
(X
−M
X )(X
−M
)T
X
AT = A ∑ X AT
{ } 因为构成 A 的各行向量是 ΣX = E ( X − M X )( X − M X )T 的特征向
⎡1
0⎤
则 λi
称为矩阵 A 的特征值
(Eigenvalues);而 I
=
⎢ ⎢
%
⎥ ⎥
:
单位矩阵
⎢⎣0
1⎥⎦
(Unitary Matrix)。
Eigenvalues (characteristical values):当矩阵的每个对角元素都减
5
第二章 图像变换
去它时,将变成奇异阵(不存在逆的矩阵)。如果给定矩阵是奇异的, 那么 N 个特征值中至少有一个是 0。
⎥ ⎦
⎢ =⎢
⎢
2 2
⎢⎣ 2
−
2⎤ቤተ መጻሕፍቲ ባይዱ
2 2
⎥ ⎥ ⎥
⎡ ⎢ ⎣
x1 x2
⎤ ⎥ ⎦
,
2 ⎥⎦
若
X
的协方差矩阵为 ΣX
=
⎡a ⎢⎣a
a⎤ a⎥⎦
,那么变换后
Y
的协方差矩阵为
⎡2
ΣY
= TΣXTT
⎢ =⎢
⎢
2 2
⎢⎣ 2
−
2⎤
2 2
⎥ ⎥ ⎥
⎡a ⎢⎣a
2 ⎥⎦
⎡2
a a
⎤ ⎥⎦
⎢ ⎢ ⎢ ⎢⎣−
2 2 2
K-L 变换的性质
Δ Y 的均值 MY = 0 ,
证:
MY = E{Y} = E{A( X − M X )}
= AE {X } − AM X (= AM X − AM X ) = 0
变换后的图像向量是期望值为零的随机向量。
Δ Y 向量的协方差矩阵为 ∑Y = A ∑X AT 证:
{ } Σ Y = E (Y − M Y ) (Y − M Y )T
例如
⎡6 2 0 ⎤⎡a⎤ ⎡a⎤ ⎡ 6a + 2b ⎤ ⎡a⎤ ⎢⎢2 2 − 1⎥⎥⎢⎢b⎥⎥ = 2⎢⎢b⎥⎥ ⇒ ⎢⎢2a + 2b − c⎥⎥ = 2⎢⎢b⎥⎥ ⎢⎣0 − 1 1 ⎥⎦⎢⎣c⎥⎦ ⎢⎣c⎥⎦ ⎢⎣ − b + c ⎥⎦ ⎢⎣c⎥⎦