KL变换和主成分分析精讲

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

j d 1
T u j Ru j

j d 1
T ( u j j u j 1)

λ j ：拉格朗日乘数
g (u j )
j d 1
T u j Ru j

wk.baidu.com
j d 1
T ( u j j u j 1)

用函数 g (u j ) 对 u j 求导，并令导数为零，得
3）C*为对角矩阵说明了变换后样本各分量互不相关，亦即消
除了原来特征之间的相关性，便于进一步进行特征的选择。
K-L变换的不足之处： 1）对两类问题容易得到较满意的结果。类别愈多，效果愈差。 2）需要通过足够多的样本估计样本集的协方差矩阵或其它类型的散布矩阵。当样本数不足时，矩阵的估计会变得十分粗略，
变换的优越性也就不能充分的地显示出来。
例5.3 两个模式类的样本分别为
ω1 ： X1 [2, 2]T ， X 2 [2, 3]T ， X 3 [3, 3]T
ω2 ： X 4 [2, 2]T ， X 5 [2, 3]T ， X 6 [3, 3]T
利用自相关矩阵R作K-L变换，把原样本集压缩成一维样本集。解：第一步：计算总体自相关矩阵R。 5.7 6.3 1 6 T T R E{ XX } X j X j 6 . 3 7 . 3 6 j 1 第二步：计算R的本征值，并选择较大者。由| R I | 0 得 1 12.85， 2 0.15 ，选择 λ1 。第三步：根据 Ru1 1u1 计算 λ1 对应的特征向量 u1 ，归一化后为 1 u1 [1, 1.14]T [0.66, 0.75]T 2.3
( R j I )u j 0
j d 1,,
——正是矩阵 R 与其特征值和对应特征向量的关系式。
说明：当用X的自相关矩阵R的特征值对应的特征向量展开X
时，截断误差最小。
选前d项估计X时引起的均方误差为

j d 1
T u j Ru j

j d 1
T tr[ u R u j j ]
1, j i T ˆ 代入X、X ，利用 ui u j 0, j i
ξ E[ a2 j]
j d 1
ξ E[ a2 j]
j d 1

T T a u u 由 X a j u j两边左乘 j 得 j j X 。
j 1 T E[ uT XX uj ] j
分为：连续K-L变换离散K-L变换
1．K-L展开式
设{X}是 n 维随机模式向量 X 的集合，对每一个 X 可以用确定的完备归一化正交向量系 {u j } 中的正交向量展开：

X a juj ˆ a u 用有限项估计X时：X j j
j 1 j 1 d
aj：随机系数；
ˆ )T ( X X ˆ )] 引起的均方误差： E[(X X
进行排队，选择前 d 个较大的特征值。第三步：计算 d 个特征值对应的特征向量 u j ， j 1,2,, d ，
归一化后构成变换矩阵 U。 U [u1 , u2 ,, ud ]
第四步：对 { X } 中的每个 X 进行 K-L 变换，得变换后向量 X * ： X* UTX d 维向量 X * 就是代替 n 维向量 X 进行分类的模式向量。
利用K-L变换进行特征提取的优点： 1）变换在均方误差最小的意义下使新样本集{X *}逼近原样本集 {X}的分布，既压缩了维数又保留了类别鉴别信息。
2）变换后的新模式向量各分量相对总体均值的方差等于原样本集总体自相关矩阵的大特征值，表明变换突出了模式类之间的差异性。 0 1 2 C * E{( X * M * )( X * M * ) T } d 0
j 1
d
矩阵形式：
X Ua
（5-49）
T a [ a , a , , a ] 式中，，U nd [u1 ,, u j ,, ud ] 。 1 2 d T u [ u , u , , u ] 其中： j j1 j2 jn
T u1 T u2 T U U [u1 u2 ud ] I T u d T —— K-L变换对式(5-49)两边左乘U t ：a U X
系数向量a就是变换后的模式向量。
2．利用自相关矩阵的K-L变换进行特征提取
设 X 是 n 维模式向量， { X } 是来自 M 个模式类的样本集，总样本数目为 N。将 X 变换为 d 维 (d n) 向量的方法：
第一步：求样本集{X}的总体自相关矩阵R。 N 1 R E[ XX T ] X j X T j N j 1 第二步：求 R 的特征值 λ j ， j 1,2,, n 。对特征值由大到小

j d 1
u E[ XX
t j T u j Ru j

j d 1
T
]u j
uj为确定性向量
R：自相关矩阵。
j d 1
不同的 {u j } 对应不同的均方误差， u j 的选择应使 ξ 最小。
利用拉格朗日乘数法求使 ξ 最小的正交系 {u j } ，令
g (u j )

j d 1
λ

j
λ j 决定截断的均方误差， λ j 的值小，那么 ξ 也小。
因此，当用X的正交展开式中前d项估计X时，展开式中的uj应当是前d个较大的特征值对应的特征向量。
K-L变换方法：对R的特征值由大到小进行排队： λ1 λ2 λd λd 1
均方误差最小的X的近似式： X a j u j —— K-L展开式
5.1 基于K-L变换的多类模式特征提取
特征提取的目的：对一类模式：维数压缩。对多类模式：维数压缩，突出类别的可分性。
卡洛南-洛伊（Karhunen-Loeve）变换（K-L变换）： * 一种常用的特征提取方法； * 最小均方误差意义下的最优正交变换； * 适用于任意的概率密度函数；
* 在消除模式特征之间的相关性、突出差异性方面有最优的效果。