KL变换和主成分分析精讲

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

j d 1
T u j Ru j

j d 1
T ( u j j u j 1)

λ j :拉格朗日乘数
g (u j )
j d 1
T u j Ru j

wk.baidu.com
j d 1
T ( u j j u j 1)

用函数 g (u j ) 对 u j 求导,并令导数为零,得
3)C*为对角矩阵说明了变换后样本各分量互不相关,亦即消
除了原来特征之间的相关性,便于进一步进行特征的选择。
K-L变换的不足之处: 1)对两类问题容易得到较满意的结果。类别愈多,效果愈差。 2)需要通过足够多的样本估计样本集的协方差矩阵或其它类 型的散布矩阵。当样本数不足时,矩阵的估计会变得十分粗略,
变换的优越性也就不能充分的地显示出来。
例5.3 两个模式类的样本分别为
ω1 : X1 [2, 2]T , X 2 [2, 3]T , X 3 [3, 3]T
ω2 : X 4 [2, 2]T , X 5 [2, 3]T , X 6 [3, 3]T
利用自相关矩阵R作K-L变换,把原样本集压缩成一维样本集。 解:第一步:计算总体自相关矩阵R。 5.7 6.3 1 6 T T R E{ XX } X j X j 6 . 3 7 . 3 6 j 1 第二步:计算R的本征值,并选择较大者。由| R I | 0 得 1 12.85, 2 0.15 ,选择 λ1 。 第三步:根据 Ru1 1u1 计算 λ1 对应的特征向量 u1 ,归一化后为 1 u1 [1, 1.14]T [0.66, 0.75]T 2.3
( R j I )u j 0
j d 1,,
——正是矩阵 R 与其特征值和对应特征向量的关系式。
说明:当用X的自相关矩阵R的特征值对应的特征向量展开X
时,截断误差最小。
选前d项估计X时引起的均方误差为

j d 1
T u j Ru j

j d 1
T tr[ u R u j j ]
1, j i T ˆ 代入X、X ,利用 ui u j 0, j i
ξ E[ a2 j]
j d 1
ξ E[ a2 j]
j d 1

T T a u u 由 X a j u j两边 左乘 j 得 j j X 。
j 1 T E[ uT XX uj ] j
分为: 连续K-L变换 离散K-L变换
1.K-L展开式
设{X}是 n 维随机模式向量 X 的集合,对每一个 X 可以 用确定的完备归一化正交向量系 {u j } 中的正交向量展开:

X a juj ˆ a u 用有限项估计X时 :X j j
j 1 j 1 d
aj:随机系数;
ˆ )T ( X X ˆ )] 引起的均方误差: E[(X X
进行排队,选择前 d 个较大的特征值。 第三步:计算 d 个特征值对应的特征向量 u j , j 1,2,, d ,
归一化后构成变换矩阵 U。 U [u1 , u2 ,, ud ]
第四步:对 { X } 中的每个 X 进行 K-L 变换,得变换后向量 X * : X* UTX d 维向量 X * 就是代替 n 维向量 X 进行分类的模式向量。
利用K-L变换进行特征提取的优点: 1)变换在均方误差最小的意义下使新样本集{X *}逼近原样本集 {X}的分布,既压缩了维数又保留了类别鉴别信息。
2)变换后的新模式向量各分量相对总体均值的方差等于原样本 集总体自相关矩阵的大特征值,表明变换突出了模式类之间 的差异性。 0 1 2 C * E{( X * M * )( X * M * ) T } d 0
j 1
d
矩阵形式:
X Ua
(5-49)
T a [ a , a , , a ] 式中, ,U nd [u1 ,, u j ,, ud ] 。 1 2 d T u [ u , u , , u ] 其中: j j1 j2 jn
T u1 T u2 T U U [u1 u2 ud ] I T u d T —— K-L变换 对式(5-49)两边左乘U t :a U X
系数向量a就是变换后的模式向量。
2.利用自相关矩阵的K-L变换进行特征提取
设 X 是 n 维模式向量, { X } 是来自 M 个模式类的样本集, 总样本数目为 N。将 X 变换为 d 维 (d n) 向量的方法:
第一步:求样本集{X}的总体自相关矩阵R。 N 1 R E[ XX T ] X j X T j N j 1 第二步:求 R 的特征值 λ j , j 1,2,, n 。对特征值由大到小


j d 1
u E[ XX
t j T u j Ru j

j d 1
T
]u j
uj为确定 性向量
R:自相关矩阵。
j d 1
不同的 {u j } 对应不同的均方误差, u j 的选择应使 ξ 最小。
利用拉格朗日乘数法求使 ξ 最小的正交系 {u j } ,令
g (u j )

j d 1
λ

j
λ j 决定截断的均方误差, λ j 的值小,那么 ξ 也小。
因此,当用X的正交展开式中前d项估计X时,展开式中 的uj应当是前d个较大的特征值对应的特征向量。
K-L变换方法: 对R的特征值由大到小进行排队: λ1 λ2 λd λd 1
均方误差最小的X的近似式: X a j u j —— K-L展开式
5.1 基于K-L变换的多类模式特征提取
特征提取的目的: 对一类模式:维数压缩。 对多类模式:维数压缩,突出类别的可分性。
卡洛南-洛伊(Karhunen-Loeve)变换(K-L变换): * 一种常用的特征提取方法; * 最小均方误差意义下的最优正交变换; * 适用于任意的概率密度函数;
* 在消除模式特征之间的相关性、突出差异性方面 有最优的效果。
相关文档
最新文档