层次K-均值聚类结合改进ITML的迁移度量学习方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
, 2 , 3 蒋林利1 ,吴建生1
百度文库
( 1 . 广西科技师范学院 数学与计算机科学学院,广西 来宾 5 4 6 1 9 9 ; 2 . 武汉大学 软件工程国家重点实验室,武汉 4 3 0 0 7 2 ; 3 . 武汉理工大学 信息工程学院,武汉 4 3 0 0 7 0 ) 摘㊀要:目前的迁移学习方法多针对单一迁移类型, 使用低级特征空间, 并且源集比目标集复杂耗力。针对这 些问题, 综合考虑特征表示迁移、 参数迁移和实例迁移, 提出迁移度量学习的通用框架。首先, 基于属性相似性 空间和类别相似性空间, 利用层次 K 均值聚类获取相似性; 然后, 利用信任评估框架和去相关归一化转换方法 消除源集中的相关关系来抑制负迁移作用; 最后, 改进信息理论度量学习方法( I T M L ) 进行相似性度量学习。对 三种不同复杂度数据集进行实验, 结果表明, 提出方法的迁移学习性能较传统方法明显提高, 且对负迁移影响具 有更好的鲁棒性; 提出的方法可应用于源集比目标集简单的情况, 评估结果表明, 即使源集知识有限, 也可以得 到较好的迁移学习效果。 关键词:迁移度量学习;层次 K 均值聚类;相似性空间;信任评估框架;去相关归一化空间;信息理论度量学习 中图分类号:T P 1 8 2 ㊀㊀㊀文献标志码:A ㊀㊀㊀文章编号:1 0 0 1 3 6 9 5 ( 2 0 1 7 ) 1 2 3 5 5 2 0 4 : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 1 3 6 9 5 . 2 0 1 7 . 1 2 . 0 0 7 d o i
A b s t r a c t :N o wm o s t o f t r a n s f e r l e a r n i n g m e t h o d s s u f f e r f r o mt h e p r o b l e m s t h a t t r a n s f e r t y p e s a r e s e p a r a t e l y a n a l y z e d , l o wl e v e l f e a t u r es p a c ea r e u s e d ,a n dt h e s o u r c e d a t a s e t i s m o r e d i v e r s e a n d c o m p l e x t h a n t h e t a r g e t s e t . F o r t h e s e p r o b l e m s , t h i s p a p e r p r o p o s e dan o v e l g e n e r a l t r a n s f e r m e t r i cl e a r n i n gf r a m e w o r kw i t hc o m p r e h e n s i v ec o n s i d e r a t i o no f f e a t u r er e p r e s e n t a t i o nt r a n s ,p a r a m e t e r t r a n s f e r a n di n s t a n c e t r a n s f e r .I n i t i a l l y ,i t u s e dh i e r a r c h i c a l K m e a n s c l u s t e r i n gt og e t t h es i m i l a r i t yb a s e do n f e r t h e s e m a n t i cs i m i l a r i t y s p a c ea n dc a t e g o r y s i m i l a r i t y s p a c e .T h e n ,i t u t i l i z e dt h e t r u s t e v a l u a t i o nf r a m e w o r ka n dd e c o r r e l a t e d ,a n dr e s t r a i n e dt h en e g a t i v et r a n s f e r .F i n a l l y ,i t n o r m a l i z e ds p a c e t oe l i m i n a t et h ec o r r e l a t i o nl e a r n e di nt h es o u r c ed o m a i n m o d i f i e dt h ei n f o r m a t i o nt h e o r e t i cm e t r i c l e a r n i n gt op r e c e d es i m i l a r i t ym e t r i cl e a r n i n g .T h ee x p e r i m e n t r e s u l t s s h o wt h a t t h e t r a n s f e r l e a r n i n gp e r f o r m a n c e o f t h e p r o p o s e dm e t h o dh a s i m p r o v e dg r e a t l y w i t hm o r e r o b u s t t o n e g a t i v et r a n s f e r e f f e c t c o m p a ,t h e p r o p o s e dm e t h o dc o u l db ea p r i n g w i t ht h et r a d i t i o n a l m e t h o d s i nt h r e ed a t a s e t s w i t hd i f f e r e n t c o m p l e x i t y .F u r t h e r m o r e p l i e di nt h e s i t u a t i o nt h a t t h es o u r c e d a t a s e t w a s s i m p l e r t h a nt h e t a r g e t s e t .T h e r e s u l t s r e v e a l t h a t e v e nw h e nt h e k n o w l e d g e ,t r a n s f e r l e a r n i n g c a ns t i l l b e b e n e f i c i a l . s o u r c ei s l i m i t e d K e yw o r d s :t r a n s f e r m e t r i c l e a r n i n g ; h i e r a r c h i c a l K m e a n s c l u s t e r i n g ; s i m i l a r i t y s p a c e ; t r u s t e v a l u a t i o n f r a m e w o r k ; d e c o r r e l a t e dn o r m a l i z e ds p a c e ;i n f o r m a t i o nt h e o r e t i c m e t r i c l e a r n i n g( I T M L )
第3 4卷第 1 2期 2 0 1 7 年1 2月㊀
计 算 机 应 用 研 究 A p p l i c a t i o nR e s e a r c ho f C o m p u t e r s
V o l . 3 4N o . 1 2 D e c . 2 0 1 7
层次 K 均值聚类结合改进 I T ML的迁移度量学习方法
( 1 . S c h o o l o f M a t h e m a t i c s &C o m p u t e r S c i e n c e , G u a n g x i S c i e n c e &T e c h n o l o g y N o r m a l U n i v e r s i t y , L a i b i nG u a n g x i 5 4 6 1 9 9 , C h i n a ; 2 . S t a t e K e y L a b o r a t o r yo f S o f t w a r eE n g i n e e r i n g ,W u h a nU n i v e r s i t y ,W u h a n4 3 0 0 7 2 ,C h i n a ;3 . S c h o o l o f I n f o r m a t i o nE n g i n e e r i n g ,W u h a nU n i v e r s i t yo f T e c h n o l o g y ,W u h a n4 3 0 0 7 0 ,C h i n a )
T r a n s f e r m e t r i cl e a r n i n gm e t h o db a s e do nh i e r a r c h i c a l K m e a n s c l u s t e r i n ga n di m p r o v e dI T M L
1 , 2 1 , 3 J i a n gL i n l i ,WuJ i a n s h e n g
百度文库
( 1 . 广西科技师范学院 数学与计算机科学学院,广西 来宾 5 4 6 1 9 9 ; 2 . 武汉大学 软件工程国家重点实验室,武汉 4 3 0 0 7 2 ; 3 . 武汉理工大学 信息工程学院,武汉 4 3 0 0 7 0 ) 摘㊀要:目前的迁移学习方法多针对单一迁移类型, 使用低级特征空间, 并且源集比目标集复杂耗力。针对这 些问题, 综合考虑特征表示迁移、 参数迁移和实例迁移, 提出迁移度量学习的通用框架。首先, 基于属性相似性 空间和类别相似性空间, 利用层次 K 均值聚类获取相似性; 然后, 利用信任评估框架和去相关归一化转换方法 消除源集中的相关关系来抑制负迁移作用; 最后, 改进信息理论度量学习方法( I T M L ) 进行相似性度量学习。对 三种不同复杂度数据集进行实验, 结果表明, 提出方法的迁移学习性能较传统方法明显提高, 且对负迁移影响具 有更好的鲁棒性; 提出的方法可应用于源集比目标集简单的情况, 评估结果表明, 即使源集知识有限, 也可以得 到较好的迁移学习效果。 关键词:迁移度量学习;层次 K 均值聚类;相似性空间;信任评估框架;去相关归一化空间;信息理论度量学习 中图分类号:T P 1 8 2 ㊀㊀㊀文献标志码:A ㊀㊀㊀文章编号:1 0 0 1 3 6 9 5 ( 2 0 1 7 ) 1 2 3 5 5 2 0 4 : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 1 3 6 9 5 . 2 0 1 7 . 1 2 . 0 0 7 d o i
A b s t r a c t :N o wm o s t o f t r a n s f e r l e a r n i n g m e t h o d s s u f f e r f r o mt h e p r o b l e m s t h a t t r a n s f e r t y p e s a r e s e p a r a t e l y a n a l y z e d , l o wl e v e l f e a t u r es p a c ea r e u s e d ,a n dt h e s o u r c e d a t a s e t i s m o r e d i v e r s e a n d c o m p l e x t h a n t h e t a r g e t s e t . F o r t h e s e p r o b l e m s , t h i s p a p e r p r o p o s e dan o v e l g e n e r a l t r a n s f e r m e t r i cl e a r n i n gf r a m e w o r kw i t hc o m p r e h e n s i v ec o n s i d e r a t i o no f f e a t u r er e p r e s e n t a t i o nt r a n s ,p a r a m e t e r t r a n s f e r a n di n s t a n c e t r a n s f e r .I n i t i a l l y ,i t u s e dh i e r a r c h i c a l K m e a n s c l u s t e r i n gt og e t t h es i m i l a r i t yb a s e do n f e r t h e s e m a n t i cs i m i l a r i t y s p a c ea n dc a t e g o r y s i m i l a r i t y s p a c e .T h e n ,i t u t i l i z e dt h e t r u s t e v a l u a t i o nf r a m e w o r ka n dd e c o r r e l a t e d ,a n dr e s t r a i n e dt h en e g a t i v et r a n s f e r .F i n a l l y ,i t n o r m a l i z e ds p a c e t oe l i m i n a t et h ec o r r e l a t i o nl e a r n e di nt h es o u r c ed o m a i n m o d i f i e dt h ei n f o r m a t i o nt h e o r e t i cm e t r i c l e a r n i n gt op r e c e d es i m i l a r i t ym e t r i cl e a r n i n g .T h ee x p e r i m e n t r e s u l t s s h o wt h a t t h e t r a n s f e r l e a r n i n gp e r f o r m a n c e o f t h e p r o p o s e dm e t h o dh a s i m p r o v e dg r e a t l y w i t hm o r e r o b u s t t o n e g a t i v et r a n s f e r e f f e c t c o m p a ,t h e p r o p o s e dm e t h o dc o u l db ea p r i n g w i t ht h et r a d i t i o n a l m e t h o d s i nt h r e ed a t a s e t s w i t hd i f f e r e n t c o m p l e x i t y .F u r t h e r m o r e p l i e di nt h e s i t u a t i o nt h a t t h es o u r c e d a t a s e t w a s s i m p l e r t h a nt h e t a r g e t s e t .T h e r e s u l t s r e v e a l t h a t e v e nw h e nt h e k n o w l e d g e ,t r a n s f e r l e a r n i n g c a ns t i l l b e b e n e f i c i a l . s o u r c ei s l i m i t e d K e yw o r d s :t r a n s f e r m e t r i c l e a r n i n g ; h i e r a r c h i c a l K m e a n s c l u s t e r i n g ; s i m i l a r i t y s p a c e ; t r u s t e v a l u a t i o n f r a m e w o r k ; d e c o r r e l a t e dn o r m a l i z e ds p a c e ;i n f o r m a t i o nt h e o r e t i c m e t r i c l e a r n i n g( I T M L )
第3 4卷第 1 2期 2 0 1 7 年1 2月㊀
计 算 机 应 用 研 究 A p p l i c a t i o nR e s e a r c ho f C o m p u t e r s
V o l . 3 4N o . 1 2 D e c . 2 0 1 7
层次 K 均值聚类结合改进 I T ML的迁移度量学习方法
( 1 . S c h o o l o f M a t h e m a t i c s &C o m p u t e r S c i e n c e , G u a n g x i S c i e n c e &T e c h n o l o g y N o r m a l U n i v e r s i t y , L a i b i nG u a n g x i 5 4 6 1 9 9 , C h i n a ; 2 . S t a t e K e y L a b o r a t o r yo f S o f t w a r eE n g i n e e r i n g ,W u h a nU n i v e r s i t y ,W u h a n4 3 0 0 7 2 ,C h i n a ;3 . S c h o o l o f I n f o r m a t i o nE n g i n e e r i n g ,W u h a nU n i v e r s i t yo f T e c h n o l o g y ,W u h a n4 3 0 0 7 0 ,C h i n a )
T r a n s f e r m e t r i cl e a r n i n gm e t h o db a s e do nh i e r a r c h i c a l K m e a n s c l u s t e r i n ga n di m p r o v e dI T M L
1 , 2 1 , 3 J i a n gL i n l i ,WuJ i a n s h e n g