多模态张量数据挖掘算法及应用_杨琬琪

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3 9卷 第1期 2 0 1 2年1月
计 算 机 科 学 C o m u t e r c i e n c e S p
V o l . 3 9N o . 1 J a n 2 0 1 2
多模态张量数据挖掘算法及应用
2 1, 2 3 1, 2 1, 2 杨琬琪1, 高 阳 周新民 杨育彬 商 琳 1 2 ( ) ) 南京大学软件新技术国家重点实验室 南京 2 南京大学江阴信息技术研究院 无锡 2 1 0 0 9 3 1 4 4 3 3 ( 3 ( ) 江苏省公安厅物证鉴定中心 南京 2 1 0 0 2 4
) 到稿日期 : 资助 。 2 0 1 1 0 2 2 3 2 0 1 1 0 5 1 9 B E 2 0 1 0 6 3 8 - - 返修日期 : - - 本文受江苏省社会发展项目 ( , : 杨琬琪源自文库( 女, 硕士生 , 主要研究方向为多模态数据挖掘与社会网络分析 , 1 9 8 8- ) E-m a i l n u. a n w a n i m a i l . c o m。 @g j y g q
[ 1]
, 近年来基于张量表示的多模态
数据挖掘方法得到 了 长 足 的 发 展 。 与 向 量 表 示 相 比 较 , 张量
2 张量代数
张量是多向阵列 , 可看作向量 、 矩阵的高阶扩展 。 一个 N
… I I I N ( 1× 2× × , 阶张量 A∈R 第 I I I 1× 2× … × N 为 笛 卡 尔 乘 积)
A b s t r a c t u l t i o d a l d a t a m i n i n t e c h n o l o i e s h a v e a t t r a c t e d m a n r e s e a r c h i n t e r e s t s i n r e c e n t l a r e a e a r s . M i n i n M -m - g g y g y g , m o u n t o f m u l t i o d a l d a t a e f f i c i e n t l b e c o m e s a h o t s o t t h e s e m u l t i o d a l m i n i n t e c h n o l o i e s m u l t i r o b l e m. Am o n -m -m - y p g g p g , , m o d a l d a t a m i n i n f o r t e n s o r r e r e s e n t a t i o n w h i c h i s a l s o c a l l e d a s m u l t i o d a l t e n s o r d a t a m i n i n i s o n e o f t h e m o s t -m g p g r e s e a r c h i s s u e s . W e r e v i e w e d t h e s t a t e o f t h e a r t a l o r i t h m s o f t h e m u l t i o d a l t e n s o r d a t a m i n i n a n d t h e i r s i n i f i c a n t - - - -m g g g , a l i c a t i o n s i n c o m u t e r v i s i o n . F i r s t l u l t i o d a l t e n s o r d a t a m i n i n a l o r i t h m s w e r e c a t e o r i z e d i n t o d i f f e r e n t c l a s -m - p p p ym g g g , , s e s a c c o r d i n t o t h e d i f f e r e n t l a b e l i n f o r m a t i o n t a s k a n d c o r e t e c h n o l o . I n a d d i t i o n s o m e a n a l s e s a b o u t t h e s e a l o - g g y y g , r i t h m s w e r e s o m e t i c a l m u l t i o d a l t e n s o r m i n i n a l o r i t h m s i n c o m u t e r v i s i o n a l i c a t i o n w e r e i l i v e n . S e c o n d l -m - y p g g p p p g y , , r e s e n t e d l u s t r a t e d . F i n a l l w e o u r o w n a n a l s e s o n r e s e a r c h s t a t u s o f m u l t i o d a l t e n s o r m i n i n a l o r i t h m s a n d e x -m - p y y g g l o r e d s o m e o t e n t i a l f u t u r e i s s u e s o f m u l t i o d a l t e n s o r m i n i n i n c o m u t e r v i s i o n a l i c a t i o n . -m p p g p p p , , , K e w o r d s M u l t i o d a l t e n s o r D a t a m i n i n T e n s o r r e r e s e n t a t i o n C o m u t e r v i s i o n -m g p p y ) 张量表示可以 有 效 解 决 向 量 表 示 的 疑 难 问 题 , 如维度 4 灾难 、 矩阵奇异等 。 本文综述了当前基 于 张 量 表 示 的 多 模 态 数 据 挖 掘 方 法 。 首先介绍张量代数的基础知识, 其次对基于张量表示的多模 态数据挖掘方法进行分类和描述, 最后讨论基于张量表示的 多模态数据挖掘算法在计算机视觉上的应用 。
M u l t i o d a l T e n s o r D a t a M i n i n A l o r i t h m s a n d A l i c a t i o n s -m g g p p
12 12 3 12 12 YANG W a n Y a n HOU X i n i n Y u b i n HANG L i n i - GAO -m YANG - S g Z q 1 ( , , ) S t a t e K e L a b o r a t o r f o r N o v e l S o f t w a r e a n d T e c h n o l o N a n i n U n i v e r s i t N a n i n 2 1 0 0 9 3, C h i n a y y g y j g y j g 2 ( , , ) J i a n i n I n s t i t u t e o f I n f o r m a t i o n T e c h n o l o N a n i n U n i v e r s i t Wu x i 2 1 4 4 3 3, C h i n a g y g y j g y 3 ( , ) J i a n s u P r o v i n c e P u b l i c S e c u r i t D e a r t m e n t N a n i n 2 1 0 0 2 4, C h i n a g y p j g , , , ,
I × I 形成二阶张量展开 矩 阵 A( 其 中I 后, n)∈R n n , n是其他阶维
度大小的乘 积 , 即I I I I I n= 1… n-1 n+1 … N 。 以 3 阶 张 量 A∈
I I I 1× 2× 3 为例 , 其张量矩阵展开过程如图 1 所示 。 R
训练样本 有标记
预测 , 支持张 S TM, T S TM,M S TM s 分类 量 机 RM S TM s 生成式 TMPM, B TA 分析 P C A 系列 2 D P C A, G P C A, MP C A, RMP C A, NMP C A, UMP C A M I C A, D I C A
摘 要 近年来 , 多模态数据挖掘技术备受关注 , 如何高 效 地 挖 掘 大 量 多 模 态 数 据 成 为 一 个 研 究 热 点 。 其 中 , 基于张 量表示的多模态数据挖掘 , 即多模态张量数据挖掘 , 是一个重要的研究问题 。 综述了多模态张量数据挖掘算法进 展 及 任务 和 核 心 技 术 的 不 同 , 对这些方法进行分类, 并给出了相应 其在计算机视觉中的应用 。 首先根据算法的样本标记 、 的介绍和分析 。 其次 , 讨论了一些多模态张量数据挖掘算法在计算机视觉问题中的典型应用 。 最后 , 就多模态 张 量 挖 掘在计算机视觉领域的研究现状与研究前景进行了简要的分析 。 关键词 多模态张量 , 数据挖掘 , 张量表示 , 计算机视觉 中图法分类号 T P 3 9 1. 4 1 文献标识码 A
1 引言
多模态数据 ( 视频 、 音 频、 图 像 等) 的 挖 掘 是 机 器 视 觉、 模 人工智能等领域的重要技术之一 。 其中 , 多模态 数 据 式识别 、 的表示是多模态数 据 挖 掘 的 核 心 问 题 。 目 前 , 多模态数据表 示分为向量表示与张量表示两类 。 不同于成熟的基于向量 表 示的多模态数据挖 掘 方 法 表示的特点有 : ) 张量结构直观 上 易 于 表 示 多 模 态 数 据 , 一阶表示一个 1 模态 , 不同的模态维度不同 , 而向量表示往往忽视这一点 ; ) 在提取特征 ( 尤 其 是 图 像 特 征) 时, 张量可以有效保存 2 原始样本的结构特征 ; ) 在数据变换时 , 张量可以充分考虑不同模态之间的相 3 关性与互补性 , 向量表示很难挖掘上述关系 ;
·9·
张量矩阵展开 ( 是将张量中的元素重新排列构成 N >2) 矩阵的过程 。 对 张 量 A∈R
I × I ×…× I 1 2 N
量表示的多模态数据挖掘算法按表 1 进行分类 。 下面针 对 每 一类的具体算法作详细介绍 。
表 1 多模态数据挖掘算法分类
样本性质 任务 核心 技术 具体算法
进 行 第n 阶 矩 阵 展 开
I 1是 矢量a∈R n 阶的维度大小是I ∈R 是 0 阶张量 , n 。 标量a I 1× I 2 是 2 阶 张 量。基 于 张 量 表 示, 矩阵 A∈R 可以 1 阶张量 ,
) 、 进一 步 定 义 张 量 矩 阵 展 开 、 模乘( 张量积 r o d u c t M o d e p ( ) 和张量分解 。 T e n s o r r o d u c t p ) 张量矩阵展开 1
相关文档
最新文档