时间序列数据挖掘中特征表示与相似性度量研究综述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
d o i : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 1 — 3 6 9 5 . 2 0 1 3 . 0 5 . 0 0 2
S u r v e y o f f e a t u r e r e p r e s e n t a t i o n s a n d s i mi l a r i t y me a s u r e me n t s i n
相 似性度 量提 供 了方 向。
关键 词 :时 间序 列 ;数据挖 掘 ;特征表 示 ; 相 似 性度 量
中图分类 号 :T P 3 1 1 . 1 文献标 志码 :A 文章 编号 :1 0 0 1 — 3 6 9 5 ( 2 0 1 3 ) 0 5 — 1 2 8 5 - 0 7
李海 林 ,郭崇慧
( 1 . . 华侨大学 工商管理学院,福建 泉州 3 6 2 0 2 1 ; 2 . 大连理工大学 系统工程研究所,辽宁 大连 1 1 6 0 2 4 ) 摘 要 :分别分析 了时间序列特征表示和相似性度量在数据挖掘中的作用和意义 , 对 目前 已有的主要 方法进行
了综述 , 分析各 自存在的优缺点; 同时, 探讨 了将来值得关注的问题 , 为进一步研 究时间序列数据的特征表示和
t i me s e r i e s d a t a mi ni ng
L I Ha i . 1 i n , .GUO C h o n g . h u i
( 1 . C o l l e g e o fB u s i n e s s A d mi n i s t r a t i o n , H u a q i a o U n i v e r s i t y ,Q u a n z h o u F u j i a n 3 6 2 0 2 1 , C h i n a;2 . I n s t i t u t e fS o y s t e m s E n g i n e e r i n g, D a l i a n U n i — v e m i t y fT o e c h n o l o g y , D a l i a n L i a o n i n g 1 1 6 0 2 4, C h i n a )
第3 0卷 第 5 期
2 0 1 3年 5月
计 算 机 应 用 研 究 Leabharlann Baidu
Ap p l i c a t i o n Re s e a r c h o f Co mp u t e r s
V0 1 . 3 O No . 5 Ma y 2 0 1 3
时间序列数据挖掘 中特征表示与相似性度量研究综述 水
时间序列 是一 类常见且 与时间相关的高维数据 , 也 是数据
基本形态和重要信息 , 为提高时 间序列数据挖 掘的效率奠定基
挖掘领域 … 中主要 的研 究对 象 , 广泛 存在 于金 融 、 医学 、 气象 以及 网络安 全 领 域 中。近年来 , 随着 社会 经 济和 信 息技术 的发展 , 时间序列 的数据量 增长 越来越快 。相应地 , 利 用数据挖掘技术在 时间序列数据 库 中发 现潜在 有用 的信息 和
Ab s t r a c t :T h i s p a p e r r e s p e c t i v e l y a n a l y z e d t h e f u n c t i o n a n d me a n i n g o f f e a t u r e r e p r e s e n t a t i o n s nd a s i m i l a it r y me a s u r e me n t s f o r t i me s e r i e s .I t a l s o s u mma r i z e d t h e e x i s t e d me t h o d s a n d na a ly z e d t h e me it r s nd a d e me i r t s .Me a n wh i l e ,b y d i s c u s s i n g t h e n o t e wo r — t h y p r o b l e ms , i t p r o v i d e d t h e f u r t h e r r e s e a r c h d i r e c t i o n o f f e a t u r e r e p r e s e n t a t i o n s a n d s i mi l a r i t y me a s u r e me n t s or f t i me s e i r e s . Ke y wo r d s :t i me s e ie r s ;d a t a mi n i n g;f e a t u r e r e p r e s e n t a t i o n; s i il m a it r y me a s u r e me n t
知识 , 也越来越受到研究者 的关注 , 而且研 究成 果被广 泛应 用
础 。与此同时 , 相似性度量方法是时 间序列数 据挖 掘中的另一 重要过程 , 也是 时间序 列数 据挖掘 中基本 和关键 的 问题 之一 。 大部分时间序列数据挖掘技 术 的初始工 作都需 要进行 相似性 比较 , 如 聚类 、 分类 、 兴趣模式 发现 、 异常模 式发现 以及时 间序 列可视化等 , 以便建 立数据 之 间的二元 关 系。因此 , 相 似 性度量方法的有效性直接关 系 到时 间序列数 据挖掘算 法 的性
S u r v e y o f f e a t u r e r e p r e s e n t a t i o n s a n d s i mi l a r i t y me a s u r e me n t s i n
相 似性度 量提 供 了方 向。
关键 词 :时 间序 列 ;数据挖 掘 ;特征表 示 ; 相 似 性度 量
中图分类 号 :T P 3 1 1 . 1 文献标 志码 :A 文章 编号 :1 0 0 1 — 3 6 9 5 ( 2 0 1 3 ) 0 5 — 1 2 8 5 - 0 7
李海 林 ,郭崇慧
( 1 . . 华侨大学 工商管理学院,福建 泉州 3 6 2 0 2 1 ; 2 . 大连理工大学 系统工程研究所,辽宁 大连 1 1 6 0 2 4 ) 摘 要 :分别分析 了时间序列特征表示和相似性度量在数据挖掘中的作用和意义 , 对 目前 已有的主要 方法进行
了综述 , 分析各 自存在的优缺点; 同时, 探讨 了将来值得关注的问题 , 为进一步研 究时间序列数据的特征表示和
t i me s e r i e s d a t a mi ni ng
L I Ha i . 1 i n , .GUO C h o n g . h u i
( 1 . C o l l e g e o fB u s i n e s s A d mi n i s t r a t i o n , H u a q i a o U n i v e r s i t y ,Q u a n z h o u F u j i a n 3 6 2 0 2 1 , C h i n a;2 . I n s t i t u t e fS o y s t e m s E n g i n e e r i n g, D a l i a n U n i — v e m i t y fT o e c h n o l o g y , D a l i a n L i a o n i n g 1 1 6 0 2 4, C h i n a )
第3 0卷 第 5 期
2 0 1 3年 5月
计 算 机 应 用 研 究 Leabharlann Baidu
Ap p l i c a t i o n Re s e a r c h o f Co mp u t e r s
V0 1 . 3 O No . 5 Ma y 2 0 1 3
时间序列数据挖掘 中特征表示与相似性度量研究综述 水
时间序列 是一 类常见且 与时间相关的高维数据 , 也 是数据
基本形态和重要信息 , 为提高时 间序列数据挖 掘的效率奠定基
挖掘领域 … 中主要 的研 究对 象 , 广泛 存在 于金 融 、 医学 、 气象 以及 网络安 全 领 域 中。近年来 , 随着 社会 经 济和 信 息技术 的发展 , 时间序列 的数据量 增长 越来越快 。相应地 , 利 用数据挖掘技术在 时间序列数据 库 中发 现潜在 有用 的信息 和
Ab s t r a c t :T h i s p a p e r r e s p e c t i v e l y a n a l y z e d t h e f u n c t i o n a n d me a n i n g o f f e a t u r e r e p r e s e n t a t i o n s nd a s i m i l a it r y me a s u r e me n t s f o r t i me s e r i e s .I t a l s o s u mma r i z e d t h e e x i s t e d me t h o d s a n d na a ly z e d t h e me it r s nd a d e me i r t s .Me a n wh i l e ,b y d i s c u s s i n g t h e n o t e wo r — t h y p r o b l e ms , i t p r o v i d e d t h e f u r t h e r r e s e a r c h d i r e c t i o n o f f e a t u r e r e p r e s e n t a t i o n s a n d s i mi l a r i t y me a s u r e me n t s or f t i me s e i r e s . Ke y wo r d s :t i me s e ie r s ;d a t a mi n i n g;f e a t u r e r e p r e s e n t a t i o n; s i il m a it r y me a s u r e me n t
知识 , 也越来越受到研究者 的关注 , 而且研 究成 果被广 泛应 用
础 。与此同时 , 相似性度量方法是时 间序列数 据挖 掘中的另一 重要过程 , 也是 时间序 列数 据挖掘 中基本 和关键 的 问题 之一 。 大部分时间序列数据挖掘技 术 的初始工 作都需 要进行 相似性 比较 , 如 聚类 、 分类 、 兴趣模式 发现 、 异常模 式发现 以及时 间序 列可视化等 , 以便建 立数据 之 间的二元 关 系。因此 , 相 似 性度量方法的有效性直接关 系 到时 间序列数 据挖掘算 法 的性