时间序列的特征表示
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
时间序列特征表示
时间序列特征表示是将原时间序列转换为另一论域中的数据并且起到数据降维的作用;同时,使得在低维空间下的数据能尽可能地反映原时间序列信息。
时间序列特征表示方法归类:
(1)数据非自适应方法是指将时间序列转换为另一数据空间,且转换过程和特征系数选择独立于数据本身;
A. 分段聚合近似是通过对时间序列进行平均分割并利用分段序列的均值来表示原时间序列的方法。
B. 基于域变换的时间序列表示方法就是将时间序列根据信号处理的方式实现时间域与频率域之间的转换,再利用频率域下的有限个特征数据来近似表示原始序列。离散傅里叶变换和离散小波变换是这种时频变换方法中最具代表性的两种方法,它们具有一定的联系,同时存在较大的区别。
(2)数据自适应方法既依赖于单条时间序列中的局部数据值,又受时间序列数据集中全体数据对象的影响,如奇异值分解方法增加或删除数据集中的任意对象都会影响最终的特征表示结果。
A. 分段线性表示是一种使用线性模型来对时间序列进行分割的方法,根据不同的分割方法可以使用不同的分割策略来实现,如滑动窗口、自底向上和自顶向下。
B. 符号化表示方法是一种将时间序列转换为字符串序列的过程。在时间序列数据挖掘过程中,传统方法主要依赖于定量数据,远远不能满足数据挖掘领域中分析和解决问题的要求。在数据结构和算法设计中,字符串具有特定的数据存储结构以及较为成熟且高效的操作算法。
(3)基于模型的表示方法通过事先假定时间序列数据是由某个模型产生,如回归模型、隐马尔可夫模型和神经网络等,通过构造合适的模型,然后使用模型的参数或系数来实现时间序列的特征表示。其中,多项式回归分析模型是一种能直观有效地对时间序列进行特征表示的方法。
参考《时间序列数据挖掘中特征表示与相似性度量研究综述》