-
题名一种基于始末距离的时间序列符号聚合近似表示方法
被引量:9
- 1
-
-
作者
季海娟
周从华
刘志锋
-
机构
江苏大学计算机科学与通信工程学院
-
出处
《计算机科学》
CSCD
北大核心
2018年第6期216-221,共6页
-
基金
江苏省重点研发计划(社会发展)项目(BE2016630)
江苏省重点研发计划(社会发展)项目(BE2015617)
+1 种基金
江苏省六大人才高峰项目(2014-WLW-012)
无锡市卫计委重点项目(Z201603)资助
-
文摘
时间序列数据的特征表示方法是时间序列数据挖掘任务的关键技术,符号聚合近似表示(SAX)是特征表示方法中比较常用的一种。针对SAX算法在各序列段表示符号一致时无法区分时间序列间的相似性这一缺陷,提出了一种基于始末距离的时间序列符号聚合近似表示方法(SAX_SM)。由于时间序列有很强的形态趋势,因此文中提出的方法选用起点和终点来表示各个序列段的形态特征,并使用各序列段的形态特征和表示符号来近似表示时间序列数据,以将其从高维空间映射到低维空间;然后,针对起点和终点构建始末距离来计算两序列段间的形态距离;最后,结合始末距离和符号距离定义一种新的距离度量方式,以更客观地度量时间序列间的相似性。理论分析表明,该距离度量满足下界定理。在20组UCR时间序列数据集上的实验表明,所提SAX_SM方法在13个数据集中获得了最高的分类准确率(包含并列最大的),而SAX只在6个数据集中获得了最高的分类准确率(包含并列最大的),因此SAX_SM具有比SAX更优的分类效果。
-
关键词
时间序列数据
序列段
始末距离
符号距离
-
Keywords
Time series data
Sequence segment
Beginning and end distance
Symbol distance
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-