-
题名紧凑性约束下的形状提取多元时序聚类
- 1
-
-
作者
张弛
陈梅
张锦宏
-
机构
兰州交通大学电子与信息工程学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2024年第5期1243-1258,共16页
-
基金
国家自然科学基金(62266029)
甘肃省重点研发计划(21YF5GA053)
甘肃省高等学校产业支撑计划项目(2022CYZC-36)。
-
文摘
针对多元时序数据(MTS)的自然性和结构复杂性以及现有算法无法准确识别高维时序数据簇的问题,提出了紧凑性约束下的形状提取多元时间序列聚类算法C-Shape。该算法首先对繁杂的多元时序数据进行最大三角形三段降采样处理,达到使用较少数据而保持原有时序形状不变的目的。然后计算原始时序数据和处理后的时序数据之间的时间序列紧凑性,来评估所定的低维空间维度是否合理。接着在有效保证数据形状完整的基础上使用形状特征提取以确定新的簇中心,最后迭代形成最终簇。C-Shape充分考虑到处理后的数据与原数据形状之间的相似性,解决了传统降采样算法难以确定低维空间维度的难题。为验证算法性能,C-Shape与两个经典算法和七个近年提出的优秀时序聚类算法分别在八个常规和四个不平衡且维数从数十到数千不等的多元时序数据集上进行比较。实验结果显示,C-Shape聚类能力均优于九种对比算法,RI平均提高了16.33%,时间性能平均提高了69.71%。因此,C-Shape是一种精确且高效的多元时间序列聚类算法。
-
关键词
多元时间序列聚类
降采样
相似度度量
形状提取
时间序列紧凑性
-
Keywords
multivariate time series clustering
down-sampling
similarity measurement
shape extraction
time series compactness
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-