摘要
提出了一种基于LSH(locality sensitive hashing,局部敏感散列)算法处理时间子序列匹配问题的方法LSHSM。不同于FRM和Dual Match方法 ,该方法不需要对时间序列做DFT、DWT等特征变换,而是直接把序列看成高维数据点,利用LSH能处理高维数据的特性来查找相似时间子序列。实验采用3种不同的时间序列数据集,通过与线性扫描算法比较,验证了算法的有效性,性能有很大的提高。
An algorithm called LSHSM, which uses locality sensitive hashing (LSH) to process time subsequence matching, was proposed. Different to the FRM and DualMatch algorithms, the LSHSM does not require feature transformation such as DFT and DWT. It just directly regards the sequence as a high-dimensional object to find similar subsequences. Comparing to a linear algorithm on three real datasets, the LSHSM algorithm demonstrates the effectiveness and efficiency.
出处
《电信科学》
北大核心
2015年第8期63-71,共9页
Telecommunications Science
基金
国家自然科学基金资助项目(No.61472194)
浙江省自然科学基金资助项目(No.LY13F020040)
宁波市自然科学基金资助项目(No.2014A610023
No.2015A610119)
"信息与通信工程"浙江省重中之重学科开放基金资助项目~~
关键词
时间子序列
LSH
匹配查询
time subsequence, locality sensitive hashing, match searching