时序数据库中快速相似搜索的算法研究被引量：5

RESEARCH ON FAST RETRIEVAL OF SIMILARITY PATTERNS IN A TIME SERIES DATABASE

导出

摘要针对时间序列,本文提出了一种新的数据表示方法。该方法通过将时间序列分成若干段,并从每个分段中提取一个特征向量,从而用一个特征向量集作为该时间序列的逻辑表示。在此基础上,采用时间弯曲距离作为相似模型,提出了一种改进的KMP算法作为检索方法。此算法能够快速挖掘出时序数据库中与给定查询序列相似的所有(子)序列。该算法具有较高的效率。 In this paper, a new data representation for time series is presented, which can support similarity search very efficiently in a time series database. First, each sequence is divided into several segments. Second, a feature vector is extracted from each segment and let a set of such feature vectors as a logical representation of a sequence. Finally, the time warping distance is used as similarity model and introduce a modified KMP algorithm to retrieve all the sequences or subsequences that are similar to the query sequence given by users. The experimental results prove that this approach is efficient and practical.

作者黄河熊范纶杭小树黄轲

机构地区中国科学院合肥智能机械研究所宜春大学生物化学系

出处《模式识别与人工智能》 EI CSCD 北大核心 2003年第2期169-173,共5页 Pattern Recognition and Artificial Intelligence

基金国家自然科学基金资助项目(No.69835010)

关键词时序数据库快速相似搜索算法数据表示数据模型 Time-Series, Feature Vector, Time-Warping Distance, Similarity Search

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1Agrawal R,Faloutsos C,Swami A.Efficient Similarity Scarch in Sequences Database[].Proc of the th International Conference on Foundations of Data Organization and Algorithms.1993
2Bozkaya T,Yazdani N,Ozsoyglu M.Matching and Indexing Sequences of Different Lengths[].Proc of the th International Conference on Information and Knowledge Management.1997
3Rabinar L,Juang B H.Fundamentals of Speech Recognition[].Prentice Hall Signal Processing Series.1993
4R. Agrawal,,K. I. Lin,H. S. Sawhney,,and K. Shim.Fast similarity search in the presence of noise, scaling, and translation in time-series database[].Proc Int Conf Very Large Data Bases(VLDB‘).1995
5Faloutsos C,Ranganathan M,Manolopoulos Y.Fast subsequencematching in time-series databases[].Proceedings of the ACMSIGMOD International Conference on Management of Data.1994
6E.Keogh,P.Smyth.A Probabilistic Approach to Fast Pat- tern Matching in Time Series Databases[].Proceedings of the rd International Conference on Knowledge Discovery and Data Mining.1997
7Keogh E,Pazzani M.An enhanced representation of time series which allows fast and accurate classification, clustering and relevance feedback.In: Proc of 4th Int’ l Conf on Knowledge Discovery and Data Mining(KDD’ 98)[].New York.1998

同被引文献28

1李秋丹,迟忠先,孙瑞超.一种时间序列相似匹配新算法[J].控制与决策,2004,19(8):915-919. 被引量：4
2李爱国,覃征.大规模时间序列数据库降维及相似搜索[J].计算机学报,2005,28(9):1467-1475. 被引量：20
3龚薇,肖辉,曾海泉.基于变化点的时间序列近似表示[J].计算机工程与应用,2006,42(10):169-171. 被引量：6
4郭四稳,何维,王鹏.基于小波技术的网络时序数据挖掘[J].计算机工程,2007,33(2):40-43. 被引量：3
5Agrawal R,Faloutsos C,Swami AN. Efficient Similarity Search in Sequence Databases. 4th Proc. on Foundations of Data Organization and Algorithms (FODO), 1993: 69-84.
6Faloutsos C,Ranganathan M,Manolopoulos Y.Fast Subsequence Matching in Time-Series Databases. Proc. of the 1994 ACM SIGMOD Int. Conf. on Management of Data,1994: 419-429.
7Rafiei D,Mendelzon A.On Similarity-Based Queries for Time Series Data. SIGMOD Record, 1997, 26(2): 13-25.
8Chan K,Fu A.W.Efficient Time Series Matching by Wavelets.Proc. 15th Int. Conf. on Data Engineering (ICDE), 1999, 4(2): 126-133.
9Yi B,Faloutsos C.Fast Time Sequence Indexing for Arbitrary Lp Norms.The VLDB Journal, 2000, 5(3): 385-594.
10Keogh E.J,Chakrabarti K,Pazzani M.J.,Mehrotra S.Dimensionality Reduction for Fast Similarity Search in Large Time Series Databases. Journal of Knowledge and Information Systems, 2001, 3(3): 263-286.

引证文献5

1黄河,史忠植,郑征.基于形状特征k-d树的多维时间序列相似搜索[J].软件学报,2006,17(10):2048-2056. 被引量：11
2王飞.能量模型数据挖掘的研究[J].软件,2011,32(1):32-34. 被引量：1
3柴亚刚.基于时序数据库的分布式网络波动监控系统[J].中国传媒科技,2018,0(3):36-37. 被引量：3
4李超.基于多系统支持的生产数据综合预警系统[J].陕西煤炭,2020,39(4):64-68.
5黄河,黄轲,杭小树,熊范纶.时间序列中快速模式发现算法的研究[J].计算机工程与应用,2003,39(21):192-194. 被引量：6

二级引证文献20

1管河山,姜青山,王声瑞.基于点分布特征的多元时间序列模式匹配方法[J].软件学报,2009,20(1):67-79. 被引量：39
2朱冲,朱贤贵,张向利.金融时间序列挖掘综合模型[J].计算机系统应用,2009,18(2):46-48. 被引量：4
3吴薇,胡静涛.旋转机械全息序列相似性匹配故障诊断方法[J].仪器仪表学报,2009,30(3):536-541. 被引量：6
4樊伟,黄斌,朱冲,王大为.金融时间序列频繁模式挖掘算法[J].计算机系统应用,2009,18(11):80-83.
5李万能,李正媛,陈志遥,刘代芹,陈涛.基于时序模式斜率反正切定量分析地形变数据[J].内陆地震,2010,24(2):137-143.
6鲁骏,宋俊辉.基于时序模型的农产品价格数据挖掘研究[J].信息系统工程,2011(8):29-30.
7刘芬,郭躬德.一种改进的时间序列模式发现算法[J].漳州师范学院学报（自然科学版）,2011,24(4):27-33. 被引量：2
8黄冬梅,廖娟.时间序列相似匹配算法在数字海洋风暴潮辅助决策系统中的应用[J].海洋环境科学,2012,31(5):746-749. 被引量：1
9李会民,方丽英,闫健卓,王普,赵辉.基于扩展范式距离的纵向数据相似性度量[J].计算机与应用化学,2012,29(10):1176-1180. 被引量：3
10张立,何冰,封卫兵,张武.笛卡尔网格生成中的相交算法[J].计算机辅助工程,2013,22(1):71-76.

1王清毅,范焱,蔡庆生.基于时序逻辑的时序数据库中知识发现方法[J].计算机科学,1999,26(8):68-70.
2刘晨,李海英,罗四维.空间、时序、时空数据库索引技术的分析[J].铁路计算机应用,2002,11(8):1-4.
3张蕾,钱峰.一种关联规则增量式更新算法[J].铜陵学院学报,2008,7(2):73-74. 被引量：1
4尹晨.时序数据库在风电监控系统中的应用[J].计算机时代,2012(8):34-36. 被引量：5
5蒋良孝,蔡之华.时序数据库中的数据挖掘研究[J].微机发展,2003,13(5):90-92. 被引量：5
6刘丽峰.时序数据库中序列模式的采掘方法[J].经济师,2004(12):273-274.
7段立娟,高文,王伟强.时序数据库中相似序列的挖掘[J].计算机科学,2000,27(5):39-44. 被引量：6
8刘省贤.模式匹配算法及其在农作物嫁接中的作用[J].安徽农业科学,2009,37(19):8811-8811.
9杨俊丽,吕晓燕,满晰.基于改进的KMP算法的词频统计[J].微计算机信息,2010,26(27):161-162. 被引量：4
10戈晓斐,黄竞伟,胡磊.改进的KMP算法在生物序列模式自动识别中的应用[J].计算机工程,2004,30(10):140-142. 被引量：6

模式识别与人工智能

2003年第2期

浏览历史

内容加载中请稍等...

时序数据库中快速相似搜索的算法研究被引量：5

参考文献7

同被引文献28

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

时序数据库中快速相似搜索的算法研究 被引量：5

参考文献7

同被引文献28

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

时序数据库中快速相似搜索的算法研究被引量：5