基于形状特征k-d树的多维时间序列相似搜索被引量：11

Similarity Search Based on Shape k-d Tree for Multidimensional Time Sequences

下载PDF

导出

摘要多维时间序列是信息系统中一类重要的数据对象,相似搜索是其应用的一个核心.两个序列(子序列)相似度加以比较的常用方法是:将序列(子序列)转换成空间中的曲线,然后计算曲线间的欧几里德距离.这种方法的主要缺陷是它仅考虑了序列(子序列)间的整体距离关系,而不能体现它们自身的局部变化.针对此问题,提出了一种新的可应用于多维时间序列的快速相似搜索方法.该方法将序列(子序列)的局部变化特性与检索结构(k-d树)结合起来,使得在搜索k-d树的同时实现了序列(子序列)的局部变化匹配,从而极大地提高了查询效率和正确率.实验结果表明了算法的有效性. Multidimensional time sequences are an important kind of data stored in the information system. Similarity search is the core of their applications. Usually, these sequences are viewed as curves in multi-space, and the Euclidean Distance is computed to measure similarity between these curves. Although Euclidean Distance can reflect the whole deviation between two sequences or subsequences, it ignores their inherent changing features. To remedy it, this paper presents a new algorithm. In this algorithm, the shape features of sequences or subsequences are subtly combined with spatial index structure （k-d tree）, which makes it possible to match shape of sequences or subsequences without any extra cost whiling searching the tree. The experimental result demonstrates that the algorithm is effective and efficient.

作者黄河史忠植郑征

机构地区中国科学院计算技术研究所

出处《软件学报》 EI CSCD 北大核心 2006年第10期2048-2056,共9页 Journal of Software

基金 No.90604017(国家自然科学基金) No.2003CB317004(国家重点基础研究发展规划(973)) No.4052025(北京市自然科学基金)~~

关键词时间序列相似搜索欧氏距离检索结构 K-D树 time sequence similarity search Euclidean distance index structure k-d tree

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1黄河,熊范纶,杭小树,黄轲.时序数据库中快速相似搜索的算法研究[J].模式识别与人工智能,2003,16(2):169-173. 被引量：5

二级参考文献7

1Agrawal R,Faloutsos C,Swami A.Efficient Similarity Scarch in Sequences Database[].Proc of the th International Conference on Foundations of Data Organization and Algorithms.1993
2Bozkaya T,Yazdani N,Ozsoyglu M.Matching and Indexing Sequences of Different Lengths[].Proc of the th International Conference on Information and Knowledge Management.1997
3Rabinar L,Juang B H.Fundamentals of Speech Recognition[].Prentice Hall Signal Processing Series.1993
4R. Agrawal,,K. I. Lin,H. S. Sawhney,,and K. Shim.Fast similarity search in the presence of noise, scaling, and translation in time-series database[].Proc Int Conf Very Large Data Bases(VLDB‘).1995
5Faloutsos C,Ranganathan M,Manolopoulos Y.Fast subsequencematching in time-series databases[].Proceedings of the ACMSIGMOD International Conference on Management of Data.1994
6E.Keogh,P.Smyth.A Probabilistic Approach to Fast Pat- tern Matching in Time Series Databases[].Proceedings of the rd International Conference on Knowledge Discovery and Data Mining.1997
7Keogh E,Pazzani M.An enhanced representation of time series which allows fast and accurate classification, clustering and relevance feedback.In: Proc of 4th Int’ l Conf on Knowledge Discovery and Data Mining(KDD’ 98)[].New York.1998

共引文献4

1王飞.能量模型数据挖掘的研究[J].软件,2011,32(1):32-34. 被引量：1
2柴亚刚.基于时序数据库的分布式网络波动监控系统[J].中国传媒科技,2018,0(3):36-37. 被引量：3
3李超.基于多系统支持的生产数据综合预警系统[J].陕西煤炭,2020,39(4):64-68.
4黄河,黄轲,杭小树,熊范纶.时间序列中快速模式发现算法的研究[J].计算机工程与应用,2003,39(21):192-194. 被引量：6

同被引文献119

1李士进,朱跃龙,张晓花,万定生.基于BORDA计数法的多元水文时间序列相似性分析[J].水利学报,2009,39(3):378-384. 被引量：19
2邝祝芳,阳国贵,辛动军.SWFPM:一种有效的数据流频繁项挖掘算法[J].计算机应用研究,2009,26(2):466-469. 被引量：4
3肖辉,胡运发.基于分段时间弯曲距离的时间序列挖掘[J].计算机研究与发展,2005,42(1):72-78. 被引量：59
4刘全金,李颖新,阮晓钢.基于统计方法的肿瘤特征基因提取[J].北京工业大学学报,2005,31(2):122-125. 被引量：1
5杨苹,吴捷.火电厂锅炉常见故障的数据挖掘诊断方法[J].仪器仪表学报,2005,26(7):696-701. 被引量：18
6宋立松,谢亚力,王挺,于普兵.钱塘江风暴潮预报系统研制[J].水电能源科学,2010,28(8):129-132. 被引量：4
7王兴元,骆超,邱天爽.HAI实验中EEG信号的非线性动力学研究[J].中国生物医学工程学报,2005,24(4):408-415. 被引量：8
8任永功,于戈.一种多维数据的聚类算法及其可视化研究[J].计算机学报,2005,28(11):1861-1865. 被引量：13
9吴绍春,吴耿锋,王炜,蔚赵春.寻找地震相关地区的时间序列相似性匹配算法[J].软件学报,2006,17(2):185-192. 被引量：25
10张军,吴绍春,王炜.多变量时间序列模式挖掘的研究[J].计算机工程与设计,2006,27(18):3364-3366. 被引量：11

引证文献11

1管河山,姜青山,王声瑞.基于点分布特征的多元时间序列模式匹配方法[J].软件学报,2009,20(1):67-79. 被引量：38
2吴薇,胡静涛.旋转机械全息序列相似性匹配故障诊断方法[J].仪器仪表学报,2009,30(3):536-541. 被引量：6
3黄冬梅,廖娟.时间序列相似匹配算法在数字海洋风暴潮辅助决策系统中的应用[J].海洋环境科学,2012,31(5):746-749. 被引量：1
4李会民,方丽英,闫健卓,王普,赵辉.基于扩展范式距离的纵向数据相似性度量[J].计算机与应用化学,2012,29(10):1176-1180. 被引量：3
5张立,何冰,封卫兵,张武.笛卡尔网格生成中的相交算法[J].计算机辅助工程,2013,22(1):71-76.
6李会民,闫健卓,方丽英,王普.基于Eros距离的纵向数据模糊聚类方法[J].北京工业大学学报,2013,39(8):1161-1165. 被引量：1
7吴虎胜,张凤鸣,张超,李正欣,杜继永.多元时间序列的相似性匹配[J].应用科学学报,2013,31(6):643-649. 被引量：6
8吴虎胜,张凤鸣,吴虎胜.多元时间序列相似性研究综述[J].统计与决策,2014,30(7):77-81. 被引量：4
9戴珂.基于线性散列索引的时间序列查询方法研究[J].软件工程,2016,19(8):1-8. 被引量：1
10张蓬郁,王煜,江旻宇,邵嘉琳,张洪滨.基于K-D树和机器学习的时空数据检索-预测系统[J].软件,2018,39(8):215-218. 被引量：4

二级引证文献59

1潘琢金,王方,周振辉.导引头电子舱自动测试系统中波形相似性度量问题的研究[J].计算机测量与控制,2010,18(6):1355-1357. 被引量：5
2李正欣,张凤鸣,李克武.多元时间序列模式匹配方法研究[J].控制与决策,2011,26(4):565-570. 被引量：26
3佟庆彬,马惠萍,刘丽华,张晓冬,李桂斌.高速旋转机械径向振动检测系统关键技术研究[J].仪器仪表学报,2011,32(5):1026-1032. 被引量：23
4李正欣,张凤鸣,李克武.基于DTW的多元时间序列模式匹配方法[J].模式识别与人工智能,2011,24(3):425-430. 被引量：24
5张振山,黄晶晶,李挺,李培富.某型坦克自动装填故障自检系统的设计与开发[J].电子测量技术,2011,34(9):106-109. 被引量：2
6郭小芳,张绛丽.基于加权范数的多维时间序列相似性主元分析[J].江苏科技大学学报（自然科学版）,2011,25(5):466-469. 被引量：7
7张静静,何振峰.基于排序的周期自动检测算法[J].计算机工程与设计,2011,32(12):4100-4103.
8郭俊,王刚,孙杰,武凤栖,王文生.四步数字相移全息干涉术三维变形测量[J].仪器仪表学报,2011,32(12):2808-2813. 被引量：8
9张岩,王美清.子宫内膜间质肿瘤[J].中国肿瘤临床,2000,27(1):75-76. 被引量：1
10张可,王岩,辛江慧,许叶军.基于特征点分布的多元灰色绝对关联度(英文)[J].Transactions of Nanjing University of Aeronautics and Astronautics,2012,29(2):145-151.

1冯晓辉.数据处理中的检索方法探析[J].辽宁师专学报（自然科学版）,2004,6(1):41-43.
2陈尚飞.利于计算曲线点串的差分算法[J].广西民族大学学报（自然科学版）,2006,12(z2):18-20.
3孙晓飞,潘文文,王霞.基于颜色特征和空间特征的图像检索[J].成都信息工程学院学报,2014,29(5):479-484.
4岳根霞.基于Ontology的跨媒体检索[J].电脑编程技巧与维护,2011(24):123-124.
5王素红,宁慧,王明星,徐丽.基于Hadoop的抄袭检测的源检索方法研究[J].应用科技,2015,42(6):67-71.
6陈超群,李志华.一种面向隐私保护的密文检索算法[J].计算机科学,2016,43(S2):346-351.
7解咪咪,廖晓峰,周庆.基于秘密共享的分布式广义不经意传输协议[J].计算机工程,2014,40(3):184-187.
8李哲,张海鸥.基于本体的信息检索模型研究[J].航空计算技术,2009,39(6):105-107.
9钱立兵,季振洲.Web搜索引擎的一种检索结构优化方法[J].高技术通讯,2014,24(6):565-572. 被引量：1
10王大玲,于戈,鲍玉斌.基于最长顺序频繁词组的Web文献检索结构[J].软件学报,2006,17(10):2096-2105. 被引量：1

软件学报

2006年第10期

浏览历史

内容加载中请稍等...

基于形状特征k-d树的多维时间序列相似搜索被引量：11

参考文献1

二级参考文献7

共引文献4

同被引文献119

引证文献11

二级引证文献59

相关作者

相关机构

相关主题

浏览历史

基于形状特征k-d树的多维时间序列相似搜索 被引量：11

参考文献1

二级参考文献7

共引文献4

同被引文献119

引证文献11

二级引证文献59

相关作者

相关机构

相关主题

浏览历史

基于形状特征k-d树的多维时间序列相似搜索被引量：11