时间序列数据的相似模式抽取被引量：12

Extracting Similar Patterns in Time Series Data

下载PDF

导出

摘要提出一种基于多项式回归分析的相似性度量和时间序列相似模式抽取的系统化方法,其基本思路是用一个分段多项式回归模型近似一个时间序列,把原始序列映射到多项式系数张成的特征空间,并推导出此特征空间的欧几里德距离作为相似性度量,从而自然地把原始序列分为一个不重叠的有序子序列集合,然后对这个子序列集合进行聚类,得到一组不重叠的模式.所提方法还定义了不等长度时间序列相似的概念.说明了一些著名的分段直线表示(PLR)法是所提方法的特例,并给出了理论分析和实验结果. Similarity search and similarity-based knowledge discovery in large time series databases have attracted research interest recently. The basis of the two applications is the metrics of similarity and the methods of extracting patterns in time series data. The metrics of similarity and a systematic method of finding similar patterns in time series data based on polynomial regression are proposed. A segmented polynomial model is employed to approximate the time series data in order to map the original time series data to a modality space that is spanned by the coefficients of the polynomial model, and Euclidean distance is derived in the space as the metrics of similarity, then the time series is divided into non-overlapping subsequences that can be clustered into variety patterns. The similarity is defined between difference length time series. Theoretical analysis and experimental results demonstrate that some well-known piecewise linear representation (PLR) methods are special situations of the proposed method.

作者李爱国覃征贺升平

机构地区西安交通大学电子与信息工程学院

出处《西安交通大学学报》 EI CAS CSCD 北大核心 2002年第12期1275-1278,共4页 Journal of Xi'an Jiaotong University

基金陕西省科学技术发展计划“十五”攻关项目(2000K08-G12).

关键词相似模式时间序列相似搜索知识发现多项式回归模型模式提取数据库 Database systems Fourier transforms Piecewise linear techniques Time series analysis

分类号 TP311.131 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1李斌,谭立湘,章劲松,庄镇泉.面向数据挖掘的时间序列符号化方法研究[J].电路与系统学报,2000,5(2):9-14. 被引量：29
2蒋嵘,李德毅.基于形态表示的时间序列相似性搜索[J].计算机研究与发展,2000,37(5):601-608. 被引量：34

二级参考文献9

1Li D，Knowledge Based Syst，1998年，10期，431页
2Li D，Proc Second Pacific-Asia Conf Knowledge Discovery & Data Mining.Melbourne，1998年，392页
3Xia B B，Master dissertation，1997年
4Li D，Logic Programming and Soft Computing，1997年
5Agrawal R，Proc Twenty-First International Conference on Very Large Data Bases.San Francisc，1995年，490页
6Das Gautam, Lin David, Mannila Heikki, et al. Rule Discovery from Time Series. In: Proc. Fourth Annual Conference on Knowledge Discovery and Data Mining.
7Andrea Baraldi, Ethem Alpaydm. Simplified ART: A New Class of ART Algorithms. Technique Report of INTERNATIONAL COMPUTER SCIENCE INSTITUTE , California: Berkeley, 1998.
8Keogh E. Fast Similarity Search in the Presence of Longitudinal Scaling in Time Series Databases. In: Proceedings of the 9th international Conference on Tools with Artificial Intelligence. [s. 1.]: IEEE Press, 1997. 578-584
9黎明,严超华,刘高航.基于遗传策略和神经网络的非监督分类方法[J].软件学报,1999,10(12):1310-1315. 被引量：3

共引文献59

1裴丽鹊.一种基于分段线性的FKD时间序列模式表示[J].赤峰学院学报（自然科学版）,2008,24(7):55-58. 被引量：1
2李斌,汪祖媛,高清维,庄镇泉.基于遗传算法的时间序列中频繁结构模式发现研究[J].电路与系统学报,2004,9(4):81-85. 被引量：2
3颜镝,宋苏.状态演化模式挖掘在交通流预测中的应用[J].计算机应用,2005,25(3):649-651. 被引量：2
4倪世宏,王刚,史忠科.一种非同步时间序列特征提取算法[J].计算机应用研究,2005,22(5):87-89.
5宋咏谦,李芳,谢康林.金融时间序列的概念表示[J].计算机应用与软件,2005,22(6):53-54. 被引量：1
6李斌,谭立湘,邹谊,庄镇泉.量子概率编码遗传算法及其应用[J].电子与信息学报,2005,27(5):805-810. 被引量：19
7王刚,倪世宏,沙孟春.基于遗传算法的非同步时间序列特征提取方法[J].计算机工程,2005,31(17):155-156. 被引量：2
8张军,陈汉武,马志民.一种时间序列相似性的快速搜索算法[J].南京师范大学学报（工程技术版）,2005,5(3):50-53. 被引量：7
9任江涛,何武,印鉴,张毅.一种时间序列快速分段及符号化方法[J].计算机科学,2005,32(9):166-169. 被引量：4
10张军,马志民.基于时间序列的相似子模式发现算法[J].计算机技术与发展,2006,16(1):140-142. 被引量：6

同被引文献87

1钱昱,郑诚.基于序列模式的异常检测[J].微机发展,2004,14(9):53-55. 被引量：3
2刘世元,江浩.面向相似性搜索的时间序列表示方法述评[J].计算机工程与应用,2004,40(27):53-59. 被引量：14
3向馗,蒋静坪.时间序列的符号化方法研究[J].模式识别与人工智能,2007,20(2):154-161. 被引量：23
4水利部水利信息中心,等.防洪调度及水资源管理数据挖掘系统项目技术报告[R].2008,1.
5R.Agrawal,C.Faloutsos, A.Swami. Efficient similarity search in sequecnce databases [A]. Proc. 4th Int'l.Conf.Foundations of Data Organization and Algorithm[C]. Oct. 1993,69-84.
6[1]KANTZ H,THOMAS S.Nonlinear time series analysis[M].Cambridge:Cambridge University Press,2000.
7[2]BROWN R.Statistical forecasting for inventory control[M].New York:McGraw Hill Book Co,1958.
8[3]HOLT C C.Forecasting seasonal and trends by exponentially weighted moving averages[J].Carnegie Institute of Technology,Pittsburgh,Pennsylvania,1957.
9[4]BOX E P,GEORGE G M,JENKINS.Time series analysis:forecasting and control[M].Holden Day:San Francisco,1970.
10[5]HARVEY C,ANDREW.Forecasting,structural time series models and the kalman filter[M].Cambridge:Cambridge University Press,1989.

引证文献12

1李爱国,覃征.在线分割时间序列数据[J].软件学报,2004,15(11):1671-1679. 被引量：27
2李爱国,覃征.大规模时间序列数据库降维及相似搜索[J].计算机学报,2005,28(9):1467-1475. 被引量：20
3范强,彭宏.一种新的多项式拟合时间序列预测方法[J].吉首大学学报（自然科学版）,2006,27(3):19-22. 被引量：3
4刘懿,鲍德沛,杨泽红,赵雁南,贾培发,王家钦.符号化近似SAX在时序数据挖掘中的应用研究[J].计算机工程与应用,2006,42(27):191-193. 被引量：1
5兰秋军,马超群.时序相似度的主观偏好模型及其系数估计的“锚点”方法[J].系统工程,2006,24(9):112-116. 被引量：1
6刘懿,鲍德沛,杨泽红,赵雁南,贾培发,王家钦.新型时间序列相似性度量方法研究[J].计算机应用研究,2007,24(5):112-114. 被引量：24
7范强.牛顿多项式拟合时间序列预测方法的研究[J].甘肃联合大学学报（自然科学版）,2008,22(4):84-87.
8张洁.基于Haar小波的时间序列相似度量算法的实现[J].福建电脑,2008,24(11):79-80.
9李薇,孙洪林.水文时间序列相似性查询的分析与研究——以漯河站、何口站汛期降雨量相似性查询为例[J].水文,2009,29(6):76-80. 被引量：8
10陈继明,王辉,仉志华.双馈风电场等值准确度研究[J].电网技术,2014,38(7):1867-1872. 被引量：14

二级引证文献105

1谭尚晨,郭春义,杜东冶.直驱风电场聚合模型下次同步振荡模态特征的保真度分析与评价[J].中国电机工程学报,2022,42(S01):26-38.
2唐建,栾家辉,吕琛.小卫星电源系统遥测数据的区间预测技术[J].华中科技大学学报（自然科学版）,2009,37(S1):210-212. 被引量：4
3刘永志,皮德常,贾学萍.基于三点的时间序列关键点研究[J].微电子学与计算机,2015,32(1):45-47. 被引量：3
4李爱国,覃征.在线分割时间序列数据[J].软件学报,2004,15(11):1671-1679. 被引量：27
5黄超,朱扬勇.基于ARMA模型的联机时间序列数据分割算法[J].模式识别与人工智能,2005,18(2):129-134. 被引量：4
6李爱国,覃征.大规模时间序列数据库降维及相似搜索[J].计算机学报,2005,28(9):1467-1475. 被引量：20
7张军,陈汉武,马志民.一种时间序列相似性的快速搜索算法[J].南京师范大学学报（工程技术版）,2005,5(3):50-53. 被引量：7
8张军,马志民.基于时间序列的相似子模式发现算法[J].计算机技术与发展,2006,16(1):140-142. 被引量：6
9龚志强,封国林,董文杰,李建平.非线性时间序列的动力结构突变检测的研究[J].物理学报,2006,55(6):3180-3187. 被引量：39
10王世卫,李爱国.检测时间序列数据中的例外模式[J].广西师范大学学报（自然科学版）,2006,24(4):18-21. 被引量：1

1刘渤海,杨世元.基于ANN和SVM的质量预测方法研究[J].制造业自动化,2010,32(5):152-155. 被引量：3
2康美林,刘军万.基于双聚类模型的协同过滤推荐引擎设计[J].电脑编程技巧与维护,2013(2):10-11.
3王太雷.个性化推荐系统中相似模式聚类研究[J].计算机工程,2005,31(10):156-158. 被引量：3
4付小青,张爱明.基于SOM的入侵检测算法的特征选择[J].华中科技大学学报（自然科学版）,2007,35(7):5-7. 被引量：3
5王威,周军红,王润生.多传感器数据融合的一种方法[J].传感器技术,2003,22(9):39-41. 被引量：39
6李正欣,张凤鸣,张晓丰,陈继成,李超.多元时间序列相似性搜索研究综述[J].控制与决策,2017,32(4):577-583. 被引量：11
7杨涛,李龙澍.基于时间序列相似搜索和粗糙集的数据挖掘研究[J].微机发展,2005,15(5):116-118.
8胡学钢,张圆圆.基于已发现序列模式的序列聚类研究[J].合肥工业大学学报（自然科学版）,2008,31(1):9-12.
9程健,陈光昀,龚平华,朱小强.非线性多维时间序列模式分类的新方法[J].计算机工程与应用,2011,47(32):128-131. 被引量：2
10相征,张太镒,孙建成.基于最小二乘支持向量机的非线性系统建模[J].系统仿真学报,2006,18(9):2684-2687. 被引量：27

西安交通大学学报

2002年第12期

浏览历史

内容加载中请稍等...

时间序列数据的相似模式抽取被引量：12

参考文献2

二级参考文献9

共引文献59

同被引文献87

引证文献12

二级引证文献105

相关作者

相关机构

相关主题

浏览历史

时间序列数据的相似模式抽取 被引量：12

参考文献2

二级参考文献9

共引文献59

同被引文献87

引证文献12

二级引证文献105

相关作者

相关机构

相关主题

浏览历史

时间序列数据的相似模式抽取被引量：12