基于分割模式的时间序列矢量符号化算法被引量：6

Vector Symbolization Algorithm for Time Series Based on Segmentation Mode

下载PDF

导出

摘要针对符号化聚合近似算法(SAX)中时间序列必须等长分割的缺陷,提出一种基于分割模式的时间序列符号化算法(SMSAX)。利用三角阈值法对随机抽样的时间序列进行特征提取,计算时间序列最大压缩比,将其作为时间窗宽提取分割点,进而求出时间序列的分割模式。利用得到的分割模式对时间序列进行分割降维,通过均值和波动率对分割后的子序列进行向量符号化。根据时间序列特征对其进行不等长分割,并加入波动率消除奇异点的影响。实验结果表明,SMSAX能获得比SAX更精确的结果。 Aiming at defects of equal-length segmentation of time series in symbolic aggregate approximation algorithm（SAX）, a vector symbolic algorithm based on segmentation algorithm for time series（SMSAX） is presented. A triangular threshold method is used to extract features of time series which is sampled randomly. The time series maximum compression ratio is calculated as the time window width to extract segmentation points, and further the Segment Mode（SM） of the time series is found. The partition model is used to segment time series to reduce the dimensionality of them by using vector of mean and volatility of sub-sequences to symbolic them. The algorithm segments time sequences based on characters of them, and eliminates the impact of singular points with the fluctuation rate. Experimental results indicate that SMSAX is able to obtain more accurate results than SAX.

作者陈湘涛李明亮陈玉娟

机构地区湖南大学计算机与通信学院中南大学信息科学与工程学院

出处《计算机工程》 CAS CSCD 北大核心 2011年第4期55-57,共3页 Computer Engineering

基金国家自然科学基金资助项目(60634020)

关键词分割模式时间序列降维子序列符号化 Segment Mode（SM） time series dimension reducing sub-sequence symbolization

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1Lin J, Keogh E, Lonardi S, et al. Symbolic Representation of Time Series, with Implications for Streaming Algorithms[C]//Proc. of the 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery. San Diego, California, USA: ACM Press. 2003.
2钟清流,蔡自兴.基于统计特征的时序数据符号化算法[J].计算机学报,2008,31(10):1857-1864. 被引量：30
3国宏伟,高学东,王宏.基于异时间窗划分的时间序列聚类[J].计算机工程,2007,33(21):3-5. 被引量：6
4Keogh E, Kasetty S. On the Need for Time Series Data Mining Benchmarks: A Survey and Empirical Demonstration[C]//Proc. of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Edmonton, Alberta, Canada: ACM Press, 2002.
5Loh W K, Kim S W. Index Interpolation: An Approach for Subsequence Matching Supporting Normalization Transform in Time-series Databases[C]//Proc. of the 9th International Conference on Information and Knowledge Management. New York, USA: ACM Press, 2000: 480-487.

二级参考文献25

1肖辉,胡运发.基于分段时间弯曲距离的时间序列挖掘[J].计算机研究与发展,2005,42(1):72-78. 被引量：60
2张军,陈汉武,马志民.一种时间序列相似性的快速搜索算法[J].南京师范大学学报（工程技术版）,2005,5(3):50-53. 被引量：7
3Fayyad U M,Piatetsky-shapiro G,Smyth P,et al.Advances in Knowledge Discovery and Data Mining[M].Cambridge,MA:AAAI/MIT Press,1996.
4武森,高学东,巴斯蒂安M.数据仓库与数据挖掘[M].北京:冶金工业出版社,2002.
5Moller-levet C S,Klawonn F,Cho K H,et al.Fuzzy Clustering of Short Time Series and Unevenly Distributed Sampling Points[C]// Proceedings of the 5th International Symposium on Intelligent Data Analysis,Berlin,Germany.2003:28-30.
6Liao T W,Bolt B,Forester J,et al.Understanding and Projecting the Battle State[C]//Proc.of the 23rd Army Science Conference.2002.
7Shumway R H.Time-frequency Clustering and Discriminant Analysis[J].Stat.Probab.Lett.,2003,63(3):307-314.
8Daw C S, Finney C E A, Tracy E R. A review of symbolic analysis of experimental data. Review of Scientific Instruments, 2003, 74(2): 915-930
9Kantz H, Schreiber T. Nonlinear Time Series Analysis. 2nd Edition. Cambridge, UK: Cambridge University Press, 2004
10Faloutsos C, Ranganathan M, Manolopoulos Y. Fast subsequence matching in time-series databases//Proceedings of the ACM SIGMOD International Conference on Management of Data. Minneapolis, MN, 1994: 419-429

共引文献34

1戴爱明,高学东.时间序列三角极值点线性分段算法[J].南昌航空大学学报（自然科学版）,2009,23(2):25-28. 被引量：8
2杨尹,韩伟红,程文聪.基于时序分析的木马规模预测技术[J].信息网络安全,2009(10):24-26.
3陈湘涛,李明亮,陈玉娟.基于时间序列相似性聚类的应用研究综述[J].计算机工程与设计,2010,31(3):577-581. 被引量：27
4夏建明,杨俊安,张琼.基于数据符号化表示和云模型的时序数据生成方法[J].计算机应用研究,2010,27(10):3691-3693. 被引量：2
5周家杰,余丹,马世龙,陈丽萍.面向航天器测试的时序数据模式表示方法研究[J].计算机应用研究,2011,28(1):127-130.
6孙达辰,孙迎燕,周广群.基于边缘算子的有效子序列分割方法[J].计算机与现代化,2011(7):92-95.
7李海林,郭崇慧,杨丽彬.基于分段聚合时间弯曲距离的时间序列挖掘[J].山东大学学报（工学版）,2011,41(5):57-62. 被引量：11
8蔡世玉,夏战国,张文涛.时间序列相似性半监督谱聚类[J].计算机工程与应用,2011,47(31):116-118. 被引量：1
9李海林,郭崇慧.基于形态特征的时间序列符号聚合近似方法[J].模式识别与人工智能,2011,24(5):665-672. 被引量：18
10张新玉,夏士雄,牛强.基于SFVS的时序关联规则动态发现方法[J].计算机应用研究,2012,29(7):2571-2574. 被引量：2

同被引文献53

1李爱国,覃征.在线分割时间序列数据[J].软件学报,2004,15(11):1671-1679. 被引量：27
2黄超,朱扬勇.基于ARMA模型的联机时间序列数据分割算法[J].模式识别与人工智能,2005,18(2):129-134. 被引量：4
3封国林,龚志强,董文杰,李建平.基于启发式分割算法的气候突变检测研究[J].物理学报,2005,54(11):5494-5499. 被引量：80
4张军,吴绍春,王炜.多变量时间序列模式挖掘的研究[J].计算机工程与设计,2006,27(18):3364-3366. 被引量：11
5向馗,蒋静坪.一种基于隐含模式发现的时间序列处理算法[J].电子与信息学报,2007,29(1):59-62. 被引量：2
6杜奕,卢德唐,李道伦,查文舒.基于层次聚类的时间序列在线划分算法[J].模式识别与人工智能,2007,20(3):415-420. 被引量：8
7AGRAWAL R, FALOUTSOS C, SWAMI A N. Efficient similarity search in sequence databases [ C]// Proceedings of the 4th Interna- tional Conference on Foundations of Data Organization and Algo- rithms. Berlin: Springer, 1993:69-84.
8LIN J, KEOGH E, LONARDI S, et al. A symbolic representation of time series, with implications for streaming algorithms [C]// Proceed- ings of the 8th SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery. New York: ACM Press, 2003: 2-11.
9KEOGH E, CHAKRABARTI K, PAZZANI M, et al. Dimensionali- ty reduction for fast similarity search in large time series databases [ J]. Knowledge and Information Systems, 2001, 3(3): 263-286.
10SHIEH J, KEOGH E. iSAX: disk-aware mining and indexing of massive time series datasets [ J]. Data Mining and Knowledge Dis- cnvery, 2009, 19(1): 24-57.

引证文献6

1刘芬,郭躬德.基于符号化聚合近似的时间序列相似性复合度量方法[J].计算机应用,2013,33(1):192-198. 被引量：7
2谭宏强,牛强.基于滑动窗口及局部特征的时间序列符号化方法[J].计算机应用研究,2013,30(3):796-798. 被引量：12
3李正欣,郭建胜,惠晓滨,宋飞飞.基于共同主成分的多元时间序列降维方法[J].控制与决策,2013,28(4):531-536. 被引量：22
4包伟伟,夏士雄,牛强.基于三角不等式的时间序列相似性搜索算法[J].计算机工程与设计,2014,35(12):4191-4194. 被引量：3
5Lin Wang,Faming Lu,Minghao Cui,Yunxia Bao.Survey of Methods for Time Series Symbolic Aggregate Approximation[J].国际计算机前沿大会会议论文集,2019(1):655-657.
6刘洋,李学文.实时数据指数平滑预测分割算法[J].数字通信世界,2020,0(3):93-94.

二级引证文献44

1李海林,梁叶.基于关键形态特征的多元时间序列降维方法[J].控制与决策,2020,35(3):629-636. 被引量：11
2陈玉昇,杨燕华,林萌,余刃.基于主元分析法的核反应堆关键参数提取研究[J].核动力工程,2019(S02):35-38. 被引量：4
3王伟,王建东,张霞.基于改进符号化度量方法的机场噪声异常检测[J].计算机与现代化,2014(8):5-10. 被引量：2
4李祯盛,何振峰.基于主成分分析的时间序列Shapelet提取方法[J].计算机系统应用,2014,23(11):145-149. 被引量：5
5包伟伟,夏士雄,牛强.基于三角不等式的时间序列相似性搜索算法[J].计算机工程与设计,2014,35(12):4191-4194. 被引量：3
6李海林.基于变量相关性的多元时间序列特征表示[J].控制与决策,2015,30(3):441-447. 被引量：12
7袁铭.基于符号化的时间序列复杂网络构造及其拓扑结构研究[J].计算机应用研究,2015,32(4):1044-1047. 被引量：2
8王喆,张丽翠,黄丽平.二元时间序列模型预测3G网络接通率[J].吉林大学学报（信息科学版）,2015,33(2):219-222. 被引量：2
9李海林,郭韧,万校基.基于特征矩阵的多元时间序列最小距离度量方法[J].智能系统学报,2015,10(3):442-447. 被引量：7
10李进东,王韬,吴杨,雷东.基于主成分分析和学习矢量量化的会话初始协议识别研究[J].计算机工程,2016,42(6):125-130. 被引量：1

1清风慕缘.文件分割合并利器WinMend File Splitter[J].网友世界,2011(3):21-21.
2姜誉,王宇颖,胡铭曾,徐晓飞.面向对象数据库的分割模式及分割算法综述[J].计算机研究与发展,2000,37(6):641-649. 被引量：1
3张英男,张敏情,钮可.基于灰色关联分析的H.264/AVC视频隐写算法[J].武汉大学学报（理学版）,2014,60(6):524-530. 被引量：8
4余胜生,田哲,周敬利,陈加忠.一种新的基于率失真优化的运动补偿方法[J].计算机工程与应用,2004,40(17):47-49.
5姜微,沈庭芝,王晓华,张健.Novel Facial Features Segmentation Algorithm[J].Journal of Beijing Institute of Technology,2008,17(4):478-483.
6吕仕明,帅仁俊.基于改进的CV模型的医学图像分割[J].电子测试,2014,25(S1):101-103. 被引量：1
7谢福鼎,李迎,孙岩,张永.改进的符号化时间序列处理方法[J].计算机工程与设计,2012,33(10):3950-3953. 被引量：5
8吕关锋,苏开乐,林瀚,骆翔宇,陈清亮,岳伟亚.基于BDD的图表示及其算法[J].中山大学学报（自然科学版）,2006,45(1):20-24. 被引量：4
9夏丽娟,冯桂,黄建筑.基于运动矢量和模式选择的视频水印方案[J].计算机工程与应用,2011,47(24):93-96. 被引量：1
10李晓翠,张新玉,罗庆云,任长安.基于统计特征向量的时序符号化改进算法[J].计算机工程,2015,41(10):155-159. 被引量：2

计算机工程

2011年第4期

浏览历史

内容加载中请稍等...

基于分割模式的时间序列矢量符号化算法被引量：6

参考文献5

二级参考文献25

共引文献34

同被引文献53

引证文献6

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于分割模式的时间序列矢量符号化算法 被引量：6

参考文献5

二级参考文献25

共引文献34

同被引文献53

引证文献6

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于分割模式的时间序列矢量符号化算法被引量：6