近似保序序列模式挖掘被引量：2

Approximate Order-preserving Sequential Pattern Mining

下载PDF

导出

摘要保序序列模式挖掘旨在时间序列中挖掘保序模式完全相同(最精确)的子序列,其可以用来进行疾病发展趋势预测.但只挖掘最精确的保序模式往往会遗漏一些重要信息.有些保序模式虽然不完全相同,但它们之间仍具有很高的相似性.有鉴于此,本文提出了一种近似保序序列模式挖掘算法(Approximate Order Preserving Pattern Mining:AOPM),该算法能根据输入参数值的不同而挖掘出近似程度不同的保序模式.在候选模式生成方面,AOPM算法采用了基于前后缀拼接的模式融合策略,减少了无意义候选模式的数量.在模式支持度计算方面,AOPM算法首选获取候选模式的全部候选序列,然后在进行模式匹配.本文通过在真实数据集上进行对比实验,验证了AOPM算法的完备性和高效性. Order-preserving sequence pattern mining aims to mine sub-sequences with the same(most accurate)order-preserving pattern in a time series, which can be used to predict the development trend of diseases.However, only mining the most accurate order-preserving pattern often misses some important information.Although some preserving patterns are not the same, they still have high similarities.In view of this, this paper proposes an approximate order-preserving pattern mining algorithm(Approximate Order Preserving Pattern Mining, AOPM),which can mine order-preserving patterns with different degrees of approximation according to different input parameter values.In terms of candidate pattern generation, the AOPM algorithm uses a pattern fusion strategy based on prefix and suffix splicing, which reduces the number of meaningless candidate patterns.In terms of pattern support calculation, the AOPM algorithm first obtains all candidate sequences of candidate patterns and then performs pattern matching.This paper verifies the completeness and efficiency of the AOPM algorithm through comparative experiments on real data sets.

作者刘锦武优西王月华李艳 LIU Jin;WU You-xi;WANG Yue-hua;LI Yan(School of Artificial Intelligence,Hebei University of Technology,Tianjin 300401,China;School of Economics and Management,Hebei University of Technology,Tianjin 300401,China)

机构地区河北工业大学人工智能学院河北工业大学经济管理学院

出处《小型微型计算机系统》 CSCD 北大核心 2023年第3期490-496,共7页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61976240)资助。

关键词模式挖掘时间序列保序序列 (δ-γ)距离模式匹配 pattern mining order-preserving sequence (δ-γ)distance pattern fusion pattern match

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1张晓宇,谢红薇,孟亮.序列模式挖掘算法在高血压治疗中的研究[J].计算机工程与设计,2018,39(3):727-731. 被引量：1
2张传玉,杨鹤标.加权序列模式在临床异常行为检测中的应用[J].信息技术,2016,40(11):182-184. 被引量：1
3刘贞宇,陈羽中,郭昆,张毓东.面向网络攻击建模的分布式过程挖掘与图分割方法[J].小型微型计算机系统,2020,41(8):1732-1740. 被引量：8
4杨海民,潘志松,白玮.时间序列预测方法综述[J].计算机科学,2019,46(1):21-28. 被引量：112
5原继东,王志海.时间序列的表示与分类算法综述[J].计算机科学,2015,42(3):1-7. 被引量：54

二级参考文献66

1魏伟杰,张明卫,张斌,王波.基于最小加权支持的加权序列模式挖掘算法[J].吉林大学学报（工学版）,2008,38(S2):178-183. 被引量：2
2庄军,李峰,叶世清,刘侃,何皎.HIS系统中药物医嘱序列模式挖掘[J].医疗卫生装备,2007,28(7):34-36. 被引量：2
3Agrawal R, Faloutsos C, Swami A. Efficient similarity search in sequence databases[C]//Proceedings of the 4th International Conference on Foundations of Data Organization and Algorithms (FODO 1993). 1993:69-84.
4Azzouzi M, Nabney I T. Analysing time series structure with Hidden Markov Models[C]//Proceedings of the IEEE Confe- rence on Neural Networks and Signal Processing. 1998:402-408.
5Bagnall A, Janacek G J, Powell M. A likelihood ratio distance measure for the similarity between the fourier transform of time series[C]//Proceedings of the Advances in Knowledge Disco- very and Data Mining, 9th Pacific-Asia Conference (PAKDD2005). 2005:737 743.
6Bagnall A, Davis I., Hills J, et al. Transformation based ensem- bles for time series elassification[C]//Proeeedings of the 2012 SIAM International Conference on Data Mining (SDM 2012). 2012:307 318.
7Balakrishnan S, Madigan D. Decision trees for functional varia- bles[C] // Proceedings of the 2006 International Conference on Data Mining (ICDM 2006). 2006:798 802.
8Batista G, Wang X, Keogh E. A complexity invariant distance measure for time series[C]//Proeeedings of the eleventh SIAM conference on data mining (SDM 2011 ). 2011 : 699-710.
9Berndt D J,Clifford J. Using dynamic time warping to find pat terns in time series[C]//KDD Workshop. 1994 : 359 370.
10Buza K. Fusion methods for time-series classification[D]. Uni- versity of Hildesheim,Germany, 2011.

共引文献164

1徐亮,李楠楠,杨国华,李小虎.安全监测数据的趋势性和波动性研究[J].水利水电技术（中英文）,2022,53(S01):174-180. 被引量：1
2孙斌,张博,余向华,陈学健,姜泽昊,伍俊.基于深度学习的桥梁技术状况预测研究[J].中国交通信息化,2024(S01):568-571.
3王宏伟,张利民,姜建平,乔木,刘英男,于大洋.特高压站避雷器泄漏电流在线监测和分析系统[J].电瓷避雷器,2019(6):67-72. 被引量：24
4陈晓虎.氧化铝陶瓷摩擦材料制备的初步研究[J].材料导报,2000,14(5):63-65. 被引量：5
5姚吉利,张大富.数字测图中棱镜偏心的坐标改正模型[J].测绘通报,2000(4):29-31. 被引量：6
6万媛媛,宋余琴.基于“第二课堂成绩单”的友善价值观培育现状研究——以安徽工业大学为例[J].内蒙古师范大学学报（教育科学版）,2018,31(11):22-26.
7薛联青,刘远洪,张梦泽,王思琪,李军.基于样本熵的降雨和径流时间序列突变检验[J].地球科学与环境学报,2015,37(3):75-80. 被引量：11
8王远,陶烨,蒋英明,陈波,陈立宇.智能电网时序大数据实时处理系统[J].计算机应用,2015,35(A02):88-92. 被引量：29
9丁雨晴,隋爱娜,伏文龙,王亚光.基于免疫算法的时间序列预测模型[J].中国传媒大学学报（自然科学版）,2016,23(1):21-26.
10丁剑,王树英.一种使用shapelets的增量式时间序列分类[J].计算机科学,2016,43(5):257-260. 被引量：1

同被引文献4

1杨皓,段磊,胡斌,邓松,王文韬,秦攀.带间隔约束的Top-k对比序列模式挖掘[J].软件学报,2015,26(11):2994-3009. 被引量：22
2王慧锋,段磊,左劼,王文韬,李钟麒,唐常杰.免预设间隔约束的对比序列模式高效挖掘[J].计算机学报,2016,39(10):1979-1991. 被引量：15
3高曼,韩萌,雷冰冰.高效用模式产生策略综述[J].计算机工程与应用,2020,56(16):1-12. 被引量：4
4赵晓倩,武优西,王月华,李艳.一种保序序列快速挖掘算法:RSMM[J].郑州大学学报（理学版）,2022,54(4):64-70. 被引量：6

引证文献2

1王珍,武优西,孟玉飞,李艳.一种共生保序模式挖掘算法[J].小型微型计算机系统,2024,45(6):1384-1391.
2谢婷萱,武优西,王月华,李艳.一种对比序列模式挖掘算法[J].小型微型计算机系统,2024,45(8):1808-1815.

1Murtaza Saleem,Saadat A.Siddiqi,Shahid M.Ramay,Shahid Atiq,Shahzad Naseem.Origin of Ferromagnetism in Al and Ni Co-doped ZnO Based DMS Materials[J].Chinese Physics Letters,2012,29(10):155-157. 被引量：1
2Yong-Hao Gao,Xu-Ping Yao,Fei-Ye Li,Gang Chen.Spin-1 pyrochlore antiferromagnets:Theory,model,and materials'survey[J].Frontiers of physics,2020,15(6):83-96.
3陈海洋,张静,王露楠,环晓敏.小数据集下基于改进QMAP算法的BN参数学习[J].西安工程大学学报,2023,37(1):126-133. 被引量：2
4朱应云.泳池循环水处理系统中消毒方案的选用——以南沙某学校为例[J].中文科技期刊数据库（文摘版）工程技术,2022(9):226-228.
5陈熙,崔凯(摄影).东风雪铁龙C5 X凡尔赛[J].汽车与运动,2022(3):26-31.
6夏容,李房云.基于数据挖掘的船舶海上航行轨迹高精度跟踪研究[J].舰船科学技术,2023,45(1):186-189. 被引量：1
7荀亚玲,王林青,蔡江辉,杨海峰.基于多尺度的时序数据部分周期模式增量挖掘[J].计算机应用,2023,43(2):391-397. 被引量：2
8郑玉婵,谈笑,田宜鑫,潘颖,谭朝文,马晓缓,喻乾,赵彦.血流限制的低强度有氧训练对2型糖尿病患者糖代谢和睡眠时长的影响[J].中国运动医学杂志,2022,41(11):849-856. 被引量：5
9王春东,孙嘉琪,杨文军.基于矫正理解的中文文本对抗样本生成方法[J].计算机工程,2023,49(2):37-45. 被引量：1
10张海涛,王立凤,袁萍,张霄,李栋.不同维持剂量枸橼酸咖啡因治疗早产儿呼吸暂停的临床效果分析[J].中国妇幼保健,2023,38(3):465-469. 被引量：5

小型微型计算机系统

2023年第3期

浏览历史

内容加载中请稍等...

近似保序序列模式挖掘被引量：2

参考文献5

二级参考文献66

共引文献164

同被引文献4

引证文献2

相关作者

相关机构

相关主题

浏览历史

近似保序序列模式挖掘 被引量：2

参考文献5

二级参考文献66

共引文献164

同被引文献4

引证文献2

相关作者

相关机构

相关主题

浏览历史

近似保序序列模式挖掘被引量：2