一种快速最大频繁序列模式挖掘算法

A Mining Algorithm for Fast Maximal Sequential Patterns

下载PDF

导出

摘要针对序列模式挖掘中,频繁子序列个数随模式长度增加而爆炸性增长的问题,提出一种从序列数据库中挖掘最大频繁序列模式的新算法(MFSPAN).MFSPAN充分利用不同序列可能具有相同前缀的性质来减少项集比较次数.在标准测试数据集上的实验结果表明了MFSPAN的有效性. This paper proposes a novel algorithm MFSPAN （maximal frequent sequential pattern mining algorithm）. MFSPAN is used to mine the complete set of maximal frequent sequential patterns in sequence databases. It solves the problem that the number of frequent subsequences will increase explosively as frequent patterns become longer： because MFSPAN takes full advantage of the property that different sequences may share a common prefix to reduce itemset comparing times. Experiments on standard test data show that MFSPAN is very effective.

作者常晓宇王喆徐秀娟路春一周春光

机构地区吉林大学计算机科学与技术学院

出处《吉林大学学报（理学版）》 CAS CSCD 北大核心 2006年第4期570-574,共5页 Journal of Jilin University:Science Edition

基金国家自然科学基金(批准号:60433020) 教育部"符号计算和知识工程重点实验室"资助项目基金

关键词序列模式最大序列模式长模式深度优先 sequential pattern maximal sequential pattern long pattern depth-first

分类号 TP31 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1Agrawal R,Srikant R.Mining Sequential Patterns[C]//Eleventh International Conference on Data Engineering (ICDE 1995).Taipei:IEEE Computer Society Press,1995:3-14.
2陆楠,王喆,周春光.基于FP-tree频集模式的FP-Growth算法对关联规则挖掘的影响[J].吉林大学学报（理学版）,2003,41(2):180-185. 被引量：25
3欧阳继红,王仲佳,刘大有.具有动态加权特性的关联规则算法[J].吉林大学学报（理学版）,2005,43(3):314-319. 被引量：16
4Yan X,Han J,Afshar R.CloSpan:Mining Closed Sequential Patterns in Large Databases[C]//Proceedings of the Third SIAM International Conference on Data Mining (SDM2003).San Francisco:ACM/SIAM Press,2003:166-177.
5Burdick D,Calimlim M,Gehrke J.Mafia:a Maximal Frequent Itemset Algorithm for Transactional Databases[C]//Proceedings of the 17th International Conference on Data Engineering (ICDE 2001).Heidelberg,Germany:IEEE Press,2001:443-452.
6管恩政,周春光,王喆,徐秀娟.频繁序列模式挖掘算法[J].吉林大学学报（信息科学版）,2005,23(3):267-272. 被引量：4
7Jr Bayardo R J.Efficiently Mining Long Patterns from Databases[C]//Proceedings of the ACM SIGMOD.New York:ACM Press,1998:85-93.
8Agarwal R,Aggarwal C,Prasad V V.A Tree Projection Algorithm for Generation of Frequent Itemsets[J].Journal of Parallel and Distributed Computing,2000,61(3):350-371.
9Ayres J,Flannick J,Gehrke J,et al.Sequential Pattern Mining Using a Bitmap Representation[C]//SIGKDD 2002.New York:ACM Press,2002:429-435.
10管恩政,常晓宇,王喆,周春光.快速频繁序列模式挖掘算法[J].吉林大学学报（理学版）,2005,43(6):768-772. 被引量：7

二级参考文献23

1周春光,邢辉,徐振龙,王哲.商业数据的预测模型及其算法研究[J].吉林大学学报（信息科学版）,2002,20(3):53-60. 被引量：15
2AGRAWAL R, SRIKANT R. Mining Sequential Patterns [A]. In ICDE'95 [C]. Taipei: [s. n. ], 1995: 3-14.
3AGRAWAL R, SRIKANT R. Fast Algorithms for Mining AssociationRules [A]. In VLDB'94 [C]. Santiago, Chile: [s.n. ] , 1994: 487-499.
4BURDICK D, CALIMLIM M, GEHRKE J. Mafia: A Maximal Frequent Itemset Algorithm for Transactional Databases [A].In ICDE2001 [C]. Heidelberg, Germany: [s. n.] , 2001.
5PEI J, HAN J, MORTAZAVI-ASL B, et al. PrefixSpan Mining Sequential Patterns Efficiently by Prefix Projected Pattern Growth [A]. In ICDE2001 [C]. Heidelberg, Germany: [s. n.],2001.
6YAN XIFENG, HAN JIAWEI, AFSHAR RAMIN. CloSpan: Mining Closed Sequential Patterns in Large Databases [A]. In SDM 2003 [C]. San Francisco, California, USA: [s. n. ], 2003.
7AYRES J, FLANNICK J, GEHRKE J, et al. Sequential Pattern Mining Using a Bitmap Representation [A]. In SIGKDD2002[C]. Edmonton, Alberta, Canada: [ s. n. ], 2002: 429-435.
8HAN J, PEI J, YIN Y. Mining Frequent Patterns without Candidate Generation [J]. In SIGMOD00 [C]. Dallas, TX: [s.n. ], 2000: 1-12.
9HAN J, PEI J, MORTAZAVI-ASL B, et al. Freespan: Frequent Pattern-Projected Sequential Pattern Mining [A]. In KDD'00 [C]. Boston. MA: [ s. n. ], 2000. 355-359.
10SRIKANT R, AGRAWAL R. Mining Sequential Patterns: Generalizations and Performance Improvements [A]. In EDBT96[C]. Avignon, France: [s. n. ], 1996: 3-17.

共引文献47

1肖云凡,马会,赵靖普.基于数据挖掘的船舶碰撞人为因素致因链构建[J].中国水运（下半月）,2021,21(4):30-31. 被引量：2
2胡枫.频繁序列模式挖掘算法Apriori的分析及改进[J].青海师范大学学报（自然科学版）,2009,25(3):35-38. 被引量：1
3侯雪波,田斌,葛少云,路志英.关联规则技术在电力市场营销分析中的应用[J].电力系统及其自动化学报,2005,17(2):67-72. 被引量：23
4王英,徐慧.基于时间权重的FP-Growth算法改进[J].运城学院学报,2005,23(2):9-11.
5管恩政,常晓宇,王喆,周春光.快速频繁序列模式挖掘算法[J].吉林大学学报（理学版）,2005,43(6):768-772. 被引量：7
6肖海林,李兴明.层次分析法在通信网告警相关性分析中的应用研究[J].电信科学,2006,22(11):36-39. 被引量：11
7王富强,许士国.基于关联规则挖掘的径流长期预报模型研究[J].南水北调与水利科技,2007,5(1):70-73. 被引量：3
8徐岩,朱恒民.数据挖掘与数据库的集成方法[J].吉林大学学报（信息科学版）,2007,25(2):228-232. 被引量：7
9闪四清,李晓娜.基于时间约束的序列模式挖掘算法研究[J].石家庄铁路职业技术学院学报,2007,6(3):11-16.
10李彤岩,李兴明.神经网络在确定关联规则挖掘算法权值中的应用研究[J].计算机应用研究,2008,25(5):1440-1441. 被引量：3

1卫锦花,吴陈.基于最大频繁序列的蛋白质分类算法[J].江苏科技大学学报（自然科学版）,2007,21(B12):79-83. 被引量：1
2董云耀,李笑.基于后缀树的知识点间关联规则挖掘算法[J].杭州电子科技大学学报（自然科学版）,2006,26(1):9-13.
3谭小球,姚敏,顾沈明.基于最大频繁序列模式树的个性化页面推荐[J].微电子学与计算机,2006,23(9):108-111. 被引量：2
4施颖男,李德敏,蔡葛峰.移动计算环境中用户移动模式的挖掘[J].计算机工程,2004,30(5):186-187. 被引量：2
5马传香,李庆华,简钟.MAXSeq:一个新的最大频繁序列挖掘算法[J].小型微型计算机系统,2006,27(6):1092-1096. 被引量：1
6王泽芳,袁平,黄晓芳.一种新的多步攻击场景构建技术研究[J].西南科技大学学报,2016,31(1):55-60. 被引量：4
7黄东,唐俊,汪卫,施伯乐.CuMen:基于最大频繁序列模式的聚类算法及其在基因拼接中的应用[J].计算机科学,2005,32(10):149-153. 被引量：4
8杨观赐,李琴,李少波,钟勇.重用最大频繁模式的可持续进化算法[J].华南理工大学学报（自然科学版）,2011,39(5):115-119. 被引量：1
9崔巍,安海忠,武森.一种挖掘加权最大频繁序列的新算法[J].情报杂志,2009,28(10):129-131. 被引量：1
10王涛.在有噪音的环境中挖掘序列模式精简基[J].华中科技大学学报（自然科学版）,2006,34(6):36-38. 被引量：1

吉林大学学报（理学版）

2006年第4期

浏览历史

内容加载中请稍等...

一种快速最大频繁序列模式挖掘算法

参考文献10

二级参考文献23

共引文献47

相关作者

相关机构

相关主题

浏览历史