基于改进PrefixSpan的序列模式挖掘算法被引量：12

Sequential patterns mining algorithm based on improved PrefixSpan

下载PDF

导出

摘要针对PrefixSpan算法构造投影数据库开销大的问题,提出一种基于改进PrefixSpan的序列模式挖掘算法SPMIP。该方法通过添加剪枝步和减少某些特定序列模式生成过程的扫描,来减少投影数据库的规模及扫描投影数据库的时间,提高算法效率,并最终得到需要的序列模式。实验结果证明在获得序列模式不受影响情况下,SPMIP算法比PrefixSpan算法效率更高。 PrefixSpan, the classic sequential patterns mining algorithm, has the problem of producing huge amount of project databases. To solve this problem, a sequential patterns mining algorithm named SPMIP was proposed based on an improved PrefixSpan. This algorithm reduced the scale of projected databases and the time of scanning projected databases through adding pruning step and reducing scanning of certain specific sequential patterns production. In this way, algorithm efficiency could be raised up, and the needed sequential patterns were obtained. The experimental results show that SPMIP is more efficient than PrefixSpan while obtained sequential patterns have not been affected.

作者公伟刘培玉贾娴

机构地区山东师范大学信息科学与工程学院山东省分布式计算机软件新技术重点实验室

出处《计算机应用》 CSCD 北大核心 2011年第9期2405-2407,共3页 journal of Computer Applications

基金国家自然科学基金资助项目(60873247) 山东省高新自主创新专项工程资助项目(2008ZZ28) 山东省自然科学基金资助项目(ZR2009GZ007) 山东省教育厅科技计划项目(J09LG52)

关键词 PREFIXSPAN 序列模式投影数据库剪枝扫描 PrefixSpan squential pattern project database pruning scanning

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1AGRAWAL B, SRIKANT It. Mining sequential patterns [C]// ICDE '95: Proceedings of the Eleventh International Conference on Data Engineering. Washington, DC: IEEE Computer Society, 1995:3 - 14.
2HANJ KAMBERM 范明孟小峰译.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
3SRIKANT R, AGRAWAL R. Mining sequential patterns: generalizations and performance improvements [ C]// EDBT '96: Proceedings of the 5th International Conference on Extending Database Technology: Advances in Database Technology. Berlin: Springer-Verlag, 1996:3 - 17.
4ZAKI M. SPADE: an efficient algorithm for mining frequent sequences [J]. Machine Learning, 2001, 42(1) : 31 -60.
5PEI J, HAN J, PINTO H, et al. PrefixSpan: mining sequential patterns efficiently by prefix-projected pattern growth [ C]// Proceedings 17th International Conference on Data Engineering. Washington, DC: IEEE Computer Society, 2001:215-224.
6HAN J, PEI J, MORTAZAVI-ASL B, et al. FreeSpan: frequent pattern-projected sequential pattern mining [C]// Proceedings of the 6th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2000:355 -359.
7张坤,朱扬勇.无重复投影数据库扫描的序列模式挖掘算法[J].计算机研究与发展,2007,44(1):126-132. 被引量：17
8谢清森,杨天奇.改进的PrefixSpan算法在Web挖掘中的应用[J].科学技术与工程,2009,9(23):7176-7179. 被引量：2
9汪林林,范军.基于PrefixSpan的序列模式挖掘改进算法[J].计算机工程,2009,35(23):56-58. 被引量：13
10宁兴旺,刘培玉.支持审计与取证联动的日志系统设计[J].计算机工程与设计,2009,30(24):5580-5583. 被引量：6

二级参考文献35

1黄艺海,胡君.日志审计系统设计与实现[J].计算机工程,2006,32(22):67-68. 被引量：17
2Agrawal R, Srikant R. Mining Sequential Pattems[C]//Proc. of the 11th Int'l Conf. on Data Engineering. Taipei, China: [s. n.], 1995: 3-L4.
3Srikant R, Agrawal R. Mining Sequential Patterns: Generalizations and Performance Improvements[C]//Proc. of the 5th Int'l Conf. on Extending Database Technology. Avignon, France: [s. n.], 1996: 3-17.
4Zaki M J. SPADE: An Efficient Algorithm for Mining Frequent Sequences[J]. Machine Learning Journal, Special Issue on Unsupervised Learning, 2001, 42(1/2): 31-60.
5Pei Jian,- Han Jiawei, Mortazavi B, et al. FreeSpan: Frequent Pattern-projected Sequential Pattern Mining[C]//Proe. of the 6th Int'l Conf. on Knowledge Discovery and Data Mining. New York, USA: [s. n.], 2000: 355-359.
6Pei Jian, Han Jiawei, Mortazavi-Asl B, et al. Mining Sequential Patterns by Pattern-growth: The PrefixSpan Approach[J]. IEEE Trans. on Knowledge and Data Engineering, 2004, 16(11): 1424-1440.
7Anderson J P.Computer security threat monitoring and surveillance[C].Anderson Co,1980.
8a赵小敏.基于日志的计算机取证技术的研究及系统设计与实现[D].浙江工业大学,2002.
9Han Jiawei,Micheline Kamber.Data mining:Concepts and techniques[M].Morgan Kanfmann Publishers,2001:149-184.
10Ha Ines J, Ryder DK. Validation of sensor alert correlators [J]. IEEE Security & Privacy,2003,1 (1):46-56.

共引文献73

1王伟娜,李陶深,陈庆锋.基于投影位置的序列模式挖掘算法[J].华中科技大学学报（自然科学版）,2012,40(S1):104-107.
2吕锡香,杨波,裴昌幸,苏晓龙.基于数据挖掘的入侵检测系统检测引擎的设计[J].西安电子科技大学学报,2004,31(4):574-580. 被引量：10
3赵守伟.数据挖掘在网络异常检测中的应用[J].河北大学学报（自然科学版）,2004,24(4):444-447. 被引量：2
4刘芳,孙杨军.基于多克隆选择的多维关联规则挖掘算法[J].复旦学报（自然科学版）,2004,43(5):742-745. 被引量：9
5厍向阳,彭文祥,薛惠锋.满足二维空间邻接条件的遗传聚类算法研究[J].计算机应用,2005,25(10):2395-2397.
6樊建聪,张问银,梁永全.基于贝叶斯方法的决策树分类算法[J].计算机应用,2005,25(12):2882-2884. 被引量：20
7王雪姣,叶枫.基于关联规则算法的工业生产班组运行质量分析[J].计算机应用,2005,25(B12):211-212. 被引量：2
8李新安,石冰.基于决策树方法的特定主题Web搜索策略[J].计算机应用,2006,26(1):223-226. 被引量：3
9王晓乔,张桂新,喻兴标.Web使用挖掘预处理技术研究[J].湘潭师范学院学报（自然科学版）,2006,28(2):18-20.
10任江涛,黄焕宇,孙婧昊,印鉴.基于相关性分析及遗传算法的高维数据特征选择[J].计算机应用,2006,26(6):1403-1405. 被引量：16

同被引文献91

1张利军,李战怀,王淼.基于位置信息的序列模式挖掘算法[J].计算机应用研究,2009,26(2):529-531. 被引量：12
2胡建武,何贞铭,张贻权.WEB日志挖掘及其实现[J].计算机工程与应用,2004,40(14):156-158. 被引量：13
3张晓宁,戴青.基于数据挖掘的分布式入侵检测系统研究[J].无线电工程,2004,34(9):19-21. 被引量：3
4沙金,邓成玉,张翠肖,刘伟峰.闭合序列模式挖掘算法[J].计算机工程与设计,2006,27(3):514-518. 被引量：9
5陆介平,刘月波,倪巍伟,陈耿,孙志挥.基于投影数据库的序列模式挖掘增量式更新算法[J].东南大学学报（自然科学版）,2006,36(3):457-462. 被引量：5
6张坤,朱扬勇.无重复投影数据库扫描的序列模式挖掘算法[J].计算机研究与发展,2007,44(1):126-132. 被引量：17
7王硕,周激流,彭博.基于API序列分析和支持向量机的未知病毒检测[J].计算机应用,2007,27(8):1942-1943. 被引量：21
8高明霞,刘椿年.基于约束的自然语言问题到OWL的语义映射方法研究[J].电子学报,2007,35(8):1598-1602. 被引量：8
9HAN J W,KAMBER M.数据挖掘:概念与技术[M].范明,孟晓峰,译.北京:机械工业出版社,2007:147-183.
10AGRAWAL R, SRIKANT R. Mining sequential patterns [ C ]//Proc of the 11 th international Conference on Data Engineering. Washington DC : IEEE Computer Society, 1995:3-14.

引证文献12

1周晓凤,肖南峰,文翰.基于情感特征分类的语音情感识别研究[J].计算机应用研究,2012,29(10):3648-3650. 被引量：5
2缪裕青,吴孔玲,朱晓雁,张锦杏.基于二级索引结构无候选项闭合序列模式挖掘算法[J].计算机应用研究,2012,29(10):3672-3676.
3李陶深,王伟娜,陈庆峰.Web访问序列模式挖掘算法的研究[J].计算机科学,2013,40(12):41-44. 被引量：2
4张巍,刘峰,滕少华.改进的PrefixSpan算法及其在序列模式挖掘中的应用[J].广东工业大学学报,2013,30(4):49-54. 被引量：11
5付沙.基于序列模式挖掘的图书馆用户借阅行为分析[J].情报理论与实践,2014,37(6):103-106. 被引量：18
6陈勇.一种目标行为序列模式的数据挖掘方法[J].无线电通信技术,2015,41(2):79-81. 被引量：11
7李硕,石丽红,呼忠权,孔涛.序列模式挖掘技术在数字图书馆中的应用[J].农业图书情报学刊,2015,27(7):40-43. 被引量：2
8杨斐,张万桢,陆垂伟.一种无候选项的闭合序列模式挖掘算法[J].计算机应用与软件,2016,33(3):279-283. 被引量：1
9薛飞,单征,闫丽景,范超.基于数据挖掘的多轨迹特征检测技术[J].计算机科学,2016,43(5):91-95. 被引量：2
10王斌,黄晓芳,袁平.基于PrefixSpan序列模式挖掘的改进算法[J].西南科技大学学报,2016,31(4):68-72. 被引量：6

二级引证文献60

1陈平华,周鹏.一种应用于噪声点分布密集环境下的噪声点识别算法[J].广东工业大学学报,2014,31(3):39-43. 被引量：1
2汪双兔,韩坚华,罗军.云环境下基于信任的入侵防御研究[J].广东工业大学学报,2014,31(3):55-61. 被引量：1
3张福泉.情感建模及情感识别技术研究[J].廊坊师范学院学报（自然科学版）,2014,14(5):23-26. 被引量：4
4梁欣祺,张钰莎.基于关联规则的图书馆书目序列模式挖掘[J].电脑知识与技术,2015(4):83-85.
5张钰莎,梁欣祺.数据挖掘在高校图书馆服务中的应用研究[J].廊坊师范学院学报（自然科学版）,2015,15(3):32-35. 被引量：9
6杜翠兰,鲁睿,付戈,赵淳璐,钮艳.用闭合序列模式实现特征子串的发现研究[J].现代计算机,2015,21(12):20-22.
7陶惠,蒋凡.改进的序列模式挖掘在医院转诊中的应用[J].计算机系统应用,2015,24(10):253-258. 被引量：1
8陈小燕.机器学习算法在数据挖掘中的应用[J].现代电子技术,2015,38(20):11-14. 被引量：26
9李全.适用于协议特征提取的多级T+序列树挖掘算法[J].计算机技术与发展,2015,25(10):71-75.
10白文秀,孙慧,张桂杰.数据挖掘技术在图书馆远程访问系统中的应用研究[J].吉林师范大学学报（自然科学版）,2015,36(4):149-152. 被引量：5

1叶飞跃.基于自适应哈希链的分布式频繁模式挖掘算法[J].系统工程与电子技术,2005,27(3):560-564. 被引量：2
2谢清森,杨天奇.改进的PrefixSpan算法在Web挖掘中的应用[J].科学技术与工程,2009,9(23):7176-7179. 被引量：2
3缪裕青,吴孔玲,朱晓雁,苏杰.一种基于序列末项位置信息的序列模式挖掘算法[J].计算机应用研究,2012,29(7):2505-2508. 被引量：5
4刘辉,王伯雄,李鹏程,任怀艺.双向扫描投影双目结构光编码设计[J].仪器仪表学报,2012,33(8):1862-1867. 被引量：4
5陈兆学,施鹏飞.基于灰度图像的车牌快速定位和分割方法[J].计算机工程,2006,32(9):173-174. 被引量：16
6汪林林,范军.基于PrefixSpan的序列模式挖掘改进算法[J].计算机工程,2009,35(23):56-58. 被引量：13
7肖仁财,薛安荣.一种挖掘多维序列模式的有效方法[J].计算机工程与应用,2008,44(6):187-190. 被引量：3
8蔡坤,杨扬.一种改进的LIPI数据挖掘算法的仿真分析[J].计算机仿真,2014,31(8):268-272. 被引量：2
9白娟娟,杨玉双,王海鹏.X射线断层扫描投影图像背景不一致的校准[J].CT理论与应用研究（中英文）,2016,25(6):661-670. 被引量：4
10陈兆学,施鹏飞,周煦潼.一类特殊印刷体字符的分割和识别方法[J].微型电脑应用,2003,19(2):40-42. 被引量：2

计算机应用

2011年第9期

浏览历史

内容加载中请稍等...

基于改进PrefixSpan的序列模式挖掘算法被引量：12

参考文献10

二级参考文献35

共引文献73

同被引文献91

引证文献12

二级引证文献60

相关作者

相关机构

相关主题

浏览历史

基于改进PrefixSpan的序列模式挖掘算法 被引量：12

参考文献10

二级参考文献35

共引文献73

同被引文献91

引证文献12

二级引证文献60

相关作者

相关机构

相关主题

浏览历史

基于改进PrefixSpan的序列模式挖掘算法被引量：12