一种挖掘加权最大频繁序列的新算法被引量：1

A New Algorithm for Mining Weighted Maximal Frequent Sequences

下载PDF

导出

摘要由于其内在的计算复杂性,在密集型数据序列数据库中挖掘全部频繁项集往往非常困难,解决方案之一是挖掘最大频繁序列。传统的序列模式方法对满足最小支持度阈值的序列同等对待,但在真实数据库中不同的序列往往具有不同的重要程度。为解决上述问题,提出了一种挖掘加权最大频繁序列的新算法。该算法利用频繁项目出现的频率来计算频繁序列的权重,给出了频繁加权序列的定义,该定义的引入不仅可以找出较为重要的最大频繁序列,而且可以使挖掘结果同样具有反单调性,从能够加速剪枝,提高算法效率。实验结果表明,加权最大频繁序列算法是有效的。

作者崔巍安海忠武森

机构地区中国地质大学(北京)人文经管学院中国地质大学(北京)资源环境管理实验室北京科技大学经济管理学院

出处《情报杂志》 CSSCI 北大核心 2009年第10期129-131,151,共4页 Journal of Intelligence

基金国家自然科学基金资助项目"高维稀疏数据聚类研究"(编号:70771007)

关键词数据挖掘最大频繁序列权重

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1Wang W, Yang J. Mining Sequential Patterns from Large Data Sets[M]. New York: Springer, 2005.
2Agrawat R, Srikant R. Mining Sequential Patterns [ C ]//Proceedings of the Eleventh International Conference on Data Engineering, 1995:3- 14.
3Srikant R, Agrawal R. Mining Sequential Patterns: Generalizations and Performance Improvements [ C ]//Proceedings of the Fifth International Conference on Extending Database Technology, 1996:3- 17.
4Han J, Pei J, Mortazavi - Asl B, et al. FreeSpan: Frequent Pattern - Projected Sequential Pattem Mining [ C ]//Proceedings of the Sixth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2000:355- 359.
5Pei J, Han J, Mortazavi - Aal B, et al. Mining Sequential Patterns by Pattem- Growth: the PrefixSpan Approach[J]. IEEE Transaction on Knowledge and Data Engineering, 2004,16(1) : 1424 - 1440.
6Zaki M J. SPADE: an Efficient Algorithm for Mining Frequent sequences[J]. Machine Learning, 2001,42(1 - 2) :31 - 60.
7Ayres J, Gehrke J, Yiu T, et al. Sequential Pattern Mining Using a Bitmap Representation [C]//Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2002 : 429 - 435.
8Rigoutsos L, Floratos A. Combinatorial Pattern Discovery in Biological Sequences: the Teiresias Algorithm [ J ]. Bioinformatics, 1998,14(1) :55- 67.

同被引文献19

1杨延娇,王治和.异常数据挖掘在Web服务器日志文件中的应用[J].西北师范大学学报（自然科学版）,2008,44(6):32-34. 被引量：4
2佟为明,李凤阁,孙凡金,苗立杰,程树康.NetLinx开放网络关键技术研究[J].哈尔滨工业大学学报,2004,36(10):1328-1330. 被引量：12
3刘黎明,王水,王乐.基于迭代事务集与交集剪枝的最大频繁项集挖掘算法[J].南开大学学报（自然科学版）,2009,42(4):97-102. 被引量：3
4李天瑞,徐扬,潘无名.φ频繁闭项目挖掘问题及其算法[J].西南交通大学学报,2001,36(3):225-228. 被引量：3
5连一峰,戴英侠,王航.基于模式挖掘的用户行为异常检测[J].计算机学报,2002,25(3):325-330. 被引量：84
6王莉君,何政伟,冯平兴.基于ICA的异常数据挖掘算法研究[J].电子科技大学学报,2015,44(2):211-214. 被引量：15
7李雅莉.时序挖掘算法灰色预测模型的分析及应用[J].网络安全技术与应用,2016(3):43-44. 被引量：4
8谭翠江,刘嘉勇.基于函数调用关系的Android应用权限泄露漏洞挖掘技术研究[J].网络安全技术与应用,2017(2):90-92. 被引量：1
9秦永俊,唐增明.改进的NetLinX开放网络动态入侵检测方法[J].西安工程大学学报,2017,31(4):576-581. 被引量：15
10崔学成,陆南,李秀.Android系统应用权限异常检测技术研究[J].电子设计工程,2017,25(22):85-88. 被引量：3

引证文献1

1李力恒,王晓磊.NetLinX开放网络下异常权限配置挖掘算法[J].西安工程大学学报,2020,34(1):113-118. 被引量：2

二级引证文献2

1毛俊杰,李昌锋,祝和意,吕泊怡.基于数据挖掘与智能算法的学生心理状态预警系统设计[J].电子设计工程,2020,28(15):52-56. 被引量：5
2谈笑.基于模糊聚类的区域健康数据评价分析模型研究[J].电子设计工程,2021,29(3):13-17. 被引量：4

1卫锦花,吴陈.基于最大频繁序列的蛋白质分类算法[J].江苏科技大学学报（自然科学版）,2007,21(B12):79-83. 被引量：1
2董云耀,李笑.基于后缀树的知识点间关联规则挖掘算法[J].杭州电子科技大学学报（自然科学版）,2006,26(1):9-13.
3马传香,李庆华,简钟.MAXSeq:一个新的最大频繁序列挖掘算法[J].小型微型计算机系统,2006,27(6):1092-1096. 被引量：1
4逄玉俊,宁嘉.DMBIT:一种有效的序列模式挖掘算法[J].辽宁大学学报（自然科学版）,2008,35(4):326-329. 被引量：1
5施颖男,李德敏,蔡葛峰.移动计算环境中用户移动模式的挖掘[J].计算机工程,2004,30(5):186-187. 被引量：2
6胡枫,金远平.一种基于哈夫曼树的最大频繁序列挖掘算法[J].微电子学与计算机,2008,25(8):13-16.
7胡蓉,陈文.一种基于串与运算的关联规则挖掘算法[J].东北电力学院学报,2005,25(2):12-15.
8王艳,李玲玲,邵晓艳.改进的频繁项集挖掘算法研究[J].计算机工程与应用,2012,48(19):119-121. 被引量：2
9王燕.基于等价关系的关联规则挖掘算法研究[J].计算机工程与应用,2006,42(8):187-189. 被引量：5
10陈旭辉,蒋红.基于双向搜索的最大频繁项目集挖掘算法[J].计算机工程与设计,2007,28(14):3288-3290. 被引量：2

情报杂志

2009年第10期

浏览历史

内容加载中请稍等...

一种挖掘加权最大频繁序列的新算法被引量：1

参考文献8

同被引文献19

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种挖掘加权最大频繁序列的新算法 被引量：1

参考文献8

同被引文献19

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种挖掘加权最大频繁序列的新算法被引量：1