期刊文献+

一种挖掘加权最大频繁序列的新算法 被引量:1

A New Algorithm for Mining Weighted Maximal Frequent Sequences
下载PDF
导出
摘要 由于其内在的计算复杂性,在密集型数据序列数据库中挖掘全部频繁项集往往非常困难,解决方案之一是挖掘最大频繁序列。传统的序列模式方法对满足最小支持度阈值的序列同等对待,但在真实数据库中不同的序列往往具有不同的重要程度。为解决上述问题,提出了一种挖掘加权最大频繁序列的新算法。该算法利用频繁项目出现的频率来计算频繁序列的权重,给出了频繁加权序列的定义,该定义的引入不仅可以找出较为重要的最大频繁序列,而且可以使挖掘结果同样具有反单调性,从能够加速剪枝,提高算法效率。实验结果表明,加权最大频繁序列算法是有效的。
出处 《情报杂志》 CSSCI 北大核心 2009年第10期129-131,151,共4页 Journal of Intelligence
基金 国家自然科学基金资助项目"高维稀疏数据聚类研究"(编号:70771007)
  • 相关文献

参考文献8

  • 1Wang W, Yang J. Mining Sequential Patterns from Large Data Sets[M]. New York: Springer, 2005.
  • 2Agrawat R, Srikant R. Mining Sequential Patterns [ C ]//Proceedings of the Eleventh International Conference on Data Engineering, 1995:3- 14.
  • 3Srikant R, Agrawal R. Mining Sequential Patterns: Generalizations and Performance Improvements [ C ]//Proceedings of the Fifth International Conference on Extending Database Technology, 1996:3- 17.
  • 4Han J, Pei J, Mortazavi - Asl B, et al. FreeSpan: Frequent Pattern - Projected Sequential Pattem Mining [ C ]//Proceedings of the Sixth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2000:355- 359.
  • 5Pei J, Han J, Mortazavi - Aal B, et al. Mining Sequential Patterns by Pattem- Growth: the PrefixSpan Approach[J]. IEEE Transaction on Knowledge and Data Engineering, 2004,16(1) : 1424 - 1440.
  • 6Zaki M J. SPADE: an Efficient Algorithm for Mining Frequent sequences[J]. Machine Learning, 2001,42(1 - 2) :31 - 60.
  • 7Ayres J, Gehrke J, Yiu T, et al. Sequential Pattern Mining Using a Bitmap Representation [C]//Proceedings of the Eighth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2002 : 429 - 435.
  • 8Rigoutsos L, Floratos A. Combinatorial Pattern Discovery in Biological Sequences: the Teiresias Algorithm [ J ]. Bioinformatics, 1998,14(1) :55- 67.

同被引文献19

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部