摘要
在网络流量模式挖掘中,发现邻接序列模式(CSP)是一个重要问题,为网络流量分析提出了一种新的树型数据结构。为了有效存储包含指定项的所有序列,该树组合了前缀树和后缀树,这种特殊的树结构确保了CSP检测的有效性。实验表明与已有方法相比,使用该结构不仅改进了CSP挖掘的时间性能,而且改进了空间性能。
Finding Contiguous Sequential Patterns (CSP) is an important problem in network trend mining. In this paper we propose a new data structure, UpDown Tree, for CSP mining. An UpDown Tree combines suffix tree and prefix tree for efficient storage of all the sequences that contain a given item. The special structure of UpDown Tree ensures efficient detection of CSPs. Experiments show that UpDown Tree improves CSP mining of both time and memory usage comparing to existing methods.
出处
《电脑开发与应用》
2010年第10期6-8,共3页
Computer Development & Applications
基金
"十一五"国家科技支撑计划重点项目课题(2009BAH46B06)
北京市属高等学校人才强教计划资助项目(PHR200906210)
北京市教育委员会科研基地建设项目(WYJD200902)
北京市教育委员会科技计划项目(KM200910037002)
北京市哲学社会科学规划项目(09BaJG258)
关键词
序列模式
数据挖掘
流量分析
sequential patterns, data mining, flow analysis