基于SPAM-FPT的WebLog访问序列模式挖掘

WebLog Access Sequential Pattern Mining Based on SPAM-FTP

下载PDF

导出

摘要 WebLog访问序列模式挖掘将数据挖掘中的序列模式技术应用于Web服务器上的日志文件,以此来改善Web的信息服务,而在对海量的数据挖掘时,系统资源开销很大。该文结合SPAM、PrefixSpan的思想,提出一个新的算法——SPAM-FPT,该算法通过建立First_Positon_Table,避免了SPAM中的"与操作"、"连接操作"以及PrefixSpan中大量的"投影数据库"的建立,可以快捷地挖掘数据库中所有"频繁子序列"。 WebLog mining is application of sequential pattern mining of data mining technology on Web server log files. Sequential patterns mined from Web logs are used to improve the quality of information service on Web. The main challenge of mining access sequential pattern form WebLog is the high processing cost due to the large amount of data. By combining SPAM and PrefixSpan, this paper proposes a new arithmetic SPAM-FPT. By constructing first_positon_table, SPAM-fPT avoids ＂joining＂ or ＂ANDing＂ in SPAM and generating a large number of projected database in PrefixSpan, and gets all the frequent sequential patterns form dtatabase.

作者朱莉应吉康卜忠飞

机构地区华东师范大学信息学院计算中心扬州市教育局

出处《计算机工程》 CAS CSCD 北大核心 2007年第17期80-82,共3页 Computer Engineering

关键词序列模式挖掘 WEBLOG 频繁子序列 SPAM—FPT sequential pattern mining WebLog frequent subsequence SPAM-FPT

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Srikantr A R.Mining Sequential Patterns[C]//Proc.of International Conference on Data Engineering.1995:3-14.
2Han J W Kamber M 范明孟小峰译.数据挖掘概念与技术[M].北京:机械工业出版杜,2001.147-158.
3Ayres J,Flannick J,Gehrke J,et al.Sequential Pattern Mining Using a Bitmap Representation[C]//Proc.of ACM Special Interest Group Conference on Knowledge Discovery and Data Mining.2002:429.
4Srikantr A R.Fast Algorithms for Mining Association Rules[C]//Proc.of International Conference on Very Large Data Bases,Santiago.1994:487-499.
5Chiu D,Wu Y,Chen A P L.An Efficient Algorithm for Mining Frequent Sequences by a New Strategy Without Support Counting[C]//Proc.of the 20th Int'l Conf.on Data Engineering.2004.

共引文献112

1叶震,周兵斌.基于数据挖掘的NIDS日志分析系统[J].合肥工业大学学报（自然科学版）,2005,28(1):87-90.
2于希宁,牛成林,李建强.基于决策树和专家系统的短期电力负荷预测系统[J].华北电力大学学报（自然科学版）,2005,32(5):57-61. 被引量：27
3陈亚东.数据挖掘在图书馆中的应用[J].中华医学图书情报杂志,2006,15(5):16-18. 被引量：3
4郭俊芳,谢益武,周生宝.关联规则相关性的度量[J].计算机应用,2007,27(4):892-893. 被引量：6
5徐雪松,章兢,贺庆.一种基于免疫聚类竞争的关联规则挖掘算法[J].计算机工程与应用,2007,43(16):16-19. 被引量：1
6蒋志方,祝翠玲,吴强.一个对不带类别标记文本进行分类的方法[J].计算机工程,2007,33(12):96-98. 被引量：1
7张钊,王锁柱,张雨.一种基于SOM和PAM的聚类算法[J].计算机应用,2007,27(6):1400-1402. 被引量：8
8曾小宁,肖水晶.一种增量更新算法在数据挖掘中的应用[J].计算机应用,2007,27(6):1403-1406. 被引量：1
9李士进,朱跃龙,刘净.一种基于k-prototype的多层次聚类改进算法[J].河海大学学报（自然科学版）,2007,35(3):342-347. 被引量：1
10崔兆顺,汪志农.基于模糊神经网络进行数据挖掘的一种算法[J].兰州理工大学学报,2007,33(3):112-115.

1胡晓琳,陈晓云.基于符号化表示的时间序列频繁子序列挖掘[J].计算机工程,2008,34(10):61-63. 被引量：3
2张文静,马冬来,么炜.基于改进Apriori算法的决策推导过程[J].河北农业大学学报,2013,36(2):122-124. 被引量：2
3倪志伟,蔡庆生,方瑾.用神经网络来挖掘数据库中的关联规则[J].系统仿真学报,2000,12(6):685-687. 被引量：10
4曹静.基于用户兴趣度的关联规则挖掘算法[J].计算机光盘软件与应用,2012,15(16):170-171.
5刘智萍.序列模式数据挖掘算法研究[J].科学与财富,2014(6):442-442.
6孙浩,董雷.序列模式挖掘算法的比较与研究[J].科技与生活,2010(20):116-116.
7袁本刚,陈莉,金燕.挖掘数据库中的负频繁模式[J].计算机工程与应用,2010,46(8):117-119. 被引量：1
8夏明波,王晓川,孙永强,金士尧.序列模式挖掘算法研究[J].计算机技术与发展,2006,16(4):4-6. 被引量：13
9刘昆.序列模式挖掘在教学管理上的运用[J].电脑知识与技术,2016,0(5):189-190.
10张亮,赵娜.序列模式挖掘两种典型算法的研究[J].信息技术,2016,40(11):118-120.

计算机工程

2007年第17期

浏览历史

内容加载中请稍等...

基于SPAM-FPT的WebLog访问序列模式挖掘

参考文献5

共引文献112

相关作者

相关机构

相关主题

浏览历史