期刊文献+

Web日志挖掘数据预处理研究 被引量:2

Research on Data Preprocessing in Web Log Mining
下载PDF
导出
摘要 在详细介绍ELF日志文件格式的基础上定义了会话表,并对预处理过程中几个主要步骤进行深入讨论,总结已有的各种处理手段提出新的改进方法,其中重点针对会话识别进行了改进并给出了新的算法。 Based on extended log file format,the session table was defined.Through the in-depth research of several major steps in the preprocessing,existed various means have been summarized to propose a new method.Especially,a new algorithm in session identification was improved and thus presented.
出处 《微型电脑应用》 2007年第10期50-53,6,共4页 Microcomputer Applications
关键词 WEB日志挖掘 数据预处理 用户识别 会话识别 事务识别 Web log mining ELF Data preprocessing User identification Session identification Affairs identification
  • 相关文献

参考文献6

  • 1.[EB/OL].http://www.w3.org/Daemon/User/Config/Logging.html,.
  • 2冯林,何明瑞,罗芬.一种基于ExLF日志文件的用户会话识别启发式算法[J].计算机应用,2005,25(2):314-316. 被引量:4
  • 3Robert Cooley,Bam shadMobasher,Jaideep Sriv2astava.Data Preparation for Mining World Wide Web Browsing Patterns[J].Journal of Knowledgeand Information Systems,1999,1 (1):5-32.
  • 4赵红玲,宋瀚涛,牛振东,刘桂山.Web日志挖掘中数据预处理的研究[J].计算机应用研究,2005,22(6):67-69. 被引量:20
  • 5M Spiliopoulou,B Mobasher,B Berendt et al.A Framework for the Evaluation of Session Reconstruction Heuristics in Web Usage Analy-sis[J].INFORMS Journal of Computing,2003;15(2).
  • 6M.S.Chen,J.S.Park,and P.S.Yu.Data mining for path traversal patterns in a Webenvironment[A].In Proceedings of the 16th International Conference on Distributed Computing Systems[C].pages 385-392,2002.

二级参考文献11

  • 1SWEIGERM 陆昌辉 张光剑 陈佐 译.点击流数据仓库[M].北京:电子工业出版社,2004..
  • 2SLINOFFG 沈钧毅 宋擒豹 燕彩蓉 译.Web数据挖掘[M].北京:电子工业出版社,2004..
  • 3Kamdaf T,Joshi A. On Creating Adaptive Web Servers Using Web Log Mining[ EB/OL ]. http ://citeseer. nj. nec. com/kamdm00creating.html,2002.
  • 4Nanopoulos A, Katsaros D, Manolopoulos Y. Effective Prediction of Web-user Aeeesses:A Data Mining Approach[ EB/OL]. http ://citeseer. nj. nee. eom/nanopoulos01 effective. html,2001.
  • 5Bartolini G, Redpath R. Web Usage Mining and Discovery of Association Rules from H'ITP Servers Logs [ EB/OL ]. http ://www. plato.linux. it/2 gbartolini/pdf/wum. pdf,2001.
  • 6[加]HartJ KamberM.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
  • 7Pei J, Han J, Mortazavi-asl B,et al. Mining Access Patterns Efficiently from Web Logs[ C ]. Proc. of the 4th Pacific-Asia Conf. on Knowledge Discovery and Data Mining, 2000. 396-407.
  • 8Bamshad Mobasher, Robert Cooley, Jaideep Srivastava. Automatic Personalization Based on Web Usage Mining[ EB/OL]. http://maya. cs. depaul. edu/- mobasher/personalization/,2002.
  • 9陆丽娜,杨怡玲,管旭东,魏恒义.Web日志挖掘中的数据预处理的研究[J].计算机工程,2000,26(4):66-67. 被引量:57
  • 10徐宝文,张卫丰.数据挖掘技术在Web预取中的应用研究[J].计算机学报,2001,24(4):430-436. 被引量:116

共引文献23

同被引文献12

引证文献2

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部