期刊文献+

基于网络日志的数据挖掘预处理改进方法 被引量:5

Improved method of data mining preprocessing based on Web log
下载PDF
导出
摘要 对网络日志数据挖掘预处理技术进行研究,针对Frame页面过滤方法与超时阈值设定进行分析,提出了应用ID3算法改进Frame页面过滤过程中丢失SubFrame页面信息且需要进行站点提升步骤。在超时阈值的设定方面采用动态修正方法,提高预处理技术对长时间会话的识别能力的改进方法。通过实验验证,该方法有效地减少了预处理过程中的信息丢失,同时提高了挖掘结果的精度。 Data preprocessing method of Web log mining is studied. Frame pages filtering and overtime threshold value seting are analyzed. The improved method based on induction of decision tree(ID3) algorithm and threshold value dynamic amendment algorithm is proposed. This method deals with information loss by Frame pages filtering and threshold value fixing. Transaction session identification ability is also enchanced. The experiment about this method shows that this method is efficient in improving accuracy of mining result.
出处 《系统工程与电子技术》 EI CSCD 北大核心 2009年第12期2994-2997,共4页 Systems Engineering and Electronics
关键词 网络日志 数据挖掘 预处理 会话识别 Web log data mining preprocessing transaction session identification
  • 相关文献

参考文献5

二级参考文献16

  • 1金松河,钱慎一,张素智.Frame页面过滤算法在Web日志挖掘预处理中的应用[J].云南民族大学学报(自然科学版),2006,15(1):63-65. 被引量:2
  • 2熊忠阳,周亚峰.Web访问挖掘的预处理技术的研究[J].计算机技术与发展,2007,17(8):11-14. 被引量:19
  • 3Han J,Data Mining:Concepts and Techniques,2000年
  • 4Wang K,Proc of VLDB'97,1999年,363页
  • 5Zaiane O R,Proc Int Workshop Web Information and Data Management(WIDM'98),1998年,9页
  • 6Mobasher B,Tech Rep:TR96 0 5 0,1996年
  • 7Zaiane O R,Proc KDD'95,1995年,331页
  • 8Yang Qiang, Zhang Haining, Li Tianyi. Mining Web logs for prediction models in WWW caching and prefecting[C]//The Seventh ACM SIGKDD International Conference on Knowledge Discovery and Data Mining KDD'01. San Francisco: ACM SIGKDD, 2001.
  • 9Mikroyannidis A, Theodoulidis B. A theoretical framework and an implementation architecture for self adaptive Web sites[C]// Prodeedings of the IEEE/WIC/ACM International Conference on Web Intelligence(WI'04), Beijing: IEEE Press, 2004.
  • 10Berendt B, Mobasher B, Nakagawa M, et al. The impact of site structure and user environment on session reconstruction in Web usage analysis[C]// Proceedings of the 4th WebKDD 2002 Workshop at the ACM-SIGKDD Conference on Knowledge Discovery in Database. Edmonton, Alberta: ACM SIGKDD,2002.

共引文献388

同被引文献49

引证文献5

二级引证文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部