期刊文献+

Web日志挖掘中的数据预处理研究——Frame页面过滤算法改进

下载PDF
导出
摘要 Web数据挖掘是分析网络应用的主要手段。其数据源一般是网络服务器日志,然而日志记录的是杂乱的、不完整的、不准确的并且是非结构化的数据,必须进行数据预处理。本文将预处理过程分为4个阶段:数据净化、用户识别、会话识别、路径补充,并提出了一个高效的Web数据挖掘预处理结构和相应的算法。
作者 李立耀
出处 《福建电脑》 2007年第10期109-110,共2页 Journal of Fujian Computer
  • 相关文献

参考文献4

二级参考文献53

  • 1(美)Wynkoops 康博创作室(译).SQL Server6.5开发使用手册[M].北京:机械工业出版社,1998,5..
  • 2Botafogo R A, Shneiderman B. Identifying Aggregates in Hypertext Structures. In:Third ACM Conf. on HyperText(1991.San Antonio, TX), ACM, 1991.
  • 3Page L, Brin S, Motwani R, Winograd T. The PageRank Citation Ranking: Bringing Order to the Web, Manuseript in progress,1998.
  • 4Kleinberg. Authoritative sources in a hyperlinked environment. In:Proc. of 9th ACM-SIAM Symposium on Discrete Algorithms,1997.
  • 5Lempel R,Moran S. The Stochastic Approach for Link-Structure Analysis (SALSA) and the TKC Effect. In :Proe. of the 9th Intl.World Wide Web Conf. 2000.
  • 6Gallager R G. Discrete Stochastic Processes, Kluwer Academic Publishers, 1996.
  • 7Borodin A, Roberts G O, Rosenthal J S, Tsaparas P. Finding Authorities and Hubs From Link Structure on the World Wide Web. In:Proc. of the 9th Intl. World Wide Web Conf. 2000.
  • 8Marchiori M. The Quest for Correct Information on the Web:Hyper Search Engines. In: The Sixth Intl. WWW Conf.(WWW97), Santa Clara, USA, 1997.
  • 9Mukherjea S, Foley J D. Showing the Context of Nodes in the World Wide Web. In: Proc. of ACM CHI'95 Conf. on Human Factors in Computing Systems, volum 2 of short papers: Web Browsing, 1995.
  • 10Pirolli P, Pitkow J, Rao R. Silk from a Sow's Ear:Extracting Usable Structures from the Web. In: Proe. of 1996 Conf. on Human Factors in Computing Systems (CHI96), Vancouver,British Columbia, Canada, 1996.

共引文献54

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部