期刊文献+

Web数据挖掘中的数据预处理 被引量:25

Data Preprocess in Web Data Mining
下载PDF
导出
摘要 WLP数据挖掘是分析网络应用的主要手段。其数据源一般是网络服务器日志,然而日志记录的是杂乱的、不完整的、不准确的并且Web是非结构化的数据,必须进行数据预处理。文章将预处理过程分为个阶段—数据清洗、区分使用者、会话识别,并提出了一个高效的3Web数据挖掘预处理结构和相应的算法。 Web data mining is the main method for analysis of Web application. The data resource often is the Web server logs. But the log originated is unorderly, uncomplete, unprecision and unstructured. So it must be preprocessed. This thesis divides the data preprocess into three periods as date cleaning, user identification,session identification,and proposes an efficient Web data mining preprocess architecture WLP and the corresponding algorithms. ;;;;;
出处 《计算机工程》 CAS CSCD 北大核心 2002年第7期125-127,共3页 Computer Engineering
关键词 WEB数据挖掘 数据预处理 结构化数据 数据库 UserSessionAdaptivePersonalizationCookieWeb data mining
  • 相关文献

参考文献4

  • 1[1]Berendt B,Mobasher B,Spiliopoulou M,et al.Measuring the Accuracy of Sessionizers for Web Usage Analysis. Int. SIAM Workshop on Web Mining,2001-04
  • 2[2]Cooley R,Mobasher B,Srivastava J.Data Preparation for Mining World Wide Web Browing Patterns. Journal of Knowledge and Information Systems,1999 1(1)
  • 3[3]He D,Goker A.Detecting Session Boundaries from Web User Logs.Proceedings of the 22nd Annual Colloquim of IR Research(IRSG2000),2000:57-66
  • 4[4]Catledge L,Pitkow J.Characterizing Browsing Strategies in the World Wide Web.3ra International World-Wide Web Conference WWW95,1995

同被引文献130

引证文献25

二级引证文献78

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部