期刊文献+

Web日志挖掘数据预处理中的会话识别技术 被引量:1

Sessions' Identification in Data Preprocessing of Web Log Mining
下载PDF
导出
摘要 会话识别是Web日志挖掘的关键步骤,会话识别的质量直接影响后续挖掘的准确性。本文分析了Web日志挖掘的数据预处理过程中的三种会话识别算法,最终选用时间阈值法对安徽国防科技职业学院服务器日志文件进行会话识别。 The sessions' identification is a key step in Web log mining.The accuracy of post-mining is influenced by the quality of the sessions' identification directly.In this paper,it analyzed three session identification algorithm in Data Preprocessing of Web Log Mining.Finally,threshold method is chosed on the session identification of Anhui Vocational College of Defense Technology's server log files.
作者 许艳丹
出处 《中国西部科技》 2011年第4期28-29,15,共3页 Science and Technology of West China
基金 安徽国防科技职业学院基金项目--基于CMS平台的校园网站系统设计与实现(2009gfyz01)
关键词 WEB日志挖掘 数据预处理 会话识别 Web logmining Data pre-processing Sessions' identification
  • 相关文献

参考文献5

  • 1Chen J.J.,Liu W Research for Web Usage Mining Model,International Conference on Computational Intelligence for Modelling Automation. and International Control and Conference on Intelligent Agents, Web Technologies and Internet Commerce (CIMCA-IAWTIC' 06),2006:8-12.
  • 2董毕建.基于点击流技术的个性化信息服务应用研究[D].北京对外经济贸易大学,2006.
  • 3Marquardt C.G, Becker K. Ruiz D.D. A pre-processing tool for Web usage mining in the distance education domain. Proceedings of the International Database Engineering and Applications Symposium (IDEAS' 04), IEEE Conference, 2004 : 78-87.
  • 4Cooley R, Mobasher B, Srivastava J. Data Preparation for mining world wide web browsing patterns[J].Knowledge and Information System, 1999,1(1):5-32.
  • 5Fu Y, Sandbu K, Shih M.A generalization-based approach to clustering of web usage session[C].Proc 1999 KDD Wordshop Web Mining, LNCS 1863. Springer- Verlag, 2000 : 21-28.

同被引文献5

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部