摘要
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍了各过程的主要任务。
In order to organize the web server architecture more logically. Web log mining is needed to analyze user's.browsing patterns. This paper studies the data preprocessing phase of Web log mining, which is the key to get good mining result, and presents a data preprocessing model including middle steps line data cleaning, user recognition, session recognition, and path supplementation. Also, each step is demonstrated through an example.
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2000年第4期66-67,72,共3页
Computer Engineering