期刊文献+

改进的Web访问日志会话识别算法 被引量:8

Improved method for session analysis in web log mining
下载PDF
导出
摘要 针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界定内容页,并针对内容页,提出了一些启发式规则,突破了"参引长度法"所固有的一个会话中只包含一个内容页的瓶颈。该方法提高了会话识别的准确度,实验结果表明是有效的。 Aiming at the problem of the session analysis in web log mining, a new method is proposed to recognize the session analysis, which improved the method of Timeout as well as the method of reference-length. According to the new method, the time interval threshold is adjusted dynamically by using the site's topology information, then the time interval threshold and the importance of the page can be related with each other. It also redefined the content page nimbly, and some heuristic rules about the content page are proposed to break through the bottleneck that one session only contained one content page. The accuracy of session analysis is enhanced, and is proved to be effective.
出处 《计算机工程与设计》 CSCD 北大核心 2008年第22期5685-5687,5690,共4页 Computer Engineering and Design
关键词 WEB日志挖掘 数据预处理 会话 内容页 时间阀值 启发式规则 web log mining data preprocessing session content page time threshold heuristics rule
  • 相关文献

参考文献7

  • 1吴慧韫.利用Web日志进行CRM数据挖掘研究[J].科技广场,2006(1):47-49. 被引量:1
  • 2He D,Goker A.Detecting session boundaries from web user logs [C]. Cambridge,UK:Proceedings of the 22nd Annual on Information Retrieval Research,2000:57-66.
  • 3Catledge L,Pitkow J.Characterizing browsing behaviors on the world wide web [J]. Computer Networks and ISDN Systems, 1995,27(6):1065-1073.
  • 4韩家炜,孟小峰,王静,李盛恩.Web挖掘研究[J].计算机研究与发展,2001,38(4):405-414. 被引量:356
  • 5Cooley R,Mobasher B,Srivastava J.Data preparation for mining world wide web browsing pattems[J].Journal of Knowledge and Information Systems, 1999(1):5-32.
  • 6Chen M S,Park J S,Yu P S.Efficient data mining for path traversal patterns[J].IEEE Transactions on Knowledge and Data Engineering, 1998,10(2):209-221.
  • 7Mark Sweiger, Mark R Madsen, Jimmy Langston, et al. Clickstream data warehousing [M]. 北京:电子工业出版社,2003.

二级参考文献5

  • 1Han J,Data Mining:Concepts and Techniques,2000年
  • 2Wang K,Proc of VLDB'97,1999年,363页
  • 3Zaiane O R,Proc Int Workshop Web Information and Data Management(WIDM'98),1998年,9页
  • 4Mobasher B,Tech Rep:TR96 0 5 0,1996年
  • 5Zaiane O R,Proc KDD'95,1995年,331页

共引文献355

同被引文献70

引证文献8

二级引证文献24

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部