期刊文献+

Web日志挖掘数据预处理优化 被引量:4

An Improved Method for Data Preprocessing in Web Log Mining
下载PDF
导出
摘要 在web日志挖掘中,数据预处理技术是各项工作的基础,此项内容将直接影响到后面的各个阶段,因此,也就显得至关重要。在已有的预处理方法基础上,选用了一种建立用户访问树的方法对用户进行识别,并且可以在缺乏网站拓扑结构的情况下对日志进行处理。提出了一种改进的事务处理方法,这可以在不额外增加步骤的基础上,能直接去除无用的事务,从而减少预处理结果对数据挖掘的影响,使得到的事务能更好地应用到模式分析当中,大大增强了后期挖掘的正确性。 In the web log mining, data preprocessing technique is crucial ,which is the basis of the work and will directly influence the later stages. In this paper, choose a method that establish a user access tree to identify the user, based on the existing pretreatment methods, which can take on by the lack of site topology in the case of the log processing. Also give an improved method of transaction processing ,which can remove unnecessary transaction derectly without additional steps, thereby reducing the pretreatment results on the impact of data mining to be better applied to the model analysis,to induce the correction on the late mining.
出处 《计算机技术与发展》 2011年第1期42-45,共4页 Computer Technology and Development
基金 安徽省教育科研重点项目(KJ2009A57)
关键词 数据预处理 WEB日志 用户识别 事务识别 bata pre-processing web log mining user identification transaction identification
  • 相关文献

参考文献12

二级参考文献113

共引文献168

同被引文献26

  • 1周明建,高济,李飞.基于本体论的Web信息抽取[J].计算机辅助设计与图形学学报,2004,16(4):535-541. 被引量:34
  • 2肖君,彭鑫,赵文耘.基于本体的资源描述和检索方法研究[J].计算机工程与应用,2005,41(36):9-11. 被引量:5
  • 3Hyoung R.Kim,Philip K.Chan.Leaming Implicit User Interest Hierarchy for Context in Personalization[J].Applied Intelligence.2008, 28,153-166.
  • 4R. Cooley,B.Mobasher,and J.Srivastava.Data preparation for mining world wideweb browsing patterns.Journal of Knowledge and Information Systems, 1(1), 1999.
  • 5张云涛等.数据挖掘原理与技术[M].电子工业,2004,04.
  • 6Baeza Yates R, Ribeiro Neto B. Modern Information Retrieval [ M ]. ACM Press, Addison Wesley Longman Limited, 1999.
  • 7Studer R, Benjamins V R, Fensel D. Knowledge engineering: Principles and methods [ J ]. Data and Knowledge En- gineering, 1995,25 (1-2) : 161-197.
  • 8Gruber T R. A translation approach to portable ontologies [ J ]. Knowledge Acquisition, 1993,5 (2) : 199-220.
  • 9胡军,李志露.一种基于Rough本体的语义搜索引擎模型[J].微计算机信息,2008,24(24):180-182. 被引量:4
  • 10杨学兵,孙航.一种基于本体的混合检索方法[J].计算机技术与发展,2009,19(1):125-127. 被引量:2

引证文献4

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部