有关日志数据预处理的研究

Research on Web Usage Data Preprocessing

下载PDF

导出

摘要在日志数据的预处理中,确定合适的挖掘粒度是一项重要任务。本文介绍了一种日志数据预处理模型,在一般预处理模型基础上添加了页面视图识别环节,从而使日志数据有了更精确的挖掘粒度,挖掘结果有更强的语义。 Finding a proper mining granularity is a crucial task, which should be finished in log data preproeessing, This paper puts forward an improved preprocessing model of Web usage data. An additional step, page view identification is appended to the common model, then the improved model is realized through experiment, and finally, from the sample result, the granularity is detailed and is more meaningful than before.

作者张琦琪

机构地区上海科学技术职业学院

出处《计算机与现代化》 2007年第4期62-63,104,共3页 Computer and Modernization

基金上海高校选拔培养优秀青年教师科研专项基金资助项目(沪教委[2005]80号)

关键词 WEB挖掘预处理日志挖掘页面视图识别 Web mining preprocessing usage data mining page view identification

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1R Cooley,B Mobasher,J Srivastava.Data preparation for mining world wide Web browsing patterns[J].Knowledge and Information Systems,1999,1(1).
2Olfa Nasraoui,Hichem Frigui.Mining Web access logs using relational competitive fuzzy clustering[A].The Eighth International Fuzzy Systems Association World Congress-IFSA 99[C].Taipei,August 99.
3Chen M S.Data mining for path traversal patterns in a Web environment[A].International Conference on Distributed Computing Systems[C].U.S.A,1996.
4Robert Walker Cooley.Web Usage Mining:Discovery and Application of Interestin Patterns[D].Ph.D.Thesis,Graduate School of the University of Minnesota,2000.
5杨怡玲,管旭东,尤晋元.Web日志挖掘预处理中的Frame页面过滤算法[J].计算机工程,2001,27(2):76-77. 被引量：14

二级参考文献1

1杨怡玲,管旭东,陆丽娜,尤晋元.一个简单的Web日志挖掘系统[J].上海交通大学学报,2000,34(7):932-935. 被引量：22

共引文献13

1张琦琪.一个改进了的用途数据预处理模型[J].上海第二工业大学学报,2005,22(4):18-22.
2李晓晔,黄迎春,邓文新.基于Web使用挖掘的个性化推荐服务研究[J].齐齐哈尔大学学报（自然科学版）,2006,22(3):49-52. 被引量：1
3黄意珊,王潜平.基于知识库的启发式智能搜索引擎的设计[J].计算机工程与设计,2007,28(9):2134-2137. 被引量：4
4张宁,何晓萍.Web日志挖掘在图书馆中的应用探讨[J].江西图书馆学刊,2008,38(3):97-99. 被引量：2
5汪瑛.Web日志挖掘中Frame页面过滤的研究与实现[J].福建电脑,2009,25(2):92-92.
6徐红,张建喜,朱旭刚,张永军.一种基于Web日志用户浏览模式的数据挖掘[J].信息技术与信息化,2009(1):40-42. 被引量：2
7方元康,胡学钢,夏启寿.Web日志预处理中优化的会话识别方法[J].计算机工程,2009,35(7):49-51. 被引量：11
8孙宇航,孙应飞.基于网络日志的数据挖掘预处理改进方法[J].系统工程与电子技术,2009,31(12):2994-2997. 被引量：5
9夏秀峰,王宇.一种基于个性化推荐的用户访问路径补全算法[J].计算机应用与软件,2011,28(2):179-183. 被引量：1
10马红梅,甘利人.电子商务中顾客的偏好分析[J].现代计算机,2001,7(6):15-17. 被引量：2

1张琦琪.一个改进了的用途数据预处理模型[J].上海第二工业大学学报,2005,22(4):18-22.
2张琦琪,陈俊杰.结合站点拓扑结构的页面视图分析[J].太原理工大学学报,2004,35(4):414-417.
3李甲林.Web日志挖掘中的数据预处理技术研究与实现[J].电脑知识与技术（过刊）,2009,15(5X):3602-3604. 被引量：2
4彭薇.网站Web日志数据预处理模型的建立[J].企业科技与发展（下半月）,2010(9):28-31. 被引量：1
5姜玥,井福荣,谢青,李建阳,杨玉涵.WHPM-Apriori:网页超链接挖掘的Apriori改进算法[J].西南民族大学学报（自然科学版）,2007,33(3):644-647.
6马长林,谢罗迪,司琪,王梦.基于情感从属和最大熵模型的细粒度观点挖掘[J].计算机工程与科学,2015,37(10):1952-1958. 被引量：1
7陈海宇,曾德胜.使用日志的异常检测[J].计算机系统应用,2011,20(9):90-94. 被引量：1
8李杰,龚俭.一种IDS报警预处理模型APM的设计与实现[J].中国教育网络,2007(11):51-53.
9陈海宇,曾德胜.基于日志的异常软件使用模式检测[J].淮海工学院学报（自然科学版）,2011,20(1):24-28.
10陈树,王磊.一种改进的基于RANSAC方法的SIFT特征匹配[J].信息技术,2016,40(12):39-43. 被引量：4

计算机与现代化

2007年第4期

浏览历史

内容加载中请稍等...

有关日志数据预处理的研究

参考文献5

二级参考文献1

共引文献13

相关作者

相关机构

相关主题

浏览历史