改进的Web日志数据预处理技术被引量：3

Advanced Data Preprocessing Technology for Web Log

下载PDF

导出

摘要介绍Web日志挖掘预处理过程中一些特殊情况的处理方法,在会话识别阶段给出一种基于过滤框架网页与会话重组相结合的会话识别方法,在会话识别之前进行框架网页的过滤,根据传统的会话识别方法构造初始会话集,使用会话重组算法对初始会话集进行优化。实验结果显示,该方法提高了会话识别的质量。 This paper introduces some special processing methods of preprocessing in the field of Web log mining. The algorithm based on frame page filtering and session identification is proposed at the stage of transaction recognition. Before identification, frame pages are filtered, and initial session sets are constructed by traditional method of session identification. The quality of session set is improved using a method of union and rupture. Experimental results show the algorithm enhances the quality of session identification.

作者方元康胡学钢夏启寿朱勇

机构地区池州学院计算机中心合肥工业大学计算机与信息学院

出处《计算机工程》 CAS CSCD 北大核心 2009年第10期73-74,77,共3页 Computer Engineering

基金国家自然科学基金资助项目(050504F) 安徽省教育厅自然科学基金资助项目(XK0829,KJ2008B45ZC) 池州学院自然科学基金资助项目(2007XJ015)

关键词 WEB日志挖掘数据预处理 frame页面会话识别 Web log mining data preprocessing frame page session identification

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1王志琪,王永成.HTML文件的文本信息预处理技术[J].计算机工程,2006,32(5):46-48. 被引量：12
2韩家炜,孟小峰,王静,李盛恩.Web挖掘研究[J].计算机研究与发展,2001,38(4):405-414. 被引量：356

二级参考文献8

1Han J，Data Mining:Concepts and Techniques，2000年
2Wang K，Proc of VLDB'97，1999年，363页
3Zaiane O R，Proc Int Workshop Web Information and Data Management（WIDM'98），1998年，9页
4Mobasher B，Tech Rep:TR96 0 5 0，1996年
5Zaiane O R，Proc KDD'95，1995年，331页
6Lemay L,Danesh A.宛延闿,周晓牧,苏俊等译.HTML Web页面制作教程[M].北京:清华大学出版社,2000.
7Tkach D.Technology Text Mining:Turning Information into Knowledge[R].A White Paper from IBM,1998.
8Baizilay R,Elhadad M.Using Lexical Chains for Text Summari-zation[C].Proceeding of the ACL'97 / EACL'97 Workshop on Intelligent Scalable Text Summarization,Madrid,Spain,1997:10.

共引文献366

1杨洋.Web数据挖掘的分析与探讨[J].装备制造技术,2006(5):63-64. 被引量：1
2王志明,沙莎.Web文本挖掘技术在新闻主题检测中的应用研究[J].长沙大学学报,2007,21(5):58-60. 被引量：2
3阿静.政企互动打假树维权典范——爱普生打印机胜诉“骗保门”事件[J].办公自动化,2006(14):10-11.
4董德民.面向电子商务的Web使用挖掘及其应用研究[J].中国管理信息化（综合版）,2006,9(10):83-85. 被引量：1
5杜志文,曾文华.网格计算在文本分类中的应用[J].微电子学与计算机,2006,23(z1):221-222.
6张克君,李伯群,李欣,杨炳儒.基于DWLMS模型的分布式Web用户访问模式挖掘[J].清华大学学报（自然科学版）,2005,45(S1):1762-1766. 被引量：2
7万君,耿东辉.浅说电子商务中的数据挖掘技术[J].东北大学学报（自然科学版）,2004,25(z1):194-196. 被引量：1
8许亮,李明,梁素田,侯耕.数据挖掘技术在电子商务中的应用[J].甘肃科学学报,2002,14(S1):17-20. 被引量：1
9王丽娜.Web日志挖掘技术研究[J].光盘技术,2008(4):34-36. 被引量：2
10李慧.数据挖掘技术探讨及其基于web的应用研究[J].硅谷,2008,1(22):71-71.

同被引文献34

1高志坚.引入第三方监测根治点击欺诈[J].生产力研究,2007(18):72-73. 被引量：4
2郭岩,白硕,于满泉.Web使用信息挖掘综述[J].计算机科学,2005,32(1):1-7. 被引量：50
3庄力可,寇忠宝,张长水.网络日志挖掘中基于时间间隔的会话切分[J].清华大学学报（自然科学版）,2005,45(1):115-118. 被引量：24
4杜家强,韩其睿,王科,杜家兴.Web日志中用户频繁路径快速挖掘算法[J].计算机工程与应用,2005,41(22):164-167. 被引量：12
5殷贤亮,张为.Web使用挖掘中的一种改进的会话识别方法[J].华中科技大学学报（自然科学版）,2006,34(7):33-35. 被引量：27
6张蓉.Web挖掘技术研究[J].计算机工程,2006,32(15):4-6. 被引量：21
7王岚,翟正军.Web日志挖掘的预处理及路径补全算法的研究[J].微电子学与计算机,2006,23(8):113-116. 被引量：11
8张波,巫莉莉,周敏.基于Web使用挖掘的用户行为分析[J].计算机科学,2006,33(8):213-214. 被引量：27
9高卫华,谢康林.Web用户行为预测的一种新模型及算法[J].计算机应用与软件,2007,24(3):142-144. 被引量：8
10马瑞民,李向云.Web日志挖掘中数据预处理技术的研究[J].计算机工程与设计,2007,28(10):2358-2360. 被引量：19

引证文献3

1毕永成.Web日志挖掘中预处理过程的具体研究[J].现代电子技术,2010,33(18):97-100. 被引量：2
2李爱春,滕少华.Web挖掘在网络广告点击欺诈检测中的应用[J].计算机工程与设计,2012,33(3):957-962. 被引量：5
3凌海峰,余笪.基于聚类的Web用户会话识别优化方法[J].计算机应用研究,2012,29(8):2862-2864. 被引量：1

二级引证文献8

1夏惠芬,董卫民.基于关联规则的Web挖掘技术研究[J].现代电子技术,2011,34(16):100-102. 被引量：4
2滕少华,邱小斌,张巍,刘冬宁,梁路.面向片区的液化石油气库存预测模型[J].计算机工程与设计,2015,36(8):2264-2270. 被引量：1
3崔微.数据挖掘技术在网络广告中的应用[J].商,2015,0(45):222-223.
4董亚楠,刘学军,李斌,章玮.点击欺诈群体检测与发现[J].计算机应用研究,2016,33(6):1771-1774. 被引量：2
5龚垒,黄永毅.Frame页面网络日志数据挖掘预处理方法[J].电子技术与软件工程,2016(11):190-190.
6林穗,赵菲.基于Spark的线性模型在广告投放系统中的应用研究[J].广东工业大学学报,2016,33(5):28-33. 被引量：4
7张欣,刘学军,李斌,郭汉.一种网络广告点击欺诈检测的SVM集成方法[J].小型微型计算机系统,2018,39(5):951-956. 被引量：4
8徐杨.改进的Apriori算法在网络购物推荐中的应用[J].无线通信技术,2015,24(2):52-54. 被引量：1

1方元康,胡学钢,夏启寿,朱勇.基于框架网页与页面阈值的会话识别算法[J].计算机应用与软件,2009,26(1):18-19.
2方元康,胡学钢,夏启寿.Web日志挖掘中数据预处理技术研究[J].安庆师范学院学报（自然科学版）,2008,14(3):107-110. 被引量：2
3龚垒,黄永毅.Frame页面网络日志数据挖掘预处理方法[J].电子技术与软件工程,2016(11):190-190.
4方元康,胡学钢,夏启寿.一种改进的Web日志会话识别方法[J].计算机技术与发展,2008,18(11):214-216. 被引量：7
5汪瑛.Web日志挖掘中Frame页面过滤的研究与实现[J].福建电脑,2009,25(2):92-92.
6赵伟,何丕廉,陈霞,谢振亮.Web日志挖掘中的数据预处理技术研究[J].计算机应用,2003,23(5):62-64. 被引量：62
7方元康,胡学钢,夏启寿.Web日志预处理中优化的会话识别方法[J].计算机工程,2009,35(7):49-51. 被引量：11
8李斌.快速掌握网页设计和建立(连载)[J].现代远程教育研究,2002,14(4):23-23.
9杨怡玲,管旭东,尤晋元.Web日志挖掘预处理中的Frame页面过滤算法[J].计算机工程,2001,27(2):76-77. 被引量：14
10顾兆军,李晓红,王伟,黄杰培.Web日志挖掘中的会话识别方法研究[J].计算机技术与发展,2012,22(4):45-49. 被引量：4

计算机工程

2009年第10期

浏览历史

内容加载中请稍等...

改进的Web日志数据预处理技术被引量：3

参考文献2

二级参考文献8

共引文献366

同被引文献34

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

改进的Web日志数据预处理技术 被引量：3

参考文献2

二级参考文献8

共引文献366

同被引文献34

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

改进的Web日志数据预处理技术被引量：3