改进的页面与时间阈值的会话识别法被引量：1

IMPROVED METHOD OF SESSION IDENTIFICATION BASED ON PAGE AND TIME THRESHOLD

下载PDF

导出

摘要会话识别是Web日志挖掘的基础,提高会话的识别率能为后续模式的挖掘提供准确可靠的数据,已有许多研究集中于此。在常用的计算时间阈值识别方法的基础上,提出一种改进的基于URL页面类型、页面信息量和停留时间的平均阈值识别方法。针对不同的URL页面类型采用不同的阈值计算方法,并设置时间阈值。相对于已有的对所有用户访问页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高。 SeSsion identification is the base of web log mining, improvement on session identification rate can provide accurate and reliable data for the following pattern mining, and many researches have been focused on it. Based on commonly used method of computing time threshold, an improved method of mean threshold identification based on URL page type, page size and visiting time is brought forward. For different URL page types, different threshold calculation methods will be used to set the time threshold. Relative to the existing method using a single priori threshold and current dynamic threshold to compute pages accessed by all users, this method can give more realistic reflection of the session situation and its accuracy has been improved greatly.

作者郑立山滕少华

机构地区广东工业大学计算机学院

出处《计算机应用与软件》 CSCD 北大核心 2012年第10期197-199,275,共4页 Computer Applications and Software

基金广东省自然科学基金项目(06021484 9151009001000007)

关键词 WEB日志挖掘数据预处理用户会话识别动态阈值 Web log mining Data preprocessing User session identification Dynamic threshold

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献12

1蔡浩,贾宇波,黄成伟,黄志强.Web日志挖掘中的会话识别算法[J].计算机工程与设计,2009,30(6):1321-1323. 被引量：11
2方元康,胡学钢,夏启寿.Web日志预处理中优化的会话识别方法[J].计算机工程,2009,35(7):49-51. 被引量：11
3殷贤亮,张为.Web使用挖掘中的一种改进的会话识别方法[J].华中科技大学学报（自然科学版）,2006,34(7):33-35. 被引量：27
4周爱武,程博,李孙长,夏松.Web日志挖掘中的会话识别方法[J].计算机工程与设计,2010,31(5):936-938. 被引量：13
5李燕,冯博琴,鲁晓锋.Web日志挖掘中的数据预处理技术[J].计算机工程,2009,35(22):44-46. 被引量：22
6范纯龙,姜宏飞,李华.利用图片类日志信息改进会话识别质量[J].计算机应用,2010,30(4):1056-1058. 被引量：2
7杨富华.网络日志预处理中优化的会话识别算法[J].计算机仿真,2011,28(4):123-125. 被引量：4
8方元康,王汝传.优化的Web日志会话识别方法[J].计算机工程与设计,2009,30(7):1688-1690. 被引量：3
9Spiliopoulou M,Mobasher B,Berendt B.A framework for the evaluation of session reconstruction heuristics in web usage analysis[J].Informs Journal of Computing,2003,15(2):171-179.
10Facca F M,Lanzi P L.Mining interesting knowledge from web logs[J].Data and Knowledge Engineering,2005,53(3):225-241.

二级参考文献58

1曹明,闪四清.基于web日志挖掘的数据预处理研究[J].科技资讯,2007,5(4):103-105. 被引量：5
2庄力可,寇忠宝,张长水.网络日志挖掘中基于时间间隔的会话切分[J].清华大学学报（自然科学版）,2005,45(1):115-118. 被引量：24
3侯亚丽,袁方.Web日志挖掘中的数据预处理技术[J].河北大学学报（自然科学版）,2005,25(2):202-206. 被引量：12
4赵红玲,宋瀚涛,牛振东,刘桂山.Web日志挖掘中数据预处理的研究[J].计算机应用研究,2005,22(6):67-69. 被引量：20
5丁国栋,王斌,白硕.Web超链挖掘:中国境内Web图结构研究[J].计算机工程,2005,31(14):24-26. 被引量：6
6欧阳一鸣,汪曦东,郭骏,刘红樱.Web使用挖掘数据预处理中的会话构造[J].计算机工程与应用,2005,41(25):148-151. 被引量：11
7方成效,袁可风.Web日志挖掘的数据预处理研究[J].计算机与现代化,2006(4):79-81. 被引量：12
8殷贤亮,张为.Web使用挖掘中的一种改进的会话识别方法[J].华中科技大学学报（自然科学版）,2006,34(7):33-35. 被引量：27
9陶剑文.一种分布式Web日志挖掘系统的设计与实现[J].计算机仿真,2006,23(10):109-112. 被引量：26
10陈子军,王鑫昱,李伟.一种Web日志会话识别的优化方法[J].计算机工程,2007,33(1):95-97. 被引量：18

共引文献65

1朱晋华,陈俊杰.Web日志预处理中会话识别的优化[J].太原理工大学学报,2008,39(2):111-114. 被引量：10
2董志锋,陈俊杰,付裕峰.Web日志会话的个性化识别方法的研究[J].计算机工程与应用,2008,44(8):179-182. 被引量：7
3徐志玮.Web日志挖掘预处理中复杂问题的解决方法[J].现代情报,2008,28(6):79-81. 被引量：2
4方元康,胡学钢,夏启寿.Web日志挖掘中数据预处理技术研究[J].安庆师范学院学报（自然科学版）,2008,14(3):107-110. 被引量：2
5周青,姚力文,黄龙军,肖燕.Wed使用挖掘数据预处理中的一种会话识别改进算法[J].科技广场,2008(7):85-87.
6方元康,胡学钢,夏启寿,朱勇.基于框架网页与页面阈值的会话识别算法[J].计算机应用与软件,2009,26(1):18-19.
7方元康,王汝传.优化的Web日志会话识别方法[J].计算机工程与设计,2009,30(7):1688-1690. 被引量：3
8李中,苑津莎,徐小彩.基于Web日志挖掘的客户访问兴趣分析[J].华北电力大学学报（自然科学版）,2009,36(5):82-88. 被引量：6
9庞敏,周海英,魏海燕.Web使用挖掘中重建会话的改进算法[J].长春理工大学学报（自然科学版）,2009,32(2):288-291.
10李瑞,朱鹤祥.Web日志挖掘预处理中会话识别算法的优化[J].电脑知识与技术,2009,5(11):8616-8618. 被引量：1

同被引文献6

1李燕,冯博琴,鲁晓锋.Web日志挖掘中的数据预处理技术[J].计算机工程,2009,35(22):44-46. 被引量：22
2戴智丽,王鑫昱.一种基于动态时间阈值的会话识别方法[J].计算机应用与软件,2010,27(2):244-246. 被引量：6
3周爱武,程博,李孙长,夏松.Web日志挖掘中的会话识别方法[J].计算机工程与设计,2010,31(5):936-938. 被引量：13
4周爱武,程博.Web日志挖掘中一种改进的会话识别方法[J].微型机与应用,2010,29(15):71-73. 被引量：1
5李建江,崔健,王聃,严林,黄义双.MapReduce并行编程模型研究综述[J].电子学报,2011,39(11):2635-2642. 被引量：187
6张帅,陈兴蜀,童浩,崔晓靖.基于引用启发式和URL语义相结合的会话识别方法[J].计算机应用研究,2014,31(1):102-105. 被引量：3

引证文献1

1黄伟建,宋园园.基于MapReduce的新会话识别方法[J].计算机工程与科学,2016,38(3):425-430.

1郑立山,滕少华.改进的页面与时间阈值的会话识别法[J].江西师范大学学报（自然科学版）,2012,36(4):395-398.
2张川,肖金升,周振,胡运发.具有访问时间完整性的Web日志方法[J].计算机应用与软件,2004,21(2):105-107. 被引量：1
3李烈彪,张海鹏,周亚峰.Web日志挖掘中数据预处理方法的研究[J].计算机技术与发展,2007,17(7):45-48. 被引量：15
4朱志国.基于URL语义分析的Web用户会话识别方法[J].大连理工大学学报,2011,51(3):440-446. 被引量：1
5石晶,龚震宇,裘杭萍,张毓森.评测Web使用分析中会话识别的准确度[J].电子科技大学学报,2002,31(3):281-285. 被引量：2
6冯林,何明瑞,罗芬.一种基于ExLF日志文件的用户会话识别启发式算法[J].计算机应用,2005,25(2):314-316. 被引量：4
7李燕,冯博琴,鲁晓锋.Web日志挖掘中的数据预处理技术[J].计算机工程,2009,35(22):44-46. 被引量：22
8王锋,殷珍珍,李彬.基于分块局部二值模式的图像检索研究[J].微电子学与计算机,2014,31(5):21-23. 被引量：6
9樊汝策,王庆,翟正军,赵荣椿.一种改进的针对退化文本图像的二值化方法[J].测控技术,2013,32(5):29-31. 被引量：6
10谭文武.Web日志挖掘技术的应用研究[J].无线互联科技,2012,9(12):158-158.

计算机应用与软件

2012年第10期

浏览历史

内容加载中请稍等...

改进的页面与时间阈值的会话识别法被引量：1

参考文献12

二级参考文献58

共引文献65

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

改进的页面与时间阈值的会话识别法 被引量：1

参考文献12

二级参考文献58

共引文献65

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

改进的页面与时间阈值的会话识别法被引量：1