-
题名一种新的基于交叉性Web日志的事务识别算法
被引量:3
- 1
-
-
作者
高卫华
谢康林
-
机构
上海交通大学计算机科学与工程系
-
出处
《计算机仿真》
CSCD
2005年第7期51-53,74,共4页
-
文摘
该文提出一种新的Web使用记录挖掘过程中的事务识别算法。该算法提出的背景是在采用基于最大向前引用和频繁遍历路径的方法进行Web用户访问模式挖掘时,通过对实验结果数据、源日志文件、用户使用互联网的特点以及互联网本身的局限进行了详细地分析和考察,发现了交叉性日志的存在。源数据新特性的出现,使得原算法在性能上有了明显的下降,因此,提出了新的基于有向图深度优先遍历的算法思想。该文设计了有针对性的模拟实验,实验结果无论从冗余事务的减少量或者事务的平均长度上都证明了新算法的优越性。
-
关键词
互联网使用记录挖掘
交叉性日志
最大向前引用
频繁遍历路径
-
Keywords
Web usage mining
Ahemately-recorded log file
Maximal forward references
Large reference sequences
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种事务识别算法的研究与改进
- 2
-
-
作者
陈荣旺
-
机构
武夷学院现代教育技术中心
-
出处
《福建电脑》
2007年第10期26-27,共2页
-
基金
武夷学院青年学术研究支持计划(项目编号:XQL06017)
-
文摘
本文介绍了一种基于最大向前引用路径MFP事务识别算法,通过对源日志文件、用户访问网站等特点的分析,发现了交叉性日志的存在,使得算法所识别出的事务集存在事务冗余。为此提出MFP算法的改进,以减少后续模式识别的输入量,提高整个挖掘算法的效率。
-
关键词
事务识别
MFP
交叉性日志
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-