-
题名基于Apriori的Web访问模式挖掘算法
被引量:3
- 1
-
-
作者
刘美玲
苏毅娟
-
机构
广西民族大学信息科学与工程学院
广西师范学院科学计算与智能信息处理广西高校重点实验室
广西师范学院计算机与信息工程学院
-
出处
《计算机与现代化》
2013年第10期1-5,共5页
-
基金
科学计算与智能信息处理广西高校重点实验室基金项目(GXSCIIP201201)
广西教育厅科研项目(201106LX131)
-
文摘
简要介绍Apriori算法与Web访问路径的有向图表示方法,提出一种从Web日志文件中得到频繁访问模式的算法,该算法以Apriori算法为基础,并以访问路径序列的有序性特点作为候选集的剪枝策略,减少候选集的生成,提高算法的效率。在真实数据集和模拟数据集上分别进行实验,实验结果表明该算法是有效的,且适应性好。
-
关键词
WFTP算法
web日志文件
数据挖掘
频繁访问路径
有序访问路径
-
Keywords
WFTP algorithm
web log file
data mining
frequently traversed path
sequential traversed path
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名浏览行为数据在Web用法挖掘中的应用
被引量:2
- 2
-
-
作者
杨凡丁
刘建平
严奉华
-
机构
浙江理工大学信息电子学院
-
出处
《浙江理工大学学报(自然科学版)》
2008年第6期689-693,708,共6页
-
文摘
网站用户的浏览行为的不确定性导致从现有的Web日志文件挖掘出的事务模式来预测用户行为越来越困难。引入一种新的数据类型浏览行为数据(BAD)用于提高Web用法挖掘的质量,BAD是一种特殊的浏览数据,如"复制","滚动","另存为",并且没有被日志文件所记录,并给出了BAD的定义。为了象Web日志文件一样记录BAD,介绍并使用一种现有的在线数据收集模块来捕获用户BAD。通过一个电子商务程序的实例说明BAD能增加现有Web事务挖掘算法的有效性。
-
关键词
web用法挖掘
浏览行为数据
web日志文件
浏览行为
-
Keywords
web usage mining
browsing action data
web log files
browsing behaviour
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于SQL的频繁项目集的研究
被引量:4
- 3
-
-
作者
王涛伟
胡锡伟
柴本成
-
机构
浙江万里学院计算机与信息学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2006年第23期4494-4497,共4页
-
文摘
Apriori算法是关联规则中挖掘频繁项目集的典型算法。在Apriori算法的基础上,利用关系数据库管理系统的强大功能和SQL语言操作简单,效率高的特点,提出了基于SQL的Apriori算法。该算法实现简单快速,可有效缩小扫描数据库的大小。将该算法应用于经过数据预处理的Web日志文件数据库,实验结果显示该算法是有效的。
-
关键词
数据挖掘
关联规则
频繁项目集
SQL
数据预处理
web日志文件
-
Keywords
data mining
association role
frequent itemsets
structured query language
data prepr- ocessed
web log file
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名点击流分析技术在网上评教系统中的应用
被引量:3
- 4
-
-
作者
蔡榆榕
-
机构
华侨大学现代教育技术中心
-
出处
《实验室研究与探索》
CAS
2006年第12期1541-1542,1613,共3页
-
文摘
介绍一种常用于电子商务网站的点击流技术,列出了该技术在电子商务网站中几项分析功能及其在网上评教系统中与其相对应的几个方面的应用,以便对参评者的参评行为与过程做较为深入的跟踪和分析。给出了基于B/S的点击流分析子系统的三层体系结构图,介绍了该技术结合WEB日志文件在网上评教系统中的实现过程,以及在教学管理系统中的尝试。
-
关键词
点击流分析
web日志文件
联机分析
-
Keywords
click-stream analysis
web diary file
OLAP
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-