-
题名Web日志中用户频繁路径快速挖掘算法
被引量:12
- 1
-
-
作者
杜家强
韩其睿
王科
杜家兴
-
机构
天津工业大学计算机应用与自动化学院
人民日报社网络中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2005年第22期164-167,共4页
-
文摘
Web访问志中含有大量用户浏览信息,从中有效挖掘出用户频繁路径是建立自适用化网站的必要前提。该文在Apriori算法和有向图存储结构的基础上,提出了会话矩阵和遍历矩阵的概念,设计了用户频繁路径快速挖掘算法:首先利用会话矩阵筛选出满足一定阈值条件的频繁一项集,这样避免产生大量中间项;然后在相似客户群体内,对页面快速聚类,得到相关联页面;最后根据遍历矩阵对相关联页面进行路径合并,得出频繁路径。实验表明此算法的准确性和快速性。
-
关键词
会话矩阵
遍历矩阵
相关联页面
用户频繁路径
快速挖掘算法
-
Keywords
session matrix,trace matrix,relative pages,user frequent paths,fast mining algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-