期刊文献+

一种Web用户行为聚类算法 被引量:20

Web User Action Clustering Algorithm
下载PDF
导出
摘要 提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法过滤了小于指定阈值的相似度系数 ,大大缩小了数据规模 ,很好地解决了其他聚类算法 (如层次聚类 )在高维空间聚类时的“维数灾难”问题 ,最后的实验结果很好 . A clustering algorithm called FCC (Filter Coefficient Clustering) is proposed in this paper to get similitude action of Web users through mining web logs. First, we define a novel similarity coefficient called CM, and then combine it with the Jaccard Coefficient. As a result, a mix Coefficient is obtained to represent the similarity of Web user actions. The main reason why our algorithm is superior to other algorithms such as hierarchical clustering is that a threshold is engaged to filter the web log, thus the volume of data processed declined dramatically and the 'dimension disaster' problem is resolved. The experiment result is satisfactory.
出处 《小型微型计算机系统》 CSCD 北大核心 2004年第7期1364-1367,共4页 Journal of Chinese Computer Systems
基金 江苏省九五重点攻关课题 (BJ980 17-1)资助 江苏省十五高科技项目 (BJ2 0 0 10 13 )资助 校科研基金重点课题 (X0 2 -0 70 -1(Z) )资助
关键词 WEB日志 数据挖掘 聚类 相似度 web log data mining clustering similarity
  • 相关文献

参考文献1

二级参考文献1

  • 1Yan T,Proc of the 5th Int World Wide Web Conf,1996年,27页

共引文献58

同被引文献158

引证文献20

二级引证文献63

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部