摘要
基于用户会话的页面聚类算法旨在发现用户在浏览过程中频繁访问的页组,为站点管理员优化站点结构提供有力的依据。将介绍一种改进的基于频繁访问页组的路径聚类算法K-PathPlus,其中定义了新的兴趣度、内容链接因子。最后采用龙城热线网站日志进行真实测试,实验的结果是成功的。
The page clustering based on user sessions is to group the frequently visited pages,which can help the webmaster to optimize the site topology.This paper will introduce an improved clustering algorithm based on users' access interest. K-PathPlus defines new interest degree,content-link ratio.In the end a true experiment is done by using www.ty.sx.cn log file. The result of experiment is successful.
出处
《计算机工程与应用》
CSCD
北大核心
2010年第33期130-131,共2页
Computer Engineering and Applications
基金
山西省自然科学基金No.2008021025~~
关键词
访问兴趣
聚类
路径聚类
数据挖掘
兴趣度
内容链接因子
access interest
clustering
path clustering
data mining
interest degree
content-link ratio