摘要
根据网站的树形结构特点,提出了一种统一的树化模型对用户访问路径进行建模,解决了因使用原始访问路径产生的"过度比较问题",并通过采用适合该模型的网页相对位置的概念,大大减轻了原来由于使用网页绝对访问位置导致的误差。结果表明:树化模型能够提高用户访问行为的相似度识别率。
In this paper, we abstract the salient features of the sequence as a tree model for web usage analysis, motivated by web site structure, to solve these problems. At the same time, we suggest the relative position to improve the error from the comparison of the absolutely position. Finally, the experimental results with an amount of datasets demonstrate the effectiveness of tree modeling approach.
出处
《华东理工大学学报(自然科学版)》
CAS
CSCD
北大核心
2005年第2期193-197,共5页
Journal of East China University of Science and Technology
关键词
网络使用挖掘
访问路径
相似度
聚类
网站结构
预聚类
web usage mining
visit path
similarity
clustering
web site structure
pre-clustering