-
题名网页分块聚类的Web站点逻辑域挖掘
被引量:1
- 1
-
-
作者
郑皎凌
王成良
-
机构
重庆大学计算机学院
重庆大学软件学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第4期52-54,57,共4页
-
文摘
Web逻辑域挖掘是当前Web挖掘领域的研究热点之一,它强调从网站设计者的角度来挖掘站点中有逻辑联系的网页,以形成一个逻辑域,而不是单纯的文本聚类或超链排序。随着应用的不同,站点逻辑域的界定也有所不同。在综合分析了几种具有代表性的站点逻辑域及其挖掘方法后,提出了基于网页分块聚类的Web站点逻辑域挖掘模型和挖掘算法。实验结果表明,该算法具有很好的稳定性和适应性,其精度不受站点规模、语言、镜像等因素的影响,召回率则会随着取回网页数目的增加而增加。
-
关键词
网页分块
web逻辑域
web挖掘
分块粒度
-
Keywords
web page block
web logical domain
web mining
Block granularity
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-