-
题名Web检索结果快速聚类方法的研究与实现
被引量:2
- 1
-
-
作者
王志梅
张俊林
李秋山
-
机构
燕山大学 信息工程学院 河北 秦皇岛
中国科学院 软件研究所中文信息中心
-
出处
《计算机工程与设计》
CSCD
2004年第12期2231-2233,2290,共4页
-
文摘
为了帮助Web用户从搜索引擎所返回的大量文档片断中筛选出自己所需要的文档,在对聚类过程研究分析的基础上给出了一种Web检索结果快速聚类方法。它通过分析聚类过程,从建立索引模型、相似性的计算到聚类结果的形成等环节,都做了分析和简化,并利用检索结果的标题、Url以及文档片断3部分所含信息计算返回结果之间的相似度,将首先返回的部分检索结果利用无向图映射法进行部分聚类后,将其余返回结果分配到与之最相近的集簇中最终形成聚类结果。该方法实现简单。实验证明该方法响应速度快,聚类相关性较高,空间占用少。
-
关键词
聚类方法
文档
WEB检索
相似度
搜索引擎
快速
集簇
检索结果
标题
环节
-
Keywords
search engine
snippets
clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP311
[自动化与计算机技术—计算机软件与理论]
-