摘要
本文介绍了一个基于Web挖掘技术的中文专业搜索引擎的实现和所用的关键技术 ,提出了类别向量的概念以及如何将Web结构挖掘和内容挖掘结合起来 ,利用改进的VSM技术实现网页自动分类的方法。
This paper presents the implementation and the key techniques for a Chinese Topic search engine based on Web mining.In it,we propose the concept of categorization vector and give the idea of how to combine Web structure mining with Web content mining to realize the automatic classification of Web pages using the improved VSM technique.
出处
《计算机工程与科学》
CSCD
2004年第9期16-20,共5页
Computer Engineering & Science