期刊文献+

一个基于Web挖掘的中文专业搜索引擎的设计与实现 被引量:6

Design and Implementation of a Chinese Topic Search Engine Based on Web Mining
下载PDF
导出
摘要 本文介绍了一个基于Web挖掘技术的中文专业搜索引擎的实现和所用的关键技术 ,提出了类别向量的概念以及如何将Web结构挖掘和内容挖掘结合起来 ,利用改进的VSM技术实现网页自动分类的方法。 This paper presents the implementation and the key techniques for a Chinese Topic search engine based on Web mining.In it,we propose the concept of categorization vector and give the idea of how to combine Web structure mining with Web content mining to realize the automatic classification of Web pages using the improved VSM technique.
出处 《计算机工程与科学》 CSCD 2004年第9期16-20,共5页 Computer Engineering & Science
关键词 WEB挖掘 搜索引擎 VSM 网页分类 向量空间模型 类别向量 Web mining VSM categorization vector automatic classification
  • 相关文献

参考文献6

  • 1Jiawei Han, Micheline Kamber. Data Mining Concepts and Techniques[ M]. Morgan Kaufmann Publishers,2001.
  • 2S Brin, L Page. The Anatomy of a Large-seale Hypertextual Web Search Engine [ A ]. Proc of the 7th World-Wide Web Conf (WWW7) [C]. 1998.
  • 3Arul Prakash Asirvatham,Kraanthi Kumar Ravi. Web Page Classification Based on Document Structure[ EB/OL]. citeseer. ist. psu.edu/asirvatham01 web. html, 2001 - 05.
  • 4Craig Utley. SQL Server 2000 Web Application Developer's Guide [M]. McGraw-Hill, 2001.
  • 5张义忠,赵明生,朱精南.基于内容的中文网页自动分类研究[J].信息与控制,2001,30(5):408-412. 被引量:5
  • 6林杰斌 刘明德 陈湘.数据挖掘与OLAP[M].北京:清华大学出版社,2003..

二级参考文献6

共引文献4

同被引文献24

  • 1刘峰,王秀坤,杨南海,马霖.中英文专业搜索引擎中数据采集加工的设计与实现[J].计算机应用研究,2004,21(10):155-157. 被引量:5
  • 2熊化宇.谈搜索引擎中Web页面标引关键词的确定[J].图书情报工作,2004,48(9):80-82. 被引量:2
  • 3和亚丽,陈立潮.Web文本挖掘中的特征选取方法研究[J].计算机工程,2005,31(5):181-182. 被引量:14
  • 4曾致远,张莉.基于向量空间模型的网页文本表示改进算法[J].计算机工程,2006,32(3):134-135. 被引量:10
  • 5Kim S, Zhang B T. Web Document Retrieval by Genetic Learning of Importance Factors for Html Tags[C]//Proe of Int'l Workshop on Text Web Mining,2006:13-23.
  • 6Etzioni O, Perkowitz M. Adaptive Web Sites: An AI Challenge[C]//Proc of the 15th Int'l Joint Conf on Artificial Intelligence, 2007:16-23.
  • 7Boughanem M, Chrisment C, Mothe J, et al. Connectionist and Genetic Approaches for Information Retrieval in Soft Computing in Information Retrieval[J]. Techniques and Applications Heidelberg, 2006,50( 1 ): 102-121.
  • 8Aslantas V, Ozer S,Ozturk S. A Novel Clonal Selection Algorithm Based Fragile Watermarking Method [C]// Lecture Notes on Computer Science 4628,2007:358-369.
  • 9Lawrence, Giles. Accessibility of information on the web. Nature. 400..
  • 10Amanda Spink, Tefko Saracevic, and etc. Searching the web: the public and their queries. Journal of the American society for information science and tech nology, 2001 ;52(3) :226- 234.

引证文献6

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部