期刊文献+

基于内容的中文网页自动分类研究 被引量:5

RESEARCH ON THE CONTENT BASED CHINESE WEB PAGES AUTOMATIC CLASSIFICATION
下载PDF
导出
摘要 本文主要介绍基于内容的网页自动分类系统 ,具体介绍了类别词典的建造方法 ,网页超文本类别词切分的方法 ,中文网页自动分类算法以及利用类别词与网页间的模糊关系对网页文本进行自动分类等内容 .通过对旅游网页进行测试 ,自动分类正确率可达 93.37%以上 。 This paper mainly introduces a content based web pages automatic classification system. Especially, it discusses the method of web pages
出处 《信息与控制》 CSCD 北大核心 2001年第5期408-412,共5页 Information and Control
基金 清华大学 985项目基金 国家自然科学基金( 6 0 0 0 30 14 ) 863-317-0 1-0 6 -99项目资助
关键词 自动分类 信息检索 中文网页 计算机网络 extraction, the automatic classification algorithm of Chinese web pages. The algorithm decides on membership function of indexing descriptors belonging in each of classification by statistics and classifies archives with fuzzy relation. The res
  • 相关文献

参考文献6

二级参考文献44

共引文献105

同被引文献22

  • 1唐振民,靳从,杨静宇,李远复.一种用于自动标引系统的主题词自动切分方法[J].南京理工大学学报,1995,19(5):401-404. 被引量:2
  • 2Jiawei Han, Micheline Kamber. Data Mining Concepts and Techniques[ M]. Morgan Kaufmann Publishers,2001.
  • 3S Brin, L Page. The Anatomy of a Large-seale Hypertextual Web Search Engine [ A ]. Proc of the 7th World-Wide Web Conf (WWW7) [C]. 1998.
  • 4Arul Prakash Asirvatham,Kraanthi Kumar Ravi. Web Page Classification Based on Document Structure[ EB/OL]. citeseer. ist. psu.edu/asirvatham01 web. html, 2001 - 05.
  • 5Craig Utley. SQL Server 2000 Web Application Developer's Guide [M]. McGraw-Hill, 2001.
  • 6林杰斌 刘明德 陈湘.数据挖掘与OLAP[M].北京:清华大学出版社,2003..
  • 7边肇祺 张学工.模式识别[M].北京:清华大学出版社,1999.282-283.
  • 8P Turney.Learning to Extract Keyphrases from Text[EB/OL].National Research Council of Canada(1999),http://arxiv.org/ftp/cs/papers/0212/0212013.pdf.
  • 9沈小建,许景红.清华同方主题词、分类号智能检索系统(医学专业)[J/OL].中国期刊网CNKI数字图书馆,2005.
  • 10http://linux.tcpip.com.cn/article/index.php?func=detail&par=14&parentid=159&start=16&s=0,2005-03[EB/OL].

引证文献5

二级引证文献27

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部