摘要
本文主要介绍基于内容的网页自动分类系统 ,具体介绍了类别词典的建造方法 ,网页超文本类别词切分的方法 ,中文网页自动分类算法以及利用类别词与网页间的模糊关系对网页文本进行自动分类等内容 .通过对旅游网页进行测试 ,自动分类正确率可达 93.37%以上 。
This paper mainly introduces a content based web pages automatic classification system. Especially, it discusses the method of web pages
出处
《信息与控制》
CSCD
北大核心
2001年第5期408-412,共5页
Information and Control
基金
清华大学 985项目基金
国家自然科学基金( 6 0 0 0 30 14 )
863-317-0 1-0 6 -99项目资助
关键词
自动分类
信息检索
中文网页
计算机网络
extraction, the automatic classification algorithm of Chinese web pages. The algorithm decides on membership function of indexing descriptors belonging in each of classification by statistics and classifies archives with fuzzy relation. The res