摘要
对基于中文的Web文本分类技术进行了研究,介绍了web文本分类的基本过程和Web文本预处理及文本特征选取的方法,重点介绍了一种常用的基于内容的分类算法KNN。最后通过实验测试了使用KNN算法的中文Web文本分类技术的效果。
This paper deals with Chinese Web texts categorization techniques.It introduces the basic process of Chinese Web texts,the methods of pretreatment of Web texts and the methods of feature selection of texts.The emphasis of this paper is a method based on the contents——KNN.A furthermore experiment tests the effects of the categorization techniques of Chinese Web texts.
出处
《软件导刊》
2007年第1期107-109,共3页
Software Guide