摘要
介绍了数据挖掘的一个分枝——文本自动分类的相关技术,在对数据进行预处理的基础上,实现了K最近邻居分类算法,并结合实验结果对数据预处理在文本分类中的重要性进行了讨论。
This paper introduces a branch of data mining technology-text categorization, and discusses some related key technologies of text categorization. Based on data preprocess, it implements one algorithm, K nearest neighbor algorithm. In the end, it utilizes the experiment results to prove the importance of data preprocess for clarifying capability.
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第8期171-172,185,共3页
Computer Engineering
基金
国家自然科学基金资助项目(60173017
9010402)
北京市自然科学基金资助项目(4011003)