摘要
针对WEB文档分类中KNN算法计算复杂度高的缺点,不同于以往从减少训练样本集大小和采用快速算法角度来降低KNN算法的计算复杂度,从并行的角度出发,提出一种在Hyper-cube SIMD模型上的并行算法,其关键部分的时间计算复杂度从O(n2)降为O(log(n)),该算法与传统的串行算法相比,能显著地提高分类速度。
Aim to the lack of the high time complexity in the Web document classification,a parallel KNN algorithm based on the model of Hyper-cube SIMD is proposed.The time complexity of the key part of the KNN decreases from O(n^2) to O(log(n)) in the algorithm.The classification speed is improved remarkably.
出处
《计算机工程与应用》
CSCD
北大核心
2008年第25期155-156,共2页
Computer Engineering and Applications
基金
广东省自然科学基金No.07300647~~
关键词
文档分类
K最近邻
并行策略
document classification
K Nearest Neighbor(KNN)
parallel algorithm