摘要
文本分类/聚类是机器学习、信息检索、知识管理等多个领域的核心任务。由于近年来Web文本数据呈指数式增长,要高效实现文本分类和聚类,需要采用更高性能的计算平台。笔者基于云计算技术,采用阿里云ECS、Hadoop和Mahout等开源工具,设计并实现了一种高性能的海量文本分类/聚类系统。
出处
《信息与电脑》
2016年第6期23-25,共3页
Information & Computer
基金
国家大学生创新创业训练计划项目(201410649041)
四川省教育厅一般项目(14ZB0247)