摘要
结合网格计算和数据挖掘技术,提出基于网格的分布式数据挖掘框架。框架定义在网格之上,由Globus来提供底层的网格服务,使用基本的网格服务来建构特定的数据分析和数据挖掘服务;框架是一组可动态扩展的服务,这些服务通过不同的方法聚合在一起来满足应用的需要,框架中各服务的开发按照开放网格服务体系结构的标准。借鉴SPRINT分类算法思想,将基于网格的分布式数据挖掘框架作为算法理想运行平台,提出了基于网格的分布式SPRINT分类算法,算法使用框架提供的目录服务、数据服务和资源分配和执行计划管理等多种服务来完成分布式数据挖掘任务。
In this article,we propose a DM(Data Mining)framework based on grid with the combination of grid technology and DM.The framework defines on top of grid services,it uses basic grid services to build specific DM services;the framework is a group of extendable and dynamic services.Based this framework and used for reference SPRINT classification algorithm,we propose a distributed SPRINT algorithm based on grid.It uses directory service,data service and other services from framework to fulfill DM task.
出处
《情报科学》
CSSCI
北大核心
2011年第5期769-773,共5页
Information Science