-
题名分布式并行数据挖掘系统的研究与实现
被引量:8
- 1
-
-
作者
张学明
施法中
-
机构
北京航空航天大学飞行器制造系
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第4期198-200,共3页
-
文摘
分布式多层体系结构,一方面可以适用于分布式应用的需要,另一方面可以减少系统的升级、维护费用,提高系统的鲁棒性。并行计算可以提高系统的执行效率。因此,研究分布式数据挖掘和并行数据挖掘问题很有必要性。文章研究了基于多线程的并行数据挖掘,和基于VisiBroker的分布式数据挖掘的实现原理,以及运行实例。
-
关键词
数据库管理系统
分布式并行数据挖掘系统
多线程
-
Keywords
Data mining,Distributed computation,Parallel computation
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于云计算的大数据挖掘平台
被引量:22
- 2
-
-
作者
何清
庄福振
-
机构
中国科学院计算技术研究所智能信息处理重点实验室
-
出处
《中兴通讯技术》
2013年第4期32-38,共7页
-
基金
国家自然科学基金(61175052
61203297)
+2 种基金
国家高技术研究发展("863")计划(2013AA01A606
2012AA011003)
国家重点基础研究发展("973")规划(2013CB329502)
-
文摘
开发了一个基于云计算的并行分布式大数据挖掘平台——PDMiner。PDMiner实现了各种并行数据挖掘算法,如数据预处理、关联规则分析以及分类、聚类等算法。实验结果表明,并行分布式数据挖掘平台PDMiner中实现的并行算法,能够处理大规模数据集,达到太字节级;具有很好的加速比性能;实现的并行算法可以在商用机器构建的并行平台上稳定运行,整合了已有的计算资源,提高了计算资源的利用效率;可以有效地应用到实际海量数据挖掘中。在PDMiner中还开发了工作流子系统,提供友好统一的接口界面方便用户定义数据挖掘任务。
-
关键词
云计算
分布式并行数据挖掘
海量数据
-
Keywords
cloud computing
parallel and distributed data mining
big data
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于云计算的数据处理及数据挖掘方法
被引量:2
- 3
-
-
作者
王彬菁
李明东
-
机构
西华师范大学计算机学院
-
出处
《软件导刊》
2015年第3期148-149,共2页
-
文摘
介绍云计算的概念及应用,探讨传统数据挖掘方法——分类和聚集方法的基本原理、特点、优缺点及应用范围。根据云计算的并行分布式计算特点,提出与之适应的数据处理方法。借助Google云计算中的分布式数据处理平台,评价云计算下复杂数据形式的数据挖掘方法。
-
关键词
云计算
并行分布式数据挖掘
MAP
Reduce数据处理
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-