动态云平台下的快速闭树聚类并行算法被引量：2

Fast Closed Tree Clustering Parallel Algorithm for Dynamic Cloud Platform

下载PDF

导出

摘要为提高聚类算法效率,提出一种基于动态云平台的快速闭树聚类并行算法。针对云计算平台Hadoop中任务的随机分配策略,给出一个满足最小化消耗成本的任务分配算法CDA-GA,并基于该算法提出动态云平台模型。将传统的频繁闭树挖掘算法与聚类算法并行化,应用于动态云平台中,设计基于动态云平台的闭树聚类算法框架。实验结果表明,该算法有效可行,适合在大规模数据下进行聚类分析。 In order to improve the efficiency of clustering algorithm, this paper proposes a model of fast closed tree paralleled algorithm on the platform of dynamic cloud. Aiming at the random allocation strategy of cloud computing platform Hadoop, the paper puts forward CDA-GA to meet the requirements of the minimized consumption cost. Moreover, on the foundation of CDA-GA, it proposes the dynamic cloud platform model. The parallelization of traditional frequency closed tree mining algorithm and clustering algorithm and is applied in the dynamic cloud platform, this paper designs a closed tree clustering algorithm framework. Experimental results show that the algorithm is feasible and fits into clustering analysis under massive amounts of data.

作者郭鑫颜一鸣徐洪智覃遵跃

机构地区吉首大学软件服务外包学院

出处《计算机工程》 CAS CSCD 2013年第9期80-83,共4页 Computer Engineering

基金湖南省教育厅基金资助一般项目(10C1100) 吉首大学校级科研计划基金资助项目(11JD051)

关键词数据挖掘云计算并行计算闭树树聚类海量数据 data mining cloud computing parallel computing closed tree tree clustering mass data

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1Valiant L G. A Bridging Model for Parallel Computation[J]. Communications of the ACM, 1990, 33(3): 103-111.
2Jeffrey D. MapReduce: Simplified Data Processing on Large Clusters[J]. Communications of the ACM, 2008, 51(1): 107-113.
3Grzegorz M, Austern M H, Bik A J C, et al. Pregel: A System for Large-scale Graph Processing[C]//Proc. of SIGMOD'10. Indianapolis, USA: [s. n.], 2010: 135-145.
4Avery C. Giraph: Large-scale Graph Processing Infrastruction on Hadoop[C]//Proceedings of Hadoop Summit. Santa Clara, USA: [s. n.], 2011.
5Tyson C, Nell C, Peter A, et al. MapReduce Online[C]// Proceedings of NSDI' 10. San Jose, USA: [s. n.], 2010: 33-48.
6Lublin U The Workload on Parallel Supercomputers: Model- ing the Characteristics of RigidJobs[J]. Journal of Parallel and Distributed Computing, 2003, 63(20): 1105-1122.
7卓月明.基于聚类技术的XML文件代表性结构获取[J].吉首大学学报（自然科学版）,2011,32(6):55-58. 被引量：4
8周建钦,何凌云.最优扩散的循环矩阵[J].吉首大学学报（自然科学版）,2011,32(5):37-40. 被引量：13
9刘文军,游兴中.一种改进的凝聚层次聚类法[J].吉首大学学报（自然科学版）,2011,32(4):11-14. 被引量：10
10吴扬扬,雷庆,陈锻生,YOKOTA Harou.一种从XML数据中发现关系信息的方法[J].软件学报,2008,19(6):1422-1427. 被引量：10

二级参考文献62

1朱永泰,王晨,洪铭胜,汪卫,施伯乐.ESPM——频繁子树挖掘算法[J].计算机研究与发展,2004,41(10):1720-1727. 被引量：18
2崔灵果,曹元大.SPN分组密码中最优扩散层的构造与验证[J].计算机应用,2005,25(4):856-858. 被引量：2
3崔灵果,曹元大.一种SPN线性层的设计方法[J].计算机工程,2005,31(20):8-9. 被引量：3
4赵传申,孙志挥,张净.基于投影分支的快速频繁子树挖掘算法[J].计算机研究与发展,2006,43(3):456-462. 被引量：14
5钱晓东.数据挖掘中分类方法综述[J].图书情报工作,2007,51(3):68-71. 被引量：28
6ZAKI M J. Efficiently mining frequent trees in a forest: Algorithms and applications [ J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 17(8): 1021 - 1035.
7AGGARWAL C C, TA N, WANG J, et al. XProj: A framework for projected structural clustering of XML documents [ C ]// SIGKDD'07: Proceedings of the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2007:46-55.
8DESHPANDE M, KURAMOCHI M, WALE N, et al. Frequent substructure-based approaches for classifying chemical compounds [J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 17(8) : 1036 - 1050.
9HORVATH T, GARTNER T, WROBEL S. Cyclic pattern kernels for predictive graph mining [ C]// KDD 2004: Proceedings of the tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2004:158 -167.
10BROWN J W. The ribonuclease P database [ J]. Nucleic Acids Research, 1998, 26(1) : 351 -352.

共引文献64

1雷庆,吴扬扬,缑锦.从复杂XML文档中抽取目标关系片段的方法[J].郑州大学学报（理学版）,2009,41(1):40-43.
2郭鑫,李云,黄云,周清平.最小闭树特征集的聚类与分类方法[J].计算机应用,2010,30(2):423-426. 被引量：5
3洪欣,陈维斌,杜吉祥.抽取XML模式到关系模式[J].华侨大学学报（自然科学版）,2010,31(3):288-291. 被引量：2
4李雄飞,孙涛,郭建芳.基于标签树的粗糙集模型LTRS[J].通信学报,2010,31(6):35-43. 被引量：2
5黄伟,郭鑫,周清平.支持实时增量更新的闭子树聚类算法[J].计算机工程,2011,37(24):25-27.
6李晓翠,孟凡荣,周勇.一种基于代表点的快速聚类算法[J].南京大学学报（自然科学版）,2012,48(4):504-512. 被引量：4
7程红,于光,郑悦.非战争军事行动中图像情报资源特征提取方法研究[J].黑龙江科技信息,2012(34):34-34.
8岳强斌,欧渊,石倩.装备维修流程设计需求聚类分析[J].重庆理工大学学报（自然科学）,2012,26(12):65-69.
9刘让国,彭会湘,陈莉.基于WebGis的态势表达解决方案探讨[J].计算机与网络,2013,39(2):61-64. 被引量：2
10饶威,王凤云,丁坚勇.基于改进层次聚类法的电力设备家族缺陷评估[J].浙江电力,2013,32(3):9-13. 被引量：6

同被引文献20

1赵海东.关于流数据挖掘技术中有关云计算的应用设计分析[J].数字化用户,2013(15):142.
2郭鑫,李云,黄云,周清平.最小闭树特征集的聚类与分类方法[J].计算机应用,2010,30(2):423-426. 被引量：5
3程苗,陈华平.基于Hadoop的Web日志挖掘[J].计算机工程,2011,37(11):37-39. 被引量：64
4程苗.基于云计算的用户浏览偏爱路径挖掘算法[J].计算机工程与应用,2011,47(29):85-89. 被引量：6
5黄章树,刘晴晴.基于云计算服务模式的数据挖掘应用平台的构建[J].电信科学,2012,28(1):53-57. 被引量：32
6王德文.基于云计算的电力数据中心基础架构及其关键技术[J].电力系统自动化,2012,36(11):67-71. 被引量：152
7金龙.云计算环境中的数据挖掘存储管理设计[J].软件工程师,2012(12):36-37. 被引量：7
8黄华.基于大云数据快速挖掘过程的研究与仿真[J].计算机仿真,2013,30(4):386-389. 被引量：7
9杜艳绥.基于Hadoop云计算平台的数据挖掘分析[J].信息技术与标准化,2013(4):36-38. 被引量：5
10宛婉,周国祥.基于并行抽样的海量数据关联挖掘算法[J].合肥工业大学学报（自然科学版）,2013,36(8):933-937. 被引量：3

引证文献2

1黄取治.动态云模型大规模数据挖掘算法[J].长春工业大学学报,2014,35(3):305-308. 被引量：2
2包永红.云计算技术下数据挖掘平台设计及技术[J].现代电子技术,2016,39(16):61-63. 被引量：9

二级引证文献11

1蹇旭,陈泯利.基于云计算的数据挖掘应用平台构建策略研究[J].数字技术与应用,2016,34(3):74-75. 被引量：2
2孟智慧.云计算背景下数据挖掘的服务模式分析[J].太原学院学报（自然科学版）,2017,35(2):52-55.
3李天峰.智能信息处理技术在网络计算中的应用[J].现代电子技术,2017,40(15):41-43. 被引量：6
4朱娜.基于云计算技术的数据挖掘平台设计与实现[J].信息记录材料,2018,19(6):79-81. 被引量：4
5黄国庆.云计算技术下数据挖掘平台设计及技术[J].电脑知识与技术,2018,14(7):10-11. 被引量：1
6刘座铭,高长宇,夏善磊,赵昕.科研项目及业绩管理系统中异构数据库中间件系统的设计与实现[J].产业与科技论坛,2019,0(16):43-45. 被引量：3
7王晓妮,段群,韩建刚.基于云计算的数据挖掘系统设计与实现[J].计算机技术与发展,2019,29(3):178-182. 被引量：10
8郭骏,张勇,王琪,李皓南.基于云计算的海量微服务资源调度系统设计与实现[J].电子设计工程,2019,27(11):43-46. 被引量：9
9熊学锋,周苏,宋凯.泛在电力物联网的用户侧电力大数据关键技术[J].信息技术,2020,44(10):149-154. 被引量：9
10郭俊宏,薛晓强,李玲,牛家强.多算法模型评价电力市场交易运营大数据的方法[J].电子测量技术,2020,43(23):172-177. 被引量：4

1刘玉海,张锡恩.VR在装备维修中的应用研究[J].计算机工程,2001,27(8):132-133. 被引量：10
2李凯,李昆仑,崔丽娟.模型聚类及在集成学习中的应用研究[J].计算机研究与发展,2007,44(z2):203-207. 被引量：7
3高滢,刘大有,徐益.一种特征加权的聚类算法框架[J].计算机科学,2008,35(10):152-154. 被引量：6
4舒文琼.Convergys：建立创收型呼叫中心[J].通信世界,2008(40).
5台达HIFT UPS助力山西物联网[J].电气应用,2012,31(15):21-21.
6彭和平.新一代绿色数据中心(机房)先进节能技术[J].智能建筑与智慧城市,2016(9):46-49. 被引量：3
7刘丁.山石网科:软硬件结合打造IDC“绿色之盾”[J].通信世界,2012(12):37-37.
8杨彬.移动云计算中分布式计算卸载框架的研究[J].软件,2015,36(6):129-133. 被引量：4
9孙强.构建服务器虚拟化平台,高效企业信息化工作[J].电脑编程技巧与维护,2015(14):15-16.
10杨栋.挖掘利用物资出入库信息实现科室物资消耗成本的自动计入[J].中国医疗设备,2008,23(9):29-31.

计算机工程

2013年第9期

浏览历史

内容加载中请稍等...

动态云平台下的快速闭树聚类并行算法被引量：2

参考文献13

二级参考文献62

共引文献64

同被引文献20

引证文献2

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

动态云平台下的快速闭树聚类并行算法 被引量：2

参考文献13

二级参考文献62

共引文献64

同被引文献20

引证文献2

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

动态云平台下的快速闭树聚类并行算法被引量：2