基于Hadoop MapReduce和粗粒度并行遗传算法的大数据聚类方法改进被引量：3

Improvement of large data clustering method based on Hadoop MapReduce and coarse grain parallel genetic algorithm

下载PDF

导出

摘要为了提高并行遗传算法在大数据聚类问题中的时间效率,通过利用粗粒度遗传算法的并行化思想,提出了Hadoop平台上基于MapReduce计算框架的粗粒度遗传算法的并行化设计。该思想主要来源于大数据体量庞大的特点,聚类算法时间消耗巨大。并行是解决算力不足的一个较为有效的方法,实验结果表明,并行化的遗传算法在处理大数据聚类时相比传统的串行化处理在时间消耗方面有明显的降低。 Parallel design of coarse grain genetic algorithm based on MapReduce computing framework is proposed in the Hadoop to improve the time efficiency of parallel genetic algorithm in large data clustering, by using the idea of parallel genetic algorithm. This idea is mainly derived from the huge amount of large data, a huge amount of time consumption of clustering algorithm. Parallelism is the solution to the lack of a more effective method. Experimental results show that parallel genetic algorithm in dealing with large data clustering compared to the traditional serial processing in time consumption has decreased significantly.

作者郭晨晨朱红康 GUO Chen-Chen ZHU Hong-Kang(School of mathematics and computer science, Shanxi Normal University, Linfen 041000, China)

机构地区山西师范大学数学与计算机科学学院

出处《黑龙江大学工程学报》 2016年第3期87-91,共5页 Journal of Engineering of Heilongjiang University

基金山西省自然科学基金资助项目(2015011040)

关键词大数据聚类 MAPREDUCE 数据挖掘并行粗粒度遗传算法 large data clustering MapReduce data mining parallel coarse-grain genetic algorithm

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献12

1何东晓,周栩,王佐,周春光,王喆,金弟.复杂网络社区挖掘—基于聚类融合的遗传算法[J].自动化学报,2010,36(8):1160-1170. 被引量：58
2傅景广,许刚,王裕国.基于遗传算法的聚类分析[J].计算机工程,2004,30(4):122-124. 被引量：49
3贾瑞玉,管玉勇,李亚龙.基于MapReduce模型的并行遗传k-means聚类算法[J].计算机工程与设计,2014,35(2):657-660. 被引量：22
4刘正龙,杨艳梅,罗玉军.基于遗传算法的非线性系统辨识的研究[J].黑龙江大学自然科学学报,2014,31(3):416-420. 被引量：5
5张婧,杨炳儒.基于混合遗传算法的聚类模式数据挖掘方法[J].微计算机信息,2006,22(06X):219-221. 被引量：5
6李兰英,董义明,孔银,周秋丽.改进K-means算法的MapReduce并行化研究[J].哈尔滨理工大学学报,2016,21(1):31-35. 被引量：7
7李建明,迟忠先,万单领.一种基于GPU加速细粒度并行遗传算法的实现方法[J].控制与决策,2008,23(6):697-700. 被引量：15
8刘向东,刘奎,胡飞翔,王翠荣.基于MapReduce的并行聚类算法设计与实现[J].计算机应用与软件,2014,31(11):251-256. 被引量：10
9何宏,谭永红.一种基于动态遗传算法的聚类新方法[J].电子学报,2012,40(2):254-259. 被引量：27
10夏桂梅,曾建潮.基于锦标赛选择遗传算法的随机微粒群算法[J].计算机工程与应用,2007,43(4):51-53. 被引量：17

二级参考文献148

1江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
2钟将,吴中福,吴开贵,欧灵.基于人工免疫网络的动态聚类算法[J].电子学报,2004,32(8):1268-1272. 被引量：24
3曾建潮,崔志华.一种保证全局收敛的PSO算法[J].计算机研究与发展,2004,41(8):1333-1338. 被引量：160
4吴恩华.图形处理器用于通用计算的技术、现状及其挑战[J].软件学报,2004,15(10):1493-1504. 被引量：141
5倪金林.遗传算法求解约束非线性规划及Matlab实现[J].大学数学,2005,21(1):91-95. 被引量：10
6龙银香.基于移动计算的数据挖掘研究[J].微计算机信息,2005,21(4):216-217. 被引量：12
7刘立芳,霍红卫,王宝树.PHGA-COFFEE:多序列比对问题的并行混合遗传算法求解[J].计算机学报,2006,29(5):727-733. 被引量：11
8郎显宇,陆忠华,迟学斌.一种基于“基因表达谱”的并行聚类算法[J].计算机学报,2007,30(2):311-316. 被引量：11
9陆林花,王波.一种改进的遗传聚类算法[J].计算机工程与应用,2007,43(21):170-172. 被引量：26
10AnsariN HouE 李军边肇祺译.用于最优化的计算智能[M].北京：清华大学出版社,1999..

共引文献229

1刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：25
2刘婷,郭海湘,诸克军,高思维.一种改进的遗传k-means聚类算法[J].数学的实践与认识,2007,37(8):104-111. 被引量：22
3鲜于建川,隽志才.基于遗传聚类算法的出行行为分析[J].计算机应用研究,2009,26(3):836-839.
4智源,行飞.复杂网络社区结构问题综述[J].阴山学刊（自然科学版）,2011,25(3):31-34. 被引量：2
5宋冬梅,刘斌,陈寿长,马毅,马明国,李利伟,张雅洁,沈晨,崔建勇.基于子空间-粗集法的高光谱数据光谱与纹理特征优选[J].遥感技术与应用,2015,30(2):258-266. 被引量：3
6叶志伟,尹宇洁,王明威,赵伟.一种基于杜鹃搜索算法的聚类分析方法[J].微电子学与计算机,2015,32(5):104-110. 被引量：6
7武兆慧,张桂娟,刘希玉.基于模拟退火遗传算法的聚类分析[J].计算机应用研究,2005,22(12):24-26. 被引量：15
8刘向东,沙秋夫,刘勇奎,段晓东.基于粒子群优化算法的聚类分析[J].计算机工程,2006,32(6):201-202. 被引量：26
9李向群,陈光柱,刘世蕾,张虹.基于免疫细胞分离进化的聚类算法研究[J].计算机工程与设计,2006,27(14):2519-2521.
10李松斌.基于MPICH平台的多种群并行遗传算法[J].厦门大学学报（自然科学版）,2006,45(5):646-651. 被引量：3

同被引文献23

1王强,姚进,王进戈.基于遗传算法的移动机器人的一种路径规划方法[J].哈尔滨工业大学学报,2004,36(7):867-870. 被引量：19
2李建明,迟忠先,万单领.一种基于GPU加速细粒度并行遗传算法的实现方法[J].控制与决策,2008,23(6):697-700. 被引量：15
3陈建平,任斌,张会章.人工智能在智能机器人领域中的研究与应用[J].东莞理工学院学报,2008,15(3):33-37. 被引量：10
4岳嵚,冯珊.粗粒度并行遗传算法的计算性能分析[J].武汉理工大学学报,2008,30(7):107-110. 被引量：13
5马钧水,刘贵忠,贾玉兰.改进遗传算法搜索性能的大变异操作[J].控制理论与应用,1998,15(3):404-408. 被引量：84
6张荣松,包家汉.基于改进遗传算法的机器人路径规划[J].计算机技术与发展,2009,19(7):20-23. 被引量：14
7朱大奇,颜明重.移动机器人路径规划技术综述[J].控制与决策,2010,25(7):961-967. 被引量：328
8马永杰,云文霞.遗传算法研究进展[J].计算机应用研究,2012,29(4):1201-1206. 被引量：431
9李东,潘志松.一种适用于大规模变量的并行遗传算法研究[J].计算机科学,2012,39(7):182-184. 被引量：13
10孙树栋,林茂.基于遗传算法的多移动机器人协调路径规划[J].自动化学报,2000,26(5):672-676. 被引量：49

引证文献3

1屈洁.虚拟环境下大数据智能并行聚类方法研究[J].计算机测量与控制,2017,25(6):257-260. 被引量：4
2姜海洋,闫照儒,郭琦.基于改进遗传算法的机器人路径规划[J].黑龙江大学自然科学学报,2017,34(5):601-607. 被引量：6
3王龙,姚文明.基于Spark的并行遗传算法在物流配送问题中的应用[J].计算机与现代化,2018(1):19-22. 被引量：3

二级引证文献13

1胡东明,刘旭敏,徐维祥.MapReduce框架下一种负载均衡的Top-k连接查询算法[J].计算机测量与控制,2018,26(8):238-242. 被引量：1
2张利娟,仇建伟,杜登崇,王鑫.基于Spark和PSO算法的军事物流配送路径优化问题研究[J].计算机与现代化,2018(11):65-68. 被引量：3
3杨雁莹.大数据背景下的聚类算法的相关研究[J].电脑编程技巧与维护,2019(1):68-71. 被引量：1
4王素琴,王飞,袁建平,陈晓龙,陈显龙.基于双向RRT算法的管线路径规划及建模仿真[J].太原理工大学学报,2018,49(6):839-845. 被引量：10
5吴书强,蔡宗琰.基于改进鲸鱼算法的路径规划方法研究[J].机电工程技术,2019,48(10):83-85. 被引量：3
6赵云强,韩翼,崔慧茹,郑琳.聚类目标函数下混合属性大数据集分析系统[J].电子设计工程,2020,28(4):73-76. 被引量：3
7王辉,于立君,胡羽坤,王莹莹.具有势场启发因子的蚁群路径规划仿真[J].实验室研究与探索,2020,39(3):106-109. 被引量：5
8宋国兴,张家铭,张清伟,薛飏.基于Spark架构的机器学习平台设计与研究[J].信息技术与信息化,2020(5):55-58. 被引量：1
9孙丽娜,田军委,刘雪松,王沁.一种融合模拟退火的改进遗传算法多任务路径规划[J].西安工业大学学报,2021,41(2):145-152. 被引量：3
10熊亿民.基于改进蚁群算法的全向移动机器人全遍历路径规划[J].计算机系统应用,2021,30(6):209-214. 被引量：4

1孙红娜.远程控制助理[J].中国计算机用户,2002(17):59-59.
2陈庆章,洪卫丹,蔡韶华,林建明.支持信息过滤的一种新的群体感知模型[J].暨南大学学报（自然科学与医学版）,2009,30(1):45-48.

黑龙江大学工程学报

2016年第3期

浏览历史

内容加载中请稍等...

基于Hadoop MapReduce和粗粒度并行遗传算法的大数据聚类方法改进被引量：3

参考文献12

二级参考文献148

共引文献229

同被引文献23

引证文献3

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于Hadoop MapReduce和粗粒度并行遗传算法的大数据聚类方法改进 被引量：3

参考文献12

二级参考文献148

共引文献229

同被引文献23

引证文献3

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于Hadoop MapReduce和粗粒度并行遗传算法的大数据聚类方法改进被引量：3