基于增量随机抽样的大数据迭代优化FCM算法

Big Data Iterative Optimization FCM Algorithm Based on Incremental Random Sampling

下载PDF

导出

摘要针对传统大数据聚类算法中存在效果差和时间复杂度高的问题,本文提出一种基于增量随机抽样的大数据迭代优化模糊C-均值算法(Fuzzy C-Means Algorithm,FCM)算法。该算法在大数据聚类期间引入增量式技术,对块内数据点执行并行计算处理,而且在迭代过程中无须存储庞大的隶属度矩阵,从而使得在不影响聚类结果质量的情况下大大减少运行时间和存储空间,能够有效提升聚类执行速度.实验结果表明,相对于其他聚类算法,本文提出的算法在几种聚类指标中的性能突出,而且在计算效率和放大性能方面对大数据聚类十分有效. Aiming at the problems of poor effect and high time complexity in traditional big data clustering algorithms,this paper proposes a fuzzy C-Means Algorithm(FCM)algorithm based on incremental random sampling for big data iterative optimization.The algorithm introduces incremental technology during big data clustering,performs parallel computing processing on data points in the block,and does not need to store a huge membership matrix during the iterative process,so that the quality of the clustering results is greatly improved without affecting the quality of the clustering results.Reduce running time and storage space,which can effectively improve the execution speed of clustering.Experimental results show that compared with other clustering algorithms,the algorithm proposed in this paper has outstanding performance in several clustering indicators,and it is very effective for big data clustering in terms of computational efficiency and amplification performance.

作者施媛波 SHI Yuanbo(Business School,Yunnan Normal University,Kunming Yunnan 650106,China)

机构地区云南师范大学商学院

出处《信息与电脑》 2021年第3期73-76,共4页 Information & Computer

基金云南省教育厅科学研究基金项目(项目编号:2019J1048,2019J1042)。

关键词大数据增量聚类算法并行计算模糊C-均值 large data incremental clustering algorithm parallel computing fuzzy C-Means

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1廖彬,张陶,于炯,黄静莱,国冰磊,刘炎.多MapReduce作业协同下的大数据挖掘类算法资源效率优化[J].计算机应用研究,2020,37(5):1321-1325. 被引量：32

二级参考文献4

1廖彬,张陶,于炯,刘继,尹路通,郭刚.温度感知的MapReduce节能任务调度策略[J].通信学报,2016,37(1):61-75. 被引量：8
2廖彬,张陶,于炯,尹路通,郭刚,国冰磊.MapReduce能耗建模及优化分析[J].计算机研究与发展,2016,53(9):2107-2131. 被引量：12
3廖彬,张陶,国冰磊,于炯,张旭光,刘炎.基于Spark的ItemBased推荐算法性能优化[J].计算机应用,2017,37(7):1900-1905. 被引量：8
4吴倩,王林平,罗相洲,崔建群,王海.基于MapReduce的top-k高效用模式挖掘算法[J].计算机应用研究,2017,34(10):2897-2900. 被引量：7

共引文献31

1陈志忠.数据挖掘算法在云平台应用中的优化与实施[J].电子元器件与信息技术,2019,0(3):8-11. 被引量：8
2何南.云计算下环形网络大数据协同挖掘方法分析[J].数码设计,2020,9(12):9-9.
3李孜颖,石振国.面向大数据任务的调度方法[J].计算机应用,2020,40(10):2923-2928. 被引量：12
4贾丽娜.基于大数据处理平台的计算任务调度的配置优化[J].电脑编程技巧与维护,2021(1):106-107. 被引量：1
5宋蓓蓓.基于差分进化算法的网络多属性大数据聚类挖掘方法[J].宁夏师范学院学报,2021,42(1):91-97. 被引量：5
6周沭玲.基于卷积神经网络的网页信息资源定向抽取方法研究[J].齐齐哈尔大学学报（自然科学版）,2021,37(4):33-37.
7任艳丽,黄永刚.基于云技术的手术室护理综合管理系统的设计[J].自动化与仪器仪表,2021(6):201-204.
8高浩.基于任务驱动的大数据高性能排序算法设计研究[J].自动化与仪器仪表,2021(7):17-20. 被引量：1
9文龙,师源懋.基于CHMM的物联网应用平台Android程序恶意行为识别[J].自动化与仪器仪表,2021(8):1-4.
10张婷曼,牛奕翔,李娜.基于fg-growth算法的大数据频繁项集挖掘方法[J].现代雷达,2021,43(11):63-67. 被引量：4

1李敬炜.面向测试用例的中文文本聚类分析[J].数字技术与应用,2020,38(12):105-108.
2王彤,杨军,张浩祥,张凯,周晓.基于粒子群改进FCM聚类算法优化管网压力监测点布置研究[J].给水排水,2021,47(2):140-144. 被引量：5
3王向阳,胡新文.电力信息通信数据智能运维技术分析研究[J].信息技术,2021,45(3):136-142. 被引量：7
4新资讯[J].互联网周刊,2021(7):10-11.
5郭健,乔铁柱,车剑.基于改进高斯混合模型的矿用输送带纵向撕裂检测方法[J].煤矿安全,2020,51(12):167-170. 被引量：5
6栾博语,刘沛清,翟羽佳,戴佳骅,李庆辉,张雅璇,夏慧.某大型飞机后缘襟翼气动/机构综合优化设计[J].民用飞机设计与研究,2021(1):17-22. 被引量：2
7王黎光,于长青,赵炯,李志国.基于预测模型迭代优化的改进比例导引律[J].飞行力学,2021,39(1):66-70. 被引量：3
8毛丽娜,毛鹍,刘智强,杨竟宪,张冰洁,芦柯仰.常州市全国第二次污染源普查数据质量控制技术研究[J].污染防治技术,2020,33(6):8-12.
9邵凌威,郑灿伟,渠振华,黄博,李世明.基于M-DRN多尺度特征提取的入侵检测方法[J].信息技术与网络安全,2021,40(4):14-19. 被引量：2
10李彬,郝一浩,祁兵,陈宋宋,冯剑.边缘计算在需求响应中的应用现状及发展思路[J].华电技术,2021,43(3):1-8. 被引量：7

信息与电脑

2021年第3期

浏览历史

内容加载中请稍等...

基于增量随机抽样的大数据迭代优化FCM算法

参考文献1

二级参考文献4

共引文献31

相关作者

相关机构

相关主题

浏览历史