基于多代表点的大规模数据模糊聚类算法被引量：9

Fuzzy clustering algorithm based on multiple medoids for large-scale data

导出

摘要针对传统模糊聚类在大规模数据场景下,由于内存的限制不能一次装载所有数据,以及在通过聚类捕捉数据的潜在结构和描述各个类时仅使用单个代表点存在信息量不足的问题,提出一种基于多代表点的大规模数据模糊聚类算法.该算法通过对大规模数据进行分块,在对每个数据块进行聚类时使用多个代表点描述捕捉到的数据的潜在结构和各个类信息,并通过考虑代表点与代表点之间在聚类过程中的约束关系,提高最后聚类结果的精度.在模拟数据集和真实数据集上的3组实验验证了所提出算法的有效性. For the problem that the traditional fuzzy clustering is not able to load all the data at a time because of the limited memory in the application scenario for large-scale data, and using a single medoid is insufficient to capture the underlying structure of data and describe each cluster, a fuzzy clustering algorithm based on multiple medoids for large-scale data is presented. The algorithm handles data chunk by chunk, and uses multiple medoids to represent the underlying data structure and each cluster information in one chunk, and the pairwise constraints from the relationship between two identified medoids are taken into account. These mechanisms improve the accuracy of the final clustering results. The effectiveness of the proposed algorithm is verified by three sets of experiments on a simulated dataset and two real datasets.

作者陈爱国王士同

机构地区江南大学数字媒体学院

出处《控制与决策》 EI CSCD 北大核心 2016年第12期2122-2130,共9页 Control and Decision

基金国家自然科学基金项目(61272210) 江苏省杰出青年基金项目(BK20140001) 江苏省自然科学基金项目(BK20130155)

关键词大规模数据模糊聚类增量式聚类多代表点 large-scale data fuzzy clustering incremental clustering multiple medoids

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献70

1王骏,王士同,邓赵红.聚类分析研究中的若干问题[J].控制与决策,2012,27(3):321-328. 被引量：195
2王莉,周献中,沈捷.一种改进的粗K均值聚类算法[J].控制与决策,2012,27(11):1711-1714. 被引量：8
3黄月,吴成东,张云洲,程龙,孙尧.基于K均值聚类的二进制传感器网络多目标定位方法[J].控制与决策,2013,28(10):1497-1501. 被引量：4
4白俊良,梅华威.改进相似度的模糊聚类算法在光伏阵列短期功率预测中的应用[J].电力系统保护与控制,2014,42(6):84-90. 被引量：22
5李远成,阴培培,赵银亮.基于模糊聚类的推测多线程划分算法[J].计算机学报,2014,37(3):580-592. 被引量：19
6古凌岚.面向大数据集的有效聚类算法[J].计算机工程与设计,2014,35(6):2183-2187. 被引量：7
7钱卫宁,周傲英.从多角度分析现有聚类算法(英文)[J].软件学报,2002,13(8):1382-1394. 被引量：86
8刘小勇,郑琨.光纤缺陷实时检测与分类方法研究[J].西安交通大学学报,2014,48(9):1-5. 被引量：7
9李向丽,耿鹏,邱保志.混合属性数据集的聚类边界检测技术[J].控制与决策,2015,30(1):171-175. 被引量：5
10高翠芳,黄珊维,沈莞蔷,殷萍.基于信息熵加权的协同聚类改进算法[J].计算机应用研究,2015,32(4):1016-1018. 被引量：6

引证文献9

1金保林.基于模糊聚类改进的光纤大数据分类算法研究[J].激光杂志,2018,39(7):152-156. 被引量：2
2斯亚民.嵌入式模糊集数据库的FCM增量式聚类算法研究[J].中国电子科学研究院学报,2019,14(6):586-592. 被引量：5
3周洁,姜志彬,张远鹏,王士同.基于密度的模糊代表点聚类算法[J].控制与决策,2020,35(5):1123-1133. 被引量：11
4云微.大规模混合网络数据库模糊查询算法改进仿真[J].计算机仿真,2020,37(5):246-249. 被引量：1
5顾苏杭,王士同.增量学习的模糊风格K平面聚类[J].控制与决策,2020,35(9):2081-2093. 被引量：1
6宋仁旺,苏小杰,石慧.基于空间分布优选初始聚类中心的改进K-均值聚类算法[J].科学技术与工程,2021,21(19):8094-8100. 被引量：13
7陈娇花.基于改进K-means模糊聚类的区域健康大数据智能分析方法研究[J].电子设计工程,2022,30(19):30-34. 被引量：4
8邱云飞,费博雯,刘大千,刘兴.稀疏条件下的重叠子空间聚类算法[J].计算机应用研究,2019,36(3):657-662. 被引量：3
9杨华晖,孟晨,王成,姚运志.基于目标特征选择和去除的改进K-means聚类算法[J].控制与决策,2019,34(6):1219-1226. 被引量：17

二级引证文献55

1侯冀超,谢成心,孟凡兴,温秀梅.基于模糊聚类处理月亮型数据的研究与实现[J].河北建筑工程学院学报,2022,40(3):173-178.
2徐涛,刘泽君,卢敏.基于RBM-GASA-BPNN的潜在高价值旅客预测[J].交通运输系统工程与信息,2019,19(4):108-114. 被引量：1
3朱祥.基于隐马尔可夫模型和聚类的英语语音识别混合算法[J].计算机测量与控制,2020,28(5):175-179. 被引量：15
4蒋忆睿,裴洋,陈磊,王文乐,代江艳,易玉根.多局部约束自表示的谱聚类算法[J].计算机工程与应用,2020,56(11):172-178. 被引量：1
5梁礼明,郭凯,盛校棋.基于加权特征子空间的支持向量机核函数研究[J].科学技术与工程,2020,20(15):6101-6106.
6郑毅,马盈仓,杨小飞.基于可靠邻居与精确簇数的稀疏子空间聚类[J].计算机应用研究,2021,38(1):75-82. 被引量：3
7田园,原野.基于改进K-means算法的电力大数据系统研究[J].电子设计工程,2021,29(2):76-80. 被引量：3
8杨华芬.云存储环境下大数据实时动态迁移算法研究[J].机械设计与制造工程,2021,50(2):117-122. 被引量：3
9岳根霞,刘金花,刘峰.基于决策树算法的医疗大数据填补及分类仿真[J].计算机仿真,2021,38(1):451-454. 被引量：19
10郭永爱.云计算技术的高校心理健康在线服务平台设计[J].现代电子技术,2021,44(11):177-181. 被引量：1

1滕明贵,熊范纶,吴正龙.一种对二维空间对象进行聚类的算法[J].模式识别与人工智能,2005,18(3):297-302.
2吴佳,罗可.改进的模糊C均值的增量聚类算法[J].计算机工程与应用,2011,47(23):141-142. 被引量：4
3毛国君,曹永存.基于数据概要描述的分布式数据流聚类模型与算法[J].计算机科学,2013,40(6):187-191. 被引量：4
4徐玉辰,刘真,张付志.基于增量式聚类和矩阵分解的鲁棒推荐方法[J].小型微型计算机系统,2015,36(4):689-695. 被引量：3
5王新星.基于Spark平台的热点话题发现算法并行化研究[J].软件导刊,2016,15(9):51-54.
6杨杰.一种多协议网络日志二次聚类方法研究[J].计算机应用研究,2012,29(10):3929-3931.
7沈洁,林颖,陈志敏,赵敏涯.基于增量式蚁群聚类的用户访问模式挖掘[J].计算机应用,2005,25(7):1654-1657. 被引量：4
8张广婷.基于KPoints的分布式聚类模型与算法[J].计算机工程,2011,37(S1):40-42.
9王洪春,彭宏.基于模糊C-均值的增量式聚类算法[J].微电子学与计算机,2007,24(6):156-157. 被引量：22
10刘青宝,侯东风,邓苏,张维明.基于相对密度的增量式聚类算法[J].国防科技大学学报,2006,28(5):73-79. 被引量：13

控制与决策

2016年第12期

浏览历史

内容加载中请稍等...

基于多代表点的大规模数据模糊聚类算法被引量：9

同被引文献70

引证文献9

二级引证文献55

相关作者

相关机构

相关主题

浏览历史

基于多代表点的大规模数据模糊聚类算法 被引量：9

同被引文献70

引证文献9

二级引证文献55

相关作者

相关机构

相关主题

浏览历史

基于多代表点的大规模数据模糊聚类算法被引量：9