基于密度峰值的加权犹豫模糊聚类算法被引量：10

Weighted Hesitant Fuzzy Clustering Based on Density Peaks

下载PDF

导出

摘要由于人们对事物认知的局限性和信息的不确定性,在对决策问题进行聚类分析时,传统的模糊聚类不能有效解决实际场景中的决策问题,因此有学者提出了有关犹豫模糊集的聚类算法。现有的层次犹豫模糊K均值聚类算法没有利用数据集本身的信息来确定距离函数的权值,且簇中心的计算复杂度和空间复杂度都是指数级的,不适用于大数据环境。针对上述问题,文中提出了一种基于密度峰值思想的加权犹豫模糊聚类算法(WHFDP),首先给出了犹豫模糊元素集的补齐方法,并结合变异系数理论给出了新的距离函数权重计算公式,然后利用密度峰值选取簇中心,不仅降低了簇中心计算的复杂度,而且提高了对不同规模以及任意形状数据集的适应性,算法的时间复杂度和空间复杂度也降为多项式级,最后采用典型数据集进行仿真实验,证明了所提算法的有效性。 Due to cognitive limitations and the information uncertainty,traditional fuzzy clustering cannot effectively solve the decision-making problems in a real-life scenario when cluster analysis is carried out on the decision problem.Therefore,hesitant fuzzy sets(HFSs)clustering algorithms were proposed.The conception of hesitant fuzzy sets is evolved from fuzzy sets which are applied to fuzzy linguistic approach.The distance function of the hierarchical hesitant fuzzy K-means clustering algorithm has the same weight since the datasets information is seldom considered,and the computational complexity for computing the cluster center is exponential which is unavailable in the big data environment.In order to solve the above problems,this paper presents a novel clustering algorithm for hesitant fuzzy sets based on density peaks,called WHFDP.Firstly,a new method for extending the short hesitant fuzzy elements set to calculate the distance between two HFSs is proposed and a new formula for calculating the weight of distance function combined with the coefficient of variation is given.In addition,the computational complexity for computing the cluster center is reduced by using density peaks clustering method to select cluster center.Meanwhile,the adaptability to data sets with different sizes and arbitrary shapes is also improved.The time complexity and space complexity of the algorithm are reduced to polynomial level.Finally,typical data sets are used for simulation experiments,which prove the effectiveness of the new algorithm.

作者张煜陆亿红黄德才 ZHANG Yu;LU Yi-hong;HUANG De-cai(College of Computer Science and Technology,Zhejiang University of Technology,Hangzhou 310023,China)

机构地区浙江工业大学计算机科学与技术学院

出处《计算机科学》 CSCD 北大核心 2021年第1期145-151,共7页 Computer Science

基金浙江省公益技术应用项目(LGG19E090001)。

关键词数据挖掘聚类算法犹豫模糊集密度峰值变异系数 Data mining Clustering algorithm Hesitant fuzzy sets Density peaks Coefficient of variation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1唐伟,周志华.基于Bagging的选择性聚类集成[J].软件学报,2005,16(4):496-502. 被引量：95
2CHEN Na,XU Ze-shui,XIA Mei-mei.Hierarchical hesitant fuzzy K-means clustering algorithm[J].Applied Mathematics(A Journal of Chinese Universities),2014,29(1):1-17. 被引量：21
3金建国.聚类方法综述[J].计算机科学,2014,41(B11):288-293. 被引量：78

二级参考文献23

1李瑞,邱玉辉.基于离散点的蚁群聚类算法的研究[J].计算机科学,2005,32(6):111-113. 被引量：4
2田铮,李小斌,句彦伟.谱聚类的扰动分析[J].中国科学（E辑）,2007,37(4):527-543. 被引量：33
3张洪美,徐泽水,陈琦.直觉模糊集的聚类方法研究[J].控制与决策,2007,22(8):882-888. 被引量：64
4Estivill-Castro V. Why so many clustering algorithms-A position paper. SIGKDD Explorations, 2002,4(1):65-75.
5Dietterich TG. Machine learning research: Four current directions. AI Magazine, 1997,18(4):97-136.
6Breiman L. Bagging predicators. Machine Learning, 1996,24(2):123-140.
7Zhou ZH, Wu J, Tang W. Ensembling neural networks: Many could be better than all. Artificial Intelligence, 2002,137(1-2):239-263.
8Strehl A, Ghosh J. Cluster ensembles-A knowledge reuse framework for combining partitionings. In: Dechter R, Kearns M,Sutton R, eds. Proc. of the 18th National Conf. on Artificial Intelligence. Menlo Park: AAAI Press, 2002. 93-98.
9MacQueen JB. Some methods for classification and analysis of multivariate observations. In: LeCam LM, Neyman J, eds. Proc. of the 5th Berkeley Symp. on Mathematical Statistics and Probability. Berkeley: University of California Press, 1967,1:281-297.
10Blake C, Keogh E, Merz CJ. UCI Repository of machine learning databases. Irvine: Department of Information and Computer Science, University of California, 1998. http://www.ics.uci.edu/～mlearn/MLRepository.html

共引文献191

1吕超,鲁洪良,于洋,王昊阳,吴绍斌.基于分层强化学习和社会偏好的自主超车决策系统[J].中国公路学报,2022,35(3):115-126. 被引量：8
2高琰,谷士文,唐琎,蔡自兴.一种基于互信息的模糊聚类集成算法[J].小型微型计算机系统,2007,28(6):1068-1071. 被引量：2
3李士进,朱跃龙,刘净.一种基于k-prototype的多层次聚类改进算法[J].河海大学学报（自然科学版）,2007,35(3):342-347. 被引量：1
4张莉,陈恭和.一种适合大规模数据集的特征选择方法[J].计算机工程,2007,33(4):184-186. 被引量：1
5罗会兰,孔繁胜,李一啸.聚类集成中的差异性度量研究[J].计算机学报,2007,30(8):1315-1324. 被引量：36
6张妤,王文剑,康向平.一种回归SVM选择性集成方法[J].计算机科学,2008,35(4):178-180. 被引量：7
7刘明,袁保宗,苗振江,唐晓芳,李昆仑.从局部分类精度到分类置信度的变换[J].计算机研究与发展,2008,45(9):1612-1619. 被引量：6
8罗会兰,孔繁胜,李一啸.基于添加人工数据的高差异性聚类集体生成方法[J].模式识别与人工智能,2008,21(5):682-688.
9王红军,李志蜀,成飏,周鹏,周维.基于隐含变量的聚类集成模型[J].软件学报,2009,20(4):825-833. 被引量：14
10郭红玲,程显毅.多分类器选择集成方法[J].计算机工程与应用,2009,45(13):186-187. 被引量：7

同被引文献87

1Xu Zeshui1,2 1. Coll. of Economics and Management, Southeast Univ., Nanjing 210096, P. R. China,2. Inst. of Sciences, PLA Univ. of Science and Technology, Nanjing 210007, P. R. China.Intuitionistic fuzzy hierarchical clustering algorithms[J].Journal of Systems Engineering and Electronics,2009,20(1):90-97. 被引量：6
2夏芸,徐欣.企业内部控制信息披露与债务契约——来自于中国房地产上市公司的经验证据[J].经济管理,2011,37(3):114-122. 被引量：34
3贺正洪,雷英杰.直觉模糊C-均值聚类算法研究[J].控制与决策,2011,26(6):847-850. 被引量：19
4周红芳,王鹏.DBSCAN算法中参数自适应确定方法的研究[J].西安理工大学学报,2012,28(3):289-292. 被引量：42
5范成礼,邢清华,付强,范学渊.基于直觉模糊核聚类的弹道中段目标识别方法[J].系统工程与电子技术,2013,35(7):1362-1367. 被引量：11
6CHEN Na,XU Ze-shui,XIA Mei-mei.Hierarchical hesitant fuzzy K-means clustering algorithm[J].Applied Mathematics(A Journal of Chinese Universities),2014,29(1):1-17. 被引量：21
7王玲,吴璐璐,付冬梅.一种基于密度的模糊自适应聚类算法[J].北京科技大学学报,2014,36(11):1560-1565. 被引量：5
8赵兴旺,梁吉业.一种基于信息熵的混合数据属性加权聚类算法[J].计算机研究与发展,2016,53(5):1018-1028. 被引量：43
9昌攀,钟诚.通过DFT变换提取DNA序列特征聚类物种[J].小型微型计算机系统,2018,39(3):463-467. 被引量：3
10闫菲菲,魏翠萍,任智亮.犹豫模糊集的熵[J].数学的实践与认识,2018,48(14):243-250. 被引量：5

引证文献10

1侯冀超,谢成心,孟凡兴,温秀梅.基于模糊聚类处理月亮型数据的研究与实现[J].河北建筑工程学院学报,2022,40(3):173-178.
2张波,潘小东,谢健祥.公理化模糊集合的特征及其分类[J].四川师范大学学报（自然科学版）,2023,46(1):37-43. 被引量：1
3徐鑫,曹原.基于加权直觉模糊兰氏距离的密度峰值聚类算法[J].陕西师范大学学报（自然科学版）,2023,51(1):101-110. 被引量：5
4孙爽爽,黄德才,陆亿红.犹豫模糊数据对象集的谱聚类算法[J].小型微型计算机系统,2023,44(2):225-231. 被引量：1
5孙磊,卓俊宇,李杏丽,石秀程,袁业.基于电力大数据的空心村分布智能规划模型研究[J].微型电脑应用,2023,39(1):92-96.
6郭凯红,吴峥,李冬.基于知识量加权的直觉模糊均值聚类方法[J].计算机应用研究,2023,40(4):1088-1094. 被引量：1
7李文全,毛伊敏,彭新东.基于犹豫模糊集的凝聚式层次聚类算法[J].计算机应用,2023,43(12):3755-3763.
8陈竞,杜杰,丁胜利.基于模糊聚类分析的能源产业信息自动挖掘建模研究[J].电子设计工程,2024,32(1):138-141.
9赵乌吉斯古楞,凃云杰.基于证据理论的三向密度峰值聚类[J].计算机应用与软件,2024,41(5):264-273.
10吴希娟.基于K-means聚类算法的行政单位预算内部控制研究[J].人工智能科学与工程,2024(3):67-74.

二级引证文献8

1叶昌龙,殷江滨,王紫璇,南瑜睿.煤炭资源枯竭型城市转型绩效与障碍因子[J].陕西师范大学学报（自然科学版）,2023,51(6):84-96. 被引量：2
2苏欢,潘小东,付凯.几类一元模糊代数方程的可解性条件[J].四川师范大学学报（自然科学版）,2024,47(2):253-263.
3李文全,毛伊敏,彭新东.基于犹豫模糊集的凝聚式层次聚类算法[J].计算机应用,2023,43(12):3755-3763.
4沈冰,易志,钟璇,马婷婷,李春梅,韩佳临.不同果酒的氨基酸营养价值对比评价[J].中国酿造,2024,43(4):211-215. 被引量：1
5谢娟英,张文杰.局部标准差优化的密度峰值聚类算法[J].陕西师范大学学报（自然科学版）,2024,52(3):47-62.
6郑泛舟.基于烟花算法的智慧城市物联网数据流聚类方法[J].成都工业学院学报,2024,27(3):50-54.
7韩运龙,尚庆生,赵薇,郭泓.结合密度峰值和集成过滤器的自训练算法[J].宜宾学院学报,2024,24(6):15-20.
8胡涛,王中杰,张连明,陈晓锁.基于深度学习的非结构化大数据密度聚类仿真[J].计算机仿真,2024,41(5):501-505.

1周炼.做一个严谨的思考者[J].初中生世界（七年级）,2020,0(1):83-84.
2汤毅,王坤阳,张宽,滕国伟.可重叠抑制的Anchor-free目标检测算法[J].电视技术,2020,44(9):66-72.
3何娟.追寻华北豹的踪迹[J].人民周刊,2021(1):42-43.
4罗王军.浅析论述文中的“正反对比”视角[J].中学语文,2020(36):37-39.
5齐艳媚,田学东,张充,李亚康.一种古籍汉字图像的多属性模糊检索模型[J].河北大学学报（自然科学版）,2020,40(6):657-665. 被引量：2
6王继奎,杨正国,易纪海,刘学文,王会勇,聂飞平.稀疏约束的嵌入式模糊均值聚类算法[J].复旦学报（自然科学版）,2020,59(6):725-733. 被引量：3
7李景文,俞娜,姜建武,李旭.改进的遗传神经网络优化选址方法[J].计算机工程与设计,2021,42(1):150-155. 被引量：7
8王富平,李文楼,刘颖,卢津,公衍超.结合边缘信息和门卷积的人脸修复算法[J].计算机科学与探索,2021,15(1):150-162. 被引量：6
9方轩,孙晓凡,万海东.基于信号配准的组网信号级融合检测研究[J].现代雷达,2020,42(12):40-45.
10刘海军.狭义与广义相对论探讨(三)[J].科技风,2021(2):142-145. 被引量：1

计算机科学

2021年第1期

浏览历史

内容加载中请稍等...

基于密度峰值的加权犹豫模糊聚类算法被引量：10

参考文献3

二级参考文献23

共引文献191

同被引文献87

引证文献10

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于密度峰值的加权犹豫模糊聚类算法 被引量：10

参考文献3

二级参考文献23

共引文献191

同被引文献87

引证文献10

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于密度峰值的加权犹豫模糊聚类算法被引量：10