非均匀数据的变异系数聚类算法被引量：3

Coefficient of variation clustering algorithm for non-uniform data

导出

摘要针对现有基于划分的聚类算法无法有效聚类簇大小和簇密度有较大差异的非均匀数据的问题,提出一种基于变异系数聚类算法。从聚类优化目标的角度出发,分析了以K-means为代表的划分聚类算法引发"均匀效应"的成因;提出以变异系数度量非均匀数据的分布散度,并基于变异系数定义一种非均匀数据的相异度公式;基于相异度公式定义了聚类目标优化函数,并根据局部优化方法给出聚类算法过程。在合成和真实数据集上的试验结果表明,与K-means、Verify2、ESSC聚类算法相比,本研究提出的非均匀数据的变异系数聚类算法(coefficient of variation clustering for non-uniform data,CVCN)聚类精度提升5%~40%。 Affected by the＂uniform effect＂,a problem existed in the partition-based algorithms remained on open and challenging taskdue to handling. To solve this problem,a clustering algorithm based on coefficient of variation was proposed. The＂uniform effect＂caused by K-means-type partitioning clustering algorithm from the view of clustering optimization was analyzed. Instead of the squared error,a new measure of dispersion for non-uniform data was proposed relied on the coefficient of variation. The clustering objective optimization function was defined using a new non-uniform data dissimilarity formula,which was proposed based on the coefficient of variation. According to the local optimization method,the clustering algorithm process was given. The experimental results on real and synthetic non-uniform datasets showed that the clustering accuracy of CVCN was better than K-means,Verify2,ESSC.

作者杨天鹏徐鲲鹏陈黎飞 YANG Tianpeng;XU Kunpeng;CHEN Lifei(College of Mathematics and Informatics, Fujian Normal University, Fuzhou 350117, Fujian, China;Digit Fujian Internet-of-Things Laboratory of Environmental Monitoring, Fujian Normal University, Fuzhou 350117, Fujian, China)

机构地区福建师范大学数学与信息学院数字福建环境监测物联网实验室

出处《山东大学学报（工学版）》 CAS 北大核心 2018年第3期140-146,共7页 Journal of Shandong University（Engineering Science）

基金国家自然科学基金资助项目(61175123) 福建省自然科学基金资助项目(2015J01238) 福建师范大学创新团队资助项目(IRTL1704)

关键词聚类基于划分聚类非均匀数据均匀效应变异系数 K-MEANS clustering partition-based clustering non-uniform data uniform effect coefficient of variation K-means

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1076

二级参考文献1

1李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114

共引文献1075

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：4
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献17

1骆自超,金隼,邱雪峰.考虑类内不平衡的谱聚类过抽样方法[J].计算机工程与应用,2014,50(11):120-125. 被引量：3
2王雅琳,陈斌,王晓丽,桂卫华.基于密度调整的改进自适应谱聚类算法[J].控制与决策,2014,29(9):1683-1687. 被引量：12
3亓慧.多中心的非平衡K-均值聚类方法[J].中北大学学报（自然科学版）,2015,36(4):453-457. 被引量：2
4范敏,王芬,李泽明,李志勇,张晓波.K近邻的自适应谱聚类快速算法[J].重庆大学学报（自然科学版）,2015,38(6):147-152. 被引量：4
5傅立伟,武森.基于属性值集中度的分类数据聚类有效性内部评价指标[J].工程科学学报,2019,41(5):682-693. 被引量：14
6刘颖莹,刘培玉,王智昊,李情情,朱振方.一种基于密度峰值发现的文本聚类算法[J].山东大学学报（理学版）,2016,51(1):65-70. 被引量：10
7李涛,葛洪伟,苏树智.基于密度自适应距离的密度峰聚类[J].小型微型计算机系统,2017,38(6):1347-1352. 被引量：6
8武森,刘露,卢丹.基于聚类欠采样的集成不均衡数据分类算法[J].工程科学学报,2017,39(8):1244-1253. 被引量：12
9卢建云,朱庆生,吴全旺.一种启发式确定聚类数方法[J].小型微型计算机系统,2018,39(7):1381-1385. 被引量：7
10万月,陈秀宏,何佳佳.基于加权密度的自适应谱聚类算法[J].计算机工程与科学,2018,40(10):1897-1901. 被引量：5

引证文献3

1武森,汪玉枝,高晓楠.基于近邻的不均衡数据聚类算法[J].工程科学学报,2020,42(9):1209-1219. 被引量：5
2卢建云,张蔚,李林.一种基于动态局部密度和聚类结构的聚类算法[J].山东大学学报（工学版）,2022,52(2):118-127. 被引量：2
3赵云莱,车文刚,金日泽.基于样本间变异系数改进的自适应谱聚类算法[J].兰州大学学报（自然科学版）,2022,58(6):812-818.

二级引证文献7

1郭飞,王波,王亮,史渊源,胡建军,李秀广.基于大数据分析的园区综合能源企业能效评价[J].电力大数据,2020,23(12):29-36. 被引量：4
2樊东醒,叶春明.融合聚类过采样算法的信贷不平衡数据分类[J].软件导刊,2021,20(11):70-74. 被引量：3
3张慧波,王守相,赵倩宇,任杰,王海.考虑数据不均衡的居民用户负荷曲线分类方法[J].电力工程技术,2022,41(3):186-193. 被引量：8
4陈西江,林嘉颖,韩贤权,王昊骏.基于指数函数密度聚类模型的室内物体提取[J].中国激光,2022,49(11):58-77. 被引量：2
5李叶飞,马昊燕,荆树君,王国彬,黄小花,雷鹏举.基于数据聚类的共享电源无线网络通信数据加密系统[J].电子设计工程,2024,32(1):19-23. 被引量：4
6白响恩,谢江,徐笑锋,吴永明.基于局部密度的宁波舟山港条帚门航道交通流特征分析[J].中国航海,2023,46(4):77-84.
7林雪竹,王德选,付西红,杨帆,郭丽丽,闫东明,李丽娟.面向多传感系统协同测量场的站位规划方法[J].光子学报,2024,53(8):219-235.

1张开云,马雅玲.丝裂霉素不同作用时间对LASEK术后角膜内皮细胞形态的影响（英文）[J].国际眼科杂志,2018,18(6):979-984. 被引量：1
2LUO Kun,KONG Jie,MENG Xianhong,LUAN Sheng,CAO Baoxiang,CHEN Baolong.Comparisons of Growth and Survival Performance Among Selected Families and Wild Populations of Fenneropenaeus chinensis[J].Journal of Ocean University of China,2018,17(2):407-412.
3周振环,郎立新,刘震,孙长勇,杨淑莲,王茂生.缺铁性贫血患者红细胞参数与中医证型相关性分析[J].河南中医,2018,38(5):743-745. 被引量：2
4Changqing XU,Yi LIU,Yintang YANG.An intelligent partitioning approach of the system-on-chip for flexible and stretchable systems[J].Science China(Information Sciences),2018,61(6):63-73. 被引量：2
5Shu-Xin Chen,Wei-Min Sun,Qi Yan.Clustering analysis of line indices for LAMOST spectra with AstroStat[J].Research in Astronomy and Astrophysics,2018,18(6):121-128. 被引量：1

山东大学学报（工学版）

2018年第3期

浏览历史

内容加载中请稍等...

非均匀数据的变异系数聚类算法被引量：3

参考文献1

二级参考文献1

共引文献1075

同被引文献17

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

非均匀数据的变异系数聚类算法 被引量：3

参考文献1

二级参考文献1

共引文献1075

同被引文献17

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

非均匀数据的变异系数聚类算法被引量：3