基于核密度估计的K-CFSFDP聚类算法被引量：13

K-CFSFDP Clustering Algorithm Based on Kernel Density Estimation

下载PDF

导出

摘要快速搜索和发现密度峰值的聚类算法(Clustering by Fast Search and Find of Density Peaks,CFSFDP)是一种新的基于密度的聚类算法,它通过发现密度峰值来有效地识别类簇中心,具有聚类速度快、实现简单等优点。针对CFSFDP算法的准确性依赖于数据集的密度估计和截断距离(dc)的人为选择问题,提出一种基于核密度估计的KCFSFDP算法。该算法利用无参的核密度估计分析数据点的分布特征并自适应地选取dc,从而搜索和发现数据点的密度峰值,并以峰值点数据作为初始聚类中心。基于4个典型数据集的仿真结果表明,K-CFSFDP算法比CFSFDP,K-means和DBSCAN算法具有更高的准确度和更强的鲁棒性。 The CFSFDP(Clustering by Fast Search and Find of Density Peaks)is a new density-based clustering algorithm,it can identify the cluster centers effectively by finding the density peaks,and it has the advantages of fast clustering speed and simple realization.The accuracy of CFSFDP algorithm depends on the density estimation in the dataset and cut off distance(dc)of artificial selection.Therefore,an improved K-CFSFDP algorithm based on kernel density estimation was presented.The algorithm uses non parametric kernel density to analyze distribution of data points and selects the dc adaptively to search and find the peak density of data points,with the peak point data as the initial cluster centers.The simulated results on 4 typical datasets show that the K-CFSFDP algorithm has better performance in accuracy and better robustness than CFSFDP,K-means and DBSCAN algorithm.

作者董晓君程春玲 DONG Xiao-jun;CHENG Chun-ling(College of Computer,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)

机构地区南京邮电大学计算机学院

出处《计算机科学》 CSCD 北大核心 2018年第11期244-248,共5页 Computer Science

关键词聚类核密度估计密度峰值聚类中心 Clustering Kernel density estimation Density peak Cluster center

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1072
2WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi.Clustering by Fast Search and Find of Density Peaks with Data Field[J].Chinese Journal of Electronics,2016,25(3):397-402. 被引量：62
3蒋礼青,张明新,郑金龙,戴娇,尚赵伟.快速搜索与发现密度峰值聚类算法的优化研究[J].计算机应用研究,2016,33(11):3251-3254. 被引量：32
4陈晋音,何辉豪.基于密度的聚类中心自动确定的混合属性数据聚类算法研究[J].自动化学报,2015,41(10):1798-1813. 被引量：39
5孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169. 被引量：2391

二级参考文献234

1李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
2Nature. Big Data [EB/OL]. [2012-10-02]. http,//www. nature, com/news/specials/bigdata/index, html.
3Bryant R E, Katz R H, Lazowska E D. Big-Data computing : Creating revolutionary breakthroughs in commerce, science, and society [R]. [2012-10-02]. http:// www. cra. org/ccc/docs/init/Big_Data, pdf.
4Science. Special online collection: Dealing with data [EB/OL]. [2012-10-02]. http://www, sciencemag, org/site/ special/data/, 2011.
5Agrawal D, Bernstein P, Bertino E, et al. Challenges and opportunities with big data A community white paper developed by leading researchers across the United States [R/OL]. [2012-10-02]. http://cra, org/ccc/docs/init/bigdata whitepaper, pdf.
6Manyika J, Chui M, Brown B, et al. Big data: The next frontier for innovation, competition, and productivity [R/OL]. [ 2012-10-02 ]. http://www, mekinsey, corn/ Insights]MGI[Research/Teehnology _ and _ Innovation]Big _ data The next frontier for innovation.
7World Economic Forum. Big data, big impact: New possibilities for international development [R/OL]. [2012- 10-02]. http://www3, weforum, org/docs/WEF TC MFS BigDataBigImpact_Briefing 2012. pdf.
8Big Data Across the Federal Government [EB/OL]. [2012-10-02]. http://www, whitehouse, gov/sites/default/ files/microsites/ostp/big_data fact sheet_final_ 1. pdf.
9UN Global Pulse. Big Data for Development:Challenges Opportunities [R/OL]. [ 2012-10-02 ]. http://www. unglobalpulse, org/proj ects/BigDataforDevelopment.
10Times N Y. The age of big data fEB/OLd. [2012-10 -02]. http://www, nytimes, com/2012/02/12/sunday review/big- datas-impact in-the-world, html?pagewanted=all.

共引文献3568

1韩莹莹,钟专,褚月娇,康春阳,李东霓,王志佳,刘晓阳,张白羽.基于大数据智能化背景下神经病学实践教学体系构建的探索[J].中国实验诊断学,2023,27(8):1006-1009.
2李坪.大数据赋权正当性证成[J].中山大学法律评论,2020(1):3-21. 被引量：1
3孙昊鹏.大数据在新冠肺炎疫情中的应用和缺失[J].郑州师范教育,2020,9(3):91-96. 被引量：1
4闫妍.刍议大数据时代背景下全面预算管理对提升项目储备精益化管理水平的价值[J].质量与市场,2020,0(1):19-21. 被引量：6
5叶青.违法立案的检察监督机制研究[J].国家检察官学院学报,2024,32(1):53-68. 被引量：1
6丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
7刘厚营.大数据在安保工作情报分析中的应用[J].工程技术研究,2018,3(1):243-244. 被引量：1
8肖楠,陈红梅.从融媒体到智媒体:一种技术驱动下的传媒经济发展路径[J].新闻知识,2020(9):19-22. 被引量：3
9杨东,郑清洋.从TikTok事件看数字人民币的路径选择:从流量入口到金融优势的转化[J].新疆师范大学学报（哲学社会科学版）,2021,42(4):126-135. 被引量：6
10刘生龙,张晓明,杨竺松.互联网使用对农村居民收入的影响[J].数量经济技术经济研究,2021,38(4):103-119. 被引量：68

同被引文献107

1施健,刘兴高.Melt Index Prediction by Neural Soft-Sensor Based on Multi-Scale Analysis and Principal Component Analysis[J].Chinese Journal of Chemical Engineering,2005,13(6):849-852. 被引量：11
2刘田,杜吉伟,张秀然.铝电解生产过程中氧化铝浓度的控制[J].电工技术,2006(4):55-57. 被引量：2
3唐良瑞,祁兵,杨雪,张根保.一种基于高斯滤波器的电能质量信号去噪算法[J].中国电机工程学报,2006,26(10):18-22. 被引量：16
4王士同,修宇.基于模型的基因表达聚类分析技术研究进展[J].江南大学学报（自然科学版）,2006,5(3):374-378. 被引量：5
5吴颜,沈洁,顾天竺,陈晓红,李慧,张舒.协同过滤推荐系统中数据稀疏问题的解决[J].计算机应用研究,2007,24(6):94-97. 被引量：51
6杨黎刚,苏宏业,张英,褚健.基于SOM聚类的数据挖掘方法及其应用研究[J].计算机工程与科学,2007,29(8):133-136. 被引量：32
7冯少荣,肖文俊.DBSCAN聚类算法的研究与改进[J].中国矿业大学学报,2008,37(1):105-111. 被引量：87
8王世卿,张真,陈本华.一种基于概率统计的自适应网格聚类算法[J].微电子学与计算机,2008,25(5):173-175. 被引量：3
9楼巍,刘兴高.基于PCA-GA-RBF网络的聚丙烯熔融指数预报模型[J].石油化工高等学校学报,2007,20(3):82-85. 被引量：12
10李智勇,吴晶莹,吴为麟,宋保明.基于自组织映射神经网络的电力用户负荷曲线聚类[J].电力系统自动化,2008,32(15):66-70. 被引量：43

引证文献13

1侯婕,田学法,孔淑麒.基于LSTM的铝电解槽况预测[J].轻金属,2021(1):33-37. 被引量：7
2吴辰文,刘晓光,魏立鑫.结合蝙蝠算法改进的密度峰值聚类算法[J].西北大学学报（自然科学版）,2019,49(4):597-604. 被引量：2
3陈红梅.基于互补神经网络级联模型的聚丙烯MFR预报[J].塑料科技,2019,47(7):28-35. 被引量：1
4陈思亦,何利力,郑军红.结合商圈位置区域模型的商品推荐算法[J].计算机系统应用,2019,28(8):136-141. 被引量：2
5曹丹阳,孔淑麒,高磊.基于高斯混合模型的铝电解槽况聚类研究[J].轻金属,2020(2):26-30. 被引量：5
6王光,林国宇.改进的自适应参数DBSCAN聚类算法[J].计算机工程与应用,2020,56(14):45-51. 被引量：38
7孙彩云.DBSCAN算法的学校新冠肺炎数据采集云平台设计[J].现代电子技术,2020,43(24):117-120. 被引量：2
8薛子晗,潘迪,何丽.结合改进密度峰值聚类的LGC半监督学习方法优化[J].计算机工程,2021,47(2):77-83. 被引量：1
9李娜,段友祥,孙歧峰,沈楠.一种基于样本点距离突变的聚类方法[J].南京大学学报（自然科学版）,2021,57(5):775-784.
10钟华赞,包新晔,杜杰.基于协同过滤推荐的电价计划智能推荐算法[J].计算机工程与设计,2021,42(12):3525-3533.

二级引证文献61

1庞军,贾钰铭,陈燕,罗华,殷圣琼.98例肺癌骨转移临床分析[J].泸州医学院学报,2000,23(1):72-73. 被引量：2
2郝珉.聚丙烯熔融指数的影响因素研究[J].化工设计通讯,2019,45(11):121-121. 被引量：4
3阮文俊,胡小龙,李丽华.基于深度学习的电影推荐算法[J].湖北大学学报（自然科学版）,2020,42(2):136-141.
4樊仲欣.基于数据流的聚类趋势分析算法[J].计算机应用,2020,40(8):2248-2254. 被引量：6
5王浩然,杨炼鑫,张剑书.基于DBSCAN的二氧化硅融化过程中质心定位方法[J].电脑知识与技术,2020,16(23):1-3.
6林楠,刘海琪,杨佳佳,吴梦红,刘翰霖.BA-Adaboost模型的黑土区土壤养分含量高光谱估测[J].光谱学与光谱分析,2020,40(12):3825-3831. 被引量：7
7徐秀芳,夏旻,徐森,裴森森,陶奕阳.基于Django的校园疫情防控系统设计与实现[J].软件导刊,2021,20(2):24-30. 被引量：11
8任青亭,李帅,吕鹏,张铜.面向配网带电作业机器人的激光雷达与视觉系统融合定位[J].测绘通报,2021(2):98-102. 被引量：11
9郭乃琨,陈明剑,陈锐.一种顾及时间特征的船舶轨迹DBSCAN聚类算法[J].测绘工程,2021,30(3):51-58. 被引量：12
10倪小峰,曹斌.基于MLP神经网络的铝电解槽出铝量预测[J].智能计算机与应用,2021,11(8):139-142. 被引量：7

1汤圆.Find the Differences[J].阅读,2018,0(76):25-25.
2刘沧生,许青林.基于密度峰值优化的模糊C均值聚类算法[J].计算机工程与应用,2018,54(14):153-157. 被引量：15
3刘影,贾迪,王和章.复杂环境下基于CFSFDP的自适应室内定位方法[J].信号处理,2018,34(4):465-475. 被引量：4
4仇上正,张曦煌.一种改进的基于核密度估计的DPC算法[J].计算机应用与软件,2017,34(12):278-282. 被引量：2
5王一萍.一种快速检测重叠社区的方法[J].高师理科学刊,2018,38(7):28-31.
6郑虹,周丽媛,韩旭明.布谷鸟优化的密度峰值快速搜索聚类算法[J].长春工业大学学报,2018,39(3):253-260. 被引量：6
7杨柏丞,马建斌,王哲凯,陈红玉.海事事故的聚类与关联规则[J].中国航海,2018,41(3):63-67. 被引量：1
8Yihang Chen,Fudong Liu,Zheng Shan,Guanghui Liang.MalCommunity： A Graph-Based Evaluation Model for Malware Family Clustering[J].国际计算机前沿大会会议论文集,2018(1):21-21.
9李晔,陈奕延,张淑芬.基于密度峰值的混合型数据聚类算法设计[J].计算机应用,2018,38(2):483-490. 被引量：6
10谢慧华(文/图).“幻镜”美学新尝试OPPO R17[J].微型计算机,2018,0(27):23-27.

计算机科学

2018年第11期

浏览历史

内容加载中请稍等...

基于核密度估计的K-CFSFDP聚类算法被引量：13

参考文献5

二级参考文献234

共引文献3568

同被引文献107

引证文献13

二级引证文献61

相关作者

相关机构

相关主题

浏览历史

基于核密度估计的K-CFSFDP聚类算法 被引量：13

参考文献5

二级参考文献234

共引文献3568

同被引文献107

引证文献13

二级引证文献61

相关作者

相关机构

相关主题

浏览历史

基于核密度估计的K-CFSFDP聚类算法被引量：13