基于样本空间分布密度的改进次胜者受罚竞争学习算法被引量：5

Improvement rival penalized competitive learning algorithm based on pattern distribution of samples

下载PDF

导出

摘要针对传统次胜者受罚竞争学习(RPCL)算法忽略数据集几何结构对节点权值调整的影响,以及魏立梅等提出的新RPCL算法(魏立梅,谢维信.聚类分析中竞争学习的一种新算法.电子科学学刊,2000,22(1):13-18)引入密度来对节点的权值进行调整时,密度定义的主观性,提出基于样本空间分布密度的改进RPCL算法。该算法根据数据集样本自然分布定义样本密度,将此密度引入RPCL节点权值调整;使用UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集对算法进行实验测试,对算法确定数据集类簇数目的准确率、运行时间、聚类误差平方和、聚类结果的Rand指数、Jaccard系数以及Adjust Rand index参数进行分析比较。各项实验结果显示:所提算法优于原始RPCL算法和魏立梅算法,具有更好的聚类效果,对噪声数据有很强的抗干扰性能。所提算法不仅能根据样本的自然分布确定数据集的合理类簇数目,而且能确定合适的类簇中心,提高聚类的准确性,使聚类结果尽可能快地收敛到全局最优解。 The original Rival Penalized Competitive Learning（RPCL） algorithm ignores the influence of the geometry structure of a dataset on the weight variation of its nodes.A new RPCL algorithm proposed by Wei Limei et al.（WEI LIMEI,XIE WEIXIN.A new competitive learning algorithm for clustering analysis.Journal of Electronics,2000,22（1）： 13-18） overcame the drawback of the original RPCL by introducing the density of samples to adjust the weights of nodes,while the density was not much objective.This paper defined a new density for a sample according to the pattern distribution of samples in a dataset,and introduced the density into the adjusting for the weights of nodes in RPCL to overcome the disadvantages of the available RPCL algorithms.The authors＇ improved RPCL algorithm was tested on some well-known datasets from UCI machine learning repository and on some synthetic data sets with noisy samples.The accuracy of determining the number of clusters of a dataset and the run time and the clustering error of the algorithms were compared.The Rand index,the Jaccard coefficient and the Adjust Rand index were used to analyze the performance of the algorithms.The experimental results show that the improved RPCL algorithm outperforms the original RPCL and the new RPCL proposed by WEI LIMEI et al.greatly,and achieves much better clustering results and has a stronger anti-interference performance for noisy data than that of the other two RPCL algorithms.All the analyses demonstrate that the improved RPCL algorithm can not only determine the right number of clusters for a dataset according to its sample distribution,but also uncover the suitable centers of clusters and advance the clustering accuracy as well as approximate the global optimal clustering result as fast as possible.

作者谢娟英郭文娟谢维信高新波

机构地区陕西师范大学计算机科学学院西安电子科技大学电子工程学院深圳大学信息工程学院

出处《计算机应用》 CSCD 北大核心 2012年第3期638-642,共5页 journal of Computer Applications

基金中央高校基本科研业务费专项资金资助项目(GK200901006 GK201001003) 陕西省自然科学基础研究计划项目(2010JM3004)

关键词聚类次胜者受罚竞争学习算法样本密度聚类数目聚类中心 clustering Rival Penalized Competitive Learning（RPCL） algorithm sample density cluster number cluster center

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献9

1李昕,郑宇,江芳泽.用改进的RPCL算法提取聚类的最佳数目[J].上海大学学报（自然科学版）,1999,5(5):409-413. 被引量：15
2于剑,程乾生.模糊聚类方法中的最佳聚类数的搜索范围[J].中国科学（E辑）,2002,32(2):274-280. 被引量：130
3孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1072
4王开军,李健,张军英,过立新.聚类分析中类数估计方法的实验比较[J].计算机工程,2008,34(9):198-199. 被引量：24
5张忠平,王爱杰,柴旭光.简单有效的确定聚类数目算法[J].计算机工程与应用,2009,45(15):166-168. 被引量：23
6杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117
7魏立梅,谢维信.聚类分析中竞争学习的一种新算法[J].电子科学学刊,2000,22(1):13-18. 被引量：5
8杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：190
9张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60

二级参考文献47

1李洁,高新波,焦李成.一种基于修正划分模糊度的聚类有效性函数[J].系统工程与电子技术,2005,27(4):723-726. 被引量：8
2张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
3杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：190
4李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
5普运伟,金炜东,朱明,胡来招.核模糊C均值算法的聚类有效性研究[J].计算机科学,2007,34(2):207-210. 被引量：28
6李双虎,张风海.一个新的聚类有效性分析指标[J].计算机工程与设计,2007,28(8):1772-1774. 被引量：14
7普运伟,朱明,金炜东,胡来招.核聚类算法最佳聚类数的自适应确定方法[J].计算机工程,2007,33(4):11-13. 被引量：9
8毛韶阳,李肯立.优化K-means初始聚类中心研究[J].计算机工程与应用,2007,43(22):179-181. 被引量：26
9Redmond S J,Heneghan C.A method for initializing the K-means clustering algorithm using kd-trees[J].Patten Recognition Letter, 2007,28 : 965-973.
10Han J W,Wen S P.DataMing:Concepts and techniques[M].San Francisco:Morgan Kaumann Publishers,2000.

共引文献1530

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献58

1张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
2钱线,黄萱菁,吴立德.初始化K-means的谱方法[J].自动化学报,2007,33(4):342-346. 被引量：32
3袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
4Han J W,Kamber M. Data Mining: Concepts and Techniques[M]. Beijing: China Machine Press, 2000:383-466.
5Theodoridis S, Koutroumbas K. Pattern tecognition[M]. Boston: Academic Press, 2009 : 745-748.
6Kaufman L, Rousseeuw P J. Finding groups in data: An introduction to cluster analysis[M]. New York: Wiley, 1990 : 126-163.
7Lucasius C B, Dane A clustering of large data algorithm: Background, Analytica Chimica Acta, D, Kateman G. On k-medoid sets with the aid of a genetic feasibility and comparison[J]. 1993, 282(3): 647-669.
8Ng R, Han J. Efficient and effective clustering methods for spatial data mining[C] // In Proceedings of the 20th International Conference on very Large Databases, Santiago, 1994: 144-155.
9Wei C P, Lee Y H, Hsu C M. Empirical comparison of fast partitioning-based clustering algorithms for large data sets[J]. Expert Systems with Applications, 2003, 24(4) 351-363.
10Zhang Q, Couloigner I. A new and efficient K-medoid algorithm for spatial clustering[J]. Lecture Notes in Computer Science, 2005, 3482:181-189.

引证文献5

1谢娟英,郭文娟,谢维信.基于邻域的K中心点聚类算法[J].陕西师范大学学报（自然科学版）,2012,40(4):16-22. 被引量：32
2谢娟英,郭文娟,谢维信,高新波.基于密度RPCL的K-means算法[J].西北大学学报（自然科学版）,2012,42(4):570-576. 被引量：5
3谢娟英,高瑞.Num-近邻方差优化的K-medoids聚类算法[J].计算机应用研究,2015,32(1):30-34. 被引量：11
4郭文娟.基于密度的改进聚类算法比较[J].甘肃科技,2017,33(1):16-20. 被引量：1
5郭文娟.基于密度RPCL的K-medoids算法[J].科技风,2018(32):210-211.

二级引证文献45

1刘博,安建成.基于关键姿势的人体动作识别[J].电视技术,2014,38(5):38-41. 被引量：8
2殷樱,张玉冰,刘家诚,高昆.基于邻域互信息和K均值的基因选择算法[J].电脑知识与技术,2014(2):821-823.
3谢娟英,王艳娥.最小方差优化初始聚类中心的K-means算法[J].计算机工程,2014,40(8):205-211. 被引量：86
4路浩,倪世宏,查翔,张鹏.基于递减概率初始点选择K中心点进化算法[J].计算机仿真,2014,31(9):314-318. 被引量：3
5谢娟英,高瑞.Num-近邻方差优化的K-medoids聚类算法[J].计算机应用研究,2015,32(1):30-34. 被引量：11
6唐涛,覃晓,易宗剑,韩冬越.基于k中心点聚类的图像二值化方法[J].计算机科学与探索,2015,9(2):234-241. 被引量：10
7谢娟英,周颖.一种新聚类评价指标[J].陕西师范大学学报（自然科学版）,2015,43(6):1-8. 被引量：13
8谢娟英,屈亚楠.密度峰值优化初始中心的K-medoids聚类算法[J].计算机科学与探索,2016,10(2):230-247. 被引量：27
9赵翠芹,易云飞.无线传感网中分簇分层k-medoids协议研究[J].云南民族大学学报（自然科学版）,2016,25(2):157-162. 被引量：2
10苏义鑫,夏慧雯.用于风电功率预测的RPCL优化神经网络模型[J].北京工业大学学报,2016,42(5):674-678. 被引量：5

1谢娟英,郭文娟,谢维信,高新波.基于密度RPCL的K-means算法[J].西北大学学报（自然科学版）,2012,42(4):570-576. 被引量：5
2谢皝,张平伟,罗晟.基于RPCL的模糊关联规则挖掘[J].计算机工程,2011,37(19):44-46. 被引量：1
3郝剑,高茂庭.基于模糊相似度的RPCL文本聚类算法[J].电脑知识与技术,2011,7(6X):4416-4417. 被引量：1
4战胜网络威胁和风险[J].微电脑世界,2011(12):131-132.
5李昕,郑宇,江芳泽.用改进的RPCL算法提取聚类的最佳数目[J].上海大学学报（自然科学版）,1999,5(5):409-413. 被引量：15
6魏立梅,谢维信.聚类分析中竞争学习的一种新算法[J].电子科学学刊,2000,22(1):13-18. 被引量：5
7陈少仿.颜色的空间分布密度与图像检索[J].现代计算机,2005,11(7):4-8.
8分析为什么Intel在欧洲受罚在美国没事[J].现代电子技术,2009,32(11):100-100.
9艾英山,张德贤.基于聚类和密度的KNN分类器训练样本约减方法[J].计算机与数字工程,2009,37(5):10-12.
10钟将,刘荣辉.一种改进的KNN文本分类[J].计算机工程与应用,2012,48(2):142-144. 被引量：27

计算机应用

2012年第3期

浏览历史

内容加载中请稍等...

基于样本空间分布密度的改进次胜者受罚竞争学习算法被引量：5

参考文献9

二级参考文献47

共引文献1530

同被引文献58

引证文献5

二级引证文献45

相关作者

相关机构

相关主题

浏览历史

基于样本空间分布密度的改进次胜者受罚竞争学习算法 被引量：5

参考文献9

二级参考文献47

共引文献1530

同被引文献58

引证文献5

二级引证文献45

相关作者

相关机构

相关主题

浏览历史

基于样本空间分布密度的改进次胜者受罚竞争学习算法被引量：5