基于半监督的K-means聚类改进算法被引量：1

Clustering Algorithm Based on Semi-Supervised K-means

下载PDF

导出

摘要针对原始K-means算法的一系列问题,提出一种基于半监督的K-means聚类改进算法,能够自动进行聚类,找出最优K值,并且最大限度地找出孤立点。首先根据样本集自身的特点,按照"类内尽可能相似"原则一步一步形成数据集,然后对数据集进行"去噪"与合并相似簇,最后,利用少量的标记信息指导和修正聚类结果。在UCI的多个数据集上测试,结果表明改进的算法较原始算法在准确率上有较大提高,并且具有更好的稳定性。 Original k-means algorithm for a range of issues,which is proposed on the basis of semi-supervised k-means Clustering Algorithm,can automatically cluster,finding the optimal k value,and the maximum outliers.First,according to the own characteristics of sample and the principle of category as similar as possible,data set is formed step by step,then ＂denoised＂ or merged into similar clusters,and finally,the resultant clustering is guided and corrected by using a small amount of tag information.Multiple data sets in the UCI test results show that the improved algorithm is of better accuracy and better stability than the original algorithm.

作者李小展

机构地区广东工业大学计算机学院

出处《东莞理工学院学报》 2011年第1期29-32,共4页 Journal of Dongguan University of Technology

关键词半监督 K-MEANS算法聚类改进算法 semi-supervised k-means algorithm clustering algorithm

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1刘涛,尹红健.基于半监督学习的K-均值聚类算法研究[J].计算机应用研究,2010,27(3):913-916. 被引量：12
2李志圣,孙越恒,何丕廉,侯越先.基于k-means和半监督机制的单类中心学习算法[J].计算机应用,2008,28(10):2513-2516. 被引量：4
3高滢,刘大有,齐红,刘赫.一种半监督K均值多关系数据聚类算法[J].软件学报,2008,19(11):2814-2821. 被引量：22
4Brian Kulis,Sugato Basu,et al.Semi -Supervised Graph Clustering:A Kernel Approach[J].Machine Learning,2009,74(1):1 -22.
5Malay K Pakhlraa,Sangham itra Bandyopadhyayb,UjjwalMaulikc.Validity index for crisp and fuzzy cltmtem[J].Pattem Recognition,2004,37:487-501.
6曹志宇,张忠林,李元韬.快速查找初始聚类中心的K_means算法[J].兰州交通大学学报,2009,28(6):15-18. 被引量：19

二级参考文献35

1Dzeroski S. Multi-Relational data mining: An introduction. ACM SIGKDD Explorations Newsletter, 2003,5(1):1-16.
2Dzeroski S, Lavrac N. Relational Data Mining. Berlin: Springer-Verlag, 2001. 339-364.
3Domingos P. Prospects and challenges for multi-relational data mining. ACM SIGKDD Explorations Newsletter, 2003,5(1):80-83.
4Bouchachia A. Learning with partly labeled data. Neural Computing and Applications, 2007,16(3):267-293.
5Zhu XJ. Semi-Supervised learning literature survey. Technical Report, Computer Sciences TR 1530, University of Wisconsin- Madison, 2007. 1-42.
6Chapelle O, Seholkopf B, Zien A. Semi-Supervised Learning. Cambridge: MIT Press, 2006. 3-14.
7Long B, Zhang F, Wu XY, Yu PS. Spectral clustering for multi-type relational data. In: Cohen WW, Moore A, eds. Proc. of the 23rd Int'l Conf. on Machine Learning. New York: ACM Press, 2006. 585-592.
8Marques de Sa JP, Wrote; Wu YF, Trans. Pattern Recognition Concepts, Methods and Applications. 2nd ed., Beijing: Tsinghua University Press, 2002.51-74 (in Chinese).
9http://archive.ics.uci.edu/ml/datasets.html
10Yin XX, Han JW, Yu PS. CrossClus: User-Guided multi-relational clustering. Data Mining Knowledge Discovery, 2007,15(3): 321-348.

共引文献50

1孙雪,李昆仑,胡夕坤,赵瑞.基于半监督K-means的K值全局寻优算法[J].北京交通大学学报,2009,33(6):106-109. 被引量：11
2孙晓鹏,张琪,魏小鹏.半监督的三维网格模型层次分割[J].计算机辅助设计与图形学学报,2010,22(4):592-598. 被引量：5
3刘丛林,张忠林,曾庆飞.PSO算法在关联规则挖掘中的应用[J].兰州交通大学学报,2010,29(3):96-99. 被引量：4
4傅德胜,周辰.基于密度的改进K均值算法及实现[J].计算机应用,2011,31(2):432-434. 被引量：76
5袁利永.基于不完备标签数据的半监督聚类算法[J].计算机系统应用,2011,20(2):182-185.
6杨珺,杨炳儒,唐志刚.基于张量分析的链接聚类算法的研究[J].计算机应用研究,2011,28(3):833-837.
7傅涛,孙亚民.基于PSO的k-means算法及其在网络入侵检测中的应用[J].计算机科学,2011,38(5):54-55. 被引量：34
8程琨,舒勤,罗伟,张国龙.基于划分的有监督局部切空间排列的人脸识别[J].计算机应用研究,2011,28(6):2369-2371. 被引量：1
9陈建国.一种海量数据挖掘的有效方法[J].软件,2011,32(5):65-66. 被引量：2
10周爱武,崔丹丹,肖云.一种改进的K-means聚类算法[J].微型机与应用,2011,30(21):17-19. 被引量：5

同被引文献10

1潘奇明,程咏梅,杨涛,潘泉,赵春晖.真实场景运动目标轨迹有效性判断与自动聚类算法研究[J].计算机应用研究,2007,24(4):158-160. 被引量：9
2高云天,王学辉,郭涛.基于不完整信息的半监督聚类算法[J].北华大学学报（自然科学版）,2009,10(5):457-463. 被引量：2
3潘奇明,周文辉,程咏梅.运动目标轨迹分类与识别[J].火力与指挥控制,2009,34(11):79-83. 被引量：9
4李明之,马志强,单勇,张晓燕.基于轨迹分析的交通目标异常行为识别[J].电视技术,2012,36(1):106-112. 被引量：5
5李明之,马志强,单勇,张晓燕.交通监控中运动目标轨迹的距离计算和聚类[J].计算机工程与设计,2012,33(6):2417-2422. 被引量：8
6陈勇.一种目标航迹数据聚类挖掘分析方法[J].无线电工程,2015,45(3):22-24. 被引量：13
7朱进,江南,胡斌.移动对象多种运动参数在轨迹分类的应用[J].地球信息科学学报,2016,18(2):143-150. 被引量：10
8焦卫东,杨东玲,朱丽,杨丽萍.一种改进的基于意图挖掘的航迹预测[J].价值工程,2017,36(21):92-97. 被引量：3
9周星星,吉根林,张书亮.时空轨迹相似性度量方法综述[J].地理信息世界,2018,25(4):11-18. 被引量：20
10张强,张振标.基于曲线拟合的机动目标轨迹预测算法研究[J].信息化研究,2018,44(6):12-15. 被引量：7

引证文献1

1何艳,王运锋.基于历史航迹特征的飞行意图识别[J].现代计算机,2019,0(29):29-34. 被引量：1

二级引证文献1

1陈昱君,孙樊荣,许学吉,沐瑶.基于航迹数据的油耗分析与研究[J].中国民航大学学报,2022,40(3):8-14.

1蒲蓬勃,王鸽,刘太安.基于粒子群优化的模糊C-均值聚类改进算法[J].计算机工程与设计,2008,29(16):4277-4279. 被引量：18
2陈雄韬,闫秋艳.基于距离关联性动态模型的聚类改进算法[J].计算机科学与探索,2016,10(2):248-256.
3王家耀,谢明霞,郭建忠,陈科.基于相似性保持和特征变换的高维数据聚类改进算法[J].测绘学报,2011,40(3):269-275. 被引量：8
4李石君,张瑞,卢哲延,金索哲.基于粗糙近似的Web事务聚类改进算法[J].武汉大学学报（理学版）,2008,54(1):77-80.
5张洁玲,白清源.一种高效的K-means聚类改进算法[J].福州大学学报（自然科学版）,2014,42(4):537-542. 被引量：5
6陈利跃,杭钟灵,余亮,黄剑,何星.基于马氏距离的双层聚类电力远动异常检测[J].控制工程,2015,22(2):360-364. 被引量：2
7郑超,苗夺谦,王睿智.基于密度加权的粗糙K-均值聚类改进算法[J].计算机科学,2009,36(3):220-222. 被引量：25
8王海起,王劲峰.一种基于空间邻接关系的k-means聚类改进算法[J].计算机工程,2006,32(21):50-51. 被引量：15
9刘岩,王存睿.基于抽样融合改进的大数据聚类方法[J].微电子学与计算机,2017,34(4):17-21. 被引量：12
10徐丽,丁世飞,郭锋锋.基于改进属性约简的粗核聚类算法[J].广西师范大学学报（自然科学版）,2011,29(3):105-109. 被引量：2

东莞理工学院学报

2011年第1期

浏览历史

内容加载中请稍等...

基于半监督的K-means聚类改进算法被引量：1

参考文献6

二级参考文献35

共引文献50

同被引文献10

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于半监督的K-means聚类改进算法 被引量：1

参考文献6

二级参考文献35

共引文献50

同被引文献10

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于半监督的K-means聚类改进算法被引量：1