基于Seed集的半监督核聚类被引量：2

Semi-supervised kernel clustering algorithm based on seed set

下载PDF

导出

摘要提出了一种新的半监督核聚类算法——SKK-均值算法。算法利用一定数量的标记样本构成seed集,作为监督信息来初始化K-均值算法的聚类中心,引导聚类过程并约束数据划分;同时还采用了核方法把输入数据映射到高维特征空间,并用核函数来实现样本之间的距离计算。在UCI数据集上进行了数值实验,并与K-均值算法和核-K-均值算法进行了比较。 This paper presents a novel semi-supervised kernel clustering algorithm called Seed Kernel K-Means（SKK-Means） algorithm.It uses labeled data to generate initial seed clusters to guide the clustering process and data partition,and uses kernel method to map the input data into a high-dimensional feature space and calculates the distance between data points with a kernel function.The algorithm is compared with the other clustering algorithms such as K-Means and Kernel K-Means,on UCI databases in some numeric experiment.

作者李昆仑张超曹铮刘明

机构地区河北大学电子信息工程学院

出处《计算机工程与应用》 CSCD 北大核心 2009年第20期154-157,共4页 Computer Engineering and Applications

基金国家自然科学基金No.60873100 河北省科技支撑计划项目No.072135188 河北省教育厅科研计划项目No.2008312~~

关键词半监督聚类 SEED 集核方法 K-均值 semi-supervised clustering seed set kernel method K-means

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献10

1Zhu X J.Semi-supervised learning literature survey,Technical Report 1530[R].Department of Computer Sciences,University of Wisconsin at Madison, Madison, WI, December, 2007.
2李昆仑,张伟,代运娜.基于Tri-training的半监督SVM[J].计算机工程与应用,2009,45(22):103-106. 被引量：15
3Li Kun-lun,Zhang Wei,Ma Xiao-tao,et al.A novel semi-supervised SVM based on tri-training[C]//IITA 2008.
4Basu S,Banerjee A,Mooney R.Semi-supervised clustering by seeding[C]//Intemational Conference on Machine Learning,2002:19-26.
5Filippone M,Camastra F,Masulli F,et al.A survey of kernel and spectral methods for clustering[J].Pattem Recognition, 2008,41 : 176-190.
6Kulis B,Basu S,Dhillon I S,et al.Semi-supervised graph clustering: A kernel approach[C]//Proceedings of the 22nd International Conference on Machine Learning,ICML'05.New York,NY,USA ACM Press, 2005 : 457-464.
7Girolami M.Mercer kernel-based clustering in feature space[J]. 1EEE Transactions on Neural Networks,2002,13(3):780-784.
8Camastra F,Verri A.A novel kernel method for clustering[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(5):801-805.
9Dempster A P,Laird N M,Rubin D B.Maximum likelihood from incomplete data via the EM algorithm[J].J Royal Statistical Soc, 1977,39(1 ) : 1-38.
10UCI repository of machine learning databases.http://www.ics.uci.edu/ mlearn/MLRepository.html.

二级参考文献3

1邓超,郭茂祖.基于自适应数据剪辑策略的Tri-training算法[J].计算机学报,2007,30(8):1213-1226. 被引量：15
2J.A.K. Suykens,J. Vandewalle. Least Squares Support Vector Machine Classifiers[J] 1999,Neural Processing Letters(3):293～300
3Dana Angluin,Philip Laird. Learning from noisy examples[J] 1988,Machine Learning(4):343～370

共引文献14

1吴涛,李萍,王允强.基于Tri-training算法的构造性学习方法[J].计算机工程,2012,38(6):13-15. 被引量：3
2邬书跃,余杰,樊晓平.基于Tri-training的入侵检测算法[J].计算机工程,2012,38(6):158-160. 被引量：2
3张雁,吕丹桔,吴保国.基于Tri-Training半监督分类算法的研究[J].计算机技术与发展,2013,23(7):77-79. 被引量：9
4崔龙杰,王红丽,崔荣一.基于辅助学习与富信息策略的Tri-training算法[J].计算机应用研究,2014,31(9):2685-2687.
5李萍,吴涛.协同半监督的构造性学习方法[J].计算机工程与应用,2015,51(3):129-132. 被引量：1
6李琰.基于高斯差分双线性映射的导频对称加密方法[J].科技通报,2015,31(4):82-84.
7卜华龙,夏静,郑尚志.一种基于ECVM的Tri-training半监督垃圾邮件检测算法[J].宿州学院学报,2016,31(8):105-107.
8李仲年,臧春华,杨刚,项嵘.基于半监督学习的跌倒检测系统设计[J].传感器与微系统,2016,35(10):67-69. 被引量：4
9吴明胜,邓晓刚.基于Tri-DE-ELM的半监督模式分类方法研究[J].计算机工程与应用,2018,54(3):109-114. 被引量：7
10蒋小伟,吕干云,武阳.一种新的电压暂降事故源识别方法研究[J].电工电气,2018(5):23-26. 被引量：3

同被引文献28

1杜奕,卢德唐,李道伦,查文舒.基于层次聚类的时间序列在线划分算法[J].模式识别与人工智能,2007,20(3):415-420. 被引量：8
2黄书剑.时序数据上的数据挖掘.软件学报,2004,15(1):1-7.
3Wagstaff K, Cardie C, Rogers S, et al.Constrained K-means clus- tering with background knowledge[C]//Proceedings of the 18th International Conference on Machine Learning, San Francisco.CA, USA: Morgan KaufMann Publishers Inc., 2001 : 577-584.
4Bezdek J C.Pattem recognition with objective function algo- rithms[M].New York: Plenum Press, 1981.
5Alcock R.UCI repository of machine learning database[EB/OL]. ( 1999-06-08).http ://archive.ics.uci.edu/ml/datasets.html.
6王玲,薄列峰,焦李成.密度敏感的半监督谱聚类[J].软件学报,2007,18(10):2412-2422. 被引量：95
7SAMARATI P, SWEENEY L. Generalizing data to provide anonymity when disclosing information[Z] Proc of the 17th ACM SIGMOD SIGACT SIGART Symposium, New York,ACM, 1998.
8AGGARWAL G, FEDER T, KENTHAPADI K, et al. Achieving anonymity via clustering[Z] Proe of the 25th ACM SIGMOD-SIGACT-SIGART Symp, New York, ACM, 2006.
9MEYERSON A, WILLIAMS R. On the complexity of optimal k-anonymity[Z]. Proc of the 23rd ACMSIGACT-SIG- MOD-SIGART Symp, New York, ACM, 2004.
10IYENGAR V. Transforming data to satisfy privacy constraints[Z]. Proc of the 8th ACM SIGKDD Int'l Conference, New York: ACM, 2002.

引证文献2

1蔡世玉,夏战国,张文涛.时间序列相似性半监督谱聚类[J].计算机工程与应用,2011,47(31):116-118. 被引量：1
2李昆仑,王哲,张娟,武倩,宋嵩.基于ELM集成和半监督聚类的SNS隐私保护[J].河北大学学报（自然科学版）,2013,33(1):84-89.

二级引证文献1

1袁铭.标度曲线拟合与金融时间序列聚类[J].计算机应用,2014,34(11):3344-3347. 被引量：4

1杨怀珍,李玲华.一种基于聚类与离散化算法的分类方法[J].统计与决策,2010,26(14):18-20.
2王楠,律方成,刘云鹏,李和明.粗糙集理论在变压器故障诊断中的应用[J].华北电力大学学报（自然科学版）,2003,30(4):21-24. 被引量：9
3宁亚楠,李定主,韩燮,杨晓文.基于稀疏表示的手势识别方法[J].计算机工程与设计,2016,37(9):2548-2552. 被引量：4
4金珠,马小平.基于蚁群聚类算法的SVM半监督式训练方法[J].西华大学学报（自然科学版）,2011,30(1):56-60. 被引量：3
5叶菲,罗军.基于错分样本的AdaBoost支持向量预选取算法[J].微电子学与计算机,2013,30(4):50-52.
6袁宗泽,孙浩,计科峰,邹焕新.基于Fisher字典学习稀疏表示的高光谱图像分类[J].遥感技术与应用,2014,29(4):646-652. 被引量：4
7高赟.连续量决策信息表的离散化问题研究[J].西安科技大学学报,2011,31(2):214-217. 被引量：1
8李辉,丁世飞.基于AP二次聚类的神经网络集成算法研究[J].计算机科学,2015,42(2):224-227. 被引量：3
9栾大鹏.对当前网络信息安全状况的调查[J].国家治理,2015,0(Z1):75-81.
10赵敬红,李永磊.基于稀疏恢复的L_1范数多观测样本凸包分类算法[J].机械工程师,2016(1):9-11.

计算机工程与应用

2009年第20期

浏览历史

内容加载中请稍等...

基于Seed集的半监督核聚类被引量：2

参考文献10

二级参考文献3

共引文献14

同被引文献28

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于Seed集的半监督核聚类 被引量：2

参考文献10

二级参考文献3

共引文献14

同被引文献28

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于Seed集的半监督核聚类被引量：2