基于信息理论的合作聚类算法研究被引量：8

Study on New Information Theory Based Cooperative Clustering Algorithm

下载PDF

导出

摘要传统的聚类算法是针对一个独立数据集的学习分类算法,如FCM(Fuzzy-C-Means)聚类算法.在现实生活中,一个数据集独立于其它数据集,而往往通过与别的数据集交换信息与之相互合作.因此在聚类过程中,需要考虑来自其它数据集的影响,从而得到更能反映现实的数据结构.该文提出了一种基于信息理论的信息增益方法来建模并定量分析多个数据集间的合作关系.在此基础上,导出了相应的新合作聚类算法CCA(CooperativeCluste-ringAlgorithm).理论分析表明该算法最终收敛.实验结果也进一步表明了该合作聚类算法的可行性与有效性. Conventional clustering algorithms are designed for a single independent dataset, e.g.Fuzzy C-Means （FCM） clustering algorithm. In real world, a dataset is independent of other datasets but sometimes can be cooperative with others by exchanging information, such as the relationship between the subsidiary companies. So the influence from other relative collaborative datasets should be considered while performing clustering learning under such collaborative circumstances. Two different collaborative models are discussed and new proper methods are proposed to quantitatively measure such collaboration between datasets in this paper, e.g. information gain. The corresponding collaborative clustering algorithms are presented accordingly and the theoretic analysis shows that the new cooperative clustering algorithms can finally converge to local minimum. Experimental results demonstrate that the clustering structures obtained by new cooperative algorithms are different from those of conventional algorithms for the consideration of collaboration and the performances of these collaborative clustering algorithms can be much better than those conventional “single” clustering algorithms under the cooperating circumstances.

作者沈红斌杨杰王士同董一飞

机构地区上海交通大学图像处理与模式识别研究所江南大学信息工程学院新南威尔斯大学计算机科学和工程学院

出处《计算机学报》 EI CSCD 北大核心 2005年第8期1287-1294,共8页 Chinese Journal of Computers

基金中法先进计划项目基金(PRASI03-02)资助

关键词信息论聚类模糊模式识别 information theory clustering fuzzy pattern recognition

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献20

1Hopper F.. Fuzzy Cluster Analysis. Chichester: John Wiley, 1999.
2Han Jia-Wei.,Kamber M.. Data Mining: Concept and Techniques. San Mateo: Morgan Kanfmann, 2001.
3Bezdek J.C.. Pattern Recognition with Fuzzy Objective Function Algorithms. New York: Plenum Press, 1981.
4沈红斌,王士同,吴小俊.离群模糊核聚类算法[J].软件学报,2004,15(7):1021-1029. 被引量：37
5Shen Hong-Bin, Yang Jie, Wang Shi-Tong. Outlier detecting in fuzzy switching regression models. In: Proceedings of the AIMSA'04, Varna, Bulgaria, 2004, 208～215.
6Wu K.L., Yang M.S.. Alternative c-means clustering algorithms. Pattern Recognition, 2002, 35(10): 2267～2278.
7Sun Ying, Zhu Qiu-Ming, Chen Zheng-Xin. An iterative initial-points refinement algorithm for categorical data clustering. Pattern Recognition Letters, 2002, 23(7):875～884.
8Hathaway R., Benzdek J.. Switching regression models and fuzzy clustering. IEEE Transactions on Fuzzy Systems, 1993, 1(3): 195～204.
9Merz P.. Analysis of gene expression profiles: An application of memetic algorithms to the minimum sum-of-squares clustering problem. BioSystems, 2003, 72(11): 99～109.
10Eppstein D.. Fast hierarchical clustering and other applications of dynamic closest pairs. In: Proceedings of the 9th Symposium Discrete Algorithms, San Francisco, 1998, 619～628.

二级参考文献1

1张莉,周伟达,焦李成.核聚类算法[J].计算机学报,2002,25(6):587-590. 被引量：195

共引文献36

1吕佳,熊浩.一种新城市气温模式分类的聚类算法[J].数学的实践与认识,2007,37(8):55-60.
2沈红斌,杨杰,王士同,陈宁江.采样定理、视觉原理及无监督聚类分析理论[J].上海交通大学学报,2005,39(4):544-548. 被引量：3
3邓赵红,王士同.鲁棒性的模糊聚类神经网络[J].软件学报,2005,16(8):1415-1422. 被引量：11
4吕佳.核聚类算法及其在模式识别中的应用[J].重庆师范大学学报（自然科学版）,2006,23(1):22-24. 被引量：5
5周霆,张伟,邹汉斌.基因表达数据聚类中模糊核算法的改进[J].江南大学学报（自然科学版）,2006,5(2):162-165.
6范新南,沈红斌,陈学忠.特征空间属性加权模糊核聚类算法[J].计算机应用,2006,26(8):1888-1889. 被引量：7
7吕佳,熊忠阳.基于核的可能性聚类算法[J].计算机工程与设计,2006,27(13):2466-2468. 被引量：8
8谢坤武.智能桌面元搜索引擎中个性化研究[J].湖北民族学院学报（自然科学版）,2006,24(4):383-387.
9何虎翼,姚莉秀,沈红斌,杨杰.一种新的子空间聚类算法[J].上海交通大学学报,2007,41(4):577-577. 被引量：2
10姚林,阳建宏,何飞,徐金梧.基于核偏最小二乘的锌层重量预测模型[J].控制工程,2008,15(2):154-157. 被引量：12

同被引文献98

1徐科,黄国景,崔志明.元搜索引擎中基于用户兴趣的个性化调度模型[J].清华大学学报（自然科学版）,2005,45(S1):1915-1919. 被引量：16
2张曙红,孙建勋,张金隆.基于模糊聚类的粗糙集决策表简化方法研究[J].计算机工程与应用,2004,40(15):175-177. 被引量：7
3张曙红,孙建勋,诸克军.基于遗传优化的采样模糊C均值聚类算法[J].系统工程理论与实践,2004,24(5):121-125. 被引量：21
4王海东,刘元东.神经网络建模的变量聚类分析方法[J].计算机工程,2004,30(10):16-19. 被引量：2
5张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004,15(6):858-868. 被引量：176
6沈红斌,王士同,吴小俊.离群模糊核聚类算法[J].软件学报,2004,15(7):1021-1029. 被引量：37
7邹华彬,袁久荣,杜爱琴,孙琳琳,秦正冉.甘草水提物红外指纹图谱共有峰率和变异峰率双指标序列分析法[J].中成药,2004,26(10):779-783. 被引量：46
8邹华彬,袁久荣,杜爱琴,孙琳琳.甘草氯仿提取物红外指纹图谱双指标序列分析法[J].中国中药杂志,2005,30(1):16-20. 被引量：37
9程存归,应桃开.导数FTIR结合统计学法应用于中药延胡索质量控制的研究[J].光谱学与光谱分析,2005,25(1):36-38. 被引量：22
10胡亮,许永诚,高文,胡利平.个性化高效元搜索引擎的设计与实现[J].计算机工程与设计,2005,26(4):896-899. 被引量：5

引证文献8

1范新南,沈红斌,陈学忠.特征空间属性加权模糊核聚类算法[J].计算机应用,2006,26(8):1888-1889. 被引量：7
2何虎翼,姚莉秀,沈红斌,杨杰.一种新的子空间聚类算法[J].上海交通大学学报,2007,41(4):577-577. 被引量：2
3邹华彬.双指标信息显著相似序列聚类分析桂附地黄丸、金匮肾气丸无水乙醇提取物红外指纹图谱[J].中国中药杂志,2009,34(18):2325-2330. 被引量：13
4郭传福,汪德虎,姚海涛.基于协同增益的联合编队作战任务群聚合模型[J].指挥控制与仿真,2010,32(1):37-40. 被引量：2
5刘丙泉,潘鹏杰.基于聚类算法的电子商务信息集成研究[J].价值工程,2010,29(17):158-159.
6邢婷,邢治国,王凤领.基于信息熵的FCM聚类算法[J].计算机工程与设计,2010,31(23):5092-5095. 被引量：7
7曹易,张宁.一种改进的模糊C-均值聚类算法[J].上海理工大学学报,2012,34(4):351-354. 被引量：8
8霍波,李彦锋,高腾,王子鑫,杜泽华,孙纪元.体育人工智能领域关键技术的研究现状和发展方向[J].首都体育学院学报,2023,35(3):233-256. 被引量：19

二级引证文献58

1周建文.中职体育“学练赛用”四位一体教学模式的实践与研究[J].体育风尚,2023(10):47-49.
2李章应,郭吉茹,宋娟,张正慧.人工智能赋能高校体育舞蹈教学发展研究——以大语言模型和姿态估计技术为例[J].体育视野,2024(3):1-5.
3高强,宋双,刘翼光,黄昭婷,徐宏.商业智能在数字电影流动放映系统中的应用[J].现代电影技术,2010(3):24-28. 被引量：1
4李霞,徐树维.子空间聚类改进算法研究综述[J].计算机仿真,2010,27(5):174-177. 被引量：4
5贺杨成,王士同,江南,王亮.一种面向GIS系统的高维数据双层聚类方法[J].微计算机信息,2010,26(34):179-181.
6贺杨成,王士同,江南.特征空间属性加权混合C均值模糊核聚类算法[J].计算机工程与应用,2011,47(23):159-163. 被引量：4
7范成礼,雷英杰.基于核的直觉模糊聚类算法[J].计算机应用,2011,31(9):2538-2541. 被引量：3
8贺杨成,王士同,江南.成对约束的属性加权半监督模糊核聚类算法[J].计算机工程与应用,2011,47(24):136-138. 被引量：5
9江南,王士同,贺杨成.核参数优化选取的混合C均值核模糊聚类算法[J].计算机工程与设计,2011,32(9):3148-3152. 被引量：2
10孟凡会,吴霞.农作物秸秆红外指纹图谱双指标序列分析[J].分析科学学报,2012,28(2):233-236. 被引量：3

1邹海,李梅.一种用于文本聚类的改进二分K-均值算法[J].微型机与应用,2010,29(12):64-67. 被引量：3
2刘庆和,梁正友.一种基于信息增益的特征优化选择方法[J].计算机工程与应用,2011,47(12):130-132. 被引量：55
3邓克岩,贺艳平,张椿玲.基于OPNET的校园网络的设计及建模仿真[J].甘肃联合大学学报（自然科学版）,2010,24(6):60-62. 被引量：1
4吕佳.可能性C-Means聚类算法的仿真实验[J].重庆师范大学学报（自然科学版）,2005,22(3):129-132. 被引量：7
5叶志伟.一种基于蚁群算法和C-Means算法的图像分割方法[J].软件导刊,2007,6(7):106-108. 被引量：2
6马宝秋.模糊C均值聚类算法编程实现及应用[J].石家庄职业技术学院学报,2016,28(2):30-33. 被引量：2
7贺智明,王海超,高娟.电子商务协作过滤推荐技术的算法研究与改进[J].信息化纵横,2009(11):60-62. 被引量：1
8潘正才,陈海光.基于信息增益的中文网页SVM分类研究[J].上海师范大学学报（自然科学版）,2013,42(3):277-282.
9陈实,黄芝平,刘纯武.基于可视化图形特征的入侵检测方法[J].计算机测量与控制,2016,24(8):49-51. 被引量：4
10马春华,朱颢东,钟勇.结合新型文档频和二进制可辨矩阵的特征选择[J].计算机应用,2009,29(8):2268-2271. 被引量：3

计算机学报

2005年第8期

浏览历史

内容加载中请稍等...

基于信息理论的合作聚类算法研究被引量：8

参考文献20

二级参考文献1

共引文献36

同被引文献98

引证文献8

二级引证文献58

相关作者

相关机构

相关主题

浏览历史

基于信息理论的合作聚类算法研究 被引量：8

参考文献20

二级参考文献1

共引文献36

同被引文献98

引证文献8

二级引证文献58

相关作者

相关机构

相关主题

浏览历史

基于信息理论的合作聚类算法研究被引量：8