基于粗糙集的改进Leader聚类算法被引量：1

An improved rough-based Leader clustering algorithm

下载PDF

导出

摘要传统的聚类算法,如Leader算法和k-Means方法等,只能处理完整精确的数据集,数据项只能被划分到一个簇.而粗糙集理论用上近似集和下近似集表示一个类,尤其当数据有噪声、不完全和不精确性时,非常有优势.在经典的Leader算法中引入粗糙集理论,以处理模糊数据的聚类,得到改进的Leader算法——IRL(improved roughbased Leader)算法.IRL算法首先扫描数据项集,生成初始L集、RL集、RU集;然后优化RU集;最后再合并L集、RL集、RU集,得到最后的聚类结果.实验结果表明,IRL算法非常有效. Objects are partitioned into clusters with crisp boundaries in the conventional algorithms such as Leader algorithm and k-Means algorithm.However,rough set is represented with lower-bound and upper-bound,and is good for the case when the data is incomplete,inaccurate and noisy.In this paper,IRL（improved rough-based Leader）algorithm is proposed based on rough set and Leader algorithm.At first,the data set is scanned in order to gain the set L,RLand RU.And then,the set RUis optimized.At last,the set L,RLand RU are merged in order to find the clustering result.The experimental results show that the algorithm is effective.

作者张琼

机构地区福建体育职业技术学院公共基础部

出处《江苏师范大学学报（自然科学版）》 CAS 2015年第4期50-52,共3页 Journal of Jiangsu Normal University：Natural Science Edition

基金福建省中青年教师教育科研项目B类(JBS14650)

关键词 Leader算法粗糙集聚类上近似下近似 Leader algorithm rough set clustering upper approximation lower approximation

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1Fayyad U M, Uthurusamy R. Data mining and knowl-edge discovery in databases (introduction to the specialsection)[J]. Commun ACM, 1996.39(11) :24.
2冯征.一种基于粗糙集的K-Means聚类算法[J].计算机工程与应用,2006,42(20):141-142. 被引量：16
3白亮,梁吉业,曹付元.基于粗糙集的改进K-Modes聚类算法[J].计算机科学,2009,36(1):162-164. 被引量：15
4殷钢,苗夺谦,段其国.一种新的粗糙Leader聚类算法[J].计算机科学,2009,36(5):203-205. 被引量：6
5Pawlak Z. Rough sets[J]. IJCIS, 1982 ,11(5) : 341.
6Lingras P,West C. Interval set clustering of web userswith rough K-Means[J]. JUS,2004,23(1) :5.

二级参考文献31

1张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004,15(6):858-868. 被引量：176
2刘涛,吴功宜,陈正.一种高效的用于文本聚类的无监督特征选择算法[J].计算机研究与发展,2005,42(3):381-386. 被引量：37
3王珏,苗夺谦,周育健.关于Rough Set理论与应用的综述[J].模式识别与人工智能,1996,9(4):337-344. 被引量：264
4Han Jiawei,Kamber M. Data Mining:Concepts and Techniques. San Francisco, US: Morgan Kaufmann, 2001
5MacQueen J B. Some methods for classification and analysis of multivariate observation//Proceeding 5^th Berkley Symposium, on Mathematical Statistics and Probability. 1967, I:281-297. University of California Press, 1967, Xvii, 666
6Huang Zhexue. Clustering Large Data Sets with Mixed Numeric and Categorical Values//PAKDD'97. Singapore, World Scientific, 1997:21-35
7Huang Zhexue. Extensions to the k Means algorithm for clustering large data sets with categorical values. Data Mining and Knowledge Discovery, 1998,2 : 283-304
8Michael K, Ng M, Li Junjie, et al. On the impact of dissimilarity measure in K-Modes clustering algorithm. IEEE Transaction on Pattern Analysis and Machine Intelligence, 2007,29 (3) : 503-507
9Li Cen, Biswas Gautam. Unsupervised learning with mixed numeric and nominal data. IEEE Transactions on Knowledge and Data Engineering, 2002,14 :673-690
10Hsu C C, Chen Chinlong, Su Yuwei. Hierarchical clustering of mixed data based on distance hierarchy. Information Sciences, 2007 :4474-4492

共引文献33

1吴艳文,胡学钢,王东波.基于特征加权的k-modes聚类应用[J].中国科技信息,2007(16):271-272.
2阳春华,杨尽英,牟学民,周开军,桂卫华.基于聚类预分割和高低精度距离重构的彩色浮选泡沫图像分割[J].电子与信息学报,2008,30(6):1286-1290. 被引量：26
3王明春,唐万生,江琪,刘鑫.基于相对距离的改进粗K-means方法[J].计算机应用,2009,29(4):1102-1105. 被引量：2
4卢晓珊,贺永金,何伟,杨丰梅.AD HOC网络中的区域划分和资源分配研究[J].数学的实践与认识,2009,39(8):53-60. 被引量：1
5赵兴旺,梁吉业,曹付元.符号数据最佳聚类个数的确定方法[J].广西师范大学学报（自然科学版）,2009,27(3):130-133.
6魏兵,李亚非.基于同被引矩阵的专利引文分析方法[J].计算机工程与设计,2010,31(8):1779-1781. 被引量：3
7洪亮亮,罗可.改进的基于遗传算法的粗糙聚类方法[J].计算机工程与应用,2010,46(25):142-145. 被引量：10
8姚跃华,史秀岭.一种优化初始中心的K-means粗糙聚类算法[J].计算机工程与应用,2010,46(34):126-128. 被引量：14
9李仁侃,叶东毅.粗糙K-Modes聚类算法[J].计算机应用,2011,31(1):97-100. 被引量：5
10于洪,储双双.一种基于决策粗糙集的自动聚类方法[J].计算机科学,2011,38(1):221-224. 被引量：2

同被引文献15

1冯少荣.决策树算法的研究与改进[J].厦门大学学报（自然科学版）,2007,46(4):496-500. 被引量：67
2鲍新中,张建斌,刘澄.基于粗糙集条件信息熵的权重确定方法[J].中国管理科学,2009,17(3):131-135. 被引量：72
3王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[J].计算机学报,2009,32(7):1229-1246. 被引量：369
4刘小虎,李生.决策树的优化算法[J].软件学报,1998,9(10):797-800. 被引量：130
5李华雄,刘盾,周献中.决策粗糙集模型研究综述[J].重庆邮电大学学报（自然科学版）,2010,22(5):624-630. 被引量：29
6罗彬,邵培基,罗尽尧,刘独玉,夏国恩.基于粗糙集理论-神经网络-蜂群算法集成的客户流失研究[J].管理学报,2011,8(2):265-272. 被引量：21
7于海平,朱玉全,陈耿,欧吉顺.一种基于粗糙集理论的决策树构造方法[J].计算机应用与软件,2011,28(2):80-82. 被引量：6
8张清华,王国胤,肖雨.粗糙集的近似集[J].软件学报,2012,23(7):1745-1759. 被引量：43
9徐国浪,魏延.基于二叉树结构双优化的SVM多分类算法研究[J].重庆师范大学学报（自然科学版）,2013,30(6):109-113. 被引量：4
10马文萍,黄媛媛,李豪,李晓婷,焦李成.基于粗糙集与差分免疫模糊聚类算法的图像分割[J].软件学报,2014,25(11):2675-2689. 被引量：33

引证文献1

1路翀,徐辉,杨永春.基于决策树分类算法的研究与应用[J].电子设计工程,2016,24(18):1-3. 被引量：13

二级引证文献13

1李晓曙,钱晔,徐敏,符旭波,沈颖鸣,周正,孙吉红.云南省农村干部培训科技模式探索——以云南省农村干部学院为例[J].产业科技创新,2020(5):94-96.
2梁骁,张明,覃琳.一种基于机器学习识别贫困人口的数据分析方法研究[J].企业科技与发展,2017(5):39-41. 被引量：2
3王庆娟,张维,吕诗宁.出租房客户定位分析及电费回收策略[J].电力需求侧管理,2017,19(6):45-48. 被引量：1
4王小乐,张玉锋,袁媛,高波.基于决策树的卫星故障诊断知识挖掘方法[J].电子设计工程,2018,26(3):165-169. 被引量：11
5李时.基于大数据的电网设备台账对应准确度提升[J].电力大数据,2018,21(11):15-21. 被引量：3
6许鸿飞,于然,李雪梅,寇晓溪,赵子兰,金燊,杨清海.面向故障联合定位的告警数据信息填充算法[J].现代电子技术,2017,40(19):62-66. 被引量：2
7刘超,刘馨璐,王攀,张丽娜.基于DPI和大数据分析的宽带家庭画像[J].计算机技术与发展,2018,28(12):162-166. 被引量：3
8徐旭冉,涂娟娟.基于决策树算法的空气质量预测系统[J].电子设计工程,2019,27(9):39-42. 被引量：12
9吴进玲,张海东,李哲,施伟,田小军.基于计算机视觉的葵花子外观品质检测研究[J].湖北农业科学,2019,58(23):201-206. 被引量：2
10焦亚男,马杰.一种改进的MEP决策树剪枝算法[J].河北工业大学学报,2019,48(6):24-29. 被引量：11

1殷钢,苗夺谦,段其国.一种新的粗糙Leader聚类算法[J].计算机科学,2009,36(5):203-205. 被引量：6
2张琼,张莹,白清源,谢丽聪,谢伙生.基于Leader的K均值改进算法[J].福州大学学报（自然科学版）,2008,36(4):493-496. 被引量：3
3刘顺来.基于聚类分析的Web信息搜索算法研究[J].电脑与电信,2007(6):53-56.
4郭淑红,雷梁.基于聚类的Web用户访问模式的算法研究[J].信阳师范学院学报（自然科学版）,2009,22(1):137-141.
5赵湘宁.一种基于长链竞争机制的传感器网络能量空洞研究算法[J].计算机科学,2016,43(7):125-130. 被引量：3
6曹棣,孔晓斌.基于改进Leader算法的Web存取模式的聚类[J].太原科技大学学报,2011,32(3):189-192.
7吕刚,郑诚.基于本体的模糊关联规则算法[J].合肥学院学报（自然科学版）,2009,19(2):29-32.
8辛志,刘少辉,史忠植.关联规则算法的实现与改进[J].计算机工程与应用,2002,38(24):190-192. 被引量：14
9李绪成,王保保.挖掘关联规则中Apriori算法的一种改进[J].计算机工程,2002,28(7):104-105. 被引量：71
10隋玉敏,孙秀芳,武优西,任志考.负投影梯度的特征权重Leader聚类算法[J].小型微型计算机系统,2014,35(9):2147-2150. 被引量：2

江苏师范大学学报（自然科学版）

2015年第4期

浏览历史

内容加载中请稍等...

基于粗糙集的改进Leader聚类算法被引量：1

参考文献6

二级参考文献31

共引文献33

同被引文献15

引证文献1

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于粗糙集的改进Leader聚类算法 被引量：1

参考文献6

二级参考文献31

共引文献33

同被引文献15

引证文献1

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于粗糙集的改进Leader聚类算法被引量：1