基于邻域归属信息混合度量的粗糙K-Means算法被引量：6

Rough K-Means Algorithm Based on Mixed Measure of Neighborhood Partition Information

下载PDF

导出

摘要粗糙K-Means及其衍生算法在处理边界区域不确定信息时,其边界区域中的数据对象因与各类簇中心点的距离相差较小,导致难以依据距离、密度对数据点进行区分判断。提出一种新的粗糙K-Means算法,在对数据进行划分时,综合数据对象的局部密度与邻域归属信息来衡量数据点与类簇的相似性,边界数据与类簇之间的关系由其局部的空间分布所决定,使得模糊不确定信息之间的差异更明显。在人工数据集和UCI标准数据集上的实验结果表明,该算法对边界区域数据的划分具有更高的准确率。 For Rough K-Means(RKM)and its derivative clustering algorithms,the distances between the data object in the boundary area and the cluster centers vary slightly and it is difficult to cluster the data by the distance or density.This paper proposes a new rough K-Means algorithm,which integrates the local density of data objects with their neighborhood information to measure the similarity between the data points and the clusters.The relationship between boundary data and clusters is determined by their local spatial distribution,which makes the difference between fuzzy uncertain information more obvious.Experimental results on the artificial dataset and the UCI standard datasets show that the presented algorithm has a higher accuracy for the clustering of boundary data.

作者孙静勇马福民 SUN Jingyong;MA Fumin(College of Information Engineering,Nanjing University of Finance and Economics,Nanjing 210023,China)

机构地区南京财经大学信息工程学院

出处《计算机工程》 CAS CSCD 北大核心 2021年第3期109-116,共8页 Computer Engineering

基金国家自然科学基金(61973151) 江苏省自然科学基金(BK20191376) 江苏省高校自然科学研究重大项目(17KJA120001)。

关键词粗糙集 K-MEANS算法局部密度邻域信息簇内相似 rough set K-Means algorithm local density neighborhood information intra-cluster similarity

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1马福民,逯瑞强,张腾飞.基于边界区域局部模糊增强的πRKM聚类算法[J].控制与决策,2017,32(11):1949-1956. 被引量：4
2王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[J].计算机学报,2009,32(7):1229-1246. 被引量：367
3张腾飞,陈龙,李云.基于簇内不平衡度量的粗糙K-means聚类算法[J].控制与决策,2013,28(10):1479-1484. 被引量：12
4许小龙,王士同,梅向东.基于局部和全局信息的改进聚类算法[J].计算机工程,2015,41(6):165-171. 被引量：3
5郑超,苗夺谦,王睿智.基于密度加权的粗糙K-均值聚类改进算法[J].计算机科学,2009,36(3):220-222. 被引量：25

二级参考文献75

1庞发虎,庞振凌,杜瑞卿.粗糙集理论对湖泊生态系统健康评定指数法的评价[J].生物数学学报,2008,23(2):337-344. 被引量：4
2王明慧.粗糙集理论在铁路行车调度指挥系统中应用的研究[J].中国铁道科学,2004,25(4):103-107. 被引量：13
3陈真诚,张锋,蒋大宗,倪利莉,王红艳.利用多分辨率分析的胸部X线数字图像粗糙集滤波增强[J].中国生物医学工程学报,2004,23(6):486-489. 被引量：7
4张文修,魏玲,祁建军.概念格的属性约简理论与方法[J].中国科学（E辑）,2005,35(6):628-639. 被引量：194
5胡峰,黄海,王国胤,吴渝.不完备信息系统的粒计算方法[J].小型微型计算机系统,2005,26(8):1335-1339. 被引量：18
6胡圣武,郭增长,王新洲,陶本藻.论遥感数据的模糊不确定性及基于Rough集的处理方法[J].中国铁道科学,2006,27(2):132-136. 被引量：5
7匡乐红,徐林荣,刘宝琛,姚京成.基于粗糙集原理的泥石流危险度区划指标选取方法[J].地质力学学报,2006,12(2):236-242. 被引量：14
8倪永成,杨建国,吕志军.基于Rough Set理论对原棉纱线强度的规则提取[J].纺织科技进展,2006(6):65-66. 被引量：3
9杜瑞卿,褚学英,王庆林,赵秋红,庞发虎.粗糙集神经网络在昆虫总科阶元分类学上的应用[J].中国农业大学学报,2007,12(1):33-38. 被引量：3
10赵文清,朱永利,高伟华.一个基于决策粗糙集理论的信息过滤模型[J].计算机工程与应用,2007,43(7):185-187. 被引量：15

共引文献404

1杨臻,邱保志.混合信息系统的动态变精度粗糙集模型[J].控制与决策,2020,35(2):297-308. 被引量：10
2丁广林.监理企业安全信用评价体系研究[J].建筑经济,2020(S01):41-45. 被引量：4
3王思.应用属性约简算法实现运动员伤病影响因素评估的研究[J].电子测量技术,2020,43(11):10-15.
4任泽,周逸轩,刘永国,齐宝军,刘恒,孙思.基于RS的增压系统能效评价权重计算[J].内蒙古石油化工,2019,0(12):37-40.
5宋冬梅,刘斌,陈寿长,马毅,马明国,李利伟,张雅洁,沈晨,崔建勇.基于子空间-粗集法的高光谱数据光谱与纹理特征优选[J].遥感技术与应用,2015,30(2):258-266. 被引量：3
6上官廷华,冯荣耀,柳宏川.一种基于熵和均方差法综合赋权的K-means算法[J].计算机与现代化,2010(4):34-36. 被引量：9
7蒋桂莲.基于Gabor小波和属性约简的人脸识别[J].计算机与数字工程,2010,38(6):138-141.
8郑少锋,郭群成.返乡农民工创业决策的影响因素——基于重庆市6个镇204个调查样本数据的分析[J].华南农业大学学报（社会科学版）,2010,9(3):9-15. 被引量：18
9陶铁军,梁华.基于粗糙集和贝叶斯理论的决策规则挖掘研究[J].南昌工程学院学报,2010,29(3):1-4.
10谢娟英,张琰,谢维信,高新波.一种新的密度加权粗糙K-均值聚类算法[J].山东大学学报（理学版）,2010,45(7):1-6. 被引量：11

同被引文献33

1杜佳颖,段隆振,段文影,卜秋瑾.基于Spark的改进K-means算法的并行实现[J].计算机应用研究,2020,37(2):434-436. 被引量：12
2陈万志,赵宇璇.智慧校园隐式用户行为的数据挖掘方法[J].辽宁工程技术大学学报（自然科学版）,2020(5):434-439. 被引量：13
3梁吉业,白亮,曹付元.基于新的距离度量的K-Modes聚类算法[J].计算机研究与发展,2010,47(10):1749-1755. 被引量：46
4王慧研,张腾飞,马福民.基于空间距离自适应权重度量的粗糙K-means算法[J].计算机科学,2018,45(7):190-196. 被引量：7
5张昉,赵书良,武永亮.面向多尺度数据挖掘的数据尺度划分方法[J].计算机科学,2019,46(4):57-65. 被引量：6
6吴广建,章剑林,袁丁.基于K-means的手肘法自动获取K值方法研究[J].软件,2019,40(5):167-170. 被引量：59
7李俊,周虎,李波.基于虚拟蚂蚁的局部优化蚁群算法[J].控制与决策,2019,34(11):2459-2468. 被引量：13
8黄晓辉,王成,熊李艳,曾辉.一种集成簇内和簇间距离的加权k-means聚类方法[J].计算机学报,2019,42(12):2836-2848. 被引量：39
9邓璘,王琳,盛步云,萧筝.基于变邻域蚁群算法的自动光学检测路径规划[J].计算机工程与设计,2020,41(2):354-360. 被引量：9
10施振佺,陈世平.一种改进的k-modes聚类算法[J].运筹与管理,2019,28(12):112-117. 被引量：6

引证文献6

1黄为.一种基于大数据的网络安全主动防御系统研究与设计[J].网络安全技术与应用,2022(9):59-61. 被引量：2
2王睿.基于K-means算法的网络主动安全防御系统研究与设计[J].网络安全技术与应用,2022(11):31-33. 被引量：1
3苏丰睿,穆伟伟,赵宣茗,裘智峰.一种划分聚类k值与中心初始化的改进方法[J].计算机工程,2023,49(11):85-93.
4王丽娟,邢津萍,尹明,郝志峰,蔡瑞初,温雯.基于一致性图的权重自适应多视角谱聚类算法[J].计算机工程,2024,50(2):122-131.
5姚红,梁竹.基于时间序列的局部离群数据挖掘优化算法[J].计算机仿真,2024,41(3):514-518.
6刘财辉,曾雄,谢德华.一种基于粗糙熵的改进K-modes聚类算法[J].南京理工大学学报,2024,48(3):335-341.

二级引证文献3

1薛振华.基于数据特征融合的多层次网络空间安全防御系统[J].信息与电脑,2023,35(2):242-244. 被引量：1
2张翼.基于异质性视角的网络安全防御最优投资策略[J].中国宽带,2023,19(2):169-171.
3耿倩.人工智能技术在大数据网络安全防御中的运用研究[J].网络安全技术与应用,2023(12):164-166. 被引量：1

1吴端坡,李俊杰,许晓荣,冯维,刘兆霆.基于改进TDOA算法的设计与仿真[J].实验室研究与探索,2021,40(1):107-110. 被引量：5
2丁逸尘,伍雄昌,黄美玲,杨子钰.武汉市人口分布时空演变特征分析[J].科技创新导报,2020,17(27):244-250.
3朱占龙,董建彬,李明亮,郑一博,王远.基于自适应加权图像块的广义模糊C均值算法[J].激光与光电子学进展,2020,57(24):80-89. 被引量：2
4吴燕萍,杜淑峰.基于混合属性大数据的模糊聚类算法研究[J].区域治理,2020(25):242-242.
5陈彦桥,张泽勇,陈金勇,高峰,柴兴华.基于CNN和RFC的极化SAR图像分类[J].无线电工程,2021,51(2):87-91. 被引量：2
6谢海彪,艾绍伟.配电主站边界数据可靠性测试分析[J].农村电气化,2021(3):8-9.
7张要,马盈仓,杨小飞,朱恒东,杨婷.基于L_(2,1)-范数距离的约束相似矩阵的聚类算法[J].计算机工程与设计,2021,42(3):726-733. 被引量：2
8王鑫,陈蔚雪,杨雅君,张小旺,冯志勇.知识图谱划分算法研究综述[J].计算机学报,2021,44(1):235-260. 被引量：19
9高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
10彭莉,张海清,李代伟,唐聃,于曦,何磊.基于粗糙集理论的不完备数据分析方法的混合信息系统填补算法[J].计算机应用,2021,41(3):677-685. 被引量：7

计算机工程

2021年第3期

浏览历史

内容加载中请稍等...

基于邻域归属信息混合度量的粗糙K-Means算法被引量：6

参考文献5

二级参考文献75

共引文献404

同被引文献33

引证文献6

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于邻域归属信息混合度量的粗糙K-Means算法 被引量：6

参考文献5

二级参考文献75

共引文献404

同被引文献33

引证文献6

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于邻域归属信息混合度量的粗糙K-Means算法被引量：6