基于紧密度的模糊加权kNN数据分类方法被引量：5

Data Classification Method of Fuzzy Weighted k-Nearest Neighbor Based on Affinity

下载PDF

导出

摘要模糊k-最近邻(fuzzy k-nearest neighbor,FkNN)及其改进的分类方法忽略了样本存在分布不均匀以及噪声样本的情况,不能充分体现每个类样本特征的差异性,影响了分类的准确率.为此,提出了一种基于紧密度的模糊加权kNN数据分类方法.首先基于样本间紧密度计算样本的隶属度;然后根据特征的模糊熵值分别计算每个类样本特征的权重,并使用加权欧氏距离确定近邻训练样本;最后根据待分类样本所属的每个类别的隶属度确定其类别.对UCI多个数据集的实验结果表明该方法是有效的. In sample classification, the fuzzy k-nearest neighbor （FkNN） method and the associate improved classification algorithms ignore the uneven distribution of samples and the noise samples, thus are unable to reflect the differences of class sample features, resulting in the low classification accuracy. In order to overcome the limitations, a fuzzy weighted k-nearest neighbor data classification method based on affinity is proposed in this paper. Firstly, the membership of samples is calculated based on affinity among samples. Then, the feature weights of class samples are determined by the fuzzy entropy values, and k-neighbors are selected according to the weighted Euclidean distance. Finally, the samples will be classified according to the fuzzy membership of the samples belong to each class. The experimental results on the UCI datasets show that the proposed method is effective.

作者刘诚诚姜瑛 LIU Cheng-cheng;JIANG Ying(Yunnan Key Lab of Computer Technology Application,Kunming 650500,China;Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China)

机构地区云南省计算机技术应用重点实验室昆明理工大学信息工程与自动化学院

出处《应用科学学报》 CAS CSCD 北大核心 2018年第4期679-688,共10页 Journal of Applied Sciences

基金国家自然科学基金(No.61462049 No.61063006 No.60703116) 云南省应用基础研究计划重点项目基金(No.2017FA033)资助

关键词数据分类加权kNN 紧密度模糊隶属度模糊熵 data classification weighted kNN affinity fuzzy membership fuzzy entropy

分类号 P751.1 [交通运输工程—港口、海岸及近海工程]

引文网络
相关文献

参考文献8

1吕锋,杜妮,文成林.一种模糊-证据kNN分类方法[J].电子学报,2012,40(12):2390-2395. 被引量：12
2刘继宇,王强,罗朝晖,宋浩,张绿云.基于粗糙集的加权KNN数据分类算法[J].计算机科学,2015,42(10):281-286. 被引量：7
3刘忠宝,赵文娟.基于模糊大间隔最小球分类模型的恒星光谱离群数据挖掘方法[J].光谱学与光谱分析,2016,36(4):1245-1248. 被引量：8
4张翔,肖小玲,徐光祐.基于样本之间紧密度的模糊支持向量机方法[J].软件学报,2006,17(5):951-958. 被引量：84
5江涛,陈小莉,张玉芳,熊忠阳.基于聚类算法的KNN文本分类算法研究[J].计算机工程与应用,2009,45(7):153-155. 被引量：30
6朱明旱,罗大庸,易励群.一种序列的加权kNN分类方法[J].电子学报,2009,37(11):2584-2588. 被引量：15
7孙可,龚永红,邓振云.一种高效的K值自适应的SA-KNN算法[J].计算机工程与科学,2015,37(10):1965-1970. 被引量：6
8陈池梅,张林.基于贝叶斯网络的海量数据多维分类学习方法研究[J].计算机应用研究,2016,33(3):689-692. 被引量：4

二级参考文献80

1陈振洲,李磊,姚正安.基于SVM的特征加权KNN算法[J].中山大学学报（自然科学版）,2005,44(1):17-20. 被引量：51
2安利平,陈增强,袁著祉.基于粗集理论的多属性决策分析[J].控制与决策,2005,20(3):294-298. 被引量：16
3马峻,吉晓民.利用粗糙集理论实现工艺决策的冲突消解[J].计算机辅助设计与图形学学报,2005,17(3):600-604. 被引量：5
4任靖,李春平.最小距离分类器的改进算法——加权最小距离分类器[J].计算机应用,2005,25(5):992-994. 被引量：30
5刘明,袁保宗,唐晓芳.证据理论k-NN规则中确定相似度参数的新方法[J].电子学报,2005,33(4):766-768. 被引量：8
6赵莹,高隽,汪荣贵,胡静.一种新的广义最近邻方法研究[J].电子学报,2004,32(F12):196-198. 被引量：13
7刘蓉,段福庆,刘三阳,吴福朝.基于小波特征的星系光谱分类[J].电子学报,2005,33(11):2059-2062. 被引量：9
8周涓,熊忠阳,张玉芳,任芳.基于最大最小距离法的多中心聚类算法[J].计算机应用,2006,26(6):1425-1427. 被引量：72
9杨金福,吴福朝,罗阿理,赵永恒.基于覆盖算法的天体光谱自动分类[J].模式识别与人工智能,2006,19(3):368-374. 被引量：12
10苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：386

共引文献158

1于湘涛,卢文秀,褚福磊.基于PSO算法的模糊PSVM及其在旋转机械故障诊断中的应用[J].振动与冲击,2009,28(11):183-186. 被引量：4
2张俊红,马文朋,马梁,何振鹏.Fault Diagnosis Model Based on Fuzzy Support Vector Machine Combined with Weighted Fuzzy Clustering[J].Transactions of Tianjin University,2013,19(3):174-181. 被引量：3
3王胜春,韩捷,李志农,李剑峰.基于模糊域和支持向量机的故障诊断方法[J].山东大学学报（工学版）,2006,36(6):116-120. 被引量：2
4郭雪松,孙林岩,徐晟.基于超球结构的支持向量机增量学习算法[J].运筹与管理,2007,16(4):45-49. 被引量：1
5刘芸,唐发根,林广艳.一种改进的近似支持向量机算法[J].北京航空航天大学学报,2007,33(9):1090-1093. 被引量：1
6吴巧敏,林亚平.一种基于重复训练的支持向量机方法[J].计算机工程与应用,2007,43(31):165-168. 被引量：2
7王晓锋,秦玉平.基于支持向量机的网页多类分类技术[J].大连轻工业学院学报,2007,26(4):359-362. 被引量：1
8秦玉平,王秀坤,艾青,刘卫江.多主题文本分类的实现算法[J].计算机工程,2008,34(2):190-192. 被引量：5
9李旭芳,王士同.基于QPSO训练支持向量机的网络入侵检测[J].计算机工程与设计,2008,29(1):34-36. 被引量：10
10刘洋,张秋余.基于Huffman树的模糊多类支持向量机[J].辽宁工程技术大学学报（自然科学版）,2008,27(1):96-99. 被引量：3

同被引文献45

1张翔,肖小玲,徐光祐.基于样本之间紧密度的模糊支持向量机方法[J].软件学报,2006,17(5):951-958. 被引量：84
2汪廷华,田盛丰,黄厚宽.特征加权支持向量机[J].电子与信息学报,2009,31(3):514-518. 被引量：56
3胡昌华,司小胜,周志杰,王鹏.新的证据冲突衡量标准下的D-S改进算法[J].电子学报,2009,37(7):1578-1583. 被引量：78
4丁胜锋,孙劲光.基于混合模糊隶属度的模糊双支持向量机研究[J].计算机应用研究,2013,30(2):432-435. 被引量：15
5李凯,李娜,卢霄霞.一种模糊加权的孪生支持向量机算法[J].计算机工程与应用,2013,49(4):162-165. 被引量：7
6张宁,蔡金锭.基于层次分析和逼近理想解法的绝缘状态评估[J].仪器仪表学报,2018,39(11):35-42. 被引量：10
7黄云程,蔡金锭.油纸绝缘系统回复电压函数建模及拓扑结构辨识[J].电力自动化设备,2016,36(3):149-153. 被引量：18
8刘开旻,吴小俊.一种基于新隶属度函数的模糊支持向量机[J].计算机工程,2016,42(4):155-159. 被引量：16
9宗鸣,龚永红,文国秋,程德波,朱永华.基于稀疏学习的kNN分类[J].广西师范大学学报（自然科学版）,2016,34(3):39-45. 被引量：8
10宋明娟,朱思宇.FKNN的新算法及其应用[J].模糊系统与数学,2016,30(4):89-93. 被引量：1

引证文献5

1Liangchen Chen,Shu Gao,Baoxu Liu,Zhigang Lu,Zhengwei Jiang.FEW-NNN: A Fuzzy Entropy Weighted Natural Nearest Neighbor Method for Flow-Based Network Traffic Attack Detection[J].China Communications,2020,17(5):151-167. 被引量：7
2孙聪慧,姜合,相益萱.非独立同分布下数值型数据的KNN算法改进[J].计算机工程与设计,2021,42(10):2816-2822. 被引量：2
3邹阳,俞豪奕,金涛.融合模糊K近邻及证据理论的变压器油纸绝缘状态评估方法[J].电力系统保护与控制,2023,51(14):55-63. 被引量：10
4陈小宇,阳梦雪,李常对,赵鹏程.激光点云线性KNN算法FPGA实现及加速[J].应用科学学报,2023,41(5):831-839. 被引量：1
5吕思雨,赵嘉,吴烈阳,张翼英,韩龙哲.基于特征加权混合隶属度的模糊孪生支持向量机[J].南昌工程学院学报,2024,43(1):93-101. 被引量：1

二级引证文献21

1马小林,侯庆丰.甘肃省土地生态安全空间差异评价[J].国土与自然资源研究,2020(6):37-41. 被引量：5
2郭世泽,王小娟,何明枢,任传伦,俞赛赛.网络空间对抗防御中的智能监测技术研究[J].信息安全与通信保密,2021(11):79-94. 被引量：4
3孙兴龙,李亚雄,刘新学.基于体系价值的多层交通网络打击目标优选[J].火力与指挥控制,2022,47(1):31-37. 被引量：1
4任明远,蒋紫微,姜明军,宋玉峰,彭晶,李帅兵.基于正态云模型和模糊熵权法的综合能源服务成效评价[J].电气应用,2022,41(2):75-81. 被引量：4
5Jielun Zhang,Fuhao Li,Feng Ye.Network Traffic Clustering with QoS-Awareness[J].China Communications,2022,19(3):202-214.
6刘利,张德生,肖燕婷.基于隶属度的模糊加权k近质心近邻算法[J].计算机工程,2022,48(7):122-129. 被引量：2
7殷理杰,张文初,魏丽君.一种周期信号波形识别及参数测量装置的设计[J].工业仪表与自动化装置,2022(4):28-32. 被引量：4
8邹阳,林锦茄,李安娜,张云霄.基于灰色关联分析和聚类云模型的变压器油纸绝缘状态评估[J].电力系统保护与控制,2023,51(21):35-43. 被引量：9
9张韶华,何玉鹏,李超,谢亚雷,陈元毅,张源.“化工-电网”耦合事故的情景推演及联动研究[J].化工安全与环境,2024,37(1):83-88.
10邓昭宏,赵春明,冷俊,翟冠强,王昕.基于IWOA-BP算法的变压器绝缘老化评估方法[J].电力科学与技术学报,2023,38(5):253-261.

1郇益斌,王丽君.基于训练集聚类的加权KNN算法研究[J].信息通信,2017,30(2):16-17. 被引量：2
2孙晓玲,朱家明,贺晓剑,殷德香.基于K-MEANS聚类算法对众包任务定价的计量分析[J].赤峰学院学报（自然科学版）,2018,34(4):67-70. 被引量：1
3戴意瑜,陈江.基于IVHFWHM算法的项目投资评估模型[J].福建师范大学学报（自然科学版）,2018,34(3):21-28.
4胡剑锋,王涛涛.基于脑电信号模糊熵的驾驶疲劳检测分析[J].中国安全科学学报,2018,28(4):13-18. 被引量：8
5史露娜,兰蓉.基于模糊隶属度中值的阈值分割算法[J].现代电子技术,2018,41(11):40-45. 被引量：10
6彭云聪,任心晴,石浩森.基于核加权KNN和多目标优化的众包平台定价系统设计[J].软件,2018,39(6):150-154. 被引量：2
7陶杰,王欣,孙慧贤,尹文龙.一种窄带高斯白噪声的生成与实现方法[J].通讯世界,2017,23(23):350-351. 被引量：2
8吴园园,申立勇.基于类重叠度欠采样的不平衡模糊多类支持向量机[J].中国科学院大学学报（中英文）,2018,35(4):536-543. 被引量：27
9陈功贵,易兴庭,刘耀,郭艳艳.基于改进萤火虫算法的多目标优化潮流仿真研究[J].实验技术与管理,2018,35(7):124-128. 被引量：1
10施明华,肖庆宪.直觉模糊幂Heronian平均算子及其在多属性决策中的应用[J].系统工程理论与实践,2018,38(4):971-982. 被引量：16

应用科学学报

2018年第4期

浏览历史

内容加载中请稍等...

基于紧密度的模糊加权kNN数据分类方法被引量：5

参考文献8

二级参考文献80

共引文献158

同被引文献45

引证文献5

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于紧密度的模糊加权kNN数据分类方法 被引量：5

参考文献8

二级参考文献80

共引文献158

同被引文献45

引证文献5

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于紧密度的模糊加权kNN数据分类方法被引量：5