基于特征熵相关度差异的KNN算法被引量：5

KNN Algorithm Based on Feature Entropy Correlation Difference

下载PDF

导出

摘要传统K最近邻(KNN)法在进行样本分类时容易产生无法判断或判断错误的问题。为此,将特征熵与KNN相结合,提出一种新的分类算法(FECD-KNN)。该算法采用熵作为类相关度,以其差异值计算样本距离。用熵理论规约分类相关度,并根据相关度间的差异值衡量特征对分类的影响程度,从而建立距离测度与类别间的内在联系。仿真实验结果表明,与KNN及Entropy-KNN法相比,FECD-KNN在保持效率的情况下,能够提高分类准确性。 The paper ameliorates the method that combined K-Nearest Neighbor（KNN） with entropy,a new improved algorithm that adopting entropy as correlation and taking differences values to calculate distance is proposed,which calls FECD-KNN,based on the research that KNN tested sample in misjudgment and error easily.The impacted algorithm combines information entropy theory used to statute correlation,measures strength of impact on the classification according to difference of correlation,and establishes the intrinsic relation between the distance and class.The contrast simulation experiment shows that,compared with KNN and Entropy-KNN,the impacted algorithm adopting the degree of correlation to optimize distance raised the rate of accuracy enormously in classification,meanwhile it also maintains efficiency of classification.

作者周靖刘晋胜

机构地区广东石油化工学院计算机与电子信息学院

出处《计算机工程》 CAS CSCD 北大核心 2011年第17期146-148,共3页 Computer Engineering

关键词 K最近邻算法熵相关度差异 K-Nearest Neighbor（KNN） algorithm entropy correlation difference

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1Chin K K. Support Vector Machines Applied to Speech Pattem Classification[D]. Cambridge, UK: Cambridge University, 1998.
2Klaus R M, Sebastian M, Gunnar R, et al. An Introduction to Kernel-based Learning Algorithms[J]. IEEE Transactions on Neural Networks, 2001, 12(2): 181-201.
3Wu Xindong, Kumar V, Quinlan J R, et al. Top 10 Algorithms in Data Mining[J]. Knowledge and Information Systems, 2008, 14(1): 1-37.
4王洪彬,刘晓洁.基于KNN的不良文本过滤方法[J].计算机工程,2009,35(24):69-71. 被引量：7

二级参考文献8

1李莹,张晓辉,王华勇,常桂然.一种应用向量聚合技术的KNN中文文本分类方法[J].小型微型计算机系统,2004,25(6):993-996. 被引量：13
2王秀娟,郭军,郑康锋.文本分类中一种新的特征选择方法[J].计算机应用,2005,25(3):661-663. 被引量：15
3李强,李建华.基于向量空间模型的过滤不良文本方法[J].计算机工程,2006,32(10):4-5. 被引量：14
4杨丽华,戴齐,郭艳军.KNN文本分类算法研究[J].微计算机信息,2006,22(07X):269-270. 被引量：24
5Hanani U, Shapira B, Shoval E Information Filtering: Overview of Issues, Research and Systems[J]. User Modeling and User-adapted Interaction, 2001, 11(3): 203-259.
6He Ji, Tan Ah-Hwee, Tan Chew-Lim. A Comparative Study on Chinese Text Categorization Methods[C]//Proc. of the International Workshop on Text and Web Mining. Melbourne, Australia: [s. n.], 2000: 24-35.
7Kuncheva L I. Fitness Functions in Editing KNN Reference Set by Genetic Algorithms[J]. Pattern Recognition, 1997, 30(6): 1041- 1049.
8Wang Yu, Wang Zhengou. A Fast KNN Algorithm for Text Categorization[C]//Proc, of the 6th International Conference on Machine Learning and Cybernetics. Hong Kong, China: [s. n.], 2007:3436-3441.

共引文献6

1王辉,张成锁,卓呈祥.一种改进的相对熵特征选择方法[J].计算机工程,2011,37(10):167-169. 被引量：1
2张倩,丁友东,蓝建梁,涂意.基于ASM和K近邻算法的人脸脸型分类[J].计算机工程,2011,37(11):212-214. 被引量：6
3苟和平,景永霞,冯百明,李勇.一种基于粗糙集的改进KNN文本分类算法[J].科学技术与工程,2012,20(20):4926-4929. 被引量：3
4苟和平,景永霞,冯百明,李勇.基于DBSCAN聚类的改进KNN文本分类算法[J].科学技术与工程,2013,21(1):219-222. 被引量：5
5孙建旺,吕学强,郭跇秀.基于微博转发集的微博过滤研究[J].北京信息科技大学学报（自然科学版）,2013,28(3):27-33. 被引量：3
6刘双成,蔡晓东,张力,毕伟伟,梁建勇.基于主动形状模型和K近邻算法的人脸脸型分类[J].桂林电子科技大学学报,2014,34(6):479-483. 被引量：3

同被引文献34

1强保华,吴中福,余建桥,陈凌,吴开贵.基于属性信息熵的实体匹配方法研究[J].计算机工程,2005,31(21):31-33. 被引量：5
2杨立,左春,王裕国.基于语义距离的K-最近邻分类方法[J].软件学报,2005,16(12):2054-2062. 被引量：31
3王煜,王正欧,白石.用于文本分类的改进KNN算法[J].中文信息学报,2007,21(3):76-82. 被引量：15
4HanJiawei MichelineKamber.数据挖掘概念与技术[M].北京:机械工业出版社,2004..
5Cover T M, Hart P E, Nearest neighbor pattern classification [J]. IEEE Transaction on Information Theory, 1967, 13 (1) : 21-27.
6Wu X, Kumar V, Quinlan J R, et al. Top 10 algorithms in data mining [J]. Knowledge and Information Systems, 2008, 14 (1): 1-37.
7Zhang Shichao. ShelFneighbor method ant its application in missing data imputation [J/OL]. Applied Intelligenc [2010-02-20] . http: // www. Springerlinlc com. Cntent/666244u6 72v617v/.
8ZHANG Shichao. Parimputation: From imputation and null- imputation to partially imputation [J]. IEEE Intelligent Infor- maticsBulletin, 2008, 9 (1): 32-38.
9Kira K, Rendell L. A practical approach to feature selection [C] //Proc of the 9th Machine Learning. Aberdeen: Morgan Kaufmann Pablishers, 1992: 249-256.
10Witten I H, Frank E. Data mining practical machine learning tools and techniques [M]. Beijing: China Machine Press, 2006.

引证文献5

1郑洁,秦永彬,许道云.基于Relief的特征加权壳近邻分类算法[J].计算机工程与设计,2013,34(3):951-954. 被引量：2
2肖辉辉,段艳明.基于属性值相关距离的KNN算法的改进研究[J].计算机科学,2013,40(11A):157-159. 被引量：28
3刘晋胜.基于熵降噪优化相似性距离的KNN算法研究[J].计算机应用与软件,2015,32(9):254-256. 被引量：4
4曹司磊,曾维贵,刘明刚.基于区域判别的抗质心式箔条干扰方法[J].兵工自动化,2017,36(6):70-74. 被引量：3
5刘娜,生龙.基于局部密度和相似度的自适应SNN算法[J].电脑知识与技术,2021,17(6):6-9. 被引量：1

二级引证文献36

1孙政,潘丰.基于密度的稀疏最小二乘支持向量机[J].江南大学学报（自然科学版）,2014,13(5):531-535.
2党宏社,白梅,张娜.基于ReliefF特征加权和KNN的自然图像分类方法[J].电视技术,2015,39(19):10-13. 被引量：2
3曾俊杰,王晓明,杨晓欢.基于局部保持的KNN算法[J].西华大学学报（自然科学版）,2015,34(6):58-63.
4黄成祥,杨毅恒.地质类比法计算未占用矿山可供价格[J].北京信息科技大学学报（自然科学版）,2016,31(1):58-62.
5曹赛男,张乾荣,刘斌,周仲礼.KNN改进算法在圈定地球化学元素异常区域上的应用[J].中国科技论文,2016,11(15):1782-1785. 被引量：1
6沙丽瓦尔.阿里木,努尔布力,吾守尔.斯拉木.改进的Re-FCBF算法在入侵检测中的应用[J].计算机工程与设计,2016,37(11):2956-2960. 被引量：2
7杨帅华,张清华.粗糙集近似集的KNN文本分类算法研究[J].小型微型计算机系统,2017,38(10):2192-2196. 被引量：20
8李诗语,王峰,曹彬,梅琪,肖飞.基于KNN算法的手写数字识别[J].电脑知识与技术,2017,13(9):175-177. 被引量：9
9包晓安,陈磊,万微祥,张俊为,桂江生.基于局部稀疏表示的模板匹配跟踪算法研究[J].浙江理工大学学报（自然科学版）,2018,39(1):82-89.
10路敦利,宁芊,臧军.基于BP神经网络决策的KNN改进算法[J].计算机应用,2017,37(A02):65-67. 被引量：19

1周靖,刘晋胜.一种采用类相关度优化距离的KNN算法[J].微计算机应用,2010,31(11):7-12. 被引量：15
2崔彩霞,王素格.基于类内频率的文本分类特征选择方法[J].计算机工程与设计,2007,28(17):4249-4251. 被引量：5
3苏毅娟,邓振云,程德波,宗鸣.大数据下的快速KNN分类算法[J].计算机应用研究,2016,33(4):1003-1006. 被引量：29
4钱方,孙涛,郭劲,王挺峰.基于小波变换的多尺度SSIM算法[J].液晶与显示,2015,30(2):317-325. 被引量：9
5李金力,刘文怡,彭旭峰.一种全加速传感器角速度的优化方法[J].弹箭与制导学报,2010,30(3):196-198.
6秦亚辉,何利力.基于分块后重叠K-means聚类的KNN分类算法[J].工业控制计算机,2017,30(2):103-104. 被引量：1
7职为梅,郭华平,张婷,范明.一种新的面向非平衡分类问题的特征变换方法[J].小型微型计算机系统,2015,36(5):1037-1041. 被引量：1
8林滨.K-Means聚类的多种距离计算方法的文本实验比较[J].福建工程学院学报,2016,14(1):80-85. 被引量：6
9戴越越,曹雪情,陈瑞,杨洁,曹雪虹.基于分类加权边信息的DVCS重建算法[J].计算机技术与发展,2017,27(5):87-91. 被引量：1
10周水庚,俞红奇,胡江滔,付辛,胡运发.基于相邻字对信息的中文文档分类研究[J].小型微型计算机系统,2001,22(4):462-466. 被引量：2

计算机工程

2011年第17期

浏览历史

内容加载中请稍等...

基于特征熵相关度差异的KNN算法被引量：5

参考文献4

二级参考文献8

共引文献6

同被引文献34

引证文献5

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

基于特征熵相关度差异的KNN算法 被引量：5

参考文献4

二级参考文献8

共引文献6

同被引文献34

引证文献5

二级引证文献36

相关作者

相关机构

相关主题

浏览历史

基于特征熵相关度差异的KNN算法被引量：5