针对传统k最近邻(k-nearest neighbor,KNN)算法中需要设定k值的问题,文章提出一种基于信息熵的自适应k值KNN二分类算法(adaptive k-value KNN bisecting classification algorithm based on information entropy,EAKNN)。该算法通过引...针对传统k最近邻(k-nearest neighbor,KNN)算法中需要设定k值的问题,文章提出一种基于信息熵的自适应k值KNN二分类算法(adaptive k-value KNN bisecting classification algorithm based on information entropy,EAKNN)。该算法通过引入样本比例定义信息熵,加强小样本的重要性;通过计算小于预设熵阈值的最小信息熵,得到对应的k值和模型分数;在此基础上,结合提出的精度提升模型计算得到模型精度,不断迭代模型精度,直到模型精度最大化。实验结果表明,该算法提升模型精度明显,分类准确率高。展开更多
文摘针对传统k最近邻(k-nearest neighbor,KNN)算法中需要设定k值的问题,文章提出一种基于信息熵的自适应k值KNN二分类算法(adaptive k-value KNN bisecting classification algorithm based on information entropy,EAKNN)。该算法通过引入样本比例定义信息熵,加强小样本的重要性;通过计算小于预设熵阈值的最小信息熵,得到对应的k值和模型分数;在此基础上,结合提出的精度提升模型计算得到模型精度,不断迭代模型精度,直到模型精度最大化。实验结果表明,该算法提升模型精度明显,分类准确率高。