摘要
基于稀疏表示方法的文本分类强调使用训练样本特征的全局结构对测试样本进行稀疏表示,而对文本特征的局部邻域结构和文档之间相似性缺乏考虑,导致文本分类准确率低和高耗时。为了解决上述问题,本研究以最近邻和最近特征子空间为基础,并建立局部邻域结构和距离加权机制,提出一种局部加权稀疏表示的文本分类算法,使文本语义信息表达更丰富、稀疏表示更具判别力。实验结果表明本文算法准确率高于基线算法2.4%~5%,运行速度提高1.35~2.8倍。
出处
《信息技术与信息化》
2023年第8期24-27,共4页
Information Technology and Informatization
基金
辽宁省教育厅科学研究经费项目(LG202024)。