摘要
现有KNN文本分类方法未考虑语义信息导致特征向量维度庞大、分类效率低、准确率不高。提出一种特征增强的KNN文本分类方法 FE-KNN,构建领域框架库和领域句模,降低同义词对特征的影响,利用语义关系信息强化文本特征。在Math数学应用题语料库上的实验结果显示,该方法的准确率为0.953 2,与传统KNN方法相比精准率、召回率和F1值都有所提升,验证了通过框架语义与语义搭配能够改善文本分类的效果。
作者
余小鹏
王振佩
殷浩
徐健儿
YU Xiaopeng;WANG Zhenpei;YIN Hao;XU Jianer
出处
《信息技术与信息化》
2023年第9期17-20,共4页
Information Technology and Informatization
基金
2019年度教育部人文社会科学研究规划基金项目“基于问题情境仿真的数学应用题表征辅导系统研究”(编号:19YJA880077)研究成果之一。