摘要
提出了一种增加转折词后实体词注意力权重的短文本分类方法,旨在提高短文本分类的准确性和可靠性。所提出的方法结合了文本构图和图卷积网络技术,通过将文本数据转换为图形结构,利用图卷积神经网络对图形结构进行特征提取和模式识别,以捕捉文本数据的内在结构和语义关系。在训练过程中,使用转折词和置信度高的实体词作为关键信息,通过注意力机制强化这些信息在分类中的作用。通过多次循环训练,得到了一个高效的文本分类模型。实验结果表明,所提出的模型在短文本分类任务中具有较好的性能表现,能够有效提高分类的准确性和可靠性。为了验证模型的性能和泛化能力,选取了三个公开的短文本数据集Ohsumed、AGNews和MR数据集以及一个公开的短语音数据集MELD数据集。这些数据集具有不同的主题和领域,可以更好地评估模型的泛化能力。实验结果表明,所提出的模型在四个数据集上都取得了优于基线的分类效果,证明了模型的有效性和泛化能力。
作者
徐克圣
毛寅辉
陈胜男
XU Kesheng;MAO Yinhui;CHEN Shengnan
出处
《信息技术与信息化》
2024年第5期31-35,共5页
Information Technology and Informatization
基金
国产化公链基础软件研发与产业化(2022JH2/101300269)。