-
题名融合标签信息的分层图注意力网络文本分类模型
被引量:2
- 1
-
-
作者
杨春霞
马文文
徐奔
韩煜
-
机构
南京信息工程大学自动化学院
江苏省大数据分析技术重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2023年第11期2018-2026,共9页
-
基金
国家自然科学基金(61273229)。
-
文摘
目前基于分层图注意力网络的单标签文本分类任务存在2方面不足:一是不能较好地对文本特征进行提取;二是很少有研究通过文本与标签之间的联系进一步凸显文本特征。针对这2个问题,提出一种融合标签信息的分层图注意力网络文本分类模型。该模型依据句子关键词与主题关联性构建邻接矩阵,然后使用词级图注意力网络获取句子的向量表示。该模型是以随机初始化的目标向量为基础,同时利用最大池化提取句子特定的目标向量,使得获取的句子向量具有更加明显的类别特征。在词级图注意力层之后使用句子级图注意力网络获取具有词权重信息的新文本表示,并通过池化层得到文本的特征信息。另一方面利用GloVe预训练词向量对所有文本标注的标签信息进行初始化向量表示,然后将其与文本的特征信息进行交互、融合,以减少原有特征损失,得到区别于不同文本的特征表示。在R52、R8、20NG、Ohsumed及MR 5个公开数据集上的实验结果表明,该模型的分类准确率明显优于其它主流基线模型的。
-
关键词
分层图注意力网络
单标签文本分类
邻接矩阵
标签信息
-
Keywords
hierarchical graph attention network
single label text classification
adjacency matrix
label information
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-