-
题名结合GNN的信息融合用于归纳式文本分类
被引量:2
- 1
-
-
作者
郑诚
倪显虎
张苏航
赵伊研
-
机构
安徽大学计算机科学与技术学院
计算智能与信号处理教育部重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2023年第6期1170-1176,共7页
-
文摘
最近,图神经网络(GNN)通过将文本数据转换为图形数据的方式,来捕捉单词之间的固有拓扑结构和依赖信息,在一些文本分类任务中取得了良好的结果.但是将文本构建成图后,很多基于图结构的文本分类模型面临着全局上下文语义信息和局部特征信息提取不充分的等问题.本文提出了一种将全局上下文语义信息与局部特征信息相融合的图神经网络模型.通过将文档表示为有向、加权的词共现网络,其中有向是为了捕获词排序问题,权重是为了突出单词之间的相互影响程度,利用门控循环单元(GRU)在建模长距离单词交互上的优势,来捕获全局上下文语义信息,接着利用注意力(attention)捕获关键的局部特征信息,最后使用平均池化和最大池化进一步提升了模型对关键特征信息的提取能力,从而丰富了文档节点的全局语义信息,增强了局部特征表达.通过在三个经典英文数据集上的实验结果表明,该模型相比于基线模型有较好的分类效果.
-
关键词
文本分类
图神经网络
门控循环单元
注意力
-
Keywords
text classification
graph neural network
gated circulation unit
attention
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-