-
题名基于异构图卷积网络的小样本短文本分类方法
被引量:11
- 1
-
-
作者
袁自勇
高曙
曹姣
陈良臣
-
机构
武汉理工大学计算机科学与技术学院
益阳医学高等专科学校图书馆网络信息中心
中国劳动关系学院应用技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第12期87-94,共8页
-
基金
国家自然科学基金(51679180)
中国劳动关系学院中央高校基本科研业务费专项资金项目(21ZYJS017)。
-
文摘
针对小样本短文本分类过程中出现的语义稀疏与过拟合问题,在异构图卷积网络中利用双重注意力机制学习不同相邻节点的重要性和不同节点类型对当前节点的重要性,构建小样本短文本分类模型HGCN-RN。利用BTM主题模型在短文本数据集中提取主题信息,构造一个集成实体和主题信息的短文本异构信息网络,用于解决短文本语义稀疏问题。在此基础上,构造基于随机去邻法和双重注意力机制的异构图卷积网络,提取短文本异构信息网络中的语义信息,同时利用随机去邻法进行数据增强,用于缓解过拟合问题。在3个短文本数据集上的实验结果表明,与LSTM、Text GCN、HGAT等基准模型相比,该模型在每个类别只有10个标记样本的情况下仍能达到最优性能。
-
关键词
小样本短文本分类
异构图卷积网络
短文本异构信息网络
BTM主题模型
过拟合
-
Keywords
few-shot short text classification
heterogeneous graph convolution network
heterogeneous information network for short text
BTM topic model
over fitting
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-