-
题名基于文本图神经网络的小样本文本分类技术研究
- 1
-
-
作者
安相成
刘保柱
甘精伟
-
机构
中国电子科技集团公司第五十四研究所
-
出处
《河北科技大学学报》
CAS
北大核心
2024年第1期52-58,共7页
-
基金
河北省智能化信息感知与处理重点实验室发展基金(SXX22138X002)
LZH联合QB数据融合与共享服务项目。
-
文摘
为了解决文本图神经网络小样本文本分类精度较差的问题,设计了基于文本图神经网络的原型网络,采用预训练语言模型,利用文本级图神经网络为每个输入文本构建图并共享全局参数,将文本图神经网络的结果作为原型网络的输入,对未标注文本进行分类,并验证新模型在多个文本分类数据集上的有效性。实验结果表明,与需要大量标注文档的监督学习方法相比,所采用的方法未标注文本的分类精度提高了1%~3%,在多个文本分类数据集上验证了新模型性能先进,内存占用更少。研究结果可为解决小样本文本分类问题提供参考。
-
关键词
自然语言处理
小样本文本分类
预训练模型
图神经网络
原型网络
-
Keywords
natural language processing
few-shot text classification
pre-trained model
graph neural network
prototype network
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种基于元学习的医疗文本分类模型
- 2
-
-
作者
赵楠
赵志桦
-
机构
海军军医大学第二附属医院信息中心
海角科技政策服务部
-
出处
《计算技术与自动化》
2022年第4期98-102,共5页
-
文摘
医疗文本专业术语复杂,垂直领域训练样本不足,传统的分类方法不能满足现实需求,提出一种基于元学习的小样本文本分类模型提高医疗文本分类效率。该模型基于迁移学习思想,加入注意力机制赋予句子中的词语不同的权重,利用两个相互竞争的神经网络分别扮演领域识别者和元知识生成者的角色,通过自适应性网络加强元学习对新数据集的适应性,最后使用岭回归获得数据集的分类。实验对比分析结果验证了该模型对一些公开文本数据集和医疗文本数据具有很好的分类效果。基于元学习的小样本文本分类模型可以成功地应用在医疗文本分类领域。
-
关键词
元学习
小样本文本分类
注意力机制
医疗数据
领域自适应
-
Keywords
meta-learning
few-shot text classification
attention mechanism
medical data
domain adaptation
-
分类号
O245
[理学—计算数学]
-