-
题名基于多模融合的Java领域命名实体识别
被引量:1
- 1
-
-
作者
李凯微
王佳英
单菁
-
机构
沈阳建筑大学
沈阳工业大学
-
出处
《计算机科学与应用》
2022年第12期2712-2724,共13页
-
文摘
命名实体识别是构建学科知识图谱的重要步骤。近年来,随着深度学习的发展,通用领域、医学等领域命名实体识别的性能得到了很大的提升。Java学科领域知识点繁杂,实体中英文掺杂,并且存在其特有的实体内部特征,因此通用模型在此领域实体识别准确率并不高、不能有效识别实体边界。提出改进的单模结构,在嵌入层融入词边界信息,引入了词性信息和Java领域实体识别的规则信息,以提高模型识别实体边界的准确率。编码层使用BiLSTM和IDCNN进行上下文信息提取,解码层使用CRF得到序列全局最优提取。其次,提出对多个异构单模结果进行融合互补的想法,以提高模型实体识别性能和模型的泛化能力。实验结果显示,基于自主构建的Java领域数据集,新的单模模型相比于主流模型实体识别F1值提高了约2个百分点。多模融合后的实体识别的性能也有明显的提升,表明模型在Java领域命名实体识别任务上有着更好的效果。
-
关键词
命名实体识别
多模融合
实体边界
BiLSTM
CRF
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-