-
题名融合词信息与自注意力的教育命名实体识别
- 1
-
-
作者
郑守民
申艳光
-
机构
河北工程大学信息与电气工程学院
-
出处
《软件导刊》
2024年第9期105-109,共5页
-
文摘
为解决教育领域命名实体识别任务精度较低和语料严重不足的问题,提出一种融合词信息与自注意力的命名实体识别模型WBBAC。该模型利用BERT预训练语言模型增强字向量的语义表示并为字向量引入词频信息,将字向量与词向量拼接作为双向长短期记忆网络的输入,经过自注意力层进一步寻找序列内部的联系,最后通过CRF解码获得最优序列。根据课程文本特点创建计算机组成原理数据集并进行标注,在Resume数据集和计算机组成原理数据集上进行实验,WBBAC模型的F1值分别为95.65%和73.94%。实验结果表明,与基线模型相比,WBBAC模型具有更高的F1值,有效解决了教育领域命名实体识别任务中标注数据不足的问题。
-
关键词
命名实体识别
词信息
自注意力机制
教育领域
BERT
-
Keywords
named entity recognition
word information
self-attention mechanism
education domain
BERT
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-