对于生鲜蛋供应链知识图谱构建过程中供应链领域实体名称多样、特征信息提取不充分的问题,提出了一种基于BERT-CRF模型(Bidirectional encoder representations from transformers-conditional random field)的命名实体识别方法。该方...对于生鲜蛋供应链知识图谱构建过程中供应链领域实体名称多样、特征信息提取不充分的问题,提出了一种基于BERT-CRF模型(Bidirectional encoder representations from transformers-conditional random field)的命名实体识别方法。该方法使用BIO(Begin、Internal、Other)标记规则进行序列标注,以字向量和位置向量作为输入,通过BERT预训练模型提取输入序列全局特征,并在模型的末端添加CRF层引入硬约束,构建适合生鲜蛋供应链领域命名实体识别的模型框架。所提出的模型与其他3种命名实体识别模型在自建数据集上进行了对比实验,该数据集包含12810条文本语料数据,5大类21个小类。实验结果表明,本文模型取得了很好的结果,准确率、召回率和F1值分别达到91.82%、90.44%、91.01%,验证了本文模型优于其他3种模型。最后本文模型使用自建的食品领域菜谱数据集进行实验,结果表明模型具有一定的泛化能力。展开更多
文摘对于生鲜蛋供应链知识图谱构建过程中供应链领域实体名称多样、特征信息提取不充分的问题,提出了一种基于BERT-CRF模型(Bidirectional encoder representations from transformers-conditional random field)的命名实体识别方法。该方法使用BIO(Begin、Internal、Other)标记规则进行序列标注,以字向量和位置向量作为输入,通过BERT预训练模型提取输入序列全局特征,并在模型的末端添加CRF层引入硬约束,构建适合生鲜蛋供应链领域命名实体识别的模型框架。所提出的模型与其他3种命名实体识别模型在自建数据集上进行了对比实验,该数据集包含12810条文本语料数据,5大类21个小类。实验结果表明,本文模型取得了很好的结果,准确率、召回率和F1值分别达到91.82%、90.44%、91.01%,验证了本文模型优于其他3种模型。最后本文模型使用自建的食品领域菜谱数据集进行实验,结果表明模型具有一定的泛化能力。