摘要
针对破产文书领域文本中存在语义环境复杂、公司实体全称和简称交叉出现等问题。文章提出一种融合 BERT预训练语言模型的命名实体识别方法,利用 BERT 模型增强文本语义信息并根据上下文特征动态生成词向量,再将词向量序列输入双向长短期记忆神经网络进行双向编码,最后通过条件随机场获得每个字符所属标签类别,实现 5类实体标签的有效预测。实验结果表明,该算法模型在测试集上的准确率为 92.45%,F1 值达到了 93.85%, 验证了该模型的有效性。
出处
《移动信息》
2021年第8期176-177,共2页
MOBILE INFORMATION