摘要
国家电网公司PMS中积累了大量电力一次设备的运维工单文本数据,但难以有效利用。为此设计了一种基于BERT-BiLSTM-CRF模型的电力一次设备运维工单中文实体识别系统。首先,分析了工单的文本特点及分词难点,总结出七类实体并人工标注3452条工单,形成训练集。其次,利用相关设备的试验、故障分析报告对BERT模块进行预训练,以获得电力词向量。然后,利用BiLSTM模块对实体标签进行预测。最后,引入CRF模块优化预测标签。对1000份工单进行中文实体识别实验,结果表明该模型在电力一次设备运维工单文本中具有较高的识别能力。
出处
《电脑知识与技术》
2022年第31期7-10,共4页
Computer Knowledge and Technology
基金
国家自然科学基金项目(61673190)。