地区电网生产管理系统拥有大量的输变电设备缺陷记录文本,但是缺少系统化的利用和整理,可采用自然语言处理技术挖掘并分析缺陷记录文本。考虑电力系统领域专业分词方法,对缺陷记录文本中的句子进行文本预处理。利用word2vec模型将词语...地区电网生产管理系统拥有大量的输变电设备缺陷记录文本,但是缺少系统化的利用和整理,可采用自然语言处理技术挖掘并分析缺陷记录文本。考虑电力系统领域专业分词方法,对缺陷记录文本中的句子进行文本预处理。利用word2vec模型将词语映射到高维特征空间,形成分布式词向量。提出基于注意力机制的双向长短期记忆神经网络(BiLSTM based on attention mechanism,BiLSTM-Attention)对电力设备缺陷文本进行分类,并以准确率、混淆矩阵以及微平均F1值(F1Micro)作为评价指标与传统机器学习模型、深度学习模型进行对比。实例分析表明BiLSTM-Attention模型具有更好的分类效果,能够实现电力设备缺陷文本的自动精准高效分类。最后构建电力设备缺陷处理优先指数,以此提升输变电设备的智能化管理水平,促进自然语言处理技术在电网中的应用。展开更多
文摘地区电网生产管理系统拥有大量的输变电设备缺陷记录文本,但是缺少系统化的利用和整理,可采用自然语言处理技术挖掘并分析缺陷记录文本。考虑电力系统领域专业分词方法,对缺陷记录文本中的句子进行文本预处理。利用word2vec模型将词语映射到高维特征空间,形成分布式词向量。提出基于注意力机制的双向长短期记忆神经网络(BiLSTM based on attention mechanism,BiLSTM-Attention)对电力设备缺陷文本进行分类,并以准确率、混淆矩阵以及微平均F1值(F1Micro)作为评价指标与传统机器学习模型、深度学习模型进行对比。实例分析表明BiLSTM-Attention模型具有更好的分类效果,能够实现电力设备缺陷文本的自动精准高效分类。最后构建电力设备缺陷处理优先指数,以此提升输变电设备的智能化管理水平,促进自然语言处理技术在电网中的应用。