-
题名基于检索器-鉴别器架构的电力地址匹配模型研究
- 1
-
-
作者
赵坚鹏
盛方
徐川子
陈奕
罗庆
陈聪
-
机构
国网杭州供电公司
-
出处
《电力大数据》
2023年第1期35-43,共9页
-
文摘
为解决电力地址库与外部地址库地址的匹配问题,保证电力地址准确性,实现电力系统与外部系统间数据信息共享互通,本文提出一种基于检索器-鉴别器架构的地址匹配模型。首先介绍地址匹配模型的详细结构,包括用于缩小地址检索范围的地址检索器和最终分辨地址是否匹配正确的地址鉴别器,其中地址检索器基于词频-逆文档频率算法构建,地址鉴别器基于中文预训练语言模型NEZHA构建。还提出了一种负样本训练方法提升地址鉴别器辨别效果。详细介绍了实验分析所使用的两个数据集。实验结果表明基于检索器-鉴别器架构的电力地址匹配模型能够准确从外部地址库中找出与电力地址匹配的地址,其中,地址鉴别器能够非常准确地从多个候选地址中找出准确匹配地址,其F1分数达0.99以上。
-
关键词
地址匹配
电力地址
词频-逆文档频率
中文预训练语言模型
负样本
-
Keywords
address matching
power address
term frequency-inverse document frequency
Chinese pre-training language model
negative sample
-
分类号
TM933
[电气工程—电力电子与电力传动]
-