-
题名基于深度序列匹配网络的短文本实体链接算法
- 1
-
-
作者
王亚男
任佳星
庞宇航
刘琼
潘娟
刘伟
高凯强
-
机构
中国电力科学研究院有限公司
-
出处
《无线电工程》
北大核心
2023年第2期333-339,共7页
-
基金
电力CPS仿真输入数据处理技术研究(5242002000RX)。
-
文摘
获取大量电力领域文本数据后,由于网元链路业务命名规则不统一、业务人员表述差异等问题,会造成数据存在歧义、指代不明确等现象。为解决上述问题,提出一种基于深度序列匹配网络(Deep Sequential Matching Network, DSMN)的短文本实体链接算法,综合考虑实体指代项和候选实体间的内容和结构相似性,针对多源异构知识库实现高质量的消歧,支撑有效开展面向电力通信管理台帐以及网管数据的清洗校核工作。DSMN从多粒度对词进行全方位向量化表示,将实体指代项和句子中的每个词进行序列匹配,分别将候选实体与上层匹配结果进行序列匹配,通过卷积池化层提炼重要的匹配信息,通过动态平均算法计算实体指代项和候选实体之间的相似度。实验结果表明,DSMN在多个数据集上都展示了优异的实体链接能力。
-
关键词
实体链接
神经网络
深度序列匹配
实体指代项
命名实体
-
Keywords
entity linking
neural network
deep sequence matching
entity mention
named entity
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-