-
题名基于对比学习的中文命名实体识别方法
被引量:1
- 1
-
-
作者
江洲钰
向露
亢晓勉
宗成庆
-
机构
中国科学院自动化研究所模式识别国家重点实验室
中国科学院大学人工智能学院
-
出处
《中文信息学报》
CSCD
北大核心
2023年第12期98-105,共8页
-
基金
国家自然科学基金(62106273)。
-
文摘
针对中文命名实体识别任务,基于字词图进行字词特征融合被证明是一类有效的性能提升方法。然而,在实际场景下,构建字词图所使用的外部词典与训练数据间在领域、表达方式等多方面存在不一致,导致引入的词与实体间存在不完全匹配问题。不完全匹配词指与实体间存在边界冲突或语义冲突的词,这些词会在模型识别实体边界与类型过程中引入噪声特征。针对此问题,该文提出了一种基于对比学习的中文命名实体识别方法,将冲突实例视为负例,并为边界冲突和语义冲突分别设计了对比学习模块。另外,该文提出了改进的折损InfoNCE函数,以提升语义对比模块区分相似标签的能力。实验表明,在四个中文命名实体识别公开数据集上,该文方法均达到了当前最优性能。
-
关键词
对比学习
命名实体识别
特征融合
-
Keywords
contrastive learning
named entity recognition
feature fusion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-