-
题名基于分层ERNIE模型的中文嵌套命名实体识别
被引量:1
- 1
-
-
作者
贾李睿智
刘胜全
刘源
魏富源
孔博
王光耀
-
机构
新疆大学信息科学与工程学院
-
出处
《东北师大学报(自然科学版)》
CAS
北大核心
2023年第1期97-103,共7页
-
基金
国家自然科学基金资助项目(61966034).
-
文摘
近年来中文嵌套命名实体识别的相关研究进展缓慢,BERT和RoBERTa等预训练模型在处理中文语言时,导致模型只能学习到不完整的语义表示.针对以上两个问题,首先使用现有的中文命名实体基准语料库ACE2004和ACE2005,依照原始语料的中心词和外延的关系自动构造嵌套命名实体;然后使用分层ERNIE模型在构建好的中文语料库上进行中文嵌套命实体识别的研究,相较于BERT等模型,ERNIE模型则是通过对中文实体语义单元的掩码,使得模型学习完整概念的语义表示.实验结果表明,分层ERNIE模型在ACE2004和ACE2005两个中文嵌套命名实体语料库上F1值分别为84.5%和85.9%,性能优于BERT和RoBERTa模型.
-
关键词
嵌套命名实体识别
中文嵌套实体语料库
ERNIE
预训练模型
-
Keywords
nested named entity recognition
Chinese nested entity corpus
ERNIE
Pre-trained model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-