基于标签信息融合与多任务学习的中文命名实体识别

Chinese Named Entity Recognition Based on Label Information Fusion and Multi-task Learning

下载PDF

导出

摘要随着中文命名实体识别研究的不断深入,大多数模型关注融入词汇或字形信息来丰富特征表示,但是却忽略了标签信息。因此文中提出了一种融合标签信息的中文命名实体识别模型。首先,通过预训练模型BERT-wwm得到字符的嵌入表示,并将标签向量化,使用Transformer解码器结构将字符表示与标签表示进行交互学习,捕捉字符与标签的相互依赖关系,丰富字符的特征表示。为了促进标签信息的学习,构建了基于文本句的监督信号,增加了多标签文本分类任务,采用多任务学习的方式进行训练。其中,命名实体识别任务采用条件随机场进行解码预测,多标签文本分类任务采用双仿射机制进行解码预测,两任务共享除解码层以外的所有参数,保证了不同的监督信息反馈到每个子任务。在公开数据集MSRA,Weibo和Resume上进行了多组对比实验,分别获得了95.75%,72.17%,96.23%的F1值。与多个基准模型相比,所提模型的实验效果有一定的提升,证明了该模型的有效性与可行性。 With the development of Chinese named entity recognition research,most models focus on enriching feature representation by integrating vocabulary or glyph information but ignore label information.Therefore,a Chinese named entity recognition model integrating label information is proposed in this paper.Firstly,the embedding representation of characters is obtained by pre-trained model BERT-wwm,and labels are represented as vectors.The character representation and label representation are interactively learned by using the Transformer decoder structure to capture the interdependence between characters and labels and enrich the feature representation of characters.To promote the learning of label information,a supervision signal based on text sentences is constructed,multi-label text classification tasks are added,and multi-task learning is used for training.Among them,the named entity recognition task uses a conditional random field for decoding and prediction,and the multi-label text classification task uses a biaffine mechanism for decoding and prediction.The two tasks share all parameters except the decoding layer,which ensures that different supervision information is fed back to each subtask.Several groups of comparative experiments are carried out on the public data sets MSRA,Weibo,and Resume,and the F1 values of 95.75%,72.17%,and 96.23%are obtained respectively.Compared with several benchmark models,experimental result of the proposed model is improved to some extent,which validates its effectiveness and feasibility.

作者廖梦贾真李天瑞 LIAO Meng;JIA Zhen;LI Tianrui(School of Computing and Artificial Intelligence,Southwest Jiaotong University,Chengdu 611756,China;Manufacturing Industry Chains Collaboration and Information Support Technology Key Laboratory of Sichuan Province,Chengdu 611756,China;National Engineering Laboratory of Integrated Transportation Big Data Application Technology,Chengdu 611756,China)

机构地区西南交通大学计算机与人工智能学院四川省制造业产业链协同与信息化支撑技术重点实验室综合交通大数据应用技术国家工程实验室

出处《计算机科学》 CSCD 北大核心 2024年第3期198-204,共7页 Computer Science

基金国家自然科学基金面上项目(62176221)。

关键词命名实体识别标签信息注意力机制双仿射机制预训练模型 Named entity recognition Label information Attention mechanism Biaffine mechanism Pre-trained model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1刘宇瀚,刘常健,徐睿峰,骆旺达,陈奕,吉忠晟,应能涛.结合字形特征与迭代学习的金融领域命名实体识别[J].中文信息学报,2020,34(11):74-83. 被引量：15
2张栋,王铭涛,陈文亮.结合五笔字形与上下文相关字向量的命名实体识别[J].计算机工程,2021,47(3):94-101. 被引量：7

二级参考文献3

1李慧林,柴玉梅,孙穆祯.面向文本命名实体识别的深层网络模型[J].小型微型计算机系统,2019,40(1):50-57. 被引量：10
2陈钊,徐睿峰,桂林,陆勤.结合卷积神经网络和词语情感序列特征的中文情感分析[J].中文信息学报,2015,29(6):172-178. 被引量：49
3李雁群,何云琪,钱龙华,周国栋.基于维基百科的中文嵌套命名实体识别语料库自动构建[J].计算机工程,2018,44(11):76-82. 被引量：7

共引文献18

1杨雷,韦韩,龚尚文,赵莺菲.基于LSTM的桥梁养护文本数据的命名实体识别方法[J].公路交通科技,2023,40(S02):187-192.
2马腾,倪睿康,李艳茹,高书林,王彦冰,李馥妍,周子力.知识图谱在个性化教学中的应用研究[J].中阿科技论坛（中英文）,2021(2):177-180. 被引量：2
3陈德,宋华珠,张娟,周泓林.融合BERT和记忆网络的实体识别[J].计算机科学,2021,48(10):91-97. 被引量：5
4徐秋荣,朱鹏,罗轶凤,董启文.金融领域中文命名实体识别研究进展[J].华东师范大学学报（自然科学版）,2021(5):1-13. 被引量：3
5魏明飞,潘冀,陈志敏,梅小华,石会鹏.预训练模型下航天情报实体识别方法[J].华侨大学学报（自然科学版）,2021,42(6):831-837.
6江千军,桂前进,王磊,徐瑞翔,王京景,麦立,许水清.命名实体识别技术研究进展综述[J].电力信息与通信技术,2022,20(2):15-24. 被引量：11
7左亚尧,陈皓宇,陈致然,洪嘉伟,陈坤.融合多语义特征的命名实体识别方法[J].计算机应用,2022,42(7):2001-2008. 被引量：2
8史占堂,马玉鹏,赵凡,马博.基于CNN‐Head Transformer编码器的中文命名实体识别[J].计算机工程,2022,48(10):73-80. 被引量：6
9杨宇,马甲林,冯海,许林杰,谢乾.基于改进图注意力网络的医疗领域命名实体识别[J].江苏海洋大学学报（自然科学版）,2023,32(1):9-17.
10蒋丽媛,吴亚东,王书航,张巍瀚,李懿.融合笔画特征的命名实体识别方法[J].科学技术与工程,2023,23(17):7436-7443. 被引量：2

1刘威,马磊,李凯,李蓉.基于多粒度字形增强的中文医学命名实体识别[J].计算机工程,2024,50(2):337-344. 被引量：1
2李大岭,张浩军,王家慧,李世龙.基于深度学习的网络安全命名实体识别方法[J].无线电工程,2024,54(3):644-652. 被引量：1
3罗锦锋,袁冬莉,张蓝,屈耀红,宿世鸿.基于多视图传播的无监督三维重建方法[J].西北工业大学学报,2024,42(1):129-137.
4李佳.超声斑点追踪技术用于老年高血压患者早期心功能损伤诊断的价值[J].中国实用医刊,2023,50(7):102-104. 被引量：1
5黄巧玲,郑伯川,丁梓成,吴泽东.融合监督注意力模块和跨阶段特征融合的图像修复改进网络[J].计算机应用,2024,44(2):572-579.
6赵红磊,唐焕玲,张玉,孙雪源,鲁明羽.k-best维特比解耦合知识蒸馏的命名实体识别模型[J].计算机科学与探索,2024,18(3):780-794.
7杨吉斌,黄翔,张雄伟,张强,梅鹏程.采用多视角注意力的声音事件定位与检测[J].信号处理,2024,40(2):385-395.
8蔺广逢,吴娜,贺梦兰,张二虎,孙强.基于汉字拆分嵌入和二部图的残损碑文识别[J].电子与信息学报,2024,46(2):564-573.
9陈莉.多主体协同开发社区教育课程的PERSONAL模式探索——基于“我爱我家”的个案研究[J].继续教育研究,2024(3):40-47.

计算机科学

2024年第3期

浏览历史

内容加载中请稍等...

基于标签信息融合与多任务学习的中文命名实体识别

参考文献2

二级参考文献3

共引文献18

相关作者

相关机构

相关主题

浏览历史