基于去偏对比学习的多模态命名实体识别

Debiased Contrastive Learning for Multimodal Named Entity Recognition

下载PDF

导出

摘要命名实体识别作为信息抽取的关键环节,在自然语言处理领域有着广泛应用。随着互联网上多模态信息的不断涌现,研究发现视觉信息有助于文本实现更加准确的命名实体识别。现有工作通常将图像视为视觉对象的集合,试图将图像中的视觉对象与文本中的实体显式对齐。然而,当二者在数量或语义上不一致时,这些方法往往不能很好地应对模态偏差,从而难以实现图像和文本之间的准确语义对齐。针对此问题,该文提出了一种基于去偏对比学习的多模态命名实体识别方法(DebiasCL),利用视觉对象密度指导视觉语境丰富的图文作为扩充样本,通过去偏对比学习优化图文共享的潜在语义空间学习,实现图像与文本间的隐式对齐。在Twitter-2015和Twitter-2017上进行实验,DebiasCL的F1值分别达到75.04%和86.51%,在“PER.”和“MISC.”类别数据中F1分别提升了5.23%和5.2%。实验结果表明,该方法可以有效缓解模态偏差,从而提升多模态命名实体识别系统性能。 Recent studies show that visual information can help text achieve more accurate named entity recognition.However,most of the exiting work treats an image as a collection of visual objects and attempts to explicitly align visual objects with entities in text,fails to cope with modal bias well when visual objects and the entities are quantitatively and semantically inconsistent.To deal with this problem,we propose a debiased contrastive learning approach(DebiasCL)for multimodal named entity recognition.We utilize the visual objects density to guide visual context-rich sample mining,which enhances debiased contrastive learning to achieve better implicit alignment by optimizing the latent semantic space learning between visual and textual representations.Empirical results shows that the DebiasCL achieves a F1-value of 75.04%and 86.51%,with 5.23%and 5.2%increased on"PER"and"MISC"entity type data in Twitter-2015 and Twitter-2017,respectively.

作者张鑫袁景凌李琳刘佳 ZHANG Xin;YUAN Jingling;LI Lin;LIU Jia(School of Computer Science and Artificial Intelligence,Wuhan University of Technology,Wuhan,Hubei 430070,China;Engineering Research Center of Digital Publishing Intelligent Service Technology,Ministry of Education,Wuhan,Hubei 430070,China;Wuhan Library,Chinese Academy of Sciences,Wuhan,Hubei 430071,China;Hubei Key Laboratory of Big Data in Science and Technology,Wuhan,Hubei 430071,China)

机构地区武汉理工大学计算机与人工智能学院数字出版智能服务技术教育部工程研究中心中国科学院武汉文献情报中心科技大数据湖北省重点实验室

出处《中文信息学报》 CSCD 北大核心 2023年第11期49-59,共11页 Journal of Chinese Information Processing

基金科技大数据湖北省重点实验室(中国科学院武汉文献情报中心)开放基金课题资助项目(20211h0437) 湖北重点研发计划项目(2021BAA030) 湖北省制造业高质量发展项目(2206-420118-89-04-959008)。

关键词多模态命名实体识别对比学习模态对齐 multimodal named entity recognition contrastive learning modal alignment

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1李春楠,王雷,孙媛媛,林鸿飞.基于BERT的盗窃罪法律文书命名实体识别方法[J].中文信息学报,2021,35(8):73-81. 被引量：19
2郭力华,李旸,王素格,陈鑫,符玉杰,裴文生.基于匹配策略和社区注意力机制的法律文书命名实体识别[J].中文信息学报,2022,36(2):85-92. 被引量：11

二级参考文献9

1李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：53
2郭喜跃,何婷婷.信息抽取研究综述[J].计算机科学,2015,42(2):14-17. 被引量：83
3李丽双,郭元凯.基于CNN-BLSTM-CRF模型的生物医学命名实体识别[J].中文信息学报,2018,32(1):116-122. 被引量：121
4王路路,艾山.吾买尔,吐尔根.依布拉音,买合木提.买买提,卡哈尔江.阿比的热西提.基于深度神经网络的维吾尔文命名实体识别研究[J].中文信息学报,2019,33(3):64-70. 被引量：10
5赵浩新,俞敬松,林杰.基于笔画中文字向量模型设计与研究[J].中文信息学报,2019,33(5):17-23. 被引量：13
6王子牛,姜猛,高建瓴,陈娅先.基于BERT的中文命名实体识别方法[J].计算机科学,2019,46(S11):138-142. 被引量：89
7王月,王孟轩,张胜,杜渂.基于BERT的警情文本命名实体识别[J].计算机应用,2020,40(2):535-540. 被引量：42
8尹学振,赵慧,赵俊保,姚婉薇,黄泽林.多神经网络协作的军事领域命名实体识别[J].清华大学学报（自然科学版）,2020,60(8):648-655. 被引量：32
9王得贤,王素格,裴文生,李德玉.基于JCWA-DLSTM的法律文书命名实体识别方法[J].中文信息学报,2020,34(10):51-58. 被引量：12

共引文献22

1孙红,王哲.多粒度融合的命名实体识别[J].中文信息学报,2023,37(3):123-134.
2于淼,陆娇,管政翔,陈柳娅.人工智能在司法量刑中的应用沿革与技术演进[J].西北工业大学学报（社会科学版）,2021,41(3):88-95.
3周瀚章.基于BERT的上下文感知分类研究[J].长江信息通信,2021,34(11):72-74.
4王燕玲.论命名实体识别技术在司法大数据中的适用[J].政法论坛,2022,40(5):40-52. 被引量：5
5张龙豪,邬雯,朱宵月.面向心血管疾病的实体识别算法研究[J].福建电脑,2022,38(12):1-7.
6王颖洁,张程烨,白凤波,汪祖民,季长清.中文命名实体识别研究综述[J].计算机科学与探索,2023,17(2):324-341. 被引量：21
7陈观林,程钊,邹凌,杨武剑,李甜.基于BERT的危险化学品命名实体识别模型[J].广西科学,2023,30(1):43-51.
8毛亮,赵林均,余敦辉,孙斌.基于知识蒸馏的企业命名实体识别模型[J].计算机工程,2023,49(5):90-96.
9庄云行,季铎,马尧,敬少杰.基于Bi-LSTM的涉恐类案件法律文书的命名实体识别研究[J].网络安全技术与应用,2023(7):36-39. 被引量：1
10雷松泽,刘博,王瑜菲,单奥奎.结合多特征嵌入和多网络融合的中文医疗命名实体识别[J].电子与信息学报,2023,45(8):3032-3039. 被引量：2

1张彩霞,周泰冰,接琳琳,卢强,于海,吴君.补肾益智方对SAMP8小鼠海马α-Syn和PSD-95表达的影响[J].中国老年学杂志,2024,44(2):422-429.
2陈佳,张鸿.基于特征增强和语义相关性匹配的图像文本检索方法[J].计算机应用,2024,44(1):16-23. 被引量：1
3黄敏璇.社交媒体时代下“千禧一代”政治认知的中美比较[J].中国青年研究,2024(2):45-57.
4Peng Gao,Rule Deng,Song Jia,Yue Li,Xuefei Wang,Qian Xing.Effects of combustion temperature on the optical properties of brown carbon from biomass burning[J].Journal of Environmental Sciences,2024(3):302-309.

中文信息学报

2023年第11期

浏览历史

内容加载中请稍等...

基于去偏对比学习的多模态命名实体识别

参考文献2

二级参考文献9

共引文献22

相关作者

相关机构

相关主题

浏览历史