CLGLF:置信学习引导标签融合的多模态命名实体识别方法

CLGLF:Confidence Learning Guides Label Fusion for Multimodal Named Entity Recognition Method

下载PDF

导出

摘要为解决多模态命名实体识别中存在的视觉语义理解和多模态语义的偏差问题,本文提出了置信学习引导标签融合的多模态命名实体识别方法 .该方法调用BLIP-2预训练模型生成图像描述,将其与输入的文本拼接,进行图文联合编码实现多模态特征融合,对多模态表征和文本表征解码后得到候选标签和文本标签;在采用KL散度损失函数对齐两组标签的基础上,计算置信分数用来评估多模态表征质量,设置置信阈值辅助筛选出有偏差的候选标签,并使用相应位置的文本标签替换有偏差的候选标签,实现标签的融合,最终完成多模态命名实体识别.为了验证本文方法,在Twitter-2015和Twitter-2017多模态数据集上进行实验,并将实验结果与MSB、UMT等7种主流方法进行对比,实验结果证明了本文方法的有效性. To solve the visual semantic understanding bias and multimodal semantic bias in multimodal named entity recognition,the confidence learning guides label fusion(CLGLF)method for multimodal named entity recognition is pro⁃posed.This method invokes the BLIP-2 pre-trained model to generate image captions,concatenates them with the input texts,and performs joint coding to achieve multimodal feature fusion.The candidate labels and text labels are obtained after decoding the multimodal representations and text representations.Based on using the KL divergence loss function to align the two groups of labels,the confidence score is calculated to evaluate the quality of the multimodal representation,and a confidence threshold is set to help screen out the biased candidate labels,the text labels in the corresponding positions are used to replace the biased candidate labels,to achieve the label fusion,and finally complete the multimodal named entity recognition.In order to verify the proposed method,experiments are carried out on the Twitter-2015 and Twitter-2017 mul⁃timodal datasets,and the experimental results are compared with 7 mainstream methods,such as MSB and UMT.The exper⁃imental results show the effectiveness of the CLGLF.

作者王海荣王彤徐玺荆博祥陈芳萍 WANG Hai-rong;WANG Tong;XU Xi;JING Bo-xiang;CHEN Fang-ping(School of Computer Science and Engineering,North Minzu University,Yinchuan,Ningxia 750021,China;Laboratory of Image&Graphics Intelligent Processing of State Ethnic Affairs Commission,North Minzu University,Yinchuan,Ningxia 750021,China)

机构地区北方民族大学计算机科学与工程学院北方民族大学图像图形智能处理国家民委重点实验室

出处《电子学报》 EI CAS CSCD 北大核心 2024年第7期2429-2437,共9页 Acta Electronica Sinica

基金宁夏自然科学基金(No.2023AAC03316) 北方民族大学研究生创新项目(No.YCX23159)~~。

关键词多模态命名实体识别图像描述置信学习多模态语义偏差信息抽取 multimodal named entity recognition image caption confidence learning multimodal semantic bias in⁃formation extraction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1杜晋华,尹浩,冯嵩.中文电子病历命名实体识别的研究与进展[J].电子学报,2022,50(12):3030-3053. 被引量：13
2Yunhe PAN.On visual understanding[J].Frontiers of Information Technology & Electronic Engineering,2022,23(9):1287-1289. 被引量：3
3钟维幸,王海荣,王栋,车淼.多模态语义协同交互的图文联合命名实体识别方法[J].广西科学,2022,29(4):681-690. 被引量：4
4李晓腾,张盼盼,勾智楠,高凯.基于多任务学习的多模态命名实体识别方法[J].计算机工程,2023,49(4):114-119. 被引量：5
5张聿远,闫文君,张立民.基于多模态特征融合网络的空时分组码识别算法[J].电子学报,2023,51(2):489-498. 被引量：2

二级参考文献39

1付秀,陈麒麟,李杰,付毅,包国峰.基于智能预问诊的全景多学科会诊平台的设计与应用[J].中国数字医学,2021,16(10):79-82. 被引量：7
2王浩畅,李钰,赵铁军.面向生物医学命名实体识别的多Agent元学习框架[J].计算机学报,2010,33(7):1256-1262. 被引量：6
3杨锦锋,于秋滨,关毅,蒋志鹏.电子病历命名实体识别和实体关系抽取研究综述[J].自动化学报,2014,40(8):1537-1562. 被引量：126
4钟志农,刘方驰,吴烨,伍江江.主动学习与自学习的中文命名实体识别[J].国防科技大学学报,2014,36(4):82-88. 被引量：15
5曲春燕,关毅,杨锦锋,赵永杰,刘雅欣.中文电子病历命名实体标注语料库构建[J].高技术通讯,2015,25(2):143-150. 被引量：19
6闫文君,张立民,凌青,洪丹枫.基于高阶统计特征的空时分组码盲识别方法[J].电子与信息学报,2016,38(3):668-673. 被引量：7
7Ling Qing,Zhang Limin,Yan Wenjun,Kong Dongming.Hierarchical space–time block codes signals classification using higher order cumulants[J].Chinese Journal of Aeronautics,2016,29(3):754-762. 被引量：10
8杨锦锋,关毅,何彬,曲春燕,于秋滨,刘雅欣,赵永杰.中文电子病历命名实体和实体关系语料库构建[J].软件学报,2016,27(11):2725-2746. 被引量：105
9yu zhang,qiang yang.An overview of multi-task learning[J].National Science Review,2018,5(1):30-43. 被引量：56
10何云琪,刘苏文,钱龙华,周国栋.基于句法和语义特征的疾病名称识别[J].中国科学：信息科学,2018,48(11):1546-1557. 被引量：4

共引文献19

1刘安栋,彭琳,叶青,杜建强,程春雷,查青林.电子病历命名实体识别研究进展[J].计算机工程与应用,2023,59(21):39-51. 被引量：3
2Jiajun ZHU,Yuxin YANG,Hai Ming WONG.Development and accuracy of artificial intelligence-generated prediction of facial changes in orthodontic treatment:a scoping review[J].Journal of Zhejiang University-Science B(Biomedicine & Biotechnology),2023,24(11):974-984. 被引量：1
3王海荣,徐玺,王彤,荆博祥.多模态命名实体识别方法研究进展[J].郑州大学学报（工学版）,2024,45(2):60-71. 被引量：1
4Yawei LUO,Yi YANG.Large language model and domain-specific model collaboration for smart education[J].Frontiers of Information Technology & Electronic Engineering,2024,25(3):333-341.
5凯比努尔·赛地艾合买提.基于预训练模型的医疗命名实体识别[J].移动信息,2024,46(3):209-212.
6黄康洲,周刚,范永胜.一种基于联合预测的简历实体识别方法[J].人工智能科学与工程,2024(1):70-84.
7沈红,崔子禕,曾淑君,金小蕾,盛妤,朱思燕,张莹,吴佳倩.基于自然语言处理(NLP)的医学知识挖掘探索与实践[J].健康教育与健康促进,2024,19(2):155-157.
8李楠,王觅也,郑涛,李言生,江大鹏,黄勇.基于后结构化技术的临床病种库系统设计与应用[J].医疗卫生装备,2024,45(4):20-26.
9徐玺,王海荣,王彤,马赫.图文语义增强的多模态命名实体识别方法[J].计算机应用研究,2024,41(6):1679-1685.
10王正芳,张军亮,李小倩,于月,陈慧媜.基于ERNIE-BiGRU-Attention-CRF的电子病历命名实体识别方法[J].医学信息学杂志,2024,45(5):76-82.

1王国辉,陈健美.基于超分辨率重建的低分辨率人脸检测算法[J].计算机与数字工程,2024,52(2):315-320.
2胡爱兰,覃永松.改进自适应加权的海面目标距离测量和跟踪[J].电子技术应用,2024,50(7):20-28.
3Shijie LIU,Tianyu PAN,Qiushi LI.A numerical simulation strategy for a compressor’s underlying axisymmetric characteristic and its application in body force model[J].Chinese Journal of Aeronautics,2024,37(8):79-90.
4孟浩.一种基于RS-485传输的低功耗节点模块设计[J].电脑编程技巧与维护,2024(8):28-31.
5罗静红,李志,罗芳耀,肖仁杰,唐月明,常伟,李菊,苗明军,杨亮,高佳.四川地区8个大蒜品种蒜薹采后品质分析与评价[J].甘肃农业大学学报,2024,59(4):146-153.
6李凤.数字经济背景下民族村寨旅游发展商业化困境及策略探析[J].电子商务评论,2024,13(3):6532-6538.

电子学报

2024年第7期

浏览历史

内容加载中请稍等...

CLGLF:置信学习引导标签融合的多模态命名实体识别方法

参考文献5

二级参考文献39

共引文献19

相关作者

相关机构

相关主题

浏览历史