用于肺水肿量化的掩码图像-语言蒸馏模型

Masked Image-language Distillation Model for Pulmonary Edema Assessment

导出

摘要肺水肿量化是治疗急性充血性心力衰竭(congestive heart failure,CHF)的关键。用于视觉和语言预训练的多模态掩码自编码器已被证实可有效融合胸片和肺水肿放射学报告的多模态信息以提升肺水肿量化精度。但现有的方法是随机地对图像和文本进行掩码操作,这一不稳定的操作容易导致模型忽略图像病灶和文本关键词,并阻碍多模态信息的融合与对齐,最终影响量化精度。针对上述问题,本研究设计了一种掩码图像-语言蒸馏模型,首次将自蒸馏引入到医学图像-语言预训练任务中,使得模型获得更为稳定可靠的医学图像和语言表示;并对跨模态注意力融合机制进行优化,使得模型更好地融合与对齐多模态信息。相比于101层残差神经网络(residual network 101,ResNet101)、视觉Transformer(vision transformer,ViT)-B/16、联合胸片和肺水肿放射学报告建模(joint modeling of chest radiographs and radiology reports for pulmonary edema assessment,JMC3R)和用于视觉和语言预训练的多模态掩码自编码器(multi-modal masked autoencoders for medical vision and language pre-training,M3AE),本研究所提出的方法在肺水肿量化数据集(pulmonary edemaassessmentdataset,PEAD)上获得了更高的肺水肿量化精度。 Pulmonary edema assessment is critical to the treatment of acute congestive heart failure(CHF).Multimodal masked autoencoders for vision-language pre-training have been shown to effectively fuse multimodal information from chest radiographs and pulmonary edema radiology reports to improve pulmonary edema quantification accuracy.However,existing methods randomly perform masking operations on images and text,and this unstable operation easily causes the model to ignore image lesions and text keywords,and hinders the fusion and alignment of multimodal information,which ultimately affects the quantization accuracy.To address the above problems,this research designs a masked vision-language distillation model,which introduces self-distillation into the medical vision-language pre-training task for the first time,so that the model obtains more stable and reliable medical image and linguistic representations;and optimizes the cross-modal attention fusion mechanism,so that the model better fuses and aligns the multimodal information.Compared with residual network 101(ResNet101),vision transformer(ViT)-B/16,joint modeling of chest radiographs and radio-logy reports for pulmonary edema assessment(JMC3R),and multi-modal masked autoencoders for medical vision and language pre-training(M3AE),our method obtains higher pulmonary edema quantification accuracy on pulmonary edema assessment dataset(PEAD).

作者卢得民钟诚杨锋 LU Demin;ZHONG Cheng;YANG Feng(School of Computer,Electronics and Information,Guangxi University,Nanning,530004;Laboratory of Parallel,Distributed and Intelligent Computing of Guangxi Universities and Colleges,Nanning,530004)

机构地区广西大学计算机与电子信息学院广西高校并行分布与智能计算重点实验室

出处《基因组学与应用生物学》 CAS CSCD 北大核心 2024年第2期274-283,共10页 Genomics and Applied Biology

基金国家自然科学基金项目(61861004,61962004)资助。

关键词肺水肿自蒸馏掩码建模多模态注意力机制 Pulmonary edema Self-distillation Mask modeling Multimodal Attention mechanism

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP391.1 [自动化与计算机技术—计算机应用技术] R541.63 [医药卫生—心血管疾病]

引文网络
相关文献

参考文献3

1李佳欣,苏曙光.基于BERT的图像和文本多模态融合分类模型[J].计算机应用,2023,43(S01):39-44. 被引量：3
2张昀枭,吴晓红,唐荔莉,徐庆华,王斌,何小海.基于多模态数据的阿尔兹海默病分类方法[J].计算机应用,2023,43(S02):298-305. 被引量：1
3殷炯,张哲东,高宇涵,杨智文,李亮,肖芒,孙垚棋,颜成钢.视觉语言预训练综述[J].软件学报,2023,34(5):2000-2023. 被引量：5

二级参考文献10

1贾建平,王荫华,李焰生,陈晓春,丁新生,张振馨,张晓君,张朝东,杨莘,汪凯,肖世富,周爱红,罗本燕,唐牟尼,徐江涛,章军建,彭丹涛,蔡晓杰,魏翠柏.中国痴呆与认知障碍诊治指南（二）：痴呆分型及诊断标准[J].中华医学杂志,2011,91(10):651-655. 被引量：128
2宋昕,洪羽蓉,胡秋莹.阿尔兹海默病发病原因及机制的研究进展[J].临床和实验医学杂志,2015,14(10):871-872. 被引量：48
3段火强,舒星辉,徐俊,蒋皆恢.基于PiB PET图像感兴趣区域的阿尔茨海默症计算机辅助分析[J].中国生物医学工程学报,2016,35(6):641-647. 被引量：2
4戴志飞.分子探针在重大疾病诊疗中的应用、机遇与挑战[J].科学通报,2017,62(1):25-35. 被引量：5
5陈兴蜀,马晨曦,王文贤,高悦,王海舟.基于改进的ccLDA多数据源热点话题检测模型[J].工程科学与技术,2018,50(2):141-147. 被引量：4
6李丰男,孟祥茹,焦艳菲,张琳琳,刘念.基于多特征融合Single-Pass-SOM组合模型的话题检测[J].计算机系统应用,2020,29(7):245-250. 被引量：2
7杜鹏飞,李小勇,高雅丽.多模态视觉语言表征学习研究综述[J].软件学报,2021,32(2):327-348. 被引量：25
8包希港,周春来,肖克晶,覃飙.视觉问答研究综述[J].软件学报,2021,32(8):2522-2544. 被引量：11
9吕明媞,杨志军,张伟.PPARα与阿尔茨海默病的研究进展[J].生物化学与生物物理进展,2021,48(8):866-874. 被引量：3
10王斌,吴晓红,辜蕊,卿粼波,何小海.基于改进ResNet的阿尔兹海默症分类网络[J].智能计算机与应用,2023,13(3):69-76. 被引量：1

共引文献6

1张重毅,牛欣悦,孙君艳,祁丽娟,方梅.ChatGPT探析:AI大型语言模型下学术出版的机遇与挑战[J].中国科技期刊研究,2023,34(4):446-453. 被引量：15
2张天明,张杉,刘曦,曹斌,范菁.融合多模态数据的小样本命名实体识别方法[J].软件学报,2024,35(3):1107-1124.
3姚涵涛,余璐,徐常胜.视觉语言模型引导的文本知识嵌入的小样本增量学习[J].软件学报,2024,35(5):2101-2119.
4王涛.基于多系统融合的实验室安全管理平台的设计与实现[J].自动化应用,2024,65(10):4-7.
5黄瀚.多模态数据融合处理对数据中心效率提升的影响研究——以浙江省民政数据共享交换中心为例[J].办公自动化,2024,29(11):93-96.
6廖宁,曹敏,严骏驰.视觉提示学习综述[J].计算机学报,2024,47(4):790-820.

1张杰斌,吕婷敏,李曙佳,邱文蕊,万婷婷,唐镇宇,王冠华,张奕文,陈汉文.艾司氯胺酮联合超声引导下阴茎背神经阻滞对全麻包皮环切术患儿术后不良行为改变的影响[J].中华麻醉学杂志,2023,43(11):1298-1302.
2率中泰,刘小娟.复方丹参滴丸联合阿托伐他汀钙治疗慢性心力衰竭临床观察[J].中国卫生标准管理,2024,15(3):141-145.
3丁美荣,王昭泓,郑辛茹,张迎春.基于PSO和外部知识的时序数据异常检测[J].计算机系统应用,2024,33(2):83-93.
4金敏杰.复方丹参注射液联合加味复元活血汤治疗冠心病合并急性充血性心力衰竭临床研究[J].新中医,2023,55(14):37-42. 被引量：1
5张晶.经济政策不确定性和投资者情绪对盈余公告后股价漂移的影响研究[J].老字号品牌营销,2023(24):65-67.
6Dian Hudiyawati,Kartinah,Afidatul Mujannidah.Health-related quality of life among congestive heart failure patients with preserved and reduced ejection fraction[J].Frontiers of Nursing,2024,11(1):111-117.
7李敬连,周宝庆,张玉琛.心包剥脱手术中防止急性心力衰竭的体会[J].承德医学院学报,1985(1):42-43.
8Kunal Tewari,Sumanth Pelluru,Deepak Mishra,Nitin Pahuja,Akash Ray Mohapatra,Jyotsna Sharma,Om Bahadur Thapa,Manjot Multani.Comparison of efficacy of lung ultrasound and chest X-ray in diagnosing pulmonary edema and pleural effusion in ICU patients: A single centre, prospective, observational study[J].Open Journal of Anesthesiology,2024,14(3):41-50.
9魏萌瑶,张宁,潘如如.基于知识图谱构建的面料图像多样化检索系统[J].棉纺织技术,2024,52(4):40-45.
10刘洋.小儿手术前应用咪达唑仑口服溶液减少术前焦虑及术后躁动的效果[J].中国医学创新,2024,21(9):138-142.

基因组学与应用生物学

2024年第2期

浏览历史

内容加载中请稍等...

用于肺水肿量化的掩码图像-语言蒸馏模型

参考文献3

二级参考文献10

共引文献6

相关作者

相关机构

相关主题

浏览历史