面向多模态医学语料库的皮肤镜图像分类

Dermoscopic image classification for multi-modal medical corpus

下载PDF

导出

摘要多模态医学语料库是医学研究、临床诊断和教学的重要工具之一。然而,现有的医学语料库大多仅有文本数据,缺乏匹配的直观图像,信息不够充分。而大量医学图像缺少明确的语义标签,导致构建语料库困难。针对上述问题,该文提出一种面向多模态医学语料库的皮肤镜图像分类方法,通过对皮肤镜图像进行精确分类获取语义标签,并结合自然语言处理方法匹配相关文本信息,从而建立图像与文本相结合的多模态语料库。首先,针对传统机器学习图像分类方法对病灶特征提取较弱且易受背景噪声影响,导致病灶分类精度差的问题,该文构建双流网络,通过融合病灶的形状与纹理特征增强病灶特征提取能力。其次,为减少特征融合导致的信息冗余,引入了基于通道注意力机制的特征筛选方法,关注关键特征并抑制噪声影响。此外,针对皮肤镜图像良恶性样本数量不均衡导致的模型优化困难问题,引入非对称损失函数,提升模型对样本不均衡的鲁棒性。在ISIC皮肤镜图像数据集上的实验结果表明,该文所提方法能够快速准确地分类皮肤镜图像,并将图像与病历文本进行精准匹配以构建多模态医学语料库。 Multi-modal corpus is one of the important tools for medical research,clinical diagnosis and teaching.Most of the existing medical corpus only have text data,lacking matching images,which leads to inadequate information.Additionally,a large number of medical images don’t have clear semantic labels,which makes them difficult to be used in corpus construction.To solve the above problems,a novel dermoscopic image classification method for multi-modal medical corpus construction is proposed.Through accurate classification of dermoscopic images,we obtained semantic labels,and then matching them with relevant text by natural language processing method.In this way,a multi-modal corpus with images and texts was established.First,traditional image classification methods based on machine learning are weak in feature extraction of lesions and susceptible to background noise,resulting in poor classification accuracy.Considering the above,in this paper,a two-stream network was constructed to enhance the feature representation by fusing lesions’shapes and texture features.Second,in order to reduce information redundancy caused by feature fusion,a feature selection method based on channel attention mechanism was introduced to focus on the key features and suppress the influence of noise.In addition,aiming at the problem of model optimization difficulty caused by the imbalance in the number of benign and malignant samples in dermatoscopic images,asymmetric loss function was introduced to improve the robustness of model.Experimental results on ISIC dermatoscopic image dataset proved that the proposed method can accurately and efficiently categorize dermatoscopic images and match images with corresponding medical records to construct a multi-modal medical corpus.

作者韩泓丞林玉萍郭钦钵张栋许美凤朱龙飞李小棉冯丽丽岳婕 HAN Hongcheng;LIN Yuping;GUO Qinbo;ZHANG Dong;XU Meifeng;ZHU Longfei;LI Xiaomian;FENG Lili;YUE Jie(College of Artificial Intelligence,Xi’an Jiaotong University,Xi’an 710049,China;School of Foreign Studies,Xi’an Jiaotong University,Xi’an 710049,China;School of Automation Science and Technology,Xi’an Jiaotong University,Xi’an 710049,China;Department of Dermatology,Second Afflicated Hospital of Xi’an Jiaotong University,Xi’an 710049,China;Department of English Education,Jeonbuk National University,Jeonju-si 560759,South Korea;Department of Pediatrics,First Affiliated Hospital of Xi’an Jiaotong University,Xi’an 710061,China)

机构地区西安交通大学人工智能学院西安交通大学外国语学院西安交通大学自动化科学与工程学院西安交通大学第二附属医院皮肤科韩国全北国立大学英语教育学系西安交通大学第一附属医院儿科

出处《西北大学学报（自然科学版）》 CAS CSCD 北大核心 2023年第3期377-386,共10页 Journal of Northwest University（Natural Science Edition）

基金陕西省自然科学基础研究计划面上项目(2022JM-324) 陕西省社会科学基金项目(2021K014)。

关键词多模态语料库皮肤镜图像图像分类卷积神经网络自然语言处理 multi-modal corpus dermoscopic image image classification convolutional neural network natual language processing

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1杨锦锋,于秋滨,关毅,蒋志鹏.电子病历命名实体识别和实体关系抽取研究综述[J].自动化学报,2014,40(8):1537-1562. 被引量：127
2谭晓风.基于医学学术英语语料库的功能翻译研究[J].医学教育管理,2020,6(4):366-372. 被引量：1
3简哲,李燕.电子病历自然语言处理测评发展[J].医学信息学杂志,2016,37(12):10-13. 被引量：4
4孙旭,刘剑,付紫瑶,孙一鸣.基于多模态语料库的痴呆老人言语行为特征研究[J].海外英语,2021(20):122-124. 被引量：2
5林玉萍,郑尧月,郑好洁,张栋,王丛,李小棉,李颖玉,田智强.基于医学影像分割方法的多模态语料库构建[J].模式识别与人工智能,2021,34(4):353-360. 被引量：5
6钟昀辛,张朋艺,邓玉林,李晓琼.MelaNet:用于皮肤镜图像中黑色素瘤检测的深度密集注意力网络[J].生命科学仪器,2021,19(2):40-48. 被引量：1

二级参考文献156

1魏微.医学英语多模态语料库系统构建以及应用[J].微型电脑应用,2020,36(2):75-78. 被引量：6
2车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：117
3罗倩,彭聃龄.痴呆症的语言研究[J].当代语言学,2001,3(2):109-118. 被引量：13
4林东,邵军力.医学诊疗领域通用专家系统设计与实现[J].自动化学报,1995,21(3):380-382. 被引量：6
5中华人民共和国卫生部.电子病历基本规范(试行)[Online],available:http://www.gov.cn/zwgk/2010-03/04/content_1547432.htm,December27,2013.
6Wasserman R C. Electronic medical records (EMRs), epi- demiology, and epistemology: reflections on EMRs and fu- ture pediatric clinical research. Academic Pediatrics, 2011, 11(4): 280-287.
7Uzuner O, Mailoa J, Ryan R, Sibanda T. Semantic relations for problem-oriented medical records. Artificial Intelligence in Medicine, 2010, 50(2): 63-73.
8Demner-Fushman D, Chapman W W, McDonald C J. What can natural language processing do for clinical decision sup- port? Journal of Bioxnedical Informatics, 2009, 42(5): 760- 772.
9Eysenbach G. Recent advances: consumer health informat- ics. British Medical Journal, 2000, 320(7251): 1713-1716.
10Sager N, Friedman C, Lyman M S. Review of Medical lan- guage processing: computer management of narrative data. Computational Linguistics, 1989, 15(3): 195-198.

共引文献132

1席新,李波,王骁勇,胡云苹.面向电子病历的医学术语规范化系统设计及实现[J].中国数字医学,2021,16(12):65-68. 被引量：7
2姜会珍,胡海洋,马琏,赵从朴,张锋,陈婕卿,曾可,王晓露,朱卫国.基于医患对话的病历自动生成技术研究[J].中国数字医学,2021,16(10):36-40. 被引量：3
3孔静静,于琦,李敬华,于彤,张竹绿,田野,祖雅琪.实体抽取综述及其在中医药领域的应用[J].世界科学技术-中医药现代化,2022,24(8):2957-2963. 被引量：6
4邢毅雪,朱永华,高海燕,周金,张克.基于注意力机制的远程监督实体关系抽取[J].上海大学学报（自然科学版）,2021,27(5):983-992. 被引量：7
5昝红英,韩杨超,范亚鑫,牛承志,张坤丽,穗志方.中文症状知识库的建立与分析[J].中文信息学报,2020,34(4):30-37. 被引量：9
6吴欢,应俊,王逸飞,胡华宇,徐洪丽,郑一琼.乳腺癌病理文本的结构化信息提取[J].解放军医学院学报,2020,41(7):746-751. 被引量：10
7易应萍,张志强,王强.基于自然语言处理技术的医学命名实体解析研究[J].中国数字医学,2018,13(12):20-22. 被引量：3
8苟梦野,赵文龙,杨美洁,于跃,宋萍.基于电子健康档案相关研究现状、热点与前沿知识可视化分析[J].现代预防医学,2019,46(1):65-72. 被引量：11
9沈江,余海燕,徐曼.实体异构性下证据链融合推理的多属性群决策[J].自动化学报,2015,41(4):832-842. 被引量：9
10曲春燕,关毅,杨锦锋,赵永杰,刘雅欣.中文电子病历命名实体标注语料库构建[J].高技术通讯,2015,25(2):143-150. 被引量：19

1魏伟,杨明州,杨进益.完全内生型肾肿瘤行肾部分切除术的研究进展[J].中文科技期刊数据库（全文版）医药卫生,2021(3):33-34.
2李晓萌.浅谈BIM技术在暖通空调工程中的应用[J].中文科技期刊数据库（全文版）工程技术,2021(11):345-347.
3许凡勇,夏进东,陈君华,曹文新.新型冠状病毒肺炎早期CT表现分析[J].实用放射学杂志,2020,36(3):356-358. 被引量：3
4邓庆荣,韩丽君,胡珊山,翟浩,陈立光.^(18)F-FDG PET/CT显像在广泛淋巴结转移癌与非霍奇金淋巴瘤鉴别中的应用价值探析[J].医学理论与实践,2022,35(17):2884-2887. 被引量：2
5李星意.试论李斛《关汉卿像》的真实与虚构[J].东方收藏,2023(2):63-65.
6朱雪亮,应捷,杨海马,李薄羏.结合MRI纹理与SVM的子宫内膜癌肌层浸润程度预测[J].软件导刊,2022,21(1):108-113.
7谢云凤.城市更新开辟高质量发展新空间[J].风流一代,2023(15):16-17.
8田军.可视化领导力最佳实践[J].复印报刊资料（管理学文摘）,2022(2):21-23.
9冒海军.核心素养视域下高中地理问题式教学实践研究[J].山西教育（教学版）,2023(5):93-94. 被引量：2
10岳莹.基于核心概念的大单元整体教学实践与思考研究——以小学数学北师版教材“面积”为例[J].中文科技期刊数据库（全文版）教育科学,2023(6):172-175.

西北大学学报（自然科学版）

2023年第3期

浏览历史

内容加载中请稍等...

面向多模态医学语料库的皮肤镜图像分类

参考文献6

二级参考文献156

共引文献132

相关作者

相关机构

相关主题

浏览历史