基于深度学习的结直肠息肉内镜图像分割和分类方法比较

Comparative study on methods for colon polyp endoscopic image segmentation and classification based on deep learning

下载PDF

导出

摘要目的·比较不同深度学习方法在结直肠息肉内镜图像分割和分类任务中的性能,以确定最优方法。方法·从3家医院采集4个结肠息肉数据集,涵盖1534个静态图像及15个肠镜视频。所有样本均经病理学验证,分为锯齿状病变和腺瘤性息肉2类。使用LabelMe工具进行多边形标注,将标注结果转换为整数掩膜格式。数据用于训练不同架构的深度神经网络,包括卷积神经网络、Transformer以及这2种技术的融合,建立有效的语义分割模型。对比不同架构模型自动诊断结肠息肉的多项性能指标,包括平均交并比(mIoU)、整体准确率(aAcc)、平均准确率(mAcc)、平均Dice系数(mDice)、平均F分数(mFscore)、平均精确率(mPrecision)和平均召回率(mRecall)。结果·开发了4种不同架构的语义分割模型,包括2种深度卷积神经网络架构(Fast-SCNN和DeepLabV3plus)、1种Transformer架构(Segformer)以及1种混合架构(KNet)。在对291张测试图像进行综合性能评估中,KNet最高mIoU为84.59%,显著优于Fast-SCNN(75.32%)、DeepLabV3plus(78.63%)和Segformer(80.17%)。在“背景”“锯齿状病变”和“腺瘤性息肉”3个类别上,KNet的交并比(IoU)分别为98.91%、74.12%和80.73%,均超越其他模型。KNet在关键性能指标上也表现优异,其中aAcc、mAcc、mDice、mFscore和mRecall分别达到98.59%、91.24%、91.31%、91.31%和91.24%,均优于其他模型。尽管在mPrecision上,91.46%并非最突出,但KNet的整体性能仍领先。在80张外部测试图像的推理测试中,KNet保持了81.53%的mIoU,展现出良好的泛化能力。结论·利用基于KNet混合架构的深度神经网络构建的结直肠息肉内镜图像语义分割模型表现出优异的预测性能,具有成为检测结直肠息肉高效工具的潜力。 Objective·To compare the performance of various deep learning methods in the segmentation and classification of colorectal polyp endoscopic images,and identify the most effective approach.Methods·Four colorectal polyp datasets were collected from three hospitals,encompassing 1534 static images and 15 videos.All samples were pathologically validated and categorized into two types:serrated lesions and adenomatous polyps.Polygonal annotations were performed by using the LabelMe tool,and the annotated results were converted into integer mask formats.These data were utilized to train various architectures of deep neural networks,including convolutional neural network(CNN),Transformers,and their fusion,aiming to develop an effective semantic segmentation model.Multiple performance indicators for automatic diagnosis of colon polyps by different architecture models were compared,including mIoU,aAcc,mAcc,mDice,mFscore,mPrecision and mRecall.Results·Four different architectures of semantic segmentation models were developed,including two deep CNN architectures(Fast-SCNN and DeepLabV3plus),one Transformer architecture(Segformer),and one hybrid architecture(KNet).In a comprehensive performance evaluation of 291 test images,KNet achieved the highest mIoU of 84.59%,significantly surpassing Fast-SCNN(75.32%),DeepLabV3plus(78.63%),and Segformer(80.17%).Across the categories of“background”,“serrated lesions”and“adenomatous polyps”,KNet's intersection over union(IoU)were 98.91%,74.12%,and 80.73%,respectively,all exceeding other models.Additionally,KNet performed excellently in key performance metrics,with aAcc,mAcc,mDice,mFscore,and mRecall reaching 98.59%,91.24%,91.31%,91.31%,and 91.24%,respectively,all superior to other models.Although its mPrecision of 91.46%was not the most outstanding,KNet's overall performance remained leading.In inference testing on 80 external test images,KNet maintained an mIoU of 81.53%,demonstrating strong generalization capabilities.Conclusion·The semantic segmentation model of colorectal polyp endoscopic images constructed by deep neural network based on KNet hybrid architecture,exhibits superior predictive performance,demonstrating its potential as an efficient tool for detecting colorectal polyps.

作者陈健王珍妮夏开建王甘红刘罗杰徐晓丹 CHEN Jian;WANG Zhenni;XIA Kaijian;WANG Ganhong;LIU Luojie;XU Xiaodan(Department of Gastroenterology,Changshu No.1 People's Hospital(Changshu Hospital Affiliated to Soochow University),JiangsuProvince,Changshu 215500,China;Changshu Key Laboratory of Medical Artificial Intelligence and Big Data,Jiangsu Province,Changshu 215500,China;Department of Gastroenterology,Changshu Traditional Chinese Medicine Hospital,Jiangsu Province,Changshu 215500,China)

机构地区江苏省常熟市第一人民医院(苏州大学附属常熟医院)消化内科江苏省常熟市医学人工智能与大数据重点实验室江苏省常熟市中医院消化内科

出处《上海交通大学学报（医学版）》 CAS CSCD 北大核心 2024年第6期762-772,共11页 Journal of Shanghai Jiao tong University:Medical Science

基金苏州市第二十三批科技发展计划项目(SLT2023006) 常熟市医学人工智能与大数据重点实验室能力提升项目(CYZ202301) 苏州市护理学会科研项目(SZHL-B-202407)。

关键词深度学习结直肠息肉卷积神经网络 TRANSFORMER 图像分割 deep learning colorectal polyp convolutional neural network Transformer image segmentation

分类号 R574.6 [医药卫生—消化系统] TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1Goto H.,Oda Y.,Murakami Y.,刘丽娜.日本人结肠直肠癌中新生癌的比例研究[J].世界核心医学期刊文摘（胃肠病学分册）,2006,0(11):23-23. 被引量：1
2中华人民共和国国家卫生健康委员会,中华医学会肿瘤学分会,顾晋,汪建平,王锡山,张苏展,蔡三军,李进,沈琳,徐瑞华,金晶,章真,梁智勇,孙应实,王晰程,刘骞,彭亦凡.中国结直肠癌诊疗规范(2023年版)[J].中华外科杂志,2023,61(8):617-644. 被引量：40

共引文献39

1郑阔,金路,沈浮,高显华,朱晓明,于冠宇,郝立强,楼征,王颢,于恩达,白辰光,张卫.局部进展期直肠癌新辅助放化疗后延长等待时间对肿瘤退缩的影响[J].中华外科杂志,2023,61(9):775-781.
2肖曼玉,杨明莹,陶继华,夏斯亚,孟庭瑞,江帆,余力锐.造口患者自我报告信息支持现状及影响因素分析[J].昆明医科大学学报,2023,44(9):176-182.
3黎立喜,马飞.肿瘤全方位全周期健康管理模式的进展[J].科技导报,2023,41(18):29-35. 被引量：2
4孙敏,蔺潇,孙霞,裴新荣,李芹.同伴支持模式延伸护理应用于大肠癌结肠造口术患者中的效果分析[J].中外医疗,2023,42(27):140-144.
5黄覛韬,屈展,梁鹏飞,刘蔚东,何志友,崔旭,郭乐,陈杰,李梦娟,黄晓元,张丕红.改良垂直腹直肌肌皮瓣修复直肠癌经腹会阴联合切除术后皮肤软组织缺损的临床效果[J].中华烧伤与创面修复杂志,2024,40(1):57-63. 被引量：1
6袁倩,徐晓红,张国丽,刘丽娟.超声双重造影在结直肠癌诊断及分期评估中的应用进展[J].山东医药,2024,64(1):111-114.
7秦琼,吴玉泉,文荣,白秀梅,高瑞智,林雅丹,吕佳忆,何云,杨红.基于超声造影影像组学预测局部进展期直肠癌新辅助放化疗病理完全缓解的应用研究[J].中华超声影像学杂志,2024,33(1):63-70.
8陈书宁,田雨,秦艳,刘彦魁,周心一,韩伟峰,齐晓薇.血清趋化因子(C-X-C基序)配体3在结直肠癌早期筛查和预后评估中的应用价值[J].中华实验外科杂志,2024,41(1):137-140.
9梁小琴,庞书勤,王珑.薯蓣粥对2型糖尿病合并结直肠癌术后患者切口愈合情况的影响[J].现代临床护理,2024,23(1):21-27.
10颜姝,王今.非治愈性内镜切除pT1期结直肠癌的临床分析[J].中国现代医药杂志,2024,26(3):82-87.

1陈冬梅,陈燕霞,解盼盼,杨茹文.基于“十二皮部理论”揿针治疗大肠息肉内镜术后胃肠道功能障碍的临床研究[J].内蒙古中医药,2024,43(4):103-105.
2伍亚辉,朱世祺,吴宇东,张儒发,朱锦舟.基于少样本学习算法的结直肠粘膜下肿瘤和息肉内镜图像分类系统[J].中国医学物理学杂志,2024,41(7):897-904.
3孙刘杰,朱耀达,王文举.双通道特征融合的真实场景点云语义分割方法[J].计算机工程与应用,2024,60(12):160-169. 被引量：1
4尼科尔·德霍雷修斯,安德烈·穆萨莱姆,罗伯特·鲁德科克.数字化转型难倒零售商的高效工具[J].市场营销文摘,2023(4):25-27.
5贾逸腾.测绘工程中无人机影像处理技术探究[J].中文科技期刊数据库（全文版）工程技术,2024(4):0021-0024.
6侯鑫烨.科技创新平台建设存在的壁垒及对策研究——以阳泉市为例[J].IT经理世界,2024(3):45-47.
7何沛,黄应龙.基因甲基化对结直肠锯齿状病变的发生发展、治疗及预后的影响[J].现代消化及介入诊疗,2024,29(4):501-505.
8文家新,叶俊镠,魏鑫,杨京东,尹雪娇,李凌杰.氯化镁-氯化铝-EMImBF_(4)/有机醚可充镁电池电解液[J].高等学校化学学报,2024,45(5):120-128.
9杨祝勇.EPC工程总承包项目质量控制探析[J].中文科技期刊数据库（全文版）工程技术,2024(4):0044-0047.
10郑格阳,张玄一.基于时变可靠度的既有铁路桥梁服役状态综合评估方法研究[J].福建建材,2024(6):68-73.

上海交通大学学报（医学版）

2024年第6期

浏览历史

内容加载中请稍等...

基于深度学习的结直肠息肉内镜图像分割和分类方法比较

参考文献2

共引文献39

相关作者

相关机构

相关主题

浏览历史