目的本研究旨在构建一个基于临床和影像学特征的极端梯度提升(extreme gradient boosting,XGBoost)模型,以鉴别乳腺非肿块病变的良恶性。材料与方法收集2018年1月至2024年7月2个机构,2种乳腺X线设备检查的有病理结果的首诊乳腺非肿块病...目的本研究旨在构建一个基于临床和影像学特征的极端梯度提升(extreme gradient boosting,XGBoost)模型,以鉴别乳腺非肿块病变的良恶性。材料与方法收集2018年1月至2024年7月2个机构,2种乳腺X线设备检查的有病理结果的首诊乳腺非肿块病变480个。患者被分为建模组[n=310,数字乳腺X线摄影(digital mammography,DM)检查]、内部验证组(n=108,DM检查),和外部验证组[n=62,数字乳腺体层合成摄影(digital breast tomosynthesis,DBT)检查]。记录患者术前乳腺X线(DM或DBT),MRI以及临床特征。采用XGBoost算法和多因素逻辑回归分析,分别构建XGBoost模型和逻辑回归(logistic regression,LR)模型。使用受试者工作特征(receiver operating characteristic,ROC)曲线评估模型的诊断效能。结果在建模组中,患者以7∶3随机分为训练集(n=217)和测试集(n=93)。训练集、测试集、训练集的内部验证组及训练集的外部验证组中,恶性非肿块病灶分别为159(73%)、58(62%)、73(68%)和43(69%)。XGBoost模型的诊断效能明显优于LR模型,在独立的训练集、测试集、训练集的内部验证组及训练集的外部验证组中均表现出良好的诊断效能,曲线下面积(area under the curve,AUC)在0.884~0.913之间。XGBoost模型在四个队列中也表现出良好的校准能力和临床净获益。结论XGBoost模型能够准确鉴别乳腺非肿块病变的良恶性,具有推广应用的潜力。展开更多
目的构建适应中国人群的乳腺钼靶图像分类辅助系统,探讨人工智能技术在国内辅助乳腺癌早期筛查的潜力。方法为复现当前文献中的主流深度学习方法,利用乳腺X线筛查数字数据库子集(curated breast imaging subset of digital database for...目的构建适应中国人群的乳腺钼靶图像分类辅助系统,探讨人工智能技术在国内辅助乳腺癌早期筛查的潜力。方法为复现当前文献中的主流深度学习方法,利用乳腺X线筛查数字数据库子集(curated breast imaging subset of digital database for screening mammography,CBIS-DDSM)、乳房X线图像分析学会数据库(mammographic image analysis society database,MIAS)等国际公开数据集分别进行模型训练,并在华教科技有限公司提供的中国人群乳腺钼靶图像数据集(Chinese breast mammography dataset,CBMD)上进行测试和模型性能比较;针对中国人群数据在公开数据集训练模型性能测试不理想的问题,结合中国人群数据特点,提出基于滑动窗口调窗机制的优化策略,设计二阶段迁移学习方法,以提升模型的整体性能,并进行系统研发。结果使用滑动窗口调窗机制及二阶段迁移学习后的CBMD训练模型,以中国人群数据集为测试集,其准确度从默认窗口下公开数据集训练模型的0.50提升至0.80,精度从0.54提升至0.82,灵敏度从0.52提升至0.80,F1值从0.52提升至0.80,AUC值从0.51提升至0.89。结论本研究引入滑动窗口调窗机制和二阶段迁移学习策略,显著提升了乳腺钼靶图像分类模型在中国人群数据集上的性能,初步达到适应中国人群的乳腺钼靶图像辅助分类的目的。展开更多
文摘目的本研究旨在构建一个基于临床和影像学特征的极端梯度提升(extreme gradient boosting,XGBoost)模型,以鉴别乳腺非肿块病变的良恶性。材料与方法收集2018年1月至2024年7月2个机构,2种乳腺X线设备检查的有病理结果的首诊乳腺非肿块病变480个。患者被分为建模组[n=310,数字乳腺X线摄影(digital mammography,DM)检查]、内部验证组(n=108,DM检查),和外部验证组[n=62,数字乳腺体层合成摄影(digital breast tomosynthesis,DBT)检查]。记录患者术前乳腺X线(DM或DBT),MRI以及临床特征。采用XGBoost算法和多因素逻辑回归分析,分别构建XGBoost模型和逻辑回归(logistic regression,LR)模型。使用受试者工作特征(receiver operating characteristic,ROC)曲线评估模型的诊断效能。结果在建模组中,患者以7∶3随机分为训练集(n=217)和测试集(n=93)。训练集、测试集、训练集的内部验证组及训练集的外部验证组中,恶性非肿块病灶分别为159(73%)、58(62%)、73(68%)和43(69%)。XGBoost模型的诊断效能明显优于LR模型,在独立的训练集、测试集、训练集的内部验证组及训练集的外部验证组中均表现出良好的诊断效能,曲线下面积(area under the curve,AUC)在0.884~0.913之间。XGBoost模型在四个队列中也表现出良好的校准能力和临床净获益。结论XGBoost模型能够准确鉴别乳腺非肿块病变的良恶性,具有推广应用的潜力。
文摘目的构建适应中国人群的乳腺钼靶图像分类辅助系统,探讨人工智能技术在国内辅助乳腺癌早期筛查的潜力。方法为复现当前文献中的主流深度学习方法,利用乳腺X线筛查数字数据库子集(curated breast imaging subset of digital database for screening mammography,CBIS-DDSM)、乳房X线图像分析学会数据库(mammographic image analysis society database,MIAS)等国际公开数据集分别进行模型训练,并在华教科技有限公司提供的中国人群乳腺钼靶图像数据集(Chinese breast mammography dataset,CBMD)上进行测试和模型性能比较;针对中国人群数据在公开数据集训练模型性能测试不理想的问题,结合中国人群数据特点,提出基于滑动窗口调窗机制的优化策略,设计二阶段迁移学习方法,以提升模型的整体性能,并进行系统研发。结果使用滑动窗口调窗机制及二阶段迁移学习后的CBMD训练模型,以中国人群数据集为测试集,其准确度从默认窗口下公开数据集训练模型的0.50提升至0.80,精度从0.54提升至0.82,灵敏度从0.52提升至0.80,F1值从0.52提升至0.80,AUC值从0.51提升至0.89。结论本研究引入滑动窗口调窗机制和二阶段迁移学习策略,显著提升了乳腺钼靶图像分类模型在中国人群数据集上的性能,初步达到适应中国人群的乳腺钼靶图像辅助分类的目的。