摘要
近年来,Vision Transformer(ViT)成了医学图像分割中受欢迎的新范式,并且在定量指标上超过了CNN同类方法。ViT的显著优点是建立全局联系,但是同时它也缺乏CNN对于局部信息的归纳能力。此方法利用CNN对于局部信息的归纳能力和ViT对于全局关系的归纳能力分别进行特征提取,通过特征融合模块将全局信息和局部信息进行融合,使得模型能够学习到更加鲁棒的特征。此方法在前列腺数据集上取得了比传统方法更高的准确率,表明了其在医学图像分割任务中的有效性。
出处
《电脑知识与技术》
2023年第7期35-37,共3页
Computer Knowledge and Technology
基金
自然科学基金联合基金(项目号:U18092006)
自然科学基金(项目号:62171323)
科技部重点研发项目(项目号:2020YFA0711400)
上海市重大科技项目(项目号:2021SHZDZX0100)
长江学者奖励计划
中央高校基本科研业务费等项目的支持