期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
深度复数轴向自注意力卷积循环网络的语音增强
1
作者 曹洁 王乔 +3 位作者 梁浩鹏 王宸章 李晓旭 于泓 《计算机系统应用》 2024年第4期60-68,共9页
单通道语音增强任务中相位估计不准确会导致增强语音的质量较差,针对这一问题,提出了一种基于深度复数轴向自注意力卷积循环网络(deep complex axial self-attention convolutional recurrent network,DCACRN)的语音增强方法,在复数域... 单通道语音增强任务中相位估计不准确会导致增强语音的质量较差,针对这一问题,提出了一种基于深度复数轴向自注意力卷积循环网络(deep complex axial self-attention convolutional recurrent network,DCACRN)的语音增强方法,在复数域同时实现了语音幅度信息和相位信息的增强.首先使用基于复数卷积网络的编码器从输入语音信号中提取复数表示的特征,并引入卷积跳连模块用以将特征映射到高维空间进行特征融合,加强信息间的交互和梯度的流动.然后设计了基于轴向自注意力机制的编码器-解码器结构,利用轴向自注意力机制来增强模型的时序建模能力和特征提取能力.最后通过解码器实现对语音信号的重构,同时利用混合损失函数优化网络模型,提升增强语音信号的质量.实验在公开数据集Valentini和DNS Challenge上进行,结果表明所提方法相对于其他模型在客观语音质量评估(perceptual evaluation of speech quality,PESQ)和短时客观可懂度(short-time objective intelligibility,STOI)两项指标上均有提升,在非混响数据集中,PESQ比DCTCRN(deep cosine transform convolutional recurrent network)提高了12.8%,比DCCRN(deep complex convolutional recurrent network)提高了3.9%,验证了该网络模型在语音增强任务中的有效性. 展开更多
关键词 单通道语音增强 复数卷积循环网络 卷积跳连 轴向注意力机制
下载PDF
基于轴-Transformer的医学图像分割模型Axial-TransUNet
2
作者 刘文科 刘琳 +1 位作者 韩子逸 张媛媛 《现代信息科技》 2024年第16期28-33,共6页
针对TransUNet中Transformer自注意力机制计算复杂度高、捕获位置信息能力不足的问题,提出一种基于轴向注意力机制的医学图像分割网络Axial-TransUNet。该网络在保留TransUNet网络编码器、解码器以及跳跃连接的基础上,使用基于轴向注意... 针对TransUNet中Transformer自注意力机制计算复杂度高、捕获位置信息能力不足的问题,提出一种基于轴向注意力机制的医学图像分割网络Axial-TransUNet。该网络在保留TransUNet网络编码器、解码器以及跳跃连接的基础上,使用基于轴向注意力机制的残差轴向注意力块代替TransUNet的Transformer层。实验结果表明,在多个医学数据集上,相较于TransUNet等其他医学图像分割网络,Axial-TransUNet的Dice系数、交并比IoU有更好的表现。与TransUNet相比,Axial-TransUNet网络的参数量与浮点运算数(FLOPs)分别降低14.9%和30.5%。可见,Axial-TransUNet有效降低了模型复杂度,并增强了模型捕获位置信息的能力。 展开更多
关键词 医学图像分割 卷积神经网络 位置信息 计算复杂度 轴向注意力机制
下载PDF
基于SPD多尺度输入的ST-MASA的肺炎智能检测模型
3
作者 李芳芳 束建华 +3 位作者 阚峻岭 殷云霞 孙大勇 马春 《宿州学院学报》 2023年第12期11-17,共7页
肺部X光片的临床诊断结果可以作为新冠肺炎及其他肺炎诊断的重要依据,而X光片所显示的肺炎病变的相似性及阅片量巨大,医生传统的阅片识别存在误诊、漏诊和时间消耗等问题。因此,提出了一种融合空间金字塔分解(Spatial pyramid decomposi... 肺部X光片的临床诊断结果可以作为新冠肺炎及其他肺炎诊断的重要依据,而X光片所显示的肺炎病变的相似性及阅片量巨大,医生传统的阅片识别存在误诊、漏诊和时间消耗等问题。因此,提出了一种融合空间金字塔分解(Spatial pyramid decomposition, SPD)模块进行多尺度输入的ST-MASA(Swin Transformer with Multi-Head Axial-Self-Attention)的肺炎智能检测模型,用于COVID-19和多类型肺炎的自动分类。该模型能够自动关注肺炎病灶的判别信息和多尺度特征,进而更好地进行COVID-19、肺不透明(Lung_Opacity)、非COVID的病毒性肺炎(Viral_Pneumonia)和正常(Normal)的X光片进行分类,以便更好地帮助放射科医生进行医疗诊断工作。实验结果表明,所提出的模型在准确率、召回率、F1-Measure等指标上均优于经典的网络模型ResNet 50、ResNet 101、Inception net-V3和Swin Transformer。 展开更多
关键词 肺炎智能检测 空间金字塔分解 多尺度输入 多头轴向注意力机制 Swin Transformer
下载PDF
基于CCT的新冠肺炎胸部CT检测识别
4
作者 林金朝 陈俊刚 +3 位作者 庞宇 王慧倩 张冲冲 黄志伟 《生命科学仪器》 2021年第6期58-65,共8页
根据国家卫生健康委员会公布的诊疗方案第五版,计算机断层扫描(CT)影像临床诊断结果可作为新冠肺炎(COVID-19)病例诊断的标准。CT图像能够清晰、立体地显示新冠肺炎患者肺部病变特征,针对新冠肺炎的诊断,可以使用胸部CT图像构建新冠肺... 根据国家卫生健康委员会公布的诊疗方案第五版,计算机断层扫描(CT)影像临床诊断结果可作为新冠肺炎(COVID-19)病例诊断的标准。CT图像能够清晰、立体地显示新冠肺炎患者肺部病变特征,针对新冠肺炎的诊断,可以使用胸部CT图像构建新冠肺炎检测模型,为医生提供更精确的诊断。本文提出了基于紧凑型卷积Transformer(CCT)的检测识别模型,首先使用U-Net分割网络提取肺区后,使用CCT对肺区进行识别。将Transformer编码器的注意力机制更改为了轴向注意力机制,并添加位置偏移项,在训练中获取更精确的上下文信息。在CC-CCII数据集中挑选出了1034张新冠肺炎CT图像,1003张社区肺炎CT图像和931张正常CT图像组成测试集,性能达到了98.5%的准确率,98.6%的灵敏度,并且在其他小型数据集上性能表现良好。证明了提出的方法使用胸部CT图像检测新冠肺炎有正向辅助作用。 展开更多
关键词 新冠肺炎 CCT 轴向注意力机制 位置偏移项
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部