-
题名多跳连接残差注意网络的图像超分辨率重建
被引量:2
- 1
-
-
作者
刘遵雄
朱成佳
黄稷
蔡体健
-
机构
华东交通大学信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2021年第11期258-267,共10页
-
基金
国家自然科学基金(61861017)
江西省青年科学基金(20181BAB211013)。
-
文摘
随着卷积神经网络深度的不断增加,深度卷积神经网络的训练会变得更加困难。此外,在图像超分辨率中,低分辨率图像的通道特征和输入通常在不同的通道中被平等对待,这就导致了卷积神经网络的表征能力被弱化。为了解决这些问题,提出了一种多跳连接残差注意网络,该网络利用多跳连接中的残差(Residual in Multi-skip Connection,RIMC),构造了具有多个残差组的深度网络。每个残差组包含了一定数量的短跳连接和多跳连接。在RIMC的基础上,主网络被允许穿过多跳连接来绕过丰富的低频信息,同时高频信息也可以被主网络集中地学习。另外,考虑到通道和空间维度的相互依赖关系,提出了注意机制块(Attention Mechanism Block,AMBlock)来关注信息的位置,并自适应地调整通道特征尺度,其中通道注意机制和空间注意机制被应用在这种方式中。实验结果表明,该网络可以更好地恢复图像细节,获得更高的图像质量和网络性能。
-
关键词
图像超分辨率
注意机制块
残差网络
多跳连接中的残差
跳连接
-
Keywords
Image super-resolution
Attention mechanism block
Residual network
Residual in multi-skip connection
Skip connection
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进Inception网络的语音分类模型
被引量:1
- 2
-
-
作者
张秋余
王煜坤
-
机构
兰州理工大学计算机与通信学院
-
出处
《计算机应用》
CSCD
北大核心
2023年第3期909-915,共7页
-
基金
国家自然科学基金资助项目(61862041)。
-
文摘
针对传统音频分类模型提取音频特征的过程繁琐,以及现有神经网络模型存在过拟合、分类精度不高、梯度消失等问题,提出一种基于改进Inception网络的语音分类模型。首先,在模型中加入ResNet中的残差跳连思想以改进传统的InceptionV2模型,使网络模型在加深的同时避免梯度消失;其次,优化Inception模块中的卷积核大小,并利用不同尺寸卷积对原始语音的Log-Mel谱图进行深度特征提取,使模型通过自主学习的方式选择合适的卷积处理数据;同时,在深度与宽度两个维度改进模型以提高分类精度;最后,利用训练好的网络模型对语音数据进行分类预测,并通过Softmax函数得到分类结果。在清华大学汉语语音数据集THCHS-30与环境声音数据集UrbanSound8K数据集上的实验结果表明,改进的Inception网络模型在上述两个数据集上分类准确率分别为92.76%与93.34%。相较于VGG16、InceptionV2、GoogLeNet等模型,所提模型的分类准确率取得了最优,最多提高了27.30个百分点。所提模型具有更强的特征融合能力和更准确的分类结果,能够解决过拟合、梯度消失等问题。
-
关键词
语音分类
卷积神经网络
残差跳连
对数梅尔谱图
深度特征
-
Keywords
speech classification
convolutional neural network
residual skip connection
Log-Mel spectrogram
depth feature
-
分类号
TN912.3
[电子电信—通信与信息系统]
TP183
[自动化与计算机技术—控制理论与控制工程]
-