-
题名基于跨维度协同注意力机制的单通道语音增强方法
- 1
-
-
作者
康宏博
冯雨佳
台文鑫
蓝天
吴祖峰
刘峤
-
机构
电子科技大学信息与软件工程学院
电子科技大学计算机科学与工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2023年第7期1639-1648,共10页
-
基金
国家自然科学基金项目(U19B2028)
国家科技重大专项(2021YFC3330403)
+1 种基金
中国电子科技集团54所开放课题(201148)
攀钢集团有限公司开放课题(211129)。
-
文摘
近年来,卷积神经网络在语音增强任务中得到了广泛的应用.然而,目前广泛使用的跳跃连接机制在特征信息传输时会引入噪声成分,从而不可避免地降低了去噪性能;除此之外,普遍使用的固定形状的卷积核在处理各种声纹信息时效率低下,基于上述考虑,提出了一种跨维度协同注意力机制和形变卷积模块的端到端编-解码器网络CADNet.具体来说,在跳跃连接中引入跨维度协同注意力模块,进一步提高信息控制能力.并且在每个标准卷积层之后引入形变卷积层,从而更好地匹配声纹的自然特征.在TIMIT公开数据集上进行的实验验证了所提出的方法在语音质量和可懂度的评价指标方面的有效性.
-
关键词
语音增强
自注意力
跨维度协同注意力
形变卷积
跳跃连接
-
Keywords
speech enhancement
self-attention
cross-dimensional collaborative attention
deformable convolution
skip connection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于数据增强的自监督飞行航迹预测
- 2
-
-
作者
王鹏宇
台文鑫
刘芳
钟婷
罗绪成
周帆
-
机构
电子科技大学信息与软件工程学院
中国民用航空飞行学院
-
出处
《计算机科学》
CSCD
北大核心
2023年第2期130-137,共8页
-
基金
四川省自然科学基金(2022NSFSC0505,2022NSFSC0956)
四川省青年软件创新工程资助项目(2021023)
+1 种基金
四川省科技计划(2022YFSY0006,2020YFG0053)
国家自然科学基金(62176043,62072077)。
-
文摘
准确的飞行航迹预测可以帮助空中交通管理系统对潜在的危险提出预警,并有效地为安全出行提供指导。飞机飞行所处的大气情况复杂多变,飞行航迹受大气扰动、空中云层等外部因素的影响很大,使得飞行航迹预测问题十分复杂和困难。另外,由于某些飞行区域所在的地面环境恶劣,无法部署足够的信号基站,而某些飞行区域的飞行信号由多个信号基站采集组合而成,造成最终得到的飞行航迹数据存在稀疏和含噪等问题,进一步增加了飞行航迹预测的难度。文中提出了一种基于数据增强的自监督飞行航迹学习方法。此方法采用基于正则化的数据增强方式,扩充了稀疏的航迹数据集并处理了数据中包含的异常值,利用最大化互信息的方式进行自监督预训练,以挖掘飞行航迹中蕴含的运动模式和航行意图,采用一种带有蒸馏机制的多头自注意力模型作为基础模型,解除了循环神经网络长期依赖和无法并行计算的限制,并利用注意力蒸馏机制和生成式解码方式降低了模型的复杂度,加快了其训练和预测的速度。在飞行航迹数据集上的评测结果显示,此方法较目前预测表现最优秀的方法在纬度、经度和高度上的预测结果的均方根误差各减少了20.8%,26.4%和25.6%,极大地提高了预测准确性。
-
关键词
飞行航迹预测
自监督学习
自注意力机制
深度学习
-
Keywords
Flight trajectory prediction
Self-supervised learning
Self-attention
Deep learning
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于动态选择机制的低信噪比单声道语音增强算法
被引量:1
- 3
-
-
作者
台文鑫
王钇翔
李森
蓝天
刘峤
-
机构
电子科技大学信息与软件工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2021年第9期2604-2608,共5页
-
基金
国家自然科学基金项目(U19B2028,61772117)
科技委创新特区项目(19-163-21-TS-001-042-01)
+1 种基金
提升政府治理能力大数据应用技术国家工程实验室重点项目(10-2018039)
中央高校基本科研业务费项目(ZYGX2019J077)。
-
文摘
为了提升模型在复杂场景下的信息处理能力,提出了一种基于注意力的动态选择机制,根据当前信息选择性地分配权重,有效融合形变卷积和普通卷积的特征输出,自适应地在卷积形变和标准卷积之间进行权衡,从而提高其表示能力。此外,通过借鉴渐进学习,在不增加额外参数的前提下,通过循环迭代的方式进一步增强了模型的学习能力。在TIMIT公开语料库上使用七种来自NoiseX92的不同噪声,在多种信噪比环境下进行实验,结果表明无论信噪比高低,噪声是否在训练数据集中出现,所提出的算法在可懂度和语音质量等客观评价指标上均优于近期其他的深度学习算法。
-
关键词
语音增强
低信噪比
动态选择机制
形变卷积
渐进学习
-
Keywords
speech enhancement
low SNR
dynamic selection
deformable convolution
progressive learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于区域自适应多尺度卷积的单声道语音增强算法
被引量:1
- 4
-
-
作者
王钇翔
吕忆蓝
台文鑫
孙建强
蓝天
-
机构
电子科技大学信息与软件工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2021年第11期3264-3267,共4页
-
基金
国家自然科学基金资助项目(U19B2028,61772117)
科技委创新特区资助项目(19-163-21-TS-001-042-01)
+1 种基金
提升政府治理能力大数据应用技术国家工程实验室重点项目(10-2018039)
中央高校基本科研业务费资助项目(ZYGX2019J077)。
-
文摘
卷积神经网络的感受野大小与卷积核的尺寸相关,传统的卷积采用了固定大小的卷积核,限制了网络模型的特征感知能力;此外,卷积神经网络使用参数共享机制,对空间区域中所有的样本点采用了相同的特征提取方式,然而带噪频谱图噪声信号与干净语音信号的分布存在差异,特别是在复杂噪声环境下,使得传统卷积方式难以实现高质量的语音信号特征提取和过滤。为了解决上述问题,提出了多尺度区域自适应卷积模块,利用多尺度信息提升模型的特征感知能力;根据对应采样点的特征值自适应地分配区域卷积权重,实现区域自适应卷积,提升模型过滤噪声的能力。在TIMIT公开数据集上的实验表明,提出的算法在语音质量和可懂度的评价指标上取得了更优的实验结果。
-
关键词
语音增强
卷积神经网络
多尺度卷积
区域自适应
-
Keywords
speech enhancement
convolutional neural network
multi-scale convolution
region-aware
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-