期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于改进扩散模型的温度预报
1
作者 方巍 袁众 薛琼莹 《中国科技论文》 CAS 2024年第2期215-223,共9页
针对传统数值预报模式计算时间长和计算资源消耗大的问题,以及现有深度学习预报方法在温度预报结果上不精确,且预测结果模糊的问题,提出了一个新的温度预报模型。首先,设计了一个时空信息捕捉模块,将该模块捕获的长期依赖信息,作为扩散... 针对传统数值预报模式计算时间长和计算资源消耗大的问题,以及现有深度学习预报方法在温度预报结果上不精确,且预测结果模糊的问题,提出了一个新的温度预报模型。首先,设计了一个时空信息捕捉模块,将该模块捕获的长期依赖信息,作为扩散模型的生成条件,赋予扩散模型预报的能力;其次,设计了一个新的平衡损失函数,同时保护了扩散模型的生成能力和时空信息捕捉模块对时空信息的捕捉能力;最后,基于美国国家环境预报中心的再分析数据进行预报,与现有的深度学习方法相比,所提模型预报结果的质量在均方误差(mean square error,MSE)上降低了17.3%,在均方根误差(root mean square error,RMSE)上降低了9.14%,在峰值信噪比(peak signal to noise ratio,PSNR)上提升了5.1%。改进的扩散模型能有效地捕捉时空依赖的关系,有效地进行时空序列预测,效果优于其他对比方法。 展开更多
关键词 时空序列预测 深度学习 扩散模型 时空捕捉模块 平衡损失函数
下载PDF
融合动态场景感知和注意力机制的声学回声消除算法
2
作者 许春冬 黄乔月 +1 位作者 王磊 徐锦武 《信号处理》 CSCD 北大核心 2024年第2期396-405,共10页
在实时语音频通话系统中,如何去除声学回声得到清晰语音是目前最受关注的难题之一。声学回声消除(Acoustic echo cancellation,AEC)技术旨在消除语音频通话系统中的声学回声,提高通话过程中的语音质量,给予用户良好的通话体验,但是传统... 在实时语音频通话系统中,如何去除声学回声得到清晰语音是目前最受关注的难题之一。声学回声消除(Acoustic echo cancellation,AEC)技术旨在消除语音频通话系统中的声学回声,提高通话过程中的语音质量,给予用户良好的通话体验,但是传统回声消除系统存在去回声效果不明显、存在非线性回声残留以及无法实时处理回声等问题。因此,为解决上述存在问题,提出了一种动态场景感知模块(Dynamic scene perception module,DSPM)和全局注意力机制(Global attention mechanism,GAM)相结合的声学回声消除算法。该算法以卷积循环网络(Convolutional recurrent network,CRN)作为基线模型,提取语音信号的序列特征;首先,在其编码器中引入DSPM模块替换原因果卷积,根据场景动态分配卷积内核数量,加强模型的自适应性;其次,在编码器最后两层中分别引入GAM模块,放大空间通道间关系以及统筹全局交互,提升对语音信号特征的提取能力以及消除回声的性能;最后,通过将MSE损失函数和HuberLoss损失函数线性相加生成一种新的损失函数——MSE-HuberLoss,进一步提高模型的鲁棒性。实验结果表明,提出的GAM-DSPM-CRN模型的回声消除性能优秀,且获得较基线模型更加清晰的重构语音信号;在双端通话环境下,提出的GAM-DSPM-CRN模型声学回声消除算法较其他对比算法性能有较大提升;在Microsoft AEC Challenges数据集上,MOS、ERLE和STOI的得分分别达到了4.09、57.43和0.78。 展开更多
关键词 声学回声消除 动态场景感知模块 全局注意力机制 卷积循环网络 联合损失函数
下载PDF
基于虚拟点云的二阶段多模态融合网络
3
作者 程腾 倪昊 +2 位作者 张强 王文冲 石琴 《汽车工程》 EI CSCD 北大核心 2024年第2期222-229,共8页
针对点云的稀疏性和无序性对目标检测准确率的影响,本文提出了一种基于虚拟点云的二阶段多模态融合网络VPC-VoxelNet。首先,利用图像检测目标信息构造虚拟点云,增加点云的密集程度,从而提高目标特征的表现;其次,增加点云特征维度以区分... 针对点云的稀疏性和无序性对目标检测准确率的影响,本文提出了一种基于虚拟点云的二阶段多模态融合网络VPC-VoxelNet。首先,利用图像检测目标信息构造虚拟点云,增加点云的密集程度,从而提高目标特征的表现;其次,增加点云特征维度以区分真实和虚拟点云,并使用含置信度编码的体素,增强点云的相关性;最后,采用虚拟点云的比例系数设计损失函数,增加图像检测有监督训练,提高二阶段网络训练效率,避免二阶段端到端网络模型存在的模型误差累计问题。该目标检测网络VPC-VoxelNet在KITTI数据集上进行了测试,检测精度优于经典三维点云检测网络和某些多传感器信息融合网络,车辆检测精度达到了86.9%。 展开更多
关键词 目标检测 多模态感知 虚拟点云 损失函数
下载PDF
基于改进YOLOX-s的机场跑道冰雪状态感知
4
作者 邢志伟 阚犇 +2 位作者 刘子硕 李彪 罗谦 《上海交通大学学报》 EI CAS CSCD 北大核心 2023年第10期1292-1304,共13页
针对机场冰雪跑道安全性和适航性状态感知能力不足及跑道表面状况报告交互的新需求,提出一种面向多尺度特征融合的机场跑道冰雪状态感知模型.以YOLOX-s模型为基础,在主干特征提取网络中引入全局上下文模块,获取更丰富的浅层与深层特征;... 针对机场冰雪跑道安全性和适航性状态感知能力不足及跑道表面状况报告交互的新需求,提出一种面向多尺度特征融合的机场跑道冰雪状态感知模型.以YOLOX-s模型为基础,在主干特征提取网络中引入全局上下文模块,获取更丰富的浅层与深层特征;将颈部结构中路径聚合网络替换为双向特征金字塔,以提升特征融合能力;在加强特征提取网络尾部添加自适应空间特征融合结构,进一步增强特征融合效果;使用α-EIoU优化损失函数,提高模型收敛速度与精度.实验结果表明,改进后的YOLOX-s模型在跑道冰雪实验系统所得的冰雪污染物数据集上平均精度达到了91.53%,比原始的YOLOX-s模型提高了4.68%,能够为机场跑道除冰雪作业提供决策支持. 展开更多
关键词 跑道冰雪状态感知 YOLOX-s 全局上下文模块 双向特征金字塔网络 自适应空间特征融合结构 α-EIoU损失函数
下载PDF
一种深度级联网络结构的单帧超分辨重建算法 被引量:4
5
作者 王飞 王伟 邱智亮 《光电工程》 CAS CSCD 北大核心 2018年第7期37-46,共10页
利用深度学习进行超分辨重建已经获得了极大的成功,但是目前绝大多数网络结构依然存在训练以及重建速度较慢,一个模型仅能重建一个尺度以及重建图像过于平滑等问题。针对这些问题,本文设计了一种级联的网络结构(DCN)来逐级对图像进行重... 利用深度学习进行超分辨重建已经获得了极大的成功,但是目前绝大多数网络结构依然存在训练以及重建速度较慢,一个模型仅能重建一个尺度以及重建图像过于平滑等问题。针对这些问题,本文设计了一种级联的网络结构(DCN)来逐级对图像进行重建。使用L2和感知损失函数共同优化网络,在每一级的共同作用下得到了最终高质量的重建图像。此外,本文的方法可以同时重建多个尺度,比如4?的模型可以重建1.5?,2?,2.5?,3?,3.5?,4?。在几个常用数据集上的实验表明,该方法在准确性和视觉效果均优于现有的方法。 展开更多
关键词 深度学习 超分辨 逐级 多尺度 感知损失函数
下载PDF
一种基于条件生成对抗网络的高感知图像压缩方法 被引量:5
6
作者 张雪峰 许华文 杨棉子美 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第6期783-791,共9页
针对如何获得符合人类视觉感知的压缩图像问题,提出了基于条件生成对抗网络的图像压缩模型(HPIC).在HPIC中,首先利用一个超先验概率模型对原始图像进行编码量化,将条件附加标签和残差模块相结合的生成器用于压缩图像的重建,基于深度卷... 针对如何获得符合人类视觉感知的压缩图像问题,提出了基于条件生成对抗网络的图像压缩模型(HPIC).在HPIC中,首先利用一个超先验概率模型对原始图像进行编码量化,将条件附加标签和残差模块相结合的生成器用于压缩图像的重建,基于深度卷积神经网络搭建的判别器则用于区分压缩后的图像和真实图像间的差异.损失函数是基于比特率-失真-感知优化理论来设计的,一方面选用基于预训练Inception网络特征值的感知失真指标来实现具有高感知质量的图像压缩重建,另一方面利用生成对抗网络损失来消除压缩伪影,提高压缩精度.实验结果表明,HPIC在比特率-失真-感知三重权衡中取得了较好的平衡,即使目前的常见算法使用两倍于本文算法的比特率,本文算法在所有的感知指标得分上均优于前者,HPIC仍能够实现具有高感知质量的压缩. 展开更多
关键词 图像压缩 比特率-失真-感知优化理论 条件生成对抗网络 损失函数
下载PDF
基于残差细化和边界感知的显著性检测
7
作者 郑陈怡 祝忠明 +1 位作者 罗聪敏 郭明昊 《科技通报》 2021年第2期72-74,共3页
针对目前显著性检测算法精度不高、目标边缘模糊等问题,本文提出一种基于残差细化和边界感知的显著性检测算法。其中残差细化充分利用高层语义特征和低层细节特征得到信息较为完整的显著图,而边界感知能关注到更多的边缘细节信息,解决... 针对目前显著性检测算法精度不高、目标边缘模糊等问题,本文提出一种基于残差细化和边界感知的显著性检测算法。其中残差细化充分利用高层语义特征和低层细节特征得到信息较为完整的显著图,而边界感知能关注到更多的边缘细节信息,解决目标边缘模糊的问题。实验表明,通过定性和定量比较,本文算法的精确度和准确度都得到了提高,且有效解决了目标边界模糊的问题。 展开更多
关键词 残差细化 边界感知 混合损失函数 显著性检测
下载PDF
基于多尺度特征融合的语音频带扩展
8
作者 许春冬 朱诚 +1 位作者 应冬文 董桂官 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第9期132-139,共8页
针对现有的深度学习模型在语音频带扩展领域数据特征利用不充分、训练周期长以及生成语音质量不高等问题,提出了一种新型的端到端神经网络模型,该模型通过融合不同数据维度特征促使网络模型利用更少的数据特征量,获取更多的低高频映射... 针对现有的深度学习模型在语音频带扩展领域数据特征利用不充分、训练周期长以及生成语音质量不高等问题,提出了一种新型的端到端神经网络模型,该模型通过融合不同数据维度特征促使网络模型利用更少的数据特征量,获取更多的低高频映射关系解,从而减少模型的整体训练周期.为了提高长时序数据中关键特征的权重占比,设计了一种残差多头自注意力机制,从而达到数据特征利用率的最大化.此外,提出了一种基于时频域和Mel频谱的混合损失函数对模型进行优化.实验结果表明:该方法重构的宽带语音在主客观的评价中均优于传统方法和近年来的一些基于神经网络的语音频带扩展方法. 展开更多
关键词 语音频带扩展 深度学习 自注意力机制 时频感知损失函数
原文传递
Deep learning characterization of rock conditions based on tunnel boring machine data
9
作者 Xu Li Min Yao +2 位作者 Ji-dong Yuan Yu-jie Wang Peng-yu Li 《Underground Space》 SCIE EI CSCD 2023年第5期89-101,共13页
Rock condition perception based on tunnel boring machine(TBM)data is of great importance for not only ensuring tunnel boring safety but also improving construction efficiency.The prediction of TBM boring responses(i.e... Rock condition perception based on tunnel boring machine(TBM)data is of great importance for not only ensuring tunnel boring safety but also improving construction efficiency.The prediction of TBM boring responses(i.e.,torque and total thrust of the cutterhead)largely determines the reliability of rock condition perception.In this paper,a new architecture of a two-dimensional convolutional neural network(2D-CNN)with a dual-input strategy is proposed to predict the TBM responses.The TBM Lot 3 of the Yinsong project in Jilin province,China,is taken as the case study in this paper.Two types of models that follow different learning strategies are compared:one is defined as the point model,which only learns data of the stable phase,and the other is defined as the line model,which learns data from both the loading and stable boring phases.The line model is further improved by the weighted loss function method.The results indicate that the strategy of learning data from both the loading phase and stable boring phase and increasing the weight of samples from the stable phase is shown to be optimal in predicting TBM boring responses.In terms of learning strategies,the line model can learn the influence of active control parameters on passive response parameters,but the point model cannot.In terms of machine learning algorithms,2D-CNN has the best performance,with R2 values of 0.865 and 0.923 for torque and total thrust,respectively.The proposed line model can overcome the problem that the traditional model failed to learn the influence of control parameters.Such a model can provide a solid base for the timely optimization of the control parameters in TBM boring process. 展开更多
关键词 TBM Rock condition perception 2D-CNN Weighted loss function Line model
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部