期刊文献+
共找到202篇文章
< 1 2 11 >
每页显示 20 50 100
Multi-Scale Mixed Attention Tea Shoot Instance Segmentation Model
1
作者 Dongmei Chen Peipei Cao +5 位作者 Lijie Yan Huidong Chen Jia Lin Xin Li Lin Yuan Kaihua Wu 《Phyton-International Journal of Experimental Botany》 SCIE 2024年第2期261-275,共15页
Tea leaf picking is a crucial stage in tea production that directly influences the quality and value of the tea.Traditional tea-picking machines may compromise the quality of the tea leaves.High-quality teas are often... Tea leaf picking is a crucial stage in tea production that directly influences the quality and value of the tea.Traditional tea-picking machines may compromise the quality of the tea leaves.High-quality teas are often handpicked and need more delicate operations in intelligent picking machines.Compared with traditional image processing techniques,deep learning models have stronger feature extraction capabilities,and better generalization and are more suitable for practical tea shoot harvesting.However,current research mostly focuses on shoot detection and cannot directly accomplish end-to-end shoot segmentation tasks.We propose a tea shoot instance segmentation model based on multi-scale mixed attention(Mask2FusionNet)using a dataset from the tea garden in Hangzhou.We further analyzed the characteristics of the tea shoot dataset,where the proportion of small to medium-sized targets is 89.9%.Our algorithm is compared with several mainstream object segmentation algorithms,and the results demonstrate that our model achieves an accuracy of 82%in recognizing the tea shoots,showing a better performance compared to other models.Through ablation experiments,we found that ResNet50,PointRend strategy,and the Feature Pyramid Network(FPN)architecture can improve performance by 1.6%,1.4%,and 2.4%,respectively.These experiments demonstrated that our proposed multi-scale and point selection strategy optimizes the feature extraction capability for overlapping small targets.The results indicate that the proposed Mask2FusionNet model can perform the shoot segmentation in unstructured environments,realizing the individual distinction of tea shoots,and complete extraction of the shoot edge contours with a segmentation accuracy of 82.0%.The research results can provide algorithmic support for the segmentation and intelligent harvesting of premium tea shoots at different scales. 展开更多
关键词 Tea shoots attention mechanism multi-scale feature extraction instance segmentation deep learning
下载PDF
Human Visual Attention Mechanism-Inspired Point-and-Line Stereo Visual Odometry for Environments with Uneven Distributed Features
2
作者 Chang Wang Jianhua Zhang +2 位作者 Yan Zhao Youjie Zhou Jincheng Jiang 《Chinese Journal of Mechanical Engineering》 SCIE EI CAS CSCD 2023年第3期191-204,共14页
Visual odometry is critical in visual simultaneous localization and mapping for robot navigation.However,the pose estimation performance of most current visual odometry algorithms degrades in scenes with unevenly dist... Visual odometry is critical in visual simultaneous localization and mapping for robot navigation.However,the pose estimation performance of most current visual odometry algorithms degrades in scenes with unevenly distributed features because dense features occupy excessive weight.Herein,a new human visual attention mechanism for point-and-line stereo visual odometry,which is called point-line-weight-mechanism visual odometry(PLWM-VO),is proposed to describe scene features in a global and balanced manner.A weight-adaptive model based on region partition and region growth is generated for the human visual attention mechanism,where sufficient attention is assigned to position-distinctive objects(sparse features in the environment).Furthermore,the sum of absolute differences algorithm is used to improve the accuracy of initialization for line features.Compared with the state-of-the-art method(ORB-VO),PLWM-VO show a 36.79%reduction in the absolute trajectory error on the Kitti and Euroc datasets.Although the time consumption of PLWM-VO is higher than that of ORB-VO,online test results indicate that PLWM-VO satisfies the real-time demand.The proposed algorithm not only significantly promotes the environmental adaptability of visual odometry,but also quantitatively demonstrates the superiority of the human visual attention mechanism. 展开更多
关键词 Visual odometry Human visual attention mechanism Environmental adaptability Uneven distributed features
下载PDF
Adaptive spatio-temporal attention neural network for cross-database micro-expression recognition
3
作者 Yuhan RAN 《Virtual Reality & Intelligent Hardware》 2023年第2期142-156,共15页
Background The use of micro-expression recognition to recognize human emotions is one of the most critical challenges in human-computer interaction applications. In recent years, cross-database micro-expression recogn... Background The use of micro-expression recognition to recognize human emotions is one of the most critical challenges in human-computer interaction applications. In recent years, cross-database micro-expression recognition(CDMER) has emerged as a significant challenge in micro-expression recognition and analysis. Because the training and testing data in CDMER come from different micro-expression databases, CDMER is more challenging than conventional micro-expression recognition. Methods In this paper, an adaptive spatio-temporal attention neural network(ASTANN) using an attention mechanism is presented to address this challenge. To this end, the micro-expression databases SMIC and CASME II are first preprocessed using an optical flow approach,which extracts motion information among video frames that represent discriminative features of micro-expression.After preprocessing, a novel adaptive framework with a spatiotemporal attention module was designed to assign spatial and temporal weights to enhance the most discriminative features. The deep neural network then extracts the cross-domain feature, in which the second-order statistics of the sample features in the source domain are aligned with those in the target domain by minimizing the correlation alignment(CORAL) loss such that the source and target databases share similar distributions. Results To evaluate the performance of ASTANN, experiments were conducted based on the SMIC and CASME II databases under the standard experimental evaluation protocol of CDMER. The experimental results demonstrate that ASTANN outperformed other methods in relevant crossdatabase tasks. Conclusions Extensive experiments were conducted on benchmark tasks, and the results show that ASTANN has superior performance compared with other approaches. This demonstrates the superiority of our method in solving the CDMER problem. 展开更多
关键词 Cross-database micro-expression recognition Deep learning attention mechanism Domain adaption
下载PDF
Prediction of seawater pH by bidirectional gated recurrent neural network with attention under phase space reconstruction:case study of the coastal waters of Beihai,China
4
作者 Chongxuan Xu Ying Chen +2 位作者 Xueliang Zhao Wenyang Song Xiao Li 《Acta Oceanologica Sinica》 SCIE CAS CSCD 2023年第10期97-107,共11页
Marine life is very sensitive to changes in pH.Even slight changes can cause ecosystems to collapse.Therefore,understanding the future pH of seawater is of great significance for the protection of the marine environme... Marine life is very sensitive to changes in pH.Even slight changes can cause ecosystems to collapse.Therefore,understanding the future pH of seawater is of great significance for the protection of the marine environment.At present,the monitoring method of seawater pH has been matured.However,how to accurately predict future changes has been lacking effective solutions.Based on this,the model of bidirectional gated recurrent neural network with multi-headed self-attention based on improved complete ensemble empirical mode decomposition with adaptive noise combined with phase space reconstruction(ICPBGA)is proposed to achieve seawater pH prediction.To verify the validity of this model,pH data of two monitoring sites in the coastal sea area of Beihai,China are selected to verify the effect.At the same time,the ICPBGA model is compared with other excellent models for predicting chaotic time series,and root mean square error(RMSE),mean absolute error(MAE),mean absolute percentage error(MAPE),and coefficient of determination(R2)are used as performance evaluation indicators.The R2 of the ICPBGA model at Sites 1 and 2 are above 0.9,and the prediction errors are also the smallest.The results show that the ICPBGA model has a wide range of applicability and the most satisfactory prediction effect.The prediction method in this paper can be further expanded and used to predict other marine environmental indicators. 展开更多
关键词 seawater pH prediction Bi-gated recurrent neural(GRU)model phase space reconstruction attention mechanism improved complete ensemble empirical mode decomposition with adaptive noise
下载PDF
基于自适应VMD-Attention-BiLSTM的交通流组合预测模型 被引量:12
5
作者 殷礼胜 孙双晨 +2 位作者 魏帅康 田帅帅 何怡刚 《电子测量与仪器学报》 CSCD 北大核心 2021年第7期130-139,共10页
针对短时交通流量序列的非平稳性和随机性的特征,为提高短时交通流预测精度和收敛速度,提出一种基于自适应变分模态分解(VMD)和结合注意力机制层的双向长短时记忆网络(BiLSTM)的组合预测模型。首先,使用自适应变分模态分解将时空交通流... 针对短时交通流量序列的非平稳性和随机性的特征,为提高短时交通流预测精度和收敛速度,提出一种基于自适应变分模态分解(VMD)和结合注意力机制层的双向长短时记忆网络(BiLSTM)的组合预测模型。首先,使用自适应变分模态分解将时空交通流量序列分解为一系列有限带宽模态分量,细化了交通流信息,降低了非平稳性,提升了建模的精确度;其次,利用结合注意力机制的双向长短时记忆网络挖掘分解后交通流量序列中的时空相关性,从而揭示其时空变化规律,从而进一步提升了建模精确度,并且利用改进Adam算法进行网络权值优化,以加速了预测网络的训练收敛速度;最后,将各模态分量预测值叠加求和作为最终交通流预测值。实验结果表明,使用模态分解的预测模型预测性能明显优于未使用模态分解的预测模型,同时自适应VMD-Attention-BiLSTM预测模型相较于EEMD-Attention-BiLSTM预测模型,均方根误差降低了47.1%,该组合预测模型提升了预测精度,并且能够快速预测交通流量时间序列。 展开更多
关键词 短时交通流预测 自适应变分模态分解 双向长短时记忆网络 注意力机制
下载PDF
基于分层Attention机制的Bi-GRU中文文本分类模型
6
作者 胡玉兰 赵青杉 +1 位作者 牛永洁 陈莉 《长春师范大学学报》 2021年第2期39-45,共7页
针对基于神经网络的文本分类模型在训练过程中容易发生过拟合及忽略句子中的关键词的问题,提出了一种基于分层Attention机制的Bi-GRU中文文本分类模型。该模型引入了分层的思想,利用双向门控循环神经网络学习词层面和句子层面的文本表示... 针对基于神经网络的文本分类模型在训练过程中容易发生过拟合及忽略句子中的关键词的问题,提出了一种基于分层Attention机制的Bi-GRU中文文本分类模型。该模型引入了分层的思想,利用双向门控循环神经网络学习词层面和句子层面的文本表示,采用Self-Attention层次模型获取词和句子对于文本分类影响程度的信息;通过绑定共享嵌入层和softmax层之间的权重,在减少模型中参数的同时采用AMSBound优化方法快速有效地获取最优权重矩阵。对常用的两个中文数据集Fudan Set和THUCNews,本文模型对中文较长文本分类数据集Fudan Set进行实验,实验结果表明,本文模型在精度、召回率、F-score等指标上均优于Text-CNN模型、Attention-BiLSTM模型、Bi-GRU_CNN模型,精度、召回率、F-score指标分别提高了5.9%、5.8%、4.6%。 展开更多
关键词 中文文本分类 双向门控循环单元 分层注意力机制 权重绑定 自适应边界梯度优化法
下载PDF
基于融合注意力机制LSTM网络的地下水位自适应鲁棒预测 被引量:2
7
作者 佃松宜 厉潇滢 +2 位作者 杨丹 芮胜阳 郭斌 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第1期54-64,共11页
地下水水位是旱天污水管网地下水入渗量的重要影响因素,快速精准地预测地下水水位能有效提升旱天污水管网地下水入渗量估算准确度,辅助优化管网病害治理与维护策略。针对目前城市复杂水文预测存在的准确度低、灵敏度低、泛化能力弱等问... 地下水水位是旱天污水管网地下水入渗量的重要影响因素,快速精准地预测地下水水位能有效提升旱天污水管网地下水入渗量估算准确度,辅助优化管网病害治理与维护策略。针对目前城市复杂水文预测存在的准确度低、灵敏度低、泛化能力弱等问题,本文提出了一种新的鲁棒自适应水位预测算法。首先,对水文数据进行预处理,解决了数据时间跨度大、噪声多、缺失及异常、非平稳等问题。其次,针对不同输入特征对预测指标的影响,在模型训练阶段提出一种新的空间变量注意机制,可快速识别与水位关联的关键变量,并对输入特征赋予不同的影响权重。然后,针对不同序列长度对预测效果的影响,还设计了自适应时间注意力机制,帮助网络自适应地找出与不同时间序列长度预测指标相关的编码器隐藏状态,以更好地捕捉时间上的依赖关系。在此基础上,以上下文向量作为输入,提出一种融合注意力机制的长短时记忆网络水文预测算法。最后,通过意大利Petrignano水文数据验证了所提算法的有效性,并与GRU、Elman、LSTM、VA–LSTM和S–LSTM等方法进行预测性能比较。结果表明,基于融合注意力机制的LSTM网络在面临大规模、噪点多的复杂数据时有优于其它几种算法的预测效果,表明该算法具有强自适应性和鲁棒性。本文研究结果可以为市政排水策略合理调整、及时控制提供参考。 展开更多
关键词 地下水位预测 时间与空间注意力机制 LSTM网络 自适应预测 鲁棒预测
下载PDF
基于动态自适应图神经网络的电动汽车充电负荷预测
8
作者 张延宇 张智铭 +2 位作者 刘春阳 张西镚 周毅 《电力系统自动化》 EI CSCD 北大核心 2024年第7期86-93,共8页
电动汽车充电站负荷波动的不确定性与长时间预测任务给提升充电负荷预测精度带来巨大的挑战。文中提出一种基于动态自适应图神经网络的电动汽车充电负荷预测算法。首先,构建了一个充电负荷信息时空关联特征提取层,将多头注意力机制与自... 电动汽车充电站负荷波动的不确定性与长时间预测任务给提升充电负荷预测精度带来巨大的挑战。文中提出一种基于动态自适应图神经网络的电动汽车充电负荷预测算法。首先,构建了一个充电负荷信息时空关联特征提取层,将多头注意力机制与自适应相关图结合生成具有时空关联性的综合特征表达式,以捕获充电站负荷的波动性;然后,将提取的特征输入到时空卷积层,捕获时间和空间之间的耦合关系;最后,通过切比雪夫多项式图卷积与多尺度时间卷积提升模型耦合长时间序列之间的能力。以Palo Alto数据集为例,与现有方法相比,所提算法在4种波动情况下的平均预测误差大幅降低。 展开更多
关键词 电动汽车 负荷预测 时空关联特征 自适应图神经网络 注意力机制 时空卷积层
下载PDF
基于改进边缘注意力生成对抗网络的电力设备热成像超分辨率重建
9
作者 王艳 连洪钵 +2 位作者 王寅初 康磊 赵洪山 《电力系统保护与控制》 EI CSCD 北大核心 2024年第3期119-127,共9页
针对低分辨率电力设备热成像图像,提出一种基于改进边缘注意力生成对抗网络的超分辨率重建方法。首先,在边缘注意力的基础上,引入通道注意力和位置注意力的双注意力模块(dual attention, DA),捕获特征图不同位置间和不同通道间的依赖关... 针对低分辨率电力设备热成像图像,提出一种基于改进边缘注意力生成对抗网络的超分辨率重建方法。首先,在边缘注意力的基础上,引入通道注意力和位置注意力的双注意力模块(dual attention, DA),捕获特征图不同位置间和不同通道间的依赖关系,并将两组依赖关系进行融合,以加大全局信息的提取程度。然后针对参数修正线性单元激活函数(parametric rectified linear unit, PReLU)对网络中神经元进行无差别激活,导致网络特征表达能力受限问题。采用改进β-ACONC自适应控制激活函数替代PRe LU函数,在辨识有效特征的基础上,对神经元进行选择性激活,以强化有效特征、弱化无效特征,提升网络的自适应激活能力和特征表达能力。最后对所提改进边缘注意力生成对抗网络模型(edge-attention generative adversarial network, EA-GAN)进行实验验证。结果表明,与Bi Cubic双三次插值模型和原EA-GAN模型边缘注意力生成对抗网络模型相比,所提改进模型网络性能最好,重建图像质量最高,客观评价指标峰值信噪比(peaksignal-to-noiseratio, PSNR)均值、结构相似性(structural similarity,SSIM)均值和均方误差损失(mean square error loss, MSE-loss)均值最优,在电力设备红外图像重建领域普适性较高,具有一定的工程应用价值。 展开更多
关键词 热成像 超分辨率重建 注意力机制 自适应激活函数
下载PDF
跨域人脸活体检测的单边对抗网络算法
10
作者 曾凡智 吴楚涛 周燕 《计算机工程与应用》 CSCD 北大核心 2024年第5期103-111,共9页
现有跨域人脸活体检测算法,其特征提取过程容易发生过拟合和缺乏特征聚合所导致的泛化性不足问题。针对该问题,提出了跨域人脸活体检测的单边对抗网络算法,将分组卷积与改进的倒残差结构融合替换普通卷积,降低网络参数同时加强人脸细粒... 现有跨域人脸活体检测算法,其特征提取过程容易发生过拟合和缺乏特征聚合所导致的泛化性不足问题。针对该问题,提出了跨域人脸活体检测的单边对抗网络算法,将分组卷积与改进的倒残差结构融合替换普通卷积,降低网络参数同时加强人脸细粒度特征的表达能力,并引入自适应特征归一化模块,强调图像中人脸活体信息区域淡化无关背景区域,有效避免人脸活体信息的过拟合并加强来自不同源域的人脸活体检测能力。基于NetVLAD引入通道注意力机制模块,通道注意力机制模块作为特征聚合网络的分支,学习不同源域中人脸局部特征的语义信息,有效增强对不同源域的人脸活体信息分类的泛化能力。设计两模块融合网络以提高未知场景下跨域人脸活体检测精度。在OULU-NPU、CASIA-FASD、MSU-MFSD和Idiap Replay-Attack数据集上的实验结果表明,该算法在跨数据集测试O&C&M to I、O&C&I to M、I&C&M to O、O&M&I to C均有不错的表现,其中,在O&C&I to M及O&M&I to C性能评估指标分别提升了0.99个百分点和0.5个百分点的精度。 展开更多
关键词 域泛化 生成对抗网络 人脸活体检测 自适应归一化 注意力机制
下载PDF
基于增强多头注意力机制的Optuna-BiGRU测井岩性识别
11
作者 王婷婷 王振豪 +1 位作者 李方 赵万春 《地球科学与环境学报》 CAS 北大核心 2024年第1期127-142,共16页
测井岩性识别是油气勘探开发中至关重要的内容。针对现有算法模型在处理测井曲线数据时,无法有效捕获曲线内部深层关联和深度方向关系、拟合能力较弱、难以准确提取关键特征、噪声干扰以及模型超参数调优过程复杂困难等问题,提出了一种... 测井岩性识别是油气勘探开发中至关重要的内容。针对现有算法模型在处理测井曲线数据时,无法有效捕获曲线内部深层关联和深度方向关系、拟合能力较弱、难以准确提取关键特征、噪声干扰以及模型超参数调优过程复杂困难等问题,提出了一种通过Optuna超参数优化双向门循环单元(Optuna-BiGRU)结合增强多头注意力机制(EMHA)的测井岩性识别模型——Optuna-BiGRU-EMHA模型。该模型引入残差机制和层归一化以改进多头注意力机制模块,并结合双向门循环单元(BiGRU)解决了处理测井数据时的问题,同时使用Optuna超参数优化框架和小波包自适应阈值方法分别解决了超参数调优和噪声干扰问题。首先通过交会图分析和敏感性箱线图分析选取自然伽马、深感应电阻率、中子-密度孔隙度、平均中子-密度孔隙度和岩性密度5个特征参数的测井数据,通过小波包自适应阈值方法对数据进行去噪,并将测井数据分割成数据块,然后利用Optuna框架优化BiGRU-EMHA模型超参数,最后通过实验对比K-近邻算法(KNN)、随机森林(RF)、极端梯度提升算法(XGBoost)、长短期记忆(LSTM)神经网络、BiGRU、双向长短期记忆(BiLSTM)神经网络、BiGRU-MHA、Optuna-BiGRU-EMHA等8种模型在测井岩性识别中的精度。结果表明:Optuna-BiGRU-EMHA模型识别准确率达到80%,相对于传统机器学习模型和深度学习模型,综合岩性识别准确率分别提高15.94%~23.14%和3.93%~15.94%,该模型为常规测井岩性识别提供了坚实的理论支持。 展开更多
关键词 岩性识别 深度学习 BiGRU 增强多头注意力机制 小波包自适应阈值 超参数优化
下载PDF
基于改进YOLOv5的无人机影像道路裂缝检测方法
12
作者 朱伟刚 汪伦 +1 位作者 陈田 邹博文 《测绘通报》 CSCD 北大核心 2024年第3期173-178,共6页
道路裂缝的出现对道路使用寿命和人车安全带来明显影响,需及时检测出道路裂缝。针对无人机影像中裂缝目标小、图像背景复杂导致检测精度低等问题,本文以无人机采集裂缝图像作为研究数据,提出了一种改进YOLOv5模型的深度学习道路裂缝检... 道路裂缝的出现对道路使用寿命和人车安全带来明显影响,需及时检测出道路裂缝。针对无人机影像中裂缝目标小、图像背景复杂导致检测精度低等问题,本文以无人机采集裂缝图像作为研究数据,提出了一种改进YOLOv5模型的深度学习道路裂缝检测方法。在YOLOv5模型骨干网络中分别加入CBAM、SimAM、CA注意力机制,提高模型对裂缝的识别能力及检测精度,通过消融试验进行对比分析,同时在YOLOv5模型上融入自适应空间特征融合算法,改善裂缝特征提取能力。研究表明,改进后的YOLOv5网络模型相比于原模型,精度得到明显提高,均值平均精度(mAP)提升20.6%,在保证准确性的同时有效提高了检测精度,可为道路裂缝检测提供新的方法。 展开更多
关键词 裂缝检测 YOLOv5 注意力机制 自适应空间特征融合
下载PDF
采用多尺度自适应选择卷积神经网络的轴承故障诊断研究
13
作者 张玺君 尚继洋 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第2期127-135,共9页
针对轴承故障诊断方法中传统多尺度卷积神经网络对不同尺度的特征只是简单拼接,而未考虑不同尺度的特征差异的问题,提出一种多尺度自适应选择卷积神经网络轴承故障诊断模型(MSASCNN)。通过不同大小的宽卷积筛选原始轴承振动信号中的特征... 针对轴承故障诊断方法中传统多尺度卷积神经网络对不同尺度的特征只是简单拼接,而未考虑不同尺度的特征差异的问题,提出一种多尺度自适应选择卷积神经网络轴承故障诊断模型(MSASCNN)。通过不同大小的宽卷积筛选原始轴承振动信号中的特征,合并为初始特征;构建多尺度自适应选择卷积块,提取不同尺度的特征,利用改进的注意力机制自适应调整不同尺度的特征权重,加入残差连接,防止模型退化;通过分类器完成轴承故障诊断。在凯斯西储大学轴承数据集和XJTU-SY轴承数据集上的实验结果表明:在模型改进实验中,与没有改进注意力机制的模型相比,所提模型的轴承故障诊断准确率提升了1.98%;在不同信噪比的噪声干扰环境中,所提模型的轴承故障诊断准确率均高于93%。 展开更多
关键词 轴承故障诊断 卷积神经网络 自适应融合 注意力机制 多尺度特征
下载PDF
融合自注意力和图卷积的多视图群组推荐
14
作者 王永贵 王芯茹 《计算机工程与应用》 CSCD 北大核心 2024年第8期287-295,共9页
为了解决大多数现有的群组推荐仅仅从群组和用户的单一交互中学习群组表示,以及固定融合策略难以动态调整权重的问题。提出了一种融合自注意力和图卷积的多视图群组推荐模型(MVGR),设计了成员级、项目级和组级三个不同的视图,来捕捉群... 为了解决大多数现有的群组推荐仅仅从群组和用户的单一交互中学习群组表示,以及固定融合策略难以动态调整权重的问题。提出了一种融合自注意力和图卷积的多视图群组推荐模型(MVGR),设计了成员级、项目级和组级三个不同的视图,来捕捉群组、用户和项目三者之间的高阶交互信息,缓解数据稀疏问题,增强群组表示建模过程;对于项目级视图,利用基于二分图的图卷积神经网络来学习群组偏好向量以及项目嵌入;进一步提出了自适应融合组件来动态调整不同视图权重,得到最终的群组偏好向量。在两个真实数据集上的实验结果表明,与基线模型相比,MVGR模型的命中率(HR)和归一化折损累计增益(NDCG)在Mafengwo数据集上平均提高了8.89个百分点和1.56个百分点,在CAMRa2011数据集上平均提高了2.79个百分点和2.7个百分点。 展开更多
关键词 群组推荐 自注意力机制 图卷积神经网络 自适应融合
下载PDF
基于图像自适应增强的轻量级雾天车牌检测和识别算法
15
作者 徐望明 袁世鑫 何钦 《武汉科技大学学报》 CAS 北大核心 2024年第2期144-153,共10页
针对雾天图像降质带来的车牌识别难题,提出一种采用图像自适应增强的轻量级车牌检测和识别算法。以目标检测网络YOLOv5s和车牌识别网络LPRNet为基础,设计一个改进的图像自适应增强模块级联于YOLOv5s之前,并引入混合注意力(SA)机制改进LP... 针对雾天图像降质带来的车牌识别难题,提出一种采用图像自适应增强的轻量级车牌检测和识别算法。以目标检测网络YOLOv5s和车牌识别网络LPRNet为基础,设计一个改进的图像自适应增强模块级联于YOLOv5s之前,并引入混合注意力(SA)机制改进LPRNet。图像自适应增强模块由带参数的图像去雾和纹理增强模块以及自适应参数预测模块组成。自适应参数预测模块是轻量级卷积神经网络,与YOLOv5s联合训练,为不同程度的带雾图像自动提供合适的去雾和纹理增强参数以获得更准确的车牌检测结果。利用车牌位置的真实标签和实际检测结果,采用混合注意力机制和迁移学习策略得到最终的SA-LPRNet模型,缓解识别模型对检测结果的敏感性以获得更高的车牌识别准确率。在合成的雾天车牌数据集上的实验结果表明:本文算法对雾天车牌检测的mAP@0.5-0.95指标达到70.6%,车牌识别准确率达到93.5%,优于对比算法,且识别速度满足实时性要求。 展开更多
关键词 车牌识别 图像自适应增强 图像去雾 迁移学习 混合注意力机制 YOLOv5s LPRNet
下载PDF
CEEMDAN-WPE-CLSA超短期风电功率预测方法研究
16
作者 李杰 孟凡熙 +1 位作者 牛明博 张懿璞 《大连交通大学学报》 CAS 2024年第2期101-108,共8页
提出了一种结合自适应噪声完全集合经验模态分解、加权排列熵、卷积神经网络、长短期记忆网络和自注意力机制的超短期风电功率预测方法。首先,利用自适应噪声完全集合经验模态分解将原始风电功率时间序列自适应分解为一系列的模态分量,... 提出了一种结合自适应噪声完全集合经验模态分解、加权排列熵、卷积神经网络、长短期记忆网络和自注意力机制的超短期风电功率预测方法。首先,利用自适应噪声完全集合经验模态分解将原始风电功率时间序列自适应分解为一系列的模态分量,降低原始序列的非线性和波动性;其次,根据加权排列熵计算各模态分量间的相似性并对相似的分量进行重组,以修正自适应噪声完全集合经验模态分解的过度分解问题,使得修正后的模态分量更具规律性;最后,将重组后的分量输入卷积长短期记忆网络进行时序建模,并利用自注意力机制对卷积长短期记忆网络的神经元权重进行重新分配,提高了卷积长短期记忆网络对输入特征不确定性的适应能力。在此基础上,明确了自注意力机制和自适应噪声完全集合经验模态分解、加权排列熵在风电功率预测中的作用机制,以及风电功率信号包含的重要物理信息,证明了自适应噪声完全集合经验模态分解、加权排列熵以及自注意力机制在风电功率信号模态分解和长短期记忆网络隐层输出权重分配中的有效性。 展开更多
关键词 超短期风电功率预测 自适应噪声完全集合经验模态分解 加权排列熵 卷积长短期记忆网络 自注意力机制
下载PDF
引入轻量级Transformer的自适应窗口立体匹配算法
17
作者 王正家 胡飞飞 +2 位作者 张成娟 雷卓 何涛 《计算机工程》 CAS CSCD 北大核心 2024年第2期256-265,共10页
现有端到端的立体匹配算法为了减轻显存消耗和计算量而预设固定视差范围,在匹配精度和运行效率上难以平衡。提出一种基于轻量化Transformer的自适应窗口立体匹配算法。利用具有线性复杂度的坐标注意力层对低分辨率特征图进行位置编码,... 现有端到端的立体匹配算法为了减轻显存消耗和计算量而预设固定视差范围,在匹配精度和运行效率上难以平衡。提出一种基于轻量化Transformer的自适应窗口立体匹配算法。利用具有线性复杂度的坐标注意力层对低分辨率特征图进行位置编码,减轻计算量并增强相似特征的辨别力;设计轻量化Transformer特征描述模块,转换上下文相关的特征,并引入可分离多头自注意力层对Transformer进行轻量化改进,降低Transformer的延迟性;用可微匹配层对特征进行匹配,设计自适应窗口匹配细化模块进行亚像素级的匹配细化,在提高匹配精度的同时减少显存消耗;经视差回归后生成无视差范围的视差图。在KITTI2015、KITTI2012和SceneFlow数据集上的对比实验表明,该算法比基于标准Transformer的STTR在匹配效率上快了近4.7倍,具有更快的运行速度和更友好的存储性能;比基于3D卷积的PSMNet误匹配率降低了18%,运行时间快了5倍,实现了更好的速度和精度的平衡。 展开更多
关键词 立体匹配 TRANSFORMER 自适应窗口 可分离自注意力机制 坐标注意力
下载PDF
内容感知的可解释性路面病害检测模型
18
作者 李傲 葛永新 +2 位作者 刘慧君 杨春华 周修庄 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期701-715,共15页
针对实际场景中高分辨路面图像难以直接作为现有卷积神经网络(convolutional neural network,CNN)的输入、现有预处理及下采样算法无法有效感知并保留原始路面图像中低占比的病害区域信息等问题,借助于可视化解释的技术手段,设计了一种... 针对实际场景中高分辨路面图像难以直接作为现有卷积神经网络(convolutional neural network,CNN)的输入、现有预处理及下采样算法无法有效感知并保留原始路面图像中低占比的病害区域信息等问题,借助于可视化解释的技术手段,设计了一种即插即用的图像内容自适应感知模块(adaptive perception module,APM),既平衡了高分辨路面图像与CNN输入限制,又能够自适应感知激活前景病害区域,从而实现高分辨路面图像中病害类型的快速准确检测,构建可信路面病害视觉检测软件系统.APM利用大卷积核和下采样残差操作降低原始图像分辨率并获取图像浅层特征表示;通过注意力机制自适应感知并激活图像中路面病害区域信息,过滤无关的背景信息.利用联合学习的方式,无需额外监督信息完成对APM的训练.通过可视化解释方法辅助选择和设计APM的具体结构,在最新公开数据集CQUBPMDD上的实验结果表明:APM相比于现有的图像预处理采样算法均有明显提升,分类准确率最高为84.47%;在CQU-BPDD上的实验结果及APM决策效果可视化分析表明APM具备良好的泛化性与鲁棒性.实验代码已开源:https://github.com/Li-Ao-Git/apm. 展开更多
关键词 路面病害检测 可解释性 自适应感知 注意力机制 联合学习
下载PDF
一种通道自适应与局部增强的Transformer术中血压预测方法
19
作者 王尘 蔡晶晶 +4 位作者 郝学超 张伟义 舒红平 王亚强 陈果 《计算机与数字工程》 2024年第1期43-50,98,共9页
准确预测术中患者的血压状态来预防术中低血压,对提高手术安全性和降低术后并发症有积极作用,以往的低血压预测方法主要视为二分类任务,忽略了患者血压变化的过程,从而限制了干预策略的制定。因此提前预测血压的变化趋势,具有更重要的... 准确预测术中患者的血压状态来预防术中低血压,对提高手术安全性和降低术后并发症有积极作用,以往的低血压预测方法主要视为二分类任务,忽略了患者血压变化的过程,从而限制了干预策略的制定。因此提前预测血压的变化趋势,具有更重要的临床研究和应用价值。针对以上问题,对通过监测的术中生理序列实时预测未来5min、10min、15min血压的连续值展开研究,并提出了一种通道自适应与局部增强Transformer模型,该模型采用卷积注意力机制捕捉血压序列的局部相似性,同时提出一种通道自适应模块嵌入模型来建模生理序列潜在交互关系。结果表明,该模型相比于基准模型在5min、10min、15min预测精度分别提升4.88%、8.2%和8.42%,预测的平均动脉压的MAE分别为2.997、3.393、3.743,且显著优于其余对比模型,为术中血压预测提供新的解决方案。 展开更多
关键词 术中血压预测 TRANSFORMER 生理序列 注意力机制 通道自适应
下载PDF
基于改进YOLOv7的换热器板片故障检测算法研究
20
作者 王伯涛 周福强 +1 位作者 吴国新 王少红 《机床与液压》 北大核心 2024年第11期105-113,共9页
针对换热器板片装配检测成本高、检测精度低等问题,提出一种改进的YOLOv7算法检测换热器板片的装反问题。在原始数据集上采用限制对比度自适应直方图均衡化对图像进行处理,提高待检测图像的清晰度;在YOLOv7模型原有基础上,针对换热器板... 针对换热器板片装配检测成本高、检测精度低等问题,提出一种改进的YOLOv7算法检测换热器板片的装反问题。在原始数据集上采用限制对比度自适应直方图均衡化对图像进行处理,提高待检测图像的清晰度;在YOLOv7模型原有基础上,针对换热器板片层数较多、模糊且噪点多,提出一种多级自适应注意力机制添加至Backbone最后一层;针对图像识别模型计算量大、下采样特征损失严重,采用改进的MP-D模块优化原有的下采样模块;针对特征提取部分,加入F-ReLU激活函数,使得计算速度和检测准确性有了明显提高;针对Neck部分的PANet结构,融合BiFPN跨尺度连接的思想,进一步提高融合的效率和准确性。通过实验可得,改进后的网络模型和初始YOLOv7相比,mAP@0.5、召回率R、检测速度分别提高0.6%、2%、16.9帧/s,针对换热器板片检测具有良好效果。 展开更多
关键词 换热器板片 YOLOv7 多级自适应注意力机制 MP-D模块 BiFPN
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部