期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于DO-Conv改进的端到端车牌识别算法 被引量:1
1
作者 赖珍向 丁磊 +1 位作者 邓杰航 顾国生 《计算机科学与应用》 2021年第3期588-595,共8页
提出了基于DO-Conv改进的端到端车牌识别算法,该算法引入一种新颖的深度过参数化卷积(Depthwise Over-Parameterized Convolutional Layer, DO-Conv),用于替换常规卷积,提升图像特征提取的有效性,从而提高车牌识别的准确率。研究结果表... 提出了基于DO-Conv改进的端到端车牌识别算法,该算法引入一种新颖的深度过参数化卷积(Depthwise Over-Parameterized Convolutional Layer, DO-Conv),用于替换常规卷积,提升图像特征提取的有效性,从而提高车牌识别的准确率。研究结果表明:改进后的算法在合成数据集和SYSU数据集上的识别准确率分别为97.42%和95.08%,均优于使用传统卷积的端到端识别算法。 展开更多
关键词 车牌识别 端到端 深度过参数化卷积 do-conv
下载PDF
基于DO-Conv的DBNet文本检测方法研究 被引量:2
2
作者 曾祥福 钟维良 +1 位作者 郑阳超 陈海钦 《工业控制计算机》 2022年第11期100-101,103,共3页
目前,文本检测任务主要有基于回归的方法和基于分割的方法,基于回归的方法能够完成一般的文本检测任务,但是较难处理弯曲文本,基于分割的方法利用了图像分割,通过后处理的方式可以检测弯曲文本,得到较好的包围曲线,但是同时也增加了处... 目前,文本检测任务主要有基于回归的方法和基于分割的方法,基于回归的方法能够完成一般的文本检测任务,但是较难处理弯曲文本,基于分割的方法利用了图像分割,通过后处理的方式可以检测弯曲文本,得到较好的包围曲线,但是同时也增加了处理的步骤和预测的时间。DBNet方法提出可学习阈值并设计了一个二值化函数,简化了后处理的步骤,在文本检测任务中取得了很好的效果。随着越来越多的网络被提出并且在计算机视觉中都有不错的效果,针对基于分割方法的后处理复杂和预测速度慢问题,在DBNet方法上应用了较为新的ResNeSt网络,同时引入了DO-Conv卷积方式。实验结果表明,该方法在多个指标上都要优于DBNet方法,有较好的文本检测性能。 展开更多
关键词 文本检测 DBNet ResNeSt do-conv
下载PDF
VG-DOCoT:a novel DO-Conv and transformer framework via VAE-GAN technique for EEG emotion recognition
3
作者 Yanping ZHU Lei HUANG +3 位作者 Jixin CHEN Shenyun WANG Fayu WAN Jianan CHEN 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2024年第11期1497-1514,共18页
Human emotions are intricate psychological phenomena that reflect an individual’s current physiological and psychological state.Emotions have a pronounced influence on human behavior,cognition,communication,and decis... Human emotions are intricate psychological phenomena that reflect an individual’s current physiological and psychological state.Emotions have a pronounced influence on human behavior,cognition,communication,and decision-making.However,current emotion recognition methods often suffer from suboptimal performance and limited scalability in practical applications.To solve this problem,a novel electroencephalogram(EEG)emotion recognition network named VG-DOCoT is proposed,which is based on depthwise over-parameterized convolutional(DO-Conv),transformer,and variational automatic encoder-generative adversarial network(VAE-GAN)structures.Specifically,the differential entropy(DE)can be extracted from EEG signals to create mappings into the temporal,spatial,and frequency information in preprocessing.To enhance the training data,VAE-GAN is employed for data augmentation.A novel convolution module DO-Conv is used to replace the traditional convolution layer to improve the network.A transformer structure is introduced into the network framework to reveal the global dependencies from EEG signals.Using the proposed model,a binary classification on the DEAP dataset is carried out,which achieves an accuracy of 92.52%for arousal and 92.27%for valence.Next,a ternary classification is conducted on SEED,which classifies neutral,positive,and negative emotions;an impressive average prediction accuracy of 93.77%is obtained.The proposed method significantly improves the accuracy for EEG-based emotion recognition. 展开更多
关键词 Emotion recognition Electroencephalogram(EEG) Depthwise over-parameterized convolutional(do-conv) Transformer Variational automatic encoder-generative adversarial network(VAE-GAN)
原文传递
胎盘超声图像分割
4
作者 徐成 张芸 曾祥进 《计算机与现代化》 2024年第5期115-119,126,共6页
妊娠早期的胎盘形状和大小与胎儿生长等临床结果紧密相关。针对人工手动标注胎盘轮廓较为耗时的分割方法,设计一种新型深度学习分割网络:DEC-U-Net,该模型设计依据U-Net架构,在U-Net下采样阶段使用深度超参数化卷积代替2D卷积并且联合EC... 妊娠早期的胎盘形状和大小与胎儿生长等临床结果紧密相关。针对人工手动标注胎盘轮廓较为耗时的分割方法,设计一种新型深度学习分割网络:DEC-U-Net,该模型设计依据U-Net架构,在U-Net下采样阶段使用深度超参数化卷积代替2D卷积并且联合ECA(Efficient Channel Attention)注意力机制,在不过多引入参数量的同时提高对胎盘细节特征识别的准确度。将交叉注意力机制引入跳跃链接,解决胎盘边界模糊、对比度不均等问题。与普通U-Net网络相比,本文算法分别在交并比(IoU)、召回率(Recall)、精确度(Precision)、Dice系数上提升4.14、9.59、6.2、16.41个百分点。实验结果表明,改进后的网络模型具有较好的分割效果,能够将超声图像中的胎盘进行精确分割。 展开更多
关键词 胎儿超声图像 胎盘检测 do-conv ECA注意力 MHCA
下载PDF
基于改进LadderNet的视网膜血管分割应用 被引量:1
5
作者 吴亚兰 蒋传健 《信息技术与信息化》 2024年第4期118-121,共4页
视网膜血管的分割有助于辅助医学工作者对眼部或全身性疾病进行诊断和治疗。为进一步提升视网膜血管的分割精度,改进LadderNet架构应用于视网膜血管分割。首先结合DO-Conv,提出改进的池化卷积块替换LadderNet中的池化卷积层,保留强上下... 视网膜血管的分割有助于辅助医学工作者对眼部或全身性疾病进行诊断和治疗。为进一步提升视网膜血管的分割精度,改进LadderNet架构应用于视网膜血管分割。首先结合DO-Conv,提出改进的池化卷积块替换LadderNet中的池化卷积层,保留强上下文特征;其次引入不平衡注意力模块应用在改进LadderNet网络末端,处理血管和背景,以及粗血管和细小血管之间的类不平衡问题。所提的方法在数据集DRIVE上实验得到AUC、SE、SP评价指标值分别为0.9564、0.7863和0.9802。实验结果表明,改进LadderNet对提升视网膜血管分割精度有一定的作用。 展开更多
关键词 视网膜眼底图像 血管分割 LadderNet do-conv 不平衡注意力模块
下载PDF
融合Transformer和CNN的手掌静脉识别网络 被引量:1
6
作者 吴凯 沈文忠 +1 位作者 贾丁丁 梁娟 《计算机工程与应用》 CSCD 北大核心 2023年第24期98-109,共12页
针对手掌静脉特征提取识别精度不高问题,提出了掌静脉识别网络PVCodeNet。该网络设计了改进的BasicBlock和Transformer Encoder模块结合并运用扩大决策边界的损失函数AAM-Loss(additive angular margin loss)。该网络首次将Transformer ... 针对手掌静脉特征提取识别精度不高问题,提出了掌静脉识别网络PVCodeNet。该网络设计了改进的BasicBlock和Transformer Encoder模块结合并运用扩大决策边界的损失函数AAM-Loss(additive angular margin loss)。该网络首次将Transformer Encoder模块成功用于掌静脉图像全局特征提取,改进的BasicBlock使用深度超参数化卷积Do-Conv取代传统卷积Conv进行特征提取使提取的特征更加具有区分性,该模块还加入规一化的注意力机制NAM模块,通过应用权重稀疏性惩罚项抑制不显著性特征的权值来提取图像在通道和空间域上重要的细节特征。在手掌关键点定位、ROI提取、图像增强方面作了详细描述,在特征向量维度、AAM-Loss参数设置方面做了详细实验,在PolyU数据库和自建库SEPAD-PV数据库上进行消融实验测试,EER均达到了0,成功实现了最高识别率的突破。为了验证该网络的泛化性能,还在具有相似纹理特征的掌纹数据库Tongji和指静脉数据库SDUMLA上进行验证,EER远远优于其他主流算法,充分证明了提出算法的优越性。 展开更多
关键词 手掌静脉识别 Transformer编码模块 深度超参数化卷积(do-conv) 规一化注意力机制(NAM) 扩大决策边界的损失函数(AAM-Loss)
下载PDF
GMTS: GNN-based multi-scale transformer siamese network for remote sensing building change detection
7
作者 Xinyang Song Zhen Hua Jinjiang Li 《International Journal of Digital Earth》 SCIE EI 2023年第1期1685-1706,共22页
With the remarkable success of change detection(CD)in remote sensing images in the context of deep learning,many convolutional neural network(CNN)based methods have been proposed.In the current research,to obtain a be... With the remarkable success of change detection(CD)in remote sensing images in the context of deep learning,many convolutional neural network(CNN)based methods have been proposed.In the current research,to obtain a better context modeling method for remote sensing images and to capture more spatiotemporal characteristics,several attention-based methods and transformer(TR)-based methods have been proposed.Recent research has also continued to innovate on TR-based methods,and many new methods have been proposed.Most of them require a huge number of calculation to achieve good results.Therefore,using the TR-based mehtod while maintaining the overhead low is a problem to be solved.Here,we propose a GNN-based multi-scale transformer siamese network for remote sensing image change detection(GMTS)that maintains a low network overhead while effectively modeling context in the spatiotemporal domain.We also design a novel hybrid backbone to extract features.Compared with the current CNN backbone,our backbone network has a lower overhead and achieves better results.Further,we use high/low frequency(HiLo)attention to extract more detailed local features and the multi-scale pooling pyramid transformer(MPPT)module to focus on more global features respectively.Finally,we leverage the context modeling capabilities of TR in the spatiotemporal domain to optimize the extracted features.We have a relatively low number of parameters compared to that required by current TR-based methods and achieve a good effect improvement,which provides a good balance between efficiency and performance. 展开更多
关键词 Remote sensing(RS) change detection(CD) depthwise over-parameterized convolutional(do-conv) attention mechanism transformer graph convolution
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部