期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于MobileViT的轻量型入侵检测模型研究
1
作者 姚军 孙方超 《现代电子技术》 北大核心 2024年第19期33-39,共7页
为解决入侵检测中数据不平衡对神经网络模型训练的影响和模型参数量高的问题,提出一种基于改进MobileViT的入侵检测模型。首先,使用方差分析提取对检测结果影响较高的特征,将提取后的特征转化为图像型数据,将其输入至MobileViT网络;其次... 为解决入侵检测中数据不平衡对神经网络模型训练的影响和模型参数量高的问题,提出一种基于改进MobileViT的入侵检测模型。首先,使用方差分析提取对检测结果影响较高的特征,将提取后的特征转化为图像型数据,将其输入至MobileViT网络;其次,针对占比较少的攻击流量,采用焦点损失函数自适应地调整攻击流量的损失贡献,使模型更加专注于不平衡的攻击流量;最后,为解决神经元死亡问题,使用GeLU激活函数替换MobileViT网络中MV2的ReLU6激活函数,加快模型收敛速度。实验结果表明,改进的MobileViT模型参数量仅为5.67 MB,与Shufflenet、Mobilenet相比拥有最少的参数量,模型的准确率、召回率以及F_(1)分数分别达到了98.40%、96.49%、95.17%。 展开更多
关键词 入侵检测 焦点损失函数 数据不平衡 MobileViT GeLU 方差分析
下载PDF
改进Alexnet网络的滚动轴承故障诊断方法
2
作者 韩龙 王超群 +1 位作者 姜楠 赵雅婷 《中国新技术新产品》 2024年第6期15-18,共4页
本文针对滚动轴承故障诊断准确率不高的问题提出一种新方法。首先,将振动信号通过短时傅里叶变换(Short Time Fourier Transform,STFT)转化为时频图像构建数据集。其次,采用批量归一化算法和GeLU激活函数改进Alexnet网络,对不同工况的... 本文针对滚动轴承故障诊断准确率不高的问题提出一种新方法。首先,将振动信号通过短时傅里叶变换(Short Time Fourier Transform,STFT)转化为时频图像构建数据集。其次,采用批量归一化算法和GeLU激活函数改进Alexnet网络,对不同工况的时频图像进行训练和故障诊断。在凯斯西储大学(Case Western Reserve University,CWRU)轴承数据集试验中,改进后的Alexnet网络训练损失更低,收敛速度更快,故障识别准确率更高。最后,比较模拟滚动轴承损伤故障实验平台采集的样本数据,改进Alexnet网络的故障识别准确率为97.2%,明显优于Alexnet网络、SVM网络和CNN网络,验证了该改进方法的有效性。 展开更多
关键词 滚动轴承 故障诊断 改进Alexnet BN层 GeLU
下载PDF
基于改进Faster-RCNN的无人驾驶目标检测
3
作者 张起航 曾琦 《计算机与数字工程》 2024年第8期2411-2415,2419,共6页
针对Faster-RCNN主干特征提取网络Resnet50原本的ReLU函数性能仍有提升空间这样的问题。论文探索使用高斯误差线性单元激活函数GELU去提升原网络的性能。高斯误差线性单元激活函数GELU相较于ReLU激活函数,用概率的方法去保留有效信息,... 针对Faster-RCNN主干特征提取网络Resnet50原本的ReLU函数性能仍有提升空间这样的问题。论文探索使用高斯误差线性单元激活函数GELU去提升原网络的性能。高斯误差线性单元激活函数GELU相较于ReLU激活函数,用概率的方法去保留有效信息,而不是ReLU函数那样单纯的对于大于0的信息保留,小于0的信息舍弃。这使得用GELU作为激活函数能更准确反映图像信息,从而提高网络整体的目标检测性能。实验表明,改进后的网络的mAP相较于原网络有了一定的提升,在识别道路信息时有更好的表现,能够更好地应用于无人驾驶技术。 展开更多
关键词 目标检测 Faster-RCNN Resnet50 GELU激活函数 无人驾驶
下载PDF
基于深度神经网络AdaMod优化模型的来袭目标攻击意图识别 被引量:5
4
作者 王家鑫 王瑞琪 +2 位作者 孟海波 蔺红明 陈天群 《计算机测量与控制》 2023年第6期274-279,共6页
海上舰艇防空反导作战基于目标攻击意图识别是现代舰艇防空技术的研究热点;来袭目标攻击意图识别是战场态势分析的一个重要部分,以往是通过先验知识和先验概率进行量化分析与明确攻击意图识别特征值的影响权重;深度神经网络可通过自适... 海上舰艇防空反导作战基于目标攻击意图识别是现代舰艇防空技术的研究热点;来袭目标攻击意图识别是战场态势分析的一个重要部分,以往是通过先验知识和先验概率进行量化分析与明确攻击意图识别特征值的影响权重;深度神经网络可通过自适应学习目标攻击意图的特征值,可以在缺乏先验知识的条件下,通过小样本集的目标攻击意图的特征值训练,学习特征数据和攻击意图识别之间的对应关系与映射;通过引入GeLUs激活函数和AdaMod优化算法加快模型收敛,并解决了Adam模型可能无法收敛到最优解的问题;实验结果显示文中提出的模型可以在先验知识不足及训练数据规模小的情况下,有效识别来袭目标攻击意图,同时保证更高的准确率。 展开更多
关键词 防空反导 攻击意图识别 深度神经网络 gelus AdaMod
下载PDF
基于RT-Unet的医学图像分割算法 被引量:1
5
作者 赵佳美 吴迪康 王志芳 《无线电工程》 北大核心 2023年第2期381-386,共6页
近年来,由于Transformer能够有效地捕获全局上下文信息,在机器视觉领域展现了巨大的应用潜力。然而,它只能获取单尺度的上下文信息,对于细节信息的提取仍然存在一定的局限性。针对此类问题,提出了RT-Unet算法。该算法在RESwin Transfor... 近年来,由于Transformer能够有效地捕获全局上下文信息,在机器视觉领域展现了巨大的应用潜力。然而,它只能获取单尺度的上下文信息,对于细节信息的提取仍然存在一定的局限性。针对此类问题,提出了RT-Unet算法。该算法在RESwin Transformer模块中引入内在的局部归纳偏置,并在位置嵌入与编码模块使用4个连续的卷积层。将卷积与Transformer有效地组合在一起,既可以获得丰富的多尺度特征,又可以关注局部细节信息与远程依赖关系。另外,改用GELU激活函数增加算法的非线性因素,避免训练时出现梯度消失问题。实验采用Synapse腹部多器官分割数据集,结果表明RT-Unet的性能优于ViT,V-Net,U-Net,Swin-Unet和TU-Net等算法,并取得了DSC为79.08%,HD为23.43 mm的分割结果。 展开更多
关键词 医学图像 RT-Unet RESwin Transformer模块 局部归纳偏置 GELU
下载PDF
用于货物类别检测的改进YOLOv5m方法研究 被引量:1
6
作者 孙圆 李为相 周海军 《计算机工程与应用》 CSCD 北大核心 2023年第16期205-211,共7页
针对货车入库时对货物类别检测问题,提出一种可以用于在线检测携带货物的方法。该方法基于YOLOv5m和DeepSort算法,在YOLOv5m的主干网络中以深度可分离卷积替换标准卷积,降低模型参数量,提高模型推理速度;激活函数SiLU替换为GELU,引入随... 针对货车入库时对货物类别检测问题,提出一种可以用于在线检测携带货物的方法。该方法基于YOLOv5m和DeepSort算法,在YOLOv5m的主干网络中以深度可分离卷积替换标准卷积,降低模型参数量,提高模型推理速度;激活函数SiLU替换为GELU,引入随机正则的思想;融入倒置残差结构,进一步提高网络性能;损失函数CIoU替换为EIoU,提高回归精度;采用AdamW优化器改善参数更新。最后通过自制数据集进行训练和实验,实验结果表明,改进后的YOLOv5m模型具有精度高、计算量小和检测速度快的特点,能够更好地满足仓储环境下的货车入库货物检测。 展开更多
关键词 YOLOv5m DeepSort 目标检测 GELU AdamW EIoU
下载PDF
基于改进的ResNet50网络的黑色素瘤分类方法
7
作者 邓辉 张洁 《计算机技术与发展》 2023年第2期64-70,共7页
黑色素瘤的早期诊断对提高患者的五年生存率至关重要。针对临床上使用皮肤镜检查黑色素瘤费时、费力的问题,提出一种基于迁移学习和改进的ResNet50模型的黑色素瘤分类模型MC-Net(Melanoma Classification-Net)。首先,为了降低数据集样... 黑色素瘤的早期诊断对提高患者的五年生存率至关重要。针对临床上使用皮肤镜检查黑色素瘤费时、费力的问题,提出一种基于迁移学习和改进的ResNet50模型的黑色素瘤分类模型MC-Net(Melanoma Classification-Net)。首先,为了降低数据集样本分布不均匀以及毛发遮挡信息带来的影响,进行数据增强;对ResNet50的输入主干重新进行了设计,用常规卷积和深度可分离卷积的组合代替原来的7×7大卷积核;对残差块进行了优化,使用GELU函数替代ReLU函数,并将特征相加后的激活层移到残差块内部,同时去除了部分BN层和激活层;向网络中添加CA注意力机制,使得网络更加关注目标的关键信息,从而抑制其他无用信息;结合迁移学习,利用在ImageNet上预训练权重初始化网络并在数据集上进行微调训练,得到最终黑色素瘤分类模型。实验结果表明,所改进的结构对模型性能提升具有显著效果,MC-Net模型在准确率和F1指标上达到94.87%和95.01%,经过迁移学习得到的最终分类模型在数据集上进行测试,获得了95.4%的准确率和95.6%的F1值,均优于其他网络。 展开更多
关键词 黑色素瘤 ResNet50 注意力机制 GELU 数据增强 迁移学习
下载PDF
3D Human Pose Estimation Using Two-Stream Architecture with Joint Training
8
作者 Jian Kang Wanshu Fan +2 位作者 Yijing Li Rui Liu Dongsheng Zhou 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第10期607-629,共23页
With the advancement of image sensing technology, estimating 3Dhuman pose frommonocular video has becomea hot research topic in computer vision. 3D human pose estimation is an essential prerequisite for subsequentacti... With the advancement of image sensing technology, estimating 3Dhuman pose frommonocular video has becomea hot research topic in computer vision. 3D human pose estimation is an essential prerequisite for subsequentaction analysis and understanding. It empowers a wide spectrum of potential applications in various areas, suchas intelligent transportation, human-computer interaction, and medical rehabilitation. Currently, some methodsfor 3D human pose estimation in monocular video employ temporal convolutional network (TCN) to extractinter-frame feature relationships, but the majority of them suffer from insufficient inter-frame feature relationshipextractions. In this paper, we decompose the 3D joint location regression into the bone direction and length, wepropose the TCG, a temporal convolutional network incorporating Gaussian error linear units (GELU), to solvebone direction. It enablesmore inter-frame features to be captured andmakes the utmost of the feature relationshipsbetween data. Furthermore, we adopt kinematic structural information to solve bone length enhancing the use ofintra-frame joint features. Finally, we design a loss function for joint training of the bone direction estimationnetwork with the bone length estimation network. The proposed method has extensively experimented on thepublic benchmark dataset Human3.6M. Both quantitative and qualitative experimental results showed that theproposed method can achieve more accurate 3D human pose estimations. 展开更多
关键词 3D human pose improved TCN GELU kinematic structure
下载PDF
基于ViT的中欧班列集装箱logo图像分类识别研究
9
作者 刘彦鹏 《图像与信号处理》 2023年第2期128-135,共8页
随着“一带一路”、长江经济带等国家战略的叠加实施,中国与西方的贸易也呈直线上升的趋势。伴随着中欧班列高质量运行,中欧班列集装箱的分类统计也成为中国对外贸易的一大重点。集装箱上代表着各供应商的logo图像在运输途中会产生褪色... 随着“一带一路”、长江经济带等国家战略的叠加实施,中国与西方的贸易也呈直线上升的趋势。伴随着中欧班列高质量运行,中欧班列集装箱的分类统计也成为中国对外贸易的一大重点。集装箱上代表着各供应商的logo图像在运输途中会产生褪色破损情况从而给识别增加了很多的难度。因此,公司为了有效识别各个标识,提出了基于ViT的logo图像分类模型,使用激活函数GELU代替传统的RELU。实验表明,改进后的模型可以很好地分类识别,准确率达到98%,且优于其他的分类模型。 展开更多
关键词 logo分类 VIT 中欧班列 GELU
下载PDF
基于通道注意力的人脸表情识别
10
作者 李堃 王传安 +1 位作者 吕雅洁 陈雪敏 《安徽科技学院学报》 2023年第4期87-95,共9页
目的:解决通道注意力提取过程中各个通道信息利用不充分、交互性不足的问题。方法:提出一种基于SENet改进的通道注意力模型。本模型利用Inverted Bottleneck提取更加完整的通道信息。将GELU函数引入表情识别,以改善网络升维操作带来的... 目的:解决通道注意力提取过程中各个通道信息利用不充分、交互性不足的问题。方法:提出一种基于SENet改进的通道注意力模型。本模型利用Inverted Bottleneck提取更加完整的通道信息。将GELU函数引入表情识别,以改善网络升维操作带来的过度融合问题。同时利用信息熵判断不同卷积核生成特征图的重要程度,为网络引入更多的归纳偏置。结果:在CK+和Oulu-CASIA库人脸表情数据集上的正确率分别达到95.92%和91.21%。结论:本方法能够更加充分地利用各通道特征,在有效提升准确率的同时具有较好的泛化能力。 展开更多
关键词 通道注意力 Inverted Bottleneck GELU 信息熵
下载PDF
A Fast Tongue Detection and Location Algorithm in Natural Environment 被引量:3
11
作者 Lei Zhu Guojiang Xin +3 位作者 Xin Wang Changsong Ding Hao Liang Qilei Chen 《Computers, Materials & Continua》 SCIE EI 2022年第12期4727-4742,共16页
The collection and extraction of tongue images has always been an important part of intelligent tongue diagnosis.At present,the collection of tongue images generally needs to be completed in a sealed,stable light envi... The collection and extraction of tongue images has always been an important part of intelligent tongue diagnosis.At present,the collection of tongue images generally needs to be completed in a sealed,stable light environment,which is not conducive to the promotion of extensive tongue image and intelligent tongue diagnosis.In response to the problem,a newalgorithm named GCYTD(GELU-CA-YOLO Tongue Detection)is proposed to quickly detect and locate the tongue in a natural environment,which can greatly reduce the restriction of the tongue image collection environment.The algorithm is based on the YOLO(You Only Look Once)V4-tiny network model to detect the tongue.Firstly,the GELU(Gaussian Error Liner Units)activation function is integrated into the model to improve the training speed and reduce the number of model parameters;then,the CA(Coordinate Attention)mechanism is integrated into the model to enhance the detection precision and improve the failure tolerance of the model.Compared with the other classical algorithms,Experimental results show thatGCYTD algorithm has a better performance on the tongue images of all types in terms of training speed,tongue detection speed and detection precision,etc.The lighter model can contribute on deploying the tongue detection model on small mobile terminals. 展开更多
关键词 Tongue detection YOLO V4-tiny CA mechanism GELU
下载PDF
基于改进生成对抗网络的单图超分辨率重建 被引量:2
12
作者 么天舜 马晓轩 《计算机应用与软件》 北大核心 2022年第12期227-233,240,共8页
针对目前通过超分辨率技术重建后图像的质量不高、纹理细节模糊、网络训练不稳定等问题,提出一种基于改进生成对抗网络的单图超分辨率重建算法。该算法以生成对抗网络为基础,采用多尺度卷积层和GELU(Gaussian Error Linear Units)激活... 针对目前通过超分辨率技术重建后图像的质量不高、纹理细节模糊、网络训练不稳定等问题,提出一种基于改进生成对抗网络的单图超分辨率重建算法。该算法以生成对抗网络为基础,采用多尺度卷积层和GELU(Gaussian Error Linear Units)激活函数对生成网络中的残差块进行优化,提高网络泛化能力;利用Wasserstein距离和Huber损失对损失函数进行优化,增强网络训练的稳定性;减少判别网络中的批规范化层,优化网络结构。实验结果表明:在Set5等数据集上,该算法重建后的图像在客观评价指标和主观视觉效果上均优于其他经典算法。 展开更多
关键词 超分辨率 生成对抗网络 残差块 Wasserstein距离 GELU
下载PDF
面向Transformer模型边缘端部署的常用激活函数高精度轻量级量化推理方法
13
作者 杨赟辉 程虎 +2 位作者 魏敬和 刘国柱 桑贤侦 《电子学报》 EI CAS 2024年第10期3301-3311,共11页
基于Transformer的大语言模型(Large Language Models,LLM)和视觉Transformer(Vision Transformers,ViTs)分别在自然语言处理、机器视觉任务上实现了最为先进的性能.但是ViTs和LLM的常用激活函数GELU(Gaussian Error Linear Unit)、Swis... 基于Transformer的大语言模型(Large Language Models,LLM)和视觉Transformer(Vision Transformers,ViTs)分别在自然语言处理、机器视觉任务上实现了最为先进的性能.但是ViTs和LLM的常用激活函数GELU(Gaussian Error Linear Unit)、Swish在Transformer全量化推理中存在精度不足、计算效率低的问题,限制了它们在资源受限的边缘端设备上的部署和应用.本文提出了一种基于分段二次多项式拟合的激活函数高精度近似计算方法(Segmented Quadratic Polynomial Fitting,SQPF)及其量化推理过程,以实现端侧非线性激活函数的高性能部署.SQPF采用最小二乘法和粒子群优化方法求解非线性激活函数拟合优化问题,给出最优的二次多项式拟合系数和区间划分.得到的二次多项式拟合采用动态精度定点对称量化方法进行纯整数推理,推理过程仅包含移位操作和乘加运算.本文使用SQPF计算了GELU和Swish的二次多项式拟合Si-GELU和Si-Swish,并评估了量化推理精度.实验结果表明,在标准数据集ImageNet上,Si-GELU引起的ViTs(ViT、DeiT和Swin)模型分类任务准确率衰减仅为0.09%,是其他同类方法的27.3%;在主流的大语言模型评测数据集MMLU上,Si-Swish引起的子类别精度衰减不超过0.77%,大类别精度衰减不超过0.23%.极小的精度损失表明SQPF计算得到的最优分段二次多项式拟合可以直接替换Transformer模型中全精度浮点激活函数,不必进行参数微调或者重训练. 展开更多
关键词 Transformer 全量化推理 GELU函数 Swish函数 分段二次多项式拟合
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部