期刊文献+
共找到230篇文章
< 1 2 12 >
每页显示 20 50 100
Power Grid Fault Diagnosis Based on Deep Pyramid Convolutional Neural Network
1
作者 Xu Zhang Huiting Zhang +4 位作者 Dongying Zhang Yixian Wang Ruiting Ding Yuchuan Zheng Yongxu Zhang 《CSEE Journal of Power and Energy Systems》 SCIE EI CSCD 2023年第6期2188-2203,共16页
Existing power grid fault diagnosis methods relyon manual experience to design diagnosis models, lack theability to extract fault knowledge, and are difficult to adaptto complex and changeable engineering sites. Consi... Existing power grid fault diagnosis methods relyon manual experience to design diagnosis models, lack theability to extract fault knowledge, and are difficult to adaptto complex and changeable engineering sites. Considering thissituation, this paper proposes a power grid fault diagnosismethod based on a deep pyramid convolutional neural networkfor the alarm information set. This approach uses the deepfeature extraction ability of the network to extract fault featureknowledge from alarm information texts and achieve end-to-endfault classification and fault device identification. First, a deeppyramid convolutional neural network model for extracting theoverall characteristics of fault events is constructed to identifyfault types. Second, a deep pyramidal convolutional neuralnetwork model for alarm information text is constructed, thetext description characteristics associated with alarm informationtexts are extracted, the key information corresponding to faultsin the alarm information set is identified, and suspicious faultydevices are selected. Then, a fault device identification strategythat integrates fault-type and time sequence priorities is proposedto identify faulty devices. Finally, the actual fault cases and thefault cases generated by the simulation are studied, and theresults verify the effectiveness and practicability of the methodpresented in this paper. 展开更多
关键词 Alarm information deep pyramid convolutional neural network fault classification fault device identification feature extraction key information
原文传递
Multi-scale object detection by top-down and bottom-up feature pyramid network 被引量:13
2
作者 ZHAO Baojun ZHAO Boya +2 位作者 TANG Linbo WANG Wenzheng WU Chen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2019年第1期1-12,共12页
While moving ahead with the object detection technology, especially deep neural networks, many related tasks, such as medical application and industrial automation, have achieved great success. However, the detection ... While moving ahead with the object detection technology, especially deep neural networks, many related tasks, such as medical application and industrial automation, have achieved great success. However, the detection of objects with multiple aspect ratios and scales is still a key problem. This paper proposes a top-down and bottom-up feature pyramid network(TDBU-FPN),which combines multi-scale feature representation and anchor generation at multiple aspect ratios. First, in order to build the multi-scale feature map, this paper puts a number of fully convolutional layers after the backbone. Second, to link neighboring feature maps, top-down and bottom-up flows are adopted to introduce context information via top-down flow and supplement suboriginal information via bottom-up flow. The top-down flow refers to the deconvolution procedure, and the bottom-up flow refers to the pooling procedure. Third, the problem of adapting different object aspect ratios is tackled via many anchor shapes with different aspect ratios on each multi-scale feature map. The proposed method is evaluated on the pattern analysis, statistical modeling and computational learning visual object classes(PASCAL VOC)dataset and reaches an accuracy of 79%, which exhibits a 1.8% improvement with a detection speed of 23 fps. 展开更多
关键词 convolutional neural network (CNN) FEATURE pyramid network (FPN) object detection deconvolution.
下载PDF
Dual Attention Based Feature Pyramid Network 被引量:4
3
作者 Huijun Xing Shuai Wang +1 位作者 Dezhi Zheng Xiaotong Zhao 《China Communications》 SCIE CSCD 2020年第8期242-252,共11页
Object detection could be recognized as an essential part of the research to scenarios such as automatic driving and pedestrian detection, etc. Among multiple types of target objects, the identification of small-scale... Object detection could be recognized as an essential part of the research to scenarios such as automatic driving and pedestrian detection, etc. Among multiple types of target objects, the identification of small-scale objects faces significant challenges. We would introduce a new feature pyramid framework called Dual Attention based Feature Pyramid Network(DAFPN), which is designed to avoid predicament about multi-scale object recognition. In DAFPN, the attention mechanism is introduced by calculating the topdown pathway and lateral pathway, where the spatial attention, as well as channel attention, would participate, respectively, such that the pyramidal feature maps can be generated with enhanced spatial and channel interdependencies, which bring more semantical information for the feature pyramid. Using the COCO data set, which consists of a considerable quantity of small-scale objects, the experiments are implemented. The analysis results verify the optimized performance of DAFPN compared with the original Feature Pyramid Network(FPN) specifically for the identification on a small scale. The proposed DAFPN is promising for object detection in an era full of intelligent machines that need to detect multi-scale objects. 展开更多
关键词 object detection convolutional neural networks feature pyramid
下载PDF
基于Transformer的跨尺度交互学习伪装目标检测
4
作者 李建东 王岩 曲海成 《计算机系统应用》 2024年第2期115-124,共10页
伪装目标检测(COD)旨在精确且高效地检测出与背景高度相似的伪装物体,其方法可为物种保护、医学病患检测和军事监测等领域提供助力,具有较高的实用价值.近年来,采用深度学习方法进行伪装目标检测成为一个比较新兴的研究方向.但现有大多... 伪装目标检测(COD)旨在精确且高效地检测出与背景高度相似的伪装物体,其方法可为物种保护、医学病患检测和军事监测等领域提供助力,具有较高的实用价值.近年来,采用深度学习方法进行伪装目标检测成为一个比较新兴的研究方向.但现有大多数COD算法都是以卷积神经网络(CNN)作为特征提取网络,并且在结合多层次特征时,忽略了特征表示和融合方法对检测性能的影响.针对基于卷积神经网络的伪装目标检测模型对被检测目标的全局特征提取能力较弱问题,提出一种基于Transformer的跨尺度交互学习伪装目标检测方法.该模型首先提出了双分支特征融合模块,将经过迭代注意力的特征进行融合,更好地融合高低层特征;其次引入了多尺度全局上下文信息模块,充分联系上下文信息增强特征;最后提出了多通道池化模块,能够聚焦被检测物体的局部信息,提高伪装目标检测准确率.在CHAMELEON、CAMO以及COD10K数据集上的实验结果表明,与当前主流的伪装物体检测算法相比较,该方法生成的预测图更加清晰,伪装目标检测模型能取得更高精度. 展开更多
关键词 深度学习 伪装目标检测 视觉特征金字塔 卷积神经网络 特征融合
下载PDF
基于改进卷积神经网络的心理状态预警技术
5
作者 王克 《电子设计工程》 2024年第10期49-53,共5页
针对传统问卷法难以真实反映被调查者心理状态的问题,基于光流法和卷积神经网络提出了一种微表情判断方法,并将其作为心理状态预警技术的核心模块。对于数据集中人脸数据离散的问题,该方法采用人眼权重法对图像进行预处理,且通过金字塔... 针对传统问卷法难以真实反映被调查者心理状态的问题,基于光流法和卷积神经网络提出了一种微表情判断方法,并将其作为心理状态预警技术的核心模块。对于数据集中人脸数据离散的问题,该方法采用人眼权重法对图像进行预处理,且通过金字塔光流算法提取预处理图像序列的光流特征,再利用三维卷积神经网络对该特征加以训练。与传统算法相比,所提方法在减少模型训练参数与运算时间的同时还具有更优的学习能力。实验测试结果表明,该算法在CASME数据集上的微表情识别准确率为89.2%,F1值为0.6751,均优于其他对比方法。由此证明,该算法可实现对人脸微表情的准确识别,进而为学生心理状态预警提供客观的数据支撑。 展开更多
关键词 金字塔光流法 三维卷积神经网络 微表情识别 人脸识别 心理预警
下载PDF
Fine-grained classification of grape leaves via a pyramid residual convolution neural network
6
作者 Hanghao Li Yana Wei +2 位作者 Hongming Zhang Huan Chen Jiangfei Meng 《International Journal of Agricultural and Biological Engineering》 SCIE CAS 2022年第2期197-203,共7页
The value of grape cultivars varies.The use of a mixture of cultivars can negate the benefits of improved cultivars and hamper the protection of genetic resources and the identification of new hybrid cultivars.Classif... The value of grape cultivars varies.The use of a mixture of cultivars can negate the benefits of improved cultivars and hamper the protection of genetic resources and the identification of new hybrid cultivars.Classifying cultivars based on their leaves is therefore highly practical.Transplanted grape seedlings take years to bear fruit,but leaves mature in months.Foliar morphology differs among cultivars,so identifying cultivars based on leaves is feasible.Different cultivars,however,can be bred from the same parents,so the leaves of some cultivars can have similar morphologies.In this work,a pyramid residual convolution neural network was developed to classify images of eleven grape cultivars.The model extracts multi-scale feature maps of the leaf images through the convolution layer and enters them into three residual convolution neural networks.Features are fused by adding the value of the convolution kernel feature matrix to enhance the attention on the edge and center regions of the leaves and classify the images.The results indicated that the average accuracy of the model was 92.26%for the proposed leaf dataset.The proposed model is superior to previous models and provides a reliable method for the fine-grained classification and identification of plant cultivars. 展开更多
关键词 fine-grained classification grape cultivars identification pyramid residual network convolution neural network
原文传递
基于跨层次聚合网络的实时城市街景语义分割
7
作者 侯志强 程敏婕 +2 位作者 马素刚 屈敏杰 杨小宝 《光学精密工程》 EI CAS CSCD 北大核心 2024年第8期1212-1226,共15页
随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战... 随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战,主要表现为不同类别的像素区分不够清晰、对于复杂场景结构的理解不够精准以及对小尺度对象或大尺度结构的分割不准确等问题。为此,本文提出一种基于跨层次聚合网络的实时城市街景语义分割算法。首先,在编码器末端设计了结合跨层次聚合的金字塔池化模块,用于高效提取多尺度上下文信息;其次,在编码器和解码器之间设计了跨层次聚合模块,通过引入通道注意力机制增强信息的表征能力,逐级聚合编码器阶段的特征以充分实现特征复用;最后,在解码器阶段设计了多尺度融合模块,在通道维度聚合全局信息与局部信息,促进深层特征与浅层特征的融合。将所提算法在两个通用的城市街景数据集上进行了验证。在一张RTX3090显卡上(TensorRT测速环境),本文算法在Cityscapes测试集以294 FPS的实时性达到73.0%mIoU的准确性,在更高分辨率的图像上以164 FPS的实时性达到75.8%mIoU的准确性;在CamVid数据集以239 FPS的实时性达到74.8%mIoU的准确性。实验结果表明,本文算法在准确性与实时性之间取得了有效平衡,对比其他算法的语义分割性能具有显著提升,为实时城市街景语义分割领域带来了新的突破。 展开更多
关键词 语义分割 卷积神经网络 城市街景 编码器-解码器结构 金字塔池化模块
下载PDF
基于层间引导的低光照图像渐进增强算法
8
作者 黄梦源 常侃 +2 位作者 凌铭阳 韦新杰 覃团发 《计算机应用》 CSCD 北大核心 2024年第6期1911-1919,共9页
低光照图像的图像质量通常较低,低光照图像增强(LLIE)旨在提高这类图像的视觉质量。针对现有的LLIE算法大多专注增强亮度和对比度、忽略细节增强的问题,提出一个基于层间引导的低光照图像渐进增强算法(PELG),兼顾图像亮度和细节增强。首... 低光照图像的图像质量通常较低,低光照图像增强(LLIE)旨在提高这类图像的视觉质量。针对现有的LLIE算法大多专注增强亮度和对比度、忽略细节增强的问题,提出一个基于层间引导的低光照图像渐进增强算法(PELG),兼顾图像亮度和细节增强。首先,使用拉普拉斯金字塔(LP)降低任务复杂度,提高算法效率;其次,利用各频率分量间的相关性,在低频和高频分量之间构建基于Transformer的层间引导融合模块,在各高频分量之间构建轻量级的层间引导融合模块,有效精炼金字塔较低层增强信息指导较高层处理图像,实现基于层间引导的渐进增强;最后,通过LP重建亮度均匀、细节清晰的增强图像。实验结果表明,所提算法的峰值信噪比(PSNR)在LOL(LOw-Light dataset)-v1上比DSLR(Deep Stacked Laplacian Restorer)高2.3 dB,在LOL-v2上比UNIE(Unsupervised Night Image Enhancement)高0.55 dB;与其他基于深度学习的LLIE算法相比,所提算法运行速度快,增强结果在客观和主观质量上均获得明显提升,更适用于实际场景。 展开更多
关键词 低光照图像增强 拉普拉斯金字塔 特征融合 卷积神经网络 TRANSFORMER
下载PDF
基于卷积神经网络的路面裂缝分割设计与研究
9
作者 刘艳宁 章国宝 《应用光学》 CAS 北大核心 2024年第2期373-384,共12页
裂缝是路面病害最主要的类型,准确的裂缝分割是国家进行公路预防养护管理的重要决策依据。针对背景复杂下现有模型路面裂缝分割准确度有待提高的问题,提出一种基于卷积神经网络的端到端裂缝分割模型,使用分层结构的ConvNeXt编码器提取... 裂缝是路面病害最主要的类型,准确的裂缝分割是国家进行公路预防养护管理的重要决策依据。针对背景复杂下现有模型路面裂缝分割准确度有待提高的问题,提出一种基于卷积神经网络的端到端裂缝分割模型,使用分层结构的ConvNeXt编码器提取多尺度特征,特征的最高层使用金字塔池化模块进一步获取全局先验特征,通过具有横向连接和自上而下的金字塔结构进行特征融合。针对裂缝和背景不平衡问题,使用平衡交叉熵损失函数提高模型的检测性能。此外,构建了一个包含2 876张裂缝图片的数据集UCrack,覆盖多种裂缝类型和广泛的背景范围,以提供丰富的特征供模型学习。实验表明,在UCrack测试数据集上模型的召回率和F1得分比其他表现最佳的模型提高了2.68%和6.89%;在CrackDataset数据集上的测试取得了85.68%的召回率和80.11%的F1得分,说明模型具有较好的泛化性能,可应对背景复杂的路面裂缝分割。 展开更多
关键词 裂缝分割 卷积神经网络 编解码网络 特征金字塔 金字塔池化
下载PDF
面向多复杂场景环境的敞车车号辨识研究
10
作者 薛峰 于国丞 +3 位作者 李世杰 凌烈鹏 张峰峰 陈峰炜 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第6期1162-1169,共8页
针对现有敞车车号定位识别方法存在的环境适应性差、定位和识别精度低的问题,本文提出一种面向多种复杂环境下的敞车车号精准定位和识别的方法。搭建融合多尺度特征信息的敞车车号定位模型框架,在此基础上,融合多尺度金字塔特征进行深... 针对现有敞车车号定位识别方法存在的环境适应性差、定位和识别精度低的问题,本文提出一种面向多种复杂环境下的敞车车号精准定位和识别的方法。搭建融合多尺度特征信息的敞车车号定位模型框架,在此基础上,融合多尺度金字塔特征进行深度可分离卷积的敞车车号特征提取网络设计。提出基于改进卷积循环神经网络的车号定位识别模型,主要针对识别网络模型结构进行设计。通过不同环境下采集的敞车车厢图片对本文提出的方法进行验证。结果表明:本文提出的车号定位方法的准确率为0.94,车号识别的准确率为0.97。 展开更多
关键词 车号定位 深度可分离卷积 特征提取 改进卷积循环神经网络 特征金字塔 字符识别 铁路货运 深度学习
下载PDF
改进Unet++的肾脏肿瘤分割方法
11
作者 刘欣 柏正尧 方成 《计算机应用与软件》 北大核心 2024年第2期238-243,263,共7页
针对人工方式分割CT图像肾脏肿瘤区域耗时费力且存在主观因素影响等问题,提出一种基于卷积神经网络的肾脏肿瘤自动分割算法。算法以Unet++分割网络为基础框架,将预训练的ResNet-34网络中四个特征提取模块作为Unet++网络特征编码器,来提... 针对人工方式分割CT图像肾脏肿瘤区域耗时费力且存在主观因素影响等问题,提出一种基于卷积神经网络的肾脏肿瘤自动分割算法。算法以Unet++分割网络为基础框架,将预训练的ResNet-34网络中四个特征提取模块作为Unet++网络特征编码器,来提取图像特征信息;并将重新设计的空洞空间金字塔池化网络嵌入到Unet++每条解码路径中;不同的解码路径通过特征融合得到肾脏肿瘤分割结果。在KiTS19竞赛提供的数据集上进行验证,实验结果表明,该算法有效提高了CT图像肾脏肿瘤的分割精度。 展开更多
关键词 卷积神经网络 CT图像 Unet++网络 空洞空间金字塔池化 肾脏肿瘤
下载PDF
基于改进Faster RCNN的PCB表面缺陷检测研究
12
作者 龚陈博 南卓江 陶卫 《自动化仪表》 CAS 2024年第7期99-103,109,共6页
印刷电路板(PCB)在制造过程中不可避免地存在焊点缺焊、短路、毛刺、缺口、开路、余铜等微小缺陷。传统的基于机器视觉检测的缺陷检测方法存在检测速度慢、误检率和漏检率高、抗干扰能力弱等问题。为解决上述问题,提出一种基于改进快速... 印刷电路板(PCB)在制造过程中不可避免地存在焊点缺焊、短路、毛刺、缺口、开路、余铜等微小缺陷。传统的基于机器视觉检测的缺陷检测方法存在检测速度慢、误检率和漏检率高、抗干扰能力弱等问题。为解决上述问题,提出一种基于改进快速区域卷积神经网络(Faster RCNN)的PCB表面缺陷检测方法。首先,在传统Faster RCNN框架的基础上,融入扩展特征金字塔网络(EFPN)以实现特征提取与融合,并进行多尺度检测,从而尽可能保留图像细节信息以提高检测性能。其次,利用K-means算法结合交并比(IoU)优化区域建议网络(RPN)结构中的锚框参数,使得生成的锚框方案更有针对性。试验结果表明,改进Faster RCNN在PCB缺陷数据集上的全类平均正确率(mAP)值达到93.4%、检测速度达到每秒21.79帧。所提方法可推广应用至芯片、光学器件表面微小缺陷在线检测,从而提升工业生产效率。 展开更多
关键词 印刷电路板 缺陷检测 快速区域卷积神经网络 扩展特征金字塔网络 K-MEANS 小目标检测 机器视觉
下载PDF
改进Mask R-CNN的无人机影像建筑物提取
13
作者 方超 廖运茂 +2 位作者 刘飞 王坚 赵小平 《北京测绘》 2024年第1期97-101,共5页
从无人机影像中自动提取建筑物对城乡规划和管理至关重要,然而,在复杂背景干扰和建筑物外观变化很大的情况下给实例提取带来挑战。因此,提出一种改进的Mask区域卷积神经网络(R-CNN)方法用于无人机影像的建筑物自动实例提取。改进方法以R... 从无人机影像中自动提取建筑物对城乡规划和管理至关重要,然而,在复杂背景干扰和建筑物外观变化很大的情况下给实例提取带来挑战。因此,提出一种改进的Mask区域卷积神经网络(R-CNN)方法用于无人机影像的建筑物自动实例提取。改进方法以ResNet-101作为特征提取网络,在特征融合网络方面,通过添加自底向上的路径增强整个特征层次的定位能力,同时在特征融合中加入空洞空间金字塔池化模块(ASPP)来提高多尺度能力与改善模型性能。在自制建筑物数据集上的综合实验结果表明,与原始的Mask R-CNN方法相比,改进方法的mAP值提高了2.6%,能够很好地实现无人机影像建筑物实例提取。 展开更多
关键词 建筑物提取 Mask R-CNN 路径融合 空洞空间金字塔池化模块
下载PDF
轻量化沥青路面裂缝图像分割网络PIPNet
14
作者 封筠 毕健康 +1 位作者 霍一儒 李家宽 《计算机应用》 CSCD 北大核心 2024年第5期1520-1526,共7页
裂缝分割是对路面病害损坏程度评估的重要前提,为平衡深度神经网络分割的有效性与实时性,提出一种基于U-Net编码-解码结构的轻量化沥青路面裂缝图像分割网络PIPNet(Parallel dilated convolution of Inverted Pyramid Network)。编码部... 裂缝分割是对路面病害损坏程度评估的重要前提,为平衡深度神经网络分割的有效性与实时性,提出一种基于U-Net编码-解码结构的轻量化沥青路面裂缝图像分割网络PIPNet(Parallel dilated convolution of Inverted Pyramid Network)。编码部分为倒金字塔结构,提出了具有不同空洞率的多分支并行空洞卷积模块,结合深度可分离卷积和普通卷积,逐级减少并行卷积的个数,对表层、中层及底层特征提取多尺度信息并降低模型复杂度;同时借鉴GhostNet特点,设计了逆残差轻量化模块,嵌入并行双池化注意力。在GAPs384数据集上的测试结果表明,PIPNet在参数量(Params)和计算量(MFLOPs)仅为ResNet50编码近1/6的情况下,平均交并比(mIoU)提高了1.10个百分点,且较轻量化GhostNet和SegNet分别高出4.14与9.95个百分点。实验结果表明,PIPNet在降低模型复杂度的同时,有着较好的裂缝分割性能,且对不同路面裂缝图像分割适应性良好。 展开更多
关键词 沥青路面图像 裂缝分割 轻量化神经网络 倒金字塔结构 并行空洞卷积
下载PDF
基于改进的Faster RCNN的仪表自动识别方法
15
作者 王欣然 张斌 +1 位作者 湛敏 赵成龙 《机电工程》 CAS 北大核心 2024年第3期532-539,共8页
在环境复杂的工业场景中,仪表盘存在类别多、相似性高等问题,导致检测的识别效果较差、准确率不高。针对这一问题,提出了一种基于改进的更快速的区域卷积神经网络(Faster RCNN)的仪表自动识别方法。首先,采用残差网络(Resnet)101代替视... 在环境复杂的工业场景中,仪表盘存在类别多、相似性高等问题,导致检测的识别效果较差、准确率不高。针对这一问题,提出了一种基于改进的更快速的区域卷积神经网络(Faster RCNN)的仪表自动识别方法。首先,采用残差网络(Resnet)101代替视觉几何群网络(VGG)16,进行了网络结构简化;然后,引入了特征金字塔网络(FPN),并将其改进为递归特征金字塔网络后进行了迭代融合,输出了特征图;接着,引入了注意力机制模块,根据特征的重要程度,完成了对输出通道权值的重新分配,增强了Faster RCNN对目标的运算能力;提出了改进非极大值抑制算法(Softer-NMS),通过降低置信度来确定准确的目标候选框;最后,采用Mosaic数据增强技术对可视对象类(VOC)2007数据集进行了扩充,对改进后的Faster RCNN模型进行了仪表自动识别的实验。研究结果表明:在相同工业环境下,与传统的Faster RCNN算法模型相比,改进后的Faster RCNN模型准确率为93.5%,较原模型提高了3.8%,mAP值为92.6%,较原模型提高了3.7%,可见该方法在实际生产中具有较强的鲁棒性与泛化能力,可满足工业上对智能检测的要求。 展开更多
关键词 仪表识别 更快速的区域卷积神经网络 递归特征金字塔网络 注意力机制 非极大值抑制算法 Mosaic数据增强技术
下载PDF
一种轻量化的金字塔卷积
16
作者 秦斌斌 孙金杨 《软件》 2024年第4期29-36,70,共9页
金字塔卷积(Pyconv)是近年提出的一种金字塔式多层结构,可以提取多尺度的特征信息,已被应用于多种计算机视觉任务,但其冗余度高,参数量大。因此,本文提出了一种轻量化的金字塔卷积light_Pyconv,其使用卷积分解和分组卷积降低卷积冗余度... 金字塔卷积(Pyconv)是近年提出的一种金字塔式多层结构,可以提取多尺度的特征信息,已被应用于多种计算机视觉任务,但其冗余度高,参数量大。因此,本文提出了一种轻量化的金字塔卷积light_Pyconv,其使用卷积分解和分组卷积降低卷积冗余度,同时,将残差单元、通道混洗技术以及注意力机制引入设计,以维持网络的准确率并加速有效特征的提取。在VGG13网络上,参数量从1.96M下降到了0.56M,而在CIFAR-10和CIFAR-100数据集上的准确率仅分别下降了0.87%和0.04%;在ResNet18网络上,参数量从9.22M下降到了7.72M,而在两个数据集上的准确率仅分别下降了0.24%和0.76%。light_Pyconv在降低模型尺寸的同时,其在收敛速度和准确率波动上的表现仍优于原始网络结构。 展开更多
关键词 金字塔卷积 轻量级的网络 多尺度特征 卷积神经网络 卷积切除 频道的关注
下载PDF
基于Faster R-CNN的密集人群检测算法 被引量:3
17
作者 邹斌 张聪 《计算机应用》 CSCD 北大核心 2023年第1期61-66,共6页
为提高拥挤场景下的人群检测准确率,提出一种基于改进Faster R-CNN的密集人群检测算法。首先,在特征提取阶段添加空间与通道注意力机制,使用加强的双向特征金字塔网络(S-BiFPN)替代原网络中的多尺度特征金字塔(FPN),使网络对重要特征进... 为提高拥挤场景下的人群检测准确率,提出一种基于改进Faster R-CNN的密集人群检测算法。首先,在特征提取阶段添加空间与通道注意力机制,使用加强的双向特征金字塔网络(S-BiFPN)替代原网络中的多尺度特征金字塔(FPN),使网络对重要特征进行自主学习并加强对图像深层特征的提取;其次,引入多实例预测(MIP)算法对实例进行预测,以避免模型对拥挤场景下的目标造成漏检;最后,对模型中的非极大值抑制(NMS)进行优化,并额外增设一个交并比(IoU)阈值,以对检测结果的干扰项进行精确抑制。在开源的密集人群检测数据集上进行测试的结果显示,相较于原Faster R-CNN算法,所提算法的平均精度(AP)提升5.6%,Jaccard指数值提升3.2%。所提算法具有较高检测精度和稳定性,可以满足密集场景人群检测的需求。 展开更多
关键词 密集人群检测 Faster R-CNN 注意力机制 多实例预测 加强的双向特征金字塔网络
下载PDF
结合全局注意力机制的实时语义分割网络 被引量:2
18
作者 李涛 高志刚 +2 位作者 管晟媛 徐久成 马媛媛 《智能系统学报》 CSCD 北大核心 2023年第2期282-292,共11页
针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic s... 针对轻量化网络结构从特征图提取有效语义信息不足,以及语义信息与空间细节信息融合模块设计不合理而导致分割精度降低的问题,本文提出一种结合全局注意力机制的实时语义分割网络(global attention mechanism with real time semantic segmentation network,GaSeNet)。首先在双分支结构的语义分支中引入全局注意力机制,在通道与空间两个维度引导卷积神经网来关注与分割任务相关的语义类别,以提取更多有效语义信息;其次在空间细节分支设计混合空洞卷积块,在卷积核大小不变的情况下扩大感受野,以获取更多全局空间细节信息,弥补关键特征信息损失。然后重新设计特征融合模块,引入深度聚合金塔池化,将不同尺度的特征图深度融合,从而提高网络的语义分割性能。最后将所提出的方法在CamVid数据集和Vaihingen数据集上进行实验,通过与最新的语义分割方法对比分析可知,GaSeNet在分割精度上分别提高了4.29%、16.06%,实验结果验证了本文方法处理实时语义分割问题的有效性。 展开更多
关键词 实时语义分割 全局注意力机制 多尺度特征融合 混合空洞卷积 卷积神经网络 金字塔池化 感受野 特征提取
下载PDF
密集遮挡条件下的步态识别 被引量:1
19
作者 高毅 何淼 《光学精密工程》 EI CAS CSCD 北大核心 2023年第2期263-276,共14页
步态识别算法主要依赖行人目标的时序轮廓进行特征提取和判别。在实际应用中行人具有结伴行走的特点,轮廓提取易受到其他行人的遮挡和干扰,大幅降低了步态识别算法的精度。为提高人员密集遮挡严重的场景下步态识别算法的鲁棒性,提出一... 步态识别算法主要依赖行人目标的时序轮廓进行特征提取和判别。在实际应用中行人具有结伴行走的特点,轮廓提取易受到其他行人的遮挡和干扰,大幅降低了步态识别算法的精度。为提高人员密集遮挡严重的场景下步态识别算法的鲁棒性,提出一种基于无序序列的深度步态识别算法。首先在Casia-B数据集的基础上进行仿真,建立遮挡情况下的目标轮廓仿真数据集,用于对算法进行遮挡鲁棒性验证;其次,提出基于随机二值膨胀的数据增广方法,同时通过理论和实验论证了HPP(Horizontal Pyramid Pooling)结构在步态识别问题中的局限性,提出退化水平金字塔结构DHPP,利用DHPP结构、CoordConv方法和联合训练裁剪方法的配合,在深度特征中增强绝对位置信息的感知能力,提升算法遮挡鲁棒性的同时减少目标特征表达维度。实验结果表明,所提方法对于步态识别的鲁棒性提升效果明显。 展开更多
关键词 步态识别 数据增广 密集遮挡 DHPP 卷积神经网络
下载PDF
卷积神经网络在流场结构检测中的应用研究
20
作者 苏伟 秦绪国 +2 位作者 王薇 李强 刘文伶 《导弹与航天运载技术(中英文)》 CSCD 北大核心 2023年第4期137-141,共5页
针对飞行器气动设计流场结构分析需求,提出了一种基于卷积神经网络的流场结构自动检测的方法。该方法充分利用神经网络对非线性系统隐藏特征的提取能力,通过学习高维度流场结构特征建立的网络可从CFD流场仿真结果中自主检测气动设计关... 针对飞行器气动设计流场结构分析需求,提出了一种基于卷积神经网络的流场结构自动检测的方法。该方法充分利用神经网络对非线性系统隐藏特征的提取能力,通过学习高维度流场结构特征建立的网络可从CFD流场仿真结果中自主检测气动设计关心的流场结构。该方法采用监督学习和交叉验证方法对网络进行训练和验证,同时采用金字塔结构方法对待检测流场进行预处理,解决了结构检测尺度不匹配的问题并提高了检测正确率。以二维涡检测为例对方法进行了验证,最终识别了大部分区域的涡结构,结果表明该方法是有效的。该方法可进一步应用于三维分离涡、激波边界层干扰等复杂流场结构检测。 展开更多
关键词 气动设计 卷积神经网络 结构特征提取 流场结构检测 金字塔结构方法
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部