期刊文献+
共找到243篇文章
< 1 2 13 >
每页显示 20 50 100
Power Grid Fault Diagnosis Based on Deep Pyramid Convolutional Neural Network
1
作者 Xu Zhang Huiting Zhang +4 位作者 Dongying Zhang Yixian Wang Ruiting Ding Yuchuan Zheng Yongxu Zhang 《CSEE Journal of Power and Energy Systems》 SCIE EI CSCD 2023年第6期2188-2203,共16页
Existing power grid fault diagnosis methods relyon manual experience to design diagnosis models, lack theability to extract fault knowledge, and are difficult to adaptto complex and changeable engineering sites. Consi... Existing power grid fault diagnosis methods relyon manual experience to design diagnosis models, lack theability to extract fault knowledge, and are difficult to adaptto complex and changeable engineering sites. Considering thissituation, this paper proposes a power grid fault diagnosismethod based on a deep pyramid convolutional neural networkfor the alarm information set. This approach uses the deepfeature extraction ability of the network to extract fault featureknowledge from alarm information texts and achieve end-to-endfault classification and fault device identification. First, a deeppyramid convolutional neural network model for extracting theoverall characteristics of fault events is constructed to identifyfault types. Second, a deep pyramidal convolutional neuralnetwork model for alarm information text is constructed, thetext description characteristics associated with alarm informationtexts are extracted, the key information corresponding to faultsin the alarm information set is identified, and suspicious faultydevices are selected. Then, a fault device identification strategythat integrates fault-type and time sequence priorities is proposedto identify faulty devices. Finally, the actual fault cases and thefault cases generated by the simulation are studied, and theresults verify the effectiveness and practicability of the methodpresented in this paper. 展开更多
关键词 Alarm information deep pyramid convolutional neural network fault classification fault device identification feature extraction key information
原文传递
Multi-scale object detection by top-down and bottom-up feature pyramid network 被引量:13
2
作者 ZHAO Baojun ZHAO Boya +2 位作者 TANG Linbo WANG Wenzheng WU Chen 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2019年第1期1-12,共12页
While moving ahead with the object detection technology, especially deep neural networks, many related tasks, such as medical application and industrial automation, have achieved great success. However, the detection ... While moving ahead with the object detection technology, especially deep neural networks, many related tasks, such as medical application and industrial automation, have achieved great success. However, the detection of objects with multiple aspect ratios and scales is still a key problem. This paper proposes a top-down and bottom-up feature pyramid network(TDBU-FPN),which combines multi-scale feature representation and anchor generation at multiple aspect ratios. First, in order to build the multi-scale feature map, this paper puts a number of fully convolutional layers after the backbone. Second, to link neighboring feature maps, top-down and bottom-up flows are adopted to introduce context information via top-down flow and supplement suboriginal information via bottom-up flow. The top-down flow refers to the deconvolution procedure, and the bottom-up flow refers to the pooling procedure. Third, the problem of adapting different object aspect ratios is tackled via many anchor shapes with different aspect ratios on each multi-scale feature map. The proposed method is evaluated on the pattern analysis, statistical modeling and computational learning visual object classes(PASCAL VOC)dataset and reaches an accuracy of 79%, which exhibits a 1.8% improvement with a detection speed of 23 fps. 展开更多
关键词 convolutional neural network (CNN) FEATURE pyramid network (FPN) object detection deconvolution.
下载PDF
Dual Attention Based Feature Pyramid Network 被引量:4
3
作者 Huijun Xing Shuai Wang +1 位作者 Dezhi Zheng Xiaotong Zhao 《China Communications》 SCIE CSCD 2020年第8期242-252,共11页
Object detection could be recognized as an essential part of the research to scenarios such as automatic driving and pedestrian detection, etc. Among multiple types of target objects, the identification of small-scale... Object detection could be recognized as an essential part of the research to scenarios such as automatic driving and pedestrian detection, etc. Among multiple types of target objects, the identification of small-scale objects faces significant challenges. We would introduce a new feature pyramid framework called Dual Attention based Feature Pyramid Network(DAFPN), which is designed to avoid predicament about multi-scale object recognition. In DAFPN, the attention mechanism is introduced by calculating the topdown pathway and lateral pathway, where the spatial attention, as well as channel attention, would participate, respectively, such that the pyramidal feature maps can be generated with enhanced spatial and channel interdependencies, which bring more semantical information for the feature pyramid. Using the COCO data set, which consists of a considerable quantity of small-scale objects, the experiments are implemented. The analysis results verify the optimized performance of DAFPN compared with the original Feature Pyramid Network(FPN) specifically for the identification on a small scale. The proposed DAFPN is promising for object detection in an era full of intelligent machines that need to detect multi-scale objects. 展开更多
关键词 object detection convolutional neural networks feature pyramid
下载PDF
Neighborhood fusion-based hierarchical parallel feature pyramid network for object detection 被引量:3
4
作者 Mo Lingfei Hu Shuming 《Journal of Southeast University(English Edition)》 EI CAS 2020年第3期252-263,共12页
In order to improve the detection accuracy of small objects,a neighborhood fusion-based hierarchical parallel feature pyramid network(NFPN)is proposed.Unlike the layer-by-layer structure adopted in the feature pyramid... In order to improve the detection accuracy of small objects,a neighborhood fusion-based hierarchical parallel feature pyramid network(NFPN)is proposed.Unlike the layer-by-layer structure adopted in the feature pyramid network(FPN)and deconvolutional single shot detector(DSSD),where the bottom layer of the feature pyramid network relies on the top layer,NFPN builds the feature pyramid network with no connections between the upper and lower layers.That is,it only fuses shallow features on similar scales.NFPN is highly portable and can be embedded in many models to further boost performance.Extensive experiments on PASCAL VOC 2007,2012,and COCO datasets demonstrate that the NFPN-based SSD without intricate tricks can exceed the DSSD model in terms of detection accuracy and inference speed,especially for small objects,e.g.,4%to 5%higher mAP(mean average precision)than SSD,and 2%to 3%higher mAP than DSSD.On VOC 2007 test set,the NFPN-based SSD with 300×300 input reaches 79.4%mAP at 34.6 frame/s,and the mAP can raise to 82.9%after using the multi-scale testing strategy. 展开更多
关键词 computer vision deep convolutional neural network object detection hierarchical parallel feature pyramid network multi-scale feature fusion
下载PDF
基于可分离卷积与小波变换融合的道路裂缝检测
5
作者 刘云清 吴越 +2 位作者 张琼 颜飞 陈姗姗 《计算机科学》 CSCD 北大核心 2024年第S02期304-312,共9页
针对目前对细小裂缝检测能力不强、分割精度低等问题,提出了一种改进的U-Net模型来检测路面裂缝,提高检测能力和分割精度。中文设计了新的模块MSDWBlock(Multi-Scale Depthwise Separable Convolutional Block),应用在编码器和解码器部... 针对目前对细小裂缝检测能力不强、分割精度低等问题,提出了一种改进的U-Net模型来检测路面裂缝,提高检测能力和分割精度。中文设计了新的模块MSDWBlock(Multi-Scale Depthwise Separable Convolutional Block),应用在编码器和解码器部分,通过深度可分离卷积增强模型的能力,扩大模型感受野,在跳跃连接部分引入了C2G注意力机制模块,提升模型对裂缝特征的感知能力;并引入了ASPP(Atrous Spatial Pyramid Pooling)和DWT(Discrete Wavelet Transformation)。ASPP通过在多个尺度上进行操作,有助于捕捉到裂缝的特征,而DWT能够减少卷积池化过程中的裂缝空间信息损失,保留裂缝边缘信息。这种结构设计使得网络更专注于裂缝的特征,从而提升了裂缝检测的准确性。通过实验证明所提模型显示出优于U-Net,Segnet,U2net等先进模型的精确性。在CFD数据集上mIoU,F1分别达到78.51%,0.868。这些成果表明,所提方法能有效提升道路裂缝检测的性能。 展开更多
关键词 裂缝检测 U-Net神经网络 深度可分离卷积 注意力机制 空间金字塔 小波变换
下载PDF
基于Transformer的跨尺度交互学习伪装目标检测
6
作者 李建东 王岩 曲海成 《计算机系统应用》 2024年第2期115-124,共10页
伪装目标检测(COD)旨在精确且高效地检测出与背景高度相似的伪装物体,其方法可为物种保护、医学病患检测和军事监测等领域提供助力,具有较高的实用价值.近年来,采用深度学习方法进行伪装目标检测成为一个比较新兴的研究方向.但现有大多... 伪装目标检测(COD)旨在精确且高效地检测出与背景高度相似的伪装物体,其方法可为物种保护、医学病患检测和军事监测等领域提供助力,具有较高的实用价值.近年来,采用深度学习方法进行伪装目标检测成为一个比较新兴的研究方向.但现有大多数COD算法都是以卷积神经网络(CNN)作为特征提取网络,并且在结合多层次特征时,忽略了特征表示和融合方法对检测性能的影响.针对基于卷积神经网络的伪装目标检测模型对被检测目标的全局特征提取能力较弱问题,提出一种基于Transformer的跨尺度交互学习伪装目标检测方法.该模型首先提出了双分支特征融合模块,将经过迭代注意力的特征进行融合,更好地融合高低层特征;其次引入了多尺度全局上下文信息模块,充分联系上下文信息增强特征;最后提出了多通道池化模块,能够聚焦被检测物体的局部信息,提高伪装目标检测准确率.在CHAMELEON、CAMO以及COD10K数据集上的实验结果表明,与当前主流的伪装物体检测算法相比较,该方法生成的预测图更加清晰,伪装目标检测模型能取得更高精度. 展开更多
关键词 深度学习 伪装目标检测 视觉特征金字塔 卷积神经网络 特征融合
下载PDF
基于ResNet101多特征融合的新型冠状病毒感染图像分类方法
7
作者 曹春萍 李哲 《小型微型计算机系统》 CSCD 北大核心 2024年第10期2473-2478,共6页
新型冠状病毒感染自爆发以来一直威胁着人类健康.针对现有对新型冠状病毒医学图像分类方法忽略了对深度神经网络前层特征的利用以及特征信息丢失不利于小区域的分类问题,本文提出了一种多特征融合利用的BAFPN-ResNet101模型.该模型以Res... 新型冠状病毒感染自爆发以来一直威胁着人类健康.针对现有对新型冠状病毒医学图像分类方法忽略了对深度神经网络前层特征的利用以及特征信息丢失不利于小区域的分类问题,本文提出了一种多特征融合利用的BAFPN-ResNet101模型.该模型以ResNet101为主干网络,引入了使用双线性插值法和通道注意力改进的特征金字塔结构,在主干网络与特征金字塔结构横向连接中使用通道注意力增强特征赋予不同的权重,然后利用特征金字塔结构将高层特征与低层特征融合.在公开数据集Chest X-ray(Covid-19&Pneumonia)上测试,实验结果显示,BAFPN-ResNet101模型在三分类实验中对识别新型冠状病毒感染胸部X射线的准确率、精确率、召回率分为97.41%、98.36%、97.20%.与其他方法相比,本文所提方法有效的利用了神经网络前层特征,对新型冠状病毒感染胸部X射线图像能够精确的识别,具有良好的泛化能力和性能. 展开更多
关键词 新型冠状病毒感染 卷积神经网络 特征金字塔 注意力机制 医学图像分类
下载PDF
基于改进卷积神经网络的心理状态预警技术
8
作者 王克 《电子设计工程》 2024年第10期49-53,共5页
针对传统问卷法难以真实反映被调查者心理状态的问题,基于光流法和卷积神经网络提出了一种微表情判断方法,并将其作为心理状态预警技术的核心模块。对于数据集中人脸数据离散的问题,该方法采用人眼权重法对图像进行预处理,且通过金字塔... 针对传统问卷法难以真实反映被调查者心理状态的问题,基于光流法和卷积神经网络提出了一种微表情判断方法,并将其作为心理状态预警技术的核心模块。对于数据集中人脸数据离散的问题,该方法采用人眼权重法对图像进行预处理,且通过金字塔光流算法提取预处理图像序列的光流特征,再利用三维卷积神经网络对该特征加以训练。与传统算法相比,所提方法在减少模型训练参数与运算时间的同时还具有更优的学习能力。实验测试结果表明,该算法在CASME数据集上的微表情识别准确率为89.2%,F1值为0.6751,均优于其他对比方法。由此证明,该算法可实现对人脸微表情的准确识别,进而为学生心理状态预警提供客观的数据支撑。 展开更多
关键词 金字塔光流法 三维卷积神经网络 微表情识别 人脸识别 心理预警
下载PDF
Fine-grained classification of grape leaves via a pyramid residual convolution neural network 被引量:1
9
作者 Hanghao Li Yana Wei +2 位作者 Hongming Zhang Huan Chen Jiangfei Meng 《International Journal of Agricultural and Biological Engineering》 SCIE CAS 2022年第2期197-203,共7页
The value of grape cultivars varies.The use of a mixture of cultivars can negate the benefits of improved cultivars and hamper the protection of genetic resources and the identification of new hybrid cultivars.Classif... The value of grape cultivars varies.The use of a mixture of cultivars can negate the benefits of improved cultivars and hamper the protection of genetic resources and the identification of new hybrid cultivars.Classifying cultivars based on their leaves is therefore highly practical.Transplanted grape seedlings take years to bear fruit,but leaves mature in months.Foliar morphology differs among cultivars,so identifying cultivars based on leaves is feasible.Different cultivars,however,can be bred from the same parents,so the leaves of some cultivars can have similar morphologies.In this work,a pyramid residual convolution neural network was developed to classify images of eleven grape cultivars.The model extracts multi-scale feature maps of the leaf images through the convolution layer and enters them into three residual convolution neural networks.Features are fused by adding the value of the convolution kernel feature matrix to enhance the attention on the edge and center regions of the leaves and classify the images.The results indicated that the average accuracy of the model was 92.26%for the proposed leaf dataset.The proposed model is superior to previous models and provides a reliable method for the fine-grained classification and identification of plant cultivars. 展开更多
关键词 fine-grained classification grape cultivars identification pyramid residual network convolution neural network
原文传递
基于P-U-net的角锥波前探测器的波前校正方法
10
作者 胡鸣 张琪 +6 位作者 王红燕 徐星宇 胡启立 吴晶晶 胡立发 朱华新 黄杨 《液晶与显示》 CAS CSCD 北大核心 2024年第9期1174-1181,共8页
自适应光学技术被广泛应用于像差的校正,但在实际应用中,闭环校正需要较长的时间,并且由于变形镜的非线性响应,传统的开环校正方法的校正精度会受到影响。本文提出一种基于P-U-net网络的角锥波前探测器波前校正方法。P-U-net通过数据训... 自适应光学技术被广泛应用于像差的校正,但在实际应用中,闭环校正需要较长的时间,并且由于变形镜的非线性响应,传统的开环校正方法的校正精度会受到影响。本文提出一种基于P-U-net网络的角锥波前探测器波前校正方法。P-U-net通过数据训练建立了整个自适应光学系统的模型,在角锥波前探测器的光瞳图像与变形镜的控制电压之间构建了直接的非线性映射关系。可以通过角锥波前探测器的光瞳图像直接计算变形镜的控制电压。通过使用仿真自适应系统理论验证了该方法的可行性,可以在50 ms内完成像差校正,校正精度达到0.1μm。与传统的闭环自适应校正算法相比,本文方法可以在更短的时间内完成像差校正,达到更高的精度,具有很好的应用前景。 展开更多
关键词 自适应光学 角锥波前探测器 卷积神经网络
下载PDF
基于跨层次聚合网络的实时城市街景语义分割
11
作者 侯志强 程敏婕 +2 位作者 马素刚 屈敏杰 杨小宝 《光学精密工程》 EI CAS CSCD 北大核心 2024年第8期1212-1226,共15页
随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战... 随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战,主要表现为不同类别的像素区分不够清晰、对于复杂场景结构的理解不够精准以及对小尺度对象或大尺度结构的分割不准确等问题。为此,本文提出一种基于跨层次聚合网络的实时城市街景语义分割算法。首先,在编码器末端设计了结合跨层次聚合的金字塔池化模块,用于高效提取多尺度上下文信息;其次,在编码器和解码器之间设计了跨层次聚合模块,通过引入通道注意力机制增强信息的表征能力,逐级聚合编码器阶段的特征以充分实现特征复用;最后,在解码器阶段设计了多尺度融合模块,在通道维度聚合全局信息与局部信息,促进深层特征与浅层特征的融合。将所提算法在两个通用的城市街景数据集上进行了验证。在一张RTX3090显卡上(TensorRT测速环境),本文算法在Cityscapes测试集以294 FPS的实时性达到73.0%mIoU的准确性,在更高分辨率的图像上以164 FPS的实时性达到75.8%mIoU的准确性;在CamVid数据集以239 FPS的实时性达到74.8%mIoU的准确性。实验结果表明,本文算法在准确性与实时性之间取得了有效平衡,对比其他算法的语义分割性能具有显著提升,为实时城市街景语义分割领域带来了新的突破。 展开更多
关键词 语义分割 卷积神经网络 城市街景 编码器-解码器结构 金字塔池化模块
下载PDF
基于层间引导的低光照图像渐进增强算法
12
作者 黄梦源 常侃 +2 位作者 凌铭阳 韦新杰 覃团发 《计算机应用》 CSCD 北大核心 2024年第6期1911-1919,共9页
低光照图像的图像质量通常较低,低光照图像增强(LLIE)旨在提高这类图像的视觉质量。针对现有的LLIE算法大多专注增强亮度和对比度、忽略细节增强的问题,提出一个基于层间引导的低光照图像渐进增强算法(PELG),兼顾图像亮度和细节增强。首... 低光照图像的图像质量通常较低,低光照图像增强(LLIE)旨在提高这类图像的视觉质量。针对现有的LLIE算法大多专注增强亮度和对比度、忽略细节增强的问题,提出一个基于层间引导的低光照图像渐进增强算法(PELG),兼顾图像亮度和细节增强。首先,使用拉普拉斯金字塔(LP)降低任务复杂度,提高算法效率;其次,利用各频率分量间的相关性,在低频和高频分量之间构建基于Transformer的层间引导融合模块,在各高频分量之间构建轻量级的层间引导融合模块,有效精炼金字塔较低层增强信息指导较高层处理图像,实现基于层间引导的渐进增强;最后,通过LP重建亮度均匀、细节清晰的增强图像。实验结果表明,所提算法的峰值信噪比(PSNR)在LOL(LOw-Light dataset)-v1上比DSLR(Deep Stacked Laplacian Restorer)高2.3 dB,在LOL-v2上比UNIE(Unsupervised Night Image Enhancement)高0.55 dB;与其他基于深度学习的LLIE算法相比,所提算法运行速度快,增强结果在客观和主观质量上均获得明显提升,更适用于实际场景。 展开更多
关键词 低光照图像增强 拉普拉斯金字塔 特征融合 卷积神经网络 TRANSFORMER
下载PDF
基于卷积神经网络特征提取的病理语音识别
13
作者 姜羽菲 石宇 +2 位作者 何若男 陈益 曹辉 《电子设计工程》 2024年第20期26-30,共5页
针对传统病理语音识别效率低的问题,提出了一种利用卷积神经网络语音特征的病理语音识别方法,实现了特征的自动提取。从原始语音信号中提取梅尔语谱图特征,并对原始图像进行数据增强。基于迁移学习的思想,对Alex Net网络进行微调和训练... 针对传统病理语音识别效率低的问题,提出了一种利用卷积神经网络语音特征的病理语音识别方法,实现了特征的自动提取。从原始语音信号中提取梅尔语谱图特征,并对原始图像进行数据增强。基于迁移学习的思想,对Alex Net网络进行微调和训练,并将图像输入到训练好的卷积神经网络中提取语句级特征,输出时由时域金字塔匹配进行统一降维,得到相同长度的语音特征。使用神经网络和支持向量机分类器分别对提取好的语音特征进行分类,以完成病理语音识别。实验结果表明,神经网络能够很好地提取复杂和抽象的特征,避免了前期复杂繁琐的数据处理和数据分析工作,同时与传统特征提取方法相比准确率有所提高。 展开更多
关键词 病理语音识别 梅尔谱图 卷积神经网络 时域金字塔匹配
下载PDF
基于卷积神经网络的路面裂缝分割设计与研究
14
作者 刘艳宁 章国宝 《应用光学》 CAS 北大核心 2024年第2期373-384,共12页
裂缝是路面病害最主要的类型,准确的裂缝分割是国家进行公路预防养护管理的重要决策依据。针对背景复杂下现有模型路面裂缝分割准确度有待提高的问题,提出一种基于卷积神经网络的端到端裂缝分割模型,使用分层结构的ConvNeXt编码器提取... 裂缝是路面病害最主要的类型,准确的裂缝分割是国家进行公路预防养护管理的重要决策依据。针对背景复杂下现有模型路面裂缝分割准确度有待提高的问题,提出一种基于卷积神经网络的端到端裂缝分割模型,使用分层结构的ConvNeXt编码器提取多尺度特征,特征的最高层使用金字塔池化模块进一步获取全局先验特征,通过具有横向连接和自上而下的金字塔结构进行特征融合。针对裂缝和背景不平衡问题,使用平衡交叉熵损失函数提高模型的检测性能。此外,构建了一个包含2 876张裂缝图片的数据集UCrack,覆盖多种裂缝类型和广泛的背景范围,以提供丰富的特征供模型学习。实验表明,在UCrack测试数据集上模型的召回率和F1得分比其他表现最佳的模型提高了2.68%和6.89%;在CrackDataset数据集上的测试取得了85.68%的召回率和80.11%的F1得分,说明模型具有较好的泛化性能,可应对背景复杂的路面裂缝分割。 展开更多
关键词 裂缝分割 卷积神经网络 编解码网络 特征金字塔 金字塔池化
下载PDF
基于CB-Attention的JavaScript恶意混淆代码检测方法
15
作者 徐鑫 张志宁 +2 位作者 吕云山 李立 郑玉杰 《计算机工程与设计》 北大核心 2024年第8期2298-2305,共8页
当今JavaScript代码混淆方法日益多样,现有检测方法在对混淆代检测时会出现漏报和误报的情况,为解决该问题,提出一种基于CB-Attention的JavaScript恶意代码检测方法。由SDPCNN模型和BiLSTM+Attention模型构成,SDPCNN对短距离间的语义特... 当今JavaScript代码混淆方法日益多样,现有检测方法在对混淆代检测时会出现漏报和误报的情况,为解决该问题,提出一种基于CB-Attention的JavaScript恶意代码检测方法。由SDPCNN模型和BiLSTM+Attention模型构成,SDPCNN对短距离间的语义特征信息进行提取,BiLSTM+Attention获取JavaScript代码中长距离间的语义信息特征。为验证所提方法的有效性,将该方法与其它方法进行对比,对比结果表明,该方法具有较好的检测效果,F1-Score可达98.78%。 展开更多
关键词 JavaScript恶意代码 混淆代码 检测模型 增强深度金字塔卷积神经网络 注意力网络 双向长短时记忆网络 长距离特征信息 抽象语法树
下载PDF
基于CNN-Transformer结构的遥感影像变化检测
16
作者 潘梦洋 杨航 范祥晖 《液晶与显示》 CAS CSCD 北大核心 2024年第10期1361-1379,共19页
现代高分辨率遥感图像变化检测借助卷积神经网络(Convolutional Neural Network,CNN)取得了显著成果。然而,卷积操作的感受野限制导致在学习全局上下文和远程空间关系方面存在不足。虽然视觉Transformer能有效捕获远程特征的依赖性,但... 现代高分辨率遥感图像变化检测借助卷积神经网络(Convolutional Neural Network,CNN)取得了显著成果。然而,卷积操作的感受野限制导致在学习全局上下文和远程空间关系方面存在不足。虽然视觉Transformer能有效捕获远程特征的依赖性,但其对影像变化细节的处理不足,导致空间定位能力有限且计算效率低下。为解决上述问题,本文提出了一种基于空间空洞金字塔池化的跨层级联线性融合端到端编解码混合CNN-Transformer的变化检测模型,兼具视觉Transformer和CNN的优势。首先,利用孪生CNN网络提取图像特征,并借助空洞金字塔池化模块对特征进行精细处理,从而更精准地捕获图像的细节特征信息。其次,将提取的特征转化为视觉单词,并通过Transformer编码器进行建模,以获取丰富的上下文信息。这些信息随后被反馈至视觉空间,通过Transformer解码器对原始特征进行强化,提升特征的表达效果。接着,采用跨层级联的方式将CNN提取的特征与Transformer编解码的特征进行融合,利用上采样技术联系不同分辨率的特征图,实现位置信息与语义信息的融合。最后,通过差异增强模块生成包含丰富变化信息的差异特征图。在LEVIR、CDD、DSIFN和WHUCD 4个公开遥感数据集上的广泛实验验证了本文方法的有效性。与其他先进方法相比,本文模型的分类性能更出色,有效改善了变化检测中的欠分割、过分割及边缘粗糙等问题。 展开更多
关键词 遥感图像 变化检测 卷积神经网络 TRANSFORMER 空间空洞金字塔池化
下载PDF
双路径特征金字塔网络遥感图像建筑物提取方法
17
作者 张进鹏 李宏伟 +2 位作者 赵亚帅 吴泽康 李想 《测绘科学技术学报》 2024年第4期397-403,共7页
虽然近年来卷积神经网络在遥感图像建筑物提取研究中取得了极大的成功,但其仍然面临着多尺度目标识别、分割目标边界模糊和提升类不平衡目标识别精度等问题。为解决以上问题,提出了一种双路径特征金字塔编解码结构,用于遥感图像建筑物... 虽然近年来卷积神经网络在遥感图像建筑物提取研究中取得了极大的成功,但其仍然面临着多尺度目标识别、分割目标边界模糊和提升类不平衡目标识别精度等问题。为解决以上问题,提出了一种双路径特征金字塔编解码结构,用于遥感图像建筑物提取。以高分辨率网络为编码器、带注意力机制的特征金字塔为解码器,提高相同目标不同尺度识别能力;通过在编码器加入边界网络增强其对目标边界特征学习,从而提高目标边界识别精度;采用交叉熵损失函数与Dice损失函数加权方式来增强不平衡目标提取精度。最后在WHU航空图像和WHU卫星图像Ⅱ上验证提出方法的有效性,交并比分别达到了90.0%和71.1%。 展开更多
关键词 建筑物提取 特征金字塔 卷积神经网络 高分辨率网络 遥感图像
下载PDF
面向多复杂场景环境的敞车车号辨识研究
18
作者 薛峰 于国丞 +3 位作者 李世杰 凌烈鹏 张峰峰 陈峰炜 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第6期1162-1169,共8页
针对现有敞车车号定位识别方法存在的环境适应性差、定位和识别精度低的问题,本文提出一种面向多种复杂环境下的敞车车号精准定位和识别的方法。搭建融合多尺度特征信息的敞车车号定位模型框架,在此基础上,融合多尺度金字塔特征进行深... 针对现有敞车车号定位识别方法存在的环境适应性差、定位和识别精度低的问题,本文提出一种面向多种复杂环境下的敞车车号精准定位和识别的方法。搭建融合多尺度特征信息的敞车车号定位模型框架,在此基础上,融合多尺度金字塔特征进行深度可分离卷积的敞车车号特征提取网络设计。提出基于改进卷积循环神经网络的车号定位识别模型,主要针对识别网络模型结构进行设计。通过不同环境下采集的敞车车厢图片对本文提出的方法进行验证。结果表明:本文提出的车号定位方法的准确率为0.94,车号识别的准确率为0.97。 展开更多
关键词 车号定位 深度可分离卷积 特征提取 改进卷积循环神经网络 特征金字塔 字符识别 铁路货运 深度学习
下载PDF
改进Unet++的肾脏肿瘤分割方法
19
作者 刘欣 柏正尧 方成 《计算机应用与软件》 北大核心 2024年第2期238-243,263,共7页
针对人工方式分割CT图像肾脏肿瘤区域耗时费力且存在主观因素影响等问题,提出一种基于卷积神经网络的肾脏肿瘤自动分割算法。算法以Unet++分割网络为基础框架,将预训练的ResNet-34网络中四个特征提取模块作为Unet++网络特征编码器,来提... 针对人工方式分割CT图像肾脏肿瘤区域耗时费力且存在主观因素影响等问题,提出一种基于卷积神经网络的肾脏肿瘤自动分割算法。算法以Unet++分割网络为基础框架,将预训练的ResNet-34网络中四个特征提取模块作为Unet++网络特征编码器,来提取图像特征信息;并将重新设计的空洞空间金字塔池化网络嵌入到Unet++每条解码路径中;不同的解码路径通过特征融合得到肾脏肿瘤分割结果。在KiTS19竞赛提供的数据集上进行验证,实验结果表明,该算法有效提高了CT图像肾脏肿瘤的分割精度。 展开更多
关键词 卷积神经网络 CT图像 Unet++网络 空洞空间金字塔池化 肾脏肿瘤
下载PDF
基于改进Faster RCNN的PCB表面缺陷检测研究
20
作者 龚陈博 南卓江 陶卫 《自动化仪表》 CAS 2024年第7期99-103,109,共6页
印刷电路板(PCB)在制造过程中不可避免地存在焊点缺焊、短路、毛刺、缺口、开路、余铜等微小缺陷。传统的基于机器视觉检测的缺陷检测方法存在检测速度慢、误检率和漏检率高、抗干扰能力弱等问题。为解决上述问题,提出一种基于改进快速... 印刷电路板(PCB)在制造过程中不可避免地存在焊点缺焊、短路、毛刺、缺口、开路、余铜等微小缺陷。传统的基于机器视觉检测的缺陷检测方法存在检测速度慢、误检率和漏检率高、抗干扰能力弱等问题。为解决上述问题,提出一种基于改进快速区域卷积神经网络(Faster RCNN)的PCB表面缺陷检测方法。首先,在传统Faster RCNN框架的基础上,融入扩展特征金字塔网络(EFPN)以实现特征提取与融合,并进行多尺度检测,从而尽可能保留图像细节信息以提高检测性能。其次,利用K-means算法结合交并比(IoU)优化区域建议网络(RPN)结构中的锚框参数,使得生成的锚框方案更有针对性。试验结果表明,改进Faster RCNN在PCB缺陷数据集上的全类平均正确率(mAP)值达到93.4%、检测速度达到每秒21.79帧。所提方法可推广应用至芯片、光学器件表面微小缺陷在线检测,从而提升工业生产效率。 展开更多
关键词 印刷电路板 缺陷检测 快速区域卷积神经网络 扩展特征金字塔网络 K-MEANS 小目标检测 机器视觉
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部