期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
共享核空洞卷积与注意力引导FPN文本检测 被引量:4
1
作者 孟月波 金丹 +3 位作者 刘光辉 徐胜军 韩九强 石德旺 《光学精密工程》 EI CAS CSCD 北大核心 2021年第8期1955-1967,共13页
高分辨率图像具有特征尺度差异较大的特点,针对其造成的细粒度特征难以捕获、多尺度特征融合不佳问题,提出一种共享核空洞卷积与注意力引导(Kernel-Sharing Dilated Convolutions and Attention-guided FPN,KDA-FPN)的复杂场景文本检测... 高分辨率图像具有特征尺度差异较大的特点,针对其造成的细粒度特征难以捕获、多尺度特征融合不佳问题,提出一种共享核空洞卷积与注意力引导(Kernel-Sharing Dilated Convolutions and Attention-guided FPN,KDA-FPN)的复杂场景文本检测方法;提出最小交集(Intersection Over Minimum,IOM)后处理策略,改善因文本长宽比变化较大特性导致的掩膜重叠现象,提升检测效果。首先,模型以Resnet50为主干网络采用FPN结构捕获多尺度特征;然后,利用空洞卷积扩大特征感受野,提高特征信息的多尺度捕获能力,深层次挖掘文本细粒度特征,并通过共享核手段减少模型参数量,降低计算成本;同时,采用上下文注意模块(Context Attention Module,CxAM)捕捉多感受野间的语义信息关系,通过内容注意模块(Content Attention Module,CnAM)精确定位目标位置信息,增强多尺度融合能力,提升特征图质量;最后,将同一文本区域预测的候选框按大小排列,提出将面积最大的框与相邻文本框之间区域的交集面积占较小框面积的比值作为候选框筛选指标,抑制检测结果的掩模重叠现象,实现文本的精准检测。采用ICDAR2013、ICDAR2015、TotalText数据集进行对比实验,实验结果表明,本文模型对于水平场景文本检测的精度和召回率分别为95.3和90.4;对于倾斜文本检测的精度和召回率分别为87.1和84.2;对于任意形状文本检测的精度和召回率分别为69.6和57.3。提出的算法有效克服了图像分辨率、文本形状与长度等因素的影响,提高了检测精度,得到了更为精准的文本边界。 展开更多
关键词 文本检测 注意力结构 共享空洞卷积 特征金字塔网络
下载PDF
空洞卷积模型遥感影像建筑快速检测方法研究
2
作者 刘瑶 亢玮 赵占营 《测绘与空间地理信息》 2024年第4期149-152,共4页
基于端到端的检测框架,使用多空洞率卷积核组作为特征提取模块,并在不同特征提取层间设置了密集连接,来加强不同尺度特征图内的信息复杂度;以多尺度特征图融合为基础,构建了4个输出层的特征图上采样金字塔,最后通过数据增强提高了训练... 基于端到端的检测框架,使用多空洞率卷积核组作为特征提取模块,并在不同特征提取层间设置了密集连接,来加强不同尺度特征图内的信息复杂度;以多尺度特征图融合为基础,构建了4个输出层的特征图上采样金字塔,最后通过数据增强提高了训练集内目标的表达能力。测试结果表明,本文方法在测试数据集上能够达到较高的检测精度,体现了良好的实时检测能力,并且对不同背景下多角度的房屋目标具有很好的泛化性能。该方法在城市违章建筑监管与智慧城市建设等领域具有较高的实用价值。 展开更多
关键词 遥感影像 建筑物检测 空洞卷积核 密集连接 多尺度特征金字塔
下载PDF
基于深度学习监控场景下的多尺度目标检测算法研究 被引量:1
3
作者 程显毅 胡海涛 +1 位作者 季国华 孙丽丽 《南京师范大学学报(工程技术版)》 CAS 2018年第3期33-38,共6页
针对监控环境下的视频图像处理存在漏检这一问题,分析现有目标检测算法中普遍使用的深度学习方法—Faster R-CNN,在VGG16卷积神经网络基础上,对深度卷积神经网络进行改进,在第一层卷积层中加入空洞卷积核,扩展神经网络的宽度,使得目标... 针对监控环境下的视频图像处理存在漏检这一问题,分析现有目标检测算法中普遍使用的深度学习方法—Faster R-CNN,在VGG16卷积神经网络基础上,对深度卷积神经网络进行改进,在第一层卷积层中加入空洞卷积核,扩展神经网络的宽度,使得目标检测模型具有尺度不变性.在深度学习平台PyTorch下对Cifar-10数据集进行了实验,实验结果显示,改进的目标检测算法具有较好的尺度不变性,在监控场景下更具优势. 展开更多
关键词 深度学习 目标检测 空洞卷积核 监控场景
下载PDF
分层级联生成对抗网络用于手背静脉图像修复
4
作者 王军 申政文 +1 位作者 陈晓玲 潘在宇 《信号处理》 CSCD 北大核心 2020年第11期1819-1828,共10页
为解决在识别过程中因手背静脉图像信息缺失而造成识别效率低下的问题,本文提出了分层级联生成对抗网络的手背静脉图像修复框架。该网络框架分别以级联与并行分层的方式进行修复操作,通过并行分层结构创新性的融合了不同静脉图像的特征... 为解决在识别过程中因手背静脉图像信息缺失而造成识别效率低下的问题,本文提出了分层级联生成对抗网络的手背静脉图像修复框架。该网络框架分别以级联与并行分层的方式进行修复操作,通过并行分层结构创新性的融合了不同静脉图像的特征信息;为有效地利用静脉图像的上下文信息对缺失的静脉图像信息进行预测与补全,在网络中创新性的引入了空洞卷积核与非局部注意力网络;为保证修复静脉图像质量与其真实图像的一致性,创新性的结合对抗损失与感知损失进行优化。实验结果表明,本文算法在视觉效果、峰值信噪比(Peak Signal to Noise Ratio,PSNR)和结构相似性(Structural Similarity Index,SSIM)等方面表现优于已有算法,并在两个公开的掌纹与指纹数据集上进行了有效的泛化验证。此外,修复图像相较于缺失图像在身份识别效率方面有了一定的提高。 展开更多
关键词 图像修复 手背静脉 空洞卷积核 非局部注意力
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部