期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
基于SSD-MobileNetv2和FPN的人脸检测 被引量:2
1
作者 康晓凤 厉丹 《电子器件》 CAS 北大核心 2023年第2期455-462,共8页
随着人工智能技术的不断发展,人脸检测与识别技术以其广泛的应用性成为学术研究的重点。提出了SSD-MobileNetv2-FPN人脸检测模型,首先用轻量级的MobileNetv2代替SSD中的VGG-16主干网络,减少模型训练参数以提高模型的检测速度,然后引入FP... 随着人工智能技术的不断发展,人脸检测与识别技术以其广泛的应用性成为学术研究的重点。提出了SSD-MobileNetv2-FPN人脸检测模型,首先用轻量级的MobileNetv2代替SSD中的VGG-16主干网络,减少模型训练参数以提高模型的检测速度,然后引入FPN网络提取多尺度特征信息使得模型更利于小目标人脸的检测,增加检测精度。最后引入Focal loss损失函数解决模型在训练过程中出现前景和背景类分布不平衡问题,提高模型性能。实验表明上述模型在Pascal Voc 2012人脸部分数据集中准确率为92.5%,且处理速度快,满足实时需求。 展开更多
关键词 MobileNetv2网络 fpn网络 SSD模型 人脸检测
下载PDF
基于改进Faster RCNN的茶叶叶部病害识别
2
作者 姜晟 曹亚芃 +3 位作者 刘梓伊 赵帅 张振宇 王卫星 《华中农业大学学报》 CAS CSCD 北大核心 2024年第5期41-50,共10页
针对茶园复杂背景下茶叶叶部病害识别较为困难的问题,提出一种基于改进Faster RCNN算法的茶叶叶部病害识别方法。通过对优化区域建议框的特征提取网络VGG-16、MobileNetV2和ResNet50进行比较,选择识别效果较好的ResNet50作为骨干网络,... 针对茶园复杂背景下茶叶叶部病害识别较为困难的问题,提出一种基于改进Faster RCNN算法的茶叶叶部病害识别方法。通过对优化区域建议框的特征提取网络VGG-16、MobileNetV2和ResNet50进行比较,选择识别效果较好的ResNet50作为骨干网络,增加模型在茶园复杂背景下对茶叶叶部病害特征的提取能力;融入特征金字塔网络(feature pyramid network,FPN)改善小目标漏检问题和病斑的多尺度问题;采用Rank&Sort(RS)Loss函数代替原Faster RCNN中的损失函数,缓解样本分布不均给模型带来的性能影响,进一步提高检测精度。结果显示:改进模型平均精度均值PmA为88.06%,检测速度为19.1帧/s,对藻斑病、白星病、炭疽病、煤烟病识别平均精度分别为75.54%、86.84%、90.42%、99.45%,比Faster RCNN算法分别提高40.98、44.16、13.9和2.43百分点。以上结果表明,基于改进Faster RCNN算法的茶叶叶部病害识别方法能够弱化茶园复杂背景的干扰,准确识别茶园复杂背景下茶叶叶部病害目标。 展开更多
关键词 目标检测 茶叶叶部病害 fpn网络 Rank and Sort Loss 区域建议网络
下载PDF
基于YOLO的轻量化目标检测方法研究
3
作者 文磊 《机电产品开发与创新》 2024年第3期114-118,共5页
针对移动端目标检测算法需要模型参数量与计算量更少、推理速度更快和检测效果更好以及目标检测算法对于小目标误检、漏检及特征提取能力不足等问题,提出一种基于YOLOv5改进的轻量化目标检测算法。该算法使用轻量级网络MobileNetV2作为... 针对移动端目标检测算法需要模型参数量与计算量更少、推理速度更快和检测效果更好以及目标检测算法对于小目标误检、漏检及特征提取能力不足等问题,提出一种基于YOLOv5改进的轻量化目标检测算法。该算法使用轻量级网络MobileNetV2作为目标检测算法的骨干网络降低模型的参数量与计算量,通过使用深度可分离卷积结合大卷积核的思想降低网络的计算量与参数量,并提升了小目标的检测精度。使用GhostConv来替换部分普通卷积,进一步降低参数量与计算量.本文算法在VOC竞赛数据集,COCO竞赛数据集两份数据集上均进行了多次对比实验,结果表明本文算法相比于其他模型参数量更小、计算量更小、推理速度更快以及检测精度更高。 展开更多
关键词 轻量化 深度学习 特征金字塔网络(fpn) YOLOv5 大核卷积
下载PDF
融合LoG特征的凸焊螺母检测算法
4
作者 罗柏槐 李扬 +1 位作者 林熙烨 周梓斌 《计算机工程与应用》 CSCD 北大核心 2024年第10期332-340,共9页
针对目前汽车曲面零部件的紧固连接中常用的凸焊工艺中出现凸焊螺母的漏焊、错焊,以及主要依赖人工目测的低效检测方法等问题,提出了一种基于Faster-RCNN的凸焊螺母检测算法。以Faster-RCNN作为基础模型,针对模型在不同角度下螺母特征... 针对目前汽车曲面零部件的紧固连接中常用的凸焊工艺中出现凸焊螺母的漏焊、错焊,以及主要依赖人工目测的低效检测方法等问题,提出了一种基于Faster-RCNN的凸焊螺母检测算法。以Faster-RCNN作为基础模型,针对模型在不同角度下螺母特征各异且难以提取的问题,提出提取LoG特征和原图像自适应融合的方法,以增强模型对螺母特征的提取能力;引入特征金字塔(feature pyramid network,FPN)解决小目标难以被精确检测的问题;为了提升网络在复杂背景中的检测鲁棒性,在FPN中嵌入坐标注意力机制来提升网络对重点目标的关注;设计损失函数,提升训练效果,增强回归框中心点的回归精确度。实验结果表明,所提算法相比原算法,在IoU=0.75时凸焊螺母的检测精确率上升了8.65个百分点,达到90.11%,召回率上升了5.87个百分点,达到79.23%,相比原算法具有明显改善。 展开更多
关键词 目标检测 特征金字塔网络(fpn) 坐标注意力 LoG特征 区域建议网络(RPN)
下载PDF
基于改进Mask R-CNN的输电线路安全检测方法研究
5
作者 王铭晟 《通信电源技术》 2024年第17期219-221,共3页
随着全球电力需求的持续增长和电力网络的不断扩展,输电线路的安全性与稳定性尤为重要。输电线路在连接发电厂和用户的过程中,承担着可靠输送电能的重要职责。为提升输电线路的安全,研究提出一种基于掩膜区域卷积神经网络(Mask Region C... 随着全球电力需求的持续增长和电力网络的不断扩展,输电线路的安全性与稳定性尤为重要。输电线路在连接发电厂和用户的过程中,承担着可靠输送电能的重要职责。为提升输电线路的安全,研究提出一种基于掩膜区域卷积神经网络(Mask Region Convolutional Neural Network,Mask R-CNN)的输电线路安全检测模型,并引入特征金字塔网络(Feature Pyramid Network,FPN)对其进行改进。实验结果表明,在数据集尺寸为500时,改进Mask R-CNN模型的准确率为0.91,损失函数值为0.01。改进的Mask R-CNN模型能够有效提升输电线路缺陷检测的精度,具有较高的实用价值,能够提高电力系统的安全监控水平。 展开更多
关键词 输电线路 安全检测 掩膜区域卷积神经网络(Mask R-CNN) 特征金字塔网络(fpn)
下载PDF
基于立体图像的多路径特征金字塔网络3D目标检测 被引量:3
6
作者 苏凯祺 阎维青 徐金东 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2022年第8期1487-1494,共8页
3D目标检测是计算机视觉和自动驾驶中一项重要的场景理解任务。当前基于立体图像的3D目标检测方法大多没有充分考虑多个目标之间的尺度存在较大差异,从而尺度小的物体容易被忽略,导致检测精度低。针对这一问题,提出了一种基于立体图像... 3D目标检测是计算机视觉和自动驾驶中一项重要的场景理解任务。当前基于立体图像的3D目标检测方法大多没有充分考虑多个目标之间的尺度存在较大差异,从而尺度小的物体容易被忽略,导致检测精度低。针对这一问题,提出了一种基于立体图像的多路径特征金字塔网络(MpFPN)3D目标检测方法。MpFPN对特征金字塔网络进行了扩展,增加了自底向上的路径、由上至下的路径及输入特征图到输出特征图之间的连接,为联合区域提议网络提供了更高语义信息和更细粒度空间信息的多尺度特征信息。实验结果表明:在3D目标检测KITTI数据集上,无论在场景简单、中等、复杂情况下,所提方法获得的结果都优于比较方法的结果。 展开更多
关键词 3D目标检测 特征金字塔网络(fpn) 立体图像 多尺度 深度学习
下载PDF
通道分离双注意力机制的目标检测算法 被引量:10
7
作者 赵珊 郑爱玲 +1 位作者 刘子路 高雨 《计算机科学与探索》 CSCD 北大核心 2023年第5期1112-1125,共14页
对于两阶段目标检测算法中模型存在检测精度低、小目标漏检率高等问题,提出通道分离双注意力机制的目标检测算法,通过改进Faster+FPN主干网络来提高小目标的检测精度。首先针对神经网络不能自动学习特征间的重要性问题,在通道分离过程... 对于两阶段目标检测算法中模型存在检测精度低、小目标漏检率高等问题,提出通道分离双注意力机制的目标检测算法,通过改进Faster+FPN主干网络来提高小目标的检测精度。首先针对神经网络不能自动学习特征间的重要性问题,在通道分离过程中提出双注意力机制来构建深度神经网络,另结合分组卷积、空洞卷积等技术减少网络参数。其次针对高分辨率特征经过深度CNN后导致的信息丢失问题,通过添加细节提取模块以及通道注意力特征融合模块来提取更多的细节特征。最后考虑到一般损失函数不可重点评估目标物位置的置信度,结合KL散度进行损失函数优化,通过训练使得预测分布更接近真实分布,有效地解决了神经网络直接用于目标检测存在的问题。采用PASCAL VOC2007、KITTI以及Pedestrian三类数据集对网络进行训练,并将提出的模型与多个目标检测算法进行对比。实验结果表明,该算法能够高效地对图像进行识别,且具有较高的检测精度。 展开更多
关键词 通道分离 双注意力机制 特征金字塔网络(fpn) KL散度 目标检测
下载PDF
复杂交通环境下多层交叉融合多目标检测 被引量:1
8
作者 李翠锦 瞿中 《电讯技术》 北大核心 2023年第9期1291-1299,共9页
针对目前复杂交通环境下还存在多目标检测精度和速度不高等问题,以特征金字塔网络(Feature Pyramid Network,FPN)为基础,提出了一种多层融合多目标检测与识别算法,以提高目标检测精度和网络泛化能力。首先,采用ResNet101的五层架构将空... 针对目前复杂交通环境下还存在多目标检测精度和速度不高等问题,以特征金字塔网络(Feature Pyramid Network,FPN)为基础,提出了一种多层融合多目标检测与识别算法,以提高目标检测精度和网络泛化能力。首先,采用ResNet101的五层架构将空间分辨率上采样2倍构建自上而下的特征图,按照元素相加的方式将上采样图和自下而上的特征图合并,并构建一个融合高层语义信息与低层几何信息的特征层;然后,根据BBox回归存在训练样本不平衡问题,选择Efficient IOU Loss损失函数并结合Focal Loss提出一种改进Focal EIOU Loss;最后,充分考虑复杂交通环境下的实际情况,进行人工标注混合数据集进行训练。该模型在KITTI测试集上的平均检测精度和速度比FPN分别提升了2.4%和5 frame/s,在Cityscale测试集上平均检测精度和速度比FPN提升了1.9%和4 frame/s。 展开更多
关键词 复杂交通环境 多目标检测 多目标识别 特征金字塔网络(fpn) 多层交叉融合
下载PDF
基于YOLOv5改进的轻量化目标检测 被引量:1
9
作者 管嘉程 任红卫 周宋佳 《计算机系统应用》 2023年第9期132-142,共11页
针对移动端目标检测算法需要模型参数量与计算量更少、推理速度更快和检测效果更好以及目标检测算法对于小目标误检、漏检及特征提取能力不足等问题,提出一种基于YOLOv5改进的轻量化目标检测算法.该算法使用轻量级网络MobileNetV2作为... 针对移动端目标检测算法需要模型参数量与计算量更少、推理速度更快和检测效果更好以及目标检测算法对于小目标误检、漏检及特征提取能力不足等问题,提出一种基于YOLOv5改进的轻量化目标检测算法.该算法使用轻量级网络MobileNetV2作为目标检测算法的骨干网络降低模型的参数量与计算量,通过使用深度可分离卷积结合大卷积核的思想降低网络的计算量与参数量,并提升了小目标的检测精度.使用GhostConv来替换部分普通卷积,进一步降低参数量与计算量.本文算法在VOC竞赛数据集, COCO竞赛数据集两份数据集上均进行了多次对比实验,结果表明本文算法相比于其他模型参数量更小、计算量更小、推理速度更快以及检测精度更高. 展开更多
关键词 轻量化 深度学习 特征金字塔网络(fpn) YOLOv5 大核卷积
下载PDF
基于深度学习的场景图像自适应文本检测方法
10
作者 杨仁桓 康家杰 +3 位作者 秦传波 麦超云 邱天 喻慧文 《现代电子技术》 2023年第16期143-148,共6页
为了解决自然场景图像中任意形状文本检测的难题,文中提出一种具有自适应文本区域表示的鲁棒场景文本检测方法;同时基于回归和分割方法的两种思想,设计自适应角点检测模块(ACDM)和自适应阈值分割模块(ATSM)。将不同尺度的文本生成不同... 为了解决自然场景图像中任意形状文本检测的难题,文中提出一种具有自适应文本区域表示的鲁棒场景文本检测方法;同时基于回归和分割方法的两种思想,设计自适应角点检测模块(ACDM)和自适应阈值分割模块(ATSM)。将不同尺度的文本生成不同数量的角点进行定位,利用自适应阈值的方法生成文本分割图,结合生成的角点候选框进行联合优化。实验结果表明:所提方法在ICDAR2015数据集上综合指标F为86.5%,相较于PSENet网络提升0.8%;在Total-Text和CTW1500数据集上综合指标F分别为85.3%和84.2%,相较于DBNet网络分别提升0.6%和0.8%。该方法能有效提高任意形状文本检测的鲁棒性。 展开更多
关键词 自适应文本检测 自然场景图像 深度学习 自适应角点检测 自适应阈值分割 ResNet-50网络 特征金字塔网络(fpn)
下载PDF
深度学习的多尺度多人目标检测方法研究 被引量:11
11
作者 刘云 钱美伊 +1 位作者 李辉 王传旭 《计算机工程与应用》 CSCD 北大核心 2020年第6期172-179,共8页
深度学习具有自主学习目标特征、识别率高、鲁棒性强等优点,当前基于深度学习的人体目标检测方法不能有效地适应目标的尺度变化。针对上述问题,提出多尺度多人的目标检测方法,将FPN特征金字塔分别与Faster R-CNN网络的两个阶段结合,同时... 深度学习具有自主学习目标特征、识别率高、鲁棒性强等优点,当前基于深度学习的人体目标检测方法不能有效地适应目标的尺度变化。针对上述问题,提出多尺度多人的目标检测方法,将FPN特征金字塔分别与Faster R-CNN网络的两个阶段结合,同时,平衡RPN阶段产生的正负锚点的数量比例,并采用了更适合的锚点纵横比,对原始网络进行了一系列的优化。在标准数据集PETS 2009、Caltech和INRIA上的实验结果表明,提出的检测方法性能优于主流深度学习目标检测算法。 展开更多
关键词 深度学习 多尺度多人目标检测 Faster R-CNN网络 fpn网络 RPN网络 锚点
下载PDF
基于改进DenseNet的水果小目标检测 被引量:15
12
作者 徐利锋 黄海帆 +1 位作者 丁维龙 范玉雷 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2021年第2期377-385,共9页
针对自然环境中小目标水果的检测精度普遍较低的问题,提出基于DenseNet改进的水果目标检测框架.构建以DenseNet为核心的多尺度特征提取模块,在DenseNet不同层级的稠密块中建立特征金字塔结构,加强网络层特征复用.结合低层特征的高分辨... 针对自然环境中小目标水果的检测精度普遍较低的问题,提出基于DenseNet改进的水果目标检测框架.构建以DenseNet为核心的多尺度特征提取模块,在DenseNet不同层级的稠密块中建立特征金字塔结构,加强网络层特征复用.结合低层特征的高分辨率和高层特征的高语义性,实现准确定位和预测小目标水果存在的目的.引入软阈值非极大值抑制(Soft-NMS)算法,改善簇状果实结构中检测框被误剔除的情况.与常用的Faster R-CNN网络相比,所提出的框架在苹果、芒果和杏3个数据集中的平均检测速度大于40 FPS,F1值分别为0.920、0.928、0.831,实现了检测效率及精度的提升. 展开更多
关键词 DenseNet 深度学习 水果小目标检测 特征金字塔网络(fpn) 软阈值非极大值抑制(Soft-NMS)
下载PDF
基于Mask RCNN的桥小脑角区脑膜瘤与听神经瘤分类定位研究 被引量:11
13
作者 刘颖 陈静聪 +1 位作者 胡小洋 章浩伟 《波谱学杂志》 CAS 北大核心 2021年第1期58-68,共11页
由于人体桥小脑角区的脑膜瘤与听神经瘤在影像学的表现以及发病位置极其相似,所以临床诊断极易发生误诊.针对此问题,本文应用掩膜区域卷积神经网络(Mask RCNN)对两类肿瘤进行分类定位研究.首先采集89名脑膜瘤与218名听神经瘤患者的T1WI... 由于人体桥小脑角区的脑膜瘤与听神经瘤在影像学的表现以及发病位置极其相似,所以临床诊断极易发生误诊.针对此问题,本文应用掩膜区域卷积神经网络(Mask RCNN)对两类肿瘤进行分类定位研究.首先采集89名脑膜瘤与218名听神经瘤患者的T1WI-SE序列的磁共振图像,对其进行预处理,再结合改进的特征金字塔网络(FPN)算法进行网络训练.本文对比了三种不同的Mask RCNN主干网络对两者分类定位的效果.结果表明,结合改进的FPN算法和ResNet101作为主干网络的Mask RCNN分类定位模型能够有效实现对两类肿瘤的分类定位,精确率为0.9182、召回率为0.8569、特异性为0.8762、均值平均精度(mAP)为0.90. 展开更多
关键词 掩膜区域卷积神经网络(Mask RCNN) 特征金字塔网络(fpn)算法 分类定位 脑膜瘤 听神经瘤
下载PDF
模糊Petri网在城市安全发展水平评价中的应用分析 被引量:4
14
作者 尹鑫伟 王瑜 +1 位作者 代宝乾 汪彤 《中国安全科学学报》 CAS CSCD 北大核心 2020年第5期129-135,共7页
为克服传统Petri网在评价城市安全发展水平时不易处理模糊信息的缺点,提出基于Petri网络和模糊推理算法的评估分析方法。首先,分析城市安全管理风险特性;其次,借鉴国家安全发展示范城市评价细则,建立三级城市安全发展评价指标体系;然后... 为克服传统Petri网在评价城市安全发展水平时不易处理模糊信息的缺点,提出基于Petri网络和模糊推理算法的评估分析方法。首先,分析城市安全管理风险特性;其次,借鉴国家安全发展示范城市评价细则,建立三级城市安全发展评价指标体系;然后,将指标转换成城市安全模糊Petri网络(FPN)模型,运用模糊推理算法对Petri网络进行迭代计算,得到最终评价矩阵;最后,通过模糊层次分析法(FAHP)与优劣解距离法(TOPSIS)验证该方法结果的可靠性。研究结果表明:该方法能够有效处理指标基础模糊信息,并确定优势环节和薄弱环节,有助于评估城市安全发展水平。 展开更多
关键词 城市安全发展 城市风险特性 模糊Petri网络(fpn) 模糊推理 评估分析
下载PDF
改进的Mask R-CNN算法在人额部区域实例分割任务的应用研究
15
作者 周永旭 《信息与电脑》 2021年第12期65-68,共4页
针对遮盖区域卷积神经网络(Mask Regional Convolutional neural network,Mask R-CNN)在人额部区域分割任务中丢失部分目标的问题,本文改进了Mask R-CNN算法原有的特征金字塔网络(Feature Pyramid Networks,FPN)结构。为了更好地利用图... 针对遮盖区域卷积神经网络(Mask Regional Convolutional neural network,Mask R-CNN)在人额部区域分割任务中丢失部分目标的问题,本文改进了Mask R-CNN算法原有的特征金字塔网络(Feature Pyramid Networks,FPN)结构。为了更好地利用图像中反映出的特征信息,首先将原Mask R-CNN中的高维特征信息进行融合,其次,进行ROI Align操作生成人额部的Mask;最后,仿照COCO数据集,从“LIPCIHPinstance-level_human_parsing”数据集中选取带有人脸额部区域的随机场景照片,自建人额部数据集。实验结果表明改进后的FPN网络模型有着更好的目标分割能力,实验效果更好。 展开更多
关键词 Mask R-CNN 卷积神经网络 fpn网络 人额部分割数据集
下载PDF
基于改进FasterRCNN的配网架空线路异常状态检测 被引量:9
16
作者 王超洋 樊绍胜 +2 位作者 刘铮 李彬 张巍 《电力学报》 2019年第4期322-329,共8页
随着无人机巡线技术的不断发展,现已广泛运用在输电线路运维工作中,但仍需由人工判断线路异常状态类型,检测准确率极易受环境影响,现有智能检测技术检测速度慢、检测手段单一。针对提高异常状态智能检测效率问题,提出基于融合FPN结构的F... 随着无人机巡线技术的不断发展,现已广泛运用在输电线路运维工作中,但仍需由人工判断线路异常状态类型,检测准确率极易受环境影响,现有智能检测技术检测速度慢、检测手段单一。针对提高异常状态智能检测效率问题,提出基于融合FPN结构的FasterRCNN深度学习在线异常状态检测系统。首先采用ResNet50卷积神经网络对原图逐层进行特征提取,得到最高层特征图;再对该特征图使用反池化法进行上采样得到多张低特征图,并将原各层特征图与新各层特征图对应融合;最后将融合后的全部特征图输入RPN层进行二分类与边框回归,经过ROIpooling层后得到异常点检测结果。经过对配网设备及异常状态检测数据集的检测验证,所提出的网络结构对比原FasterRCNN网络,不仅具有更高的识别正确率,且可以有效识别变压器等小目标物体。 展开更多
关键词 架空线路异常状态智能检测 fpn神经网络 FasterRCNN神经网络 高低特征共享
下载PDF
一种实时多尺度目标检测识别算法 被引量:3
17
作者 朱佩佩 吴元 赖作镁 《电讯技术》 北大核心 2022年第5期619-624,共6页
无人机目标检测与识别任务中,目标随着飞行高度的改变尺寸发生显著变化。常规目标检测模型中,获取的小目标细节信息有限,检测精度较低;而适用于小目标的实时检测模型往往容易丢失大目标的背景信息,降低大目标的检测精度。针对以上多尺... 无人机目标检测与识别任务中,目标随着飞行高度的改变尺寸发生显著变化。常规目标检测模型中,获取的小目标细节信息有限,检测精度较低;而适用于小目标的实时检测模型往往容易丢失大目标的背景信息,降低大目标的检测精度。针对以上多尺度目标检测识别任务难点,提出一种基于改进特征金字塔网络(Feature Pyramid Network,FPN)结构的实时多尺度目标检测识别模型。该模型通过增加特征金字塔层级覆盖更广的目标尺度,获取更为丰富的目标信息;同时,利用跨连接增加不同尺度特征融合的多样性,降低特征传导距离,保留更加完整的尺度特征来提高模型检测识别多尺度目标的性能。通过实验发现,相比于原始网络结构和相同特征层级的四层特征金字塔结构,加入改进特征金字塔结构的多尺度目标检测模型识别性能得到了提升。 展开更多
关键词 无人机(UAV) 目标检测与识别 多尺度目标检测 特征金字塔网络(fpn)
下载PDF
基于深度学习水果检测的研究与改进 被引量:17
18
作者 黄豪杰 段先华 黄欣辰 《计算机工程与应用》 CSCD 北大核心 2020年第3期127-133,共7页
为实现自然环境下水果自动化采摘存在受环境和障碍物等因素造成的问题,导致目标水果检测准确率不高,泛化性不强等实际问题,以苹果、橘子、香蕉三种水果作为研究对象,提出一种基于深度学习的SSD(Single Shot Detector)改进模型。经典SSD... 为实现自然环境下水果自动化采摘存在受环境和障碍物等因素造成的问题,导致目标水果检测准确率不高,泛化性不强等实际问题,以苹果、橘子、香蕉三种水果作为研究对象,提出一种基于深度学习的SSD(Single Shot Detector)改进模型。经典SSD采用多尺度特征融合的方式,从网络不同层抽取不同尺度的特征做预测,但是没有用到足够低层的特征,使得小物体的检测效果较差。通过将经典SSD训练使用的VGG16输入模型替换为ResNet-101,利用特征金字塔网络(FPN)结构将高层特征通过上采样和低层特征做融合。实验表明,改进的SSD300和SSD512水果检测模型的平均检测精度为83.05%和84.24%,经数据增强后精度也有所提升,适合于自然环境下水果的精确检测。 展开更多
关键词 深度学习 目标检测 SSD模型 ResNet-101模型 特征金字塔网络(fpn)
下载PDF
风格强度可变的人脸风格迁移网络
19
作者 廖远鸿 钱文华 曹进德 《中国图象图形学报》 CSCD 北大核心 2023年第12期3784-3796,共13页
目的针对人脸风格迁移算法StarGAN(star generative adversarial network)、MSGAN(mode seeking genera⁃tive adversarial network)等存在细节风格学习不佳、迁移效果单一和生成图像失真等缺点,提出一种能够降低失真并生成不同风格强度... 目的针对人脸风格迁移算法StarGAN(star generative adversarial network)、MSGAN(mode seeking genera⁃tive adversarial network)等存在细节风格学习不佳、迁移效果单一和生成图像失真等缺点,提出一种能够降低失真并生成不同风格强度图像的人脸风格迁移算法MStarGAN(multilayer StarGAN)。方法首先,通过特征金字塔网络(feature pyramid network,FPN)构建前置编码器,生成蕴含有图像细节特征的多层特征向量,增强生成图像在风格传输时能学习到的风格图像的细节风格;其次,使用前置编码器对原图像及风格图像各生成一个风格向量并进行组合,利用组合后的风格向量进行风格传输,使生成图像具有不同的风格迁移强度;最后,采用权重解调算法作为生成器中的风格传输模块,通过对卷积权重的操作代替在特征图上的归一化操作,消除特征图中的特征伪影,减少生成图像中的失真。结果在Celeba_HQ数据集上进行实验,与MSGAN、StarGAN v2等对比算法相比,在参考引导合成实验中,MStarGAN的FID(Frechét inception distance score)指标分别降低了18.9和3.1,LPIPS(learned perceptual image patch similarity)指标分别提升了0.094和0.018。在潜在引导合成实验中,MStarGAN的FID指标分别降低了20.2和0.8,LPIPS指标分别提升了0.155和0.92,并能够生成具有不同风格强度的结果图像。结论提出的算法能够传输图像的细节风格,生成具有不同强度的输出图像,并减少生成图像的失真。 展开更多
关键词 人脸风格迁移网络 StarGAN 风格强度 特征金字塔网络(fpn) 权重解调
原文传递
基于改进SSD的交通标志实时检测
20
作者 徐元泽 王勇 《电脑知识与技术》 2021年第29期92-94,共3页
针对实际驾驶时获取的自然交通场景图像中,交通标志占图像比例较小导致检测精度低问题,同时要求交通标志检测速度快,提出一种改进的单发多框检测(SSD)神经网络模型。该模型在SSD基础上融合特征金字塔网络(FPN),在后处理方法应用中心点... 针对实际驾驶时获取的自然交通场景图像中,交通标志占图像比例较小导致检测精度低问题,同时要求交通标志检测速度快,提出一种改进的单发多框检测(SSD)神经网络模型。该模型在SSD基础上融合特征金字塔网络(FPN),在后处理方法应用中心点距离非极大值抑制(DIoU-NMS),提高了交通标志小目标的检测精度。实验结果表明,改进后的SSD网络型检测性能显著提高,其均值平均精度(mAP)比原SSD提高了7.6个百分点,其每秒帧率(FPS)达到31.4具备实时检测能力。 展开更多
关键词 交通标志 实时检测 单发多框检测(SSD) 特征金字塔网络(fpn)
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部