基于通道特征金字塔的田间葡萄实时语义分割方法被引量：4

Real-time semantic segmentation method for field grapes based on channel feature pyramid

下载PDF

导出

摘要复杂环境下葡萄的快速检测识别是智能采摘的关键步骤,为解决目前葡萄识别精度低和实时性差的问题,该研究提出一种轻量级葡萄实时语义分割模型(Grape Real-time Semantic Segmentation Model,GRSM)。首先,利用通道特征金字塔(Channel-wise Feature Pyramid,CFP)模块进行特征提取,该模块通过1×3和3×1空洞卷积的跳跃连接,在减少模型参数量的同时提取葡萄图像的多尺度特征和上下文信息;然后,采用池化卷积融合结构完成下采样,增加可训练参数以减少信息损失;最后,利用跳跃连接融合多种特征恢复图像细节。试验结果表明:该研究所提出的模型在田间葡萄测试集上达到了78.8%的平均交并比,平均像素准确率为90.3%,处理速度达到68.56帧/s,网络结构大小仅为4.88 M。该模型具有较高分割识别精度和较好实时性,能满足葡萄采摘机器人对视觉识别系统的要求,为葡萄的智能化采摘提供了理论基础。 Automated and intelligent harvesting has been one of the most important steps for urgent task in the grape industry.However,the current models of fruit recognition have posed a great balance between accuracy and real-time performance.In this study,a lightweight and real-time semantic segmentation model was proposed for field grape harvesting using a channel feature pyramid.Firstly,a publicly available dataset of field grape instance segmentation was used as the experimental object.A total of 300 grape images were collected with the different pruning periods,lighting conditions,and maturity levels.The LabelMe annotation tool was used to build the field grape dataset.Four types of objects were annotated,including the background,leaves,grapes,and stems.The dataset was then expanded using random enhancement,resulting in a total of 1200images.Since the original images were too large in pixels to be trained directly,the image resolution was uniformly compressed to 512×512(pixels)for better training efficiency of the network model.Secondly,the convolutional kernels of different sizes were arranged in the perceptual fields,due to the huge differences in the grape size and location.The channel feature pyramid module was then utilized for the feature extraction.The 3×3,5×5,and 7×7 multi-scale feature extraction datasets were then achieved for the jumping connections of 1×3 and 3×1 null convolutions in a single channel.As such,the multi-scale and contextual features were effectively extracted from the grape images.At the same time,the model parameters were reduced to increase the trainable ones for less information loss.The convolutional fusion structure was pooled during down-sampling,instead of the traditional maximum pooling structure.The jump joints were employed in the decoding part,in order to fuse information from different feature layers for the recovery of image details.Finally,the improved model was tested on a grape test set.The experimental results showed that the Mean Intersection over Union(MIoU)was 78.8%,The Mean Pixel Accuracy(MPA)was 90.3%,and the real-time processing speed was 68.56 frames/s.The model size was only 4.88 MB.The accuracies of Mean IoU were improved by 7.9,5.7,and 10.5 percentage points in the real-time semantic segmentation networks,respectively,compared with the BiSeNet,ENet,and DFAnet.The accuracies of the improved model increased by 1.2 and 8.8 percentage points,respectively,compared with lightweight networks using mobilienetv3 and inception as encoders.Therefore,the proposed network presented a significant advantage over the real-time and lightweight networks,in terms of segmentation accuracy.The mean IoUs of the semantic segmentation network was reduced by 2.3,2.0,and 3.7 percentage points,respectively,but the model sizes were 12.3%,4.1%,and 7.4%,respectively,compared with the classical networks,Deeplabv3+,SegNet,and UNet.The real-time requirement fully met the tradeoff between real-time and accuracy.The improved model can be expected to serve as the segmentation recognition of field grapes in smart agriculture.The finding can also provide technical support for the visual recognition systems in the grape-picking robots.

作者孙俊宫东见姚坤杉芦兵戴春霞武小红 Sun Jun;Gong Dongjian;Yao Kunshan;Lu Bing;Dai Chunxia;Wu Xiaohong(School of Electrical and Information Engineering,Jiangsu University,Zhenjiang 212013,China)

机构地区江苏大学电气信息工程学院

出处《农业工程学报》 EI CAS CSCD 北大核心 2022年第17期150-157,共8页 Transactions of the Chinese Society of Agricultural Engineering

基金江苏大学农业装备学部项目(NZXB20210210) 江苏高校优势学科建设工程(三期)资助项目(PAPD-2018-87)。

关键词机器视觉图像识别语义分割实时性葡萄 CFP machine vision image recognition semantic segmentation real-time grape CFP

分类号 S126 [农业科学—农业基础科学]

引文网络
相关文献

参考文献11

1孔庆山,刘崇怀,潘兴,刘三军.国内外鲜食葡萄发展现状、趋势、问题与对策[J].中国农业信息快讯,2002(7):3-6. 被引量：71
2刘平,朱衍俊,张同勋,侯加林.自然环境下贴叠葡萄串的识别与图像分割算法[J].农业工程学报,2020,36(6):161-169. 被引量：27
3田锐,郭艳玲.基于机器视觉的葡萄自动识别技术[J].东北林业大学学报,2008,36(11):95-97. 被引量：28
4孙俊,谭文军,毛罕平,武小红,陈勇,汪龙.基于改进卷积神经网络的多种植物叶片病害识别[J].农业工程学报,2017,33(19):209-215. 被引量：190
5赵德安,吴任迪,刘晓洋,赵宇艳.基于YOLO深度卷积神经网络的复杂背景下机器人采摘苹果定位[J].农业工程学报,2019,35(3):164-173. 被引量：160
6李就好,林乐坚,田凯,Al Aasmi Alaa.改进Faster R-CNN的田间苦瓜叶部病害检测[J].农业工程学报,2020,36(12):179-185. 被引量：48
7孙俊,谭文军,武小红,沈继锋,芦兵,戴春霞.多通道深度可分离卷积模型实时识别复杂背景下甜菜与杂草[J].农业工程学报,2019,35(12):184-190. 被引量：28
8李云伍,徐俊杰,刘得雄,于尧.基于改进空洞卷积神经网络的丘陵山区田间道路场景识别[J].农业工程学报,2019,35(7):150-159. 被引量：31
9贾伟宽,李倩雯,张中华,刘国良,侯素娟,Ji Ze,郑元杰.复杂环境下柿子和苹果绿色果实的优化SOLO分割算法[J].农业工程学报,2021,37(18):121-127. 被引量：6
10薛君蕊,王昱潭,曲爱丽,张加欣,邢振伟,魏海岩,孙浩伟.基于改进FCN-8s的灵武长枣图像分割方法[J].农业工程学报,2021,37(5):191-197. 被引量：13

二级参考文献93

1张凯,赵丽宁,孙哲,耿长兴,李伟.葡萄套袋智能机器人系统设计与目标提取[J].农业机械学报,2013,44(S1):240-246. 被引量：9
2毛罕平.农业装备智能化技术的发展动态和重点领域[J].农机科技推广,2005(6):12-14. 被引量：6
3郑罡,王惠南,李远禄,汤敏.基于Chan-Vese模型的目标多层次分割算法[J].中国图象图形学报,2006,11(6):804-810. 被引量：7
4田有文,李天来,李成华,朴在林,孙国凯,王滨.基于支持向量机的葡萄病害图像识别方法[J].农业工程学报,2007,23(6):175-180. 被引量：84
5Van E J, Hemming H J. An Autonomaus Robot for Harvesting Cucumbers in Greenhouses [ J ]. Autonomous Robots, 2002,13 ( 3 ) : 241 - 258.
6Gonzalez R C,Woods R E.数字图像处理[M].2版.阮秋琦,阮宇智,等译.北京:电子工业出版社,2003
7翟衡,杜远鹏,孙庆华,王兆顺,裴承国,王忠跃.论我国葡萄产业的发展[J].果树学报,2007,24(6):820-825. 被引量：41
8侯学贵,陈勇,郭伟斌.除草机器人田间机器视觉导航[J].农业机械学报,2008,39(3):106-108. 被引量：43
9谭峰,马晓丹.基于叶片的植物病虫害识别方法[J].农机化研究,2009,31(6):41-43. 被引量：23
10司永胜,乔军,刘刚,刘兆祥,高瑞.基于机器视觉的苹果识别和形状特征提取[J].农业机械学报,2009,40(8):161-165. 被引量：76

共引文献571

1刘云玲,张天雨,姜明,李勃,宋坚利.基于机器视觉的葡萄品质无损检测方法研究进展[J].农业机械学报,2022,53(S01):299-308. 被引量：6
2闫彬,樊攀,王美茸,史帅旗,雷小燕,杨福增.基于改进YOLOv5m的采摘机器人苹果采摘方式实时识别[J].农业机械学报,2022,53(9):28-38. 被引量：24
3叶中华,赵明霞,贾璐.复杂背景农作物病害图像识别研究[J].农业机械学报,2021,52(S01):118-124. 被引量：14
4傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：49
5王凯,姜吴昊,吕艳,倪益华,侯英岢.基于深度学习的笼养蛋鸡行为实时检测方法[J].中国农业大学学报,2019,24(11):123-133. 被引量：7
6孔凡国,李志豪,仇展明,王鑫.基于改进YOLOv5-s的火龙果多任务识别与定位[J].电子测量技术,2023,46(18):155-162.
7刘佳典,宋伟东,朱洪波,张兵,戴激光.改进U-Net模型的遥感影像水体提取研究[J].测绘科学,2022,47(8):230-239. 被引量：1
8阮顺领,焦鑫,景莹,卢才武,顾清华.一种露天矿区非结构化道路分割检测方法[J].测绘科学,2022,47(6):204-212. 被引量：3
9梅军霞,李琳,程建徽,魏灵珠,吴江.美国无核葡萄在浙江的引种表现[J].湖南农业科学,2013(5):95-98. 被引量：5
10熊俊涛,邹湘军,彭红星,吴定中,朱梦思.荔枝采摘机械手视觉定位系统设计[J].农业机械学报,2012,43(S1):250-255. 被引量：9

同被引文献61

1刘莫尘,褚镇源,崔明诗,杨庆璐,王金星,杨化伟.基于改进YOLO v8-Pose的红熟期草莓识别和果柄检测[J].农业机械学报,2023,54(S02):244-251. 被引量：2
2项荣,应义斌,蒋焕煜,彭永石.基于双目立体视觉的番茄定位[J].农业工程学报,2012,28(5):161-167. 被引量：56
3朱镕杰,朱颖汇,王玲,卢伟,罗慧,张志川.基于尺度不变特征转换算法的棉花双目视觉定位技术[J].农业工程学报,2016,32(6):182-188. 被引量：10
4赵菡,张琤,林家骏.基于混合编码遗传算法的最优跟踪门[J].华东理工大学学报（自然科学版）,2017,43(6):844-848. 被引量：4
5李凯,张建华,冯全,孔繁涛,韩书庆,吴建寨.复杂背景与天气条件下的棉花叶片图像分割方法[J].中国农业大学学报,2018,23(2):88-98. 被引量：16
6王小娟,李云伍,刘得雄,孙红伟,黄雪燕.基于机器视觉的丘陵山区田间道路虚拟中线提取方法[J].西南大学学报（自然科学版）,2018,40(4):162-169. 被引量：9
7罗陆锋,邹湘军,叶敏,杨自尚,张丛,朱娜,王成琳.基于双目立体视觉的葡萄采摘防碰空间包围体求解与定位[J].农业工程学报,2016,32(8):41-47. 被引量：23
8李凯,冯全,张建华.棉花苗叶片复杂背景图像的联合分割算法[J].计算机辅助设计与图形学学报,2017,29(10):1871-1880. 被引量：13
9杨阿庆,薛月菊,黄华盛,黄宁,童欣欣,朱勋沐,杨晓帆,毛亮,郑婵.基于全卷积网络的哺乳母猪图像分割[J].农业工程学报,2017,33(23):219-225. 被引量：28
10梁喜凤,金超杞,倪梅娣,王永维.番茄果实串采摘点位置信息获取与试验[J].农业工程学报,2018,34(16):163-169. 被引量：18

引证文献4

1杨珍,龚惟新,李凯,郝伟,何智,丁辛亭,崔永杰.高架草莓的果实识别与果梗分割[J].农业工程学报,2023,39(17):172-181. 被引量：2
2梁新成,刘鹏,李云伍,张志冬,陈欣,李法霖.融合毫米波雷达与机器视觉的田间道路视觉引导线提取[J].农业工程学报,2023,39(19):141-153.
3张士豪,沈磊,宋利杰,韩腾飞,宋育阳,房玉林,苏宝峰.基于RGB-D图像的葡萄复芽识别定位方法[J].农业工程学报,2023,39(21):172-180.
4周馨曌,吴烽云,邹湘军,蒙贺伟,张芸齐,罗锡文.基于多目标识别的葡萄果串采摘点定位方法[J].农业工程学报,2023,39(22):166-177. 被引量：1

二级引证文献3

1黄家才,赵雪迪,高芳征,温鑫,金少宇,张洋.基于改进YOLOv5s的草莓多阶段识别检测轻量化算法[J].农业工程学报,2023,39(21):181-187. 被引量：1
2刘鑫,马本学,李玉洁,陈金成,喻国威.基于改进YOLOv7-ByteTrack的干制哈密大枣缺陷检测与计数系统[J].农业工程学报,2024,40(3):303-312.
3殷建军,康俊琪,肖德琴.基于改进YOLOv5l的轻量化鸭蛋裂纹检测算法[J].农业工程学报,2024,40(5):216-223.

1周中,张俊杰,龚琛杰,丁昊晖.基于深度语义分割的隧道渗漏水智能识别[J].岩石力学与工程学报,2022,41(10):2082-2093. 被引量：4
2路乔宽,张惊雷.基于无锚框YOLO检测网络的麦穗检测方法[J].山东农业大学学报（自然科学版）,2022,53(5):796-802.
3刘小刚,李荣梅,范诚,杨启良,赵璐.基于语义分割的芒果表皮缺陷识别[J].华南农业大学学报,2023,44(1):134-141.
4张颖,张喆,龙光利.融合轻量化与梯形结构的学生行为检测算法[J].电子技术应用,2022,48(12):47-53. 被引量：2
5刘粤,赵迪,田紫欣,熊炜,许婷婷,李利荣.双金字塔结构引导的多粒度行人重识别方法[J].光电子．激光,2022,33(9):959-967.
6岳有军,耿连欣,赵辉,王红君.基于ARD-PSPNet网络下的水下鱼类图像分割算法研究[J].光电子．激光,2022,33(11):1173-1182. 被引量：2
7马涪元,王英,李丽娜,汪洪吉.融合结构和特征的图层次化池化模型[J].计算机科学与探索,2023,17(1):179-186.
8王振华,刘阳星,赵晓雨,张书台.结合上下文和注意力机制改进的视盘分割模型[J].中国医学物理学杂志,2023,40(1):47-53. 被引量：1
9吴飞飞,李晓娟.一种深度学习的通货核桃品种分选方法[J].现代电子技术,2023,46(2):154-158.
10洪杨.供热企业财务会计与内部审计的融合发展路径探究[J].知识经济,2023(1):79-81.

农业工程学报

2022年第17期

浏览历史

内容加载中请稍等...

基于通道特征金字塔的田间葡萄实时语义分割方法被引量：4

参考文献11

二级参考文献93

共引文献571

同被引文献61

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于通道特征金字塔的田间葡萄实时语义分割方法 被引量：4

参考文献11

二级参考文献93

共引文献571

同被引文献61

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于通道特征金字塔的田间葡萄实时语义分割方法被引量：4