基于Transformer的强泛化苹果叶片病害识别模型被引量：11

Model for identifying strong generalization apple leaf disease using Transformer

下载PDF

导出

摘要模型泛化能力是病害识别模型多场景应用的关键,该研究针对不同环境下的苹果叶片病害数据,提出一种可以提取多类型特征的强泛化苹果叶片病害识别模型CaTNet。该模型采用双分支结构,首先设计了一种卷积神经网络分支,负责提取苹果叶片图像的局部特征,其次构建了具有挤压和扩充功能的视觉Transformer分支,该分支能够提取苹果叶片图像的全局特征,最后将两种特征进行融合,使Transformer分支可以学习局部特征,使卷积神经网络分支学习全局特征。与多种卷积神经网络模型和Transformer模型相比,该模型具有更好的泛化能力,仅需学习实验室环境叶片数据,即可在自然环境数据下达到80%的识别精度,相较卷积神经网络EfficientNetV2的72.14%精度和Transformer网络PVT的52.72%精度均有较大提升,能够有效提升对不同环境数据的识别精度,解决了深度学习模型训练成本高,泛化能力弱的问题。 Apple diseases have pose a serious risk on the income of orchards in recent years.An accurate and rapid identification of apple diseases can be great benefit to better prevent and control diseases.Most effort has been made in the laboratory to train the identification model,due mainly to the limited condition for the deliberately infect apples in the real orchard.However,most models cannot fully meet the requirement of the disease detection in the large-scale production.In this study,a deep learning model(called CaTNet)was proposed to extract both the global and local information from the diseases of apple leaf.The image data of disease was collected from the apple orchards in the Jilin Province of China.A total of 16,464 images were obtained from the several publicly available datasets with the laboratory and natural environmental data collected from the field.Firstly,a model structure was constructed with both Transformer and convolutional neural network(CNN).Global and local information was extracted from the original images using the two branches.The strong generalization ability of the model was improved to learn a wider variety of features.Meanwhile,the global features were acquired to improve the resistance of the model to interference.Secondly,the Transformer block in the Transformer branch was optimized to make the structure simpler.In addition,a channel compression and expansion module was designed in the Transformer branch,in order to reduce the training cost of CaTNet for the less channel dimension of the input features.Afterwards,the multiple multilayer perceptrons were replaced by the grouped convolutional layers to further improve the computational speed of the model.Thirdly,the lightweight CNN branch was constructed with an inverse residual structure to fuse the point convolution of the expanded channels with the 3×3 convolution of the extracted information.The CNN branch was utilized to extract the local features of the image.As such,the model was more sensitive to the fine-grained features.Finally,the concat operation was implemented to fuse the different output of features from the two branches.After that,the CNN branch was selected to extract the local features from the global ones,whereas,the Transformer branch was extracted the global from the local.The multiple features to be cycled were also improved the generalization of the model.A comparison was made to clarify the effect of different down-sampling on the two-branch network.Specifically,an accuracy rate of 79.35%,74.06%and 67.95%were obtained using pooling,3×3 size convolution kernel,and 1×1 size convolution kernel for the down-sampling,respectively.The CaTNet model with two branches showed a computational speed of 0.1082 s/Frame),which was faster than the various deep learning models,such as the EfficientNetV2 s(0.3832 s/Frame)and PVT t(0.1778 s/Frame).Consequently,the two-branch structure can be expected to accommodate more computation for the much higher computational speed.This finding can provide a design approach to build the deep learning models with the high generalization capability,particularly on the training with the high accuracy under only easily accessible data.

作者徐艳蕾孔朔琳陈清源高志远李陈孝 Xu Yanlei;Kong Shuolin;Chen Qingyuan;Gao Zhiyuan;Li Chenxiao(College of Information Technology,Jilin Agricultural University,Changchun 130118,China)

机构地区吉林农业大学信息技术学院

出处《农业工程学报》 EI CAS CSCD 北大核心 2022年第16期198-206,共9页 Transactions of the Chinese Society of Agricultural Engineering

基金吉林省科技厅国际科技合作项目(20200801014GH) 长春市科技局重点科技攻关项目(21ZGN28)。

关键词图像识别农业卷积神经网络苹果叶片病害 Transformer模型强泛化性特征融合 image identification agriculture convolutional neural networks apple leaf disease Transformer model strong generalization ability feature fusion

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1郝菁,贾宗维.基于图像识别的苹果叶片病害识别模型对比研究[J].中国农学通报,2022,38(12):153-158. 被引量：3
2刘斌,徐皓玮,李承泽,宋鸿利,何东健,张海曦.基于快照集成卷积神经网络的苹果叶部病害程度识别[J].农业机械学报,2022,53(6):286-294. 被引量：18
3Swati Singh,Isha Gupta,Sheifali Gupta,Deepika Koundal,Sultan Aljahdali,Shubham Mahajan,Amit Kant Pandit.Deep Learning Based Automated Detection of Diseases from Apple Leaf Images[J].Computers, Materials & Continua,2022(4):1849-1866. 被引量：2
4贾伟宽,孟虎,马晓慧,赵艳娜,Ji Ze,郑元杰.基于优化Transformer网络的绿色目标果实高效检测模型[J].农业工程学报,2021,37(14):163-170. 被引量：15
5孙俊,朱伟栋,罗元秋,沈继锋,陈义德,周鑫.基于改进MobileNet-V2的田间农作物叶片病害识别[J].农业工程学报,2021,37(22):161-169. 被引量：56
6甘雨,郭庆文,王春桃,梁炜健,肖德琴,吴惠粦.基于改进EfficientNet模型的作物害虫识别[J].农业工程学报,2022,38(1):203-211. 被引量：35
7宋磊,李嵘,焦义涛,宋怀波.基于ResNeXt单目深度估计的幼苗植株高度测量方法[J].农业工程学报,2022,38(3):155-163. 被引量：10

二级参考文献73

1Wenjie Liu,Guoqing Wu,Fuji Ren,Xin Kang.DFF-ResNet: An Insect Pest Recognition Model Based on Residual Networks[J].Big Data Mining and Analytics,2020,3(4):300-310. 被引量：6
2王晓峰,黄德双,杜吉祥,张国军.叶片图像特征提取与识别技术的研究[J].计算机工程与应用,2006,42(3):190-193. 被引量：114
3赵朋,刘刚,李民赞,李道亮.基于GIS的苹果病虫害管理信息系统[J].农业工程学报,2006,22(12):150-154. 被引量：35
4张五一,赵强松,王东云.机器视觉的现状及发展趋势[J].中原工学院学报,2008,19(1):9-12. 被引量：84
5高万林,李桢,于丽娜,王进.加快农业信息化建设促进农业现代化发展[J].农业现代化研究,2010,31(3):257-261. 被引量：83
6阚江明,王怡萱,杨晓微,冷萃.基于叶片图像的植物识别方法[J].科技导报,2010,28(23):81-85. 被引量：21
7韩学俭.北方苹果根部病害识别及其防治[J].植物医生,1999,12(6):19-20. 被引量：2
8韩瑞珍,何勇.基于计算机视觉的大田害虫远程自动识别系统[J].农业工程学报,2013,29(3):156-162. 被引量：41
9李保华,王彩霞,董向丽.我国苹果主要病害研究进展与病害防治中的问题[J].植物保护,2013,39(5):46-54. 被引量：127
10毋媛媛,刁智华,王会丹,赵明珍,魏伟.作物病害图像形状特征提取研究[J].农机化研究,2015,37(1):64-67. 被引量：9

共引文献124

1李震,李佳盟,王楠,张源,孙红,李民赞.基于轻量化改进模型的小麦白粉病检测装置研发[J].农业机械学报,2023,54(S02):314-322.
2陈思羽,朱红媛,王俊发,于添,王贞旭,刘春山.基于Opt-MobileNetV3的大豆种子异常籽粒识别研究[J].农业机械学报,2023,54(S02):359-365.
3郭小燕,于帅卿,沈航驰,李龙,杜佳举.基于全局特征提取的农作物病害识别模型[J].农业机械学报,2022,53(12):301-307. 被引量：4
4张飞宇,王美丽,王正超.引入 Transformer 和尺度融合的动物骨骼关键点检测模型构建[J].农业工程学报,2021,37(23):179-185. 被引量：9
5曾安,彭杰威,刘畅,潘丹,蒋艳荣,张小波.基于多尺度几何感知Transformer的植物点云补全网络[J].农业工程学报,2022,38(4):198-205. 被引量：5
6翟永杰,胡东阳,苑朝,王家豪,张鑫,刘亚军.基于视觉伺服的蝴蝶兰种苗切割系统设计与试验[J].农业工程学报,2022,38(6):148-156. 被引量：5
7温长吉,王启锐,陈洪锐,吴建双,倪军,杨策,苏恒强.面向大规模多类别的病虫害识别模型[J].农业工程学报,2022,38(8):169-177. 被引量：10
8彭红星,徐慧明,刘华鼐.融合双分支特征和注意力机制的葡萄病虫害识别模型[J].农业工程学报,2022,38(10):156-165. 被引量：11
9赵学观,郑申玉,易克传,王秀,邹伟,翟长远.考虑喷雾高度的大田蔬菜对靶喷雾系统设计与试验[J].农业工程学报,2022,38(11):1-11. 被引量：3
10彭红星,徐慧明,刘华鼐.基于改进ShuffleNet V2的轻量化农作物害虫识别模型[J].农业工程学报,2022,38(11):161-170. 被引量：13

同被引文献119

1彭红星,何慧君,高宗梅,田兴国,邓倩婷,咸春龙.基于改进ShuffleNetV2模型的荔枝病虫害识别方法[J].农业机械学报,2022,53(12):290-300. 被引量：22
2于明,李若曦,阎刚,王岩,王建春,李扬.基于颜色掩膜网络和自注意力机制的叶片病害识别方法[J].农业机械学报,2022,53(8):337-344. 被引量：8
3刘立波,周国民.基于多层感知神经网络的水稻叶瘟病识别方法[J].农业工程学报,2009,25(S2):213-217. 被引量：23
4毛广卿.不同截面形状的溜管对物料流动的影响[J].粮食加工,2004,29(5):34-37. 被引量：5
5田有文,李天来,李成华,朴在林,孙国凯,王滨.基于支持向量机的葡萄病害图像识别方法[J].农业工程学报,2007,23(6):175-180. 被引量：84
6龙满生,何东健.玉米苗期杂草的计算机识别技术研究[J].农业工程学报,2007,23(7):139-144. 被引量：55
7牛夏牧,焦玉华.感知哈希综述[J].电子学报,2008,36(7):1405-1411. 被引量：98
8冯洁,李宏宁,杨卫平,侯德东,廖宁放.园艺作物病害的多光谱组合分类[J].光谱学与光谱分析,2010,30(2):426-429. 被引量：9
9范德耀,姚青,杨保军,周营烽,管泽鑫,唐健.田间杂草识别与除草技术智能化研究进展[J].中国农业科学,2010,43(9):1823-1833. 被引量：22
10丁自立,吴金平,刁英,胡中立.莲藕主要病害及其综合防治[J].湖北农业科学,2011,50(15):3078-3079. 被引量：10

引证文献11

1张国忠,吕紫薇,刘浩蓬,刘婉茹,龙长江,黄成龙.基于改进DenseNet和迁移学习的荷叶病虫害识别模型[J].农业工程学报,2023,39(8):188-196. 被引量：8
2杨森森,张昊,兴陆,杜勇.改进MobileViT网络识别轻量化田间杂草[J].农业工程学报,2023,39(9):152-160. 被引量：6
3李想,胡肖楠,李方一,许金坡.苹果树叶多病害及不可辨别病害的轻量识别算法[J].农业工程学报,2023,39(14):184-190. 被引量：3
4杨硕,李书琴.多模态知识图谱增强葡萄种植问答对的答案选择模型[J].农业工程学报,2023,39(14):207-214. 被引量：4
5王瑞鹏,陈锋军,朱学岩,张新伟.采用改进的EfficientNet识别苹果叶片病害[J].农业工程学报,2023,39(18):201-210. 被引量：4
6于雁南,莫泳彬,严继池,熊春林,窦世卿,杨荣峰.基于改进ShuffleNet V2的柑橘病害识别研究[J].河南农业科学,2024,53(1):142-151. 被引量：1
7黄铝文,关非凡,谦博,侯闳耀,刘迎庆,李雯敏.基于2D DWT与MobileNetV3融合的轻量级茶叶病害识别[J].农业工程学报,2023,39(24):207-214. 被引量：1
8牛玉霞,孙宙红,任伟,陈林琳,陈莉莉.基于分层特征对齐网络的小样本马铃薯病害叶片检测[J].中国农机化学报,2024,45(2):250-258. 被引量：1
9牛智有,于重洋,田敏,刘梅英.饲料原料种类在线识别系统设计与试验[J].农业工程学报,2024,40(7):309-316.
10Jiaoling Wang,Weidong Song,Wengang Zheng,Qingchun Feng,Mingfei Wang,Chunjiang Zhao.Spatial-channel transformer network based on mask-RCNN for efficient mushroom instance segmentation[J].International Journal of Agricultural and Biological Engineering,2024,17(4):227-235.

二级引证文献26

1刘茜,易诗,李立,程兴豪,王铖.基于轻量级CNN-Transformer混合网络的梯田图像语义分割[J].农业工程学报,2023,39(13):171-181. 被引量：2
2王磊磊,王斌,李东晓,赵义鹏,王春霞,张迪迪.基于改进YOLOv5的菇房平菇目标检测与分类研究[J].农业工程学报,2023,39(17):163-171. 被引量：9
3郭文娟,冯全.基于类激活映射的可解释性方法在农作物检测识别中的发展现状与趋势[J].智能化农业装备学报（中英文）,2023,4(4):41-48. 被引量：1
4王瑞鹏,陈锋军,朱学岩,张新伟.采用改进的EfficientNet识别苹果叶片病害[J].农业工程学报,2023,39(18):201-210. 被引量：4
5孙月平,孙杰,袁必康,方正,秦云,赵德安.基于改进YOLOv5s的轻量化蟹塘障碍物检测与定位方法[J].农业工程学报,2023,39(23):152-163. 被引量：3
6皮轶轩,张锦水,马然,段雅鸣,申克建,朱爽.基于深度学习的温室大棚实例识别及模型迁移[J].农业工程学报,2023,39(23):185-195. 被引量：1
7黄铝文,关非凡,谦博,侯闳耀,刘迎庆,李雯敏.基于2D DWT与MobileNetV3融合的轻量级茶叶病害识别[J].农业工程学报,2023,39(24):207-214. 被引量：1
8郭惠萍,曹亚州,王晨思,荣麟瑞,李怡,王霆伟,杨福增.基于迁移学习的苹果落叶病识别与应用[J].农业工程学报,2024,40(3):184-192. 被引量：4
9柳建伟,李金峰,史广亮,魏江文,韩菊红,李青梅,姜延军.平凉市苹果叶部病害绿色防控技术规程[J].寒旱农业科学,2024,3(4):388-392.
10张京,赵泽瑄,赵艳茹,卜泓超,吴星宇.基于Bi-GRU和空-谱信息融合的油菜菌核病侵染区域高光谱图像分割方法[J].智慧农业（中英文）,2024,6(2):40-48.

1陈勇,李松,李萌,毛秋吉,王云辉,张珂.基于改进型Transformer网络的图像去噪算法[J].计算机科学与应用,2022,12(12):2763-2771.
2滕明洪,谭立新.基于EfficientNetV2和迁移学习的葡萄病害识别研究[J].软件,2022,43(11):43-49. 被引量：1
3张璐,芦天亮,杜彦辉.人脸视频深度伪造检测方法综述[J].计算机科学与探索,2023,17(1):1-26. 被引量：6
4王卓,王健,王枭雄,时佳,白晓平,赵泳嘉.基于改进YOLO v4的自然环境苹果轻量级检测方法[J].农业机械学报,2022,53(8):294-302. 被引量：36
5汤永恒,潘斌.基于双向转换网络的域自适应单幅图像去雾方法[J].辽宁石油化工大学学报,2022,42(6):78-83.
6郭建军,韩钤钰,董佳琦,周冰,徐龙琴,刘双印.基于SSA-PSO-LSTM模型的羊舍相对湿度预测技术[J].农业机械学报,2022,53(9):365-373. 被引量：8
7毛锐,张宇晨,王泽玺,高圣昌,祝涛,王美丽,胡小平.利用改进Faster-RCNN识别小麦条锈病和黄矮病[J].农业工程学报,2022,38(17):176-185. 被引量：10
8于明,李若曦,阎刚,王岩,王建春,李扬.基于颜色掩膜网络和自注意力机制的叶片病害识别方法[J].农业机械学报,2022,53(8):337-344. 被引量：8

农业工程学报

2022年第16期

浏览历史

内容加载中请稍等...

基于Transformer的强泛化苹果叶片病害识别模型被引量：11

参考文献7

二级参考文献73

共引文献124

同被引文献119

引证文献11

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于Transformer的强泛化苹果叶片病害识别模型 被引量：11

参考文献7

二级参考文献73

共引文献124

同被引文献119

引证文献11

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于Transformer的强泛化苹果叶片病害识别模型被引量：11