基于SwinT-YOLACT的玉米果穗实时实例分割被引量：2

Real-time instance segmentation of maize ears using SwinT-YOLACT

下载PDF

导出

摘要玉米果穗的表型参数是玉米生长状态的重要表征,生长状况的好坏直接影响玉米产量和质量。为方便无人巡检机器人视觉系统高通量、自动化获取玉米表型参数,该研究基于YOLACT(you only look at coefficients)提出一种高精度-速度平衡的玉米果穗分割模型SwinT-YOLACT。首先使用Swin-Transformer作为模型主干特征提取网络,以提高模型的特征提取能力;然后在特征金字塔网络之前引入有效通道注意力机制,剔除冗余特征信息,以加强对关键特征的融合;最后使用平滑性更好的Mish激活函数替换模型原始激活函数Relu,使模型在保持原有速度的同时进一步提升精度。基于自建玉米果穗数据集训练和测试该模型,试验结果表明,SwinT-YOLACT的掩膜均值平均精度为79.43%,推理速度为35.44帧/s,相较于原始YOLACT和其改进算法YOLACT++,掩膜均值平均精度分别提升了3.51和3.38个百分点;相较于YOLACT、YOLACT++和Mask R-CNN模型,推理速度分别提升了3.39、2.58和28.64帧/s。该模型对玉米果穗有较为优秀的分割效果,适于部署在无人巡检机器人视觉系统上,为玉米生长状态监测提供技术支撑。 Maize is one of the most important food crops in the field of agricultural development and food security in China.Among them,maize fruit and ear can directly determine the yield and quality of maize.Their phenotypic parameters(such as size and shape)can also be crucial indicators for the growth state of the plant.Fortunately,machine vision can be expected to serve as the maize phenotypic parameter acquisition and trait analysis,due to its objectivity,accuracy and speed,particularly with the application of artificial intelligence technology in agricultural production.Field inspection robots can be utilized to monitor the maize growth status in large-scale planting mode during this stage.This study aims to realize the high-throughput and automated acquisition of maize phenotypic parameters by unmanned inspection robots.A high-precision-speed balanced maize ear segmentation model,SwinT-YOLACT was proposed using YOLACT(you only look at coefficients)algorithm.Three optimization strategies were designed,according to the characteristics of the maize ear segmentation task.Firstly,Swin-Transformer was used as the backbone feature extraction network of the improved model,where the self-attention mechanism of Transformer structure was integrated to enhance the global feature extraction capability;Secondly,a 3-layer effective channel attention mechanism was introduced before the feature pyramid network to eliminate the redundant feature information,in order to enhance the fusion of key features for the high accuracy of the improved model;Finally,the Mish activation function with better smoothing was used to replace the original Relu activation function,in order to further improve the segmentation accuracy at the original inference speed.In addition,the maize plant data was collected with the different environmental backgrounds and various maturity stages of maize fruit and maize ears in the field.Labelme annotation software was then adopted to manually label the data,according to the COCO dataset format.The number of samples was also expanded using data augmentation.A segmentation dataset of the maize fruit and ear was constructed for the model training on a deep learning network.The self-built segmentation dataset of maize ear was used to train and test the improved model.The experimental results show that the mask mean average precision was improved by 2.11 percentage points after introducing Swin-Transformer as the backbone feature extraction network,compared with the original YOLACT model.There was no influence on the segmentation speed.On this basis,the mask mean average precision was improved by 0.65 percentage points after introducing efficient channel attention before the feature pyramid network.The inference speed of the model was basically unchanged.The original model Relu activation function was replaced by Mish activation function,according to the first two experiments.The mask mean average precision was improved by 0.75 percentage points than before the replacement,whereas,the model inference speed was improved by 2.74 frames per second.SwinT-YOLACT was also used to compare with the YOLACT,YOLACT++,YOLACT-Edge,and Mask R-CNN segmentation models,all of which used the same experimental environment and training strategy.The verification results show that the mask mean average precision of SwinT-YOLACT reached 79.43%,which was 3.51,3.38,and 7.88 percentage points higher than those of the original YOLACT,YOLACT++,and YOLACT-Edge,respectively,while only slightly lower than that of the Mask R-CNN model.The better performance of the improved models was then achieved in the segmentation task.In terms of segmentation speed,the inference speed of SwinTYOLACT was 35.44 frames per second,which was much better than that of Mask R-CNN model at 6.80 frames per second,and also improved by 3.39 and 2.58 frames per second,compared with the YOLACT and YOLACT++,respectively.In summary,SwinT-YOLACT can be expected for better segmentation of the maize fruit and ear in the unmanned inspection robot vision system.The finding can provide technical support for maize growth status monitoring.

作者朱德利余茂生梁明飞 ZHU Deli;YU Maosheng;LIANG Mingfei(College of Computer and Information Science,Chongqing Normal University,Chongqing 401331,China;Research Center of Chongqing Digital Agricultural Service Engineering Technology,Chongqing 401331,China)

机构地区重庆师范大学计算机与信息科学学院重庆市数字农业服务工程技术研究中心

出处《农业工程学报》 EI CAS CSCD 北大核心 2023年第14期164-172,共9页 Transactions of the Chinese Society of Agricultural Engineering

基金重庆市教育委员会科学技术研究项目(KJQN201800536) 重庆市高校创新研究群体项目智慧农业的机器视觉感知与智能算法研究(CXQT20015)。

关键词图像分割注意力机制玉米果穗 YOLACT Swin-Transformer image segmentation attention mechanism maize ear YOLACT Swin-Transformer

分类号 S24 [农业科学—农业电气化与自动化] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1朱超,苗腾,许童羽,李娜,邓寒冰,周云成.基于骨架的玉米植株三维点云果穗分割与表型参数提取[J].农业工程学报,2021,37(6):295-301. 被引量：7
2龙洁花,赵春江,林森,郭文忠,文朝武,张宇.改进Mask R-CNN的温室环境下不同成熟度番茄果实分割方法[J].农业工程学报,2021,37(18):100-108. 被引量：35
3郭希岳,李劲松,郑立华,张漫,王敏娟.利用Re-YOLOv5和检测区域搜索算法获取大豆植株表型参数[J].农业工程学报,2022,38(15):186-194. 被引量：5
4张振乾,李世超,李晨阳,曹如月,张漫,李寒,李修华.基于双目视觉的香蕉园巡检机器人导航路径提取方法[J].农业工程学报,2021,37(21):9-15. 被引量：34
5扶兰兰,黄昊,王恒,黄胜操,陈度.基于Swin Transformer模型的玉米生长期分类[J].农业工程学报,2022,38(14):191-200. 被引量：8
6邓寒冰,许童羽,周云成,苗腾,李娜,吴琼,朱超,沈德政.基于深度掩码的玉米植株图像分割模型[J].农业工程学报,2021,37(18):109-120. 被引量：12
7孙建桐,孙意凡,赵然,季宇寒,张漫,李寒.基于几何形态学与迭代随机圆的番茄识别方法[J].农业机械学报,2019,50(B07):22-26. 被引量：27
8贾伟宽,李倩雯,张中华,刘国良,侯素娟,Ji Ze,郑元杰.复杂环境下柿子和苹果绿色果实的优化SOLO分割算法[J].农业工程学报,2021,37(18):121-127. 被引量：8
9袁立,夏桐,张晓爽.基于改进YOLACT实例分割网络的人耳关键生理曲线提取[J].工程科学学报,2022,44(8):1386-1395. 被引量：2
10刘德儿,朱磊,冀炜臻,廉悦.基于RGB-D相机的脐橙实时识别定位与分级方法[J].农业工程学报,2022,38(14):154-165. 被引量：10

二级参考文献105

1刘瑞,李衍军,刘忠军,刘立晶,吕海涛.包衣玉米种子离散元参数分析与标定[J].农业机械学报,2021,52(S01):1-8. 被引量：19
2杨月如,吴红斌.耳廓的解剖学研究[J].解剖学杂志,1988(1):56-58. 被引量：12
3刘珂,周富强,张广军.半径约束最小二乘圆拟合方法及其误差分析[J].光电子．激光,2006,17(5):604-607. 被引量：82
4宋健,张铁中,徐丽明,汤修映.果蔬采摘机器人研究进展与展望[J].农业机械学报,2006,37(5):158-162. 被引量：216
5赵金英,张铁中,杨丽.西红柿采摘机器人视觉系统的目标提取[J].农业机械学报,2006,37(10):200-203. 被引量：54
6谢志勇,张铁中,赵金英.基于Hough变换的成熟草莓识别技术[J].农业机械学报,2007,38(3):106-109. 被引量：61
7蔡健荣,周小军,李玉良,范军.基于机器视觉自然场景下成熟柑橘识别[J].农业工程学报,2008,24(1):175-178. 被引量：102
8王津京,赵德安,姬伟,张超.采摘机器人基于支持向量机苹果识别方法[J].农业机械学报,2009,40(1):148-151. 被引量：69
9高广平,易干军,魏岳荣.香蕉栽培管理技术研究概况[J].中国农学通报,2010,26(10):337-342. 被引量：19
10司永胜,乔军,刘刚,高瑞,何蓓.苹果采摘机器人果实识别与定位方法[J].农业机械学报,2010,41(9):148-153. 被引量：75

共引文献134

1纪宝锋,李斌,卫勇,赵文文,周孟创.基于VGG-ST模型的奶牛粪便形态分类方法研究[J].农业机械学报,2023,54(S01):245-251. 被引量：1
2邱权,胡青含,樊正强,孙娜,张喜海.基于自适应系数卡尔曼滤波的农业移动机器人组合定位[J].农业机械学报,2022,53(S01):36-43. 被引量：8
3卢羿.基于颜色特征识别的番茄果梗定位及特征增强算法[J].大众标准化,2019,0(11):23-25. 被引量：4
4席芮,姜凯,张万枝,吕钊钦,侯加林.基于改进Faster R-CNN的马铃薯芽眼识别方法[J].农业机械学报,2020,51(4):216-223. 被引量：22
5袁培森,李润隆,任守纲,顾兴健,徐焕良.表示学习技术研究进展及其在植物表型中应用分析[J].农业机械学报,2020,51(6):1-14. 被引量：10
6张铮,熊盛辉,王孙强,胡凌辉.基于机器视觉的香蕉果肉缺陷预测方法[J].食品与机械,2020,36(7):150-154. 被引量：9
7邵佩迪,吴明晖.基于视觉测量的茶叶嫩芽定位方法研究[J].农业装备与车辆工程,2020,58(9):50-53. 被引量：4
8冯青春,王秀,李军辉,李小明,成伟,陈建.基于高动态范围成像的温室番茄植株图像色彩矫正方法[J].农业机械学报,2020,51(11):235-242. 被引量：2
9李寒,陶涵虓,崔立昊,刘大为,孙建桐,张漫.基于SOM-K-means算法的番茄果实识别与定位方法[J].农业机械学报,2021,52(1):23-29. 被引量：26
10张星,高巧明,潘栋,张伟伟.基于改进YOLOv3的田间复杂环境下菠萝拾捡识别研究[J].中国农机化学报,2021,42(1):201-206. 被引量：8

同被引文献50

1彭红星,何慧君,高宗梅,田兴国,邓倩婷,咸春龙.基于改进ShuffleNetV2模型的荔枝病虫害识别方法[J].农业机械学报,2022,53(12):290-300. 被引量：23
2卢伟,邹明萱,施浩楠,王玲,DENG Yiming.基于YOLO v5-TL的褐菇采摘视觉识别-测量-定位技术[J].农业机械学报,2022,53(11):341-348. 被引量：10
3于明,李若曦,阎刚,王岩,王建春,李扬.基于颜色掩膜网络和自注意力机制的叶片病害识别方法[J].农业机械学报,2022,53(8):337-344. 被引量：9
4傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：53
5宋怀波,何东健.面向精细农业的高维数据本征维数估计方法研究进展[J].中国科学：信息科学,2010,40(S1):104-110. 被引量：5
6杨国国,鲍一丹,刘子毅.基于图像显著性分析与卷积神经网络的茶园害虫定位与识别[J].农业工程学报,2017,33(6):156-162. 被引量：85
7刘德营,王家亮,林相泽,陈京,於海明.基于卷积神经网络的白背飞虱识别方法[J].农业机械学报,2018,49(5):51-56. 被引量：21
8王玲,徐伟,杜开炜,卢伟,朱家豪,张俊.基于SR300深度相机的褐蘑菇原位测量技术[J].农业机械学报,2018,49(12):13-19. 被引量：11
9翁杨,曾睿,吴陈铭,王猛,王秀杰,刘永进.基于深度学习的农业植物表型研究综述[J].中国科学：生命科学,2019,49(6):698-716. 被引量：50
10吕盛坪,李灯辉,冼荣亨.深度学习在我国农业中的应用研究现状[J].计算机工程与应用,2019,55(20):24-33. 被引量：23

引证文献2

1郭文娟,冯全.基于类激活映射的可解释性方法在农作物检测识别中的发展现状与趋势[J].智能化农业装备学报（中英文）,2023,4(4):41-48. 被引量：1
2叶大鹏,景均,吴昊宇,李辉煌,谢立敏.基于EP-YOLO v8的瓶栽金针菇最优抓取位置定位方法[J].农业机械学报,2024,55(10):51-61.

二级引证文献1

1王林江,王恒,徐珊珊,林则鑫,郑阳,张新爱.基于碳基结构增敏型肥料中缩二脲检测的电化学传感器设计与评估[J].智能化农业装备学报（中英文）,2024,5(1):58-63. 被引量：1

1李海燕,殷桂金,占德杰,李瑞雪.生态系统理论视角下普通高中创新人才培养路径探索[J].创新人才教育,2023(5):31-35. 被引量：1
2孙羽津.韩孟诗派最后十年的孤芳与微澜[J].高等学校文科学术文摘,2023,40(5):217-217.
3刘一,郑南山,丁锐,张克非,鞠海龙.基于机器学习的多频多星GNSS-IR模式NDVI反演研究[J].中国矿业大学学报,2023,52(5):1014-1021. 被引量：1
4杨丽艳,高学义.红色文化助推精神生活共同富裕的价值意蕴与实现路径[J].浙江理工大学学报（社会科学版）,2023,50(5):576-583. 被引量：2
5杨秀丽,马丽娜.“双碳”目标下基层组织嵌入对农户低碳生产行为的影响:基于村庄归属感的中介效应[J].生态与农村环境学报,2023,39(10):1247-1256. 被引量：1
6王亚民,潘硕华,钱一斌.浦东机场航班地面保障节点视频分析技术的应用研究[J].电子元器件与信息技术,2023,7(8):141-146.
7高万里,赵惊涛,王化伟.高温作用下干热岩岩石物理实验及岩石物理建模研究[J].矿业科学学报,2023,8(6):758-767. 被引量：4
8李泽,吴博萌.气候变化背景下乡村聚落生态韧性评价与空间分异研究[J].生态经济,2023,39(11):110-118. 被引量：1
9史安斌,朱泓宇.国际传播叙事的“南方转向”——基于“一带一路”沿线国家媒体的扎根研究[J].传媒观察,2023(9):18-27. 被引量：20
10徐民.影响玉米成熟因素及调控措施[J].现代农村科技,2023(12):23-23. 被引量：1

农业工程学报

2023年第14期

浏览历史

内容加载中请稍等...

基于SwinT-YOLACT的玉米果穗实时实例分割被引量：2

参考文献10

二级参考文献105

共引文献134

同被引文献50

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于SwinT-YOLACT的玉米果穗实时实例分割 被引量：2

参考文献10

二级参考文献105

共引文献134

同被引文献50

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于SwinT-YOLACT的玉米果穗实时实例分割被引量：2