基于自监督学习的番茄植株图像深度估计方法被引量：7

Method for estimating the image depth of tomato plant based on self-supervised learning

下载PDF

导出

摘要深度估计是智能农机视觉系统实现三维场景重建和目标定位的关键。该文提出一种基于自监督学习的番茄植株图像深度估计网络模型,该模型直接应用双目图像作为输入来估计每个像素的深度。设计了3种面向通道分组卷积模块,并利用其构建卷积自编码器作为深度估计网络的主体结构。针对手工特征衡量2幅图像相似度不足的问题,引入卷积特征近似性损失作为损失函数的组成部分。结果表明:基于分组卷积模块的卷积自编码器能够有效提高深度估计网络的视差图精度;卷积特征近似性损失函数对提高番茄植株图像深度估计的精度具有显著作用,精度随着参与损失函数计算的卷积模块层数的增加而升高,但超过4层后,其对精度的进一步提升作用不再明显;当双目图像采样距离在9.0 m以内时,该文方法所估计的棋盘格角点距离均方根误差和平均绝对误差分别小于2.5和1.8 cm,在3.0 m以内时,则分别小于0.7和0.5 cm,模型计算速度为28.0帧/s,与已有研究相比,2种误差分别降低了33.1%和35.6%,计算速度提高了52.2%。该研究可为智能农机视觉系统设计提供参考。 Depth estimation is critical to 3D reconstruction and object location in intelligent agricultural machinery vision system, and a common method in it is stereo matching. Traditional stereo matching method used low-quality image extracted manually. Because the color and texture in the image of field plant is nonuniform, the artificial features in the image are poorly distinguishable and mismatching could occur as a result. This would compromise the accuracy of the depth of the map. While the supervised learning-based convolution neural network(CNN) is able to estimate the depth of each pixel in plant image directly, it is expensive to annotate the depth data. In this paper, we present a depth estimation model based on the self-supervised learning to phenotype tomato canopy. The tasks of the depth estimation method were to reconstruct the image. The dense disparity maps were estimated indirectly using the rectified stereo pair of images as the network input, from which a bilinear interpolation was used to sample the input images to reconstruct the warping images. We developed three channel wise group convolutional(CWGC) modules, including the dimension invariable convolution module, the down-sampling convolution module and the up-sampling convolution module, and used them to construct the convolutional auto-encoder-a key infrastructure in the depth estimation method. Considering the shortage of manual features for comparing image similarity, we used the loss in image convolutional feature similarity as one objective of the network training. A CWGC-based CNN classification network(CWGCNet) was developed to extract the low-level features automatically. In addition to the loss in image convolutional feature similarity, we also considered the whole training loss, which include the image appearance matching loss, disparity smoothness loss and left-right disparity consistency loss. A stereo pair of images of tomato was sampled using a binocular camera in a greenhouse. After epipolar rectification, the pair of images was constructed for training and testing of the depth estimation model. Using the Microsoft Cognitive Toolkit(CNTK), the CWGCNet and the depth estimation network of the tomato images were calculated using Python. Both training and testing experiments were conducted in a computer with a Tesla K40 c GPU(graphics processing unit). The results showed that the shallow convolutional layer of the CWGCNet successfully extracted the low-level multiformity image features to calculate the loss in image convolutional feature similarity. The convolutional auto-encoder developed in this paper was able to significantly improve the disparity map estimated by the depth estimation model. The loss function in image convolutional feature similarity had a remarkable effect on accuracy of the image depth. The accuracy of the disparity map estimated by the model increased with the number of convolution modules for calculating the loss in convolutional feature similarity. When sampled within 9.0 m, the root means square error(RMSE) and the mean absolute error(MAE) of the corner distance estimated by the model were less than 2.5 cm and 1.8 cm, respectively, while when sampled within 3.0 m, the associated errors were less than 0.7 cm and 0.5 cm, respectively. The coefficient of determination(R2) of the proposed model was 0.8081, and the test speed was 28 fps(frames per second). Compared with the existing models, the proposed model reduced the RMSE and MAE by 33.1% and 35.6% respectively, while increased calculation speed by 52.2%.

作者周云成许童羽邓寒冰苗腾吴琼 Zhou Yuncheng;Xu Tongyu;Deng Hanbing;Miao Teng;Wu Qiong(College of Information and Electrical Engineering,Shenyang Agricultural University,Shenyang 110866,China)

机构地区沈阳农业大学信息与电气工程学院

出处《农业工程学报》 EI CAS CSCD 北大核心 2019年第24期173-182,共10页 Transactions of the Chinese Society of Agricultural Engineering

基金辽宁省自然科学基金(20180551102) 国家自然科学基金(31601218)

关键词图像处理卷积神经网络算法自监督学习深度估计视差深度学习番茄 image processing convolution neural network algorithms self-supervised learning depth estimation disparity deep learning tomato

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献9

1项荣,应义斌,蒋焕煜.田间环境下果蔬采摘快速识别与定位方法研究进展[J].农业机械学报,2013,44(11):208-223. 被引量：77
2肖珂,高冠东,马跃进.基于Kinect视频技术的葡萄园农药喷施路径规划算法[J].农业工程学报,2017,33(24):192-199. 被引量：11
3何勇,蒋浩,方慧,王宇,刘羽飞.车辆智能障碍物检测方法及其农业应用研究进展[J].农业工程学报,2018,34(9):21-32. 被引量：53
4莫宇达,邹湘军,叶敏,司徒伟明,罗少锋,王成琳,罗陆锋.基于Sylvester方程变形的荔枝采摘机器人手眼标定方法[J].农业工程学报,2017,33(4):47-54. 被引量：15
5翟长远,赵春江,Ning Wang,John Long,王秀,Paul Weckler,张海辉.果园风送喷雾精准控制方法研究进展[J].农业工程学报,2018,34(10):1-15. 被引量：67
6翟志强,杜岳峰,朱忠祥,郎健,毛恩荣.基于Rank变换的农田场景三维重建方法[J].农业工程学报,2015,31(20):157-164. 被引量：10
7朱镕杰,朱颖汇,王玲,卢伟,罗慧,张志川.基于尺度不变特征转换算法的棉花双目视觉定位技术[J].农业工程学报,2016,32(6):182-188. 被引量：11
8程曼,蔡振江,Ning Wang,袁洪波.基于地面激光雷达的田间花生冠层高度测量系统研制[J].农业工程学报,2019,35(1):180-187. 被引量：24
9周云成,许童羽,邓寒冰,苗腾.基于面向通道分组卷积网络的番茄主要器官实时识别[J].农业工程学报,2018,34(10):153-162. 被引量：15

二级参考文献173

1庞勇,赵峰,李增元,周淑芳,邓广,刘清旺,陈尔学.机载激光雷达平均树高提取研究[J].遥感学报,2008,12(1):152-158. 被引量：104
2李斌,王海峰,黄文倩,张弛.菠萝采收机械低成本双目视觉平台搭建与田间试验(英文)[J].农业工程学报,2012,28(S2):188-192. 被引量：17
3熊俊涛,邹湘军,彭红星,吴定中,朱梦思.荔枝采摘机械手视觉定位系统设计[J].农业机械学报,2012,43(S1):250-255. 被引量：9
4陈兵旗,何醇,马彦平,白由路.大田玉米长势的三维图像监测与建模[J].农业工程学报,2011,27(S1):366-372. 被引量：13
5袁挺,纪超,陈英,李伟,张俊雄.基于光谱成像技术的温室黄瓜识别方法[J].农业机械学报,2011,42(S1):172-176. 被引量：35
6孙琦,罗志增.Eye-to-Hand机器人系统的平面工件识别研究[J].杭州电子科技大学学报（自然科学版）,2010,30(1):46-49. 被引量：6
7丁幼春,王书茂,陈红.农用车辆作业环境障碍物检测方法[J].农业机械学报,2009,40(S1):23-27. 被引量：10
8谢春燕,吴达科,王朝勇,李岩.基于图像和光谱信息融合的病虫害叶片检测系统[J].农业机械学报,2013,44(S1):269-272. 被引量：11
9赵杰文,刘木华,杨国彬.基于HIS颜色特征的田间成熟番茄识别技术[J].农业机械学报,2004,35(5):122-124. 被引量：73
10钱星博.超声波技术在军事上的应用[J].世界发明,1997,20(3):21-21. 被引量：1

共引文献272

1刘慧,姜建滨,沈跃,贾卫东,曾潇,庄珍珍.基于改进DeepLab V3+的果园场景多类别分割方法[J].农业机械学报,2022,53(11):255-261. 被引量：8
2迟瑞娟,熊泽鑫,姜龙腾,马悦琦,黄修炼,朱晓龙.基于模型预测的插秧机路径跟踪控制算法[J].农业机械学报,2022,53(11):22-30. 被引量：13
3傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：53
4王丹丹,石峰,翟亚芳,杜雪.基于UKF的苹果果实定位估计算法[J].昆明理工大学学报（自然科学版）,2020,45(4):50-56. 被引量：3
5李柳青.如何给工科大学生讲量子力学[J].工科物理,2000,10(4):16-19.
6吕继东,赵德安,姬伟.苹果采摘机器人目标果实快速跟踪识别方法[J].农业机械学报,2014,45(1):65-72. 被引量：58
7熊俊涛,邹湘军,刘念,彭红星,李锦鸿,林桂潮.基于机器视觉的荔枝果实采摘时品质检测技术[J].农业机械学报,2014,45(7):54-60. 被引量：17
8王玲,邹小昱,刘思瑶,陈兵林,朱宏超,朱镕杰.棉花采摘机器人红外测距技术研究[J].农业机械学报,2014,45(7):61-66. 被引量：10
9熊俊涛,邹湘军,彭红星,陈文光,林桂潮.扰动柑橘采摘的实时识别与采摘点确定技术[J].农业机械学报,2014,45(8):38-43. 被引量：29
10罗陆锋,邹湘军,杨洲,李国琴,宋西平,张丛.基于改进人工蜂群模糊聚类的葡萄图像快速分割方法[J].农业机械学报,2015,46(3):23-28. 被引量：15

同被引文献114

1卢伟,邹明萱,施浩楠,王玲,DENG Yiming.基于YOLO v5-TL的褐菇采摘视觉识别-测量-定位技术[J].农业机械学报,2022,53(11):341-348. 被引量：8
2柳长源,赖楠旭,毕晓君.基于深度图像的球形果实识别定位算法[J].农业机械学报,2022,53(10):228-235. 被引量：7
3李敏,冯亚丽,吴东林.采摘机器人动态果实目标检测与跟踪技术研究——基于云存储[J].农机化研究,2020,42(9):207-211. 被引量：10
4王丹丹,石峰,翟亚芳,杜雪.基于UKF的苹果果实定位估计算法[J].昆明理工大学学报（自然科学版）,2020,45(4):50-56. 被引量：3
5徐丽明,张铁中.果蔬果实收获机器人的研究现状及关键问题和对策[J].农业工程学报,2004,20(5):38-42. 被引量：61
6蔡健荣,范军,李玉良.立体视觉系统标定及成熟果实定位[J].农机化研究,2007,29(11):38-40. 被引量：5
7张文明,刘彬,李海滨.基于双目视觉的三维重建中特征点提取及匹配算法的研究[J].光学技术,2008,34(2):181-185. 被引量：35
8蒋焕煜,彭永石,申川,应义斌.基于双目立体视觉技术的成熟番茄识别与定位[J].农业工程学报,2008,24(8):279-283. 被引量：62
9张凯良,杨丽,张铁中.草莓采摘位置机器视觉与激光辅助定位方法[J].农业机械学报,2010,41(4):151-156. 被引量：36
10张洁,李艳文.果蔬采摘机器人的研究现状、问题及对策[J].机械设计,2010,27(6):1-5. 被引量：87

引证文献7

1刘翱宇,吴云志,朱小宁,范国华,乐毅,张友华.基于深度残差网络的玉米病害识别[J].江苏农业学报,2021,37(1):67-74. 被引量：22
2孙茜,郑书河.基于双目视觉的植物三维重建方法及应用[J].安徽农业科学,2021,49(24):11-17. 被引量：5
3何斌,张亦博,龚健林,付国,赵昱权,吴若丁.基于改进YOLO v5的夜间温室番茄果实快速识别[J].农业机械学报,2022,53(5):201-208. 被引量：33
4梁喜凤,花瑞,杨铭涛.番茄枝叶修剪机械手视觉伺服控制系统研究[J].中国农机化学报,2022,43(7):8-13. 被引量：2
5石晶晶,周绪川,蒋凤霞.基于孪生网络的自监督细粒度分类度量[J].西南民族大学学报（自然科学版）,2023,49(3):297-302.
6马兆敏,郭家祥.果实定位的机器视觉技术研究现状[J].南方农机,2024,55(2):6-9. 被引量：1
7张自超,陈建.基于双目仿鹰眼视觉与超分辨的果园三维点云重建[J].吉林大学学报（工学版）,2024,54(5):1469-1481.

二级引证文献63

1杨佳昊,左昊轩,黄祺成,孙泉,李思恩,李莉.基于YOLO v5s的作物叶片病害检测模型轻量化方法[J].农业机械学报,2023,54(S01):222-229. 被引量：4
2张志远,罗铭毅,郭树欣,刘刚,李淑平,张瑶.基于改进YOLO v5的自然环境下樱桃果实识别方法[J].农业机械学报,2022,53(S01):232-240. 被引量：33
3张美娜,王潇,梁万杰,曹静,张文宇.温室远程监控系统人机交互与番茄识别研究[J].农业机械学报,2022,53(10):363-370. 被引量：6
4柳长源,赖楠旭,毕晓君.基于深度图像的球形果实识别定位算法[J].农业机械学报,2022,53(10):228-235. 被引量：7
5闫彬,樊攀,王美茸,史帅旗,雷小燕,杨福增.基于改进YOLOv5m的采摘机器人苹果采摘方式实时识别[J].农业机械学报,2022,53(9):28-38. 被引量：38
6吴淑琦.基于卷积神经网络的玉米病害识别[J].现代信息科技,2021,5(9):6-9. 被引量：2
7韩旭,赵春江,吴华瑞,朱华吉,张燕.基于注意力机制及多尺度特征融合的番茄叶片缺素图像分类方法[J].农业工程学报,2021,37(17):177-188. 被引量：19
8王子阳,王江涛,李飞杨.动态光照环境下基于轻量网络的磁瓦正反面识别[J].佳木斯大学学报（自然科学版）,2021,39(6):42-47. 被引量：1
9李珍辉,鲁静文,陈镜伊,刘鹏,龚德峰.基于InceptionV3卷积神经网络森林火灾检测方法[J].湖南工程学院学报（自然科学版）,2021,31(4):44-49. 被引量：9
10李书琴,陈聪,朱彤,刘斌.基于轻量级残差网络的植物叶片病害识别[J].农业机械学报,2022,53(3):243-250. 被引量：30

1黄婕,张雨,黄滢.儿童交互电子书视觉系统设计有效性研究——以2～5岁儿童电子书设计为例[J].大众文艺（学术版）,2019(23):120-121. 被引量：22
2杨雪,唐郁明.齐鲁文化元素在视觉系统设计中的应用[J].流行色,2019,0(10):89-90.
3马利,曹一铭,牛斌.应用残差稠密网络的无监督单幅图像深度估计[J].小型微型计算机系统,2019,40(11):2439-2444. 被引量：4
4付绪文,张旭东,张骏,孙锐.级联金字塔结构的深度图超分辨率重建[J].光电工程,2019,46(11):53-65. 被引量：1
5赵龙,张珍珍,丁坤,周强,万庆祝,李俊涛.基于分组一致性协议的多微网分层优化调度方法研究[J].电力设备管理,2020,0(2):41-43. 被引量：3
6吴芯政.室内机器人探索式三维重建与视觉感知[J].中国航班,2019(15):153-153.
7李昱靓.高校视觉传达设计专业学生创新创业促进机制研究[J].重庆工商大学学报（自然科学版）,2019,36(6):123-128. 被引量：4
8朱思聪,周德龙.角点检测技术综述[J].计算机系统应用,2020,29(1):22-28. 被引量：31
9黄军,王聪,刘越,毕天腾.单目深度估计技术进展综述[J].中国图象图形学报,2019,24(12):2081-2097. 被引量：23
10张春蕾,牛馨苑.结合YOLO的ORB双目图像匹配方法研究[J].小型微型计算机系统,2020,41(1):185-189. 被引量：9

农业工程学报

2019年第24期

浏览历史

内容加载中请稍等...

基于自监督学习的番茄植株图像深度估计方法被引量：7

参考文献9

二级参考文献173

共引文献272

同被引文献114

引证文献7

二级引证文献63

相关作者

相关机构

相关主题

浏览历史

基于自监督学习的番茄植株图像深度估计方法 被引量：7

参考文献9

二级参考文献173

共引文献272

同被引文献114

引证文献7

二级引证文献63

相关作者

相关机构

相关主题

浏览历史

基于自监督学习的番茄植株图像深度估计方法被引量：7