基于改进的ResNet网络的中餐图像识别方法被引量：12

Chinese food image recognition method based on improved ResNet

下载PDF

导出

摘要食品图像识别是计算机视觉、数据挖掘以及食品科学与技术等领域的研究热点.基于卷积神经网络(CNN)方法的中餐食品图像识别技术在直接提取图像的视觉特征时,由于食品图像类间差异小、类内差异大等属性,而导致识别率不高.为此对CNN进行优化设计提出一种适用于中餐食品图像识别的FoodResNet18模型,该模型融合非对称卷积增强局部骨架信息学习,同时嵌入深浅层共用的注意力模块,解决整张图像信息的无差别化特征提取,从局部到全局提升了特征提取的效率.选用本领域典型的VIREO Food-172中餐基准数据集进行多次实验,结果验证了FoodResNet18模型的有效性,在平衡识别精度与模型占用空间关系的基础上,基于动态变化的固定步长学习率衰减策略加快了模型收敛速度,按照图像识别性能的top1、top5方式获得识别率,最终使食品图像识别精度达到85.26%和96.21%,且比流行的ResNet101、ResNet-18、ResNet-34模型方法提升10.06%、9.89%、16.33%,进一步表明本文的食品图像识别方法在中小规模的食品图像识别系统将具有较好的应用前景. Food image recognition is a research hotspot in the fields of computer vision,data mining,and food science and technology.When the Chinese food image recognition technology based on the convolutional neural network(CNN)method directly extracts the visual features of the image,the recognition rate is not high due to the small differences between the food images and the large differences within the categories.For this reason,this article optimizes the design of CNN and proposes a FoodResNet18 model suitable for Chinese food image recognition.This model integrates asymmetric convolution to enhance local skeleton information learning,and at the same time embeds the attention module shared by the deep and shallow layers to solve the problem of the entire image information.Differentiated feature extraction improves the efficiency of feature extraction from local to global.The typical VIREO Food-172 Chinese food benchmark data set in this field is selected for multiple experiments,and the results verified the effectiveness of the FoodResNet18 model.On the basis of balancing the recognition accuracy and the model occupation space,the learning rate attenuation strategy based on dynamic changes is accelerated by a fixed step size.In order to achieve the model convergence speed,the recognition rate is obtained according to the top1 and top5 methods of image recognition performance,and finally the food image recognition accuracy reaches 85.26%and 96.21%,which is 10.06%,9.89%and 16.33%higher than the popular ResNet101,ResNet-18,and ResNet-34 model methods.It is further shown that the food image recognition method designed in this paper will have a good application prospect in small and medium-sized food image recognition systems.

作者王海燕张渺刘虎林陈晓 WANG Hai-yan;ZHANG Miao;LIU Hu-lin;CHEN Xiao(School of Electronic Information and Artificial Intelligence, Shaanxi University of Science & Technology, Xi′an 710021, China)

机构地区陕西科技大学电子信息与人工智能学院

出处《陕西科技大学学报》北大核心 2022年第1期154-160,共7页 Journal of Shaanxi University of Science & Technology

基金国家自然科学基金项目(62031021)。

关键词 CNN 增强块注意残差模块食品分类 CNN enhanced block attention-residual module food classification

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1廖恩红,李会芳,王华,庞雄文.基于卷积神经网络的食品图像识别[J].华南师范大学学报（自然科学版）,2019,51(4):113-119. 被引量：15

二级参考文献1

1罗建豪,吴建鑫.基于深度卷积特征的细粒度图像分类研究综述[J].自动化学报,2017,43(8):1306-1318. 被引量：147

共引文献14

1秦川.基于卷积神经网络的图像识别[J].电子技术与软件工程,2020(1):98-99. 被引量：4
2柳琦,涂郑禹,陈超,吴鹏.计算机视觉技术在食品品质检测中的应用[J].食品研究与开发,2020,41(16):208-213. 被引量：14
3张红岩,王永志,刘庆红.图像识别技术在食品包装缺陷检测中的应用[J].食品与机械,2020,36(8):225-228. 被引量：12
4王长冬.中餐主食图像识别研究[J].电脑知识与技术,2021,17(5):199-200.
5韩筠,罗泽钦.基于卷积神经网络的食品图像识别[J].科技创新导报,2021,18(3):104-107.
6杨昊岩,栾涛,韩仲志,倪建功,高霁月.基于深度学习声谱图分类的“听声识风”[J].华南师范大学学报（自然科学版）,2021,53(5):10-16. 被引量：2
7闵巍庆,刘林虎,刘宇昕,罗梦江,蒋树强.食品图像识别方法综述[J].计算机学报,2022,45(3):542-566. 被引量：6
8丁栋,高瞩,贾聚鑫.基于技术移植法的校园绿色餐饮装备设计研究[J].设计,2022,35(5):27-29.
9张茹,张奋楠,周星宇,俞经虎.基于机器视觉的生鲜牛肉冷藏时间识别研究[J].食品与发酵工业,2022,48(18):75-80. 被引量：2
10马志刚,赵志强.基于机器视觉的包装品质检测系统设计[J].包装工程,2022,43(21):193-197. 被引量：4

同被引文献127

1张文红.O2O模式下的餐饮外卖行业分析研究[J].农村经济与科技,2019,0(22):116-117. 被引量：5
2霍春宝,杨闯,佟智波,杨红喆,王丹丹.OCR下的改进SIFT人脸识别算法[J].辽宁工程技术大学学报（自然科学版）,2021,40(4):378-382. 被引量：5
3雷英杰,王宝树,王毅.基于直觉模糊决策的战场态势评估方法[J].电子学报,2006,34(12):2175-2179. 被引量：55
4彭飘林,刘昭霞.基于Photoshop图像三维效果仿真技术的PU鞋底设计[J].中国皮革,2014,43(20):116-120. 被引量：3
5朱艺,肖兵,林傲.基于主成分分析法的反导态势要素提取研究[J].现代防御技术,2015,43(1):31-38. 被引量：10
6郭丽丽,丁世飞.深度学习研究进展[J].计算机科学,2015,42(5):28-33. 被引量：201
7翟社平,李威,马传宾.图像识别中的数字运算及其FPGA实现[J].信息技术,2016,40(3):15-18. 被引量：4
8许广强,贾翠翠,詹念,杨自恒.基于FPGA和DBN的手写体图像识别算法的实现[J].电子世界,2017,0(7):69-69. 被引量：2
9熊聪聪,邓滢,史艳翠,陶鑫,陈亚瑞.基于协同过滤的美食推荐算法[J].计算机应用研究,2017,34(7):1985-1988. 被引量：14
10刘正坤,陈伦清,王昊.无人机辅助电网巡检作业的应用现状与思考[J].南方能源建设,2017,4(2):115-119. 被引量：10

引证文献12

1朱小勇,陈胜.基于ResNet-ViT的海战多目标态势感知[J].信息与控制,2023,52(5):638-647. 被引量：1
2胡俊梅.基于卷积神经网络的图像信息识别系统设计[J].信息与电脑,2022,34(13):178-180. 被引量：2
3姚芷馨,张太红,赵昀杰.基于改进权重衰减的EfficientNet食用菌图像识别[J].食品与机械,2022,38(11):117-124. 被引量：2
4吴岳敏,孙圣鑫,王小龙,马彬,程香平.基于二值网络的自动驾驶目标检测方法[J].陕西科技大学学报,2023,41(2):176-183.
5杨磊,熊昶,刘文超,王彦秋,侯果.基于改进ResNet深度残差网络的岩屑岩性识别研究[J].长江大学学报（自然科学版）,2023,20(2):11-19. 被引量：4
6任爽,张敏,王珂,司培培.照片同源检测技术研究及在电话实名制中的应用[J].信息通信技术与政策,2023(3):91-96.
7冯友胜,职保柱.改进DHCEP模型在图像智能识别中的应用研究[J].现代科学仪器,2023,40(2):154-159.
8熊梦园,詹炜,桂连友,刘虎,王佩文,韩涛,李伟豪,孙泳.基于ResNet模型的玉米叶片病害检测与识别[J].江苏农业科学,2023,51(8):164-170. 被引量：18
9刘清.基于定向成对混合的摄影档案图像数据增广研究[J].自动化技术与应用,2023,42(7):8-10. 被引量：1
10斯建东,汤义勤,赵文浩.基于改进FPN与SVM的树障检测方法[J].浙江电力,2023,42(9):124-132.

二级引证文献28

1魏沐晴.数字时代下观念摄影的图像创作研究[J].旅游与摄影,2024(3):142-144.
2赵瑞杰.基于神经网络的信息提取方法研究[J].信息与电脑,2023,35(2):48-50.
3惠巧娟,孙婕.基于多尺度特征度量元学习的玉米叶片病害识别模型研究[J].江苏农业科学,2023,51(9):199-206. 被引量：4
4李伟豪,詹炜,周婉,韩涛,王佩文,刘虎,熊梦园,孙泳.轻量型Yolov7-TSA网络在茶叶病害检测识别中的研究与应用[J].河南农业科学,2023,52(5):162-169. 被引量：12
5陈智超,汪国强,李飞,杨昭.基于Bi-LSTM与多尺度神经网络模型的番茄病害识别[J].江苏农业科学,2023,51(15):194-203. 被引量：3
6杨艳辉,张苏鸿,史文崇.机器视觉技术在玉米生产管理中的应用现状与展望[J].寒旱农业科学,2023,2(9):799-804. 被引量：3
7马天寿,张东洋,杨赟,陈颖杰.基于机器学习模型的斜井坍塌压力预测方法[J].天然气工业,2023,43(9):119-131. 被引量：6
8张蓓蕾,毕锦桐,郭宇佳,刘玉良,胡欣.基于迁移学习和模型融合的龋齿检测[J].天津科技大学学报,2023,38(5):49-56. 被引量：1
9堂格斯,包玉龙,孙长青,特日格乐,包玉海,图布新巴雅尔,金额尔德木吐.基于无人机遥感和深度学习的布氏田鼠洞群识别[J].内蒙古民族大学学报（自然科学版）,2023,38(5):448-457.
10叶荣,马自飞,高泉,李彤,邵郭奇,王白娟.基于改进YOLOv5s-ECA-ASFF算法的茶叶病害目标检测[J].中国农机化学报,2024,45(1):244-251. 被引量：2

1食品科学与技术国家重点实验室[J].食品与生物技术学报,2021,40(12).
2《环境科学》连续9次荣获“中国最具国际影响力学术期刊”称号[J].环境科学,2021,42(12):5835-5835.
3《连铸》杂志2021年度评选的优秀论文[J].连铸,2021,46(6):100-100.
4攵茧.艰难的革新苏联陆军T-44中型坦克小传[J].海陆空天惯性世界,2022(1):87-111.
5行业[J].中国食品工业,2021(22):17-17.
6喜报[J].电化教育研究,2022,43(2).
7孙俊,朱伟栋,罗元秋,沈继锋,陈义德,周鑫.基于改进MobileNet-V2的田间农作物叶片病害识别[J].农业工程学报,2021,37(22):161-169. 被引量：58
8岳有军,李雪松,赵辉,王红君.基于改进VGG网络的农作物病害图像识别[J].农机化研究,2022,44(6):18-24. 被引量：13
9梁文琦,王广聪,赖剑煌.基于多对多生成对抗网络的非对称跨域迁移行人再识别[J].自动化学报,2022,48(1):103-120. 被引量：5
10谢娟英,夏琴.新冠肺炎CXR图像分类新模型COVID-SERA-NeXt[J].太原理工大学学报,2022,53(1):52-62. 被引量：4

陕西科技大学学报

2022年第1期

浏览历史

内容加载中请稍等...

基于改进的ResNet网络的中餐图像识别方法被引量：12

参考文献1

二级参考文献1

共引文献14

同被引文献127

引证文献12

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于改进的ResNet网络的中餐图像识别方法 被引量：12

参考文献1

二级参考文献1

共引文献14

同被引文献127

引证文献12

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于改进的ResNet网络的中餐图像识别方法被引量：12