细粒度图像分类综述被引量：7

Review of fine-grained image categorization

下载PDF

导出

摘要细粒度图像具有类内方差大、类间方差小的特点,致使细粒度图像分类(FGIC)的难度远高于传统的图像分类任务。介绍了FGIC的应用场景、任务难点、算法发展历程和相关的常用数据集,主要概述相关算法:基于局部检测的分类方法通常采用连接、求和及池化等操作,模型训练较为复杂,在实际应用中存在较多局限;基于线性特征的分类方法模仿人类视觉的两个神经通路分别进行识别和定位,分类效果相对较优;基于注意力机制的分类方法模拟人类观察外界事物的机制,先扫描全景,后锁定重点关注区域并形成注意力焦点,分类效果有进一步的提高。最后针对目前研究的不足,展望FGIC下一步的研究方向。 The fine-grained image has characteristics of large intra-class variance and small inter-class variance, which makes Fine-Grained Image Categorization(FGIC) much more difficult than traditional image classification tasks. The application scenarios, task difficulties, algorithm development history and related common datasets of FGIC were described, and an overview of related algorithms was mainly presented. Classification methods based on local detection usually use operations of connection, summation and pooling, and the model training was complex and had many limitations in practical applications. Classification methods based on linear features simulated two neural pathways of human vision for recognition and localization respectively, and the classification effect is relatively better. Classification methods based on attention mechanism simulated the mechanism of human observation of external things, scanning the panorama first, and then locking the key attention area and forming the attention focus, and the classification effect was further improved. For the shortcomings of the current research, the next research directions of FGIC were proposed.

作者申志军穆丽娜高静史远航刘志强 SHEN Zhijun;MU Lina;GAO Jing;SHI Yuanhang;LIU Zhiqiang(School of Computer and Information Engineering,Fuyang Normal University,Fuyang Anhui 236037,China;College of Computer and Information Engineering,Inner Mongolia Agricultural University,Hohhot Inner Mongolia 010011,China)

机构地区阜阳师范大学计算机与信息工程学院内蒙古农业大学计算机与信息工程学院

出处《计算机应用》 CSCD 北大核心 2023年第1期51-60,共10页 journal of Computer Applications

基金阜阳师范大学科学研究项目(2021KYQD0028) 内蒙古自治区科技攻关项目(2021GG0090) 内蒙古农业大学博士科研启动基金资助项目(BJ2013B-1) 内蒙纪检监察大数据实验室开放课题(IMDBD2020015)。

关键词细粒度图像分类深度学习卷积神经网络注意力机制计算机视觉 Fine-Grained Image Categorization(FGIC) deep learning Convolutional Neural Network(CNN) attention mechanism computer vision

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献14

1Ding-Nan Zou,Song-Hai Zhang,Tai-Jiang Mu,Min Zhang.A new dataset of dog breed images and a benchmark for fine-grained classification[J].Computational Visual Media,2020,6(4):477-487. 被引量：2
2王美华,吴振鑫,周祖光.基于注意力改进CBAM的农作物病虫害细粒度识别研究[J].农业机械学报,2021,52(4):239-247. 被引量：54
3陈前,刘骊,付晓东,刘利军,黄青松.部件检测和语义网络的细粒度鞋类图像检索[J].中国图象图形学报,2020,25(8):1578-1590. 被引量：4
4陈立潮,朝昕,曹建芳,潘理虎.融合独立组件的ResNet在细粒度车型识别中的应用[J].计算机工程与应用,2021,57(11):248-253. 被引量：7
5薄康虎,李菲菲,陈虬.基于改进CNN特征的场景识别[J].计算机系统应用,2018,27(12):25-32. 被引量：4
6朱铭武,韩军,陆冬明,班孝坤.自然场景中基于局部轮廓特征的对象识别方法[J].计算机工程与应用,2016,52(1):162-167. 被引量：14
7晓莉,达飞鹏.基于排除算法的快速三维人脸识别方法[J].自动化学报,2010,36(1):153-158. 被引量：32
8苏志明,王烈,蓝峥杰.基于多尺度分层双线性池化网络的细粒度表情识别模型[J].计算机工程,2021,47(12):299-307. 被引量：5
9王林,李聪会.基于多级注意力跳跃连接网络的行人属性识别[J].计算机工程,2021,47(2):314-320. 被引量：7
10李宽宽,刘立波.双线性聚合残差注意力的细粒度图像分类模型[J].计算机科学与探索,2022,16(4):938-949. 被引量：3

二级参考文献71

1鲁光泉,许洪国,李一兵.基于链码检测的直线段检测方法[J].计算机工程,2006,32(14):1-3. 被引量：30
2Zhong C, Sun Z N, Tan T N, He Z F. Robust 3D face recognition in uncontrolled environments. In: Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Anchorage, USA: IEEE, 2008. 1-8.
3Bowyer K W, Chang K, Flynn P. A survey of approaches and challenges in 3D and multi-modal 3D + 2D face recognition. Computer Vision and Image Understanding, 2006, 101(1): 1-15.
4Lu X G, Jain A K. Deformation modeling for robust 3D face matching. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2008, 30(8): 1346-1356.
5Chang K I, Bowyer K W, Flynn P J. Multiple nose region matching for 3D face recognition under varying facial expression. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(10): 1695-1700.
6Besl P J, Mckay H D. A method for registration of 3-D shapes. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1992, 14(2): 239-256.
7Mian A S, Bennamoun M, Owens R.An efficient multimodal 2D-3D hybrid approach to automatic face recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(11): 1927-1943.
8Beumier C, Acheroy M. Automatic 3D face authentication. Image and Vision Computing, 2000, 18(4): 315-321.
9Dorai C, Jain A K. COSMOS A representation scheme for 3D free-form objects. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(10): 1115-1130.
10Pan G, Wang Y M, Qi Y P, Wu Z H. Finding symmetry plane of 3D face shape. In: Proceedings of the 18th International Conference on Pattern Recognition. Piscataway, USA: IEEE, 2006. 1143-1146.

共引文献154

1奚琰.基于对比学习的细粒度遮挡人脸表情识别[J].计算机系统应用,2022,31(11):175-183. 被引量：4
2余琼,张瑞,李德豪,员玉良,王至秋.基于残差块与注意力机制的果蔬自动识别方法[J].农业机械学报,2023,54(S02):214-222. 被引量：1
3彭红星,何慧君,高宗梅,田兴国,邓倩婷,咸春龙.基于改进ShuffleNetV2模型的荔枝病虫害识别方法[J].农业机械学报,2022,53(12):290-300. 被引量：22
4于明,李若曦,阎刚,王岩,王建春,李扬.基于颜色掩膜网络和自注意力机制的叶片病害识别方法[J].农业机械学报,2022,53(8):337-344. 被引量：9
5刘中涛,胡凡,王淦,李钊,王磊,葛平高,王建娟.基于特征融合的深度学习场景识别与应用[J].计算机应用研究,2020,37(S01):418-420. 被引量：1
6张亮,黄曙光,石昭祥.一种基于拒识的高可靠性CAPTCHA识别算法[J].自动化学报,2011,37(7):891-900. 被引量：1
7邹红艳,达飞鹏,李晓莉.基于面部曲线特征融合的三维人脸识别[J].东南大学学报（自然科学版）,2012,42(4):618-622. 被引量：5
8徐辉,凌捷.基于关键帧标识的视频人脸识别技术研究[J].计算机技术与发展,2012,22(9):80-82.
9朱冰莲,杨吉祥,运明华,张磊.融合整体和局部信息的三维人脸识别[J].光电子．激光,2012,23(10):1977-1982. 被引量：4
10刘帅师,田彦涛,王新竹.基于对称双线性模型的光照鲁棒性人脸表情识别[J].自动化学报,2012,38(12):1933-1940. 被引量：6

同被引文献30

1江卓,吴茜,李贺武,吴建平.互联网端到端多路径传输跨层优化研究综述[J].软件学报,2019,30(2):302-322. 被引量：17
2何凯,冯旭,高圣楠,马希涛.基于多尺度特征融合与反复注意力机制的细粒度图像分类算法[J].天津大学学报（自然科学与工程技术版）,2020,53(10):1077-1085. 被引量：6
3闫子旭,侯志强,熊磊,刘晓义,余旺盛,马素刚.YOLOv3和双线性特征融合的细粒度图像分类[J].中国图象图形学报,2021,26(4):847-856. 被引量：13
4马啸,邵利民,金鑫,卢惠民,肖军浩,谷东亮.基于改进Mask R-CNN的可见光图像中舰船目标检测方法[J].北京理工大学学报,2021,41(7):734-744. 被引量：18
5李祥霞,吉晓慧,李彬.细粒度图像分类的深度学习方法[J].计算机科学与探索,2021,15(10):1830-1842. 被引量：9
6张文轩,吴秦.基于多分支注意力增强的细粒度图像分类[J].计算机科学,2022,49(5):105-112. 被引量：6
7吕冬健,王春立.可变尺寸循环注意力模型及应用研究[J].计算机工程与应用,2022,58(12):243-248. 被引量：1
8马瑶,智敏,殷雁君,萍萍.CNN和Transformer在细粒度图像识别中的应用综述[J].计算机工程与应用,2022,58(19):53-63. 被引量：10
9周金坤,王先兰,穆楠,王晨.基于多视角多监督网络的无人机图像定位方法[J].计算机应用,2022,42(10):3191-3199. 被引量：2
10Meng-Hao Guo,Tian-Xing Xu,Jiang-Jiang Liu,Zheng-Ning Liu,Peng-Tao Jiang,Tai-Jiang Mu,Song-Hai Zhang,Ralph R.Martin,Ming-Ming Cheng,Shi-Min Hu.Attention mechanisms in computer vision:A survey[J].Computational Visual Media,2022,8(3):331-368. 被引量：120

引证文献7

1李昊霖,俞成海,卢智龙,陈涵颖.基于特征融合的细粒度鸟类图像分类研究[J].计算机时代,2023(12):130-134.
2蔡美玉,朱润哲,吴飞,张开昱,李家乐.基于注意力机制和多粒度特征融合的跨视角匹配模型[J].计算机应用,2024,44(3):901-908.
3何志祥,齐琦,何伟,郭龙源.跨层协同注意和通道分组注意的细粒度图像分类[J].计算机系统应用,2024,33(3):126-133.
4张高义,徐杨,曹斌,石进.全局跨层交互网络学习细粒度图像特征表示[J].计算机与现代化,2024(3):97-104.
5孙露露,刘建平,王健,邢嘉璐,张越,王晨阳.细粒度图像分类上Vision Transformer的发展综述[J].计算机工程与应用,2024,60(10):30-46.
6李连民,孙立功,孙士保.一种改进的视觉词包模型的船舶识别方法[J].河南科技大学学报（自然科学版）,2024,45(4):10-16. 被引量：1
7钟玲,王添娇.细粒度图像分类研究方法综述[J].信息记录材料,2024,25(7):57-61.

二级引证文献1

1丁琰,张文琼,陈颖,张天琪,王宣林,熊华星.一种基于强化学习的仿真光电平台的驱动方法[J].信息技术与信息化,2024(9):172-175.

1高辉,李玲.制度支持对制造企业数字化转型的影响——基于管理者认知视角[J].企业经济,2022,41(12):151-160. 被引量：10
2耿海,李婧,吴辰宸,孙新锋,王紫桐,贾艳辉,王尚民,李兴达,蒲彦旭.空间电推进技术发展及应用展望[J].气体物理,2023,8(1):1-16. 被引量：8
3冯健,戴维奇,周丹.高管团队职能背景与公司创业投资:注意力焦点的中介作用[J].管理评论,2022,34(12):121-130. 被引量：5
4王雪,徐焕焕,张慧娇.HPLC法测定华法林片中有关物质分析方法研究[J].中文科技期刊数据库（引文版）医药卫生,2022(12):276-279.
5闵格格,毛力,王可,吴萌,安政柄.针对二值图像识别功能的对抗攻击工具箱[J].网络安全技术与应用,2023(1):32-35. 被引量：1
6吴中琦,项朝顺.覆土无包封钢筋混凝土圆管涵理论计算方法对比分析[J].运输经理世界,2022(26):47-49.
7张建兵,周煜,王孝平,郝雯娟.基于RoboMaster竞技赛中机器人视觉识别定位系统的研究[J].实验室研究与探索,2022,41(11):94-99. 被引量：1
8何富君,王帅,刘凯,任俞洁,程数驰.双转子永磁缓速器的设计与输出特性分析[J].机械制造与自动化,2023,52(1):16-21.
9周丹,宋晓阳,程鹏飞,秦明哲,余胭,黎笔熙.围术期神经认知障碍及其防治策略研究进展[J].中国医药,2023,18(1):135-138. 被引量：4
10黄丹.现代中国油画中的曲线运用[J].美术观察,2023(2):75-76.

计算机应用

2023年第1期

浏览历史

内容加载中请稍等...

细粒度图像分类综述被引量：7

参考文献14

二级参考文献71

共引文献154

同被引文献30

引证文献7

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

细粒度图像分类综述 被引量：7

参考文献14

二级参考文献71

共引文献154

同被引文献30

引证文献7

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

细粒度图像分类综述被引量：7