基于深度学习编码模型的图像分类方法被引量：11

Image Classification Method Based on Deep Learning Coding Model

下载PDF

导出

摘要针对矢量量化编码的量化误差严重,而稀疏编码只是一种浅层学习模型,容易导致视觉词典对图像特征缺乏选择性的问题,提出了一种基于深度学习特征编码模型的图像分类方法。首先,采用深度学习网络无监督的受限玻尔兹曼机(RBM)代替传统的K-Means聚类及稀疏编码等方法对SIFT特征库进行编码学习,生成视觉词典;其次,对RBM编码添加正则化项分解组合每个特征的稀疏表示,使得生成的视觉单词兼具稀疏性和选择性;然后,利用训练数据的类别标签信息有监督地自上而下对得到的初始视觉词典进行微调,得到图像深度学习表示向量,以此训练SVM分类器并完成图像分类。实验结果表明,本文方法能有效克服传统矢量量化编码及稀疏编码等方法的缺点,有效地提升图像分类性能。 For the serious quantization error in vector quantitation coding, the sparse coding is only a shallow learning model which caused the codeword lack selectivity for image features. In this paper, an image classification method based on deep learning coding model was proposed. Firstly, the deep learning network unsupervised RBM was used to encode SIFT features and generate visual diction- ary instead of the traditional K-means elustering. Then, the unsupervised RBM learning was steered by using a regularization scheme, which decomposes into a combined prior for the sparsity of each feature＇ s representation as well as the selectivity for each eodeword. Finally, the initial dictionary was fine-tuned to be discriminative through the supervised learning from top-down labels. To train SVM classifter and complete image classification,the representation features based on image deep learning were obtained. The experimental resuits demonstrated that the proposed method can overcome the disadvantage of vector quantization coding and sparse coding. Moreover, the classification performance can be boosted effectively.

作者赵永威李婷蔺博宇

机构地区武警工程大学电子技术系河南财政金融学院信息工程系 [

出处《工程科学与技术》 EI CAS CSCD 北大核心 2017年第1期213-220,共8页 Advanced Engineering Sciences

基金国家自然科学基金资助项目(61379152 61301232) 全军军事学研究生课题资助项目(YJS1062)

关键词图像分类视觉词典模型深度学习稀疏编码受限玻尔兹曼机 image classification bag of visual words model deep learning coding model sparse coding restricted Bohzmann machine

分类号 TP39 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1赵春晖,王莹,Masahide KANEKO.一种基于词袋模型的图像优化分类方法[J].电子与信息学报,2012,34(9):2064-2070. 被引量：22
2赵仲秋,季海峰,高隽,胡东辉,吴信东.基于稀疏编码多尺度空间潜在语义分析的图像分类[J].计算机学报,2014,37(6):1251-1260. 被引量：26
3张瑞杰,魏福山.结合Fisher判别分析和稀疏编码的图像场景分类[J].计算机辅助设计与图形学学报,2015,27(5):808-814. 被引量：9

二级参考文献59

1韩东峰,李文辉,郭武.基于潜在局部区域空间关系学习的物体分类算法[J].计算机学报,2007,30(8):1286-1294. 被引量：5
2Wu Lei, Hoi S C H, and Yu Neng-hai. Semantics-preserving bag-of-words models mid applications [J]. IEEE Transactions on Image Processing, 2010, 19(7): 1908-1920.
3Uijlings J R R, Smeulders A W M, and Scha R J H. Real-time visual concept classification [J]. IEEE Transactions on Multimedia, 2010, 12(7): 665-681.
4Chao Zhu, Charles-Edmond B, and Chen Li-ming. Visual object recognition using DAISY descriptor [C]. IEEE International Conference on Multimedia and Expo, Barcelona, Spain, July 11-15, 2011: 1-6.
5Wang Meng-yue, Zhang Chang-lin, and Song Yan. Extraction of image semantic features with spatial mean shift clustering algorithm [C]. IEEE 10th International Conference on Signal Processing, Beijing, China, Oct. 24-26, 2010: 906-909.
6Chum O and Zisserman A. An exemplar model for learning object classes [C]. IEEE International Conference on Computer Vision and Pattern Recognition, Minneapolis, MN USA, June 17-22, 2007: 1-8.
7Mathur A and Foody G M. Multiclass and binary SVM classification: implications for training and classificationusers[J]. IEEE Geoscience and Remote Sensing Letters, 2008, 5(2): 241-245.
8Kalyani S and Swarup K S. Classification and assessment of power system security using multiclass SVM [J]. IEEE Transactions on Systems, Man, and Cybermetics, 2011, 41(5): 753-758.
9Grauman K and Darrell T. The pyramid match kernel: discriminative classification with sets of image features [C]. IEEE International Conference on Computer Vision, Beijing, China, Oct. 17-21, 2005:1458- 1465.
10Swain M J and Ballard D H. Color indexing [J]. International Journal of Computer Vision, 1991, 7(1): 11-32.

共引文献52

1王跃,薄华.基于改进的Bag of Visual Words算法的SAR图像目标分类[J].电子设计工程,2013,21(12):124-127. 被引量：1
2丁锴,陈伟海,吴星明,刘中.基于规范割的空间金字塔图像分类算法[J].北京航空航天大学学报,2013,39(10):1342-1347. 被引量：3
3生海迪,段会川,孔超.词袋模型中梯度方向离散精度阈值经验分析[J].计算机工程与设计,2014,35(9):3270-3273.
4杨晓敏,严斌宇,王潘,宋亚东.一种基于视觉显著度词袋模型的图像分类方法[J].数字技术与应用,2014,32(7):77-79.
5施明登,周鹏,白铁成.基于Bag of Words的干果图像分类研究[J].安徽农业科学,2014,42(29):10381-10383. 被引量：1
6蔡强,刘亚奇,曹健,毛典辉,牛群.图像目标类别检测综述[J].计算机科学与探索,2015,9(3):257-265. 被引量：13
7杨晓敏,严斌宇,李康丽,苏冰山.基于金字塔模型的图像分类[J].计算机与数字工程,2015,43(4):704-706.
8刘培娜,刘国军,郭茂祖,刘扬,李盼.非负局部约束线性编码图像分类算法[J].自动化学报,2015,41(7):1235-1243. 被引量：17
9郗海龙,张玉环.恶意网络软件行为评估中的分类优化模型仿真[J].计算机仿真,2015,32(10):467-470. 被引量：1
10盛虎.基于视觉词袋模型的图像匹配方法研究与实现[J].电子技术与软件工程,2015(21):101-102.

同被引文献59

1丁毓峰,徐鑫.基于POS-KELM的森林火灾图像识别方法[J].数字制造科学,2020(4):283-288. 被引量：3
2孙君顶,丁振国,周利华.基于图像信息熵与空间分布熵的彩色图像检索方法[J].红外与毫米波学报,2005,24(2):135-139. 被引量：21
3段瑞玲,李庆祥,李玉和.图像边缘检测方法研究综述[J].光学技术,2005,31(3):415-419. 被引量：373
4周晓明,马秋禾,肖蓉,杨娜.一种改进的Canny算子边缘检测算法[J].测绘工程,2008,17(1):28-31. 被引量：27
5包广清,郑文鹏,江建中.一种改进粒子群算法在横向磁通永磁电机优化中的应用[J].电机与控制应用,2008,35(8):27-31. 被引量：7
6陈小娥,陈昭炯.多类SVM在图像艺术属性分类中的应用研究[J].智能系统学报,2009,4(2):157-162. 被引量：3
7赵宏中,张彦超.基于Canny边缘检测算子的图像检索算法[J].电子设计工程,2010,18(2):75-77. 被引量：28
8陈丽,陈静,高新涛,王来生.基于支持向量机与反K近邻的分类算法研究[J].计算机工程与应用,2010,46(24):135-137. 被引量：20
9向昌盛,周子英.支持向量分类机的参数选择方法研究[J].计算机技术与发展,2010,20(9):94-97. 被引量：8
10贾世杰,孔祥维,付海燕,金光.基于互补特征和类描述的商品图像自动分类[J].电子与信息学报,2010,32(10):2294-2300. 被引量：16

引证文献11

1张琳林,曹军梅.一种基于卷积神经网络的图像分类方法[J].福建电脑,2018,34(2):46-47. 被引量：2
2杨雪,刘惠义,陈霜霜.基于DRBM和边缘检测的脑部磁共振图像分类[J].信息技术,2018,42(5):129-132. 被引量：2
3张国栋.基于深度学习的图像特征学习和分类方法的研究及应用[J].网络安全技术与应用,2018(7):52-53. 被引量：1
4吕焦盛.基于稀疏表示和深度学习的图像识别算法研究[J].新乡学院学报,2018,35(9):31-34. 被引量：2
5曹鑫磊,冯锋.轨迹聚类算法及其应用[J].电脑知识与技术,2018,14(10Z):9-10.
6金亮,王飞,杨庆新,汪冬梅,寇晓斐.永磁同步电机性能分析的典型深度学习模型与训练方法[J].电工技术学报,2018,33(A01):41-48. 被引量：17
7栾庆磊.基于深度迁移学习的图像分类研究[J].黄山学院学报,2019,21(3):11-15. 被引量：2
8钱文华,徐丹,徐瑾,何磊,韩镇阳.基于信息熵的风格绘画分类研究[J].图学学报,2019,40(6):991-999. 被引量：9
9何豪,王杰军.基于经典深度卷积神经网络算法的火灾图像识别方法[J].常州工学院学报,2023,36(4):20-25.
10章李刚,黄磊,孙星,何豪,吴珂.改进Inception算法火灾图像识别领域应用[J].科技通报,2023,39(9):113-118. 被引量：1

二级引证文献37

1邱海锋,霍凯龙,尉耀稳,陈思超.移动互联网视频压缩技术设计研究[J].科技经济导刊,2020,0(1):46-46.
2佐磊,胡小敏,何怡刚,孙洪凯,李兵.小样本数据处理的加速寿命预测方法[J].电子测量与仪器学报,2020,32(11):26-32. 被引量：8
3郑凯,方春.基于迁移学习的果蔬质量分类研究[J].中国科技论文在线精品论文,2021(2):220-228. 被引量：1
4都娟.基于一种具有感知功能的蚁群算法的图像边缘信息捕获研究[J].生命科学仪器,2018,16(6):37-40.
5胡卉,蔡金清.基于深度卷积神经网络的宫颈细胞涂片的病变细胞分类[J].软件工程,2018,21(8):19-22. 被引量：4
6厉亚强,张文涛,李涉川.基于ELM实现的IPMSM转矩观测器[J].微特电机,2019,47(5):50-54. 被引量：4
7吴睿曦,肖秦琨.基于深度网络和数据增强的多物体图像识别[J].国外电子测量技术,2019,38(5):86-90. 被引量：30
8曹树龙,姚一卓.永磁同步电机结构设计和特点分析[J].电力系统装备,2019,0(11):80-80. 被引量：1
9徐春华,陈克绪,马建,刘佳翰,吴建华.基于深度置信网络的电力负荷识别[J].电工技术学报,2019,34(19):4135-4142. 被引量：36
10安华,王国锋,王喆,马凯乐,钟才川.基于深度学习理论的刀具状态监测及剩余寿命预测方法[J].电子测量与仪器学报,2019,31(9):64-70. 被引量：20

1生海迪,段会川,孔超.基于语义短语的空间金字塔词袋模型图像分类方法[J].小型微型计算机系统,2015,36(4):877-881. 被引量：8
2詹川,卢显良,周旭,侯孟书,袁连海.基于贝叶斯公式的垃圾邮件过滤方法[J].计算机科学,2005,32(2):73-75. 被引量：11
3冯进丽,杨红菊.基于BoC-BoF特征的图像检索方法研究[J].计算机科学,2015,42(4):297-301. 被引量：5
4彭天强,栗芳.基于二进制哈希与空间金字塔的视觉词袋模型生成方法[J].计算机工程,2016,42(12):164-170. 被引量：1
5周利萍,杨家红,黄务兰.基于SVM的增量学习算法及其在网页分类中的应用[J].计算机时代,2004(11):17-19. 被引量：1
6薛笑荣,章慧蓉,赵荣椿.一种有效的SAR图像目标识别方法[J].北京工业大学学报,2007,33(12):1262-1266. 被引量：2
7陈向东,常文森,高政.卫星图像的格矢量量化编码压缩方法研究[J].系统工程与电子技术,1998,20(3):39-43.
8罗忠亮.基于小波和神经网络的图像压缩方法[J].韶关学院学报,2010,31(3):25-28. 被引量：1
9赵鹏,盛步云,邓伟刚.工艺设计过程中的切削体分解组合策略[J].计算机集成制造系统,2010,16(9):1793-1800. 被引量：9
10阿力木江.艾沙,吐尔根.依布拉音,库尔班.吾布力,瓦依提.阿不力孜,艾山.吾买尔.基于类别分布差异和特征熵的维吾尔语文本特征选择[J].计算机应用研究,2013,30(10):2958-2961. 被引量：5

工程科学与技术

2017年第1期

浏览历史

内容加载中请稍等...

基于深度学习编码模型的图像分类方法被引量：11

参考文献3

二级参考文献59

共引文献52

同被引文献59

引证文献11

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

基于深度学习编码模型的图像分类方法 被引量：11

参考文献3

二级参考文献59

共引文献52

同被引文献59

引证文献11

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

基于深度学习编码模型的图像分类方法被引量：11