图像特征注意力与自适应注意力融合的图像内容中文描述被引量：6

Chinese description of image content based on fusion of image feature attention and adaptive attention

下载PDF

导出

摘要针对现有基于注意力机制的图像内容中文描述模型无法在关注信息不减弱和无缺失的条件下对重点内容进行注意力加强关注的问题,提出一种图像特征注意力与自适应注意力融合的图像内容中文描述模型。模型使用编解码结构,首先在编码器网络中提取图像特征,并通过图像特征注意力提取图像全部特征区域的注意力信息;然后使用解码器网络将带有注意力权重的图像特征解码生成隐藏信息,以保证关注信息不减弱、无缺失;最后利用自适应注意力的视觉哨兵模块对图像特征中的重点内容进行再次加强关注,从而更加精准地提取图像的主体内容。使用多种评价指标(BLEU、METEOR、ROUGEL和CIDEr)进行模型验证,将所提模型与单一基于自适应注意力和基于图像特征注意力的图像描述模型进行对比实验,该模型的CIDEr评价指标值分别提高了10.1%和7.8%;同时与基线模型NIC(Neural Image Caption)以及基于自底向上和自顶向下(BUTD)注意力的图像描述模型相比,该模型的CIDEr评价指标值分别提高了10.9%和12.1%。实验结果表明,所提模型的图像理解能力得到了有效提升,其各项评价指标得分均优于对比模型。 Aiming at the problem that the existing Chinese description models of image content based on attention mechanism cannot focus on the key content without weakening or missing attention information,a Chinese description model of image content based on fusion of image feature attention and adaptive attention was proposed.An encode-decode structure was used in this model.Firstly,the image features were extracted in the encoder network,and the attention information of all feature regions of the image was extracted by the image feature attention.Then,the decoder network was used to decode the image features with attention weights to generate hidden information,so as to ensure that the attention information was not weakened or missed.Finally,the visual sentry module of self-adaptive attention was used to focus on the key content in the image features again,so that the main content of the image was able to be extracted more accurately.Several evaluation indices including BLEU,METEOR,ROUGEL and CIDEr were used to verify the models,the proposed model was compared with the image description models based on self-adaptive attention or image feature attention only,and the proposed model had the evaluation value of CIDEr improved by 10.1%and 7.8%respectively.Meanwhile,compared with the baseline model Neural Image Caption(NIC)and the Bottom-Up and Top-Down(BUTD)attention based image description model,the proposed model had the evaluation index value of CIDEr increased by 10.9%and 12.1%respectively.Experimental results show that the image understanding ability of the proposed model is effectively improved,and the score of each evaluation index of the model is better than those of the comparison models.

作者赵宏孔东一 ZHAO Hong;KONG Dongyi(School of Computer and Communication,Lanzhou University of Technology,Lanzhou Gansu 730050,China)

机构地区兰州理工大学计算机与通信学院

出处《计算机应用》 CSCD 北大核心 2021年第9期2496-2503,共8页 journal of Computer Applications

基金国家自然科学基金资助项目(51668043,61262016)。

关键词图像内容中文描述注意力机制深度学习卷积神经网络循环神经网络 Chinese description of image content attention mechanism deep learning Convolutional Neural Network(CNN) Recurrent Neural Network(RNN)

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1赵宏,王乐,王伟杰.基于BiLSTM-CNN串行混合模型的文本情感分析[J].计算机应用,2020,40(1):16-22. 被引量：33
2程俊华,曾国辉,鲁敦科,黄勃.基于Dropout的改进卷积神经网络模型平均方法[J].计算机应用,2019,39(6):1601-1606. 被引量：27
3马书磊,张国宾,焦阳,石光明.一种改进的全局注意机制图像描述方法[J].西安电子科技大学学报,2019,46(2):17-22. 被引量：6

二级参考文献14

1朱远平,戴汝为.基于SVM决策树的文本分类器[J].模式识别与人工智能,2005,18(4):412-416. 被引量：25
2李敏宁,张巧,赵劼.视觉注意机制下的三维重建技术的改进[J].西安电子科技大学学报,2014,41(5):192-196. 被引量：4
3李婷婷,姬东鸿.基于SVM和CRF多特征组合的微博情感分析[J].计算机应用研究,2015,32(4):978-981. 被引量：83
4梁军,柴玉梅,原慧斌,高明磊,昝红英.基于极性转移和LSTM递归网络的情感分析[J].中文信息学报,2015,29(5):152-159. 被引量：91
5王科,夏睿.情感词典自动构建方法综述[J].自动化学报,2016,42(4):495-511. 被引量：72
6郗亚辉.产品评论中领域情感词典的构建[J].中文信息学报,2016,30(5):136-144. 被引量：23
7曾谁飞,张笑燕,杜晓峰,陆天波.基于神经网络的文本表示模型新方法[J].通信学报,2017,38(4):86-98. 被引量：18
8周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1751
9李然,林政,林海伦,王伟平,孟丹.文本情绪分析综述[J].计算机研究与发展,2018,55(1):30-52. 被引量：100
10钮成明,詹国华,李志华.基于深度神经网络的微博文本情感倾向性分析[J].计算机系统应用,2018,27(11):205-210. 被引量：16

共引文献63

1陶友山.姚桥矿井改扩建工程移交生产[J].煤矿设计,2000(5):11-12.
2张云,李岚,王浩东.一种机器学习中防止过拟合的Dropout优化算法[J].兰州文理学院学报（自然科学版）,2019,33(6):84-87. 被引量：11
3黄丽娟,周海.基于情感分析的文本检索系统的研究[J].科技创新与应用,2019,0(36):58-59. 被引量：1
4吴咏昆,李进,曾泽荣,和贺敏.楼宇新能源控制系统算法研究[J].建筑电气,2020,39(1):58-64.
5於张闲,冒宇清,胡孔法.基于深度学习的虚假健康信息识别[J].软件导刊,2020,19(3):16-20. 被引量：9
6张哲铭,任淑霞,郭凯杰.结合主题感知与通信代理的文本摘要模型[J].西安电子科技大学学报,2020,47(3):97-104. 被引量：2
7张娜,乔德聪.基于深度学习的在线学习评论情感分析研究[J].河南城建学院学报,2020,29(4):63-71. 被引量：4
8沈微微,李颖,杨志豪,王祥力,叶轩.防止过拟合的属性约简[J].计算机应用研究,2020,37(9):2665-2668. 被引量：6
9刘志勇,张丽秀,钟婷婷,王幸福,胡声洲.基于改进leNet-5的番茄病虫害识别的研究[J].赣南师范大学学报,2020,41(6):70-74. 被引量：6
10刘文秀,李艳梅,罗建,李薇,付顺兵.基于BERT与BiLSTM的中文短文本情感分析[J].太原师范学院学报（自然科学版）,2020,19(4):52-58. 被引量：9

同被引文献47

1夏茂森,江玲玲.基于深度网络CNN-LSTM模型的中国消费者信心指数预测[J].统计与决策,2021(7):21-26. 被引量：7
2任越美,程显毅,李小燕,谢玉宇.基于概念级语义的图像描述与识别[J].计算机科学,2008,35(7):206-212. 被引量：2
3顾昊元,肖翔,袁陈晨,黄梦斌,严佳,古晞.基于小波神经网络的松江区PM_(2.5)浓度预测[J].上海工程技术大学学报,2015,29(2):175-178. 被引量：4
4尹琪,胡红萍,白艳萍,王建中.基于GA-SVM的太原市空气质量指数预测[J].数学的实践与认识,2017,47(12):113-120. 被引量：21
5王平,张红,秦作栋,姚清晨,耿红.基于wavelet-SVM的PM_(10)浓度时序数据预测[J].环境科学,2017,38(8):3153-3161. 被引量：25
6石峰,楼文高,张博.基于灰狼群智能最优化的神经网络PM_(2.5)浓度预测[J].计算机应用,2017,37(10):2854-2860. 被引量：16
7高月,宿翀,李宏光.一类基于非线性PCA和深度置信网络的混合分类器及其在PM2.5浓度预测和影响因素诊断中的应用[J].自动化学报,2018,44(2):318-329. 被引量：12
8周杉杉,李文静,乔俊飞.基于自组织递归模糊神经网络的PM2.5浓度预测[J].智能系统学报,2018,13(4):509-516. 被引量：8
9蒲国林,刘笃晋.基于改进神经网络的环境空气质量预测[J].计算机技术与发展,2018,28(9):181-184. 被引量：8
10王毅,冯小年,钱铁云,朱辉,周静.基于CNN和LSTM深度网络的伪装用户入侵检测[J].计算机科学与探索,2018,12(4):575-585. 被引量：22

引证文献6

1张鹏昊,秦斌.深度强化学习研究进展[J].电脑知识与技术,2021,17(28):104-106. 被引量：1
2谢崇波.一种注意力机制下的空气污染物预测方法[J].自动化与仪器仪表,2022(2):52-56.
3王茂,彭亚雄,陆安江.面向视觉问答的跨模态交叉融合注意网络[J].计算机应用,2022,42(3):854-859. 被引量：2
4何昀峰,王小戈,刘路希,王潇.基于注意力机制的入侵检测生成对抗网络模型[J].计算机应用,2022,42(S01):152-159. 被引量：3
5李克文,杨建涛,黄宗超.基于边界极限点特征的改进YOLOv3目标检测[J].计算机应用,2023,43(1):81-87. 被引量：4
6朱晨豪,叶霞,陆琪多.多模态图像描述任务综述[J].计算机仿真,2023,40(6):1-8.

二级引证文献10

1祁铧颖,贺萍.跨模态数据融合综述[J].软件工程,2022,25(10):1-7. 被引量：5
2苟超,陈惠婷.基于深度学习的网络入侵检测技术研究[J].信息与电脑,2022,34(20):10-13. 被引量：2
3王斌,田士来,王小成,王瀚,叶伟.以ChatGPT为代表的人工智能技术在医学教育中的机遇与挑战[J].医学教育研究与实践,2023,31(4):402-405. 被引量：11
4杨飞帆,李军.面向自动驾驶的YOLO目标检测算法研究综述[J].汽车工程师,2023(11):1-11. 被引量：3
5袁琨鹏,米金鹏,陈智谦.基于模态预融合的三维指称表达理解[J].计算机应用研究,2023,40(12):3666-3671.
6王榆,史磊,张琼.电子信息竞赛中的机器人目标检测技术研究[J].自动化与仪器仪表,2023(10):196-200. 被引量：1
7施永辉,杨丽敏,代琪,陈丽芳.Spark框架下改进TrAdaBoost分布式入侵检测算法研究[J].中国电子科学研究院学报,2023,18(12):1129-1137.
8叶彩瑞,徐华,邓在辉.基于轻量级卷积神经网络的DDoS攻击检测研究[J].软件导刊,2024,23(3):8-14.
9孔令龙,任仕艳.基于深度学习的智能交通灯设计[J].现代信息科技,2024,8(17):179-184.
10Huiling Yu,Yanqiu Hang,Shen Shi,Kangning Wu,Yizhuo Zhang.Infrared Fault Detection Method for Dense Electrolytic Bath Polar Plate Based on YOLOv5s[J].Computers, Materials & Continua,2024,80(9):4859-4874.

1杨伟邦.小学数学课堂教学中如何培养学生“问题解决”能力[J].明日,2021(14):0272-0272.
2董文兰,毛凡,姜莹莹,夏章,张伟伟,董建群,刘世炜,周脉耕,吴静.2017-2019年236个国家慢性病综合防控示范区建设质量评估[J].中华流行病学杂志,2021,42(8):1413-1419. 被引量：10
3王秀碧.慢性阻塞性肺病采用多索茶碱和氨茶碱治疗的临床比较[J].益寿宝典,2020(22):128-128.
4Chaoqi Dai,Peiqin Chen,Shaocheng Qi,Yongbin Hu,Zhitang Song,Mingzhi Dai.Erratum to: Ultrathin flexible InGaZnO transistor for implementing multiple functions with a very small circuit footprint[J].Nano Research,2021,14(7):2469-2469.
5韦加龙.小学六年级数学应用题有效教学质量的提升方法[J].明日,2021(14):0297-0297.
6陈小龙,赵骥,陈思溢.基于注意力编码的轻量化语义分割网络[J].激光与光电子学进展,2021,58(14):217-225. 被引量：5
7Wei Guo,Jin Wei,Xuan Zhong,Ru Zang,Huan Lian,Ming-Ming Hu,Shu Li,Hong-Bing Shu,Qing Yang.Correction to: SNX8 modulates the innate immune response to RNA viruses by regulating the aggregation of VISA[J].Cellular & Molecular Immunology,2021,18(6):1613-1614.
8梁军义,李智皓,刘伟.复杂产品离散制造过程信息追溯模型研究[J].信息技术与网络安全,2021,40(9):66-70. 被引量：1
9何旭,戴靖榕,李婕,李燕,黄红.老年慢性冠状动脉综合征合并心房颤动患者抗栓治疗[J].中华老年心脑血管病杂志,2021,23(8):887-888. 被引量：3
10张雄,杨琳琳,上官宏,韩泽芳,韩兴隆,王安红,崔学英.基于生成对抗网络和噪声水平估计的低剂量CT图像降噪方法[J].电子与信息学报,2021,43(8):2404-2413. 被引量：7

计算机应用

2021年第9期

浏览历史

内容加载中请稍等...

图像特征注意力与自适应注意力融合的图像内容中文描述被引量：6

参考文献3

二级参考文献14

共引文献63

同被引文献47

引证文献6

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

图像特征注意力与自适应注意力融合的图像内容中文描述 被引量：6

参考文献3

二级参考文献14

共引文献63

同被引文献47

引证文献6

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

图像特征注意力与自适应注意力融合的图像内容中文描述被引量：6