图像内容自动描述技术综述被引量：1

A Survey of Image Captioning Technology

下载PDF

导出

摘要图像内容自动描述是计算机视觉和自然语言处理领域的一个重要任务,在生活娱乐、智慧交通以及帮助视觉障碍者理解视觉内容等领域有着广泛而重要的应用价值.相比于图像分类和目标检测等感知任务,图像内容自动描述是一种更高级别、更复杂的认知任务,对帮助分析和理解图像有着重要的意义.旨在对现有的图像自动描述技术进行全面的综述.讨论图像内容自动描述中常用的数据集和评价指标,以及现有图像自动描述技术的性能、优点和局限性. Image captioning is an important task in the field of computer vision and natural language processing.It has a wide and important application value in our life and entertainment,intelligent transportation and helping people with visual impairment.Compared with other perception tasks such as image classification and object detection,image captioning is a higher level and more complex cognitive task,which has a great significance to help analyze and understand images.In this paper,we aim to give a comprehensive overview of the existing image captioning techniques.Here we discuss the data sets and evaluation metrics commonly used in image captioning,as well as the performances,advantages and limitations of existing image captioning techniques.

作者邓旭冉李灵慧唐胜张勇东 Deng Xuran;Li Linghui;Tang Sheng;Zhang Yongdong(University of Science and Technology of China,Hefei 230026;Institute of Computing Technology Chinese Academy of Sciences,Beijing 100190)

机构地区中国科学技术大学中国科学院计算技术研究所

出处《信息安全研究》 2019年第11期988-992,共5页 Journal of Information Security Research

基金国家自然科学基金项目(61572472,61525206)

关键词图像内容描述卷积神经网络循环神经网络注意力机制深度学习 image caption CNN RNN attention deep learning

分类号 TP39.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献2

1马春鹏,赵铁军.序列-序列模型注意力机制模块基本原理探究[J].智能计算机与应用,2020,0(1):1-6. 被引量：3
2秦爱梅,丁雨.基于人工智能视觉的特定场景识别系统设计[J].现代电子技术,2017,40(10):28-30. 被引量：12

引证文献1

1胡今朝.基于视觉自注意力机制的图像描述系统设计[J].信息与电脑,2020,32(17):77-79. 被引量：1

二级引证文献1

1袁启旺,芦健秋,户传真,涂小雅,周志文.深度学习图像字幕应用于施工现场视觉管理研究[J].科技风,2023(29):1-3.

1陈晨.云计算、雾计算和边缘计算在智慧交通中的应用[J].数字通信世界,2019,0(9):211-211. 被引量：5
2李海琴,谢亚琼.关于在静脉输液中如何完善无痛穿刺技术综述[J].医学信息（医学与计算机应用）,2014,0(11):555-555.
3张振强.BIM技术在智慧交通建设中的应用[J].科技风,2019,0(29):124-124.
4王金明,洪伟勇,申昌龙,董德强,魏静,曹明雪.伏立康唑致视觉障碍1例[J].中国药物应用与监测,2019,16(5):309-311. 被引量：2
5周奇才,沈鹤鸿,赵炯,刘星辰.基于改进堆叠式循环神经网络的轴承故障诊断[J].同济大学学报（自然科学版）,2019,47(10):1500-1507. 被引量：38
6祁青山,田生伟,禹龙,艾山·吾买尔.基于ATT-IndRNN-CNN的维吾尔语名词指代消解[J].中文信息学报,2019,33(9):60-68.
7王丽瑶.电动汽车充电技术综述[J].时代农机,2019,46(7):96-97. 被引量：3
8聂金芳.新媒体时代电视台外宣途径的构建研究[J].新闻研究导刊,2019,0(15):122-123. 被引量：2
9陈岳峰,毛潇锋,李裕宏,何源,薛晖.AI安全——对抗样本技术综述与应用[J].信息安全研究,2019,5(11):1000-1007. 被引量：16
10张蓓蓓.圣母的求情与代祷——以清代《圣教圣像全图》万民四末圣母像为中心[J].基督教学术,2018,0(2):368-395.

信息安全研究

2019年第11期

浏览历史

内容加载中请稍等...

图像内容自动描述技术综述被引量：1

同被引文献2

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

图像内容自动描述技术综述 被引量：1

同被引文献2

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

图像内容自动描述技术综述被引量：1