基于梯度核特征及N-gram模型的商品图像句子标注被引量：5

Product Image Sentence Annotation Based on Gradient Kernel Feature and N-gram Model

下载PDF

导出

摘要提出为商品图像标注句子,以便更准确地刻画图像内容。首先,执行图像特征学习,选出标注性能最优的梯度核特征完成图像分类和图像检索,该特征能客观描绘商品图像中形状和纹理这两类关键视觉特性。然后,基于语义相关度计算结果从训练图像的文本描述中摘取关键单词,并采用N-gram模型把单词组装为蕴涵丰富语义信息且满足句法模式兼容性的修饰性短语,基于句子模板和修饰性短语生成句子。最后,构建Boosting模型,从若干标注结果中选取BLEU-3评分最优的句子标注商品图像。结果表明,Boosting模型的标注性能优于各基线。 Product image sentence annotation was presented because sentence describes online products more accurately than single words.Firstly,image feature learning was executed.Gradient kernel feature that achieves the best annotation performance was chosen because the feature describes the key visual characteristics of product image such as shape and texture better than other features.Therefore,the gradient kernel feature was selected to complete image classification and image retrieval.Secondly,several key words were summarized from training images＇ captions based on semantic correlation computing.Thirdly,a modified sequence that not only contains rich semantic information but also satisfies syntactic mode compatibility was created based on these key words by N-gram model.Sentence was generated according to predefined sentence template and the modified sequence.Finally,a Boosting model was designed to choose those sentences that obtain the best BLEU-3 scores to annotate product images.Experiments show sentences generated by the boosting model achieve the state of art annotation performances.

作者张红斌姬东鸿尹兰任亚峰

机构地区武汉大学计算机学院

出处《计算机科学》 CSCD 北大核心 2016年第5期269-273,287,共6页 Computer Science

基金国家自然科学基金重点项目(61133012) 国家社科重大招标项目(11&ZD189) 教育部人文社会科学研究青年项目(12YJCZH274) 江西省科技厅科技攻关项目(20142BBG70011 20121BBG70050) 江西省高校人文社科基金项目(XW1502 TQ1503)资助

关键词梯度核特征 N-GRAM模型商品图像句子标注语义相关度计算修饰性短语 Gradient kernel feature N-gram model Product image Sentence annotation Semantic correlation computing Modified sequence

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献18

1Makadia A,Pavlovic V,Kumar S.A New Baseline for ImageAnnotation[C]∥Proceedings of European Conference on Computer Vision.2008:316-329.
2Yang Y,Teo C L,Daume H,et al.Corpus-guided sentencegeneration of natural images[C]∥Proceedings of Conference on Empirical Methods on Natural Language Processing.2011:444-454.
3Kulkarni G,Premraj V,Dhar S,et al.Baby talk:Understanding and generating simple image descriptions[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(12):2891-2903.
4Nwogu I,Zhou Ying-bo,Brown C.DISCO:Describing ImagesUsing Scene Contexts and Objects[C]∥Proceedings of American Association for Artificial Intelligence.2011:1487-1493.
5Hodosh M,Young P,Hockenmaier J.Framing image description as a ranking task:Data,models and evaluation metrics[J].J.Artif.Intell.Res.(JAIR),2013(47):853-899.
6Li Pi-ji,Ma Jun,Gao Shuai.Learning to Summarize Web Image and Text Mutually[C]∥Proceedings of International Con-ference on Multimedia Retrieval.2012.
7Feng Y S,Lapata M.Automatic Caption Generation for News Images [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(4):797-812.
8Berg T L,Berg A C,Shih J.Automatic Attribute Discovery and Characterization from Noisy Web Data [C]∥Proceedings of European Conference on Computer Vision.2010:663-676.
9Kiapour H,Yamaguchi K,Berg A C,et al.Hipster Wars:Discovering Elements of Fashion Styles[C]∥Proceedings of European Conference on Computer Vision.2014:472-488.
10Rebecca.Domain-Independent Captioning of Domain-SpecificImages [C]∥Proceedings of North American Association for Computational Linguistics.2013:69-76.

同被引文献27

1余龙华,王宏,钟洪声.基于隐马尔科夫模型的人脸识别[J].计算机技术与发展,2012,22(2):25-28. 被引量：15
2蒋黎星,侯进.基于集成分类算法的自动图像标注[J].自动化学报,2012,38(8):1257-1262. 被引量：11
3万金娥,袁保社,谷朝,米尔沙力江.沙吾提.基于字符归一化双投影互相关性匹配识别算法[J].计算机应用,2013,33(3):645-647. 被引量：8
4石祥滨,房雪键,张德园,郭忠强.基于深度学习混合模型迁移学习的图像分类[J].系统仿真学报,2016,28(1):167-173. 被引量：62
5蒋树强,闵巍庆,王树徽.面向智能交互的图像识别技术综述与展望[J].计算机研究与发展,2016,53(1):113-122. 被引量：93
6马静,高翔,李益楠,邱扬.基于连续马尔可夫模型的时变电力系统自适应控制策略[J].电力系统自动化,2016,40(3):21-26. 被引量：3
7段艳杰,吕宜生,张杰,赵学亮,王飞跃.深度学习在控制领域的研究现状与展望[J].自动化学报,2016,42(5):643-654. 被引量：147
8郭潇逍,李程,梅俏竹.深度学习在游戏中的应用[J].自动化学报,2016,42(5):676-684. 被引量：22
9王伟凝,王励,赵明权,蔡成加,师婷婷,徐向民.基于并行深度卷积神经网络的图像美感分类[J].自动化学报,2016,42(6):904-914. 被引量：53
10奚雪峰,周国栋.面向自然语言处理的深度学习研究[J].自动化学报,2016,42(10):1445-1465. 被引量：226

引证文献5

1汤鹏杰,王瀚漓,许恺晟.LSTM逐层多目标优化及多层概率融合的图像描述[J].自动化学报,2018,44(7):1237-1249. 被引量：28
2徐守坤,徐坚,李宁,周佳,刘楚秋.基于Sentence-Rank的图像句子标注[J].计算机工程与应用,2019,55(2):121-127.
3孔锐,谢玮,雷泰.基于神经网络的图像描述方法研究[J].系统仿真学报,2020,32(4):601-611. 被引量：6
4赵兴旺,叶剑斌.基于图像识别的电能表智能建档系统研究[J].电测与仪表,2020,57(24):139-144. 被引量：6
5龚学尧,赵逢禹.基于图像搜索与合成的图像语义理解[J].计算机技术与发展,2022,32(6):57-62.

二级引证文献40

1李卉,何晶,程富强,王晓薇,詹炳光.基于LSTM模型的卫星电源系统异常检测方法[J].装甲兵工程学院学报,2019,33(3):90-96. 被引量：3
2陈威,祁伟彦,袁福香,李哲敏.基于时间序列与横截面数据的吉林省水稻产量预测对比分析[J].中国农业信息,2018,30(5):91-101. 被引量：5
3王星峰.基于CNN和LSTM的智能文本分类[J].辽东学院学报（自然科学版）,2019,26(2):126-132. 被引量：2
4巫红霞,谢强.基于加权社区检测与增强人工蚁群算法的高维数据特征选择[J].计算机应用与软件,2019,36(9):285-292. 被引量：8
5刘昊俣,贺诗波,陈积明.数据驱动的高速铁路强风报警自适应解除策略[J].自动化学报,2019,45(12):2242-2250. 被引量：4
6黄友文,游亚东,赵朋.融合卷积注意力机制的图像描述生成模型[J].计算机应用,2020,40(1):23-27. 被引量：14
7季秀怡,李建华.基于双路注意力机制的化学结构图像识别[J].计算机工程,2020,46(9):213-220. 被引量：4
8曹治博.复合地层掘进参数预测分析[J].建筑安全,2020,35(12):11-15.
9唐志涛,陈珏羽,黄冬梅,黄柯颖.计及多规格表位端子的电能表检定装置设计与应用[J].广西电力,2021,44(1):25-29.
10毕健旗,刘茂福,胡慧君,代建华.基于依存句法的图像描述文本生成[J].北京航空航天大学学报,2021,47(3):431-440. 被引量：3

1张希府,戴云徽,高志强.利用句法模式从术语词典中抽取语义关系[J].南京师范大学学报（工程技术版）,2008,8(4):43-45. 被引量：3
2曾璇.基于句法模式的评教信息挖掘[J].电脑编程技巧与维护,2016(16):57-58. 被引量：2
3梁娜,耿国华,周明全.自然语言处理中的语义关系与句法模式互发现[J].计算机应用研究,2008,25(8):2295-2298. 被引量：7
4朱万颖,张希府,高志强.句法模式的泛化及其在关系学习中的应用[J].重庆工学院学报（自然科学版）,2008,22(10):112-116.
5张亮,陈家骏.基于大规模语料库的句法模式匹配研究[J].中文信息学报,2007,21(5):31-35. 被引量：8
6戴汝为.语义、句法模式识别方法及其应用[J].模式识别与人工智能,1995,8(2):89-93. 被引量：7
7古凌岚,孙素云.基于多策略本体构建方法研究[J].计算机与数字工程,2011,39(11):54-57.
8韩道范.识别多类异常的句法模式识别方法[J].吉林大学学报（地球科学版）,1988,31(3):351-356. 被引量：2
9包亮,张莉,许鑫.苏州园林网络评论意见挖掘研究[J].微型机与应用,2016,35(13):86-89. 被引量：1
10沈明玉,邱文庆.基于句法模式识别的异常入侵检测技术研究[J].合肥工业大学学报（自然科学版）,2008,31(5):708-710. 被引量：2

计算机科学

2016年第5期

浏览历史

内容加载中请稍等...

基于梯度核特征及N-gram模型的商品图像句子标注被引量：5

参考文献18

同被引文献27

引证文献5

二级引证文献40

相关作者

相关机构

相关主题

浏览历史

基于梯度核特征及N-gram模型的商品图像句子标注 被引量：5

参考文献18

同被引文献27

引证文献5

二级引证文献40

相关作者

相关机构

相关主题

浏览历史

基于梯度核特征及N-gram模型的商品图像句子标注被引量：5