基于多任务学习的传统服饰图像双层标注被引量：7

Double-layer annotation of traditional costume images based on multi-task learning

导出

摘要针对当前图像多标签标注方法只能标注图像内容信息(本体),而不能同时标注图像寓意信息(隐义)的问题,提出了一种基于多任务学习的双层多标签标注模型(MTL-DMAM)。首先将图像的本体标注和隐义标注视为两个关联任务,以ResNeXt-50作为共享特征的主干网络,然后利用注意力机制分别为每个任务构建一个分支结构,实现了图像双层标注,同时为消除图像内各物体大小差异对标注结果的影响,在模型中加入ELASTIC结构,进一步提高了模型性能。在对比实验中,本文模型在单任务MS-COCO数据集和多任务传统服饰数据集上优于其他同类模型。最后,利用Grad-cam方法可视化模型MTL-DMAM在标注时重点关注的图像区域,实验结果表明本文模型能有效学习标签对应的图像显著特征。 To solve the problem that current image multi-label annotation methods can only annotate image content information(ontology),but can not simultaneously annotate image implied information(implicit),this paper proposes a double-layer multi-label annotation model based on multi-task learning(MTLDMAM). Firstly,the image ontology annotation and implicit annotation are regarded as two related tasks,and ResNeXt-50 is used as the backbone network of shared features. Then,in order to realize image double-level annotation,attention mechanism is used to construct a branch structure for each task. In order to eliminate the influence of different object sizes on labeling results in images,the ELASTIC structure is added to the model to improve the performance of the model. The comparative experiment results show that,on single task MS-COCO data set,the proposed model is superior to most advanced models in the indicators of C-R,C-F1,O-R,and mAP,and on multi-task traditional costume data set,the proposed model is superior to all other models in 10 indicators. Finally,we use the Grad-cam method to visualize the image region that MTL-DMAM focuses on when labeling,and the experimental results show that the proposed model can effectively learn the salient features of the image corresponding to labels.

作者赵海英周伟侯小刚张小利 ZHAO Hai-ying;ZHOU Wei;HOU Xiao-gang;ZHANG Xiao-li(School of Computer Science,Beijing University of Posts and Telecommunications,Beijing 100876,China;School of Digital Media and Design Art,Beijing University of Posts and Telecommunications,Beijing 100876,China;College of Computer Science and Technology,Jilin University,Changchun 130012,China)

机构地区北京邮电大学计算机学院北京邮电大学数字媒体与设计艺术学院吉林大学计算机科学与技术学院

出处《吉林大学学报（工学版）》 EI CAS CSCD 北大核心 2021年第1期293-302,共10页 Journal of Jilin University:Engineering and Technology Edition

基金中央文化产业发展专项资金申报项目(GSSKS-2015-035).

关键词人工智能传统服饰多任务学习多标签标注注意力机制 artificial intelligence traditional costume multi-task learning multi-label annotation attention mechanisms

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1王松,党建武,王阳萍,金静.基于3D运动历史图像和多任务学习的动作识别[J].吉林大学学报（工学版）,2020,50(4):1495-1502. 被引量：5
2张会,陈晨.“互联网+”背景下的汉语国际教育与文化传播[J].语言文字应用,2019,0(2):30-38. 被引量：26
3陈绵书,于录录,苏越,桑爱军,赵岩.基于卷积神经网络的多标签图像分类[J].吉林大学学报（工学版）,2020,50(3):1077-1084. 被引量：18
4赵海英,陈洪,贾耕云,郑桥,王绍杰.基于字典学习的民族文化图案语义标注[J].中国科学：信息科学,2019,49(2):172-187. 被引量：8
5王柯俨,胡妍,王怀,李云松.结合天空分割和超像素级暗通道的图像去雾算法[J].吉林大学学报（工学版）,2019,49(4):1377-1384. 被引量：10
6谌华,郭伟,闫敬文,卓文浩,吴良斌.基于深度学习的SAR图像道路识别新方法[J].吉林大学学报（工学版）,2020,50(5):1778-1787. 被引量：9
7赵鑫全.互联网时代文化消费如何升级[J].人民论坛,2019(23):132-133. 被引量：5
8张钰,刘建伟,左信.多任务学习[J].计算机学报,2020,43(7):1340-1378. 被引量：34

二级参考文献49

1洪日昌,吴秀清,刘媛,尹东.低分辨率遥感影像中道路的全自动提取方法研究[J].遥感学报,2008,12(1):36-45. 被引量：9
2张广伟,张永红.基于链码优化的SAR影像城市道路网络提取[J].遥感学报,2008,12(4):620-625. 被引量：4
3赵沁平.虚拟现实综述[J].中国科学（F辑:信息科学）,2009,39(1):2-46. 被引量：667
4杨彬蔚,陆系群,陈纯.一种纺织印染图案的多尺度彩色分割算法[J].浙江大学学报（工学版）,2005,39(4):530-533. 被引量：7
5程罡,徐瑾,余胜泉.学习资源标准的新发展与学习资源的发展趋势[J].远程教育杂志,2009,27(4):6-12. 被引量：55
6安星霖,魏开云.景颇族传统民族图案在园林中的应用探讨[J].南方农业（园林花卉版）,2011,5(1):1-6. 被引量：2
7蒋建国,侯天峰,齐美彬.改进的基于暗原色先验的图像去雾算法[J].电路与系统学报,2011,16(2):7-12. 被引量：133
8赵海英,杨一帆,徐光美.新疆民族民间艺术图案生成方法[J].计算机系统应用,2011,20(7):94-99. 被引量：10
9张会,李玉顺.移动学习与对外汉语教学[J].北京广播电视大学学报,2011(2):49-53. 被引量：13
10白学军,梁菲菲,闫国利,田瑾,臧传丽,孟红霞.词边界信息在中文阅读眼跳目标选择中的作用:来自中文二语学习者的证据[J].心理学报,2012,44(7):853-867. 被引量：25

共引文献106

1谭丽梅.线上对外汉语教学的思考——以沈阳师范大学国际教育学院为例[J].现代交际,2020(24):28-30. 被引量：5
2刘浩,刘海滨,孙宇,王竞陶,黄辉.煤矿井下员工不安全行为智能识别系统[J].煤炭学报,2021,46(S02):1159-1169. 被引量：30
3薛梦晨.论新媒介在国际中文教育中的实践逻辑[J].理论观察,2023(7):127-132.
4杨璐,吴锡华,劳若芊.互联网时代下的大学生汉字危机对策研究[J].汉字文化,2019,0(23):1-3. 被引量：2
5杨栩.基于卷积神经网络的数字图像特征降维算法[J].信息通信,2019,0(11):42-44.
6魏海平.新形势下在线少儿国际中文教育的发展与对策[J].国际汉语文化研究,2022(1):3-15.
7杨栩.基于神经网络的数字信号多分类识别方法[J].汽车实用技术,2019,0(21):56-58.
8周建宇.浅析传统文化在国际汉语教育中的教学传播路径[J].黑龙江工业学院学报（综合版）,2019,19(12):24-28. 被引量：2
9张轶格,王盟.“互联网+”汉语国际传播的应用分析[J].文教资料,2019,0(32):46-47.
10赵晶莹.“一带一路”视阈下汉语国际教育硕士课程设置浅析[J].科教文汇,2020,0(3):55-57. 被引量：5

同被引文献100

1傅道彬.文化的积淀与冷却[J].学术交流,1986(3):80-81. 被引量：3
2刘长林.宇宙基因·社会基因·文化基因[J].哲学动态,1988(11):29-32. 被引量：72
3乌丙安.非物质文化遗产保护中文化圈理论的应用[J].江西社会科学,2005,25(1):102-106. 被引量：115
4陈虹.试谈文化空间的概念与内涵[J].文物世界,2006(1):44-46. 被引量：109
5徐才.文化基因的内在机制与社会权力结构的历史演变[J].理论探讨,2006(3):141-144. 被引量：7
6关昕.“文化空间：节日与社会生活的公共性”国际学术研讨会综述[J].民俗研究,2007(2):265-272. 被引量：54
7刘漫丹.文化基因算法(Memetic Algorithm)研究进展[J].自动化技术与应用,2007,26(11):1-4. 被引量：37
8王海宁.聚落形态的文化基因解析——以贵州省青岩镇为例[J].规划师,2008,24(5):61-65. 被引量：22
9陈宇光.城市文化空间的三维向度[J].华东理工大学学报（社会科学版）,2008,23(2):91-94. 被引量：14
10苗伟.文化时间与文化空间:文化环境的本体论维度[J].思想战线,2010,36(1):101-106. 被引量：70

引证文献7

1陈涛.目标检测在数字人文图像中的应用尝试[J].数字人文研究,2021,1(3):39-50. 被引量：2
2赵海英.文化基因研究缘起、进展与未来研究思考综述[J].中国传媒大学学报（自然科学版）,2021,28(5):1-10. 被引量：14
3卢明,侯小刚,韩晓彤,赵海英.基于知识推理的纹饰演化关系发现[J].计算机工程与应用,2022,58(14):194-199.
4陈少峰,宋菲,李微.元宇宙中文化空间建构与结构特征研究[J].北京联合大学学报（人文社会科学版）,2023,21(2):48-59. 被引量：6
5马进,张彤彤,钱晓松,胡洁.人工智能在非物质文化遗产保护与传承中的应用研究现状[J].包装工程,2023,44(8):1-14. 被引量：7
6丁宁,余隋怀,初建杰,陈晨,刘华静.面向产品设计的民族图案语义量化模型构建与应用[J].计算机辅助设计与图形学学报,2023,35(4):621-632. 被引量：3
7彭宏,侯小刚,曾凡璐,吴萌.融合金字塔和注意力机制的文物子图检索模型[J].中国传媒大学学报（自然科学版）,2024,31(2):19-26.

二级引证文献31

1雷珏莹,侯西龙,王晓光.数智时代古籍数字化再造的逻辑与进路[J].数字人文研究,2022,2(2):46-56. 被引量：22
2胡燕,余静林.文化基因嵌入生活日常的中华传统文化演进——以中华茶艺文化为切入[J].贵州社会科学,2023(10):35-42. 被引量：2
3钱毅,崔浩男.基于图像学理论的人物照片档案开发利用研究[J].档案与建设,2022(6):16-19. 被引量：5
4孔庆夫,张海庆.粤港澳非遗的文化基因与非遗名录制度改进[J].文化遗产,2022(4):9-17. 被引量：6
5张玉洁,白如江,张亚辉,冯梦莹,鞠孜涵,邢莹.追溯现代精神文明的古典参照:基于稷下学数字人文研究视角[J].图书情报工作,2022,66(19):15-25.
6张应韬,单琳琳.建筑文化遗产数字化体验设计策略研究[J].自然与文化遗产研究,2022,7(6):97-111. 被引量：4
7任玉冰,郑东军.河南传统民居门楼造型的文化基因与图谱探研[J].安阳师范学院学报,2023(1):143-147.
8荣玥芳,张新月,石爽,周苡帆.乡村振兴视角下的传统村落文化基因传承策略研究——以张家口市怀安县段家庄村为例[J].艺术与设计（理论版）,2023(4):37-40.
9荣玥芳,吕虎臣.基于锚固—层积理论的长城文化带沿线传统村落规划设计研究——以北京令公村为例[J].小城镇建设,2023,41(6):5-13. 被引量：3
10蒋璐.基于非遗文化基因的游客价值感知研究[J].浙江工贸职业技术学院学报,2023,23(2):47-51.

1鲍善军,平燕.让量感在课堂中真实生长[J].小学数学教育,2020(19):17-19. 被引量：11
2陈金圣,张晓明.“双一流”的隐义:一流高等教育体系建设[J].高教文摘,2020(9):13-16.
3吴一凡,薛醒思,柯学,詹先银,刘伟,张清端,何子皓,吴秉恒.基于领域本体的股票资讯新闻自动语义标注技术[J].宝鸡文理学院学报（自然科学版）,2019,39(4):66-72. 被引量：1
4李重霖,李明轩,谢卓亨,张楚其,陈珂.面向方面级情感分类与深度学习的分层网络模型[J].广东石油化工学院学报,2020,30(6):42-45.
5何雪波.国画白描手法在服饰设计中的应用研究[J].棉纺织技术,2021,49(2). 被引量：1
6马钰婷,李佳霖,王晓江.全媒体环境中大学生学习模式小样本调查报告[J].新闻前哨,2021(1):99-103.
7胡菁菁,方倩.建筑企业会计课程项目化教学改革规划与实施[J].新课程研究,2020(35):45-46.
8马晓星.基于任务驱动的中职电工技术基础课程教学研究[J].女人坊,2021(2):00266-00266.
9郭延华,孙磊,马世超,何宏.一种基于极端尺度变化的船舶识别方法研究[J].计算机应用与软件,2021,38(1):171-178. 被引量：5
10Dorcas S.Eyinla,Michael A.Oladunjoye.Empirical analysis for the characterization of geo-mechanical strength and pressure regime:Implications on hydraulic fracturing stimulation[J].Petroleum,2019,5(3):260-270. 被引量：2

吉林大学学报（工学版）

2021年第1期

浏览历史

内容加载中请稍等...

基于多任务学习的传统服饰图像双层标注被引量：7

参考文献8

二级参考文献49

共引文献106

同被引文献100

引证文献7

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

基于多任务学习的传统服饰图像双层标注 被引量：7

参考文献8

二级参考文献49

共引文献106

同被引文献100

引证文献7

二级引证文献31

相关作者

相关机构

相关主题

浏览历史

基于多任务学习的传统服饰图像双层标注被引量：7